डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के लिए तार्किक और सहायक दोनों तरह के नए तरीकों में रिकॉर्ड को सारांशित करना है।
यह डेटाबेस के मालिक के लिए स्पष्ट और लाभकारी परिणाम प्राप्त करने के लिए पहले अज्ञात नियमितताओं या संबंधों को खोजने के लिए उच्च मात्रा में जानकारी के चयन, अन्वेषण और मॉडलिंग की प्रक्रिया है।
डेटा माइनिंग डेटा साइंस के समान है। यह एक व्यक्ति द्वारा, एक विशेष स्थिति में, एक विशिष्ट डेटा सेट पर, एक उद्देश्य के साथ किया जाता है। इस चरण में टेक्स्ट माइनिंग, वेब माइनिंग, ऑडियो और वीडियो माइनिंग, सचित्र डेटा माइनिंग और सोशल मीडिया माइनिंग सहित कई प्रकार की सेवाएँ शामिल हैं। यह सॉफ्टवेयर के माध्यम से पूरा होता है जो सरल या बहुत विशिष्ट होता है।
डेटा माइनिंग को आउटसोर्स करके, कम परिचालन लागत के साथ सभी काम तेजी से किए जा सकते हैं। विशिष्ट फर्म डेटा को बचाने के लिए नई तकनीकों का भी उपयोग कर सकती हैं जिन्हें मैन्युअल रूप से खोजना असंभव है। कई प्लेटफार्मों पर टन डेटा उपलब्ध है, लेकिन बहुत सीमित ज्ञान उपलब्ध है।
डेटा में उपयोगी पैटर्न खोजने के दृष्टिकोण को कई नाम दिए गए हैं, जिसमें डेटा माइनिंग, नॉलेज एक्सट्रैक्शन, डेटा डिस्कवरी, डेटा हार्वेस्टिंग, डेटा आर्कियोलॉजी और डेटा पैटर्न प्रोसेसिंग शामिल हैं। डेटा माइनिंग का उपयोग सांख्यिकीविदों, डेटा विश्लेषकों और प्रबंधन सूचना प्रणाली (MIS) समुदायों द्वारा किया गया है।
इसने डेटाबेस क्षेत्र में लोकप्रियता में भी सुधार किया है। डेटा माइनिंग में, निर्णय समस्याओं को हल करने के लिए बड़े डेटाबेस का विश्लेषण किया जाता है। एक दुकान के मालिक पर विचार करें जो एक नए उत्पाद के बारे में जानकारी प्राप्त करना चाहता है। डेटा माइनिंग प्रक्रिया द्वारा संचालित जानकारी ग्राहकों के साथ पिछले इंटरैक्शन और ग्राहकों से जुड़ी सुविधाओं जैसे उम्र, आय और उनकी प्रतिक्रियाओं के ऐतिहासिक डेटाबेस में निहित है।
डेटा माइनिंग सॉफ़्टवेयर ग्राहक व्यवहार का एक मॉडल बनाने के लिए ऐतिहासिक जानकारी का उपयोग करता है जिसका उपयोग यह अनुमान लगाने के लिए किया जा सकता है कि कौन सा ग्राहक नए उत्पाद का जवाब देगा। ऐतिहासिक जानकारी क्रेडिट कार्ड धोखाधड़ी जैसे अपेक्षाकृत सामान्य अपराधों की खोज का आधार भी बन सकती है।
ऐतिहासिक डेटा और वर्तमान डेटा में पैटर्न की तुलना करके, यह जांचा जाता है कि क्या परिवर्तन ग्राहकों द्वारा किए गए हैं। इन क्षेत्रों में ऐतिहासिक जानकारी व्यापक रूप से पैटर्न खोजने के लिए एक उपकरण के रूप में स्वीकार की जाती है, और ग्राहक इन प्रक्रियाओं से आर्थिक लाभ प्राप्त करते हैं।