डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है।
यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के लिए तार्किक और सहायक दोनों तरह के नए तरीकों में रिकॉर्ड को सारांशित करना है।
यह डेटाबेस के मालिक के लिए स्पष्ट और लाभकारी परिणाम प्राप्त करने के लिए पहले अज्ञात नियमितताओं या संबंधों को खोजने के लिए उच्च मात्रा में जानकारी के चयन, अन्वेषण और मॉडलिंग की प्रक्रिया है।
डेटा माइनिंग को आउटसोर्स करके, कम परिचालन लागत के साथ सभी काम तेजी से किए जा सकते हैं। विशिष्ट फर्म डेटा को बचाने के लिए नई तकनीकों का भी उपयोग कर सकती हैं जिन्हें मैन्युअल रूप से खोजना असंभव है। कई प्लेटफार्मों पर टन डेटा उपलब्ध है, लेकिन बहुत सीमित ज्ञान उपलब्ध है।
डेटा माइनिंग इंटरफ़ेस वह माध्यम प्रदान करता है जो उपयोगकर्ताओं को डेटा माइनिंग प्रक्रियाओं के साथ संवाद करने की अनुमति देता है। डेटा माइनिंग क्वेरी भाषा का उपयोग करना कठिन है। डेटा माइनिंग सिस्टम के साथ संचार करने के लिए एक ग्राफिकल यूजर इंटरफेस का उपयोग किया जा सकता है। डेटा माइनिंग क्वेरी भाषा एक मुख्य भाषा के रूप में काम कर सकती है, जिसके शीर्ष पर GUI को आसानी से डिज़ाइन किया जा सकता है।
डेटा माइनिंग में निम्नलिखित कार्यात्मक घटक शामिल हो सकते हैं जो इस प्रकार हैं -
डेटा संग्रह और डेटा माइनिंग क्वेरी संरचना - यह उपयोगकर्ताओं को कार्य-प्रासंगिक डेटा सेट निर्दिष्ट करने और डेटा माइनिंग क्वेरी लिखने की अनुमति देता है।
खोजे गए पैटर्न की प्रस्तुति - यह टेबल, ग्राफ़, चार्ट और अन्य विज़ुअलाइज़ेशन तकनीकों जैसे विभिन्न रूपों में खोजे गए पैटर्न को प्रदर्शित करने की अनुमति देता है।
पदानुक्रम विनिर्देश और हेरफेर - यह अवधारणा पदानुक्रम के विनिर्देशन को मैन्युअल रूप से या स्वचालित रूप से करने की अनुमति देता है। यह किसी दिए गए डेटा सेट वितरण के आधार पर अवधारणा पदानुक्रमों को स्वचालित रूप से संशोधित या समायोजित करने की अनुमति देता है।
डेटा माइनिंग प्रिमिटिव्स का हेरफेर - यह डेटा माइनिंग संचालन जैसे कि चयन, प्रदर्शन और अवधारणा पदानुक्रमों के परिवर्तन के शक्तिशाली समायोजन को सक्षम बनाता है।
इंटरैक्टिव बहुस्तरीय खनन - यह पहचाने गए पैटर्न पर रोल-अप या ड्रिल-डाउन संचालन को सक्षम बनाता है। डेटा माइनिंग इंटरफेस के डिजाइन को उपयोगकर्ताओं के विभिन्न वर्गों पर भी विचार करना चाहिए। डेटा माइनिंग सिस्टम के उपयोगकर्ताओं को व्यापार विश्लेषकों और व्यावसायिक अधिकारियों के रूप में वर्गीकृत किया जा सकता है।
व्यापार विश्लेषक डेटा के विभिन्न भागों का चयन करने, आयामों में हेरफेर करने और डेटा खनन प्रक्रियाओं को ट्यून करने में लचीलापन और सुविधा चाहते हैं। दूसरी ओर, व्यावसायिक अधिकारियों को डेटा माइनिंग परिणामों की स्पष्ट प्रस्तुति और व्याख्या की आवश्यकता होती है, डेटा माइनिंग परिणामों का रिपोर्ट लेखन और प्रस्तुति प्रक्रिया में आसान एकीकरण। एक अच्छी तरह से डिज़ाइन किए गए डेटा माइनिंग सिस्टम को दोनों प्रकार के उपयोगकर्ताओं के लिए उपयोगकर्ता के अनुकूल इंटरफेस प्रदान करना चाहिए।