डेटा माइनिंग को डेटा में नॉलेज डिस्कवरी के रूप में भी परिभाषित किया गया है, यह अंतर्दृष्टि प्राप्त करने के लिए लाखों डेटा (विशेष रूप से संरचित डेटा) के बीच किसी भी विसंगतियों, सहसंबंधों, प्रवृत्तियों या पैटर्न को पहचानने की एक तकनीक है जो व्यावसायिक निर्णय लेने के लिए उपयोगी हो सकती है और पारंपरिक के दौरान छूट सकती है। विश्लेषण। डेटा माइनिंग का उद्देश्य जटिल संख्यात्मक एल्गोरिदम का उपयोग करके उन तथ्यों या डेटा को खोजना है जिन्हें पहले अनदेखा किया गया था या ज्ञात नहीं था।
डेटा माइनिंग डेटा साइंस के समान है। यह एक व्यक्ति द्वारा, एक विशेष स्थिति में, एक विशिष्ट डेटा सेट पर, एक उद्देश्य के साथ किया जाता है। इस चरण में टेक्स्ट माइनिंग, वेब माइनिंग, ऑडियो और वीडियो माइनिंग, सचित्र डेटा माइनिंग और सोशल मीडिया माइनिंग सहित कई प्रकार की सेवाएँ शामिल हैं। यह सॉफ्टवेयर के माध्यम से पूरा होता है जो सरल या बहुत विशिष्ट होता है।
डेटा माइनिंग को आउटसोर्स करके, कम परिचालन लागत के साथ सभी काम तेजी से किए जा सकते हैं। विशिष्ट फर्म डेटा को बचाने के लिए नई तकनीकों का भी उपयोग कर सकती हैं जिन्हें मैन्युअल रूप से खोजना असंभव है। कई प्लेटफार्मों पर टन डेटा उपलब्ध है, लेकिन बहुत सीमित ज्ञान उपलब्ध है।
प्रमुख चुनौती आवश्यक डेटा निकालने के लिए डेटा का विश्लेषण करना है जिसका उपयोग किसी समस्या को हल करने या कंपनी के विकास के लिए किया जा सकता है। डेटा को माइन करने और उससे बेहतर निर्णय लेने के लिए कई गतिशील उपकरण और तकनीक उपलब्ध हैं।
डेटा माइनिंग का उपयोग निजी और सार्वजनिक दोनों क्षेत्रों में कई उद्देश्यों के लिए किया जाता है। बैंकिंग, बीमा, दवा और खुदरा बिक्री सहित उद्योग आम तौर पर लागत कम करने, शोध बढ़ाने और बिक्री बढ़ाने के लिए डेटा माइनिंग का उपयोग करते हैं।
बीमा और बैंकिंग उद्योग धोखाधड़ी का पता लगाने और क्रेडिट स्कोरिंग जैसे जोखिम मूल्यांकन में सहायता के लिए डेटा माइनिंग एप्लिकेशन का उपयोग करते हैं।
कंपनियां विभिन्न वर्षों में उनके द्वारा एकत्र किए गए डेटाबेस के माध्यम से मॉडल स्थापित कर सकती हैं जो यह अनुमान लगाते हैं कि क्या उपयोगकर्ता एक अच्छा क्रेडिट जोखिम है, या क्या दुर्घटना का दावा धोखाधड़ी है और इसकी अधिक गहनता से जांच की जानी चाहिए।
चिकित्सा समुदाय डेटा माइनिंग का उपयोग किसी प्रक्रिया या दवा की प्रभावशीलता का अनुमान लगाने के लिए करता है।
फ़ार्मास्युटिकल फ़र्म रासायनिक यौगिकों और आनुवंशिक सामग्री के डेटा माइनिंग का उपयोग रोगों के नए उपचारों पर शोध करने में मदद करने के लिए करते हैं।
उत्पाद चयन और प्लेसमेंट निर्णय, कूपन ऑफ़र, और कौन से उत्पाद अक्सर एक साथ खरीदे जाते हैं, की प्रभावशीलता का आकलन करने के लिए खुदरा विक्रेता एफ़िनिटी प्रोग्राम (उदाहरण के लिए, शॉपर्स क्लब कार्ड, फ़्रीक्वेंट फ़्लायर पॉइंट, प्रतियोगिता) के माध्यम से एकत्र किए गए डेटा का उपयोग कर सकते हैं।
दूरसंचार सेवा प्रदाता और संगीत क्लब डेटा माइनिंग का उपयोग 'मंथन विश्लेषण' उत्पन्न करने के लिए कर सकते हैं, यह आकलन करने के लिए कि किन उपयोगकर्ताओं के ग्राहक बने रहने की संभावना है और किन लोगों के एक प्रतियोगी के रूप में स्विच करने की संभावना है।
सार्वजनिक क्षेत्र में, डेटा माइनिंग अनुप्रयोगों का उपयोग मूल रूप से धोखाधड़ी और अपशिष्ट का पता लगाने के लिए एक साधन के रूप में किया गया था, लेकिन वे कार्यक्रम के प्रदर्शन को मापने और बढ़ाने सहित उद्देश्यों के लिए भी उपयोग किए जाने लगे हैं।