डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के लिए तार्किक और सहायक दोनों तरह के नए तरीकों में रिकॉर्ड को सारांशित करना है।
डेटा माइनिंग सिस्टम को विभिन्न समूहों या खंडों में व्यक्तियों की पहचान और वर्गीकरण को बढ़ावा देने के लिए डिज़ाइन किया गया है। वाणिज्यिक फर्म के पहलू से, और संभवत:पूरे उद्योग के लिए, यह डेटा माइनिंग के उपयोग को मुनाफे की तर्कसंगत खोज में एक भेदभावपूर्ण तकनीक के रूप में व्याख्या कर सकता है।
डेटा माइनिंग के विभिन्न सामाजिक निहितार्थ हैं जो इस प्रकार हैं -
गोपनीयता - यह एक भारित मुद्दा है। वर्तमान वर्षों में गोपनीयता संबंधी चिंताओं ने अमेरिकी समाज में व्यापारियों, बीमा कंपनियों और सरकारी एजेंसियों के व्यक्तिगत रिकॉर्ड सहित गोदामों के रूप में अधिक महत्वपूर्ण भूमिका निभाई है।
इस डेटा के समूह को लेकर लोगों की जो चिंताएँ हैं, वे आम तौर पर डेटा के लिए उपयोग की जाने वाली कुछ विश्लेषणात्मक क्षमताओं तक विस्तारित होंगी। डेटा माइनिंग के उपयोगकर्ताओं को यह सोचना शुरू कर देना चाहिए कि गोपनीयता से जुड़ी कानूनी समस्याओं से इस तकनीक का उनका उपयोग कैसे प्रभावित होगा।
प्रोफाइलिंग - डेटा माइनिंग और प्रोफाइलिंग एक विकासशील क्षेत्र है जो इस सूचना युग में डेटा के विस्फोट को व्यवस्थित करने, समझने, विश्लेषण करने, तर्क करने और उपयोग करने का प्रयास करता है। इस प्रक्रिया में डिज़ाइन या विसंगतियों को निकालने के लिए एल्गोरिदम और अनुभव का उपयोग करना शामिल है जो पहचानने में बहुत जटिल, कठिन या समय लेने वाली हैं।
माइक्रोसॉफ्ट की एक्सप्लोरेशन टीम के संस्थापक ने एक ऐसे मुद्दे को हल करने के लिए जटिल डेटा माइनिंग एल्गोरिदम का इस्तेमाल किया, जिसने कुछ वर्षों से खगोलविदों को परेशान किया था। 3 दशकों में दर्ज की गई 2 अरब आकाश वस्तुओं की समीक्षा, वर्णन और वर्गीकरण की समस्या। एल्गोरिथ्म ने तारों या आकाशगंगाओं जैसी आकाश की वस्तुओं को आवंटित करने के लिए प्रासंगिक डिज़ाइन को निकाला। एल्गोरिदम उस सुविधा को निकालने में सक्षम थे जो आकाश की वस्तुओं को सितारों या आकाशगंगाओं के रूप में दर्शाती थी। डेटा माइनिंग और प्रोफाइलिंग के इस विकासशील क्षेत्र में कई सीमाएँ हैं जहाँ इसका उपयोग किया जा सकता है।
अनधिकृत उपयोग किया गया - मार्केटिंग लक्ष्यों या कुछ अन्य नैतिक लक्ष्यों के लिए उपयोग किए जाने के लिए डिज़ाइन किए गए डेटा माइनिंग के माध्यम से प्राप्त रुझानों का दुरुपयोग किया जा सकता है। अनैतिक व्यवसाय या लोग डेटा माइनिंग के माध्यम से प्राप्त डेटा का उपयोग कमजोर लोगों का लाभ उठाने या लोगों के एक विशिष्ट समूह के साथ भेदभाव करने के लिए कर सकते हैं। इसके अलावा, डेटा माइनिंग तकनीक 100 प्रतिशत सटीक नहीं है; इस प्रकार गलतियाँ सामने आती हैं जिसके गंभीर परिणाम हो सकते हैं।