डेटा माइनिंग बड़ी मात्रा में डेटा से ज्ञान निकालने या खनन करने को परिभाषित करता है। डेटा माइनिंग का उपयोग आमतौर पर उन जगहों पर किया जाता है जहां बड़ी मात्रा में डेटा सहेजा और संसाधित किया जाता है। उदाहरण के लिए, बैंकिंग प्रणाली बड़ी मात्रा में डेटा को बचाने के लिए डेटा माइनिंग का उपयोग करती है जिसे लगातार संसाधित किया जाता है।
डेटा माइनिंग में, डेटा के छिपे हुए पैटर्न कई श्रेणियों के अनुसार उपयोगी डेटा के एक टुकड़े में विचार कर रहे हैं। इस डेटा को विश्लेषण के लिए डेटा वेयरहाउस सहित एक क्षेत्र में इकट्ठा किया जाता है, और डेटा माइनिंग एल्गोरिदम का प्रदर्शन किया जाता है। यह डेटा प्रभावी निर्णय लेने में मदद करता है जो मूल्य में कटौती करते हैं और राजस्व में वृद्धि करते हैं।
डेटा के लिए उपयोग किए जाने वाले विभिन्न प्रकार के डेटा माइनिंग एप्लिकेशन इस प्रकार हैं -
-
संबंधपरक डेटाबेस - डेटाबेस सिस्टम को डेटाबेस मैनेजमेंट सिस्टम भी कहा जाता है। इसमें परस्पर संबंधित डेटा का एक सेट, जिसे डेटाबेस कहा जाता है, और डेटा को संभालने और एक्सेस करने के लिए सॉफ़्टवेयर प्रोग्राम का एक सेट शामिल है।
एक रिलेशनल डेटाबेस तालिकाओं का एक सेट है, जिनमें से प्रत्येक को एक अद्वितीय नाम अधिकृत किया जाता है। प्रत्येक तालिका में विशेषताओं (कॉलम या फ़ील्ड) का एक सेट शामिल होता है और आम तौर पर टुपल्स (रिकॉर्ड या पंक्तियों) का एक विशाल सेट संग्रहीत करता है। एक संबंधपरक तालिका में प्रत्येक टपल एक अद्वितीय कुंजी द्वारा पहचानी गई वस्तु को परिभाषित करता है और विशेषता मानों के एक सेट द्वारा दर्शाया जाता है। एंटिटी-रिलेशनशिप (ईआर) डेटा मॉडल सहित सिमेंटिक डेटा मॉडल आमतौर पर रिलेशनल डेटाबेस के लिए बनाया जाता है। एक ईआर डेटा मॉडल डेटाबेस को संस्थाओं और उनके संबंधों के एक सेट के रूप में परिभाषित करता है।
-
लेन-देन संबंधी डेटाबेस - एक लेनदेन संबंधी डेटाबेस में एक फाइल शामिल होती है जहां प्रत्येक रिकॉर्ड लेनदेन को परिभाषित करता है। लेन-देन में आम तौर पर एक विशिष्ट लेन-देन पहचान संख्या (ट्रांस आईडी) और लेन-देन बनाने वाली वस्तुओं की एक सूची होती है (जैसे कि किसी स्टोर में खरीदी गई वस्तुएं)।
लेन-देन संबंधी डेटाबेस में इससे संबंधित अतिरिक्त तालिकाएँ हो सकती हैं, जिसमें बिक्री से संबंधित अन्य डेटा शामिल हैं, जिसमें लेन-देन की तारीख, ग्राहक आईडी नंबर, विक्रेता की आईडी संख्या और जिस शाखा में बिक्री हुई, आदि शामिल हैं।पी>
-
ऑब्जेक्ट-रिलेशनल डेटाबेस -ऑब्जेक्ट-रिलेशनल डेटाबेस को ऑब्जेक्ट-रिलेशनल डेटा मॉडल के आधार पर इकट्ठा किया जाता है। यह मॉडल जटिल वस्तुओं और वस्तु अभिविन्यास के प्रबंधन के लिए एक समृद्ध डेटा प्रकार का समर्थन करके संबंधपरक मॉडल को जारी रखता है।
-
अस्थायी डेटाबेस - एक टेम्पोरल डेटाबेस आमतौर पर रिलेशनल डेटा को स्टोर करता है जिसमें समय से संबंधित विशेषताएँ होती हैं। इन विशेषताओं में कई टाइमस्टैम्प शामिल हो सकते हैं, जिनमें से प्रत्येक में कई शब्दार्थ हैं।
-
अनुक्रम डेटाबेस - एक अनुक्रम डेटाबेस समय के तथ्यात्मक विचार के साथ या उसके बिना आदेशित घटनाओं के अनुक्रमों को संग्रहीत करता है। उदाहरण के लिए, ग्राहक खरीदारी क्रम, वेब क्लिक स्ट्रीम और जैविक क्रम।
-
समय-श्रृंखला डेटाबेस - एक समय-श्रृंखला डेटाबेस समय के बार-बार माप (जैसे, प्रति घंटा, दैनिक, साप्ताहिक) पर एक्सेस किए गए मूल्यों या घटनाओं के अनुक्रमों को संग्रहीत करता है। एक उदाहरण में स्टॉक एक्सचेंज, स्टॉक नियंत्रण और प्राकृतिक घटनाओं (जैसे तापमान और हवा) के मापन से एकत्र किया गया डेटा शामिल है।