डेटा माइनिंग के कार्य क्या हैं?

<घंटा/>

डेटा माइनिंग फ़ंक्शंस का उपयोग डेटा माइनिंग कार्यों में खोजे जाने वाले पैटर्न के प्रकार का प्रतिनिधित्व करने के लिए किया जाता है। सामान्य तौर पर, डेटा माइनिंग कार्यों को वर्णनात्मक और भविष्य कहनेवाला सहित दो प्रकारों में वर्गीकृत किया जा सकता है। वर्णनात्मक खनन कार्य डेटाबेस में डेटा की सामान्य विशेषताओं को परिभाषित करते हैं और भविष्य कहनेवाला खनन कार्य भविष्यवाणियों को विकसित करने के लिए वर्तमान जानकारी पर अनुमान लगाते हैं।

विभिन्न डेटा माइनिंग फ़ंक्शंस हैं जो इस प्रकार हैं -

डेटा विशेषता - यह डेटा के किसी ऑब्जेक्ट वर्ग की सामान्य विशेषताओं का सारांश है। उपयोगकर्ता द्वारा निर्दिष्ट वर्ग से संबंधित डेटा आमतौर पर डेटाबेस क्वेरी द्वारा एकत्र किया जाता है। डेटा लक्षण वर्णन का आउटपुट कई रूपों में प्रस्तुत किया जा सकता है।
डेटा भेदभाव - यह लक्ष्य वर्ग डेटा वस्तुओं की सामान्य विशेषताओं की तुलना एक या विषम वर्गों के समूह से वस्तुओं की सामान्य विशेषताओं के साथ करता है। लक्ष्य और विपरीत वर्गों को उपयोगकर्ता द्वारा दर्शाया जा सकता है, और समकक्ष डेटा ऑब्जेक्ट डेटाबेस प्रश्नों के माध्यम से प्राप्त किए जा सकते हैं।
एसोसिएशन विश्लेषण - यह उन वस्तुओं के समूह का विश्लेषण करता है जो आम तौर पर एक लेन-देन संबंधी डेटासेट में एक साथ होते हैं। दो पैरामीटर हैं जिनका उपयोग एसोसिएशन के नियमों को निर्धारित करने के लिए किया जाता है -
- यह प्रदान करता है जो डेटाबेस में सेट सामान्य आइटम की पहचान करता है।
- कॉन्फिडेंस सशर्त संभावना है कि एक आइटम लेन-देन में तब होता है जब कोई अन्य आइटम होता है।
वर्गीकरण - वर्गीकरण एक मॉडल की खोज करने की प्रक्रिया है जो डेटा वर्गों या अवधारणाओं का प्रतिनिधित्व करता है और उन्हें अलग करता है, जिसका उद्देश्य उन वस्तुओं के वर्ग की भविष्यवाणी करने के लिए मॉडल का उपयोग करने में सक्षम होना है जिनका वर्ग लेबल गुमनाम है। व्युत्पन्न मॉडल प्रशिक्षण डेटा के एक सेट के विश्लेषण पर स्थापित किया गया है (यानी, डेटा ऑब्जेक्ट जिसका वर्ग लेबल सामान्य है)।
भविष्यवाणी - यह कुछ अनुपलब्ध डेटा मानों या लंबित रुझानों की भविष्यवाणी को परिभाषित करता है। वस्तु के गुण मानों और वर्गों के गुण मानों के आधार पर किसी वस्तु का अनुमान लगाया जा सकता है। यह समय से संबंधित जानकारी में संख्यात्मक मानों के लापता होने या रुझान में वृद्धि/कमी की भविष्यवाणी हो सकती है।
क्लस्टरिंग - यह वर्गीकरण के समान है लेकिन वर्ग पूर्वनिर्धारित नहीं हैं। कक्षाओं को डेटा विशेषताओं द्वारा दर्शाया जाता है। यह अनुपयोगी शिक्षा है। वस्तुओं को क्लस्टर या समूहीकृत किया जाता है, यह इंट्राक्लास समानता को अधिकतम करने और इंट्राक्लास समानता को कम करने के सिद्धांत पर निर्भर करता है।
बाहरी विश्लेषण - आउटलेयर डेटा तत्व होते हैं जिन्हें किसी दिए गए वर्ग या क्लस्टर में समूहीकृत नहीं किया जा सकता है। ये डेटा ऑब्जेक्ट हैं जिनमें अन्य डेटा ऑब्जेक्ट्स के सामान्य व्यवहार से कई व्यवहार होते हैं। ज्ञान प्राप्त करने के लिए इस प्रकार के डेटा का विश्लेषण आवश्यक हो सकता है।
विकास विश्लेषण - यह उन वस्तुओं के रुझान को परिभाषित करता है जिनका व्यवहार कुछ समय के साथ बदलता है।