Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग के कार्य क्या हैं?

<घंटा/>

डेटा माइनिंग फ़ंक्शंस का उपयोग डेटा माइनिंग कार्यों में खोजे जाने वाले पैटर्न के प्रकार का प्रतिनिधित्व करने के लिए किया जाता है। सामान्य तौर पर, डेटा माइनिंग कार्यों को वर्णनात्मक और भविष्य कहनेवाला सहित दो प्रकारों में वर्गीकृत किया जा सकता है। वर्णनात्मक खनन कार्य डेटाबेस में डेटा की सामान्य विशेषताओं को परिभाषित करते हैं और भविष्य कहनेवाला खनन कार्य भविष्यवाणियों को विकसित करने के लिए वर्तमान जानकारी पर अनुमान लगाते हैं।

विभिन्न डेटा माइनिंग फ़ंक्शंस हैं जो इस प्रकार हैं -

  • डेटा विशेषता - यह डेटा के किसी ऑब्जेक्ट वर्ग की सामान्य विशेषताओं का सारांश है। उपयोगकर्ता द्वारा निर्दिष्ट वर्ग से संबंधित डेटा आमतौर पर डेटाबेस क्वेरी द्वारा एकत्र किया जाता है। डेटा लक्षण वर्णन का आउटपुट कई रूपों में प्रस्तुत किया जा सकता है।

  • डेटा भेदभाव - यह लक्ष्य वर्ग डेटा वस्तुओं की सामान्य विशेषताओं की तुलना एक या विषम वर्गों के समूह से वस्तुओं की सामान्य विशेषताओं के साथ करता है। लक्ष्य और विपरीत वर्गों को उपयोगकर्ता द्वारा दर्शाया जा सकता है, और समकक्ष डेटा ऑब्जेक्ट डेटाबेस प्रश्नों के माध्यम से प्राप्त किए जा सकते हैं।

  • एसोसिएशन विश्लेषण - यह उन वस्तुओं के समूह का विश्लेषण करता है जो आम तौर पर एक लेन-देन संबंधी डेटासेट में एक साथ होते हैं। दो पैरामीटर हैं जिनका उपयोग एसोसिएशन के नियमों को निर्धारित करने के लिए किया जाता है -

    • यह प्रदान करता है जो डेटाबेस में सेट सामान्य आइटम की पहचान करता है।

    • कॉन्फिडेंस सशर्त संभावना है कि एक आइटम लेन-देन में तब होता है जब कोई अन्य आइटम होता है।

  • वर्गीकरण - वर्गीकरण एक मॉडल की खोज करने की प्रक्रिया है जो डेटा वर्गों या अवधारणाओं का प्रतिनिधित्व करता है और उन्हें अलग करता है, जिसका उद्देश्य उन वस्तुओं के वर्ग की भविष्यवाणी करने के लिए मॉडल का उपयोग करने में सक्षम होना है जिनका वर्ग लेबल गुमनाम है। व्युत्पन्न मॉडल प्रशिक्षण डेटा के एक सेट के विश्लेषण पर स्थापित किया गया है (यानी, डेटा ऑब्जेक्ट जिसका वर्ग लेबल सामान्य है)।

  • भविष्यवाणी - यह कुछ अनुपलब्ध डेटा मानों या लंबित रुझानों की भविष्यवाणी को परिभाषित करता है। वस्तु के गुण मानों और वर्गों के गुण मानों के आधार पर किसी वस्तु का अनुमान लगाया जा सकता है। यह समय से संबंधित जानकारी में संख्यात्मक मानों के लापता होने या रुझान में वृद्धि/कमी की भविष्यवाणी हो सकती है।

  • क्लस्टरिंग - यह वर्गीकरण के समान है लेकिन वर्ग पूर्वनिर्धारित नहीं हैं। कक्षाओं को डेटा विशेषताओं द्वारा दर्शाया जाता है। यह अनुपयोगी शिक्षा है। वस्तुओं को क्लस्टर या समूहीकृत किया जाता है, यह इंट्राक्लास समानता को अधिकतम करने और इंट्राक्लास समानता को कम करने के सिद्धांत पर निर्भर करता है।

  • बाहरी विश्लेषण - आउटलेयर डेटा तत्व होते हैं जिन्हें किसी दिए गए वर्ग या क्लस्टर में समूहीकृत नहीं किया जा सकता है। ये डेटा ऑब्जेक्ट हैं जिनमें अन्य डेटा ऑब्जेक्ट्स के सामान्य व्यवहार से कई व्यवहार होते हैं। ज्ञान प्राप्त करने के लिए इस प्रकार के डेटा का विश्लेषण आवश्यक हो सकता है।

  • विकास विश्लेषण - यह उन वस्तुओं के रुझान को परिभाषित करता है जिनका व्यवहार कुछ समय के साथ बदलता है।


  1. डेटा माइनिंग में OLAP टूल्स क्या हैं?

    OLAP टूल की तीन मुख्य श्रेणियां हैं जो इस प्रकार हैं - मोलैप - MOLAP बहुआयामी OLAP का प्रतिनिधित्व करता है। यह डेटा स्टोरेज यूनिट के रूप में टुपल्स को सपोर्ट करता है। MOLAP डेटा को संभालने के लिए एक समर्पित n-आयामी सरणी भंडारण इंजन और OLAP मिडलवेयर लागू करता है। इसलिए, OLAP प्रश्नों को संबंधित बहुआ

  1. वेब माइनिंग के तरीके क्या हैं?

    वेब माइनिंग सीखने या ज्ञान प्राप्त करने के लक्ष्यों के लिए वेब-आधारित डेटा के लिए मशीन लर्निंग (डेटा माइनिंग) दृष्टिकोण का अनुप्रयोग है। वेब माइनिंग के तरीकों को तीन अलग-अलग तत्वों में से एक में परिभाषित किया जा सकता है जो इस प्रकार हैं - वेब उपयोग खनन - वेब यूसेज माइनिंग एक तरह का वेब माइनिंग है ज

  1. स्थानिक डेटा माइनिंग की मूल बातें क्या हैं?

    स्थानिक डेटा माइनिंग स्थानिक मॉडल के लिए डेटा माइनिंग का अनुप्रयोग है। स्थानिक डेटा माइनिंग में, विश्लेषक भौगोलिक या स्थानिक डेटा का उपयोग व्यावसायिक खुफिया या अलग-अलग परिणाम बनाने के लिए करते हैं। भौगोलिक डेटा को प्रासंगिक और लाभकारी स्वरूपों में लाने के लिए इसके लिए विशिष्ट विधियों और संसाधनों की