Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

बाधा आधारित एसोसिएशन खनन क्या है?

<घंटा/>

एक डेटा माइनिंग प्रक्रिया दी गई जानकारी के सेट से हजारों नियमों को उजागर कर सकती है, जिनमें से अधिकांश उपयोगकर्ताओं के लिए स्वतंत्र या थकाऊ होते हैं। उपयोगकर्ताओं को इस बात की सबसे अच्छी समझ है कि खनन की "दिशा" दिलचस्प पैटर्न और पैटर्न या नियमों के "रूप" को जन्म दे सकती है, जिन्हें वे खोजना पसंद कर सकते हैं।

इसलिए, एक अच्छा अनुमान यह है कि उपयोगकर्ता इस तरह के अंतर्ज्ञान या अपेक्षाओं को खोज स्थान को बाधित करने के लिए बाधाओं के रूप में परिभाषित करते हैं। इस रणनीति को बाधा आधारित खनन कहा जाता है।

बाधा-आधारित एल्गोरिदम को बार-बार आइटमसेट जनरेशन चरण में खोज क्षेत्र को कम करने के लिए बाधाओं की आवश्यकता होती है (एसोसिएशन नियम जनरेट करने वाला चरण संपूर्ण एल्गोरिदम के लिए सटीक है)।

सामान्य बाधा समर्थन न्यूनतम सीमा है। यदि कोई बाधा अनियंत्रित है, तो खनन चरण में इसका समावेश खोज स्थान जाली के अंदर एक सीमा की परिभाषा के कारण अन्वेषण स्थान की महत्वपूर्ण कमी का समर्थन कर सकता है, जिसके बाद अन्वेषण की आवश्यकता नहीं है।

बाधाओं का महत्व अच्छी तरह से परिभाषित है - वे केवल एसोसिएशन नियम बनाते हैं जो उपयोगकर्ताओं को आकर्षित करते हैं। विधि काफी तुच्छ है और नियमों की जगह कम हो जाती है जिससे शेष विधियां बाधाओं को पूरा करती हैं।

बाधा-आधारित क्लस्टरिंग उन समूहों की खोज करती है जो उपयोगकर्ता द्वारा परिभाषित प्राथमिकताओं या बाधाओं को पूरा करते हैं। यह बाधाओं की विशेषताओं पर निर्भर करता है, अलग-अलग दृष्टिकोणों के बजाय बाधा-आधारित क्लस्टरिंग अपना सकते हैं।

बाधाओं में निम्नलिखित शामिल हो सकते हैं जो इस प्रकार हैं -

ज्ञान प्रकार की बाधाएं - ये संबंध या सहसंबंध सहित, खनन किए जाने वाले ज्ञान के प्रकार को परिभाषित करते हैं।

डेटा की कमी - ये कार्य-प्रासंगिक जानकारी के सेट को परिभाषित करते हैं जैसे कि आयाम/स्तर की बाधाएं - ये जानकारी के वांछित आयामों (या विशेषताओं) को परिभाषित करती हैं, या अवधारणा पदानुक्रमों के तरीकों को खनन में उपयोग करने के लिए परिभाषित करती हैं।

रुचि की कमी - ये समर्थन, विश्वास और सहसंबंध सहित, नियम की रुचि के संख्यात्मक उपायों पर थ्रेसहोल्ड को परिभाषित करते हैं।

नियम की कमी - ये खनन किए जाने वाले नियमों के रूप को परिभाषित करते हैं। इस तरह की बाधाओं को मेटारूल्स (नियम टेम्प्लेट) के रूप में परिभाषित किया जा सकता है, विधेय की अधिकतम या न्यूनतम संख्या के रूप में जो नियम पूर्ववर्ती या परिणामी में प्रकट हो सकते हैं, या विशेषताओं, विशेषता मानों और/या समुच्चय के बीच संबंधों के रूप में।

एक उच्च-स्तरीय घोषणात्मक डेटा माइनिंग क्वेरी भाषा और उपयोगकर्ता इंटरफ़ेस का उपयोग करके निम्नलिखित बाधाओं का वर्णन किया जा सकता है। बाधा-आधारित खनन का यह रूप उपयोगकर्ताओं को उन नियमों को परिभाषित करने में सक्षम बनाता है जिन्हें वे उजागर करना पसंद कर सकते हैं, इस प्रकार डेटा खनन प्रक्रिया को और अधिक कुशल बनाकर।

इसके अलावा, एक परिष्कृत खनन क्वेरी अनुकूलक का उपयोग उपयोगकर्ता द्वारा परिभाषित बाधाओं को दूर करने के लिए किया जा सकता है, जिससे खनन प्रक्रिया अधिक प्रभावी हो जाती है। बाधा-आधारित खनन इंटरैक्टिव खोजपूर्ण खनन और विश्लेषण को बढ़ावा देता है।


  1. वेब उपयोग खनन क्या है?

    वेब उपयोग खनन का उपयोग वेबलॉग डेटा से उपयोगी डेटा, सूचना, ज्ञान प्राप्त करने के लिए किया जाता है, और वेब पेजों के लिए उपयोगकर्ता एक्सेस डिज़ाइन की पहचान करने में मदद करता है। खनन में, वेब संसाधनों का प्रबंधन, व्यक्ति एक वेबसाइट के आगंतुकों के अनुरोधों के डेटा के बारे में सोच रहा है जो वेब सर्वर लॉग

  1. डेटा माइनिंग में बाधाओं का वर्गीकरण क्या हैं?

    बाधा-आधारित एल्गोरिदम को बार-बार आइटमसेट जनरेशन चरण में खोज क्षेत्र को कम करने के लिए बाधाओं की आवश्यकता होती है (एसोसिएशन नियम बनाने वाला चरण संपूर्ण एल्गोरिदम के लिए सटीक है)। बाधाओं का महत्व अच्छी तरह से परिभाषित है और वे केवल एसोसिएशन नियम बनाते हैं जो ग्राहकों के लिए दिलचस्प हैं। विधि काफी तुच

  1. Spatiotemporal डेटा माइनिंग क्या है?

    Spatiotemporal डेटा माइनिंग, spatiotemporal डेटा से पैटर्न और ज्ञान खोजने की प्रक्रिया को परिभाषित करता है। स्पोटियोटेम्पोरल डेटा माइनिंग के एक उदाहरण में शहरों और भूमि के विकास के इतिहास का पता लगाना, मौसम के डिजाइन को उजागर करना, भूकंप और तूफान की भविष्यवाणी करना और ग्लोबल वार्मिंग के रुझान तय करन