Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

अक्सर पैटर्न खनन के मानदंड क्या हैं?

<घंटा/>

फ़्रीक्वेंट पैटर्न माइनिंग के कई मानदंड हैं जो इस प्रकार हैं -

खनन किए जाने वाले पैटर्न की पूर्णता के आधार पर - यह न्यूनतम समर्थन सीमा प्रदान करते हुए, लगातार आइटमसेट, बंद बार-बार आइटमसेट, और अधिकतम बारंबार आइटमसेट के पूरे संग्रह को माइन कर सकता है।

यह विवश लगातार आइटमसेट को भी निकाल सकता है (यह उपयोगकर्ता द्वारा परिभाषित बाधाओं के संग्रह को संतुष्ट कर सकता है), अनुमानित लगातार आइटमसेट (यह खनन किए गए लगातार आइटमसेट के लिए केवल अनुमानित समर्थन गणना बदल सकता है), निकट-मिलान लगातार आइटमसेट (यह समर्थन गिनती की गणना कर सकता है) अपेक्षाकृत मेल खाने वाले आइटमसेट), टॉप-के फ़्रीक्वेंट आइटमसेट (अर्थात, उपयोगकर्ता-निर्दिष्ट मान के लिए k सबसे अधिक बार आने वाले आइटमसेट, k), आदि।

खनन किए जाने वाले पैटर्न की अखंडता के संबंध में कई अनुप्रयोगों की कई आवश्यकताएं हो सकती हैं, जिससे विभिन्न गणना और अनुकूलन दृष्टिकोण हो सकते हैं।

नियम सेट में शामिल अमूर्तता के स्तरों के आधार पर - एसोसिएशन रूल माइनिंग के लिए कई तरीके हैं जो एब्स्ट्रैक्शन के कई स्तरों पर नियमों की खोज कर सकते हैं। उदाहरण के लिए, मान लें कि खनन किए गए एसोसिएशन नियमों के समूह में निम्नलिखित नियम शामिल हैं जहां एक्स ग्राहक को परिभाषित करने वाला एक चर है -

खरीदता है (एक्स, "कंप्यूटर") ⇒ खरीदता है (एक्स, "एचपी प्रिंटर")

खरीदता है (एक्स, "लैपटॉप कंप्यूटर") ⇒ खरीदता है (एक्स, "एचपी प्रिंटर")

नियम में शामिल डेटा आयामों की संख्या के आधार पर - अगर किसी एसोसिएशन नियम में आइटम या विशेषताएँ केवल एक आयाम का संदर्भ देती हैं, तो यह एक-आयामी एसोसिएशन नियम है।

नियम में नियंत्रित मूल्यों के प्रकारों के आधार पर -यदि किसी नियम में वस्तुओं के अस्तित्व और अनुपस्थिति के बीच संबंध हैं, तो यह एक बूलियन एसोसिएशन नियम है। यदि कोई नियम मात्रात्मक वस्तुओं या विशेषताओं के बीच संघों को परिभाषित करता है, तो यह एक मात्रात्मक संघ नियम है। इन नियमों में, वस्तुओं या विशेषताओं के मात्रात्मक मूल्यों को अंतराल में विभाजित किया जाता है।

खनन किए जाने वाले नियमों के प्रकार के आधार पर - बार-बार पैटर्न विश्लेषण कई तरह के नियम और विभिन्न दिलचस्प संबंध बना सकता है। एसोसिएशन के नियम अक्सर पैटर्न से उत्पन्न होने वाले प्रसिद्ध प्रकार के नियम हैं।

खनन किए जाने वाले पैटर्न के प्रकार के आधार पर - कई प्रकार के डेटा सेट से कई प्रकार के लगातार पैटर्न का खनन किया जा सकता है। मुख्य लक्ष्य लगातार आइटमसेट माइनिंग पर है, यानी ट्रांजेक्शनल या रिलेशनल डेटा सेट से लगातार आइटमसेट (आइटम के सेट) का खनन।

अनुक्रमिक पैटर्न खनन एक अनुक्रम डेटा सेट में लगातार बाद की खोज करता है, जहां एक अनुक्रम डेटा घटनाओं का एक क्रम है। उदाहरण के लिए, अनुक्रमिक पैटर्न खनन के साथ, यह उस श्रृंखला का अध्ययन कर सकता है जिसमें आम तौर पर आइटम खरीदे जाते हैं। उदाहरण के लिए, उपयोगकर्ता पहले एक पीसी खरीद सकते हैं, उसके बाद एक डिजिटल कैमरा और फिर एक मेमोरी कार्ड खरीद सकते हैं।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. वेब माइनिंग के अनुप्रयोग क्या हैं?

    वेब माइनिंग डेटा माइनिंग तकनीकों का उपयोग करने की प्रक्रिया को परिभाषित करता है, जो वेब-आधारित रिकॉर्ड्स और सेवाओं, सर्वर लॉग्स, सर्वर लॉग्स, और हाइपरलिंक। वेब माइनिंग का उद्देश्य महत्वपूर्ण अंतर्दृष्टि प्राप्त करने के लिए डेटा को समूहीकृत और विश्लेषण करके वेब जानकारी में डिज़ाइन की खोज करना है। वे

  1. पैटर्न खनन के अनुप्रयोग क्या हैं?

    पैटर्न माइनिंग के विभिन्न अनुप्रयोग हैं जो इस प्रकार हैं - पैटर्न खनन आम तौर पर कई डेटा-गहन अनुप्रयोगों में प्रीप्रोसेसिंग के रूप में शोर फ़िल्टरिंग और डेटा सफाई के लिए उपयोग किया जाता है। इसका उपयोग माइक्रोएरे डेटा का पता लगाने के लिए किया जा सकता है, उदाहरण के लिए, जिसमें दसियों हज़ार आयाम शामिल