Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में एकल-विशेषता मूल्यांकनकर्ता क्या हैं?

<घंटा/>

एकल-विशेषता मूल्यांकनकर्ताओं में, इसका उपयोग रैंकर खोज विधियों के साथ एक रैंक सूची बनाने के लिए किया जा सकता है जिससे रैंकर किसी दिए गए नंबर को छोड़ देता है। इसका उपयोग रैंक खोज पद्धति में भी किया जाता है।

रिलीफ एट्रीब्यूट इवल इंस्टेंस-आधारित है - यह बेतरतीब ढंग से उदाहरणों का नमूना लेता है और समान और कई वर्गों के पड़ोसी उदाहरणों की जाँच करता है। यह असतत और निरंतर वर्ग डेटा पर काम करता है। पैरामीटर नमूने के लिए कई उदाहरणों को परिभाषित करते हैं, विभिन्न पड़ोसियों की जांच करने के लिए, दूरी के आधार पर पड़ोसियों का वजन करना है या नहीं, और एक घातीय कार्य जो यह संचालित करता है कि दूरी के साथ वजन कितनी तेजी से क्षय होता है।

इन्फोगेन एट्रीब्यूट इवल - यह वर्ग से संबंधित उनके सूचना लाभ की गणना करके विशेषताओं की गणना करता है। यह पहले एमडीएल-आधारित विवेकीकरण दृष्टिकोणों का उपयोग करते हुए संख्यात्मक विशेषताओं को अलग करता है। यह दृष्टिकोण, निम्नलिखित तीन के साथ, एक स्वतंत्र मूल्य के रूप में लापता होने पर विचार कर सकता है या उनकी आवृत्ति के अनुपात में अन्य मूल्यों के बीच की गणना को वितरित कर सकता है।

ची-स्क्वायर एट्रीब्यूट इवल - यह वर्ग से संबंधित ची-वर्ग के आंकड़ों की गणना करके विशेषताओं की गणना करता है।

लाभ-अनुपात विशेषता Eval - यह वर्ग से संबंधित उनके लाभ अनुपात की गणना करके विशेषताओं की गणना करता है।

सममितीय Uncert-विशेषता Eval - यह वर्ग के संबंध में अपनी सममित अनिश्चितता की गणना करके एक विशेषता की गणना करता है।

OneRAttribute Eval - इसे OneR क्लासिफायर द्वारा अपनाए गए स्वच्छ सटीकता माप की आवश्यकता है। इसे गणना के लिए प्रशिक्षण डेटा की आवश्यकता हो सकती है, जैसा कि OneR करता है, या यह आंतरिक क्रॉस-सत्यापन का उपयोग कर सकता है - कई गुना एक पैरामीटर है। यह OneR के सरल विवेकीकरण दृष्टिकोण का चयन कर सकता है - न्यूनतम बकेट आकार एक पैरामीटर है।

एसवीएम-एट्रिब्यूट इवल - यह एक रैखिक समर्थन वेक्टर मशीन के साथ पुनरावर्ती सुविधा हटाने का उपयोग करके विशेषताओं की गणना करता है। गुणों को उनके गुणांकों के आकार के आधार पर एक-एक करके चुना जाता है, हर किसी के बाद फिर से सीखना।

वास्तव में, एक अनुपात का उपयोग तब तक किया जा सकता है जब तक कि एक निश्चित संख्या में विशेषताएँ बनी रहती हैं, इसके बाद निश्चित-संख्या पद्धति पर स्विच करने से कई विशेषताएँ समाप्त हो जाती हैं और फिर प्रत्येक शेष एक पर अधिक गहनता से विचार किया जाता है।

सपोर्ट वेक्टर मशीन - जटिलता, एप्सिलॉन, टॉलरेंस और उपयोग की जाने वाली फ़िल्टरिंग विधि को विभिन्न पैरामीटर पास किए जाते हैं।

प्रिंसिपल कंपोनेंट्स और लेटेंट सिमेंटिक एनालिसिस विशेषताओं के सेट को बदल देते हैं। प्रिंसिपल कंपोनेंट्स के मामले में, नई विशेषताओं को उनके आइजनवैल्यू के क्रम में रैंक किया जाता है। वैकल्पिक रूप से, विचरण के दिए गए अनुपात (डिफ़ॉल्ट रूप से 95%) के लिए खाते में पर्याप्त eigenvectors चुनकर एक सबसेट का चयन किया जाता है। अंत में, कम किए गए डेटा को मूल स्थान पर वापस रूपांतरित किया जा सकता है।

अव्यक्त शब्दार्थ विश्लेषण प्रशिक्षण डेटा के लिए एक विलक्षण मूल्य अपघटन लागू करता है। एकवचन मूल्य अपघटन प्रमुख घटकों के विश्लेषण से संबंधित है-दोनों दिशाओं का उत्पादन करते हैं जो मूल विशेषता मानों के रैखिक संयोजन होते हैं लेकिन इसमें भिन्नता होती है कि यह विशेषता सहसंबंध या सहप्रसरण मैट्रिक्स के बजाय मूल डेटा मानों वाले मैट्रिक्स से गणना की जाती है।


  1. वेब माइनिंग के तरीके क्या हैं?

    वेब माइनिंग सीखने या ज्ञान प्राप्त करने के लक्ष्यों के लिए वेब-आधारित डेटा के लिए मशीन लर्निंग (डेटा माइनिंग) दृष्टिकोण का अनुप्रयोग है। वेब माइनिंग के तरीकों को तीन अलग-अलग तत्वों में से एक में परिभाषित किया जा सकता है जो इस प्रकार हैं - वेब उपयोग खनन - वेब यूसेज माइनिंग एक तरह का वेब माइनिंग है ज

  1. स्थानिक डेटा माइनिंग की मूल बातें क्या हैं?

    स्थानिक डेटा माइनिंग स्थानिक मॉडल के लिए डेटा माइनिंग का अनुप्रयोग है। स्थानिक डेटा माइनिंग में, विश्लेषक भौगोलिक या स्थानिक डेटा का उपयोग व्यावसायिक खुफिया या अलग-अलग परिणाम बनाने के लिए करते हैं। भौगोलिक डेटा को प्रासंगिक और लाभकारी स्वरूपों में लाने के लिए इसके लिए विशिष्ट विधियों और संसाधनों की

  1. एक विशेषता क्या है?

    एक विशेषता एक डेटा फ़ील्ड है, जो डेटा ऑब्जेक्ट की विशेषता को परिभाषित करती है। साहित्य में संज्ञा गुण, आयाम, विशेषता और चर का प्रयोग संगत रूप से किया जाता है। आयाम आमतौर पर डेटा वेयरहाउसिंग में उपयोग किया जाता है। मशीन लर्निंग लिटरेचर फीचर शब्द का उपयोग करने के लिए प्रभावित करता है, जबकि सांख्यिकीवि