वीका डेटा माइनिंग क्या है?

<घंटा/>

Weka डेटा माइनिंग सेवाओं के लिए मशीन लर्निंग एल्गोरिदम का एक सेट है। एल्गोरिदम का उपयोग सीधे डेटासेट या आपके अपने जावा प्रोग्राम से किया जा सकता है। इसमें डेटा प्री-प्रोसेसिंग, वर्गीकरण, रिग्रेशन, क्लस्टरिंग, एसोसिएशन नियम और विज़ुअलाइज़ेशन के लिए टूल शामिल हैं। यह नई मशीन लर्निंग योजनाओं के निर्माण के लिए भी लागू है।

Weka का उपयोग करने का एक तरीका डेटासेट के लिए सीखने के दृष्टिकोण का उपयोग करना और रिकॉर्ड के बारे में अधिक जानने के लिए इसके आउटपुट का विश्लेषण करना है। दूसरा यह है कि नए उदाहरणों पर भविष्यवाणियां करने के लिए सीखे गए मॉडलों की आवश्यकता है।

एक तिहाई कई शिक्षार्थियों का उपयोग करना और भविष्यवाणी के लिए एक का चयन करने के लिए उनके प्रदर्शन की तुलना करना है। इंटरैक्टिव वीका इंटरफ़ेस में, यह एक मेनू से आवश्यक सीखने की विधि चुन सकता है। कई विधियों में ट्यून करने योग्य पैरामीटर होते हैं, जो एक प्रॉपर्टी शीट या ऑब्जेक्ट एडिटर के माध्यम से बना सकते हैं। सभी क्लासिफायर के प्रदर्शन की गणना करने के लिए एक सामान्य गणना संरचना का उपयोग किया जाता है।

यह दिखा सकता है कि विभिन्न फ़िल्टर का उपयोग कैसे किया जा सकता है, फ़िल्टरिंग एल्गोरिदम को सूचीबद्ध करें, और उनके मापदंडों का वर्णन करें। Weka में एसोसिएशन के नियमों को सीखने के लिए एल्गोरिदम का कार्यान्वयन, डेटा को क्लस्टर करना जिसके लिए कोई वर्ग मान निर्दिष्ट नहीं है, और डेटा में प्रासंगिक विशेषताओं का चयन करना शामिल है।

Weka का उपयोग करने का सबसे सरल तरीका एक ग्राफिकल यूजर इंटरफेस के माध्यम से है जिसे एक्सप्लोरर के रूप में जाना जाता है। यह मेनू चयन और फॉर्म भरने का उपयोग करके इसकी कुछ सुविधाओं तक पहुंच प्रदान करता है। उदाहरण के लिए, यह किसी ARFF दस्तावेज़ (या स्प्रेडशीट) के डेटासेट में तेज़ी से पढ़ सकता है और उससे निर्णय ट्री बना सकता है।

एक्सप्लोरर इंटरफ़ेस हमें विकल्पों को मेनू के रूप में प्रस्तुत करके प्रदान करता है, हमें उपयुक्त क्रम में काम करने के लिए मजबूर करता है, जब तक कि वे उपयुक्त न हों, और विकल्पों को भरने के लिए विकल्पों को प्रदर्शित करके। यह उपयोगी टूलटिप्स पॉप अप होता है क्योंकि माउस स्क्रीन पर तत्वों के ऊपर से गुजरता है यह समझने के लिए कि वे क्या करते हैं। समझदार डिफ़ॉल्ट मान यह प्रदान करते हैं कि यह कम से कम प्रयास के साथ परिणाम प्राप्त कर सकता है-लेकिन परिणामों के अर्थ को समझने के लिए उसे यह सोचना होगा कि इसका क्या अर्थ है।

नॉलेज फ्लो इंटरफ़ेस हमें स्ट्रीम की गई सूचना प्रसंस्करण के लिए एक संरचना बनाने की अनुमति देता है। एक्सप्लोरर इंटरफ़ेस की सीमा यह है कि यह मुख्य मेमोरी में सब कुछ प्रभावित करता है जब यह डेटासेट खोल सकता है, यह सीधे इसे सभी में लोड करता है।

इसका अर्थ है कि एक्सप्लोरर का उपयोग छोटे से मध्यम आकार की समस्याओं के लिए किया जा सकता है। हालांकि, वीका में कुछ वृद्धिशील एल्गोरिदम शामिल हैं जिनका उपयोग विशाल डेटासेट को संसाधित करने के लिए किया जा सकता है। नॉलेज फ्लो इंटरफ़ेस हमें स्क्रीन के चारों ओर लर्निंग एल्गोरिदम और डेटा स्रोतों को परिभाषित करने वाले बॉक्स को खींचने और उन्हें आवश्यक कॉन्फ़िगरेशन में जोड़ने की अनुमति देता है।

यह हमें डेटा स्रोतों को परिभाषित करने वाले घटकों, प्रीप्रोसेसिंग टूल, लर्निंग एल्गोरिदम, गणना विधियों और विज़ुअलाइज़ेशन मॉड्यूल को जोड़कर डेटा स्ट्रीम को परिभाषित करने की अनुमति देता है। यदि फ़िल्टर और शिक्षण एल्गोरिदम वृद्धिशील सीखने के लिए पर्याप्त हैं, तो डेटा को अतिरिक्त रूप से लोड और संसाधित किया जाएगा।