खनन पद्धति के विभिन्न पहलू क्या हैं?

<घंटा/>

खनन पद्धति के विभिन्न पहलू हैं जो इस प्रकार हैं -

विभिन्न और नए प्रकार के ज्ञान का खनन - डेटा माइनिंग डेटा विश्लेषण और ज्ञान खोज सेवाओं के व्यापक स्पेक्ट्रम को कवर करता है, डेटा लक्षण वर्णन और भेदभाव से लेकर संबंधों और सहसंबंध विश्लेषण, वर्गीकरण, प्रतिगमन, क्लस्टरिंग, बाहरी तरीकों, अनुक्रम विधियों, और प्रवृत्ति और कम्प्यूटेशनल विश्लेषण तक।

ये सेवाएं एक ही डेटाबेस का कई तरीकों से उपयोग कर सकती हैं और इसके लिए कई डेटा माइनिंग तकनीकों के विकास की आवश्यकता होती है। सॉफ्टवेयर की विविधता के कारण, नई खनन सेवाएं उभरती रहती हैं, जिससे डेटा माइनिंग एक शक्तिशाली और तेजी से बढ़ता हुआ क्षेत्र विकसित होता है।

उदाहरण के लिए, डेटा नेटवर्क में प्रभावी ज्ञान खोज के लिए, एकीकृत क्लस्टरिंग और रैंकिंग से उच्च नेटवर्क में उच्च गुणवत्ता वाले क्लस्टर और ऑब्जेक्ट रैंक की खोज हो सकती है।

बहुआयामी अंतरिक्ष में खनन ज्ञान - उच्च डेटा सेट में ज्ञान की जांच करते समय, यह बहुआयामी अंतरिक्ष में जानकारी का विश्लेषण कर सकता है। यह अमूर्त के कई स्तरों पर आयामों (विशेषताओं) के सेट के बीच दिलचस्प पैटर्न की खोज कर सकता है। इस तरह के खनन को (खोजपूर्ण) बहुआयामी डेटा माइनिंग कहा जाता है।

कई मामलों में, डेटा एकत्र किया जा सकता है या एक बहुआयामी डेटा क्यूब के रूप में माना जा सकता है। घन क्षेत्र में खनन ज्ञान डेटा खनन की शक्ति और अनुकूलन क्षमता को बढ़ा सकता है।

डेटा माइनिंग—एक अंतःविषय प्रयास - कई विषयों से नई तकनीकों को एकीकृत करके डेटा माइनिंग की शक्ति में सुधार किया जा सकता है। उदाहरण के लिए, यह प्राकृतिक भाषा पाठ के साथ रिकॉर्ड को माइन कर सकता है, यह डेटा पुनर्प्राप्ति और प्राकृतिक भाषा प्रसंस्करण के तरीकों के साथ डेटा माइनिंग दृष्टिकोण को फ्यूज करने के लिए समझ में आता है।

नेटवर्क वाले वातावरण में खोज की शक्ति को बढ़ाना - कुछ डेटा ऑब्जेक्ट कनेक्टेड या इंटरकनेक्टेड वातावरण में रहते हैं, चाहे वह वेब, डेटाबेस एसोसिएशन, फाइलें या रिकॉर्ड हों। डेटा माइनिंग में लाभ के लिए कई डेटा ऑब्जेक्ट्स में सिमेंटिक कनेक्शन का उपयोग किया जा सकता है। वस्तुओं के एक समूह में परिवर्तित ज्ञान का उपयोग वस्तुओं के "संबद्ध" या शब्दार्थिक रूप से संबंध समूह में ज्ञान की खोज को बढ़ाने के लिए किया जा सकता है।

अनिश्चितता, शोर, या डेटा की अपूर्णता को संभालना - डेटा में शोर, त्रुटियां, अपवाद, या अस्पष्टता शामिल है, या अपूर्ण हैं। त्रुटियां और शोर डेटा खनन चरण को भ्रमित कर सकते हैं, जिससे गलत डिजाइनों की व्युत्पत्ति हो सकती है। डेटा की सफाई, डेटा प्रीप्रोसेसिंग, बाहरी पहचान और निष्कासन, और अस्पष्टता तर्क उन तरीकों के उदाहरण हैं जिन्हें डेटा माइनिंग प्रक्रिया के साथ एकीकृत करने की आवश्यकता होती है।

पैटर्न मूल्यांकन और पैटर्न- या बाधा-निर्देशित खनन - ऐसा नहीं है कि डेटा माइनिंग प्रक्रियाओं द्वारा निर्मित कुछ पैटर्न दिलचस्प हैं। यह एक दिलचस्प पैटर्न बना सकता है जो उपयोगकर्ता से उपयोगकर्ता में भिन्न हो सकता है। इसलिए, खोजे गए पैटर्न की रुचि का आकलन करने के लिए तकनीकों की आवश्यकता होती है जो व्यक्तिपरक उपायों पर निर्भर करती है।

ये किसी दिए गए उपयोगकर्ता वर्ग से संबंधित पैटर्न के मूल्य की गणना करते हैं, जो उपयोगकर्ता के विश्वासों या अपेक्षाओं पर निर्भर करता है। इसके अलावा, खोज प्रक्रिया को समझने के लिए रुचिकर उपायों या उपयोगकर्ता-परिभाषित बाधाओं का उपयोग करके, यह अधिक दिलचस्प पैटर्न बना सकता है और खोज स्थान को कम कर सकता है।