Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ऑन-लाइन विश्लेषणात्मक खनन की संरचना क्या है?

<घंटा/>

एक OLAM सर्वर डेटा क्यूब्स में विश्लेषणात्मक माइनिंग करता है, ठीक उसी तरह जैसे कोई OLAP सर्वर ऑनलाइन एनालिटिकल प्रोसेसिंग करता है। एक एकीकृत OLAM और OLAP तंत्र, जहां OLAM और OLAP सर्वर दोनों एक ग्राफिकल यूजर इंटरफेस एपीआई के माध्यम से उपयोगकर्ता के ऑनलाइन प्रश्नों (या कमांड) को स्वीकार करते हैं और एक क्यूब एपीआई के माध्यम से डेटा विश्लेषण में डेटा क्यूब के साथ काम करते हैं।

डेटा क्यूब की पहुंच का निर्देश देने के लिए मेटाडेटा निर्देशिका का उपयोग किया जा सकता है। डेटा क्यूब को एमडीडीबी एपीआई के माध्यम से कई डेटाबेस तक पहुंच और एकीकृत करके और डेटाबेस एपीआई के माध्यम से डेटा वेयरहाउस को फ़िल्टर करके बनाया जा सकता है जो ओएलई डीबी या ओडीबीसी कनेक्शन प्रदान कर सकता है।

क्योंकि एक OLAM सर्वर कई डेटा माइनिंग कार्यों को लागू कर सकता है, जिसमें अवधारणा विवरण, संघ, वर्गीकरण, भविष्यवाणी, क्लस्टरिंग, समय-श्रृंखला विश्लेषण आदि शामिल हैं। इसमें आम तौर पर कई एकीकृत डेटा माइनिंग मॉड्यूल शामिल होते हैं और यह OLAP सर्वर की तुलना में अधिक परिष्कृत होता है।

एक OLAM इंजन कई डेटा माइनिंग कार्य कर सकता है, जैसे कि अवधारणा विवरण, संघ, वर्गीकरण, भविष्यवाणी, क्लस्टरिंग और समय-श्रृंखला विश्लेषण। इसलिए, इसमें आमतौर पर कई, एकीकृत डेटा माइनिंग मॉड्यूल होते हैं, जो इसे OLAP इंजन की तुलना में अधिक परिष्कृत बनाते हैं। OLAP के लिए आवश्यक डेटा क्यूब और OLAM के लिए आवश्यक डेटा क्यूब के बीच कोई मूलभूत अंतर नहीं है, हालांकि OLAM विश्लेषण के लिए अधिक शक्तिशाली डेटा क्यूब निर्माण और एक्सेसिंग टूल की आवश्यकता हो सकती है।

यह वह स्थिति है जब OLAM में बारीक ग्रैन्युलैरिटी के साथ अधिक आयाम शामिल होते हैं या डेटा क्यूब पर मल्टी-फीचर एग्रीगेशन की खोज-संचालित खोज शामिल होती है, जिसके लिए OLAP से अधिक विश्लेषण की आवश्यकता होती है। इसके अलावा, जब खोजपूर्ण डेटा माइनिंग दिलचस्प स्थानों की पहचान करता है, तो डेटा के विशिष्ट भागों के विस्तृत विश्लेषण के लिए OLAM इंजन को डेटा क्यूब से संबंधित रिलेशनल डेटाबेस में ड्रिल करने की आवश्यकता हो सकती है।

यह वह स्थिति है जब OLAM में बारीक ग्रैन्युलैरिटी के साथ अधिक आयाम शामिल होते हैं या डेटा क्यूब पर मल्टी-फीचर एग्रीगेशन की खोज-संचालित खोज शामिल होती है, जिसके लिए OLAP से अधिक विश्लेषण की आवश्यकता होती है। इसके अलावा, जब खोजपूर्ण डेटा माइनिंग दिलचस्प स्थानों की पहचान करता है, तो डेटा के विशिष्ट भागों के विस्तृत विश्लेषण के लिए OLAM इंजन को डेटा क्यूब से संबंधित रिलेशनल डेटाबेस में ड्रिल करने की आवश्यकता हो सकती है।

इसके अलावा, एक डेटा माइनिंग प्रक्रिया यह प्रकट कर सकती है कि निर्मित क्यूब के आयाम या माप डेटा विश्लेषण के लिए उपयुक्त नहीं हैं। यहां, एक परिष्कृत डेटा क्यूब डिज़ाइन डेटा वेयरहाउस निर्माण की गुणवत्ता में सुधार कर सकता है।

एक प्रभावी डेटा माइनिंग के लिए खोजपूर्ण डेटा विश्लेषण की आवश्यकता होती है। उपयोगकर्ता अक्सर एक डेटाबेस के माध्यम से जाना चाहते हैं, प्रासंगिक डेटा के कुछ हिस्सों का चयन करते हैं, विभिन्न ग्रैन्युलैरिटी पर उनका विश्लेषण करते हैं, और विभिन्न रूपों में ज्ञान/परिणाम प्रस्तुत करते हैं।

ऑनलाइन विश्लेषणात्मक खनन डेटा के विभिन्न उपसमुच्चय और अमूर्त के विभिन्न स्तरों पर डेटा माइनिंग के लिए सुविधाएं प्रदान करता है। यह डेटा क्यूब और इंटरमीडिएट डेटा माइनिंग परिणामों पर ड्रिलिंग, पिवोटिंग, फ़िल्टरिंग, डाइसिंग और स्लाइसिंग द्वारा इसे प्राप्त कर सकता है। यह, डेटा/ज्ञान विज़ुअलाइज़ेशन टूल के साथ, खोजपूर्ण डेटा माइनिंग की शक्ति और अनुकूलन क्षमता को अत्यधिक बढ़ा सकता है।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. वेब संरचना खनन क्या है?

    वेब स्ट्रक्चर माइनिंग एक ऐसा उपकरण है जो डेटा या डायरेक्ट लिंक कनेक्शन से जुड़े वेब पेजों के बीच संबंध को पहचान सकता है। यह संरचित डेटा वेब पेजों के लिए डेटाबेस तकनीकों के माध्यम से वेब संरचना स्कीमा के प्रावधान द्वारा खोजा जा सकता है। यह कनेक्शन एक खोज इंजन को एक खोज क्वेरी से जुड़े डेटा को सीधे उ

  1. टेम्पोरल डेटा माइनिंग क्या है?

    अस्थायी डेटा खनन अस्थायी डेटा के बड़े सेट से गैर-तुच्छ, निहित और संभावित रूप से आवश्यक डेटा के निष्कर्षण की प्रक्रिया को परिभाषित करता है। अस्थायी डेटा प्राथमिक डेटा प्रकारों की एक श्रृंखला है, आम तौर पर संख्यात्मक मान, और यह अस्थायी डेटा से लाभकारी ज्ञान एकत्र करने से संबंधित है। अस्थायी डेटा माइन