Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

AOI क्या है?

<घंटा/>

AOI का मतलब विशेषता-उन्मुख प्रेरण है। अवधारणा विवरण के लिए विशेषता-उन्मुख प्रेरण दृष्टिकोण पहली बार 1989 में डेटा क्यूब दृष्टिकोण की शुरुआत से कुछ साल पहले प्रस्तावित किया गया था। डेटा क्यूब दृष्टिकोण अनिवार्य रूप से डेटा के भौतिक विचारों पर आधारित होता है, जिसे आमतौर पर डेटा वेयरहाउस में पूर्व-गणना किया जाता है।

सामान्य तौर पर, यह प्रसंस्करण के लिए OLAP या डेटा माइनिंग क्वेरी सबमिट किए जाने से पहले ऑफ़लाइन एकत्रीकरण को लागू करता है। दूसरे शब्दों में, विशेषता-उन्मुख प्रेरण दृष्टिकोण आम तौर पर एक क्वेरी-उन्मुख, सामान्यीकरण-आधारित, ऑन-लाइन डेटा विश्लेषण पद्धति है।

विशेषता-उन्मुख प्रेरण का सामान्य विचार पहले डेटाबेस क्वेरी का उपयोग करके कार्य-प्रासंगिक डेटा एकत्र करना है और फिर डेटा के प्रासंगिक संग्रह में प्रत्येक विशेषता के अलग-अलग मानों की संख्या की जांच के आधार पर सामान्यीकरण करना है।

सामान्यीकरण विशेषता हटाने या विशेषता सामान्यीकरण द्वारा कार्यान्वित किया जाता है। समान सामान्यीकृत टुपल्स को मिलाकर और उनकी विशिष्ट गणनाओं को जमा करके एकत्रीकरण को लागू किया जाता है। यह सामान्यीकृत डेटा सेट के आकार को कम करता है। परिणामी सामान्यीकृत संघ को चार्ट या नियमों सहित उपयोगकर्ता को प्रस्तुत करने के लिए कई रूपों में मैप किया जा सकता है।

विशेषता-उन्मुख प्रेरण की प्रक्रिया जो इस प्रकार है -

  • सबसे पहले, विशेषता-उन्मुख प्रेरण से पहले डेटा फ़ोकसिंग को लागू किया जाना चाहिए। यह चरण कार्य-प्रासंगिक रिकॉर्ड (यानी, विश्लेषण के लिए डेटा) के विवरण से मेल खाता है। डेटा माइनिंग क्वेरी में समर्थित डेटा के आधार पर डेटा एकत्र किया जाता है।

  • क्योंकि डेटा माइनिंग क्वेरी आमतौर पर डेटाबेस के केवल एक हिस्से के लिए प्रासंगिक होती है, डेटा के प्रासंगिक सेट का चयन न केवल माइनिंग को अधिक कुशल बनाता है, बल्कि पूरे डेटाबेस को माइन करने की तुलना में अधिक महत्वपूर्ण परिणाम भी बदलता है।

  • यह प्रासंगिक विशेषताओं के सेट को निर्दिष्ट कर सकता है (यानी, खनन के लिए विशेषताएँ, जैसा कि डीएमक्यूएल में खंड की प्रासंगिकता के साथ इंगित किया गया है) उपयोगकर्ता के लिए मुश्किल हो सकता है। एक उपयोगकर्ता केवल कुछ विशेषताओं को चुन सकता है जो कि महत्वपूर्ण हैं, जबकि अन्य को याद कर रहे हैं जो प्रतिनिधित्व में भी भूमिका निभा सकते हैं।

  • उदाहरण के लिए, मान लीजिए कि आयाम जन्म स्थान शहर, प्रांत या राज्य और देश की विशेषताओं से परिभाषित होता है। यह जन्म स्थान आयाम पर सामान्यीकरण की अनुमति दे सकता है, इस आयाम को परिभाषित करने वाली अन्य विशेषताओं को भी शामिल किया जाना चाहिए।

  • दूसरे शब्दों में, सिस्टम में स्वचालित रूप से प्रांत या राज्य और देश को प्रासंगिक विशेषताओं के रूप में शामिल करने से शहर को इंडक्शन चरण के दौरान इन बड़े वैचारिक स्तरों पर सामान्यीकृत किया जा सकता है।

  • दूसरे चरम पर, मान लीजिए कि उपयोगकर्ता ने "* से प्रासंगिकता में" खंड के साथ सभी संभावित विशेषताओं को निर्दिष्ट करके बहुत अधिक विशेषताओं का परिचय दिया हो। इस मामले में, खंड से निर्दिष्ट संबंध में सभी विशेषताओं को विश्लेषण में शामिल किया जाएगा।

  • कुछ विशेषताओं के दिलचस्प प्रतिनिधित्व में योगदान करने की संभावना नहीं है। एक सहसंबंध-आधारित या एन्ट्रॉपी-आधारित विश्लेषण पद्धति का उपयोग विशेषता प्रासंगिकता विश्लेषण करने और वर्णनात्मक खनन प्रक्रिया से सांख्यिकीय रूप से अप्रासंगिक या कमजोर रूप से प्रासंगिक विशेषताओं को फ़िल्टर करने के लिए किया जा सकता है।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. एक विशेषता क्या है?

    एक विशेषता एक डेटा फ़ील्ड है, जो डेटा ऑब्जेक्ट की विशेषता को परिभाषित करती है। साहित्य में संज्ञा गुण, आयाम, विशेषता और चर का प्रयोग संगत रूप से किया जाता है। आयाम आमतौर पर डेटा वेयरहाउसिंग में उपयोग किया जाता है। मशीन लर्निंग लिटरेचर फीचर शब्द का उपयोग करने के लिए प्रभावित करता है, जबकि सांख्यिकीवि

  1. सीरियलाइजेशन क्या है?

    हाल ही में एक प्रोजेक्ट अपडेट मीटिंग के दौरान, मेरी टीम ने इस बारे में बात की कि हम इस एप्लिकेशन से डेटा को आगे और पीछे भेजने के लिए क्रमांकन का उपयोग कैसे करने जा रहे हैं। एक इंजीनियर जो सॉफ्टवेयर परियोजनाओं में और अधिक काम करना चाह रहा था, उसने मुझे बताया कि वे इस शब्द से अपरिचित थे। इस तरह की