AOI का मतलब विशेषता-उन्मुख प्रेरण है। अवधारणा विवरण के लिए विशेषता-उन्मुख प्रेरण दृष्टिकोण पहली बार 1989 में डेटा क्यूब दृष्टिकोण की शुरुआत से कुछ साल पहले प्रस्तावित किया गया था। डेटा क्यूब दृष्टिकोण अनिवार्य रूप से डेटा के भौतिक विचारों पर आधारित होता है, जिसे आमतौर पर डेटा वेयरहाउस में पूर्व-गणना किया जाता है।
सामान्य तौर पर, यह प्रसंस्करण के लिए OLAP या डेटा माइनिंग क्वेरी सबमिट किए जाने से पहले ऑफ़लाइन एकत्रीकरण को लागू करता है। दूसरे शब्दों में, विशेषता-उन्मुख प्रेरण दृष्टिकोण आम तौर पर एक क्वेरी-उन्मुख, सामान्यीकरण-आधारित, ऑन-लाइन डेटा विश्लेषण पद्धति है।
विशेषता-उन्मुख प्रेरण का सामान्य विचार पहले डेटाबेस क्वेरी का उपयोग करके कार्य-प्रासंगिक डेटा एकत्र करना है और फिर डेटा के प्रासंगिक संग्रह में प्रत्येक विशेषता के अलग-अलग मानों की संख्या की जांच के आधार पर सामान्यीकरण करना है।
सामान्यीकरण विशेषता हटाने या विशेषता सामान्यीकरण द्वारा कार्यान्वित किया जाता है। समान सामान्यीकृत टुपल्स को मिलाकर और उनकी विशिष्ट गणनाओं को जमा करके एकत्रीकरण को लागू किया जाता है। यह सामान्यीकृत डेटा सेट के आकार को कम करता है। परिणामी सामान्यीकृत संघ को चार्ट या नियमों सहित उपयोगकर्ता को प्रस्तुत करने के लिए कई रूपों में मैप किया जा सकता है।
विशेषता-उन्मुख प्रेरण की प्रक्रिया जो इस प्रकार है -
-
सबसे पहले, विशेषता-उन्मुख प्रेरण से पहले डेटा फ़ोकसिंग को लागू किया जाना चाहिए। यह चरण कार्य-प्रासंगिक रिकॉर्ड (यानी, विश्लेषण के लिए डेटा) के विवरण से मेल खाता है। डेटा माइनिंग क्वेरी में समर्थित डेटा के आधार पर डेटा एकत्र किया जाता है।
-
क्योंकि डेटा माइनिंग क्वेरी आमतौर पर डेटाबेस के केवल एक हिस्से के लिए प्रासंगिक होती है, डेटा के प्रासंगिक सेट का चयन न केवल माइनिंग को अधिक कुशल बनाता है, बल्कि पूरे डेटाबेस को माइन करने की तुलना में अधिक महत्वपूर्ण परिणाम भी बदलता है।
-
यह प्रासंगिक विशेषताओं के सेट को निर्दिष्ट कर सकता है (यानी, खनन के लिए विशेषताएँ, जैसा कि डीएमक्यूएल में खंड की प्रासंगिकता के साथ इंगित किया गया है) उपयोगकर्ता के लिए मुश्किल हो सकता है। एक उपयोगकर्ता केवल कुछ विशेषताओं को चुन सकता है जो कि महत्वपूर्ण हैं, जबकि अन्य को याद कर रहे हैं जो प्रतिनिधित्व में भी भूमिका निभा सकते हैं।
-
उदाहरण के लिए, मान लीजिए कि आयाम जन्म स्थान शहर, प्रांत या राज्य और देश की विशेषताओं से परिभाषित होता है। यह जन्म स्थान आयाम पर सामान्यीकरण की अनुमति दे सकता है, इस आयाम को परिभाषित करने वाली अन्य विशेषताओं को भी शामिल किया जाना चाहिए।
-
दूसरे शब्दों में, सिस्टम में स्वचालित रूप से प्रांत या राज्य और देश को प्रासंगिक विशेषताओं के रूप में शामिल करने से शहर को इंडक्शन चरण के दौरान इन बड़े वैचारिक स्तरों पर सामान्यीकृत किया जा सकता है।
-
दूसरे चरम पर, मान लीजिए कि उपयोगकर्ता ने "* से प्रासंगिकता में" खंड के साथ सभी संभावित विशेषताओं को निर्दिष्ट करके बहुत अधिक विशेषताओं का परिचय दिया हो। इस मामले में, खंड से निर्दिष्ट संबंध में सभी विशेषताओं को विश्लेषण में शामिल किया जाएगा।
-
कुछ विशेषताओं के दिलचस्प प्रतिनिधित्व में योगदान करने की संभावना नहीं है। एक सहसंबंध-आधारित या एन्ट्रॉपी-आधारित विश्लेषण पद्धति का उपयोग विशेषता प्रासंगिकता विश्लेषण करने और वर्णनात्मक खनन प्रक्रिया से सांख्यिकीय रूप से अप्रासंगिक या कमजोर रूप से प्रासंगिक विशेषताओं को फ़िल्टर करने के लिए किया जा सकता है।