डेटा माइनिंग कृत्रिम बुद्धिमत्ता के रूपों में से एक है जो मानव मस्तिष्क की तकनीकों का अनुकरण करने के लिए धारणा मॉडल, विश्लेषणात्मक मॉडल और कई एल्गोरिदम का उपयोग करता है। डेटा माइनिंग मानवीय निर्णय लेने और मानवीय विकल्प बनाने के लिए मशीनों का समर्थन करता है।
डेटा माइनिंग टूल के उपयोगकर्ता को मशीन के नियमों, प्राथमिकताओं और यहां तक कि अनुभवों को निर्णय समर्थन डेटा माइनिंग मेट्रिक्स के लिए निर्देशित करना होगा, जो इस प्रकार हैं -
उपयोगिता - उपयोगिता में कई मीट्रिक शामिल होते हैं जो हमें बताते हैं कि मॉडल उपयोगी डेटा प्रदान करता है या नहीं। उदाहरण के लिए, एक डेटा माइनिंग मॉडल जो बिक्री के साथ स्थान को सहेजता है, सटीक और विश्वसनीय दोनों हो सकता है, लेकिन उपयोगी नहीं हो सकता है, क्योंकि यह एक ही स्थान पर अधिक स्टोर सम्मिलित करके उस परिणाम को सामान्य नहीं कर सकता है।
इसके अलावा, यह मौलिक व्यावसायिक प्रश्न का उत्तर नहीं देता है कि विशिष्ट स्थानों की बिक्री अधिक क्यों है। यह भी पाया जा सकता है कि एक मॉडल जो सफल दिखाई देता है वह अर्थहीन है क्योंकि यह डेटा में क्रॉस-सहसंबंधों पर निर्भर करता है।
निवेश पर लाभ (आरओआई) - डेटा माइनिंग टूल डेटा के अंदर दबे दिलचस्प पैटर्न पाएंगे और प्रेडिक्टिव मॉडल विकसित करेंगे। इन मॉडलों में यह दर्शाने के लिए कई उपाय होंगे कि वे रिकॉर्ड में कितनी अच्छी तरह फिट हैं। यह स्पष्ट नहीं है कि डेटा माइनिंग विश्लेषण के एक तत्व के रूप में रिपोर्ट किए गए कुछ उपायों के आधार पर निर्णय कैसे लिया जाए।
डेटा माइनिंग के दौरान वित्तीय जानकारी तक पहुंच - वित्तीय संदर्भ में निर्णय लेने का सबसे आसान तरीका कच्ची जानकारी को बढ़ाना है जिसे आम तौर पर खनन किया जाता है जिसमें वित्तीय डेटा भी शामिल होता है। कुछ संगठन डेटा वेयरहाउस, और डेटा मार्ट का निवेश और विकास कर रहे हैं।
एक गोदाम या मार्ट के डिजाइन में अपेक्षित प्रश्नों के लिए आवश्यक विश्लेषण और डेटा के प्रकार के बारे में विचार शामिल हैं। यह गोदामों को इस तरह से डिजाइन कर रहा है जो उत्पाद विशेषताओं, उपयोगकर्ता प्रोफाइल आदि पर अधिक विशिष्ट डेटा तक पहुंच के साथ-साथ वित्तीय जानकारी तक पहुंच की अनुमति देता है।
डेटा माइनिंग मेट्रिक्स को वित्तीय शर्तों में परिवर्तित करना - एक सामान्य डेटा माइनिंग मीट्रिक "लिफ्ट" का माप है। लिफ्ट उस आधार दर के सापेक्ष विशिष्ट मॉडल या पैटर्न का उपयोग करके क्या हासिल किया जाता है, जिसमें मॉडल का उपयोग नहीं किया जाता है। उच्च मूल्यों का मतलब है कि बहुत कुछ हासिल किया गया है। तब ऐसा लग सकता है कि कोई व्यक्ति केवल लिफ्ट के आधार पर निर्णय ले सकता है।
सटीकता -सटीकता इस बात का माप है कि मॉडल समर्थित डेटा की विशेषताओं के साथ परिणामों को कितनी अच्छी तरह से संबद्ध करता है। सटीकता के कई माप हैं, लेकिन सटीकता के सभी उपाय उपयोग की जाने वाली जानकारी पर निर्भर हैं। वास्तव में, मान गायब या अनुमानित हो सकते हैं, या डेटा को कई प्रक्रियाओं द्वारा बदला जा सकता है।
यह अन्वेषण और विकास की प्रक्रिया है, यह डेटा में एक विशिष्ट मात्रा में त्रुटि को स्वीकार करने का निर्णय ले सकता है, खासकर यदि डेटा इसकी विशेषताओं में काफी समान है। उदाहरण के लिए, एक मॉडल जो पिछली बिक्री के आधार पर किसी विशिष्ट स्टोर के लिए बिक्री की भविष्यवाणी करता है, वह शक्तिशाली रूप से सहसंबद्ध और बहुत सटीक हो सकता है, भले ही वह स्टोर लगातार गलत लेखांकन तकनीकों का उपयोग करता हो। इस प्रकार, सटीकता के मापन को विश्वसनीयता के आकलन द्वारा संतुलित किया जाना चाहिए।