KDD डेटाबेस में नॉलेज डिस्कवरी का प्रतिनिधित्व करता है। यह डेटा में ज्ञान की खोज की व्यापक प्रक्रिया को परिभाषित करता है और निश्चित डेटा माइनिंग तकनीकों के उच्च-स्तरीय अनुप्रयोगों पर जोर देता है। यह आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, पैटर्न रिकग्निशन, डेटाबेस, स्टैटिस्टिक्स, प्रोफेशनल सिस्टम के लिए ज्ञान प्राप्ति, और डेटा विज़ुअलाइज़ेशन जैसे कई क्षेत्रों में शोधकर्ताओं के लिए रुचि का क्षेत्र है।
केडीडी प्रक्रिया का मुख्य उद्देश्य विशाल डेटाबेस के संदर्भ में जानकारी से डेटा निकालना है। यह डेटा माइनिंग एल्गोरिदम का उपयोग करके यह पहचानने के लिए करता है कि ज्ञान क्या माना जाता है। डेटाबेस में ज्ञान की खोज को एक प्रोग्राम, खोजपूर्ण विश्लेषण और विशाल डेटा रिपॉजिटरी के मॉडलिंग के रूप में माना जाता है। KDD बड़े और कठिन डेटा सेट से मान्य, उपयोगी और समझने योग्य डिज़ाइन को पहचानने की संगठित प्रक्रिया है।
केडीडी डेटा में वैध, उपन्यास, संभवतः उपयोगी और मूल रूप से तार्किक डिजाइनों की पहचान करने की गैर-तुच्छ प्रक्रिया है। प्रक्रिया इंगित करती है कि केडीडी में कई चरण शामिल हैं, जिसमें डेटा तैयार करना, पैटर्न की खोज, ज्ञान मूल्यांकन और शोधन शामिल हैं, सभी कई पुनरावृत्तियों में दोहराए गए हैं। गैर-तुच्छ से, इसका अर्थ है कि कुछ खोज या अनुमान निहित है; अर्थात्, संख्याओं के समूह के औसत मूल्य की गणना करने जैसी पूर्वनिर्धारित मात्राओं की गणना करना आसान नहीं है।
डेटा माइनिंग केडीडी प्रक्रिया की जड़ है, जैसे कि एल्गोरिदम का अनुमान जो रिकॉर्ड की जांच करता है, मॉडल विकसित करता है, और पहले अज्ञात पैटर्न की खोज करता है। मॉडल का उपयोग जानकारी से जानकारी निकालने, जानकारी का विश्लेषण करने और जानकारी की भविष्यवाणी करने के लिए किया जाता है।
डेटा माइनिंग केडीडी प्रक्रिया में एक कदम है जिसमें डेटा विश्लेषण और डिस्कवरी एल्गोरिदम लागू करना शामिल है, जो स्वीकार्य कम्प्यूटेशनल दक्षता सीमाओं के तहत, डेटा पर पैटर्न (या मॉडल) की एक विशिष्ट गणना करते हैं।
पैटर्न का क्षेत्र अक्सर अनंत होता है, और पैटर्न की गणना में इस स्थान में कुछ प्रकार की खोज होती है। व्यावहारिक कम्प्यूटेशनल बाधाएं उप-स्थान पर गंभीर सीमाएं रखती हैं जिनका विश्लेषण डेटा-खनन एल्गोरिदम द्वारा किया जा सकता है।
केडीडी प्रक्रिया में कुछ आवश्यक चयन, प्रीप्रोसेसिंग, सबसैंपलिंग और इसके परिवर्तनों के साथ डेटाबेस का उपयोग करना शामिल है; इससे पैटर्न की गणना करने के लिए डेटा-खनन विधियों (एल्गोरिदम) का उपयोग करना; और डेटा माइनिंग के उत्पादों की गणना करना, समझाए गए ज्ञान के प्रगणित पैटर्न के सबसेट को पहचानने के लिए।
केडीडी प्रक्रिया का डेटा-खनन घटक एल्गोरिथम पद्धति से संबंधित है जिसके द्वारा पैटर्न निकाले जाते हैं और रिकॉर्ड से गणना की जाती है। पूरी केडीडी प्रक्रिया में खनन पैटर्न का मूल्यांकन और संभावित व्याख्या शामिल है, ताकि यह तय किया जा सके कि नए ज्ञान के साथ कौन से पैटर्न का इलाज किया जा सकता है।