Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

KDD क्या है?

<घंटा/>

KDD डेटाबेस में नॉलेज डिस्कवरी का प्रतिनिधित्व करता है। यह डेटा में ज्ञान की खोज की व्यापक प्रक्रिया को परिभाषित करता है और निश्चित डेटा माइनिंग तकनीकों के उच्च-स्तरीय अनुप्रयोगों पर जोर देता है। यह आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, पैटर्न रिकग्निशन, डेटाबेस, स्टैटिस्टिक्स, प्रोफेशनल सिस्टम के लिए ज्ञान प्राप्ति, और डेटा विज़ुअलाइज़ेशन जैसे कई क्षेत्रों में शोधकर्ताओं के लिए रुचि का क्षेत्र है।

केडीडी प्रक्रिया का मुख्य उद्देश्य विशाल डेटाबेस के संदर्भ में जानकारी से डेटा निकालना है। यह डेटा माइनिंग एल्गोरिदम का उपयोग करके यह पहचानने के लिए करता है कि ज्ञान क्या माना जाता है। डेटाबेस में ज्ञान की खोज को एक प्रोग्राम, खोजपूर्ण विश्लेषण और विशाल डेटा रिपॉजिटरी के मॉडलिंग के रूप में माना जाता है। KDD बड़े और कठिन डेटा सेट से मान्य, उपयोगी और समझने योग्य डिज़ाइन को पहचानने की संगठित प्रक्रिया है।

केडीडी डेटा में वैध, उपन्यास, संभवतः उपयोगी और मूल रूप से तार्किक डिजाइनों की पहचान करने की गैर-तुच्छ प्रक्रिया है। प्रक्रिया इंगित करती है कि केडीडी में कई चरण शामिल हैं, जिसमें डेटा तैयार करना, पैटर्न की खोज, ज्ञान मूल्यांकन और शोधन शामिल हैं, सभी कई पुनरावृत्तियों में दोहराए गए हैं। गैर-तुच्छ से, इसका अर्थ है कि कुछ खोज या अनुमान निहित है; अर्थात्, संख्याओं के समूह के औसत मूल्य की गणना करने जैसी पूर्वनिर्धारित मात्राओं की गणना करना आसान नहीं है।

डेटा माइनिंग केडीडी प्रक्रिया की जड़ है, जैसे कि एल्गोरिदम का अनुमान जो रिकॉर्ड की जांच करता है, मॉडल विकसित करता है, और पहले अज्ञात पैटर्न की खोज करता है। मॉडल का उपयोग जानकारी से जानकारी निकालने, जानकारी का विश्लेषण करने और जानकारी की भविष्यवाणी करने के लिए किया जाता है।

डेटा माइनिंग केडीडी प्रक्रिया में एक कदम है जिसमें डेटा विश्लेषण और डिस्कवरी एल्गोरिदम लागू करना शामिल है, जो स्वीकार्य कम्प्यूटेशनल दक्षता सीमाओं के तहत, डेटा पर पैटर्न (या मॉडल) की एक विशिष्ट गणना करते हैं।

पैटर्न का क्षेत्र अक्सर अनंत होता है, और पैटर्न की गणना में इस स्थान में कुछ प्रकार की खोज होती है। व्यावहारिक कम्प्यूटेशनल बाधाएं उप-स्थान पर गंभीर सीमाएं रखती हैं जिनका विश्लेषण डेटा-खनन एल्गोरिदम द्वारा किया जा सकता है।

केडीडी प्रक्रिया में कुछ आवश्यक चयन, प्रीप्रोसेसिंग, सबसैंपलिंग और इसके परिवर्तनों के साथ डेटाबेस का उपयोग करना शामिल है; इससे पैटर्न की गणना करने के लिए डेटा-खनन विधियों (एल्गोरिदम) का उपयोग करना; और डेटा माइनिंग के उत्पादों की गणना करना, समझाए गए ज्ञान के प्रगणित पैटर्न के सबसेट को पहचानने के लिए।

केडीडी प्रक्रिया का डेटा-खनन घटक एल्गोरिथम पद्धति से संबंधित है जिसके द्वारा पैटर्न निकाले जाते हैं और रिकॉर्ड से गणना की जाती है। पूरी केडीडी प्रक्रिया में खनन पैटर्न का मूल्यांकन और संभावित व्याख्या शामिल है, ताकि यह तय किया जा सके कि नए ज्ञान के साथ कौन से पैटर्न का इलाज किया जा सकता है।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही

  1. सीरियलाइजेशन क्या है?

    हाल ही में एक प्रोजेक्ट अपडेट मीटिंग के दौरान, मेरी टीम ने इस बारे में बात की कि हम इस एप्लिकेशन से डेटा को आगे और पीछे भेजने के लिए क्रमांकन का उपयोग कैसे करने जा रहे हैं। एक इंजीनियर जो सॉफ्टवेयर परियोजनाओं में और अधिक काम करना चाह रहा था, उसने मुझे बताया कि वे इस शब्द से अपरिचित थे। इस तरह की