Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

हमें KDD की आवश्यकता क्यों है?


डेटा को ज्ञान में बदलने की पारंपरिक तकनीक मैन्युअल विश्लेषण और व्याख्या पर निर्भर करती है। उदाहरण के लिए, स्वास्थ्य सेवा उद्योग में, विशेषज्ञ हर तिमाही में मौजूदा रुझानों और स्वास्थ्य देखभाल डेटा में बदलाव का व्यवस्थित विश्लेषण करते हैं।

विशेषज्ञ एक रिपोर्ट का समर्थन करते हैं जो प्रायोजक स्वास्थ्य सेवा संगठन को विश्लेषण का विवरण देती है; यह रिपोर्ट स्वास्थ्य देखभाल प्रबंधन के लिए भविष्य के निर्णय लेने और योजना बनाने का आधार बन जाती है। कई प्रकार के अनुप्रयोग हैं, जिनमें ग्रहों के भूवैज्ञानिकों को ग्रहों और क्षुद्रग्रहों की दूर से संवेदी छवियों के माध्यम से स्थानांतरित करना, ध्यान से ऐसी भूगर्भीय वस्तुओं को प्रभाव क्रेटर के रूप में सूचीबद्ध करना और सूचीबद्ध करना शामिल है।

डेटा सेट की मैन्युअल जांच का यह रूप धीमा, उच्च कीमत वाला और अत्यधिक व्यक्तिपरक है। जैसे-जैसे डेटा वॉल्यूम नाटकीय रूप से उत्पन्न होता है, इस प्रकार का मैन्युअल डेटा विश्लेषण कई डोमेन में पूरी तरह से अव्यावहारिक होता जा रहा है।

व्यवसाय में, मुख्य KDD अनुप्रयोग क्षेत्रों में मार्केटिंग, वित्त (विशेषकर निवेश), धोखाधड़ी का पता लगाना, निर्माण, दूरसंचार और वेब एजेंट शामिल हैं।

मार्केटिंग - मार्केटिंग में, मूल एप्लिकेशन डेटाबेस मार्केटिंग सिस्टम है, जो कई ग्राहक समूहों को पहचानने और उनके व्यवहार की भविष्यवाणी करने के लिए ग्राहक डेटाबेस का विश्लेषण करता है।

निवेश - कई कंपनियां निवेश के लिए डेटा माइनिंग का उपयोग करती हैं, लेकिन अधिकांश अपने सिस्टम का प्रतिनिधित्व नहीं करती हैं। एक अपवाद एलबीएस कैपिटल मैनेजमेंट है। इसकी प्रणाली $600 मिलियन के कुल पोर्टफोलियो को संभालने के लिए पेशेवर प्रणालियों, तंत्रिका जाल और आनुवंशिक एल्गोरिदम का उपयोग करती है; 1993 में अपनी शुरुआत के बाद से, सिस्टम ने व्यापक शेयर बाजार से बेहतर प्रदर्शन किया है।

धोखाधड़ी का पता लगाना - एचएनसी फाल्कन और नेस्टर प्रिज्म सिस्टम का उपयोग क्रेडिट कार्ड धोखाधड़ी की जांच के लिए, लाखों से अधिक खातों को देखने के लिए किया जाता है। यू.एस. ट्रेजरी वित्तीय अपराध प्रवर्तन नेटवर्क से एफएआईएस प्रणाली वित्तीय लेनदेन की पहचान कर सकती है जो मनी लॉन्ड्रिंग गतिविधि को दर्शा सकती है।

विनिर्माण - CASSIOPEE समस्या निवारण प्रणाली, जनरल इलेक्ट्रिक और SNECMA के बीच एक संयुक्त उद्यम के एक तत्व के रूप में विकसित हुई। इसका उपयोग तीन प्रमुख यूरोपीय एयरलाइनों द्वारा बोइंग 737 के लिए समस्याओं का निदान और भविष्यवाणी करने के लिए किया गया था।

दूरसंचार - टेलीकम्युनिकेशन अलार्म-सीक्वेंस एनालाइज़र (TASA) को टेलीकम्युनिकेशन उपकरण के निर्माता और तीन टेलीफोन नेटवर्क (Mannila, Toivonen, और Verkamo 1995) के सहयोग से विकसित किया गया था। सिस्टम अलार्म स्ट्रीम से बार-बार होने वाले अलार्म एपिसोड का पता लगाने और उन्हें नियमों के रूप में प्रदर्शित करने के लिए एक नई बुनियादी ढांचे का उपयोग करता है।

खोजे गए नियमों के विशाल सेट हैं जिन्हें लचीले डेटा के साथ खोजा जा सकता है- अंतःक्रियात्मकता और पुनरावृत्ति प्रदान करने वाले पुनर्प्राप्ति उपकरण। इस पद्धति में, TASA नियमों के लिए एक बुनियादी पाशविक-बल खोज के परिणामों को परिशोधित करने के लिए छंटाई, समूहीकरण और आदेश देने वाले उपकरण प्रदान करता है।

डेटा सफाई - MERGE-PURGE प्रणाली का उपयोग डुप्लिकेट कल्याण दावों की पहचान के लिए किया गया था (हर्नांडेज़ और स्टोल्फ़ो 1995)। वाशिंगटन राज्य के कल्याण विभाग के डेटा पर इसका जोरदार इस्तेमाल किया गया।


  1. आपको एक ठोस डेटाबेस प्रबंधन प्रणाली की आवश्यकता क्यों है?

    कई हफ्तों के परिहार के बाद जब आप आखिरकार अपने घर या कमरे को साफ करने का निर्णय लेते हैं, तो आप पाते हैं कि कई चीजें पूरी तरह से अनुपयुक्त हैं। इसलिए, आप एक ऐसी प्रणाली बनाने के बारे में सोचते हैं, जिससे हर किसी के लिए चीजों को उनके इच्छित स्थान पर रखना आसान हो जाए। आप विभिन्न श्रेणियों को परिभाषित क

  1. डेटा बैकअप क्यों जरूरी है?

    कोई नहीं जानता कि आपदा कब आ सकती है, इसलिए इसके दरवाजे पर दस्तक देने से पहले तैयार रहना जरूरी है। यही कारण है कि 31 मार्चst डेटा बैकअप के महत्व के बारे में लोगों को याद दिलाने के लिए अलग रखा गया दिन है। बैकअप महत्वपूर्ण डेटा की एक आरक्षित प्रति है जो आपके फोन खो जाने, हार्ड ड्राइव के क्रैश होने य

  1. हमें डुप्लिकेट फ़ाइल खोजक और क्लीनर टूल की आवश्यकता क्यों है

    डुप्लिकेट डेटा डेटा को व्यवस्थित करने में सबसे बड़ी बाधाओं में से एक है। हालांकि, इस पर उतना ध्यान नहीं दिया जाता जितना कि अधूरे या गलत डेटा पर दिया जाता है। डुप्लिकेट डेटा एक बड़ी समस्या क्यों है, इस पर एक नज़र नीचे दी गई है, साथ ही यह समझने के लिए कि कैसे डुप्लिकेट फ़ाइल फिक्सर का उपयोग करने से ल