डेटा माइनिंग की चुनौतियां क्या हैं?

<घंटा/>

डेटा माइनिंग की विभिन्न चुनौतियाँ हैं जो इस प्रकार हैं -

डेटा माइनिंग एल्गोरिदम की दक्षता और मापनीयता - यह डेटाबेस में बड़ी मात्रा में डेटा से प्रभावी ढंग से डेटा निकाल सकता है, ज्ञान खोज एल्गोरिदम कुशल और विशाल डेटाबेस के लिए स्केलेबल होना चाहिए। विशेष रूप से, डेटा माइनिंग एल्गोरिथम का चलने का समय विशाल डेटाबेस में अनुमानित और स्वीकार्य होना चाहिए। घातांक या यहां तक कि चैनल-ऑर्डर बहुपद जटिलता वाले एल्गोरिदम कुशल उपयोग के नहीं होंगे।

डेटा माइनिंग परिणामों की उपयोगिता, निश्चितता और स्पष्टता - पहचाने गए ज्ञान को डेटाबेस की सामग्री को सटीक रूप से चित्रित करना चाहिए और विशिष्ट अनुप्रयोगों के लिए फायदेमंद होना चाहिए। अपूर्णता को अनुमानित नियमों या मात्रात्मक नियमों के रूप में अनिश्चितता के उपायों द्वारा परिभाषित किया जाना चाहिए।

डेटा माइनिंग सिस्टम में शोर और असाधारण डेटा को सुरुचिपूर्ण ढंग से प्रबंधित किया जाना चाहिए। यह सांख्यिकीय, विश्लेषणात्मक और अनुकरणीय मॉडल और उपकरणों के विकास द्वारा खोजे गए ज्ञान की गुणवत्ता, जैसे रोचकता और विश्वसनीयता को मापने के व्यवस्थित अध्ययन को भी प्रोत्साहित करता है।

विभिन्न प्रकार के डेटा माइनिंग परिणामों की अभिव्यक्ति - बड़ी मात्रा में डेटा से कई तरह के ज्ञान की खोज की जा सकती है। यह कई दृश्यों से खोजे गए ज्ञान की जांच करना और उन्हें विभिन्न रूपों में प्रदर्शित करना भी पसंद कर सकता है।

इसके लिए हमें डेटा माइनिंग अनुरोधों और खोजे गए ज्ञान दोनों को उच्च-स्तरीय भाषाओं या ग्राफिकल यूजर इंटरफेस में परिभाषित करने की आवश्यकता थी ताकि डेटा माइनिंग कार्य को गैर-विशेषज्ञों द्वारा परिभाषित किया जा सके और खोजा गया ज्ञान उपयोगकर्ताओं द्वारा समझने योग्य और सटीक रूप से उपलब्ध हो सके। इसके लिए अभिव्यंजक ज्ञान प्रतिनिधित्व तकनीकों का चयन करने के लिए खोज प्रणाली की भी आवश्यकता थी।

अनेक अमूर्त स्तरों पर इंटरएक्टिव खनन ज्ञान - क्योंकि यह भविष्यवाणी करना जटिल है कि डेटाबेस से वास्तव में क्या खोजा जा सकता है, एक उच्च-स्तरीय डेटा माइनिंग क्वेरी को एक जांच के रूप में माना जाना चाहिए जो आगे की खोज के लिए कुछ दिलचस्प निशानों का खुलासा कर सके।

इंटरएक्टिव खोज को प्रोत्साहित किया जाना चाहिए, जो एक उपयोगकर्ता को डेटा माइनिंग अनुरोध को अंतःक्रियात्मक रूप से परिष्कृत करने, डेटा फ़ोकसिंग को गतिशील रूप से बदलने, डेटा माइनिंग प्रक्रिया को उत्तरोत्तर गहरा करने, और लचीले ढंग से कई एब्स्ट्रैक्शन स्तरों और कई कोणों से जानकारी और डेटा माइनिंग परिणामों को देखने में सक्षम बनाता है।

डेटा के विभिन्न स्रोतों से खनन जानकारी - व्यापक रूप से उपलब्ध स्थानीय और विस्तृत क्षेत्र का कंप्यूटर नेटवर्क, जैसे कि इंटरनेट, और डेटा के विभिन्न स्रोतों को जोड़ सकता है और विशाल वितरित, विषम डेटाबेस बना सकता है। विविध डेटा शब्दार्थ के साथ स्वरूपित या बिना स्वरूपित जानकारी के कई स्रोतों से खनन ज्ञान डेटा खनन के लिए एक नई आवश्यकता बन गया है।

अन्यथा, डेटा माइनिंग विषम डेटाबेस में उच्च-स्तरीय डेटा नियमितताओं का खुलासा करने में मदद कर सकता है जिसे साधारण क्वेरी सिस्टम द्वारा मुश्किल से खोजा जा सकता है। इसके अलावा, डेटाबेस का विशाल आकार, डेटा का व्यापक वितरण, और कई डेटा माइनिंग विधियों की कम्प्यूटेशनल जटिलता समानांतर और वितरित डेटा माइनिंग एल्गोरिदम की उन्नति को प्रेरित करती है।