Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

लिंक माइनिंग की चुनौतियां क्या हैं?

<घंटा/>

लिंक माइनिंग की कई चुनौतियाँ हैं जो इस प्रकार हैं -

  • तार्किक बनाम सांख्यिकीय निर्भरता - दो प्रकार की निर्भरताएँ ग्राफ़ लिंक संरचनाओं (वस्तुओं के बीच तार्किक संबंध का प्रतिनिधित्व करने वाली) और संभाव्य निर्भरता (सांख्यिकीय संबंधों का प्रतिनिधित्व करती हैं, जैसे वस्तुओं की विशेषताओं के बीच संबंध, जहां, आमतौर पर, ऐसी वस्तुएं तार्किक रूप से संबंधित होती हैं) में रहती हैं।

    इन निर्भरताओं का सुसंगत प्रबंधन भी बहु-संबंधपरक डेटा माइनिंग के लिए एक चुनौती है, जहां खनन किया जाने वाला डेटा कई तालिकाओं में मौजूद होता है। इसे वस्तुओं के बीच कई संभावित तार्किक संबंधों की खोज करनी चाहिए, इसके अलावा विशेषताओं के बीच संभाव्य निर्भरता पर मानक खोज। यह एक विशाल खोज क्षेत्र लेता है, जो एक उचित गणितीय मॉडल खोजने को और अधिक जटिल बनाता है। आगमनात्मक तर्क प्रोग्रामिंग में विकसित विधियों को यहां लागू किया जा सकता है, जो तार्किक संबंधों पर खोज पर ध्यान केंद्रित करते हैं।

  • सुविधा निर्माण - लिंक-आधारित वर्गीकरण में, यह किसी वस्तु की विशेषताओं और उससे जुड़ी वस्तुओं की विशेषताओं पर विचार कर सकता है। इसके अलावा, लिंक में विशेषताएँ भी हो सकती हैं। फीचर निर्माण का उद्देश्य इन विशेषताओं को परिभाषित करने वाली एकल विशेषता का निर्माण करना है। इसमें फीचर चयन और फीचर एग्रीगेशन शामिल हो सकते हैं। फीचर चयन में, केवल सबसे अधिक भेदभाव करने वाली विशेषताएं निहित होती हैं।

  • उदाहरण बनाम कक्षाएं - यह इस बात का संकेत देता है कि मॉडल स्पष्ट रूप से व्यक्तियों या व्यक्तियों के वर्गों (सामान्य श्रेणियों) को संदर्भित करता है या नहीं। पूर्व मॉडल का लाभ यह है कि इसका उपयोग विशिष्ट व्यक्तियों को उच्च संभावना से जोड़ने के लिए किया जा सकता है। बाद वाले मॉडल का एक फायदा यह है कि इसका उपयोग कई व्यक्तियों के साथ नई स्थितियों को सामान्य बनाने के लिए किया जा सकता है।

  • लेबल और लेबल रहित डेटा का प्रभावी उपयोग - सीखने में एक हालिया रणनीति लेबल और बिना लेबल वाले डेटा दोनों के मिश्रण को शामिल करना है। लेबल रहित डेटा वस्तु विशेषता वितरण के अनुमान का समर्थन कर सकता है। लेबल रहित (परीक्षण) डेटा के बीच लिंक हमें लिंक की गई वस्तुओं की विशेषताओं का उपयोग करने की अनुमति देते हैं। लेबल किए गए (प्रशिक्षण) डेटा और लेबल रहित (परीक्षण) डेटा के बीच लिंक निर्भरता उत्पन्न करते हैं जो अधिक सटीक अनुमान बनाने में मदद कर सकते हैं।

  • लिंक पूर्वानुमान - लिंक भविष्यवाणी में एक चुनौती यह है कि वस्तुओं के बीच किसी विशेष लिंक की पूर्व संभावना आमतौर पर बहुत कम होती है। नेटवर्क में नोड्स की निकटता का विश्लेषण करने के लिए कई उपायों के आधार पर भविष्यवाणी को जोड़ने के लिए विभिन्न तरीके प्रस्तावित किए गए हैं। संभाव्य मॉडल भी प्रस्तावित किए गए हैं। विशाल डेटा सेट के लिए, उच्च स्तर पर लिंक मॉडल करना अधिक कुशल हो सकता है।

  • बंद बनाम खुली दुनिया की धारणा - अधिकांश पारंपरिक दृष्टिकोण यह मानते हैं कि हम डोमेन में सभी संभावित संस्थाओं को जानते हैं। वास्तविक दुनिया के अनुप्रयोगों में यह "बंद दुनिया" धारणा अवास्तविक है। इस क्षेत्र में कार्य में संबंधपरक संरचनाओं पर संभाव्यता वितरण को परिभाषित करने के लिए एक भाषा की शुरूआत शामिल है जिसमें वस्तुओं के कई सेट शामिल हैं।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. टेम्पोरल डेटा माइनिंग क्या है?

    अस्थायी डेटा खनन अस्थायी डेटा के बड़े सेट से गैर-तुच्छ, निहित और संभावित रूप से आवश्यक डेटा के निष्कर्षण की प्रक्रिया को परिभाषित करता है। अस्थायी डेटा प्राथमिक डेटा प्रकारों की एक श्रृंखला है, आम तौर पर संख्यात्मक मान, और यह अस्थायी डेटा से लाभकारी ज्ञान एकत्र करने से संबंधित है। अस्थायी डेटा माइन

  1. डाटा माइनिंग की सैद्धांतिक नींव क्या है?

    डेटा माइनिंग के आधार पर कई सिद्धांत हैं जिनमें निम्नलिखित शामिल हैं - डेटा में कमी - इस सिद्धांत में डेटा माइनिंग का आधार डेटा प्रतिनिधित्व को कम करना है। विशाल डेटाबेस पर प्रश्नों के तेजी से अनुमानित उत्तर प्राप्त करने की आवश्यकता के जवाब में डेटा में कमी निश्चितता को गति प्रदान करती है। डेटा में