लिंक माइनिंग की चुनौतियां क्या हैं?

<घंटा/>

लिंक माइनिंग की कई चुनौतियाँ हैं जो इस प्रकार हैं -

तार्किक बनाम सांख्यिकीय निर्भरता - दो प्रकार की निर्भरताएँ ग्राफ़ लिंक संरचनाओं (वस्तुओं के बीच तार्किक संबंध का प्रतिनिधित्व करने वाली) और संभाव्य निर्भरता (सांख्यिकीय संबंधों का प्रतिनिधित्व करती हैं, जैसे वस्तुओं की विशेषताओं के बीच संबंध, जहां, आमतौर पर, ऐसी वस्तुएं तार्किक रूप से संबंधित होती हैं) में रहती हैं।

इन निर्भरताओं का सुसंगत प्रबंधन भी बहु-संबंधपरक डेटा माइनिंग के लिए एक चुनौती है, जहां खनन किया जाने वाला डेटा कई तालिकाओं में मौजूद होता है। इसे वस्तुओं के बीच कई संभावित तार्किक संबंधों की खोज करनी चाहिए, इसके अलावा विशेषताओं के बीच संभाव्य निर्भरता पर मानक खोज। यह एक विशाल खोज क्षेत्र लेता है, जो एक उचित गणितीय मॉडल खोजने को और अधिक जटिल बनाता है। आगमनात्मक तर्क प्रोग्रामिंग में विकसित विधियों को यहां लागू किया जा सकता है, जो तार्किक संबंधों पर खोज पर ध्यान केंद्रित करते हैं।
सुविधा निर्माण - लिंक-आधारित वर्गीकरण में, यह किसी वस्तु की विशेषताओं और उससे जुड़ी वस्तुओं की विशेषताओं पर विचार कर सकता है। इसके अलावा, लिंक में विशेषताएँ भी हो सकती हैं। फीचर निर्माण का उद्देश्य इन विशेषताओं को परिभाषित करने वाली एकल विशेषता का निर्माण करना है। इसमें फीचर चयन और फीचर एग्रीगेशन शामिल हो सकते हैं। फीचर चयन में, केवल सबसे अधिक भेदभाव करने वाली विशेषताएं निहित होती हैं।
उदाहरण बनाम कक्षाएं - यह इस बात का संकेत देता है कि मॉडल स्पष्ट रूप से व्यक्तियों या व्यक्तियों के वर्गों (सामान्य श्रेणियों) को संदर्भित करता है या नहीं। पूर्व मॉडल का लाभ यह है कि इसका उपयोग विशिष्ट व्यक्तियों को उच्च संभावना से जोड़ने के लिए किया जा सकता है। बाद वाले मॉडल का एक फायदा यह है कि इसका उपयोग कई व्यक्तियों के साथ नई स्थितियों को सामान्य बनाने के लिए किया जा सकता है।
लेबल और लेबल रहित डेटा का प्रभावी उपयोग - सीखने में एक हालिया रणनीति लेबल और बिना लेबल वाले डेटा दोनों के मिश्रण को शामिल करना है। लेबल रहित डेटा वस्तु विशेषता वितरण के अनुमान का समर्थन कर सकता है। लेबल रहित (परीक्षण) डेटा के बीच लिंक हमें लिंक की गई वस्तुओं की विशेषताओं का उपयोग करने की अनुमति देते हैं। लेबल किए गए (प्रशिक्षण) डेटा और लेबल रहित (परीक्षण) डेटा के बीच लिंक निर्भरता उत्पन्न करते हैं जो अधिक सटीक अनुमान बनाने में मदद कर सकते हैं।
लिंक पूर्वानुमान - लिंक भविष्यवाणी में एक चुनौती यह है कि वस्तुओं के बीच किसी विशेष लिंक की पूर्व संभावना आमतौर पर बहुत कम होती है। नेटवर्क में नोड्स की निकटता का विश्लेषण करने के लिए कई उपायों के आधार पर भविष्यवाणी को जोड़ने के लिए विभिन्न तरीके प्रस्तावित किए गए हैं। संभाव्य मॉडल भी प्रस्तावित किए गए हैं। विशाल डेटा सेट के लिए, उच्च स्तर पर लिंक मॉडल करना अधिक कुशल हो सकता है।
बंद बनाम खुली दुनिया की धारणा - अधिकांश पारंपरिक दृष्टिकोण यह मानते हैं कि हम डोमेन में सभी संभावित संस्थाओं को जानते हैं। वास्तविक दुनिया के अनुप्रयोगों में यह "बंद दुनिया" धारणा अवास्तविक है। इस क्षेत्र में कार्य में संबंधपरक संरचनाओं पर संभाव्यता वितरण को परिभाषित करने के लिए एक भाषा की शुरूआत शामिल है जिसमें वस्तुओं के कई सेट शामिल हैं।