लिंक माइनिंग के कई कार्य हैं जो इस प्रकार हैं -
-
लिंक-आधारित ऑब्जेक्ट वर्गीकरण - पारंपरिक वर्गीकरण दृष्टिकोणों में, वस्तुओं को उन विशेषताओं के आधार पर वर्गीकृत किया जाता है जो उन्हें परिभाषित करती हैं। लिंक-आधारित वर्गीकरण भविष्यवाणी करता है कि किसी वस्तु की श्रेणी न केवल उसकी विशेषताओं पर निर्भर करती है, बल्कि उसके लिंक और लिंक की गई वस्तुओं की विशेषताओं पर भी निर्भर करती है।
वेब पेज वर्गीकरण लिंक-आधारित वर्गीकरण का एक सुप्रसिद्ध उदाहरण है। यह शब्द उपस्थिति (पृष्ठ पर दिखाई देने वाले शब्द) और एंकर टेक्स्ट (हाइपरलिंक शब्द, यानी वे शब्द जिस पर यह क्लिक कर सकता है जब वह किसी लिंक पर क्लिक कर सकता है) के आधार पर वेब पेज के वर्गीकरण की भविष्यवाणी करता है, जो दोनों काम करते हैं विशेषताओं के रूप में। इसके अलावा, वर्गीकरण पृष्ठों और पृष्ठों और लिंक की विभिन्न विशेषताओं के बीच के लिंक पर निर्भर करता है।
-
वस्तु प्रकार पूर्वानुमान - यह किसी वस्तु के प्रकार की भविष्यवाणी करता है, जो उसकी विशेषताओं और उसके लिंक और उससे जुड़ी वस्तुओं की विशेषताओं पर निर्भर करता है। ग्रंथ सूची के क्षेत्र में, किसी प्रकाशन के स्थल प्रकार की भविष्यवाणी करने की आवश्यकता हो सकती है जैसे सम्मेलन, पत्रिका, या कार्यशाला। कनेक्शन डोमेन में, एक ही कार्य यह भविष्यवाणी करना है कि क्या कनेक्शन संपर्क ई-मेल, फोन कॉल या मेल द्वारा है।
-
लिंक प्रकार पूर्वानुमान - यह निहित वस्तुओं के गुणों के आधार पर लिंक के प्रकार या लक्ष्यों की भविष्यवाणी करता है। उदाहरण के लिए, महामारी विज्ञान के आंकड़ों को देखते हुए, यह अनुमान लगाने की कोशिश कर सकता है कि क्या दो लोग जो एक-दूसरे को समझते हैं, वे परिवार के सदस्य, सहकर्मी या परिचित हैं।
-
लिंक अस्तित्व की भविष्यवाणी करना - लिंक प्रकार की भविष्यवाणी के विपरीत, जहां यह समझ सकता है कि दो वस्तुओं के बीच एक कनेक्शन मौजूद है और इसके प्रकार की भविष्यवाणी करने की आवश्यकता है, इसके बजाय यह भविष्यवाणी करना चाह सकता है कि क्या दो वस्तुओं के बीच एक लिंक मौजूद है। उदाहरणों में भविष्यवाणी करना शामिल है कि क्या दो वेब पेजों के बीच एक लिंक होगा और क्या एक पेपर दूसरे पेपर का हवाला देगा।
-
लिंक कार्डिनैलिटी अनुमान - लिंक कार्डिनैलिटी अनुमान के दो रूप हैं। सबसे पहले, यह किसी वस्तु के लिंक की संख्या की भविष्यवाणी कर सकता है। यह फायदेमंद है, उदाहरण के लिए, किसी वेब पेज की आधिकारिकता की भविष्यवाणी करने में, जो कि लिंक की संख्या (इन-लिंक्स) पर निर्भर करता है। इसी तरह, कई आउट-लिंक का उपयोग उन वेब पेजों को पहचानने के लिए किया जा सकता है जो हब के रूप में कार्य करते हैं, जहां हब एक या वेब पेजों का एक सेट होता है जो एक ही मामले के कई आधिकारिक पृष्ठों को इंगित करता है।
-
वस्तु समाधान -ऑब्जेक्ट सुलह में, फ़ंक्शन यह भविष्यवाणी करना है कि क्या दो ऑब्जेक्ट सचमुच समान हैं, उनकी विशेषताओं और लिंक के आधार पर। यह कार्य सूचना निष्कर्षण, दोहराव हटाने, वस्तु एकीकरण, और उद्धरण जोड़ने में आम है, और इसे रिकॉर्ड लिंकेज या पहचान अनिश्चितता के रूप में भी जाना जाता है।