वेब माइनिंग सीखने या ज्ञान प्राप्त करने के लक्ष्यों के लिए वेब-आधारित डेटा के लिए मशीन लर्निंग (डेटा माइनिंग) दृष्टिकोण का अनुप्रयोग है। वेब माइनिंग के तरीकों को तीन अलग-अलग तत्वों में से एक में परिभाषित किया जा सकता है जो इस प्रकार हैं -
वेब उपयोग खनन - वेब यूसेज माइनिंग एक तरह का वेब माइनिंग है जो वेब पेजों के लिए वेब एक्सेस डेटा के सेट को सक्षम बनाता है। यह उपयोग डेटा एक्सेस किए गए वेब पेजों की ओर ले जाने वाली दिशा का समर्थन करता है।
यह डेटा वेब सर्वर के माध्यम से कनेक्शन लॉग में स्वचालित रूप से एकत्र किया जाता है। CGI स्क्रिप्ट रेफ़रलकर्ता लॉग, उपयोगकर्ता सदस्यता डेटा और सर्वेक्षण लॉग सहित उपयोगी डेटा प्रदान करती है। संगठन और उनके इंटरनेट/इंट्रानेट-आधारित एप्लिकेशन और डेटा एक्सेस के लिए डेटा माइनिंग के पूर्ण उपयोग के लिए यह श्रेणी आवश्यक है।
यूसेज माइनिंग कंपनियों को उनकी व्यावसायिक सेवाक्षमता के भविष्य के बारे में उत्पादक डेटा बनाने में सक्षम बनाता है। आजीवन उपयोगकर्ता मूल्य, उत्पाद क्रॉस-मार्केटिंग दृष्टिकोण, और प्रचार अभियान प्रभावशीलता के सामूहिक डेटा से विभिन्न डेटा प्राप्त किए जा सकते हैं।
एकत्र किया गया उपयोग डेटा संगठन को अपने व्यवसायों के लिए परिणामों को अधिक कुशल बनाने और बिक्री बढ़ाने की क्षमता प्रदान करता है। उपयोग के रिकॉर्ड मार्केटिंग कौशल बनाने के लिए भी फायदेमंद हो सकते हैं जो प्रतिस्पर्धियों को पछाड़ देंगे और कंपनी की सेवाओं या उत्पाद को बड़े स्तर पर बढ़ाएंगे।
वेब संरचना खनन - वेब संरचना खनन एक उपकरण है जो डेटा या सीधे लिंक कनेक्शन से जुड़े वेब पेजों के बीच संबंध को पहचान सकता है। यह संरचना जानकारी वेब पेजों के लिए डेटाबेस दृष्टिकोण के माध्यम से वेब संरचना स्कीमा की व्यवस्था द्वारा खोजी जा सकती है।
यह कनेक्शन एक खोज इंजन को उस वेबसाइट से सीधे कनेक्टिंग वेब पेज पर खोज क्वेरी से संबंधित रिकॉर्ड खींचने में सक्षम बनाता है जिस पर सामग्री टिकी हुई है। यह पूर्णता वेबसाइटों को ब्राउज़ करने, होम पेज लाने, और वांछित डेटा सहित निश्चित पृष्ठ को सामने लाने के लिए संदर्भ लिंक के माध्यम से जानकारी को जोड़ने की आवश्यकता के माध्यम से होती है।
संरचना खनन का लक्ष्य वेब पेजों के बीच पहले से अज्ञात संबंधों को प्राप्त करना है। डेटा माइनिंग की यह संरचना साइट मैप्स में नेविगेशन और क्लस्टर डेटा की अनुमति देने के लिए अपनी वेबसाइट के डेटा को जोड़ने के लिए व्यवसाय के उपयोग का समर्थन करती है। यह अपने उपयोगकर्ताओं को कीवर्ड संबंधों और सामग्री खनन के माध्यम से वांछित डेटा तक पहुंचने की क्षमता प्रदान करता है।
वेब सामग्री खनन - वेब सामग्री खनन खोज क्वेरी के लिए सामग्री की प्रासंगिकता तय करने के लिए वेब पेज के टेक्स्ट, छवियों और ग्राफ़ की ब्राउज़िंग और खनन है।
यह ब्राउज़िंग स्ट्रक्चर माइनिंग के माध्यम से वेब पेजों के क्लस्टरिंग के बाद की जाती है और सबमिट की गई क्वेरी की प्रासंगिकता के स्तर के आधार पर परिणामों का समर्थन करती है। वर्ल्ड वाइड वेब पर उपलब्ध बड़ी मात्रा में डेटा के साथ, सामग्री खनन क्वेरी में कीवर्ड के लिए सबसे बड़ी प्रासंगिकता की श्रृंखला में खोज इंजन को परिणाम सूची का समर्थन करता है।