Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

वेब उपयोग खनन के नियम क्या हैं?

<घंटा/>

वेब माइनिंग वेब-आधारित रिकॉर्ड और सेवाओं, सर्वर लॉग्स और हाइपरलिंक्स से निपटने के द्वारा वेब की मदद से आम तौर पर लाभकारी पैटर्न प्रवृत्तियों और डेटा को निकालने के लिए डेटा माइनिंग तकनीकों का उपयोग करने की प्रक्रिया को परिभाषित करता है। वेब माइनिंग का उद्देश्य आवश्यक जानकारी प्राप्त करने के लिए जानकारी एकत्र और विश्लेषण करके वेब रिकॉर्ड में डिज़ाइन ढूंढना है।

वेब माइनिंग को इंटरनेट के लिए अनुकूलित डेटा माइनिंग दृष्टिकोण के सॉफ़्टवेयर के रूप में देखा जा सकता है, जबकि डेटा माइनिंग को एक ज्ञान खोज प्रक्रिया में तय किए गए सामान्य रूप से संरचित डेटा पर पैटर्न खोजने के लिए एल्गोरिथम के अनुप्रयोग के रूप में परिभाषित किया गया है।

वेब माइनिंग में कई डेटा प्रकारों के सेट की पेशकश करने के लिए विशिष्ट विशेषताएं हैं। वेब में कई तत्व हैं जो खनन प्रक्रिया के लिए कई दृष्टिकोण उत्पन्न करते हैं, जिसमें टेक्स्ट सहित वेब पेज शामिल हैं, वेब पेज हाइपरलिंक के माध्यम से जुड़े हुए हैं, और ग्राहक गतिविधि की निगरानी वेब सर्वर लॉग के माध्यम से की जा सकती है।

वेब उपयोग खनन के विभिन्न नियम हैं जो इस प्रकार हैं -

प्रीप्रोसेसिंग - वेब उपयोग लॉग एक प्रारूप में नहीं है जो खनन अनुप्रयोगों द्वारा पहुँचा जा सकता है। खनन अनुप्रयोगों में उपयोग किए जाने वाले कुछ डेटा के लिए, डेटा को पुन:स्वरूपित और साफ करने की आवश्यकता हो सकती है। विशेष रूप से वेबलॉग के उपयोग से संबंधित कुछ मुद्दे हैं। प्रसंस्करण चरण में कुछ चरण शामिल हैं जिनमें सफाई, उपयोगकर्ता पहचान, सत्र पहचान, पथ पूर्णता और स्वरूपण शामिल हैं।

डेटा संरचना - वेब उपयोग खनन प्रक्रिया के दौरान पहचाने गए पैटर्न का ट्रैक रखने के लिए कई अद्वितीय डेटा संरचनाएं प्रस्तावित की गई हैं। एक बुनियादी डेटा संरचना जिसका उपयोग किया जाता है उसे ट्री कहा जाता है। एक पेड़ एक जड़ वाला पेड़ है, जहाँ जड़ से पत्ती तक का प्रत्येक पथ एक क्रम का प्रतिनिधित्व करता है। पेड़ पैटर्न मिलान अनुप्रयोगों के लिए तार बचा सकते हैं। पेड़ों के साथ एकमात्र समस्या स्थान की आवश्यकता है।

पैटर्न की खोज - क्लिकस्ट्रीम डेटा पर उपयोग की जाने वाली सबसे आम डेटा माइनिंग तकनीक ट्रैवर्सल पैटर्न को उजागर करना है। एक ट्रैवर्सल पैटर्न एक सत्र में एक उपयोगकर्ता द्वारा निरीक्षण किए गए पृष्ठों का एक समूह है। वेब उपयोग खनन द्वारा अन्य प्रकार के पैटर्न का खुलासा किया जा सकता है। पैटर्न विभिन्न संयोजनों का उपयोग करते हुए पाए जाते हैं जिनका उपयोग विभिन्न विशेषताओं को खोजने और विभिन्न उद्देश्यों के लिए किया जाता है।

पैटर्न विश्लेषण - जब पैटर्न की खोज की जाती है, तो यह निर्धारित करने के लिए उनका विश्लेषण किया जाना चाहिए कि उस जानकारी का उपयोग कैसे किया जा सकता है। कुछ प्रतिमानों को हटाया जा सकता है और रुचि के लिए निर्धारित नहीं किया जा सकता है।

पैटर्न विश्लेषण खोज गतिविधियों के परिणामों को देखने और उनकी व्याख्या करने का चरण है। बार-बार होने वाले ट्रैवर्सल पैटर्न की पहचान करना आवश्यक नहीं है, बल्कि उन पैटर्न की पहचान करना भी है जो उनकी विशिष्टता या सांख्यिकीय गुणों के कारण रुचि के हैं।


  1. वेब माइनिंग के अनुप्रयोग क्या हैं?

    वेब माइनिंग डेटा माइनिंग तकनीकों का उपयोग करने की प्रक्रिया को परिभाषित करता है, जो वेब-आधारित रिकॉर्ड्स और सेवाओं, सर्वर लॉग्स, सर्वर लॉग्स, और हाइपरलिंक। वेब माइनिंग का उद्देश्य महत्वपूर्ण अंतर्दृष्टि प्राप्त करने के लिए डेटा को समूहीकृत और विश्लेषण करके वेब जानकारी में डिज़ाइन की खोज करना है। वे

  1. विशेषता सामान्यीकरण के नियम क्या हैं?

    विशेषता सामान्यीकरण निम्नलिखित नियम पर निर्भर करता है:यदि मूल कार्य संबंध में एक विशेषता के लिए अलग-अलग मूल्यों का एक विशाल संग्रह है, और विशेषता पर सामान्यीकरण ऑपरेटरों का एक समूह मौजूद है, इस प्रकार एक सामान्यीकरण ऑपरेटर को चुना जाना चाहिए और विशेषता के लिए उपयोग किया जाना चाहिए । यह नियम निम्नलि

  1. वेब उपयोग खनन क्या है?

    वेब उपयोग खनन का उपयोग वेबलॉग डेटा से उपयोगी डेटा, सूचना, ज्ञान प्राप्त करने के लिए किया जाता है, और वेब पेजों के लिए उपयोगकर्ता एक्सेस डिज़ाइन की पहचान करने में मदद करता है। खनन में, वेब संसाधनों का प्रबंधन, व्यक्ति एक वेबसाइट के आगंतुकों के अनुरोधों के डेटा के बारे में सोच रहा है जो वेब सर्वर लॉग