Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

वेब सर्च इंजन क्या है?

<घंटा/>

वेब सर्च इंजन एक विशेष कंप्यूटर सर्वर है जो वेब पर डेटा की खोज करता है। उपयोगकर्ता क्वेरी के खोज परिणामों को एक सूची (हिट के रूप में जाना जाता है) के रूप में पुनर्स्थापित किया जाता है। हिट में वेब पेज, चित्र और विभिन्न प्रकार की फाइलें शामिल हो सकती हैं।

विभिन्न खोज इंजन भी सार्वजनिक डेटाबेस या खुली निर्देशिकाओं में उपलब्ध डेटा खोज और वापस करते हैं। खोज इंजन वेब निर्देशिकाओं से भिन्न होते हैं, जिसमें वेब निर्देशिकाएं मानव संपादकों द्वारा समर्थित होती हैं जबकि खोज इंजन एल्गोरिथम या एल्गोरिथम और मानव इनपुट के संयोजन से काम करते हैं।

वेब सर्च इंजन बड़े डेटा माइनिंग एप्लिकेशन हैं। खोज इंजन के सभी तत्वों में कई डेटा माइनिंग तकनीकों का उपयोग किया जाता है, जिसमें क्रॉलिंग (जैसे, यह तय करना कि कौन से पेज क्रॉल किए जाने चाहिए और क्रॉलिंग फ़्रीक्वेंसी), इंडेक्सिंग (जैसे, इंडेक्स किए जाने वाले पेजों का चयन करना और यह निर्धारित करना कि इंडेक्स को किस हद तक होना चाहिए) निर्माण किया जा सकता है), और खोज (उदाहरण के लिए, यह निर्धारित करना कि पृष्ठों को कैसे रैंक किया जाना चाहिए, कौन से विज्ञापन जोड़े जाने चाहिए, और खोज परिणामों को कैसे अनुकूलित किया जा सकता है या "संदर्भ जागरूक" बनाया जा सकता है)।

डेटा माइनिंग के लिए सर्च इंजन के तौर-तरीके बड़ी चुनौतियां हैं। सबसे पहले, उन्हें डेटा की एक बड़ी और बढ़ती मात्रा का प्रबंधन करना होगा। आमतौर पर, ऐसे डेटा को कई मशीनों का उपयोग करके संसाधित नहीं किया जा सकता है। इसके बजाय, खोज इंजनों को कंप्यूटर क्लाउड का उपयोग करने की आवश्यकता होती है, जिसमें हजारों या यहां तक ​​कि सैकड़ों हजारों कंप्यूटर शामिल होते हैं जो बड़ी मात्रा में सूचनाओं का सहयोग करते हैं। कंप्यूटर क्लाउड और उच्च वितरित डेटा सेट पर डेटा माइनिंग दृष्टिकोण को बढ़ाना अनुसंधान के लिए एक अनुप्रयोग है।

दूसरा, वेब सर्च इंजन को ऑनलाइन रिकॉर्ड से निपटना होता है। एक सर्च इंजन बड़े डेटा सेट पर ऑफलाइन मॉडल बनाने का खर्च उठा सकता है। यह एक क्वेरी क्लासिफायरियर बना सकता है जो क्वेरी विषय के आधार पर पूर्वनिर्धारित तत्वों के लिए एक खोज क्वेरी बनाता है। चाहे मॉडल ऑफ़लाइन बनाया गया हो, ऑनलाइन मॉडल का सॉफ़्टवेयर वास्तविक समय में उपयोगकर्ता प्रश्नों को हल करने के लिए त्वरित होना चाहिए।

एक और चुनौती है तेजी से बढ़ती डेटा धाराओं पर एक मॉडल का समर्थन और वृद्धिशील रूप से ताज़ा करना। उदाहरण के लिए, एक क्वेरी क्लासिफायरियर को लगातार लगातार बनाए रखने की आवश्यकता हो सकती है क्योंकि नए प्रश्न बढ़ते रहते हैं और पूर्वनिर्धारित तत्व होते हैं और डेटा वितरण बदल सकता है। कुछ मौजूदा मॉडल प्रशिक्षण विधियां ऑफ़लाइन और स्थिर हैं और इसलिए इस तरह की पद्धति में उनका उपयोग नहीं किया जा सकता है।

तीसरा, वेब सर्च इंजन को उन प्रश्नों से निपटना होता है जो केवल कुछ ही बार पूछे जाते हैं। मान लीजिए कि एक खोज इंजन को संदर्भ-जागरूक क्वेरी निर्देश का समर्थन करने की आवश्यकता है। जब कोई उपयोगकर्ता कोई प्रश्न पूछता है, तो खोज इंजन ग्राहक प्रोफ़ाइल और उसके क्वेरी इतिहास का उपयोग करके क्वेरी के संदर्भ का अनुमान लगाने का प्रयास करता है ताकि एक सेकंड के एक छोटे से अंश के भीतर अधिक अनुकूलित उत्तर लौटाए जा सकें।


  1. वेब संरचना खनन क्या है?

    वेब स्ट्रक्चर माइनिंग एक ऐसा उपकरण है जो डेटा या डायरेक्ट लिंक कनेक्शन से जुड़े वेब पेजों के बीच संबंध को पहचान सकता है। यह संरचित डेटा वेब पेजों के लिए डेटाबेस तकनीकों के माध्यम से वेब संरचना स्कीमा के प्रावधान द्वारा खोजा जा सकता है। यह कनेक्शन एक खोज इंजन को एक खोज क्वेरी से जुड़े डेटा को सीधे उ

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही

  1. 11 सर्वश्रेष्ठ डीप वेब सर्च इंजन जिन्हें गूगल नहीं ढूंढ सकता

    अधिकांश इंटरनेट उपयोगकर्ताओं के लिए, ऑनलाइन दुनिया Google.com से शुरू और समाप्त होती है। हालाँकि, Google वेब पर सब कुछ खोजने में सक्षम नहीं है, ऐसा इसलिए है क्योंकि एक गहरा और अदृश्य वेब है जिसे Google द्वारा एक्सेस नहीं किया जा सकता है। यही कारण है कि आसानी से उपलब्ध नहीं होने वाली जानकारी को खोजने