हब वेब पेजों का एक सेट है जो अधिकारियों के लिंक के सेट का समर्थन करता है। हब पृष्ठ प्रमुख नहीं हो सकते हैं, या कुछ लिंक मौजूद हो सकते हैं जो उनकी ओर इशारा करते हैं; हालांकि, वे एक सामान्य विषय पर प्रमुख साइटों के एक समूह के लिंक का समर्थन करते हैं।
ऐसे पृष्ठ एकल होम पेजों पर अनुशंसित कनेक्शन की सूची हो सकते हैं, जिसमें कोर्स होम पेज से अनुशंसित संदर्भ साइटें, या व्यावसायिक साइटों पर व्यावसायिक रूप से बड़े पैमाने पर संसाधन दस्तावेज़ शामिल हैं। हब पृष्ठ एक लक्षित विषय पर अधिकारियों को परोक्ष रूप से प्रदान करने की एक आवश्यक भूमिका निभाते हैं।
सामान्य तौर पर, एक अच्छा हब एक ऐसा पृष्ठ होता है जो कई अच्छे अधिकारियों की ओर इशारा करता है; एक अच्छा प्राधिकरण एक पृष्ठ है जो कई अच्छे केंद्रों द्वारा इंगित किया गया है। हब और प्राधिकरणों के बीच ऐसा पारस्परिक सुदृढ़ीकरण संबंध आधिकारिक वेब पेजों के खनन और उच्च गुणवत्ता वाले वेब आर्किटेक्चर और संसाधनों की स्वचालित खोज का समर्थन करता है।
हब का उपयोग करने वाला एक एल्गोरिथम, जिसे एचआईटीएस (हाइपरलिंक-प्रेरित विषय खोज) के रूप में जाना जाता है, निम्नानुसार तैयार किया गया था। सबसे पहले, HITS को एक इंडेक्स-आधारित खोज इंजन से 200 पृष्ठों का आरंभिक सेट एकत्र करने के लिए क्वेरी शब्दों की आवश्यकता होती है। ये पेज कोर सेट को डिज़ाइन करते हैं।
चूंकि कई पृष्ठ संभावित रूप से खोज विषय के लिए प्रासंगिक हैं, उनमें से कुछ में अधिकांश प्रमुख अधिकारियों के लिंक शामिल होने चाहिए। इसलिए, कोर सेट को कुछ पेजों को शामिल करके आधार सेट में विस्तारित किया जा सकता है, जो कोर-सेट पेज लिंक करते हैं और कुछ पेज जो कोर सेट में एक पेज से लिंक होते हैं, एक निर्दिष्ट आकार के कट-ऑफ तक, जिसमें 1,000 से 5,000 पेज शामिल हैं। (आधार सेट में शामिल होना)।
दूसरा, एक वजन-प्रसार प्रक्रिया शुरू की जाती है। यह पुनरावृत्ति चरण हब और प्राधिकरण भार के सांख्यिकीय अनुमानों को तय करता है। समान वेब डोमेन वाले दो पृष्ठों के बीच लिंक हैं (अर्थात, उनके URL में समान प्रथम स्तर भेजना) एक नेविगेशन सेवा के रूप में कार्य करते हैं और इसलिए अधिकार प्रदान नहीं करते हैं। इस तरह के लिंक वजन-प्रसार विश्लेषण से अनधिकृत हैं।
Google का पेजरैंक एल्गोरिथम उसी सिद्धांत पर निर्भर करता है। वेब लिंक और टेक्स्ट संबंधी संदर्भ डेटा की खोज करके, यह प्रलेखित किया गया है कि ऐसे सिस्टम अल्टाविस्टा जैसे टर्म-इंडेक्स इंजन द्वारा बनाए गए और याहू सहित मानव ऑन्कोलॉजिस्ट द्वारा बनाए गए लोगों की तुलना में बेहतर गुणवत्ता वाले खोज परिणाम प्राप्त कर सकते हैं!
लिंक विश्लेषण एल्गोरिदम निम्नलिखित दो मान्यताओं पर निर्भर करता है। सबसे पहले, लिंक मानव समर्थन भेजते हैं। यदि पेज ए से पेज बी के लिए एक लिंक मौजूद है और इन दो पेजों को कई लोगों द्वारा लिखा गया है, तो लिंक का उपयोग करता है कि पेज ए के लेखक ने पेज बी को मूल्यवान पाया। इसलिए किसी पृष्ठ के महत्व को उन पृष्ठों तक बढ़ाया जा सकता है जिनसे वह लिंक करता है। दूसरा, किसी विशिष्ट पृष्ठ द्वारा सह-उद्धृत किए जाने वाले पृष्ठ संभवतः उसी विषय से संबद्ध होते हैं।