Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ब्लूम फ़िल्टर की गिनती

मूल अवधारणा

एक काउंटिंग ब्लूम फ़िल्टर को ब्लूम फ़िल्टर की एक सामान्यीकृत डेटा संरचना के रूप में परिभाषित किया जाता है जिसे यह परीक्षण करने के लिए कार्यान्वित किया जाता है कि तत्वों का एक क्रम दिए जाने पर किसी दिए गए तत्व की गणना संख्या दी गई सीमा से कम है या नहीं। एक सामान्यीकृत रूप के रूप में, ब्लूम फ़िल्टर के झूठे सकारात्मक मिलान की संभावना है, लेकिन झूठे नकारात्मक की कोई संभावना नहीं है - दूसरे शब्दों में, एक क्वेरी या तो "संभवतः सीमा से अधिक या बराबर" या "निश्चित रूप से सीमा से कम" लौटाती है।

एल्गोरिदम विवरण

  • ब्लूम फ़िल्टर की गिनती के तहत उपयोग किए जाने वाले अधिकांश पैरामीटर, ब्लूम फ़िल्टर के साथ समान परिभाषित किए जाते हैं, जैसे n, k। m को काउंटिंग ब्लूम फ़िल्टर में काउंटरों की संख्या के रूप में दर्शाया जाता है, जो ब्लूम फ़िल्टर में m बिट्स का विस्तार है।
  • एक खाली काउंटिंग ब्लूम फ़िल्टर को एम काउंटर के रूप में सेट किया गया है, सभी को 0 से प्रारंभ किया गया है।
  • ब्लूम फ़िल्टर के समान, k विभिन्न हैश फ़ंक्शन भी परिभाषित होने चाहिए, जिनमें से प्रत्येक एक समान यादृच्छिक वितरण बनाने के लिए m काउंटर सरणी पदों में से किसी एक के लिए कुछ सेट तत्व को मैप या हैश करने के लिए जिम्मेदार है। यह भी समान है कि k एक स्थिरांक है, जो m से बहुत कम है, जो कि जोड़े जाने वाले तत्वों की संख्या के समानुपाती होता है।
  • ब्लूम फ़िल्टर का मुख्य सामान्यीकरण एक तत्व को जोड़ना है। किसी तत्व को जोड़ने के लिए, k सरणी स्थिति प्राप्त करने के लिए इसे प्रत्येक k हैश फ़ंक्शन में डालें और इन सभी पदों पर काउंटर 1 को बढ़ाएं।
  • थ्रेशोल्ड वाले तत्व के लिए क्वेरी करने के लिए (सत्यापित करें कि क्या तत्व की गिनती संख्या θ से कम है), k काउंटर स्थिति प्राप्त करने के लिए इसे प्रत्येक k हैश फ़ंक्शन में डालें।
  • यदि इन पदों पर कोई भी काउंटर θ से छोटा है, तो तत्व की गिनती संख्या निश्चित रूप से θ से छोटी है - यदि यह अधिक और बराबर होती, तो सभी संबंधित काउंटर से अधिक या बराबर होते।
  • ली>
  • यदि सभी के उच्च या बराबर हैं, तो या तो गिनती वास्तव में अधिक है या θ के बराबर है, या काउंटर संयोग से θ के उच्च या बराबर हैं।
  • यदि सभी से अधिक या बराबर हैं, भले ही गिनती से कम है, इस स्थिति को झूठी सकारात्मक के रूप में परिभाषित किया गया है। ब्लूम फ़िल्टर की तरह, इसे भी छोटा किया जाना चाहिए।

  1. डेटा संरचना में कैश मिस की गणना करना

    एल्गोरिदम विश्लेषण में हम संचालन और चरणों की गणना करते हैं। यह मूल रूप से उचित है जब कंप्यूटर एक ऑपरेशन करने के लिए उस ऑपरेशन के लिए आवश्यक डेटा लाने के लिए जितना समय लेता है, उससे अधिक समय लेता है। आजकल एक ऑपरेशन करने की लागत मेमोरी से डेटा लाने की लागत से काफी कम है। कई एल्गोरिदम के रन टाइम में सं

  1. पायथन में फ़िल्टर करें

    हम कभी-कभी ऐसी स्थिति में पहुंच जाते हैं जहां हमारे पास दो सूचियां होती हैं और हम यह जांचना चाहते हैं कि छोटी सूची का प्रत्येक आइटम बड़ी सूची में मौजूद है या नहीं। ऐसी स्थिति में हम नीचे बताए अनुसार फ़िल्टर () फ़ंक्शन का उपयोग करते हैं। सिंटैक्स Filter(function_name, sequence name) यहां Function_na

  1. विंडोज 10 में स्मार्टस्क्रीन फ़िल्टर अक्षम करें

    स्मार्टस्क्रीन माइक्रोसॉफ्ट द्वारा शुरू में इंटरनेट एक्सप्लोरर के लिए बनाई गई एक सुरक्षा सुविधा है, लेकिन विंडोज 8.1 के बाद से इसे डेस्कटॉप स्तर पर भी पेश किया गया था। स्मार्टस्क्रीन का मुख्य कार्य इंटरनेट से अपरिचित ऐप्स के लिए विंडोज़ स्कैन करना है जो सिस्टम को नुकसान पहुंचा सकता है और उपयोगकर्ता