Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में उपायों की गणना कैसे की जाती है?

<घंटा/>

उपायों को तीन तत्वों में व्यवस्थित किया जा सकता है, जिसमें वितरणात्मक, बीजीय और समग्र शामिल हैं। यह उपयोग किए गए कुल कार्यों के प्रकार पर निर्भर करता है।

वितरक - एक समुच्चय फलन वितरणात्मक होता है यदि इसकी गणना निम्न प्रकार से की जा सकती है। विचार करें कि डेटा n सेटों में स्वतंत्र हैं। यह प्रत्येक विभाजन के लिए सेवा का उपयोग कर सकता है, जिसके परिणामस्वरूप कुल मान प्राप्त होते हैं।

यदि फ़ंक्शन का उपयोग करके n समग्र मानों में परिवर्तित परिणाम वही है जो फ़ंक्शन का उपयोग करके पूरे डेटा सेट (बिना विभाजन के) से प्राप्त होता है, तो फ़ंक्शन का मूल्यांकन वितरित तरीके से किया जा सकता है।

उदाहरण के लिए, गणना () की गणना डेटा क्यूब के लिए की जा सकती है, पहले क्यूब को सबक्यूब के समूह में विभाजित करके, प्रत्येक सबक्यूब के लिए काउंट () की गणना की जाती है, और फिर प्रत्येक सबक्यूब के लिए प्राप्त की गई गणनाओं को संक्षेप में प्रस्तुत किया जाता है। इसलिए, गिनती () एक वितरण समग्र सेवा है।

एक उपाय वितरणात्मक होता है यदि यह एक वितरणात्मक समग्र सेवा का उपयोग करके प्राप्त किया जाता है। वितरण उपायों की गणना प्रभावी ढंग से की जा सकती है क्योंकि उनकी गणना वितरणात्मक तरीके से की जा सकती है।

बीजगणितीय - एक समुच्चय फलन बीजगणितीय होता है यदि इसकी गणना M तर्कों के साथ एक बीजीय सेवा द्वारा की जा सकती है (जहाँ M एक परिबद्ध धनात्मक पूर्णांक है), जिनमें से प्रत्येक एक वितरण समुच्चय सेवा का उपयोग करके प्राप्त किया जाता है।

उदाहरण के लिए, औसत () (औसत) की गणना योग ()/गिनती () द्वारा की जा सकती है, जहां योग () और गणना () दोनों ही वितरण समग्र सेवा हैं। इसी तरह, यह प्रदर्शित किया जा सकता है कि न्यूनतम एन () और अधिकतम एन () (जो किसी दिए गए सेट में एन न्यूनतम और एन अधिकतम मूल्यों की खोज करते हैं) और मानक विचलन () बीजगणितीय कुल सेवाएं हैं। एक माप बीजगणितीय होता है यदि इसे बीजीय समुच्चय सेवा का उपयोग करके प्राप्त किया जाता है।

समग्र - एक समग्र कार्य समग्र होता है यदि एक उपसमूह को परिभाषित करने के लिए आवश्यक भंडारण आकार पर कोई निश्चित बाध्यता नहीं है। यदि एम तर्कों के साथ बीजगणितीय कार्य जारी नहीं है (जहां एम स्थिर है) जो गणना का वर्णन करता है।

माध्यिका (), मोड (), और रैंक () जैसे समग्र कार्यों के उदाहरण। एक उपाय समग्र होता है यदि इसे समग्र समग्र कार्य का उपयोग करके प्राप्त किया जाता है।

अधिकांश बड़े डेटा क्यूब अनुप्रयोगों को वितरण और बीजगणितीय उपायों की प्रभावी गणना की आवश्यकता होती है। इसके लिए कुछ कारगर तरीके मौजूद हैं। इसके विपरीत, समग्र उपायों की कुशलतापूर्वक गणना करना जटिल है। कुछ समग्र उपायों की गणना का अनुमान लगाने के लिए एक कुशल दृष्टिकोण, अभी भी मौजूद है।

उदाहरण के लिए, सटीक माध्य () की गणना करने के बजाय, एक विशाल डेटा सेट के लिए अनुमानित माध्य मान की गणना करने के लिए उपयोग किया जा सकता है। कुछ मामलों में, समग्र उपायों की प्रभावी गणना की कठिनाइयों को दूर करने के लिए ऐसी विधियां पर्याप्त हैं।


  1. वेब माइनिंग के तरीके क्या हैं?

    वेब माइनिंग सीखने या ज्ञान प्राप्त करने के लक्ष्यों के लिए वेब-आधारित डेटा के लिए मशीन लर्निंग (डेटा माइनिंग) दृष्टिकोण का अनुप्रयोग है। वेब माइनिंग के तरीकों को तीन अलग-अलग तत्वों में से एक में परिभाषित किया जा सकता है जो इस प्रकार हैं - वेब उपयोग खनन - वेब यूसेज माइनिंग एक तरह का वेब माइनिंग है ज

  1. स्थानिक डेटा माइनिंग की मूल बातें क्या हैं?

    स्थानिक डेटा माइनिंग स्थानिक मॉडल के लिए डेटा माइनिंग का अनुप्रयोग है। स्थानिक डेटा माइनिंग में, विश्लेषक भौगोलिक या स्थानिक डेटा का उपयोग व्यावसायिक खुफिया या अलग-अलग परिणाम बनाने के लिए करते हैं। भौगोलिक डेटा को प्रासंगिक और लाभकारी स्वरूपों में लाने के लिए इसके लिए विशिष्ट विधियों और संसाधनों की

  1. डेटा माइनिंग में मेटारुल्स कैसे उपयोगी हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के