Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में क्लस्टरिंग के उदाहरण क्या हैं?

<घंटा/>

भौतिक या अमूर्त वस्तुओं के समूह को समान वस्तुओं के वर्गों में संयोजित करने की प्रक्रिया को क्लस्टरिंग के रूप में जाना जाता है। क्लस्टर डेटा ऑब्जेक्ट्स का एक सेट है जो एक ही क्लस्टर के भीतर एक दूसरे के समान होते हैं और अन्य क्लस्टर में ऑब्जेक्ट्स से अलग होते हैं। डेटा ऑब्जेक्ट्स के एक समूह को सामूहिक रूप से कई अनुप्रयोगों में एक समूह के रूप में माना जा सकता है। क्लस्टर विश्लेषण एक आवश्यक मानवीय गतिविधि है।

क्लस्टर विश्लेषण का उपयोग इन अभिलेखों पर किए गए विभिन्न उपायों के आधार पर समान अभिलेखों के समूह या समूह बनाने के लिए किया जाता है। मुख्य डिजाइन समूहों को उन तरीकों से परिभाषित करना है जो विश्लेषण के उद्देश्य के लिए उपयोगी हो सकते हैं। इस डेटा का उपयोग कई क्षेत्रों में किया गया है, जैसे कि खगोल विज्ञान, पुरातत्व, चिकित्सा, रसायन विज्ञान, शिक्षा, मनोविज्ञान, भाषा विज्ञान और समाजशास्त्र।

क्लस्टरिंग के कुछ उदाहरण हैं जो इस प्रकार हैं -

जीव विज्ञान -जीवविज्ञानियों ने साम्राज्य, संघ, वर्ग, श्रृंखला, परिवार, जीनस और प्रजातियों जैसी सभी जीवित चीजों की एक वर्गीकरण (एक श्रेणीबद्ध वर्गीकरण) तैयार करने में कई साल बिताए हैं। इसलिए, यह आश्चर्य की बात नहीं है कि क्लस्टर विश्लेषण में कुछ शुरुआती काम ने संख्यात्मक वर्गीकरण का एक अनुशासन तैयार करने की मांग की जो इस तरह के वर्गीकरण ढांचे को ढूंढ सके।

इसके अलावा, जीवविज्ञानियों ने बड़ी मात्रा में आनुवंशिक डेटा का विश्लेषण करने के लिए क्लस्टरिंग का उपयोग किया है जो सुलभ हैं। उदाहरण के लिए, क्लस्टरिंग का उपयोग उन जीनों के समूहों को खोजने के लिए किया गया है जिनके समान कार्य हैं।

सूचना पुनर्प्राप्ति - वर्ल्ड वाइड वेब में अरबों वेब पेज शामिल हैं, और एक खोज इंजन के लिए एक क्वेरी के परिणाम लाखों पेजों को पुनर्स्थापित कर सकते हैं। क्लस्टरिंग का उपयोग इन खोज परिणामों को कुछ समूहों में समूहित करने के लिए किया जा सकता है, जिनमें से प्रत्येक क्वेरी का एक विशिष्ट तत्व लेता है।

उदाहरण के लिए, "मूवी" की एक क्वेरी समीक्षा, ट्रेलर, सितारों और थिएटर सहित श्रेणियों में संयुक्त वेब पेजों को पुनर्स्थापित कर सकती है। प्रत्येक क्लस्टर को उपश्रेणियों (उपसमूहों) में विभाजित किया जा सकता है, जिससे एक पदानुक्रमित संरचना बनती है जो उपयोगकर्ता के क्वेरी परिणामों के विश्लेषण का समर्थन करती है।

जलवायु - यह पृथ्वी के वातावरण और महासागर में आवश्यक खोज पैटर्न के बारे में सीख सकता है। ध्रुवीय क्षेत्रों और समुद्र के उन क्षेत्रों के वायुमंडलीय दबाव में पैटर्न की खोज के लिए क्लस्टर विश्लेषण का उपयोग किया गया है जिनका भूमि जलवायु पर एक आवश्यक प्रभाव पड़ता है।

मनोविज्ञान और चिकित्सा - एक बीमारी या स्थिति में अक्सर कई बदलाव होते हैं, और इन कई उपश्रेणियों को पहचानने के लिए क्लस्टर अध्ययन का उपयोग किया जा सकता है। उदाहरण के लिए, क्लस्टरिंग का उपयोग कई प्रकार के अवसाद की पहचान करने के लिए किया जा सकता है। किसी बीमारी के स्थानिक या लौकिक आवंटन में पैटर्न की पहचान करने के लिए क्लस्टर विश्लेषण का भी उपयोग किया जाता है।

व्यवसाय - व्यवसाय वर्तमान और संभावित उपयोगकर्ताओं पर भारी मात्रा में डेटा एकत्र करते हैं। यह आम तौर पर अधिक विश्लेषण और मार्केटिंग इवेंट के लिए उपयोगकर्ताओं को कम संख्या में टीमों में विभाजित करने के लिए उपयोग किया जाता है।


  1. डेटा माइनिंग में OLAP संचालन क्या हैं?

    OLAP,ऑन-लाइन विश्लेषणात्मक प्रसंस्करण के लिए खड़ा है। OLAP सॉफ्टवेयर प्रौद्योगिकी का एक तत्व है जो विश्लेषकों, प्रबंधकों और अधिकारियों को डेटा के संभावित विचारों की एक विस्तृत विविधता में तेज, सुसंगत, इंटरैक्टिव एक्सेस के माध्यम से डेटा में अंतर्दृष्टि प्राप्त करने के लिए अधिकृत करता है, जिसे वास्तव

  1. डेटा माइनिंग में OLAP टूल्स क्या हैं?

    OLAP टूल की तीन मुख्य श्रेणियां हैं जो इस प्रकार हैं - मोलैप - MOLAP बहुआयामी OLAP का प्रतिनिधित्व करता है। यह डेटा स्टोरेज यूनिट के रूप में टुपल्स को सपोर्ट करता है। MOLAP डेटा को संभालने के लिए एक समर्पित n-आयामी सरणी भंडारण इंजन और OLAP मिडलवेयर लागू करता है। इसलिए, OLAP प्रश्नों को संबंधित बहुआ

  1. स्थानिक डेटा माइनिंग के लिए क्लस्टरिंग विधियाँ क्या हैं?

    क्लस्टर विश्लेषण आंकड़ों की एक शाखा है जिसका कई वर्षों से व्यापक रूप से अध्ययन किया गया है। इस तकनीक का उपयोग करने का लाभ यह है कि किसी भी पृष्ठभूमि ज्ञान, जैसे कि अवधारणा पदानुक्रम का उपयोग किए बिना दिलचस्प संरचनाओं या समूहों को सीधे डेटा से खोजा जा सकता है। PAM या CLARA जैसे आंकड़ों में उपयोग किए