Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

मल्टी-रिलेशनल क्लस्टरिंग क्या है?

<घंटा/>

मल्टी-रिलेशनल क्लस्टरिंग डेटा ऑब्जेक्ट्स को उनकी समानता के आधार पर समूहों के एक सेट में विभाजित करने की प्रक्रिया है, जो कई संबंधों में जानकारी का उपयोग करती है। इस खंड में, यह क्रॉसक्लस (उपयोगकर्ता मार्गदर्शन के साथ क्रॉस-रिलेशनल क्लस्टरिंग), मल्टी-रिलेशनल क्लस्टरिंग के लिए एक एल्गोरिदम पेश कर सकता है जो भौतिक जुड़ाव से बचने के लिए क्लस्टरिंग और टपल आईडी प्रचार में उपयोगकर्ता मार्गदर्शन का उपयोग कैसे करें।

मल्टी-रिलेशनल क्लस्टरिंग में एक बड़ी चुनौती यह है कि विभिन्न संबंधों में बहुत अधिक विशेषताएँ होती हैं, और आमतौर पर, उनमें से केवल एक छोटा सा हिस्सा एक विशिष्ट क्लस्टरिंग कार्य के लिए प्रासंगिक होता है।

कंप्यूटर विज्ञान विभाग डेटाबेस पर विचार करें। यह छात्रों को आदेश दे सकता है, विशेषताएँ जानकारी के कई अलग-अलग पहलुओं को कवर करती हैं, जैसे कि छात्रों द्वारा लिए गए पाठ्यक्रम, छात्रों के प्रकाशन, सलाहकार और छात्रों के शोध समूह, और इसी तरह।

एक उपयोगकर्ता आमतौर पर सूचना के एक निश्चित पहलू का उपयोग करके छात्रों को क्लस्टर करने में रुचि रखता है (उदाहरण के लिए, छात्रों को उनके शोध क्षेत्रों द्वारा क्लस्टर करना)। उपयोगकर्ताओं को अक्सर अपने आवेदन की आवश्यकताओं और डेटा शब्दार्थ की अच्छी समझ होती है। इसलिए, एक साधारण क्वेरी की संरचना में उपयोगकर्ता का प्रबंधन, और इसका उपयोग उच्च-आयामी बहु-संबंधात्मक क्लस्टरिंग की दक्षता और गुणवत्ता में सुधार के लिए किया जा सकता है।

CrossClus उन उपयोगकर्ता प्रश्नों को स्वीकार करता है जिनमें एक लक्ष्य संबंध और एक या अधिक प्रासंगिक विशेषताएँ होती हैं, जो एक साथ उपयोगकर्ता के क्लस्टरिंग लक्ष्य को निर्दिष्ट करती हैं। CrossClus बहु-संबंधपरक विशेषताओं को परिभाषित करता है। एक बहु-संबंधात्मक विशेषता A' को जुड़ने के पथ Rt . द्वारा परिभाषित किया गया है ⋈ आर<उप>1 .... ⋈ आर<उप>के एक विशेषता आर<उप>के . Rk . का A , और संभवतः एक एकत्रीकरण ऑपरेटर (उदा., औसत, गणना, अधिकतम)।

A' को औपचारिक रूप से [A' द्वारा दर्शाया जाता है। पथ में शामिल हों, A' .attr, A' .aggr], जिसमें A'। एजीआर वैकल्पिक है। एक बहु-संबंधात्मक विशेषता A' या तो एक श्रेणीबद्ध विशेषता है या एक संख्यात्मक विशेषता है, जो इस पर निर्भर करती है कि क्या Rk . ए श्रेणीबद्ध या संख्यात्मक है। यदि A' एक श्रेणीबद्ध विशेषता है, तो लक्ष्य टपल t, t के लिए। A' Rk . में टुपल्स के बीच मानों के वितरण का प्रतिनिधित्व करता है जो टी के साथ जुड़ने योग्य हैं।

मल्टी-रिलेशनल क्लस्टरिंग प्रक्रिया में, CrossClus को कई संबंधों में प्रासंगिक विशेषताओं की खोज करने की आवश्यकता होती है। क्रॉसक्लस को खोज प्रक्रिया में दो प्रमुख चुनौतियों का समाधान करना चाहिए। सबसे पहले, लक्ष्य संबंध, Rt , आमतौर पर प्रत्येक गैर-लक्षित संबंध के साथ जुड़ सकता है, आर, कई अलग-अलग जुड़ने वाले पथों के माध्यम से, और आर में प्रत्येक विशेषता को बहु-संबंधपरक विशेषता के रूप में उपयोग किया जा सकता है।

इस विशाल खोज स्थान में किसी भी प्रकार की संपूर्ण खोज करना असंभव है। दूसरा, बड़ी संख्या में विशेषताओं के बीच, कुछ उपयोगकर्ता क्वेरी के लिए प्रासंगिक हैं (उदाहरण के लिए, एक छात्र का सलाहकार उसके शोध क्षेत्र से संबंधित है), जबकि कई अन्य अप्रासंगिक हैं। (उदाहरण के लिए, एक छात्र के सहपाठियों की व्यक्तिगत जानकारी)।


  1. डेटा स्ट्रीम क्लस्टरिंग के तरीके क्या हैं?

    डेटा स्ट्रीम क्लस्टरिंग को डेटा के क्लस्टरिंग के रूप में वर्णित किया जाता है जो टेलीफोन डेटा, मल्टीमीडिया डेटा, मौद्रिक लेनदेन इत्यादि सहित लगातार दिखाई देता है। डेटा स्ट्रीम क्लस्टरिंग को आम तौर पर स्ट्रीमिंग एल्गोरिदम के रूप में माना जाता है और इसका उद्देश्य सर्वोत्तम क्लस्टरिंग बनाने के लिए बिंदु

  1. दस्तावेज़ क्लस्टरिंग विश्लेषण क्या है?

    दस्तावेज़ क्लस्टरिंग एक असुरक्षित तरीके से फाइलों को व्यवस्थित करने के लिए महत्वपूर्ण तकनीक है। जब दस्तावेज़ों को टर्म वैक्टर के रूप में दर्शाया जाता है, तो क्लस्टरिंग विधियों को लागू किया जा सकता है। दस्तावेज़ स्थान लगातार बड़े आकार का होता है, जो विभिन्न सैकड़ों से लेकर हज़ारों तक होता है। आयामीत

  1. मल्टीरिलेशनल क्लस्टरिंग क्या है?

    मल्टीरिलेशनल क्लस्टरिंग डेटा ऑब्जेक्ट्स को क्लस्टर के समूह में विभाजित करने का चरण है, जो कई संबंधों में डेटा का उपयोग करके उनकी समानता पर निर्भर करता है। क्रॉसक्लस उपयोगकर्ता मार्गदर्शन के साथ क्रॉस-रिलेशनल क्लस्टरिंग का प्रतिनिधित्व करता है। यह मल्टीरिलेशनल क्लस्टरिंग के लिए एक एल्गोरिथम है जो विश