मल्टीरिलेशनल क्लस्टरिंग डेटा ऑब्जेक्ट्स को क्लस्टर के समूह में विभाजित करने का चरण है, जो कई संबंधों में डेटा का उपयोग करके उनकी समानता पर निर्भर करता है। क्रॉसक्लस उपयोगकर्ता मार्गदर्शन के साथ क्रॉस-रिलेशनल क्लस्टरिंग का प्रतिनिधित्व करता है। यह मल्टीरिलेशनल क्लस्टरिंग के लिए एक एल्गोरिथम है जो विश्लेषण करता है कि क्लस्टरिंग में उपयोगकर्ता मार्गदर्शन का उपयोग कैसे करें और भौतिक जुड़ाव को रोकने के लिए आईडी प्रचार को टपल करें।
बहुसंबंधात्मक क्लस्टरिंग में मुख्य चुनौती यह है कि कई संबंधों में कई विशेषताएं होती हैं, और आम तौर पर उनमें से केवल एक छोटा सा क्षेत्र एक निश्चित क्लस्टरिंग कार्य के लिए प्रासंगिक होता है।
यह छात्रों को क्लस्टर कर सकता है, विशेषताएँ जानकारी के कई तत्वों को कवर कर सकती हैं, जिसमें छात्रों द्वारा लिए गए पाठ्यक्रम, छात्रों के प्रकाशन, छात्रों के सलाहकार और शोध दल आदि शामिल हैं।
एक उपयोगकर्ता आम तौर पर डेटा के एक विशिष्ट तत्व का उपयोग करके छात्रों को क्लस्टर करने में रुचि रखता है (उदाहरण के लिए, छात्रों को उनके शोध क्षेत्रों द्वारा क्लस्टर करना)। उपयोगकर्ता अपने आवश्यक अनुप्रयोगों और डेटा शब्दार्थ की बेहतर समझ प्राप्त कर सकते हैं। इस प्रकार, एक साधारण क्वेरी के रूप में उपयोगकर्ता के मार्गदर्शन का उपयोग उच्च-आयामी बहु-संबंधात्मक क्लस्टरिंग की प्रभावशीलता और गुणवत्ता को बढ़ाने के लिए किया जा सकता है।
क्रॉसक्लस उपयोगकर्ता प्रश्नों को स्वीकार करता है जिसमें लक्ष्य संबंध और एक या अधिक प्रासंगिक विशेषताएं शामिल होती हैं, जो उपयोगकर्ता के क्लस्टरिंग उद्देश्य को परिभाषित करती हैं। बहुसंबंधात्मक क्लस्टरिंग प्रक्रिया में, क्रॉसक्लस को कई संबंधों में प्रासंगिक विशेषताओं की खोज करने की आवश्यकता होती है।
क्रॉसक्लस को खोज चरण में दो प्रमुख चुनौतियों का समाधान करना चाहिए। सबसे पहले, लक्ष्य संबंध, Rt , आम तौर पर प्रत्येक गैर-लक्षित संबंध के साथ जुड़ सकता है, R, कई जुड़ाव पथों के माध्यम से, और R में प्रत्येक विशेषता को एक बहुसंबंधात्मक विशेषता के रूप में उपयोग किया जा सकता है।
इस बड़े खोज स्थान में किसी भी प्रकार की संपूर्ण खोज को लागू करना दुर्गम है। दूसरा, बड़ी संख्या में विशेषताओं के बीच, कुछ उपयोगकर्ता क्वेरी के लिए प्रासंगिक हैं जबकि कुछ अप्रासंगिक हैं (उदाहरण के लिए, एक छात्र के सहपाठियों का व्यक्तिगत डेटा)।
CrossClus को खोज चरण को सीमित करना चाहिए। इसे संबंधपरक स्कीमा को एक ग्राफ के रूप में माना जा सकता है, जिसमें संघ नोड्स होते हैं और किनारों से जुड़ते हैं। यह एक अनुमानी तरीकों को अपनाता है, जो उपयोगकर्ता द्वारा परिभाषित विशेषता से खोज शुरू करता है, और फिर बार-बार वर्तमान विशेषताओं के पड़ोस में लाभकारी विशेषताओं की खोज करता है। इस पद्धति में, यह धीरे-धीरे जुड़े हुए संबंधों के लिए खोज का दायरा विकसित करता है, लेकिन यादृच्छिक दिशाओं में दूर नहीं जाएगा।
क्रॉसक्लस इस बात पर विचार करता है कि क्लस्टर लक्ष्य टुपल्स को कैसे एट्रिब्यूट करता है। उपयुक्त विशेषताओं का चयन उपयोगकर्ता द्वारा परिभाषित विशेषताओं के साथ उनके संबंधों पर निर्भर करता है। यदि दो विशेषताएँ बहुत अलग-अलग क्लस्टर टुपल्स करती हैं, तो उनकी समानता कम होती है और उनका संबद्ध होना असंभव है। यदि वे समान रूप से टुपल्स को क्लस्टर करते हैं, तो उन्हें संबंधित माना जाना चाहिए।