Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

नाममात्र डेटा के लिए अवधारणा पदानुक्रमों के निर्माण के तरीके क्या हैं?

<घंटा/>

नाममात्र डेटा के लिए अवधारणा पदानुक्रमों की पीढ़ी के लिए विभिन्न तरीके हैं -

उपयोगकर्ताओं या पेशेवरों द्वारा स्कीमा स्तर पर स्पष्ट रूप से विशेषताओं के आंशिक क्रम की विशिष्टता - नाममात्र विशेषताओं या आयामों के लिए अवधारणा पदानुक्रम में आम तौर पर विशेषताओं का एक सेट होता है। एक उपयोगकर्ता या पेशेवर केवल स्कीमा स्तर पर विशेषताओं के आंशिक या कुल शासन को परिभाषित करके एक अवधारणा पदानुक्रम का प्रतिनिधित्व कर सकते हैं।

उदाहरण के लिए, मान लीजिए कि एक रिलेशनल डेटाबेस में सड़क, शहर, प्रांत या राज्य और देश जैसी विशेषताओं का निम्नलिखित सेट शामिल है। डेटा वेयरहाउस स्थान आयाम में समान विशेषताएं शामिल हो सकती हैं। सड़क <शहर <प्रांत या राज्य <देश सहित स्कीमा स्तर पर इन विशेषताओं के बीच कुल क्रम का वर्णन करके एक पदानुक्रम का प्रतिनिधित्व किया जा सकता है।

स्पष्ट डेटा समूहीकरण द्वारा पदानुक्रम के एक हिस्से की विशिष्टता - यह मूल रूप से एक अवधारणा पदानुक्रम के एक हिस्से का मैनुअल विवरण है। एक विशाल डेटाबेस में, स्पष्ट मूल्य गणना द्वारा संपूर्ण अवधारणा पदानुक्रम का वर्णन करना अवास्तविक है।

विशेषताओं के समूह का विवरण, लेकिन उनके आंशिक क्रम का नहीं - एक उपयोगकर्ता एक अवधारणा पदानुक्रम बनाने वाली विशेषताओं के एक सेट को परिभाषित कर सकता है, लेकिन स्पष्ट रूप से उनके आंशिक क्रम को बताने के लिए बाहर कर सकता है। सिस्टम एक महत्वपूर्ण अवधारणा पदानुक्रम बनाने के लिए स्वचालित रूप से विशेषता क्रम बनाने का प्रयास कर सकता है।

अवलोकन पर विचार करें क्योंकि उच्च-स्तरीय अवधारणाएं आमतौर पर कई अधीनस्थ निम्न-स्तरीय अवधारणाओं को कवर करती हैं, एक उच्च अवधारणा स्तर (जैसे, देश) का वर्णन करने वाली विशेषता में आमतौर पर निम्न अवधारणा स्तर का वर्णन करने वाली विशेषता की तुलना में कम संख्या में अलग-अलग मान शामिल होंगे (उदाहरण के लिए, सड़क)।

यह इस अवलोकन पर निर्भर करता है, दिए गए विशेषता सेट में प्रति विशेषता कई अलग-अलग मानों के आधार पर एक अवधारणा पदानुक्रम स्वचालित रूप से बनाया जा सकता है। सबसे विशिष्ट मानों वाली विशेषता निम्नतम पदानुक्रम स्तर पर स्थित होती है।

एक विशेषता के कई अलग-अलग मान जितने कम होते हैं, वह उत्पन्न अवधारणा पदानुक्रम में उतना ही बड़ा होता है। यह अनुमानी नियम कई मामलों में अच्छा काम करता है। कुछ स्थानीय स्तर की अदला-बदली या अनुकूलन का उपयोग उपयोगकर्ताओं या विशेषज्ञों द्वारा, जब आवश्यक हो, उत्पन्न पदानुक्रम के विश्लेषण के बाद किया जा सकता है।

विशेषताओं के केवल आंशिक सेट की विशिष्टता - कभी-कभी एक उपयोगकर्ता पदानुक्रम का वर्णन करते समय गलत हो सकता है, या केवल एक अस्पष्ट अवधारणा हो सकती है कि पदानुक्रम में क्या शामिल होना चाहिए। नतीजतन, उपयोगकर्ता पदानुक्रम विवरण में प्रासंगिक विशेषताओं का केवल एक छोटा सा सबसेट शामिल कर सकता है।

यह ऐसे आंशिक रूप से निर्दिष्ट पदानुक्रमों का प्रबंधन कर सकता है, डेटाबेस डिज़ाइन में सूचना शब्दार्थ को एम्बेड करना आवश्यक है ताकि तेज़ सिमेंटिक लिंक वाली विशेषताओं को एक साथ पिन किया जा सके। इस पद्धति में, एक विशेषता का प्रतिनिधित्व एक संपूर्ण पदानुक्रम को डिजाइन करने के लिए शब्दार्थ रूप से कसकर जुड़े विशेषताओं के एक पूरे समूह को "खींचा" जा सकता है। उपयोगकर्ताओं के पास आवश्यक होने पर इस सुविधा को उलटने का विकल्प होना चाहिए।


  1. डेटा माइनिंग गोपनीयता-संरक्षण के तरीके क्या हैं?

    गोपनीयता-संरक्षण डेटा माइनिंग डेटा माइनिंग में गोपनीयता सुरक्षा के जवाब में डेटा माइनिंग अनुसंधान का एक अनुप्रयोग है। इसे प्राइवेसी-एन्हांस्ड या प्राइवेसी-सेंसिटिव डेटा माइनिंग कहा जाता है। यह बुनियादी संवेदनशील डेटा मूल्यों का खुलासा किए बिना सही डेटा माइनिंग परिणाम प्राप्त करने से संबंधित है। अधि

  1. अनुशंसा प्रणाली के लिए डेटा माइनिंग विधियाँ क्या हैं?

    अनुशंसाकर्ता सिस्टम सामग्री-आधारित दृष्टिकोण, सहयोगी दृष्टिकोण या हाइब्रिड दृष्टिकोण का उपयोग कर सकते हैं जो सामग्री-आधारित और सहयोगी दोनों विधियों को जोड़ती है। सामग्री-आधारित - सामग्री-आधारित दृष्टिकोण में उन वस्तुओं की सिफारिश की जाती है जो ग्राहक द्वारा पसंद किए गए या पिछले में पूछे गए आइटम के

  1. घुसपैठ का पता लगाने और रोकथाम के लिए डेटा माइनिंग के तरीके क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के