Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

श्रेणीबद्ध डेटा के लिए विवेकीकरण और अवधारणा पदानुक्रम निर्माण की तकनीक क्या है?

<घंटा/>

श्रेणीबद्ध डेटा असतत डेटा हैं। श्रेणीबद्ध विशेषताओं में विशिष्ट मूल्यों की एक निश्चित संख्या होती है, जिसमें भौगोलिक क्षेत्र, नौकरी श्रेणी और आइटम प्रकार से जुड़े मूल्यों के बीच कोई अनुक्रमण नहीं होता है। श्रेणीबद्ध डेटा के लिए अवधारणा पदानुक्रमों को उत्पन्न करने के लिए विभिन्न विधियां इस प्रकार हैं -

  • उपयोगकर्ताओं या विशेषज्ञों द्वारा स्कीमा स्तर पर स्पष्ट रूप से विशेषताओं के आंशिक क्रम की विशिष्टता - श्रेणीबद्ध विशेषताओं या आयामों के लिए अवधारणा पदानुक्रम में आमतौर पर विशेषताओं का एक समूह होता है। एक उपयोगकर्ता या पेशेवर केवल स्कीमा स्तर पर विशेषताओं के आंशिक या कुल क्रम को परिभाषित करके एक अवधारणा पदानुक्रम का प्रतिनिधित्व कर सकते हैं।

उदाहरण के लिए, एक रिलेशनल डेटाबेस या डेटा वेयरहाउस के आयाम क्षेत्र में सड़क, शहर, प्रांत या राज्य और देश जैसी विशेषताओं की निम्नलिखित टीम शामिल हो सकती है। सड़क <शहर <प्रांत या राज्य <देश सहित, स्कीमा स्तर पर इन विशेषताओं के बीच कुल क्रम को परिभाषित करके एक पदानुक्रम का प्रतिनिधित्व किया जा सकता है।

  • स्पष्ट डेटा समूहीकरण द्वारा पदानुक्रम के एक हिस्से की विशिष्टता - यह एक अवधारणा पदानुक्रम के एक हिस्से की मैन्युअल परिभाषा है। एक उच्च डेटाबेस में, स्पष्ट मूल्य गणना द्वारा संपूर्ण अवधारणा पदानुक्रम का प्रतिनिधित्व करना अवास्तविक है। इसके विपरीत, यह केवल मध्यवर्ती स्तर के डेटा के एक छोटे से हिस्से के लिए स्पष्ट समूहों का प्रतिनिधित्व कर सकता है।

  • विशेषताओं के समूह का विवरण, लेकिन उनके आंशिक क्रम का नहीं - एक उपयोगकर्ता एक अवधारणा पदानुक्रम बनाने वाली विशेषताओं के एक सेट का वर्णन कर सकता है, लेकिन स्पष्ट रूप से उनके आंशिक क्रम को समाप्त कर सकता है। अर्थपूर्ण अवधारणा पदानुक्रम के निर्माण के लिए सिस्टम स्वचालित रूप से विशेषता क्रम उत्पन्न करने का प्रयास कर सकता है।

यह इस अवलोकन पर आधारित है, दिए गए विशेषता सेट में प्रति विशेषता कई अलग-अलग मानों के आधार पर एक अवधारणा पदानुक्रम स्वचालित रूप से बनाया जा सकता है। सबसे विशिष्ट मूल्यों वाली विशेषता पदानुक्रम के निम्नतम स्तर पर स्थित होती है। एक विशेषता के कई अलग-अलग मान जितने कम होते हैं, वह उत्पन्न अवधारणा पदानुक्रम में उतना ही अधिक होता है। यह अनुमानी नियम कुछ मामलों में अच्छा काम करता है। कुछ स्थानीय स्तर की अदला-बदली या समायोजन का उपयोग उपयोगकर्ताओं या पेशेवरों द्वारा, जब आवश्यक हो, उत्पन्न पदानुक्रम के विश्लेषण के बाद किया जा सकता है।

  • विशेषताओं के केवल आंशिक सेट की विशिष्टता - उपयोगकर्ता को इस बात का अस्पष्ट विचार हो सकता है कि पदानुक्रम में क्या शामिल किया जाना आवश्यक है, उदाहरण के लिए, उपयोगकर्ता नाम केवल प्रथम और अंतिम नाम निर्दिष्ट कर सकता है और मध्य नाम शामिल नहीं कर सकता है। यह आंशिक रूप से निर्दिष्ट पदानुक्रम है जिसे डेटाबेस डिज़ाइन में डेटा सेमेन्टिक्स स्थापित करके तेज़ सिमेंटिक कनेक्शन के साथ विशेषताओं को एक साथ पिन करने के लिए प्रबंधित किया जाता है।


  1. विज्ञान और इंजीनियरिंग में डाटा माइनिंग की क्या भूमिका है?

    विज्ञान और इंजीनियरिंग में डेटा माइनिंग की विभिन्न भूमिकाएँ इस प्रकार हैं - डेटा वेयरहाउस और डेटा प्रीप्रोसेसिंग - डेटा एक्सचेंज और डेटा माइनिंग के लिए डेटा प्रीप्रोसेसिंग और डेटा वेयरहाउस महत्वपूर्ण हैं। यह एक गोदाम बना रहा है जिसके लिए कई वातावरणों में और कई समय अवधि में एकत्रित असंगत या असंगत जा

  1. डेटा सुरक्षा और डेटा अखंडता के बीच अंतर क्या है?

    डेटा सुरक्षा डेटा सुरक्षा किसी डेटाबेस या डेटाबेस प्रबंधन सॉफ़्टवेयर को अनुचित उपयोग और दुर्भावनापूर्ण साइबर खतरों और हमलों से बचाने और सुरक्षित करने के लिए उपयोग किए जाने वाले सामूहिक उपायों को परिभाषित करती है। डेटाबेस सुरक्षा सूचना सुरक्षा की एक परत है। यह मूल रूप से सूचना की भौतिक सुरक्षा, भंडा

  1. स्टेगनालिसिस की तकनीकें क्या हैं?

    स्टेग्नलिसिस वह तकनीक है जो छिपे हुए डेटा का पता लगाकर और उसे निकालकर या नष्ट करके स्टेग्नोग्राफ़ी को हराने की कोशिश करती है। स्टेग्नालिसिस बिट पैटर्न और असामान्य रूप से उच्च फ़ाइल आकारों के बीच भिन्नताओं को देखकर स्टेग्नोग्राफ़ी का पता लगाने की प्रक्रिया है। यह अर्थहीन गुप्त संदेशों को खोजने और प्र