Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

संख्यात्मक डेटा के लिए विवेकीकरण और अवधारणा पदानुक्रम निर्माण की तकनीकें क्या हैं?

<घंटा/>

लागू डेटा श्रेणियों की व्यापक विविधता और डेटा मानों के लगातार अपडेट के कारण संख्यात्मक विशेषताओं के लिए अवधारणा पदानुक्रमों को परिभाषित करना जटिल और श्रमसाध्य है। संख्यात्मक डेटा के लिए अवधारणा पदानुक्रम पीढ़ी के विभिन्न तरीके इस प्रकार हैं -

बिनिंग - बिनिंग एक निश्चित संख्या में डिब्बे के आधार पर एक टॉप-डाउन विभाजन तकनीक है। इन विधियों का उपयोग संख्यात्मकता में कमी और अवधारणा पदानुक्रम पीढ़ी के लिए विवेकीकरण विधियों के रूप में भी किया जाता है। अवधारणा पदानुक्रम बनाने के लिए इन तकनीकों को परिणामी विभाजन के लिए पुनरावर्ती रूप से उपयोग किया जा सकता है। बिनिंग वर्ग डेटा का उपयोग नहीं करता है और इसलिए, एक अनुपयोगी विवेकीकरण तकनीक है। यह उपयोगकर्ता द्वारा निर्दिष्ट संख्या में डिब्बे, और बाहरी लोगों की उपस्थिति के लिए अतिसंवेदनशील है।

हिस्टोग्राम विश्लेषण - बिनिंग की तरह, हिस्टोग्राम विश्लेषण एक अनियंत्रित विवेकीकरण तकनीक है क्योंकि यह वर्ग डेटा का उपयोग नहीं करता है। हिस्टोग्राम एक विशेषता, ए के लिए मानों को बकेट के रूप में ज्ञात असंबद्ध श्रेणियों में विभाजित करते हैं। एक समान-चौड़ाई वाले हिस्टोग्राम में, उदाहरण के लिए, मूल्यों को समान आकार के विभाजन या मूल्य के लिए श्रेणियों में विभाजित किया जाता है, जहां प्रत्येक बाल्टी की चौड़ाई $ 10 होती है)। एक समान आवृत्ति हिस्टोग्राम के साथ, मानों को विभाजित किया जाता है, ताकि प्रत्येक विभाजन में समान संख्या में डेटा टुपल्स हों।

हिस्टोग्राम विश्लेषण एल्गोरिथ्म को प्रत्येक विभाजन के लिए पुनरावर्ती रूप से लागू किया जा सकता है ताकि स्वचालित रूप से एक बहुस्तरीय अवधारणा पदानुक्रम उत्पन्न हो, एक बार पूर्व-निर्दिष्ट अवधारणा स्तरों की संख्या तक पहुंचने के बाद प्रक्रिया समाप्त हो जाती है।

पुनरावर्ती प्रक्रिया को नियंत्रित करने के लिए प्रति स्तर न्यूनतम अंतराल आकार का भी उपयोग किया जा सकता है। यह एक विभाजन की न्यूनतम चौड़ाई या प्रत्येक स्तर पर प्रत्येक विभाजन के लिए मूल्यों की न्यूनतम संख्या निर्दिष्ट करता है।

एंट्रॉपी-आधारित विवेकीकरण - एंट्रोपी आमतौर पर विवेकाधिकार उपायों का उपयोग किया जाता है। इसे पहली बार क्लाउड शैनन ने सूचना सिद्धांत और सूचना लाभ की अवधारणा पर अपने अग्रणी कार्य में पेश किया था।

एन्ट्रॉपी-आधारित विवेकीकरण एक पर्यवेक्षित, ऊपर-नीचे विभाजन तकनीक है। यह अपनी गणना और विभाजन बिंदुओं के निर्धारण में वर्ग वितरण डेटा की खोज करता है (एक विशेषता श्रेणी को विभाजित करने के लिए डेटा मान)।

क्लस्टर विश्लेषण - क्लस्टर विश्लेषण एक लोकप्रिय डेटा विवेकीकरण विधि है। क्लस्टर या समूहों में ए के मानों को विभाजित करके एक संख्यात्मक विशेषता, ए को अलग करने के लिए क्लस्टरिंग एल्गोरिदम लागू किया जा सकता है।

क्लस्टरिंग ए के वितरण के साथ-साथ डेटा बिंदुओं की निकटता पर विचार करता है, और इसलिए उच्च गुणवत्ता वाले विवेकीकरण परिणाम उत्पन्न कर सकता है। क्लस्टरिंग का उपयोग ए के लिए एक अवधारणा पदानुक्रम उत्पन्न करने के लिए किया जा सकता है, या तो एक टॉप-डाउन विभाजन रणनीति या एक बॉटम-अप मर्जिंग रणनीति का पालन करके, जहां प्रत्येक क्लस्टर अवधारणा पदानुक्रम का एक नोड बनाता है।


  1. स्टेगनालिसिस की तकनीकें क्या हैं?

    स्टेग्नलिसिस वह तकनीक है जो छिपे हुए डेटा का पता लगाकर और उसे निकालकर या नष्ट करके स्टेग्नोग्राफ़ी को हराने की कोशिश करती है। स्टेग्नालिसिस बिट पैटर्न और असामान्य रूप से उच्च फ़ाइल आकारों के बीच भिन्नताओं को देखकर स्टेग्नोग्राफ़ी का पता लगाने की प्रक्रिया है। यह अर्थहीन गुप्त संदेशों को खोजने और प्र

  1. स्टेग्नोग्राफ़ी के फायदे और नुकसान क्या हैं?

    स्टेग्नोग्राफ़ी एक दृष्टिकोण है जो एक संदेश को छिपाने को आसान बनाता है जिसे दूसरे संदेश के भीतर गुप्त बनाए रखना है। यह परिणाम स्वयं छिपे हुए संदेश की गोपनीयता है। स्टेग्नोग्राफ़ी दृष्टिकोण का उपयोग छवियों, वीडियो फ़ाइल या ऑडियो फ़ाइल के लिए किया जा सकता है। वॉटरमार्किंग जैसे स्टेग्नोग्राफ़ी का उपयो

  1. डेटा एन्क्रिप्शन की तकनीकें क्या हैं?

    डेटा एन्क्रिप्शन की कुछ तकनीकें इस प्रकार हैं - देस - DES का मतलब डेटा एन्क्रिप्शन स्टैंडर्ड है। डेटा एन्क्रिप्शन स्टैंडर्ड (डीईएस) एल्गोरिदम का आविष्कार आईबीएम ने 1970 के दशक की शुरुआत में किया था। यह 64-बिट ब्लॉक में प्लेनटेक्स्ट को स्वीकार करता है और इसे सिफरटेक्स्ट में बदल देता है जिसे जानकारी