Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

आयाम में कमी क्या है?

<घंटा/>

आयामीता में कमी में, मूल डेटा का कम या "संपीड़ित" प्रतिनिधित्व प्राप्त करने के लिए डेटा एन्कोडिंग या परिवर्तन लागू होते हैं। यदि मूल डेटा को बिना किसी सूचना की विफलता के संपीड़ित डेटा से पुनर्निर्मित किया जा सकता है, तो डेटा में कमी को दोषरहित के रूप में जाना जाता है। यदि पुनर्निर्मित डेटा केवल मूल डेटा का अनुमान लगाया जाता है, तो डेटा में कमी को हानिपूर्ण कहा जाता है।

हानिपूर्ण कमी के दो तरीके हैं जो इस प्रकार हैं -

  • वेवलेट रूपांतरण - डिस्क्रीट वेवलेट ट्रांसफॉर्म (डीडब्ल्यूटी) एक रैखिक सिग्नल प्रोसेसिंग तकनीक है, जो डेटा वेक्टर एक्स पर लागू होने पर, इसे वेवलेट गुणांक के संख्यात्मक रूप से भिन्न वेक्टर, एक्स 'में बदल देती है। दो वैक्टर समान लंबाई के हैं। डेटा में कमी के लिए इस तकनीक का उपयोग करते समय, यह प्रत्येक टपल को एक n-आयामी डेटा वेक्टर के रूप में मान सकता है, अर्थात 𝑋=(x1 ,x<उप>2 ,…x<उप>एन ) n डेटाबेस विशेषताओं से टपल पर किए गए n मापों को दर्शाता है।

डीडब्ल्यूटी लगभग असतत फूरियर ट्रांसफॉर्म (डीएफटी) से जुड़ा हुआ है, एक सिग्नल प्रोसेसिंग तकनीक जिसमें साइन और कोसाइन होते हैं। सामान्य तौर पर, डीडब्ल्यूटी बेहतर हानिपूर्ण संपीड़न प्राप्त करता है। यही है कि यदि किसी दिए गए डेटा वेक्टर के डीडब्ल्यूटी और डीएफटी के लिए समान गुणांक बनाए रखा जाता है, तो डीडब्ल्यूटी संस्करण मूल डेटा का अधिक सटीक अनुमान प्रदान करेगा। इसलिए, एक समान सन्निकटन के लिए, DWT को DFT की तुलना में कम स्थान की आवश्यकता होती है।

डेटा क्यूब सहित बहुआयामी डेटा के लिए वेवलेट ट्रांसफ़ॉर्म का उपयोग किया जा सकता है। यह पहले परिवर्तन को पहले आयाम में, फिर दूसरे में, और इसी तरह लागू करके किया जाता है। शामिल कम्प्यूटेशनल जटिलता घन में कोशिकाओं की संख्या के लिए रैखिक है।

वेवलेट ट्रांसफॉर्म विरल या तिरछी डेटा और ऑर्डर की गई विशेषताओं वाले डेटा पर अच्छे परिणाम देते हैं। वेवलेट्स द्वारा हानिपूर्ण संपीड़न वर्तमान वाणिज्यिक मानक जेपीईजी संपीड़न से बेहतर है। वेवलेट ट्रांसफ़ॉर्म में कई वास्तविक दुनिया के अनुप्रयोग हैं, जिनमें फ़िंगरप्रिंट छवियों का संपीड़न, कंप्यूटर दृष्टि, समय-श्रृंखला डेटा का विश्लेषण और डेटा की सफाई शामिल है।

  • प्रमुख घटक विश्लेषण -प्रिंसिपल कंपोनेंट्स एनालिसिस को करहुनेन-लोव, या के-एल, मेथड भी कहा जाता है। यह k n-आयामी ऑर्थोगोनल वैक्टर की खोज कर सकता है जिसका उपयोग डेटा का प्रतिनिधित्व करने के लिए सबसे अच्छा किया जा सकता है, जहां k n। मूल डेटा को बहुत छोटे स्थान पर प्रक्षेपित किया जाता है, जिसके परिणामस्वरूप आयामीता में कमी आती है। यह चर के वैकल्पिक छोटे सेट बनाकर विशेषताओं के सार को जोड़ती है। मूल डेटा को इस छोटे सेट पर प्रक्षेपित किया जा सकता है।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. OLAP क्या है?

    OLAP,ऑन-लाइन विश्लेषणात्मक प्रसंस्करण के लिए खड़ा है। OLAP सॉफ्टवेयर तकनीक का एक तत्व है जो विश्लेषकों, प्रबंधकों और अधिकारियों को सूचना के संभावित विचारों की एक विस्तृत विविधता में तेज, सुसंगत, इंटरैक्टिव एक्सेस के माध्यम से डेटा में अंतर्दृष्टि प्राप्त करने के लिए अधिकृत करता है, जिसे वास्तविक आया

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही