आयामीता में कमी में, मूल डेटा का कम या "संपीड़ित" प्रतिनिधित्व प्राप्त करने के लिए डेटा एन्कोडिंग या परिवर्तन लागू होते हैं। यदि मूल डेटा को बिना किसी सूचना की विफलता के संपीड़ित डेटा से पुनर्निर्मित किया जा सकता है, तो डेटा में कमी को दोषरहित के रूप में जाना जाता है। यदि पुनर्निर्मित डेटा केवल मूल डेटा का अनुमान लगाया जाता है, तो डेटा में कमी को हानिपूर्ण कहा जाता है।
हानिपूर्ण कमी के दो तरीके हैं जो इस प्रकार हैं -
-
वेवलेट रूपांतरण - डिस्क्रीट वेवलेट ट्रांसफॉर्म (डीडब्ल्यूटी) एक रैखिक सिग्नल प्रोसेसिंग तकनीक है, जो डेटा वेक्टर एक्स पर लागू होने पर, इसे वेवलेट गुणांक के संख्यात्मक रूप से भिन्न वेक्टर, एक्स 'में बदल देती है। दो वैक्टर समान लंबाई के हैं। डेटा में कमी के लिए इस तकनीक का उपयोग करते समय, यह प्रत्येक टपल को एक n-आयामी डेटा वेक्टर के रूप में मान सकता है, अर्थात 𝑋=(x1 ,x<उप>2उप> ,…x<उप>एनउप> ) n डेटाबेस विशेषताओं से टपल पर किए गए n मापों को दर्शाता है।
डीडब्ल्यूटी लगभग असतत फूरियर ट्रांसफॉर्म (डीएफटी) से जुड़ा हुआ है, एक सिग्नल प्रोसेसिंग तकनीक जिसमें साइन और कोसाइन होते हैं। सामान्य तौर पर, डीडब्ल्यूटी बेहतर हानिपूर्ण संपीड़न प्राप्त करता है। यही है कि यदि किसी दिए गए डेटा वेक्टर के डीडब्ल्यूटी और डीएफटी के लिए समान गुणांक बनाए रखा जाता है, तो डीडब्ल्यूटी संस्करण मूल डेटा का अधिक सटीक अनुमान प्रदान करेगा। इसलिए, एक समान सन्निकटन के लिए, DWT को DFT की तुलना में कम स्थान की आवश्यकता होती है।
डेटा क्यूब सहित बहुआयामी डेटा के लिए वेवलेट ट्रांसफ़ॉर्म का उपयोग किया जा सकता है। यह पहले परिवर्तन को पहले आयाम में, फिर दूसरे में, और इसी तरह लागू करके किया जाता है। शामिल कम्प्यूटेशनल जटिलता घन में कोशिकाओं की संख्या के लिए रैखिक है।
वेवलेट ट्रांसफॉर्म विरल या तिरछी डेटा और ऑर्डर की गई विशेषताओं वाले डेटा पर अच्छे परिणाम देते हैं। वेवलेट्स द्वारा हानिपूर्ण संपीड़न वर्तमान वाणिज्यिक मानक जेपीईजी संपीड़न से बेहतर है। वेवलेट ट्रांसफ़ॉर्म में कई वास्तविक दुनिया के अनुप्रयोग हैं, जिनमें फ़िंगरप्रिंट छवियों का संपीड़न, कंप्यूटर दृष्टि, समय-श्रृंखला डेटा का विश्लेषण और डेटा की सफाई शामिल है।
-
प्रमुख घटक विश्लेषण -प्रिंसिपल कंपोनेंट्स एनालिसिस को करहुनेन-लोव, या के-एल, मेथड भी कहा जाता है। यह k n-आयामी ऑर्थोगोनल वैक्टर की खोज कर सकता है जिसका उपयोग डेटा का प्रतिनिधित्व करने के लिए सबसे अच्छा किया जा सकता है, जहां k n। मूल डेटा को बहुत छोटे स्थान पर प्रक्षेपित किया जाता है, जिसके परिणामस्वरूप आयामीता में कमी आती है। यह चर के वैकल्पिक छोटे सेट बनाकर विशेषताओं के सार को जोड़ती है। मूल डेटा को इस छोटे सेट पर प्रक्षेपित किया जा सकता है।