Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा परिवर्तन की सेवाएं क्या हैं?

<घंटा/>

डेटा परिवर्तन में, डेटा को खनन के लिए लागू रूपों में रूपांतरित या लिंक किया जाता है। डेटा परिवर्तन में निम्नलिखित शामिल हो सकते हैं -

  • चिकनाई - यह डेटा से शोर को दूर करने का काम कर सकता है। ऐसी तकनीकों में बिनिंग, रिग्रेशन और क्लस्टरिंग शामिल हैं।

  • एकत्रीकरण - एग्रीगेशन में, जहां डेटा पर सारांश या एग्रीगेशन ऑपरेशंस लागू होते हैं।

  • सामान्यीकरण - सामान्यीकरण में, जहां निम्न-स्तरीय या "आदिम" (कच्चा) डेटा को अवधारणा पदानुक्रमों की आवश्यकता के माध्यम से बड़े-स्तर की अवधारणाओं द्वारा पुनर्स्थापित किया जाता है।

डेटा परिवर्तन की विभिन्न सेवाएँ हैं जो इस प्रकार हैं -

एकीकरण - एकीकरण में सरोगेट कुंजियाँ बनाना, एक योजना से दूसरी योजना में कुंजियों का मानचित्रण करना और कार्यक्रमों को पूर्ण विवरण में मैप करना शामिल है। इस परिवर्तन के पीछे एक मास्टर कुंजी लुकअप तालिका का समर्थन करने के लिए एक निहित अधिकार है।

डायमेंशन रखरखाव धीरे-धीरे बदल रहा है - यह बदले हुए मूल्यों की पहचान कर सकता है और सरोगेट कुंजी बनाना एक मुश्किल प्रक्रिया है, लेकिन यह अंतरिक्ष-ताना गणित नहीं है। अगर आप डेटा स्टेजिंग टूल खरीदते हैं, तो उसमें धीरे-धीरे बदलते आयामों को प्रबंधित करने के लिए एल्गोरिदम होना चाहिए।

असामान्यीकरण और पुनर्सामान्यीकरण - अलग-अलग तालिकाओं के पदानुक्रम को एक आयाम में विरूपित करना एक मानक वेयरहाउस परिवर्तन प्रक्रिया है। कुछ डेटा स्टेजिंग टूल एक स्टार स्कीमा सुविधा प्रदान करते हैं जो स्वचालित रूप से इस फ़ंक्शन को निष्पादित करती है। इसके अलावा, तथ्य तालिका चरण में कुछ असामान्यकरण होता है।

उदाहरण के लिए, एक वित्तीय स्कीमा में एक आयाम हो सकता है जो वास्तविक, बजट या पूर्वानुमान मानों के साथ राशि प्रकार है। यह इन अभिलेखों के विवरण के स्तर पर निर्भर करता है, इस कॉलम को डॉलर की मात्रा के तीन स्तंभों के साथ एक पंक्ति में, प्रत्येक राशि प्रकार के लिए एक के साथ एक पंक्ति में पिवट करने के लिए बहुत समझदारी हो सकती है।

सफाई, कटौती, विलय/शुद्ध करना - यह कई डेटा वेयरहाउस के लिए एक बड़ी समस्या है, विशेष रूप से ग्राहकों, व्यवसायों, डॉक्टरों और रोगियों जैसी बाहरी संस्थाओं से संबंधित। यह एक जटिल प्रक्रिया है, लेकिन कई विक्रेता विशेष रूप से इस समस्या के लिए उपकरण और सेवाएं प्रदान करते हैं।

डेटा प्रकार रूपांतरण - इसमें निचले स्तर के रूपांतरण शामिल हैं जो एक डेटा प्रकार या प्रारूप को दूसरे में परिवर्तित करते हैं। यह आईबीएम के मेनफ्रेम कैरेक्टर सेट ईबीसीडीआईसी को एएससीआईआई में कनवर्ट करने से लेकर एक डेटाबेस से दूसरे डेटाबेस में डेट, न्यूमेरिक और कैरेक्टर अभ्यावेदन को परिवर्तित करने तक है।

गणना, व्युत्पत्ति, आवंटन - ये व्यावसायिक नियमों का उपयोग करने के लिए परिवर्तन हैं जिन्हें आवश्यकता चरण के दौरान मान्यता प्राप्त है। सुनिश्चित करें कि वह जिस टूल को चुन सकता है उसमें स्ट्रिंग मैनिपुलेशन, दिनांक और समय अंकगणित, सशर्त विवरण और बुनियादी गणित सहित कार्यों का एक पूरा सेट उपलब्ध है।

एकत्रीकरण - लोड प्रक्रिया के कुछ तत्वों में एकत्रीकरण का प्रबंधन किया जा सकता है, जिसके आधार पर संसाधन किस स्तर पर उपलब्ध हैं। यदि यह एक्स्ट्रेक्ट या ट्रांसफ़ॉर्मेशन प्रक्रिया के एक तत्व के रूप में एग्रीगेशन की गणना कर सकता है, तो सिंकसॉर्ट जैसे टूल को सीधे फ्लैट रिकॉर्ड में उपयोग करना संभव है। इन उपयोगिताओं को छँटाई और रिपोर्टिंग के लिए विकसित किया गया है और यह पूरी तरह से अच्छी हैं।


  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।

  1. सूचना सुरक्षा की सुरक्षा सेवाएँ क्या हैं?

    विभिन्न सुरक्षा सेवाएँ हैं जो इस प्रकार हैं - संदेश गोपनीयता -गोपनीयता का सिद्धांत परिभाषित करता है कि केवल प्रेषक और इच्छित प्राप्तकर्ता ही संदेश के तत्व को बनाने में सक्षम होना चाहिए। यह प्रेषित डेटा को निष्क्रिय हमले से बचाता है। प्रसारित की जाने वाली सूचना की सामग्री के आधार पर कई स्तरों पर

  1. स्टेग्नोग्राफ़ी के आवेदन क्या हैं?

    स्टेग्नोग्राफ़ी को स्पष्ट रूप से हानिरहित संदेशों के भीतर संदेशों को एम्बेड करके डेटा छिपाने की कला और विज्ञान के रूप में भी दर्शाया गया है। स्टेग्नोग्राफ़ी नियमित कंप्यूटर फ़ाइलों में बेकार या अप्रयुक्त जानकारी के बिट्स को पुनर्स्थापित करके काम करती है। यह छिपा हुआ डेटा प्लेन टेक्स्ट या सिफर टेक्स्