Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा स्रोत चुनने के लिए क्या मापदंड हैं?

<घंटा/>

डेटा स्रोतों के चयन के लिए विभिन्न मानदंड हैं जो इस प्रकार हैं -

डेटा पहुंच योग्यता - यदि डेटा के लिए दो संभावित फ़ीड मौजूद हैं, एक को सबसे कम उम्र के प्रोजेक्ट टीम के सदस्य के जन्म से पहले लिखे गए कार्यक्रमों के एक सेट द्वारा बनाए गए बाइनरी फाइलों में संग्रहीत किया जाता है और दूसरा एक सिस्टम से होता है जो बाइनरी दस्तावेजों को पढ़ता है और अधिक प्रसंस्करण का समर्थन करता है, फिर निर्णय स्पष्ट है।

डेटा सटीकता - जैसे-जैसे डेटा सिस्टम से सिस्टम में जाता है, कई संशोधन किए जाते हैं। कभी-कभी अन्य सिस्टम से डेटा तत्व जोड़े जाते हैं, और कभी-कभी मौजूदा तत्वों को नए तत्व बनाने के लिए संसाधित किया जाता है और अन्य तत्वों को छोड़ दिया जाता है।

प्रत्येक प्रणाली अपना कार्य अच्छी तरह से करती है। हालांकि, मूल डेटा को पहचानना मुश्किल या असंभव हो सकता है। कुछ मामलों में, डेटा अब यह नहीं दर्शाता है कि व्यवसाय विश्लेषण के लिए क्या चाहता है। यदि आप इन डाउनस्ट्रीम सिस्टम से डेटा प्रदान करते हैं, तो उपयोगकर्ता सटीकता पर सवाल उठा सकते हैं।

प्रोजेक्ट शेड्यूलिंग - कई संगठनों में, डेटा वेयरहाउस प्रोजेक्ट मौजूदा OLTP सिस्टम के पुनर्लेखन के हिस्से के रूप में शुरू होता है। जैसे ही नया सिस्टम डेवलपमेंट प्रोजेक्ट सामने आना शुरू होता है, यह मामला है कि डेटा वेयरहाउस के मूल्य के बारे में सुरक्षित रूप से आश्वस्त होने वाले व्यावसायिक उपयोगकर्ता इस बात पर जोर देने लगते हैं कि डेटा वेयरहाउस को जल्द से जल्द लागू किया जाए।

ऐतिहासिक डेटा प्रदान करने के लिए, आपको अपने डेटा वेयरहाउस में मौजूदा सिस्टम से डेटा शामिल करना होगा। यदि पुराने सिस्टम का पुनर्लेखन रोक दिया जाता है, तो डेटा वेयरहाउस मौजूदा सिस्टम का उपयोग जारी रख सकता है। एक बार उत्पादन के लिए नई प्रणाली जारी होने के बाद, डेटा फीड्स को इसमें स्विच किया जा सकता है। कई मामलों में, नए ऑपरेटिंग सिस्टम के पूरा होने से पहले डेटा वेयरहाउस को डिलीवर करना संभव है।

कुछ आयामी जानकारी आमतौर पर लेन-देन या तथ्य डेटा के साथ आती है, लेकिन यह आमतौर पर न्यूनतम होती है और अक्सर केवल कोड के रूप में होती है। अतिरिक्त विशेषताएँ जो उपयोगकर्ता चाह सकते हैं और आवश्यक हैं कई सिस्टम या संयुक्त मास्टर फाइलों से फीड की जाती हैं।

कई मामलों में, विशेष रूप से ग्राहक आयाम के लिए कई मास्टर फ़ाइलें हो सकती हैं। अक्सर अलग-अलग फाइलें होती हैं जिनका उपयोग एक संगठन में किया जाता है। बिक्री, मार्केटिंग और वित्त के पास अपनी ग्राहक मास्टर फ़ाइलें हो सकती हैं।

पहले की तरह दो कठिन मुद्दे हैं, इन फ़ाइलों में शामिल ग्राहक भिन्न हो सकते हैं, और प्रत्येक ग्राहक के बारे में विशेषताएँ भिन्न हो सकती हैं। दूसरा, सामान्य जानकारी मेल नहीं खा सकती है। यदि उसके पास असीमित समय और धन हो तो वह सभी स्रोतों से समृद्ध डेटा प्राप्त कर सकता है और फिर उसे ग्राहकों के व्यक्तिगत व्यापक दृष्टिकोण में जोड़ सकता है।

ज्यादातर मामलों में, यह सब एक साथ करने के लिए पर्याप्त समय या पैसा नहीं होता है। इन मामलों में, यह अनुशंसा की जाती है कि उपयोगकर्ता जानकारी को प्राथमिकता दें, और आप उस से शुरुआत करें जो आप भविष्य में कर सकते हैं और विस्तार कर सकते हैं।


  1. डेटा माइनिंग के उपकरण क्या हैं?

    डेटा माइनिंग के विभिन्न उपकरण हैं जो इस प्रकार हैं - मंकी लर्न - मंकीलर्न एक मशीन लर्निंग प्लेटफॉर्म है जो टेक्स्ट माइनिंग में माहिर है। यह एक उपयोगकर्ता के अनुकूल इंटरफेस में सुलभ है, इसलिए यह वास्तविक समय में डेटा माइनिंग को लागू करने के लिए मंकीलर्न को मौजूदा टूल के साथ एकीकृत कर सकता है। यह नीच

  1. डेटा माइनिंग की तकनीकें क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के

  1. डेटा क्यूब कंप्यूटेशंस के लिए तकनीकें क्या हैं?

    डेटा क्यूब्स की कुशल गणना के लिए सामान्य अनुकूलन तकनीकें निम्नलिखित हैं जो इस प्रकार हैं - क्रमबद्ध करना, हैश करना और समूह बनाना - सॉर्टिंग, हैशिंग और ग्रुपिंग ऑपरेशंस का उपयोग आयाम विशेषताओं के लिए किया जाना चाहिए ताकि संबंधित टुपल्स को पुन:व्यवस्थित और क्लस्टर किया जा सके। घन गणना में, समेकन को उ