Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ईटीएल क्या है?

<घंटा/>

ETL का मतलब एक्सट्रैक्ट, ट्रांसफॉर्म और लोड है। यह वह प्रक्रिया है जो डेटा-संचालित संगठन कई स्रोतों से डेटा एकत्र करने के लिए उपयोग करते हैं और फिर इसे खोज, रिपोर्टिंग, विश्लेषण और निर्णय लेने में सहायता के लिए एक साथ लाते हैं।

डेटा स्रोत प्रकार, प्रारूप, मात्रा और विश्वसनीयता में भिन्न हो सकते हैं, इसलिए एक साथ वितरित होने पर सहायक होने के लिए संसाधित होने के लिए आवश्यक डेटा। उद्देश्यों और तकनीकी निष्पादन के आधार पर लक्ष्य डेटा स्टोर डेटाबेस, डेटा वेयरहाउस या डेटा लेक हो सकते हैं। ETL के निम्नलिखित चरण हैं जो इस प्रकार हैं -

निकालें - निष्कर्षण के दौरान, ईटीएल डेटा को पहचानता है और इसे अपने स्रोतों से डुप्लिकेट करता है, इसलिए यह डेटा को लक्ष्य डेटास्टोर में ले जा सकता है। डेटा संरचित और असंरचित स्रोतों से प्रकट हो सकता है, जिसमें फ़ाइलें, ईमेल, व्यावसायिक सॉफ़्टवेयर, डेटाबेस, उपकरण, सेंसर, तृतीय पक्ष आदि शामिल हैं।

निष्कर्षण करने के विभिन्न तरीके हैं जैसे कि

आंशिक निष्कर्षण − सूचना तक पहुंचने का सबसे आसान तरीका यह है कि अगर किसी रिकॉर्ड को संशोधित किए जाने पर स्रोत सिस्टम हमें सूचित करता है।

आंशिक निष्कर्षण (अपडेट अधिसूचना के साथ) - ऐसा नहीं है कि अपडेट होने की स्थिति में सभी सिस्टम एक घोषणा प्रदान कर सकते हैं; लेकिन, वे उन अभिलेखों को चिह्नित कर सकते हैं जिन्हें रूपांतरित किया गया है और ऐसे अभिलेखों के उद्धरण का समर्थन करते हैं।

पूर्ण उद्धरण - कुछ सिस्टम यह नहीं पहचान सकते हैं कि कौन सा डेटा बिल्कुल बदल दिया गया है। इस मामले में, सिस्टम से रिकॉर्ड निकालने के लिए एक पूर्ण अर्क ही एकमात्र व्यवहार्यता है। इस दृष्टिकोण के लिए उसी प्रारूप में अंतिम उद्धरण की एक प्रति होने की आवश्यकता है ताकि यह बनाए गए परिवर्तनों की पहचान कर सके।

रूपांतरित करें - दूसरे चरण में स्रोतों से निकाली गई कच्ची जानकारी को एक प्रारूप में बदलना शामिल है जिसका उपयोग कई अनुप्रयोगों द्वारा किया जा सकता है। इस चरण में, डेटा ने एक निश्चित स्कीमा प्रदान करते हुए, शुद्ध, मैप और रूपांतरित किया है, इसलिए यह परिचालन आवश्यकताओं को ढूंढता है।

इस प्रक्रिया में कई प्रकार के परिवर्तन की आवश्यकता होती है जो डेटा की गुणवत्ता और अखंडता प्रदान करते हैं। डेटा को आम तौर पर लक्ष्य डेटा स्रोत में ठीक से लोड नहीं किया जाता है, लेकिन वैकल्पिक रूप से, इसे स्टेजिंग डेटाबेस में अपलोड करना अक्सर होता है।

योजना के अनुसार कुछ नहीं होने की स्थिति में यह कदम एक त्वरित रोलबैक सुनिश्चित करता है। इस चरण के दौरान, यह नियामक अनुपालन के लिए ऑडिट दस्तावेज़ बना सकता है, या कुछ डेटा समस्याओं का निदान और मरम्मत कर सकता है।

लोड करें - ईटीएल रूपांतरित जानकारी को लक्ष्य डेटास्टोर में ले जाता है। इस चरण के लिए सभी स्रोत जानकारी की मूल लोडिंग की आवश्यकता हो सकती है, या यह स्रोत जानकारी में वृद्धिशील परिवर्तनों की लोडिंग हो सकती है। यह डेटा को रीयल-टाइम या शेड्यूल किए गए बैचों में लोड कर सकता है।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही

  1. सीरियलाइजेशन क्या है?

    हाल ही में एक प्रोजेक्ट अपडेट मीटिंग के दौरान, मेरी टीम ने इस बारे में बात की कि हम इस एप्लिकेशन से डेटा को आगे और पीछे भेजने के लिए क्रमांकन का उपयोग कैसे करने जा रहे हैं। एक इंजीनियर जो सॉफ्टवेयर परियोजनाओं में और अधिक काम करना चाह रहा था, उसने मुझे बताया कि वे इस शब्द से अपरिचित थे। इस तरह की