Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा क्यूब एग्रीगेशन क्या है?

<घंटा/>

डेटा एकीकरण कई अलग-अलग स्रोतों से डेटा को मर्ज करने की प्रक्रिया है। डेटा एकीकरण करते समय, इसे डेटा अतिरेक, असंगति, दोहराव आदि पर काम करना चाहिए। डेटा माइनिंग में, डेटा एकीकरण एक रिकॉर्ड प्रीप्रोसेसिंग विधि है जिसमें एक एकीकृत डेटा को बनाए रखने और प्रदान करने के लिए कुछ विषम डेटा स्रोतों के डेटा को सुसंगत डेटा में मर्ज करना शामिल है। डेटा का परिप्रेक्ष्य।

स्वास्थ्य सेवा उद्योग में डेटा एकीकरण विशेष रूप से महत्वपूर्ण है। कई रोगी रिकॉर्ड और क्लीनिक से एकीकृत डेटा कई प्रणालियों से जानकारी को लाभकारी जानकारी के एकल परिप्रेक्ष्य में एकीकृत करके चिकित्सा विकारों और बीमारियों की पहचान करने में चिकित्सकों की सहायता करता है जिससे उपयोगी अंतर्दृष्टि प्राप्त की जा सकती है।

प्रभावी डेटा संग्रह और एकीकरण भी चिकित्सा बीमा दावों की प्रसंस्करण सटीकता में सुधार करता है और यह सुनिश्चित करता है कि रोगी के नाम और संपर्क जानकारी लगातार और सटीक रूप से दर्ज की जाती है। इंटरऑपरेबिलिटी का तात्पर्य विभिन्न प्रणालियों में सूचनाओं के आदान-प्रदान से है।

जब हमारे पास आवश्यक से भिन्न रूप में डेटा होता है, तो वांछित विशेषताओं को प्राप्त करने के लिए एकत्रीकरण विधियों को विशेषताओं पर लागू किया जा सकता है। उदाहरण के लिए, एक दुकान के पास वर्ष 2010 से 2012 तक की तिमाही बिक्री का डेटा है। डेटा त्रैमासिक रूप में उपलब्ध है लेकिन इसकी वार्षिक बिक्री को पुनः प्राप्त करने की आवश्यकता है। इसलिए, वांछित आउटपुट खोजने के लिए डेटा को एकत्रित करना आवश्यक है।

<टेबल><थेड>तिमाही बिक्री <थ>तिमाही बिक्री <थ>तिमाही बिक्री <थ>वर्ष बिक्री वर्ष 2010 <वें colspan="2" स्कोप="colgroup">वर्ष 2011 <वें colspan="2" स्कोप="colgroup">वर्ष 2012 साल की बिक्री Q1 रु.10000 Q1 रु.8000 Q1 रु.15000 2010 रु.1,30,000 Q2 रु.50000 Q2 रु.15000 Q2 रु.20000 2011 रु.53000 Q3 रु.40000 Q3 रु.10000 Q3 रु.40000 2012 रु.1,05,000 Q4 रु.30000 Q4 रु.20000 Q4 रु.30000

वर्ष 2010 से 2012 तक प्रति तिमाही बिक्री एकल वार्षिक बिक्री रिकॉर्ड में एकत्रित हो जाती है।

अवधारणा पदानुक्रम प्रत्येक विशेषता के लिए मौजूद हो सकता है, जिससे अमूर्तता के कई स्तरों पर डेटा का विश्लेषण किया जा सकता है। उदाहरण के लिए, एक शाखा के लिए एक पदानुक्रम शाखाओं को उनके पते के आधार पर क्षेत्रों में समूहीकृत करने की अनुमति दे सकता है। डेटा क्यूब पूर्व-गणना, सारांशित डेटा तक त्वरित पहुंच का समर्थन करते हैं, इस प्रकार ऑनलाइन विश्लेषणात्मक प्रसंस्करण और डेटा खनन को लाभ होता है।

अमूर्तता के निम्नतम स्तर पर उत्पन्न घन को आधार घनाभ के रूप में परिभाषित किया गया है। बेस क्यूबॉइड को बिक्री या ग्राहकों सहित ब्याज की एकल इकाई के अनुरूप होना चाहिए। दूसरे शब्दों में, विश्लेषण के लिए निम्नतम स्तर प्रयोग करने योग्य या सहायक होना चाहिए। अमूर्तता के उच्चतम स्तर पर एक घन शीर्ष घनाभ है।

अमूर्तता के कई स्तरों के लिए उत्पन्न डेटा क्यूब को क्यूबॉइड के रूप में परिभाषित किया जाता है ताकि एक डेटा क्यूब इसके बजाय क्यूबॉइड की एक जाली को परिभाषित कर सके। अमूर्तता का प्रत्येक बड़ा स्तर परिणामी डेटा आकार को और कम करता है। डेटा माइनिंग अनुरोधों का जवाब देते समय, दिए गए कार्य के लिए प्रासंगिक सबसे छोटे उपलब्ध क्यूबॉइड का उपयोग किया जाना चाहिए।


  1. डेटा सेंटर क्या है?

    एक डेटा केंद्र, जिसे कभी-कभी डेटासेंटर . के रूप में लिखा जाता है (एक शब्द), एक ऐसी सुविधा को दिया गया नाम है जिसमें बड़ी संख्या में कंप्यूटर सर्वर और संबंधित उपकरण होते हैं। एक डेटा सेंटर को कंप्यूटर रूम के रूप में सोचें जो इसकी दीवारों को बढ़ा देता है। वे किसी भी तरह का डेटा स्टोर कर सकते हैं, चाह

  1. OLAP क्या है?

    OLAP,ऑन-लाइन विश्लेषणात्मक प्रसंस्करण के लिए खड़ा है। OLAP सॉफ्टवेयर तकनीक का एक तत्व है जो विश्लेषकों, प्रबंधकों और अधिकारियों को सूचना के संभावित विचारों की एक विस्तृत विविधता में तेज, सुसंगत, इंटरैक्टिव एक्सेस के माध्यम से डेटा में अंतर्दृष्टि प्राप्त करने के लिए अधिकृत करता है, जिसे वास्तविक आया

  1. STREAM क्या है?

    STREAM एक व्यक्तिगत-पास, निरंतर तत्व सन्निकटन एल्गोरिथ्म है जो k- माध्यिका समस्या के लिए तैयार किया गया था। k-माध्यमों की समस्या N डेटा बिंदुओं को k समूहों या समूहों में क्लस्टर करना है जैसे कि बिंदुओं और क्लस्टर केंद्र के बीच योग चुकता त्रुटि (SSQ) जिसे उन्हें सौंपा गया है, कम से कम है। विचार एक ही