डेटा एकीकरण कई अलग-अलग स्रोतों से डेटा को मर्ज करने की प्रक्रिया है। डेटा एकीकरण करते समय, इसे डेटा अतिरेक, असंगति, दोहराव आदि पर काम करना चाहिए। डेटा माइनिंग में, डेटा एकीकरण एक रिकॉर्ड प्रीप्रोसेसिंग विधि है जिसमें एक एकीकृत डेटा को बनाए रखने और प्रदान करने के लिए कुछ विषम डेटा स्रोतों के डेटा को सुसंगत डेटा में मर्ज करना शामिल है। डेटा का परिप्रेक्ष्य।
स्वास्थ्य सेवा उद्योग में डेटा एकीकरण विशेष रूप से महत्वपूर्ण है। कई रोगी रिकॉर्ड और क्लीनिक से एकीकृत डेटा कई प्रणालियों से जानकारी को लाभकारी जानकारी के एकल परिप्रेक्ष्य में एकीकृत करके चिकित्सा विकारों और बीमारियों की पहचान करने में चिकित्सकों की सहायता करता है जिससे उपयोगी अंतर्दृष्टि प्राप्त की जा सकती है।
प्रभावी डेटा संग्रह और एकीकरण भी चिकित्सा बीमा दावों की प्रसंस्करण सटीकता में सुधार करता है और यह सुनिश्चित करता है कि रोगी के नाम और संपर्क जानकारी लगातार और सटीक रूप से दर्ज की जाती है। इंटरऑपरेबिलिटी का तात्पर्य विभिन्न प्रणालियों में सूचनाओं के आदान-प्रदान से है।
जब हमारे पास आवश्यक से भिन्न रूप में डेटा होता है, तो वांछित विशेषताओं को प्राप्त करने के लिए एकत्रीकरण विधियों को विशेषताओं पर लागू किया जा सकता है। उदाहरण के लिए, एक दुकान के पास वर्ष 2010 से 2012 तक की तिमाही बिक्री का डेटा है। डेटा त्रैमासिक रूप में उपलब्ध है लेकिन इसकी वार्षिक बिक्री को पुनः प्राप्त करने की आवश्यकता है। इसलिए, वांछित आउटपुट खोजने के लिए डेटा को एकत्रित करना आवश्यक है।
<टेबल><थेड>वर्ष 2010 से 2012 तक प्रति तिमाही बिक्री एकल वार्षिक बिक्री रिकॉर्ड में एकत्रित हो जाती है।
अवधारणा पदानुक्रम प्रत्येक विशेषता के लिए मौजूद हो सकता है, जिससे अमूर्तता के कई स्तरों पर डेटा का विश्लेषण किया जा सकता है। उदाहरण के लिए, एक शाखा के लिए एक पदानुक्रम शाखाओं को उनके पते के आधार पर क्षेत्रों में समूहीकृत करने की अनुमति दे सकता है। डेटा क्यूब पूर्व-गणना, सारांशित डेटा तक त्वरित पहुंच का समर्थन करते हैं, इस प्रकार ऑनलाइन विश्लेषणात्मक प्रसंस्करण और डेटा खनन को लाभ होता है।
अमूर्तता के निम्नतम स्तर पर उत्पन्न घन को आधार घनाभ के रूप में परिभाषित किया गया है। बेस क्यूबॉइड को बिक्री या ग्राहकों सहित ब्याज की एकल इकाई के अनुरूप होना चाहिए। दूसरे शब्दों में, विश्लेषण के लिए निम्नतम स्तर प्रयोग करने योग्य या सहायक होना चाहिए। अमूर्तता के उच्चतम स्तर पर एक घन शीर्ष घनाभ है।
अमूर्तता के कई स्तरों के लिए उत्पन्न डेटा क्यूब को क्यूबॉइड के रूप में परिभाषित किया जाता है ताकि एक डेटा क्यूब इसके बजाय क्यूबॉइड की एक जाली को परिभाषित कर सके। अमूर्तता का प्रत्येक बड़ा स्तर परिणामी डेटा आकार को और कम करता है। डेटा माइनिंग अनुरोधों का जवाब देते समय, दिए गए कार्य के लिए प्रासंगिक सबसे छोटे उपलब्ध क्यूबॉइड का उपयोग किया जाना चाहिए।