डेटा विश्लेषण उपयोगी जानकारी निकालने के लिए डेटा का प्रसंस्करण है जो निर्णय लेने के लिए मशीन का समर्थन करता है। डेटा की प्रोसेसिंग में डेटा की सफाई, रीमॉडेलिंग और निरीक्षण करना शामिल है।
डेटा एनालिटिक्स के लिए उच्च कंप्यूटिंग शक्ति की आवश्यकता होती है क्योंकि डेटा को संसाधित करने के लिए बहुत बड़ा है। इसलिए डेटा विश्लेषण के लिए विशेष उपकरण हैं।
कुछ लोकप्रिय डेटा विश्लेषण उपकरण हैं -
-
आर प्रोग्रामिंग
आर विंडोज, मैकओएस, यूनिक्स जैसे सभी प्रमुख प्लेटफार्मों के लिए उपलब्ध डेटा एनालिटिक्स के लिए सबसे अच्छे और सबसे व्यापक रूप से उपयोग किए जाने वाले टूल में से एक है। इसने डेटा मॉडलिंग और सांख्यिकी में उपयोग पाया है। आर का उपयोग करके बड़े डेटा का आसानी से हेरफेर और प्रतिनिधित्व किया जाता है क्योंकि इसमें डेटा एनालिटिक्स के लिए विशाल पुस्तकालय समर्थन है। R में 11,556 पैकेज उपलब्ध हैं जो डेटा साइंटिस्ट के काम को आसान बनाते हैं।
-
पायथन
सूची में एक और प्रोग्रामिंग भाषा, पायथन एक बहुउद्देश्यीय और सबसे बहुमुखी प्रोग्रामिंग भाषा है। इसका व्यापक पुस्तकालय और प्रकृति को समझने में आसान होने के कारण इसका व्यापक रूप से उपयोग किया जाता है। यह एक ऐसे उपयोगकर्ता के बीच आम है जिसे मशीन लर्निंग और डेटा एनालिटिक्स दोनों की विशेषताओं वाले टूल की आवश्यकता होती है क्योंकि इसमें दोनों का समर्थन करने वाले पैकेजों का एक बड़ा सेट होता है।
-
सार्वजनिक झांकी
एक मुफ्त डेटा विज़ुअलाइज़ेशन टूल जो विज़ुअलाइज़ेशन, मैप्स और डैशबोर्ड आदि बनाता है। यह विज़ुअलाइज़ेशन के लिए डेटा निकालने के लिए डेटा स्रोतों से आसानी से जुड़ सकता है और क्लाइंट या सोशल मीडिया पर विज़ुअलाइज़ेशन को साझा करने का भी समर्थन करता है। इसमें बड़े डेटा को संसाधित करने की क्षमता है और यह बेहतर तरीके से डेटा की कल्पना कर सकता है।
-
एसएएस
Sas एक प्रोग्रामिंग भाषा सह वातावरण है जिसका उपयोग डेटा हेरफेर के लिए किया जाता है। इसका उपयोग डेटा के बड़े सेट का विश्लेषण करने और उन्हें प्रबंधित करने के लिए किया जाता है। यह एक कुशल सोशल मीडिया मार्केटिंग टूल है।
-
माइक्रोसॉफ्ट एक्सेल
यह एक सरल और बुनियादी उपकरण है जिसका उपयोग विश्लेषिकी के लिए किया जा सकता है। डेटा वैज्ञानिक इसे प्रथम स्तर के उपकरण के रूप में उपयोग करते हैं। यह डेटा सेट का पूर्वावलोकन करने और डेटा में फ़िल्टर जोड़ने का एक महत्वपूर्ण उपकरण है। इसमें उपयोगकर्ताओं को मॉडलिंग में मदद करने के लिए बहुत उन्नत व्यापार विश्लेषण है।
-
अपाचे स्पार्क
Apache Spark Apache स्पार्क एक स्केलेबल डेटा प्रोसेसिंग टूल है जिसका उपयोग Hadoop डेटा क्लस्टर के साथ काम करने के लिए किया जाता है। यह एक उपकरण है जो डेटा विज्ञान में मदद करता है और मशीन लर्निंग मॉडल विकास के लिए उपयोग किया जाता है क्योंकि यह डेटा सेट से सीखने में मदद करने के लिए वर्गीकरण, प्रतिगमन, क्लस्टरिंग और फ़िल्टरिंग जैसी तकनीकों का समर्थन करता है।