Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में आँकड़ों की आवश्यकता क्यों है?

<घंटा/>

सांख्यिकी आंकड़ों से सीखने का विज्ञान है। इसमें रिकॉर्ड के सेट की योजना बनाने और बाद के डेटा प्रशासन से लेकर अंतिम गतिविधियों तक सब कुछ शामिल है, जिसमें डेटा नामक संख्यात्मक तथ्यों से निष्कर्ष निकालना और परिणामों की प्रस्तुति शामिल है। सांख्यिकी सबसे आवश्यक व्यक्ति से संबंधित है:दुनिया के बारे में और अधिक जानने की आवश्यकता और यह कैसे नवाचार और अनिश्चितता के सामने काम करता है।

सूचना ज्ञान का संचार है। डेटा को क्रूड डेटा कहा जाता है न कि स्वयं ज्ञान। डेटा से ज्ञान तक का क्रम इस प्रकार है:डेटा से सूचना तक (डेटा तब सूचना में विकसित होता है जब वे निर्णय समस्या के लिए प्रासंगिक हो जाते हैं); जानकारी से तथ्यों तक (सूचना तब तथ्य बन जाती है जब डेटा इसका समर्थन कर सकता है) और अंत में, तथ्यों से ज्ञान तक (तथ्य तब ज्ञान बन जाते हैं जब उनका उपयोग निर्णय प्रक्रिया की सफल प्रतियोगिता में किया जाता है)।

ज्ञान को व्यवस्थित साक्ष्य आधार पर रखने की आवश्यकता से सांख्यिकी उत्पन्न हुई। इसके लिए संभाव्यता के नियमों, डेटा गुणों और संबंधों के कंप्यूटिंग के विकास आदि के अध्ययन की आवश्यकता थी।

सांख्यिकी संख्यात्मक रिकॉर्ड के विश्लेषण और प्रस्तुति को परिभाषित करती है, जो सभी डेटा माइनिंग एल्गोरिथम का आवश्यक तत्व है। यह बड़ी मात्रा में डेटा से निपटने के लिए टूल और एनालिटिक्स विधियों का समर्थन करता है। सांख्यिकी में योजना बनाना, डिजाइन करना, जानकारी एकत्र करना, विश्लेषण करना और शोध निष्कर्षों की रिपोर्ट करना शामिल है। क्योंकि ये आँकड़े न केवल गणित के लिए परिभाषित हैं, बल्कि एक व्यावसायिक विश्लेषक भी व्यावसायिक मुद्दों को हल करने के लिए आँकड़ों का उपयोग करता है।

जनसंख्या के मापदंडों के मूल्यों का अनुमान लगाने के लिए एक नमूने के लिए अनुमानात्मक आँकड़ों का उपयोग किया जाता है। यह देखने के लिए परिकल्पना परीक्षण कर सकता है कि क्या दो डेटासेट समान या असमान हैं। इसका उपयोग कार्य-कारण समझाने के लिए रैखिक- या बहु-प्रतिगमन विश्लेषण करने के लिए किया जाता है।

परिकल्पना परीक्षण संख्यात्मक रूप से दो डेटासेट की तुलना कर सकता है। उदाहरण के लिए, यह महसूस कर सकता है (परिकल्पना) कि यह बिक्री की मात्रा समान है, या मुख्य प्रतियोगी की तुलना में बेहतर है। यह इस धारणा की गणितीय रूप से पुष्टि या अस्वीकार करने के लिए परिकल्पना परीक्षण का उपयोग कर सकता है।

सहसंबंध विश्लेषण ब्याज के चरों को कई यादृच्छिक चरों से अलग करने का एक सरल उपकरण है, जिसे अक्सर विशाल डेटासेट में देखा जाता है, यह देखने के लिए कि कौन से व्यावसायिक चर वांछित व्यावसायिक परिणाम को महत्वपूर्ण रूप से प्रभावित करते हैं।

गुणवत्ता नियंत्रण के लिए चार्ट तैयार करने के लिए कई आँकड़ों का उपयोग किया जा सकता है, जिसमें शेवार्ट चार्ट और क्यूसम चार्ट (दोनों समूह सारांश आँकड़े प्रदर्शित करते हैं) शामिल हैं। इन आँकड़ों में माध्य, मानक विचलन, श्रेणी, गणना, चलती औसत, चलती मानक विचलन और गतिमान श्रेणी शामिल हैं।


  1. टेम्पोरल डेटा माइनिंग क्या है?

    अस्थायी डेटा खनन अस्थायी डेटा के बड़े सेट से गैर-तुच्छ, निहित और संभावित रूप से आवश्यक डेटा के निष्कर्षण की प्रक्रिया को परिभाषित करता है। अस्थायी डेटा प्राथमिक डेटा प्रकारों की एक श्रृंखला है, आम तौर पर संख्यात्मक मान, और यह अस्थायी डेटा से लाभकारी ज्ञान एकत्र करने से संबंधित है। अस्थायी डेटा माइन

  1. Spatiotemporal डेटा माइनिंग क्या है?

    Spatiotemporal डेटा माइनिंग, spatiotemporal डेटा से पैटर्न और ज्ञान खोजने की प्रक्रिया को परिभाषित करता है। स्पोटियोटेम्पोरल डेटा माइनिंग के एक उदाहरण में शहरों और भूमि के विकास के इतिहास का पता लगाना, मौसम के डिजाइन को उजागर करना, भूकंप और तूफान की भविष्यवाणी करना और ग्लोबल वार्मिंग के रुझान तय करन

  1. हमें डेटा एन्क्रिप्शन की आवश्यकता क्यों है?

    डेटा एन्क्रिप्शन किसी अन्य रूप या कोड में जानकारी का अनुवाद करने की विधि है ताकि डेटा तक पहुंच केवल उचित डिक्रिप्शन कुंजी (या पासवर्ड) वाले लोगों के लिए परिभाषित हो। एन्क्रिप्टेड डेटा को सिफरटेक्स्ट के रूप में भी परिभाषित किया गया है। यह सूचना सुरक्षा के सबसे लोकप्रिय और व्यापक रूपों में से एक है। ए