Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

सांख्यिकीय डेटा माइनिंग के तरीके क्या हैं?

<घंटा/>

सांख्यिकीय डेटा माइनिंग तकनीकों में, यह बड़ी मात्रा में डेटा के प्रभावी संचालन के लिए बनाया गया है जो आम तौर पर बहुआयामी और संभवतः कई जटिल प्रकार के होते हैं।

डेटा विश्लेषण के लिए कई अच्छी तरह से स्थापित सांख्यिकीय विधियां हैं, खासकर संख्यात्मक डेटा के लिए। इन विधियों का व्यापक रूप से वैज्ञानिक रिकॉर्ड (जैसे, भौतिकी, इंजीनियरिंग, निर्माण, मनोविज्ञान और चिकित्सा में प्रयोगों के रिकॉर्ड) और अर्थशास्त्र और सामाजिक विज्ञान की जानकारी के लिए उपयोग किया गया है।

सांख्यिकीय डेटा माइनिंग के विभिन्न तरीके इस प्रकार हैं -

प्रतिगमन - सामान्य तौर पर, इन तकनीकों का उपयोग नए भविष्यवक्ता (स्वतंत्र) चर से प्रतिक्रिया (आश्रित) चर के मूल्य की भविष्यवाणी करने के लिए किया जाता है, जहां चर संख्यात्मक होते हैं। प्रतिगमन के कई रूप हैं, जिनमें रैखिक, बहु, भारित, बहुपद, गैर-पैरामीट्रिक, और मजबूत (मजबूत तरीके फायदेमंद होते हैं जब त्रुटियां सामान्य स्थिति को पूरा करने के लिए कम हो जाती हैं या जब डेटा में महत्वपूर्ण आउटलेयर शामिल होते हैं)।

सामान्यीकृत रैखिक मॉडल - ये मॉडल और उनका सामान्यीकरण (सामान्यीकृत योगात्मक मॉडल), एक श्रेणीबद्ध (नाममात्र) प्रतिक्रिया चर (इसके कई परिवर्तन) को पूर्वसूचक चर के एक सेट के साथ उसी तरह से जोड़ने में सक्षम बनाता है जैसे रैखिक प्रतिगमन का उपयोग करने वाले गणितीय प्रतिक्रिया चर के मॉडलिंग के लिए। . सामान्यीकृत रैखिक मॉडल में लॉजिस्टिक रिग्रेशन और पॉइसन रिग्रेशन शामिल हैं।

विचरण का विश्लेषण - ये विधि एक संख्यात्मक प्रतिक्रिया चर और नए श्रेणीबद्ध चर (कारक) द्वारा परिभाषित दो या दो से अधिक आबादी के लिए प्रयोगात्मक जानकारी का विश्लेषण करती है। सामान्य तौर पर, एक एनोवा (विचरण का एकल-कारक विश्लेषण) समस्या में k जनसंख्या की तुलना होती है या यह तय करने के लिए उपचार परिभाषित करता है कि क्या कम से कम दो साधन अलग हैं।

मिश्रित-प्रभाव वाले मॉडल - ये मॉडल समूहीकृत डेटा-डेटा की खोज के लिए हैं जिन्हें एक या अधिक समूह चर के अनुसार वर्गीकृत किया जा सकता है। वे आम तौर पर एक या अधिक कारकों के अनुसार संयुक्त डेटा में एक प्रतिक्रिया चर और कई सहसंयोजकों के बीच संबंधों को परिभाषित करते हैं। अनुप्रयोग के कई क्षेत्र हैं जैसे बहुस्तरीय डेटा, दोहराए गए माप डेटा, ब्लॉक डिज़ाइन और अनुदैर्ध्य डेटा।

कारक विश्लेषण - यह विधि निर्धारित कर सकती है कि दिए गए कारक का उत्पादन करने के लिए कौन से चर संयुक्त हैं। उदाहरण के लिए, कई मनोरोग डेटा के लिए, यह सीधे ब्याज के एक विशिष्ट कारक की गणना करने के लिए लागू नहीं होता है (उदाहरण के लिए, बुद्धि); हालांकि, यह अन्य मात्राओं को मापने के लिए लागू होता है जो ब्याज के तत्व को दर्शाती हैं। इसलिए, कोई भी चर आश्रित के रूप में विनियोजित नहीं है।

विभेदक विश्लेषण - यह तकनीक एक श्रेणीबद्ध प्रतिक्रिया चर की भविष्यवाणी कर सकती है। सामान्यीकृत रैखिक मॉडल के विपरीत, यह मानता है कि स्वतंत्र चर एक बहुभिन्नरूपी सामान्य वितरण का पालन करते हैं। प्रक्रिया कई विभेदक कार्यों (स्वतंत्र चर के रैखिक सेट) को तय करने की कोशिश करती है जो प्रतिक्रिया चर द्वारा प्रतिनिधित्व किए गए समूहों के बीच भेदभाव करते हैं। विभेदक विश्लेषण आमतौर पर सामाजिक विज्ञान में प्रयोग किया जाता है।

अस्तित्व विश्लेषण - उत्तरजीविता विश्लेषण के लिए कई अच्छी तरह से स्थापित सांख्यिकीय विधियां मौजूद हैं। इन तकनीकों को शुरू में इस संभावना का अनुमान लगाने के लिए डिज़ाइन किया गया था कि एक चिकित्सा विश्लेषण से गुजरने वाला रोगी कम से कम समय तक जीवित रह सकता है।

गुणवत्ता नियंत्रण - गुणवत्ता नियंत्रण के लिए चार्ट तैयार करने के लिए कई आँकड़ों का उपयोग किया जाता है, जिसमें शेवार्ट चार्ट और CUSUM चार्ट शामिल हैं। इन आँकड़ों में माध्य, मानक विचलन, श्रेणी, गणना, चलती औसत, चलती मानक विचलन और गतिमान श्रेणी शामिल हैं।


  1. OLAP के अनुप्रयोग क्या हैं?

    OLAP,ऑन-लाइन विश्लेषणात्मक प्रसंस्करण के लिए खड़ा है। OLAP सॉफ्टवेयर तकनीक का एक तत्व है जो विश्लेषकों, प्रबंधकों और अधिकारियों को सूचना के संभावित विचारों की एक विस्तृत विविधता में तेज, सुसंगत, इंटरैक्टिव एक्सेस के माध्यम से डेटा में अंतर्दृष्टि प्राप्त करने के लिए अधिकृत करता है, जिसे वास्तविक आया

  1. वेब माइनिंग के तरीके क्या हैं?

    वेब माइनिंग सीखने या ज्ञान प्राप्त करने के लक्ष्यों के लिए वेब-आधारित डेटा के लिए मशीन लर्निंग (डेटा माइनिंग) दृष्टिकोण का अनुप्रयोग है। वेब माइनिंग के तरीकों को तीन अलग-अलग तत्वों में से एक में परिभाषित किया जा सकता है जो इस प्रकार हैं - वेब उपयोग खनन - वेब यूसेज माइनिंग एक तरह का वेब माइनिंग है ज

  1. पैटर्न खनन के अनुप्रयोग क्या हैं?

    पैटर्न माइनिंग के विभिन्न अनुप्रयोग हैं जो इस प्रकार हैं - पैटर्न खनन आम तौर पर कई डेटा-गहन अनुप्रयोगों में प्रीप्रोसेसिंग के रूप में शोर फ़िल्टरिंग और डेटा सफाई के लिए उपयोग किया जाता है। इसका उपयोग माइक्रोएरे डेटा का पता लगाने के लिए किया जा सकता है, उदाहरण के लिए, जिसमें दसियों हज़ार आयाम शामिल