Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

खनन अनुक्रम डेटा के प्रकार क्या हैं?

<घंटा/>

अनुक्रम घटनाओं की एक क्रमबद्ध सूची है। घटनाओं की विशेषताओं के आधार पर अनुक्रमों को तीन समूहों में विभाजित किया जा सकता है, जिन्हें वे निम्नानुसार परिभाषित करते हैं -

समय-श्रृंखला डेटा में समानता खोज

एक समय-श्रृंखला डेटा सेट में समय की बार-बार गणना पर प्राप्त पूर्णांक मानों के अनुक्रम शामिल होते हैं। मूल्यों को आम तौर पर एक ही समय अंतराल (जैसे प्रत्येक मिनट, घंटे या दिन) पर मापा जाता है।

टाइम-सीरीज़ डेटाबेस स्टॉक मार्केट विश्लेषण, आर्थिक और बिक्री की भविष्यवाणी, बजटीय विश्लेषण, उपयोगिता अध्ययन, इन्वेंट्री अध्ययन, राजस्व अनुमान, कार्यभार अनुमान, और प्रक्रिया और गुणवत्ता सेवा सहित कई अनुप्रयोगों में प्रसिद्ध हैं। वे प्राकृतिक परिघटनाओं, गणितीय और इंजीनियरिंग प्रयोगों और दवा उपचारों के अध्ययन के लिए फायदेमंद हैं।

समय-श्रृंखला डेटा में प्रतिगमन और रुझान विश्लेषण

डेटा और सिग्नल विश्लेषण के अनुप्रयोग में समय-श्रृंखला डेटा के प्रतिगमन विश्लेषण को काफी हद तक डिजाइन किया गया है। रुझान विश्लेषण समय-श्रृंखला डेटा को परिभाषित करने के लिए निम्नलिखित चार प्रमुख तत्वों या आंदोलनों का उपयोग करके एक एकीकृत मॉडल का निर्माण करता है -

रुझान या दीर्घकालिक गतिविधियां - ये उस सामान्य दिशा को दर्शाते हैं जिसमें समय-श्रृंखला ग्राफ़ समय के साथ बदल रहा है, उदाहरण के लिए, भारित चलती औसत और कम से कम वर्ग दृष्टिकोण का उपयोग करके धराशायी वक्र सहित प्रवृत्ति वक्र खोजने के लिए।

चक्रीय गतियां - ये एक ट्रेंड लाइन या कर्व के बारे में लंबे समय तक चलने वाले कंपन हैं।

मौसमी विविधताएं -ये समान रूप से समान पैटर्न हैं जिनका पालन करने के लिए एक समय श्रृंखला होती है जो क्रमिक वर्षों के समान मौसमों के दौरान होती है, जिसमें छुट्टियों की खरीदारी के मौसम भी शामिल हैं। कुशल प्रवृत्ति विश्लेषण के लिए, स्वत:सहसंबंध द्वारा गणना किए गए मौसमी सूचकांक के आधार पर डेटा को "डिसीज़नलाइज़्ड" किया जाना आवश्यक है।

यादृच्छिक गतिविधियां - ये श्रम विवादों या संगठन के भीतर घोषित कार्मिक परिवर्तनों सहित आकस्मिक घटनाओं के कारण छिटपुट परिवर्तनों को परिभाषित करते हैं।

प्रतीकात्मक अनुक्रमों में अनुक्रमिक पैटर्न खनन

एक प्रतीकात्मक अनुक्रम में समय की एक ठोस अवधारणा के साथ या उसके बिना प्रलेखित तत्वों या घटनाओं का एक क्रमबद्ध समूह शामिल होता है। उपयोगकर्ता खरीदारी अनुक्रम, वेब क्लिक स्ट्रीम, कार्यक्रम कार्यान्वयन अनुक्रम, जैविक अनुक्रम, और विज्ञान और इंजीनियरिंग और प्राकृतिक और सामाजिक विकास में घटनाओं के अनुक्रम सहित प्रतीकात्मक श्रृंखला के डेटा सहित कई अनुप्रयोग हैं।

क्योंकि जैविक अनुक्रम जटिल अर्थ अर्थ देते हैं और कई चुनौतीपूर्ण शोध समस्याएं उत्पन्न करते हैं, अधिकांश जांच जैव सूचना विज्ञान के अनुप्रयोग में निर्देशित होती हैं।

जैविक अनुक्रमों का संरेखण

जैविक अनुक्रम न्यूक्लियोटाइड या अमीनो एसिड के अनुक्रम को परिभाषित करते हैं। जैविक अनुक्रम विश्लेषण जैविक अनुक्रमों की तुलना करता है, संरेखित करता है, अनुक्रमित करता है और अध्ययन करता है और इसलिए जैव सूचना विज्ञान और वर्तमान जीव विज्ञान में एक आवश्यक भूमिका निभाता है।

अनुक्रम संरेखण इस तथ्य पर निर्भर करता है कि सभी जीवित जीव विकास से जुड़े हैं। यह इंगित करता है कि न्यूक्लियोटाइड (डीएनए, आरएनए) और प्रजातियों के प्रोटीन अनुक्रम जो विकास में एक दूसरे के करीब हैं, उच्च समानताएं प्रदर्शित करनी चाहिए। एक संरेखण एक अधिकतम पहचान स्तर प्राप्त करने के लिए अनुक्रमों को पंक्तिबद्ध करने की प्रक्रिया है, जो अनुक्रमों के बीच समानता की डिग्री को भी परिभाषित करता है।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. डेटा माइनिंग में आउटलेयर कितने प्रकार के होते हैं?

    डेटा माइनिंग में विभिन्न प्रकार के आउटलेयर हैं जो इस प्रकार हैं - वैश्विक आउटलेयर - किसी दिए गए डेटा सेट में, एक डेटा ऑब्जेक्ट एक वैश्विक बाहरी होता है यदि वह बाकी जानकारी सेट से अनिवार्य रूप से विचलित हो जाता है। वैश्विक आउटलेयर को बिंदु विसंगतियों के रूप में जाना जाता है, और सबसे आसान प्रकार के आ

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।