Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

अनुक्रमिक पैटर्न खनन क्या है?

<घंटा/>

अनुक्रमिक पैटर्न माइनिंग पैटर्न के रूप में बार-बार दिखने वाली श्रृंखला की घटनाओं या बाद के दृश्यों का खनन है। अनुक्रमिक पैटर्न का एक उदाहरण है जो उपयोगकर्ता कैनन डिजिटल कैमरा खरीदते हैं उन्हें एक महीने के भीतर एक एचपी रंग प्रिंटर खरीदना होता है।

खुदरा जानकारी के लिए, शेल्फ प्लेसमेंट और प्रचार के लिए अनुक्रमिक पैटर्न फायदेमंद होते हैं। यह उद्योग, और दूरसंचार और विभिन्न व्यवसाय, लक्षित विपणन, उपयोगकर्ता प्रतिधारण और कई कार्यों के लिए अनुक्रमिक पैटर्न का भी उपयोग कर सकते हैं।

ऐसे कई क्षेत्र हैं जिनमें अनुक्रमिक पैटर्न का उपयोग किया जा सकता है जैसे वेब एक्सेस पैटर्न विश्लेषण, मौसम पूर्वानुमान, उत्पादन प्रक्रियाएं, और वेब घुसपैठ का पता लगाना।

अनुक्रमों के एक सेट को देखते हुए, जहां प्रत्येक अनुक्रम में घटनाओं (या तत्वों) की एक फ़ाइल शामिल होती है और प्रत्येक घटना में वस्तुओं का एक समूह शामिल होता है, और एक उपयोगकर्ता द्वारा निर्दिष्ट न्यूनतम न्यूनतम समर्थन की सीमा प्रदान करता है, अनुक्रमिक पैटर्न खनन सभी लगातार बाद की खोज करता है, अर्थात, अनुक्रमों के समूह में जिनकी आवृत्ति आवृत्ति min_sup से कम नहीं है।

मान लीजिए मैं ={मैं<उप>1 , मैं<उप>2 ,..., मैं<उप>पी } सभी मदों का समुच्चय हो। एक आइटमसेट आइटम का एक गैर-रिक्त सेट है। एक क्रम घटनाओं की एक क्रमबद्ध श्रृंखला है। अनुक्रम s इंगित किया गया है {e1 , ई<उप>2 , ई<उप>3 ... ई<उप>एल } जहां ईवेंट e1 e2 . से पहले दिखाई देता है , जो e3 . से पहले दिखाई देता है , आदि इवेंट ईj s के तत्व के रूप में भी जाना जाता है।

उपयोगकर्ता खरीद जानकारी के मामले में, एक घटना एक खरीदारी यात्रा को परिभाषित करती है जिसमें एक ग्राहक एक विशिष्ट स्टोर पर आइटम खरीदता है। घटना एक आइटमसेट है, यानी, उन वस्तुओं की एक अनियंत्रित सूची जिसे ग्राहक ने यात्रा के दौरान खरीदा था। आइटमसेट (या ईवेंट) इंगित किया गया है (x1 x<उप>2 ···x<उप>क्यू ), जहां xk एक आइटम है।

अनुक्रम की घटना में एक आइटम केवल एक बार प्रकट हो सकता है, लेकिन अनुक्रम की विभिन्न घटनाओं में कई बार प्रकट हो सकता है। एक क्रम में मदों के कई उदाहरणों को अनुक्रम की लंबाई के रूप में जाना जाता है। लंबाई l वाले अनुक्रम को l-अनुक्रम के रूप में जाना जाता है।

एक अनुक्रम डेटाबेस, एस, टुपल्स का एक समूह है, (एसआईडी, एस), जहां एसआईडी एक अनुक्रम_आईडी है और एस एक अनुक्रम है। उदाहरण के लिए, S में स्टोर के सभी उपयोगकर्ताओं के लिए अनुक्रम शामिल हैं। एक टपल (SID, s) में एक अनुक्रम α शामिल होता है, यदि α s के बाद का क्रम है।

अनुक्रमिक पैटर्न खनन का यह चरण उपयोगकर्ता-खरीदारी अनुक्रम विश्लेषण का एक सार है। इस तरह के रिकॉर्ड पर अनुक्रमिक पैटर्न खनन के लिए स्केलेबल तकनीकें इस प्रकार हैं -

कई अनुक्रमिक पैटर्न खनन अनुप्रयोगों को इस चरण द्वारा कवर नहीं किया जा सकता है। उदाहरण के लिए, वेब क्लिकस्ट्रीम श्रृंखला का विश्लेषण करते समय, क्लिकों के बीच अंतराल आवश्यक हो जाता है यदि किसी को यह अनुमान लगाने की आवश्यकता होती है कि अगला क्लिक क्या हो सकता है।

डीएनए अनुक्रम विश्लेषण में, अनुमानित पैटर्न सहायक हो जाते हैं क्योंकि डीएनए अनुक्रमों में शामिल (प्रतीक) सम्मिलन, विलोपन और उत्परिवर्तन शामिल हो सकते हैं। इस तरह की विविध आवश्यकताओं को बाधा छूट या आवेदन के रूप में माना जा सकता है।


  1. खनन अनुक्रम डेटा के प्रकार क्या हैं?

    अनुक्रम घटनाओं की एक क्रमबद्ध सूची है। घटनाओं की विशेषताओं के आधार पर अनुक्रमों को तीन समूहों में विभाजित किया जा सकता है, जिन्हें वे निम्नानुसार परिभाषित करते हैं - समय-श्रृंखला डेटा में समानता खोज एक समय-श्रृंखला डेटा सेट में समय की बार-बार गणना पर प्राप्त पूर्णांक मानों के अनुक्रम शामिल होते ह

  1. Spatiotemporal डेटा माइनिंग क्या है?

    Spatiotemporal डेटा माइनिंग, spatiotemporal डेटा से पैटर्न और ज्ञान खोजने की प्रक्रिया को परिभाषित करता है। स्पोटियोटेम्पोरल डेटा माइनिंग के एक उदाहरण में शहरों और भूमि के विकास के इतिहास का पता लगाना, मौसम के डिजाइन को उजागर करना, भूकंप और तूफान की भविष्यवाणी करना और ग्लोबल वार्मिंग के रुझान तय करन

  1. सी # 7.0 में पैटर्न मिलान क्या है?

    C# 7.0 दो मामलों में पैटर्न मिलान का परिचय देता है, is एक्सप्रेशन और स्विचस्टेटमेंट। पैटर्न परीक्षण करते हैं कि किसी मान का एक निश्चित आकार होता है, और जब उसका मिलान आकार होता है तो वह मान से जानकारी निकाल सकता है। पैटर्न मिलान एल्गोरिदम के लिए अधिक संक्षिप्त सिंटैक्स प्रदान करता है आप किसी भी डे