Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग मॉडल के प्रकार क्या हैं?

<घंटा/>

डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के लिए तार्किक और सहायक दोनों तरह के नए तरीकों में रिकॉर्ड को सारांशित करना है।

डेटा माइनिंग तकनीकों का उपयोग तीन प्रकार के कार्यों के लिए तीन प्रकार के मॉडल बनाने के लिए किया जा सकता है जैसे वर्णनात्मक प्रोफाइलिंग, निर्देशित प्रोफाइलिंग और भविष्यवाणी।

विवरणात्मक रूपरेखा - वर्णनात्मक मॉडल परिभाषित करता है कि रिकॉर्ड में क्या है। आउटपुट कई चार्ट या संख्या या ग्राफिक्स है जो परिभाषित करता है कि क्या हो रहा है। परिकल्पना परीक्षण वर्णनात्मक मॉडल बनाता है। दूसरे शब्दों में, जब मॉडल का निर्माण किया जा रहा हो, तो निर्देशित रूपरेखा और भविष्यवाणी दोनों का एक उद्देश्य होता है।

प्रोफाइलिंग मॉडल में, फोकस इनपुट के समान समय सीमा से होता है। भविष्य कहनेवाला मॉडल में, फोकस अगली समय सीमा से होता है। भविष्यवाणी एक अवधि से डेटा में खोज डिजाइनों को परिभाषित करती है जो अगली अवधि में परिणामों को परिभाषित करने में सक्षम हैं। प्रोफाइलिंग और भविष्यवाणी के बीच अंतर को तीव्र करने का कारण यह है कि इसका मॉडलिंग पद्धति के साथ संबंध है, विशेष रूप से मॉडल सेट के निर्माण में समय का विश्लेषण।

निर्देशित प्रोफाइलिंग - प्रोफाइलिंग कई समस्याओं के लिए एक परिचित तरीका है। इसमें किसी परिष्कृत डेटा विश्लेषण को शामिल करने की आवश्यकता नहीं है। उदाहरण के लिए, सर्वेक्षण ग्राहक प्रोफाइल बनाने का एक सामान्य तरीका है। सर्वेक्षण से पता चलता है कि ग्राहक और संभावनाएं कैसी दिखती हैं, या कम से कम सर्वेक्षण के उत्तरदाताओं के सवालों के जवाब देने का तरीका।

प्रोफाइल अक्सर जनसांख्यिकीय चरों पर आधारित होते हैं, जैसे भौगोलिक स्थान, लिंग और आयु। चूंकि विज्ञापन इन्हीं चरों के अनुसार बेचे जाते हैं, जनसांख्यिकीय प्रोफाइल सीधे मीडिया रणनीतियों में बदल सकते हैं।

भविष्यवाणी - अतीत में क्या हुआ, इसका वर्णन करने के लिए प्रोफाइलिंग अतीत के डेटा का उपयोग करती है। भविष्यवाणी एक कदम आगे जाती है। भविष्य में क्या होने की संभावना है, इसका अनुमान लगाने के लिए भविष्यवाणी अतीत के डेटा का उपयोग करती है। यह जानकारी का गतिशील उपयोग है।

जबकि कम भंडारण शेष और सीडी स्वामित्व के बीच संबंध सीडी धारकों के प्रोफाइल में फायदेमंद नहीं हो सकता है, एक उच्च भंडारण शेष होने की संभावना (अन्य संकेतकों के संयोजन में) भविष्य की सीडी खरीद का एक भविष्यवक्ता है।

यह एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा है जिसमें मॉडल इनपुट या भविष्यवक्ताओं और मॉडल आउटपुट के बीच समय में अलगाव की आवश्यकता होती है, भविष्यवाणी की जाने वाली चीज। यदि यह विभाजन समर्थित नहीं है, तो मॉडल काम नहीं करेगा।


  1. खनन अनुक्रम डेटा के प्रकार क्या हैं?

    अनुक्रम घटनाओं की एक क्रमबद्ध सूची है। घटनाओं की विशेषताओं के आधार पर अनुक्रमों को तीन समूहों में विभाजित किया जा सकता है, जिन्हें वे निम्नानुसार परिभाषित करते हैं - समय-श्रृंखला डेटा में समानता खोज एक समय-श्रृंखला डेटा सेट में समय की बार-बार गणना पर प्राप्त पूर्णांक मानों के अनुक्रम शामिल होते ह

  1. डेटा माइनिंग में आउटलेयर कितने प्रकार के होते हैं?

    डेटा माइनिंग में विभिन्न प्रकार के आउटलेयर हैं जो इस प्रकार हैं - वैश्विक आउटलेयर - किसी दिए गए डेटा सेट में, एक डेटा ऑब्जेक्ट एक वैश्विक बाहरी होता है यदि वह बाकी जानकारी सेट से अनिवार्य रूप से विचलित हो जाता है। वैश्विक आउटलेयर को बिंदु विसंगतियों के रूप में जाना जाता है, और सबसे आसान प्रकार के आ

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।