Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

डेटा माइनिंग में आउटलेयर कितने प्रकार के होते हैं?

<घंटा/>

डेटा माइनिंग में विभिन्न प्रकार के आउटलेयर हैं जो इस प्रकार हैं -

वैश्विक आउटलेयर - किसी दिए गए डेटा सेट में, एक डेटा ऑब्जेक्ट एक वैश्विक बाहरी होता है यदि वह बाकी जानकारी सेट से अनिवार्य रूप से विचलित हो जाता है। वैश्विक आउटलेयर को बिंदु विसंगतियों के रूप में जाना जाता है, और सबसे आसान प्रकार के आउटलेयर हैं। सबसे बाहरी पता लगाने के तरीकों का उद्देश्य वैश्विक आउटलेर्स की खोज करना है।

यह वैश्विक आउटलेर्स की पहचान कर सकता है, एक महत्वपूर्ण मुद्दा प्रश्न में आवेदन से संबंधित विचलन के उचित माप की खोज करना है। कई माप प्रस्तावित हैं, और, इन पर निर्भर करता है, बाहरी पता लगाने के तरीकों को कई श्रेणियों में विभाजित किया जाता है।

कई अनुप्रयोगों में वैश्विक बाहरी पहचान आवश्यक है। कंप्यूटर नेटवर्क में घुसपैठ का पता लगाने पर विचार करें, उदाहरण के लिए, यदि कंप्यूटर का संचार व्यवहार सामान्य डिजाइनों से अलग है (उदाहरण के लिए, थोड़े समय में बड़ी संख्या में पैकेजों का विज्ञापन किया जाता है), तो इस व्यवहार को वैश्विक आउटलेयर के रूप में माना जा सकता है और संबंधित कंप्यूटर हैकिंग का एक संदिग्ध हताहत है।

प्रासंगिक आउटलेयर - प्रासंगिक आउटलेर्स को कंडीशनल आउटलेयर कहा जाता है। इस प्रकार के आउटलेयर तब प्रकट होते हैं जब कोई डेटा ऑब्जेक्ट किसी दिए गए डेटा सेट में कुछ निश्चित स्थिति के कारण कई डेटा बिंदुओं से विचलित होता है।

डेटा की वस्तुओं की दो प्रकार की विशेषताएँ होती हैं जिनमें प्रासंगिक विशेषताएँ और व्यवहार संबंधी विशेषताएँ शामिल हैं। प्रासंगिक बाहरी विश्लेषण उपयोगकर्ताओं को कई संदर्भों और स्थितियों में आउटलेयर निर्धारित करने की अनुमति देता है, जो कई अनुप्रयोगों में फायदेमंद हो सकता है।

व्यवहार विशेषताओं में, यह वस्तु की विशेषताओं का प्रतिनिधित्व कर सकता है, और यह गणना करने के लिए उपयोग किया जाता है कि क्या वस्तु उस संदर्भ में एक बाहरी है जिसे वह समझता है। तापमान के उदाहरण में, व्यवहार संबंधी विशेषताएं तापमान, नमी और दबाव हो सकती हैं।

प्रासंगिक आउटलेयर स्थानीय आउटलेर्स का एक सामान्यीकरण है, घनत्व-आधारित बाहरी विश्लेषण विधियों में पेश की गई एक अवधारणा। डेटा सेट में एक वस्तु एक स्थानीय बाहरी है यदि उसका घनत्व अनिवार्य रूप से उस स्थानीय क्षेत्र से विचलित होता है जिसमें वह दिखाई देता है।

वैश्विक बाहरी पहचान को प्रासंगिक बाहरी पहचान की एक विशेष विधि के रूप में चिंतित किया जा सकता है जहां प्रासंगिक विशेषताओं का समूह शून्य है। दूसरे शब्दों में, वैश्विक बाहरी पहचान को संदर्भ के रूप में संपूर्ण डेटा सेट की आवश्यकता होती है। प्रासंगिक बाहरी विश्लेषण उपयोगकर्ताओं के लिए लचीलेपन का समर्थन करता है जिसमें कोई भी कई संदर्भों में आउटलेयर निर्धारित कर सकता है, जो कई अनुप्रयोगों में वांछनीय हो सकता है।

सामूहिक आउटलेयर - किसी दिए गए डेटा सेट में, जब डेटा बिंदुओं का एक सेट बाकी जानकारी सेट से विचलित हो जाता है, तो इसे सामूहिक आउटलेयर के रूप में जाना जाता है। इसलिए, डेटा ऑब्जेक्ट का विशिष्ट सेट आउटलेयर नहीं हो सकता है, लेकिन जब यह डेटा ऑब्जेक्ट को समग्र रूप से मान सकता है, तो वे आउटलेयर के रूप में कार्य कर सकते हैं।

यह कई आउटलेयर के प्रकारों को पहचान सकता है, कई डेटा ऑब्जेक्ट्स द्वारा दिखाए गए आउटलेर्स के व्यवहार के बीच संबंध के बारे में पृष्ठभूमि डेटा के माध्यम से जाना आवश्यक है।


  1. खनन अनुक्रम डेटा के प्रकार क्या हैं?

    अनुक्रम घटनाओं की एक क्रमबद्ध सूची है। घटनाओं की विशेषताओं के आधार पर अनुक्रमों को तीन समूहों में विभाजित किया जा सकता है, जिन्हें वे निम्नानुसार परिभाषित करते हैं - समय-श्रृंखला डेटा में समानता खोज एक समय-श्रृंखला डेटा सेट में समय की बार-बार गणना पर प्राप्त पूर्णांक मानों के अनुक्रम शामिल होते ह

  1. आउटलेयर क्या हैं?

    एक बाहरी एक डेटा ऑब्जेक्ट है जो अनिवार्य रूप से बाकी वस्तुओं से अलग हो जाता है, जैसे कि इसे कई तंत्र द्वारा उत्पादित किया गया था। प्रस्तुति में आसानी के लिए, यह डेटा ऑब्जेक्ट्स को सामान्य या अपेक्षित जानकारी के रूप में परिभाषित कर सकता है जो बाहरी नहीं हैं। आमतौर पर, यह आउटलेर्स को असामान्य डेटा के

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।