Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

विसंगतियों के कारण क्या हैं?

<घंटा/>

विसंगति का पता लगाने में, उद्देश्य उन वस्तुओं की खोज करना है जो कई वस्तुओं से भिन्न हैं। अक्सर, विषम वस्तुओं को आउटलेयर के रूप में संदर्भित किया जाता है, क्योंकि डेटा के स्कैटर प्लॉट पर, वे कई डेटा बिंदुओं से बहुत दूर होते हैं। विसंगति का पता लगाने को विचलन का पता लगाना कहा जाता है, क्योंकि विषम वस्तुओं में विशेषता मान होते हैं जो अनिवार्य रूप से अपेक्षित या सामान्य विशेषता मानों से विचलित होते हैं, या अपवाद खनन के रूप में, क्योंकि विसंगतियां कई अर्थों में असाधारण हैं।

ग्लोब, मानव समाज, या डेटा समूहों के डोमेन में, अधिकांश घटनाएं और वस्तुएं प्रतिनिधित्व, सामान्य क्षेत्र या रेगलर द्वारा होती हैं। लेकिन यह उन वस्तुओं की व्यवहार्यता का गहन ज्ञान हो सकता है जो अलग या असाधारण हैं। इसमें असाधारण रूप से शुष्क या बरसात के मौसम, लोकप्रिय एथलीट, या एक विशेषता मान शामिल है जो अन्य सभी की तुलना में बहुत छोटा या अधिक है।

विसंगतियों के कुछ कारण हैं जो इस प्रकार हैं -

विभिन्न वर्गों का डेटा - एक वस्तु कई वस्तुओं से भिन्न हो सकती है जैसे कि विषम, क्योंकि यह एक से अधिक प्रकार या वर्ग की होती है। उदाहरण के लिए, क्रेडिट कार्ड धोखाधड़ी करने वाला कोई व्यक्ति क्रेडिट कार्ड उपयोगकर्ताओं के एक से अधिक वर्ग से संबंधित है, उन व्यक्तियों की तुलना में जिन्हें क्रेडिट कार्ड की सटीक आवश्यकता है।

धोखाधड़ी, घुसपैठ, बीमारी का प्रकोप और असामान्य परीक्षण के परिणाम जैसे प्रदर्शित कुछ उदाहरण विसंगतियों के उदाहरण हैं जो तत्वों के एक अलग वर्ग को परिभाषित करते हैं। इस तरह की विसंगतियां काफी रुचिकर हैं और डेटा माइनिंग के क्षेत्र में विसंगतियों की पहचान का लक्ष्य हैं।

प्राकृतिक विविधता - कुछ डेटा सेट को सांख्यिकीय वितरण द्वारा मॉडल किया जा सकता है, जिसमें एक सामान्य (गॉसियन) वितरण शामिल है, जहां वितरण के बीच से ऑब्जेक्ट की दूरी बढ़ने पर डेटा ऑब्जेक्ट की संभावना तेजी से कम हो जाती है।

दूसरे शब्दों में, कुछ वस्तुएँ एक केंद्र (औसत वस्तु) के पास होती हैं और इस औसत वस्तु से एक वस्तु के अनिवार्य रूप से भिन्न होने की संभावना कम होती है। उदाहरण के लिए, एक असाधारण रूप से लंबा व्यक्ति वस्तुओं के एक स्वतंत्र वर्ग से होने के तरीके में असंगत नहीं है, बल्कि केवल कुछ वस्तुओं द्वारा उपभोग की गई विशेषता (ऊंचाई) के लिए पूर्ण मूल्य रखने की विधि में है। गंभीर या असंभावित विविधताओं को परिभाषित करने वाली विसंगतियां दिलचस्प हैं।

डेटा मापन और संग्रहण त्रुटियां - डेटा सेट या माप प्रक्रिया में त्रुटियां विसंगतियों का एक अन्य कारण हैं। उदाहरण के लिए, कंप्यूटिंग डिवाइस में मानवीय त्रुटि की समस्या या शोर की उपस्थिति के कारण माप को गलत तरीके से रिकॉर्ड किया जा सकता है।

उद्देश्य ऐसी विसंगतियों को दूर करना है, क्योंकि वे किसी दिलचस्प डेटा का समर्थन नहीं करते हैं, लेकिन केवल डेटा की विशेषता और बाद के डेटा विश्लेषण को कम करते हैं। वास्तव में, इस प्रकार की विसंगति को हटाना डेटा प्रीप्रोसेसिंग, विशेष रूप से डेटा सफाई का लक्ष्य है।


  1. डेटा माइनिंग इंटरफेस क्या हैं?

    डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी क

  1. डेटा अखंडता के प्रकार क्या हैं?

    डेटाबेस अखंडता संग्रहीत जानकारी की वैधता और स्थिरता को परिभाषित करती है। अखंडता को आम तौर पर बाधाओं के संदर्भ में परिभाषित किया जाता है, जो स्थिरता नियम हैं जिनका डेटाबेस को उल्लंघन करने की अनुमति नहीं है। बाधाएं प्रत्येक विशेषता पर लागू हो सकती हैं या वे तालिकाओं के बीच संबंधों पर लागू हो सकती हैं।

  1. स्टेग्नोग्राफ़ी के आवेदन क्या हैं?

    स्टेग्नोग्राफ़ी को स्पष्ट रूप से हानिरहित संदेशों के भीतर संदेशों को एम्बेड करके डेटा छिपाने की कला और विज्ञान के रूप में भी दर्शाया गया है। स्टेग्नोग्राफ़ी नियमित कंप्यूटर फ़ाइलों में बेकार या अप्रयुक्त जानकारी के बिट्स को पुनर्स्थापित करके काम करती है। यह छिपा हुआ डेटा प्लेन टेक्स्ट या सिफर टेक्स्