Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> प्रोग्रामिंग

ROC क्या है?

<घंटा/>

ROC,रिसीवर ऑपरेटिंग विशेषता वक्र के लिए खड़ा है। यह वास्तविक सकारात्मक दर और क्लासिफायरियर की झूठी सकारात्मक दर के बीच ट्रेडऑफ दिखाने के लिए एक ग्राफिकल विधि है। ROC वक्र में, वास्तविक धनात्मक दर (TPR) को g अक्ष के आगे आलेखित किया जाता है और r अक्ष पर झूठी धनात्मक दर (FPR) प्रदर्शित की जाती है। प्रत्येक बिंदु आगे वक्र क्लासिफायर द्वारा मनाए गए मॉडलों में से एक से संबंधित है।

आरओसी वक्र के साथ कई महत्वपूर्ण बिंदु हैं जिनकी प्रसिद्ध व्याख्याएं हैं -

(टीपीआर:ओ, एफपीआर:0) - मॉडल हर उदाहरण को एक नकारात्मक वर्ग होने की भविष्यवाणी करता है।

(TPR:l, FPR:I) - मॉडल प्रत्येक उदाहरण को सकारात्मक वर्ग होने की भविष्यवाणी करता है।

(टीपीआर:एल, एफपीआर:ओ) - आदर्श मॉडल।

सर्वोत्तम वर्गीकरण मॉडल को ऊपर बाईं ओर लागू के रूप में करीब रखा जाना चाहिए, जबकि एक मॉडल जो यादृच्छिक अनुमान लगाता है, उसे मुख्य विकर्ण के साथ रहना चाहिए, बिंदुओं को जोड़ना (TPR:0,FPR:0) और (TPR:I,FPR:1))। रैंडम अनुमान यह परिभाषित करता है कि एक रिकॉर्ड को एक निश्चित प्रायिकता p के साथ एक सकारात्मक वर्ग के रूप में परिभाषित किया जाता है, भले ही इसकी विशेषता सेट कुछ भी हो।

यह एक आरओसी वक्र खींच सकता है, क्लासिफायर एक निरंतर-मूल्यवान आउटपुट बनाने में सक्षम होना चाहिए जिसका उपयोग इसकी भविष्यवाणियों को रैंक करने के लिए किया जा सकता है, सबसे संभावित डेटा को सकारात्मक वर्ग के रूप में परिभाषित करने के लिए कम से कम संभावित डेटा के रूप में परिभाषित किया जा सकता है। ये आउटपुट बायेसियन क्लासिफायर या कृत्रिम तंत्रिका नेटवर्क द्वारा विकसित संख्यात्मक-मूल्यवान आउटपुट द्वारा उत्पादित पश्च संभावनाओं से संबंधित हो सकते हैं। आरओसी वक्र बनाने के लिए निम्नलिखित प्रक्रिया का उपयोग किया जा सकता है -

यह विचार कर रहा है कि सकारात्मक वर्ग के लिए निरंतर-मूल्यवान आउटपुट का प्रतिनिधित्व किया जाता है, परीक्षण डेटा को उनके आउटपुट मानों की बढ़ती श्रृंखला में क्रमबद्ध करता है।

यह निम्नतम-रैंक परीक्षण डेटा (यानी, निम्नतम आउटपुट मान वाला डेटा) चुन सकता है। यह चयनित डेटा और इसके बाद रैंक किए गए लोगों को सकारात्मक वर्ग में असाइन कर सकता है। यह विधि सभी परीक्षण डेटा को सकारात्मक वर्ग के रूप में परिभाषित करने के समान है। क्योंकि सभी सकारात्मक उदाहरणों को सही ढंग से परिभाषित किया गया है और नकारात्मक उदाहरणों को गलत वर्गीकृत किया गया है, TPR:FPR:I.

यह क्रमबद्ध सूची से अगले परीक्षण डेटा का चयन कर सकता है। यह चयनित डेटा और इसके बाद रैंक करने वालों को सकारात्मक के रूप में परिभाषित करता है, जबकि इसके तहत रैंक किए गए लोगों को नकारात्मक के रूप में परिभाषित करता है। यह पहले से चयनित डेटा के वास्तविक वर्ग लेबल का निर्धारण करके टीपी और एफपी की संख्या को ताज़ा कर सकता है।

यदि पहले से चयनित डेटा एक सकारात्मक वर्ग है, तो टीपी की संख्या कम हो जाती है और एफपी की संख्या पहले की तरह ही रहती है। यदि पूर्व चयनित डेटा एक नकारात्मक वर्ग है, तो FP की संख्या कम हो जाती है और TP की संख्या पहले की तरह ही रहती है।

चरण 3 को दोहराएं और टीपी और एफपी गणनाओं को तदनुसार रीफ्रेश करें जब तक कि सबसे बड़े रैंक वाले परीक्षण डेटा का चयन न हो जाए।

यह टीपीआर को क्लासिफायरियर के एफपीआर के विपरीत पा सकता है।


  1. डेटा वेयरहाउस का डिज़ाइन क्या है?

    डेटा वेयरहाउसिंग एक ऐसा दृष्टिकोण है जो व्यवसाय को एक महत्वपूर्ण व्यावसायिक अंतर्दृष्टि का समर्थन करने के लिए कई स्रोतों से जानकारी एकत्र और प्रबंधित कर सकता है। एक डेटा वेयरहाउस विशेष रूप से समर्थन प्रबंधन निर्णयों के लक्ष्यों के लिए बनाया गया है। एक डेटा वेयरहाउस एक डेटाबेस को परिभाषित करता है जि

  1. ROC कर्व्स क्या है?

    ROC,रिसीवर ऑपरेटिंग विशेषता के लिए खड़ा है। आरओसी वक्र दो वर्गीकरण मॉडल के विश्लेषण के लिए एक सुविधाजनक दृश्य उपकरण हैं। आरओसी वक्र सिग्नल डिटेक्शन थ्योरी से प्रकट होते हैं जो द्वितीय विश्व युद्ध के दौरान रडार छवियों की खोज के लिए तैयार किया गया था। एक आरओसी वक्र किसी दिए गए मॉडल के लिए वास्तविक सक

  1. स्टेग्नोग्राफ़ी के क्या प्रयोग हैं?

    स्टेग्नोग्राफ़ी डेटा छिपाने की कला है और एम्बेडेड डेटा के अस्तित्व को छिपाने का प्रयास है। यह क्रिप्टोग्राफी की तुलना में संदेश को सुरक्षित करने की एक बेहतर विधि के रूप में कार्य करता है जो केवल संदेश की सामग्री को छुपाता है संदेश के अस्तित्व को नहीं। मूल संदेश वाहक के भीतर इस तरह से दिखाई नहीं दे