डेटा माइनिंग
डेटा माइनिंग, पैटर्न मान्यता तकनीकों के साथ-साथ सांख्यिकीय और गणितीय तकनीकों का उपयोग करके, रिपॉजिटरी में संग्रहीत डेटा की एक बड़ी मात्रा के माध्यम से सार्थक नए सहसंबंधों, पैटर्न और प्रवृत्तियों की खोज करने की प्रक्रिया है। यह विश्लेषण है अनपेक्षित संबंधों को खोजने और डेटा को नए तरीकों से सारांशित करने के लिए अवलोकन संबंधी डेटासेट जो डेटा स्वामी के लिए समझने योग्य और उपयोगी दोनों हैं।
यह उन नियमितताओं या संबंधों की खोज करने के लिए बड़ी मात्रा में डेटा के चयन, अन्वेषण और मॉडलिंग की प्रक्रिया है जो डेटाबेस के मालिक के लिए स्पष्ट और लाभकारी परिणाम प्राप्त करने के लिए पहले अज्ञात हैं। डेटा माइनिंग सार्थक पैटर्न और नियमों की खोज के लिए बड़ी मात्रा में डेटा के स्वचालित या अर्ध-स्वचालित माध्यम से अन्वेषण और विश्लेषण की प्रक्रिया है।
डेटा माइनिंग डेटा साइंस के समान है। यह एक व्यक्ति द्वारा, एक विशिष्ट स्थिति में, एक विशेष डेटा सेट पर, एक उद्देश्य के साथ किया जाता है। इस प्रक्रिया में टेक्स्ट माइनिंग, वेब माइनिंग, ऑडियो और वीडियो माइनिंग, सचित्र डेटा माइनिंग और सोशल मीडिया माइनिंग जैसी विभिन्न प्रकार की सेवाएँ शामिल हैं। यह सॉफ्टवेयर के माध्यम से किया जाता है जो सरल या अत्यधिक विशिष्ट होता है।
मशीन लर्निंग
मशीन लर्निंग एक ऐसा दृष्टिकोण है जो विशाल डेटा प्रोसेसिंग के लिए जटिल एल्गोरिदम बनाता है और अपने उपयोगकर्ताओं को परिणामों का समर्थन करता है। यह जटिल कार्यक्रमों का उपयोग करता है जो अनुभव के माध्यम से समझ सकते हैं और भविष्यवाणियां कर सकते हैं।
प्रशिक्षण जानकारी के लगातार इनपुट द्वारा एल्गोरिदम में सुधार किया जाता है। मशीन लर्निंग का मुख्य उद्देश्य डेटा सीखना और डेटा से ऐसे मॉडल बनाना है जिन्हें इंसान समझ सकें और इस्तेमाल कर सकें।
मशीन लर्निंग दो प्रकार की होती है जो इस प्रकार है -
-
अनपर्यवेक्षित मशीन लर्निंग -अनपर्यवेक्षित शिक्षण परिणामों की भविष्यवाणी करने के लिए प्रशिक्षित डेटा सेट पर आधारित नहीं है, लेकिन यह क्लस्टरिंग और परिणामों की भविष्यवाणी करने से संबंधित प्रत्यक्ष तकनीकों का उपयोग करता है। प्रशिक्षित डेटा सेट को उस इनपुट के रूप में दर्शाया जाता है जिसके लिए आउटपुट जाना जाता है।
-
पर्यवेक्षित मशीन लर्निंग - पर्यवेक्षित शिक्षण एक शिक्षक के रूप में पर्यवेक्षक की उपस्थिति को परिभाषित करता है। पर्यवेक्षित शिक्षण एक सीखने की तकनीक है जिसमें यह अच्छी तरह से स्तरित डेटा का उपयोग करके मशीन को सिखा या प्रशिक्षित कर सकता है, जिसका अर्थ है कि कुछ जानकारी पहले से ही सही प्रतिक्रियाओं के साथ चिह्नित है। उसके बाद, मशीन को रिकॉर्ड के नए सेट के साथ समर्थित किया जाता है ताकि पर्यवेक्षित शिक्षण एल्गोरिदम प्रशिक्षण जानकारी का विश्लेषण करे और लेबल किए गए डेटा से सटीक परिणाम प्रदान करे।
आइए देखते हैं डाटा माइनिंग और मशीन लर्निंग के बीच तुलना
डेटा माइनिंग | मशीन लर्निंग |
---|---|
डेटा माइनिंग को डेटा में नॉलेज डिस्कवरी के रूप में भी जाना जाता है, जो लाखों रिकॉर्ड (विशेष रूप से संरचित डेटा) के बीच किसी भी विसंगतियों, सहसंबंधों, प्रवृत्तियों या पैटर्न की पहचान करने के लिए एक तकनीक है जो व्यवसाय के लिए सहायक हो सकती है। निर्णय लेने और पारंपरिक विश्लेषण के दौरान चूक गए होंगे। | मशीन लर्निंग एक ऐसी तकनीक है जो बड़े डेटा प्रोसेसिंग के लिए जटिल एल्गोरिदम बनाती है और अपने उपयोगकर्ताओं को परिणाम प्रदान करती है। यह जटिल कार्यक्रमों का उपयोग करता है जो अनुभव के माध्यम से समझ सकते हैं और भविष्यवाणियां कर सकते हैं। |
डेटा माइनिंग का मुख्य लक्ष्य जटिल गणितीय एल्गोरिदम का उपयोग करके उन तथ्यों या सूचनाओं को खोजना है जिन्हें पहले अनदेखा किया गया था या ज्ञात नहीं था। | मशीन लर्निंग का उद्देश्य जानकारी को समझना और डेटा से ऐसे मॉडल बनाना है जिन्हें इंसान समझ सकें और इस्तेमाल कर सकें। |
डेटा माइनिंग लाभकारी डेटा प्राप्त करने के लिए डेटाबेस, डेटावेयरहाउस सर्वर, डेटा माइनिंग इंजन और पैटर्न मूल्यांकन विधियों का उपयोग करता है। | मशीन लर्निंग निर्णय लेने के लिए तंत्रिका नेटवर्क, भविष्य कहनेवाला मॉडल और स्वचालित एल्गोरिदम का उपयोग करता है। |
इसका उपयोग सीमित क्षेत्रों में किया जा सकता है। | इसका उपयोग विशाल क्षेत्र में किया जा सकता है। |