26 बिग डेटा एनालिटिक तकनीकों में एक अंतर्दृष्टि:भाग 1

'बिग डेटा' डेटा के बहुत बड़े सेट को प्रोसेस करने के लिए विशेष तकनीकों और तकनीकों का अनुप्रयोग है। ये डेटा सेट अक्सर इतने बड़े और जटिल होते हैं कि ऑन-हैंड डेटाबेस प्रबंधन टूल का उपयोग करके इसे प्रोसेस करना मुश्किल हो जाता है।

सूचना प्रौद्योगिकी के क्रांतिकारी विकास ने उद्योग में कई पूरक स्थितियों को जन्म दिया है। सबसे लगातार और यकीनन सबसे वर्तमान परिणामों में से एक, बिग डेटा की उपस्थिति है। बिग डेटा शब्द एक पकड़-वाक्यांश है जिसे भारी मात्रा में डेटा की उपस्थिति का वर्णन करने के लिए गढ़ा गया था। इतनी बड़ी मात्रा में डेटा होने का परिणाम डेटा एनालिटिक्स है।

डेटा एनालिटिक्स बिग डेटा को संरचित करने की प्रक्रिया है। बिग डेटा के भीतर, अलग-अलग पैटर्न और सहसंबंध होते हैं जो डेटा एनालिटिक्स के लिए डेटा की बेहतर गणना करने के लिए संभव बनाते हैं। यह डेटा विश्लेषण को सूचना प्रौद्योगिकी के सबसे महत्वपूर्ण भागों में से एक बनाता है।

इसलिए, यहां मैं 26 बिग डेटा एनालिटिक्स तकनीकों को सूचीबद्ध कर रहा हूं। यह सूची किसी भी तरह से संपूर्ण नहीं है।

A/B परीक्षण

A/B परीक्षण यह पहचानने के लिए एक मूल्यांकन उपकरण है कि वेबपेज या ऐप का कौन सा संस्करण किसी संगठन या व्यक्ति को व्यावसायिक लक्ष्य को अधिक प्रभावी ढंग से पूरा करने में मदद करता है। यह निर्णय यह तुलना करके लिया जाता है कि किसी चीज़ का कौन सा संस्करण बेहतर प्रदर्शन करता है। A/B परीक्षण का उपयोग आमतौर पर वेब डेवलपमेंट में यह सुनिश्चित करने के लिए किया जाता है कि वेबपेज या पेज घटक में परिवर्तन डेटा द्वारा संचालित होते हैं न कि व्यक्तिगत राय से।

इसे स्पिल्ड टेस्टिंग या बकेट टेस्टिंग भी कहा जाता है।
1. एसोसिएशन रूल लर्निंग
  
  बड़े डेटाबेस में वेरिएबल्स के बीच दिलचस्प रिश्तों, यानी, "एसोसिएशन रूल्स" की खोज के लिए तकनीकों का एक सेट। इन तकनीकों में संभावित नियमों को उत्पन्न करने और उनका परीक्षण करने के लिए विभिन्न प्रकार के एल्गोरिदम शामिल हैं।
  
  एक एप्लिकेशन मार्केट बास्केट विश्लेषण है, जिसमें एक खुदरा विक्रेता यह निर्धारित कर सकता है कि कौन से उत्पाद अक्सर एक साथ खरीदे जाते हैं और मार्केटिंग के लिए इस जानकारी का उपयोग करते हैं। (आमतौर पर उद्धृत उदाहरण यह खोज है कि नाचोस खरीदने वाले कई सुपरमार्केट खरीदार बीयर भी खरीदते हैं।)
  1. वर्गीकरण वृक्ष विश्लेषण
    
    सांख्यिकीय वर्गीकरण उन श्रेणियों की पहचान करने का एक तरीका है जो एक नए अवलोकन से संबंधित हैं। इसके लिए सही ढंग से पहचाने गए अवलोकनों के प्रशिक्षण सेट की आवश्यकता होती है - दूसरे शब्दों में ऐतिहासिक डेटा।
    
    सांख्यिकीय वर्गीकरण का उपयोग इसके लिए किया जा रहा है:
    <उल शैली ="पाठ्य-संरेखण:औचित्य;">
  2. श्रेणियों को स्वचालित रूप से दस्तावेज़ असाइन करें
  3. जीवों को समूहों में वर्गीकृत करें
  4. ऑनलाइन पाठ्यक्रम लेने वाले छात्रों की प्रोफाइल विकसित करें