इस ट्यूटोरियल में, हम pandas . जैसे मॉड्यूल का उपयोग करके डेटा विश्लेषण और विज़ुअलाइज़ेशन के बारे में जानेंगे और matplotlib पायथन . में . डेटा विश्लेषण चीजों के लिए पायथन एक उत्कृष्ट फिट है। मॉड्यूल स्थापित करें पांडा और matplotlib निम्न आदेशों का उपयोग करते हुए।
pip install pandas
pip install matplotlib
इंस्टॉलेशन प्रक्रिया पूरी होने के बाद आपको एक सक्सेस मैसेज मिलेगा। हम सबसे पहले पंडों . के बारे में जानेंगे और फिर matplotlib . देखेंगे ।
पांडा
पांडस पायथन की एक ओपन-सोर्स लाइब्रेरी है जो डेटा विश्लेषण उपकरण प्रदान करती है। हम पंडों . से कुछ उपयोगी तरीके देखने जा रहे हैं डेटा विश्लेषण के लिए।
डेटाफ़्रेम बनाना
DataFrame . बनाने के लिए हमें कई पंक्तियों की आवश्यकता है . आइए देखें कि यह कैसे करना है।
उदाहरण
# importing the pands package import pandas as pd # creating rows hafeez = ['Hafeez', 19] aslan = ['Aslan', 21] kareem = ['Kareem', 18] # pass those Series to the DataFrame # passing columns as well data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age']) # displaying the DataFrame print(data_frame)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
Name Age 0 Hafeez 19 1 Aslan 21 2 Kareem 18
पांडा का उपयोग करके डेटा आयात करना
लिंक पर जाएं और डाउनलोड करें सीएसवी फ़ाइल। सीएसवी . में डेटा अल्पविराम (,) से अलग पंक्तियों में होगा। आइए देखें कि पंडों . का उपयोग करके डेटा को कैसे आयात और उपयोग किया जाए ।
उदाहरण
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # displaying the first 5 rows using data.head() method print(data.head())
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
आइए देखें कि आकृति चर का उपयोग करके कितनी पंक्तियाँ और स्तंभ हैं।
उदाहरण
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.shape)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
(29, 16)
हमारे पास वर्णन () . नामक एक विधि है जो NaN . को छोड़कर विभिन्न आंकड़ों की गणना करता है . आइए इसे एक बार देखें।
उदाहरण
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.describe())
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
डेटा प्लॉटिंग
हमारे पास पैकेज है matplotlib डेटा का उपयोग करके ग्राफ बनाने के लिए। आइए देखें कि matplotlib . का उपयोग करके विभिन्न प्रकार के ग्राफ़ कैसे बनाएं ।
उदाहरण
# importing the pyplot module to create graphs import matplotlib.pyplot as plot # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # creating a histogram of Time period data['Time period'].hist(bins = 10)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>
हम matplotlib . का उपयोग करके विभिन्न प्रकार के ग्राफ़ बना सकते हैं पैकेज।
निष्कर्ष
यदि आपको ट्यूटोरियल के बारे में कोई संदेह है, तो उनका टिप्पणी अनुभाग में उल्लेख करें।