इस ट्यूटोरियल में, हम pandas . जैसे मॉड्यूल का उपयोग करके डेटा विश्लेषण और विज़ुअलाइज़ेशन के बारे में जानेंगे और matplotlib पायथन . में . डेटा विश्लेषण चीजों के लिए पायथन एक उत्कृष्ट फिट है। मॉड्यूल स्थापित करें पांडा और matplotlib निम्न आदेशों का उपयोग करते हुए।
pip install pandas
pip install matplotlib
इंस्टॉलेशन प्रक्रिया पूरी होने के बाद आपको एक सक्सेस मैसेज मिलेगा। हम सबसे पहले पंडों . के बारे में जानेंगे और फिर matplotlib . देखेंगे ।
पांडा
पांडस पायथन की एक ओपन-सोर्स लाइब्रेरी है जो डेटा विश्लेषण उपकरण प्रदान करती है। हम पंडों . से कुछ उपयोगी तरीके देखने जा रहे हैं डेटा विश्लेषण के लिए।
डेटाफ़्रेम बनाना
DataFrame . बनाने के लिए हमें कई पंक्तियों की आवश्यकता है . आइए देखें कि यह कैसे करना है।
उदाहरण
# importing the pands package import pandas as pd # creating rows hafeez = ['Hafeez', 19] aslan = ['Aslan', 21] kareem = ['Kareem', 18] # pass those Series to the DataFrame # passing columns as well data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age']) # displaying the DataFrame print(data_frame)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
Name Age 0 Hafeez 19 1 Aslan 21 2 Kareem 18
पांडा का उपयोग करके डेटा आयात करना
लिंक पर जाएं और डाउनलोड करें सीएसवी फ़ाइल। सीएसवी . में डेटा अल्पविराम (,) से अलग पंक्तियों में होगा। आइए देखें कि पंडों . का उपयोग करके डेटा को कैसे आयात और उपयोग किया जाए ।
उदाहरण
# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# displaying the first 5 rows using data.head() method
print(data.head()) आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।

आइए देखें कि आकृति चर का उपयोग करके कितनी पंक्तियाँ और स्तंभ हैं।
उदाहरण
# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.shape) आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
(29, 16)
हमारे पास वर्णन () . नामक एक विधि है जो NaN . को छोड़कर विभिन्न आंकड़ों की गणना करता है . आइए इसे एक बार देखें।
उदाहरण
# importing pandas package
import pandas as pd
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# no. of rows and columns
print(data.describe()) आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।

डेटा प्लॉटिंग
हमारे पास पैकेज है matplotlib डेटा का उपयोग करके ग्राफ बनाने के लिए। आइए देखें कि matplotlib . का उपयोग करके विभिन्न प्रकार के ग्राफ़ कैसे बनाएं ।
उदाहरण
# importing the pyplot module to create graphs
import matplotlib.pyplot as plot
# importing the data using pd.read_csv() method
data = pd.read_csv('CountryData.IND.csv')
# creating a histogram of Time period
data['Time period'].hist(bins = 10) आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>

हम matplotlib . का उपयोग करके विभिन्न प्रकार के ग्राफ़ बना सकते हैं पैकेज।
निष्कर्ष
यदि आपको ट्यूटोरियल के बारे में कोई संदेह है, तो उनका टिप्पणी अनुभाग में उल्लेख करें।