Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन पंडों का उपयोग करके डेटा विश्लेषण

इस ट्यूटोरियल में, हम पायथन पांडा लाइब्रेरी का उपयोग करके डेटा विश्लेषण देखने जा रहे हैं। पुस्तकालय पांडा C . में लिखे गए हैं . इसलिए, हमें गति के साथ कोई समस्या नहीं है। यह डेटा विश्लेषण के लिए प्रसिद्ध है। हमारे पास पंडों में दो प्रकार की डेटा भंडारण संरचनाएं हैं। वे श्रृंखला . हैं और डेटाफ़्रेम . आइए एक-एक करके देखते हैं।

1.श्रृंखला

श्रृंखला अनुकूलित सूचकांक और मूल्यों के साथ एक 1D सरणी है। हम pandas.Series(data, index) . का उपयोग करके एक सीरीज ऑब्जेक्ट बना सकते हैं कक्षा। श्रृंखला डेटा के रूप में पूर्णांकों, सूचियों, शब्दकोशों को लेगी। आइए कुछ उदाहरण देखें।

उदाहरण

# importing the pandas library
import pandas as pd
# data
data = [1, 2, 3]
# creating Series object
# Series automatically takes the default index
series = pd.Series(data)
print(series)

आउटपुट

यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

0 1
1 2
2 3
dtype: int64

एक अनुकूलित अनुक्रमणिका कैसे प्राप्त करें? उदाहरण देखें।

उदाहरण

# importing the pandas library
import pandas as pd
# data
data = [1, 2, 3]
# index
index = ['a', 'b', 'c']
# creating Series object
series = pd.Series(data, index)
print(series)

आउटपुट

यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

a 1
b 2
c 3
dtype: int64

जब हम डेटा को शब्दकोश के रूप में श्रृंखला . को देते हैं वर्ग, फिर यह कुंजी को सूचकांक के रूप में और मूल्यों को वास्तविक डेटा के रूप में लेता है। आइए एक उदाहरण देखें।

उदाहरण

# importing the pandas library
import pandas as pd
# data
data = {'a':97, 'b':98, 'c':99}
# creating Series object
series = pd.Series(data)
print(series)

आउटपुट

यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।

a 97
b 98
c 99
dtype: int64

हम एक इंडेक्स का उपयोग करके श्रृंखला से डेटा तक पहुंच सकते हैं। आइए उदाहरण देखें।

उदाहरण

# importing the pandas library
import pandas as pd
# data
data = {'a':97, 'b':98, 'c':99}
# creating Series object
series = pd.Series(data)
# accessing the data from the Series using indexes
print(series['a'], series['b'], series['c'])

आउटपुट

यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

97 98 99

2.पांडा

हमारे पास पांडा में सीरीज क्लास का उपयोग कैसे करें। आइए देखें कि डेटाफ़्रेम का उपयोग कैसे करें कक्षा। डेटाफ़्रेम पांडा में डेटा संरचना वर्ग जिसमें पंक्तियाँ और स्तंभ होते हैं।

हम DataFrame create बना सकते हैं सूचियों, शब्दकोशों, शृंखलाओं, . का उपयोग करने वाली वस्तुएं आदि.., आइए सूचियों का उपयोग करके DataFrame बनाएं।

उदाहरण

# importing the pandas library
import pandas as pd
# lists
names = ['Tutorialspoint', 'Mohit', 'Sharma']
ages = [25, 32, 21]
# creating a DataFrame
data_frame = pd.DataFrame({'Name': names, 'Age': ages})
# printing the DataFrame
print(data_frame)

आउटपुट

यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।

               Name    Age
0    Tutorialspoint    25
1             Mohit    32
2            Sharma    21

आइए देखें कि श्रृंखला का उपयोग करके डेटा फ़्रेम ऑब्जेक्ट कैसे बनाया जाता है।

उदाहरण

# importing the pandas library
import pandas as pd
# Series
_1 = pd.Series([1, 2, 3])
_2 = pd.Series([1, 4, 9])
_3 = pd.Series([1, 8, 27])
# creating a DataFrame
data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3})
# printing the DataFrame
print(data_frame)

आउटपुट

यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

   a  b  c
0  1  1  1
1  2  4  8
2  3  9  27

हम डेटा को DataFrames . से एक्सेस कर सकते हैं कॉलम नाम का उपयोग करना। आइए एक उदाहरण देखें।

उदाहरण

# importing the pandas library
import pandas as pd
# Series
_1 = pd.Series([1, 2, 3])
_2 = pd.Series([1, 4, 9])
_3 = pd.Series([1, 8, 27])
# creating a DataFrame
data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3})
# accessing the entire column with name 'a'
print(data_frame['a'])

आउटपुट

यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।

0 1
1 2
2 3
Name: a, dtype: int64

निष्कर्ष

यदि आपको ट्यूटोरियल में कोई संदेह है, तो उनका टिप्पणी अनुभाग में उल्लेख करें।


  1. पायथन में डेटा विश्लेषण और विज़ुअलाइज़ेशन?

    पायथन डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए मुख्य रूप से सुन्न, पांडा, मैटप्लोटलिब, सीबॉर्न आदि के लिए कई पुस्तकालय प्रदान करता है। इस खंड में, हम डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए पांडा पुस्तकालय पर चर्चा करने जा रहे हैं, जो एक खुला स्रोत पुस्तकालय है जो सुन्न के ऊपर बनाया गया है। यह हमें ते

  1. बेस 64 डेटा एन्कोडिंग पायथन का उपयोग कर रहा है

    बेस 64 मॉड्यूल में फ़ंक्शन बाइनरी डेटा को प्लेनटेक्स्ट प्रोटोकॉल का उपयोग करके ट्रांसमिशन के लिए उपयुक्त ASCII के सबसेट में अनुवाद करते हैं। एन्कोडिंग और डिकोडिंग फ़ंक्शन RFC 3548 में विनिर्देशों को लागू करते हैं, जो बेस16, बेस32, और बेस64 एल्गोरिदम को परिभाषित करता है, और वास्तविक मानक Ascii85 और

  1. पायथन में खोजपूर्ण डेटा विश्लेषण

    डेटा विश्लेषण के लिए, खोजपूर्ण डेटा विश्लेषण (ईडीए) आपका पहला कदम होना चाहिए। खोजपूर्ण डेटा विश्लेषण हमें − . में मदद करता है डेटा सेट में अंतर्दृष्टि देने के लिए। अंतर्निहित संरचना को समझें। महत्वपूर्ण पैरामीटर और उनके बीच संबंध निकालें। अंतर्निहित मान्यताओं का परीक्षण करें। नमूना डेट