इस ट्यूटोरियल में, हम पायथन पांडा लाइब्रेरी का उपयोग करके डेटा विश्लेषण देखने जा रहे हैं। पुस्तकालय पांडा C . में लिखे गए हैं . इसलिए, हमें गति के साथ कोई समस्या नहीं है। यह डेटा विश्लेषण के लिए प्रसिद्ध है। हमारे पास पंडों में दो प्रकार की डेटा भंडारण संरचनाएं हैं। वे श्रृंखला . हैं और डेटाफ़्रेम . आइए एक-एक करके देखते हैं।
1.श्रृंखला
श्रृंखला अनुकूलित सूचकांक और मूल्यों के साथ एक 1D सरणी है। हम pandas.Series(data, index) . का उपयोग करके एक सीरीज ऑब्जेक्ट बना सकते हैं कक्षा। श्रृंखला डेटा के रूप में पूर्णांकों, सूचियों, शब्दकोशों को लेगी। आइए कुछ उदाहरण देखें।
उदाहरण
# importing the pandas library import pandas as pd # data data = [1, 2, 3] # creating Series object # Series automatically takes the default index series = pd.Series(data) print(series)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।
0 1 1 2 2 3 dtype: int64
एक अनुकूलित अनुक्रमणिका कैसे प्राप्त करें? उदाहरण देखें।
उदाहरण
# importing the pandas library import pandas as pd # data data = [1, 2, 3] # index index = ['a', 'b', 'c'] # creating Series object series = pd.Series(data, index) print(series)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।
a 1 b 2 c 3 dtype: int64
जब हम डेटा को शब्दकोश के रूप में श्रृंखला . को देते हैं वर्ग, फिर यह कुंजी को सूचकांक के रूप में और मूल्यों को वास्तविक डेटा के रूप में लेता है। आइए एक उदाहरण देखें।
उदाहरण
# importing the pandas library import pandas as pd # data data = {'a':97, 'b':98, 'c':99} # creating Series object series = pd.Series(data) print(series)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
a 97 b 98 c 99 dtype: int64
हम एक इंडेक्स का उपयोग करके श्रृंखला से डेटा तक पहुंच सकते हैं। आइए उदाहरण देखें।
उदाहरण
# importing the pandas library import pandas as pd # data data = {'a':97, 'b':98, 'c':99} # creating Series object series = pd.Series(data) # accessing the data from the Series using indexes print(series['a'], series['b'], series['c'])
आउटपुट
यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।
97 98 99
2.पांडा
हमारे पास पांडा में सीरीज क्लास का उपयोग कैसे करें। आइए देखें कि डेटाफ़्रेम का उपयोग कैसे करें कक्षा। डेटाफ़्रेम पांडा में डेटा संरचना वर्ग जिसमें पंक्तियाँ और स्तंभ होते हैं।
हम DataFrame create बना सकते हैं सूचियों, शब्दकोशों, शृंखलाओं, . का उपयोग करने वाली वस्तुएं आदि.., आइए सूचियों का उपयोग करके DataFrame बनाएं।
उदाहरण
# importing the pandas library import pandas as pd # lists names = ['Tutorialspoint', 'Mohit', 'Sharma'] ages = [25, 32, 21] # creating a DataFrame data_frame = pd.DataFrame({'Name': names, 'Age': ages}) # printing the DataFrame print(data_frame)
आउटपुट
यदि आप उपरोक्त कार्यक्रम चलाते हैं, तो आपको निम्नलिखित परिणाम प्राप्त होंगे।
Name Age 0 Tutorialspoint 25 1 Mohit 32 2 Sharma 21
आइए देखें कि श्रृंखला का उपयोग करके डेटा फ़्रेम ऑब्जेक्ट कैसे बनाया जाता है।
उदाहरण
# importing the pandas library import pandas as pd # Series _1 = pd.Series([1, 2, 3]) _2 = pd.Series([1, 4, 9]) _3 = pd.Series([1, 8, 27]) # creating a DataFrame data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3}) # printing the DataFrame print(data_frame)
आउटपुट
यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।
a b c 0 1 1 1 1 2 4 8 2 3 9 27
हम डेटा को DataFrames . से एक्सेस कर सकते हैं कॉलम नाम का उपयोग करना। आइए एक उदाहरण देखें।
उदाहरण
# importing the pandas library import pandas as pd # Series _1 = pd.Series([1, 2, 3]) _2 = pd.Series([1, 4, 9]) _3 = pd.Series([1, 8, 27]) # creating a DataFrame data_frame = pd.DataFrame({"a":_1, "b":_2, "c":_3}) # accessing the entire column with name 'a' print(data_frame['a'])
आउटपुट
यदि आप उपरोक्त कोड चलाते हैं, तो आपको निम्न परिणाम प्राप्त होंगे।
0 1 1 2 2 3 Name: a, dtype: int64
निष्कर्ष
यदि आपको ट्यूटोरियल में कोई संदेह है, तो उनका टिप्पणी अनुभाग में उल्लेख करें।