पांडस पायथन में डेटा को कैसे सारांशित किया जा सकता है?

इस पर विभिन्न कार्यों का उपयोग करके डेटा के बारे में बहुत सारी जानकारी प्राप्त की जा सकती है। लेकिन अगर हम डेटा पर सभी जानकारी प्राप्त करना चाहते हैं, तो 'डिस्क्राइब' फ़ंक्शन का उपयोग किया जा सकता है।

यह फ़ंक्शन 'गिनती', 'माध्य', 'मानक विचलन', 25वीं शतमक, 50वीं शतमक और 75वीं शतमक जैसी जानकारी देगा।

उदाहरण

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

आउटपुट

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

स्पष्टीकरण

आवश्यक पुस्तकालय आयात किए जाते हैं, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
कुंजी और मान से युक्त श्रृंखला का शब्दकोश बनाया गया है, जिसमें एक मान वास्तव में एक श्रृंखला डेटा संरचना है।
इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
डेटाफ़्रेम कंसोल पर प्रिंट होता है।
हम डेटा के बारे में सभी जानकारी प्राप्त करने पर विचार कर रहे हैं।
डेटाफ़्रेम पर 'डिस्क्राइब' फ़ंक्शन को कॉल किया जाता है।
विवरण कंसोल पर प्रिंट होता है।