इस पर विभिन्न कार्यों का उपयोग करके डेटा के बारे में बहुत सारी जानकारी प्राप्त की जा सकती है। लेकिन अगर हम डेटा पर सभी जानकारी प्राप्त करना चाहते हैं, तो 'डिस्क्राइब' फ़ंक्शन का उपयोग किया जा सकता है।
यह फ़ंक्शन 'गिनती', 'माध्य', 'मानक विचलन', 25वीं शतमक, 50वीं शतमक और 75वीं शतमक जैसी जानकारी देगा।
उदाहरण
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
आउटपुट
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
स्पष्टीकरण
- आवश्यक पुस्तकालय आयात किए जाते हैं, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
- कुंजी और मान से युक्त श्रृंखला का शब्दकोश बनाया गया है, जिसमें एक मान वास्तव में एक श्रृंखला डेटा संरचना है।
- इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
- डेटाफ़्रेम कंसोल पर प्रिंट होता है।
- हम डेटा के बारे में सभी जानकारी प्राप्त करने पर विचार कर रहे हैं।
- डेटाफ़्रेम पर 'डिस्क्राइब' फ़ंक्शन को कॉल किया जाता है।
- विवरण कंसोल पर प्रिंट होता है।