मानक विचलन इस बारे में बताता है कि डेटासेट में मान कैसे फैले हुए हैं। वे यह भी बताते हैं कि डेटासेट में मान डेटासेट में कॉलम के अंकगणितीय माध्य से कितनी दूर हैं।
कभी-कभी, एक विशिष्ट कॉलम का मानक विचलन प्राप्त करने की आवश्यकता हो सकती है जो प्रकृति में संख्यात्मक है। यह वह जगह है जहाँ std () फ़ंक्शन का उपयोग किया जा सकता है। जिस कॉलम के माध्य की गणना करने की आवश्यकता है, उसे डेटाफ़्रेम में अनुक्रमित किया जा सकता है, और माध्य फ़ंक्शन को डॉट ऑपरेटर का उपयोग करके इस पर कॉल किया जा सकता है।
मानक विचलन का पता लगाने के लिए स्तंभ के सूचकांक को भी पास किया जा सकता है।
आइए उसी का एक प्रदर्शन देखें -
उदाहरण
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std())
आउटपुट
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364
स्पष्टीकरण
-
आवश्यक पुस्तकालयों को आयात किया जाता है, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
-
कुंजी और मान से युक्त श्रृंखला का शब्दकोश बनाया जाता है, जिसमें एक मान वास्तव में एक श्रृंखला डेटा संरचना होती है।
-
इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
-
डेटाफ़्रेम कंसोल पर मुद्रित होता है।
-
हम एक विशिष्ट कॉलम के मानक विचलन की गणना करने पर विचार कर रहे हैं जिसमें उनमें संख्यात्मक मान शामिल हैं।
-
डॉट ऑपरेटर का उपयोग करके कॉलम का नाम निर्दिष्ट करके डेटाफ्रेम पर 'एसटीडी' फ़ंक्शन को कॉल किया जाता है।
-
अंकीय स्तंभ का मानक विचलन कंसोल पर मुद्रित होता है।