पायथन पुस्तकालय के सांख्यिकी मॉड्यूल में अंश और दशमलव प्रकार सहित संख्यात्मक डेटा प्रकारों का उपयोग करके सांख्यिकीय सूत्रों की गणना करने के लिए कार्य होते हैं।
इस आलेख में वर्णित कार्यों का उपयोग करने के लिए निम्नलिखित आयात विवरण की आवश्यकता है।
>>> from statistics import *
निम्नलिखित फ़ंक्शन नमूना डेटा की केंद्रीय प्रवृत्ति की गणना करते हैं।
माध्य () - यह फ़ंक्शन अनुक्रम या पुनरावृत्त के रूप में डेटा के अंकगणितीय माध्य की गणना करता है।
>>> from statistics import mean >>> numbers = [12,34,21,7,56] >>> mean(numbers) 26
नमूना डेटा में दशमलव वस्तु या भिन्न वस्तु हो सकती है
>>> from decimal import Decimal >>> numbers = [12,34,21,Decimal('7'),56] >>> mean(numbers) Decimal('26') >>> from fractions import Fraction >>> numbers = [12,20.55,Fraction(4,5),21,56] >>> mean(numbers) 22.07
हार्मोनिक_मीन () - हार्मोनिक माध्य की गणना नमूना डेटा में तत्वों के व्युत्क्रमों के अंकगणितीय माध्य को लेकर और फिर स्वयं अंकगणित माध्य का व्युत्क्रम लेकर की जाती है।
नमूना =[1,2,3,4,5]
व्युत्क्रम =[1/1, 1/2, 1/3, 1/4, 1/5] =2.28333333333
माध्य =2.28333333333/5 =0. 4566666666666666667
हार्मोनिक माध्य =1 / 4566666666666666667 =2.189784218663093
>>> harmonic_mean([1,2,3,4,5]) 2.18978102189781
माध्यिका () - माध्य नमूना डेटा का मध्य मान है। माध्यिका ज्ञात करने के लिए डेटा को स्वचालित रूप से आरोही क्रम में व्यवस्थित किया जाता है। यदि तत्वों की संख्या विषम है, तो माध्य मध्य मान है। यदि संख्या विषम है, तो दो मध्य संख्याओं का माध्य माध्यिका है।
>>> median([2,5,4,8,6]) 5 >>> median([11,33,66,55,88,22]) 44.0
मोड () - यह फ़ंक्शन नमूने में सबसे सामान्य मान देता है। यह फ़ंक्शन संख्यात्मक या गैर-संख्यात्मक डेटा पर लागू किया जा सकता है।
>>> mode((4,7,8,4,9,7,12,4,8)) 4 >>> mode(['cc','aa','dd','cc','ff','cc']) 'cc'
निम्नलिखित फ़ंक्शन केंद्रीय मान से नमूने में तत्वों के फैलाव के माप से निपटते हैं।
भिन्नता () - यह फ़ंक्शन नमूने में डेटा की परिवर्तनशीलता या फैलाव को दर्शाता है। बड़े विचरण का मतलब है कि डेटा बिखरा हुआ है। छोटा विचरण इंगित करता है कि डेटा बारीकी से क्लस्टर किया गया है।
विचरण खोजने की प्रक्रिया निम्नलिखित है
- नमूने में सभी तत्वों का अंकगणितीय माध्य ज्ञात करें।
- माध्य और प्रत्येक तत्व के बीच के अंतर का वर्ग खोजें और वर्गों को जोड़ें।
- विचरण प्राप्त करने के लिए यदि नमूना आकार n है तो योग को n-1 से विभाजित करें
गणितीय रूप से, उपरोक्त प्रक्रिया को निम्न सूत्र द्वारा दर्शाया गया है -
$$s^2 =\frac{1}{n-1}\displaystyle\displaystyle\sum\limits_{i=1}^n(x_{i}-\overline{x})^2$$
शुक्र है कि विचरण () फ़ंक्शन आपके लिए उपरोक्त सूत्र की गणना करता है।
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> variance(num) 981.2111111111111
stdev() - यह फ़ंक्शन नमूने में डेटा का मानक विचलन लौटाता है। मानक विचलन विचरण का वर्गमूल है।
>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70] >>> stdev(num) 31.324289474960338