Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

सभी वर्णनात्मक आंकड़ों के साथ आर डेटा फ्रेम का सांख्यिकीय सारांश कैसे प्राप्त करें?

जब हम R डेटा फ़्रेम का सांख्यिकीय सारांश पाते हैं, तो हमें केवल न्यूनतम मान, प्रथम चतुर्थक, माध्यिका, माध्य, तृतीय चतुर्थक और अधिकतम मान प्राप्त होता है, लेकिन वर्णनात्मक में कई अन्य उपयोगी उपाय होते हैं जैसे विचरण, मानक विचलन, तिरछापन, कुर्टोसिस , आदि। इसलिए, हम इस उद्देश्य के लिए fBasics पैकेज के basicStats फ़ंक्शन का उपयोग कर सकते हैं।

fBasics पैकेज लोड हो रहा है -

लाइब्रेरी(fBasics)

आधार R में mtcars डेटा पर विचार करें -

उदाहरण

डेटा(mtcars)head(mtcars,20)

आउटपुट

 mpg cyl disp hp drat wt qsec vs am गियर कार्बमाज़्दा RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1हॉर्नेट 4 ड्राइव 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1हॉर्नेट स्पोर्टलगभग 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2 बहादुर 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1डस्टर 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4Merc 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2 मर्क 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2 मर्क 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4 मर्क 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4 मर्क 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3 मर्क 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3 Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3 कैडिलैक फ्लीटवुड 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4लिंकन कॉन्टिनेंटल 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4 क्रिसलर इंपीरियल 14.7 8 440.0 230 3.23 03 5.345 3 4फिएट 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1होंडा सिविक 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2टोयोटा कोरोला 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1

mtcars डेटा सेट का सांख्यिकीय सारांश ढूँढना -

>बुनियादी आँकड़े(mtcars)
 mpg cyl disp hp dratnobs 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000न्यूनतम 10.400000 4.000000 71.100000 52.000000 2.760000 अधिकतम 33.900000 8.000000 472.000000 335.96. 230.721875 146.687500 3.596563Median 19,200000 6,000000 196,300000 123,000000 3.695000Sum 642,900000 198,000000 7383,100000 4694,000000 115.090000SE मीन 1,065424 0,315709 21,909473 12,120317 0,094519 LCLMean 17,917679 5,543607 186,037211 121,967950 3,403790 UCLMean 22,263571 6,831393 275,406539 171,407050 3.789335Variance 36,324103 3,189516 15360,799829 4700,866935 0.285881Stdev 6,026948 1,785922 123,938694 68,562868 0.534679Skewness .६,१०,६५५ -.१,७४,६१२ 0.381657 0.726024 0.265904 कर्टोसिस -0.372766 -1.762120 -1.207212 -0.135551 -0.714701


 wt qsec बनाम am Gea r carbnobs 32.000000 32.000000 32.000000 32.000000 32.000000 32.000000NAs 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 न्यूनतम 1.513000 14.500000 0.000000 0.000000 0.000000 3.000000 1.000000 18.900000 1.000000 1.000000 4.000000 4.000000Mean 3,217250 17,848750 0,437500 0,406250 3,687500 2.812500Median 3,325000 17,710000 0,000000 0,000000 4,000000 2.000000Sum 102,952000 571,160000 14,000000 13,000000 118,000000 90.000000SE मीन 0,172968 0,315890 0,089098 0,088210 0,130427 0.285530LCL मीन 2,864478 17,204488 0,255783 0,226345 3,421493 2.230158UCL मीन 3,570022 18,493012 0,619217 0,586155 3,953507 3,394842 प्रसरण 0.957379 3.193166 0.254032 0.248992 0.544355 2.608871Stdev 0.978457 1.786943 0.504016 0.498991 0.737804 1.615200 तिरछापन 0.423146 0.369045 0.240258 0.364016 0.528854 1.050874 कर्टोसिस -0.022711 0.335114 -2.001938 -1.924741 -1.069751 1.257043

आइए आधार R में ट्री डेटा और प्रेशर डेटा का उपयोग करते हुए दो और उदाहरण देखें।

पेड़ डेटा उदाहरण -

उदाहरण

डेटा(पेड़)सिर(पेड़,20)

आउटपुट

 गिरथ हाइट वॉल्यूम1 8.3 70 10.32 8.6 65 10.33 8.8 63 10.24 10.5 72 16.45 10.7 81 18.86 10.8 83 19.77 11.0 66 15.68 11.0 75 18.29 11.1 80 22.610 11.2 75 19.911 11.3 79 24.212 11.4 76 21.013 11.4 76 21.415 11.7 75 19.116 12.9 74 22.217 12.9 85 33.818 13.3 86 27.419 13.7 71 25.720 13.8 64 24.9


>बुनियादी आँकड़े(पेड़)गिर्थ ऊँचाई आयतन संख्या 31.000000 31.000000 31.000000 NAs 0.000000 0.000000 0.000000 न्यूनतम 8.300000 63.000000 10.200000 अधिकतम 20.600000 87.000000 77.000000 1. चतुर्थक 11.050000 72.000000 19.400000 3. चतुर्थक 15.250000 SE मीन 0.563626 1.144411 2.952324LCL मीन 12.097309 73.662800 24.141517 UCL मीन 14.399466 78.337200 36.200418 वेरिएंस 9.847914 40.600000 270.202796 Stdev 3.138139 6.371813 16.437846 स्क्यूनेस 0.5601772 

दबाव डेटा उदाहरण -

उदाहरण

डेटा (दबाव) सिर (दबाव, 20)

आउटपुट

 तापमान दबाव1 0 0.00022 20 0.00123 40 0.00604 60 0.03005 80 0.09006 100 0.27007 120 0.75008 140 1.85009 160 4.200010 180 8.800011 200 17.300012 220 32.100013 240 57.000014 260 96.000015 2800000 157.000016 300 247.000017 320 376.000018 340 558.000019 360 806.000018 


मूल आँकड़े(दबाव)तापमान दाब 19.000000 19.000000NAs 0.000000 0.000000न्यूनतम 0.000000 0.000200अधिकतम 360.000000 806.0000001 है। चतुर्थक 90.000000 0.1800003। चतुर्थक 270.0000 126.500000 माध्य 180.00000 124.336705 माध्य 180.000000 8.800000 योग 3420.0000 2362.397400एसई मतलब 25.819889 51.531945एलसीएल मतलब 125.754426 16.072107यूसीएल मीन 234.245574 232.60140एस वेरिएंस 12666666675585. 
  1. Matplotlib में लाइन ग्राफ के लिए डेटा इंडेक्स के साथ लाइन रंग कैसे भिन्न करें?

    Matplotlib में लाइन ग्राफ़ के डेटा इंडेक्स के साथ लाइन का रंग अलग-अलग होने के लिए, हम निम्नलिखित कदम उठा सकते हैं - कदम फिगर साइज सेट करें और सबप्लॉट्स के बीच और आसपास पैडिंग को एडजस्ट करें। numpy का उपयोग करके x और y डेटा पॉइंट बनाएं। छोटी सीमा प्राप्त करें, dydx । अंक प्राप्त करें और स

  1. अधिकतम मूल्य के साथ पायथन सूची से तत्व कैसे खोजें?

    अधिकतम मान वाले तत्व को खोजने के लिए, आपको सूची के साथ अधिकतम () फ़ंक्शन को तर्क के रूप में कॉल करने की आवश्यकता है। अधिकतम फ़ंक्शन सूची में पुनरावृति करता है, जब तक कि यह अंत तक नहीं पहुंच जाता है, तब तक इसका सामना करने वाले अधिकतम मूल्य का ट्रैक रखता है। फिर यह यह मान लौटाता है। उदाहरण my_list =

  1. पाइथन में एक्सटेंशन .txt वाली निर्देशिका में सभी फ़ाइलों को कैसे खोजें?

    आप निर्देशिका में सभी निर्देशिकाओं और फ़ाइलों को प्राप्त करने के लिए os.listdir विधि का उपयोग कर सकते हैं। फिर केवल फ़ाइलें प्राप्त करने के लिए सूची को फ़िल्टर करें और उनके एक्सटेंशन भी जांचें। उदाहरण के लिए >>> import os >>> file_list = [f for f in os.listdir('.') if os.pa