Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - पांडस डेटाफ्रेम के आंकड़ों का सारांश खोजें

डेटाफ़्रेम के आँकड़ों का सारांश खोजने के लिए, वर्णन () विधि का उपयोग करें। सबसे पहले, हमने निम्नलिखित पांडा पुस्तकालय को एक उपनाम के साथ आयात किया है

import pandas as pd

हमारी CSV फ़ाइल निम्नलिखित है और हम एक पांडा डेटाफ़्रेम बना रहे हैं -

dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")

अब, हमारे पंडों के डेटाफ़्रेम के आँकड़ों का सारांश प्राप्त करें -

dataFrame.describe()

उदाहरण

पूरा कोड निम्नलिखित है

import pandas as pd

# reading csv file
dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\CarRecords.csv")
print("DataFrame...\n",dataFrame)

# count the rows and columns in a DataFrame
print("\nNumber of rows and column in our DataFrame = ",dataFrame.shape)

# summary of DataFrame
print("\nGet the summary of statistics of a DataFrame = \n",dataFrame.describe())

# returns top 7 row records
print("\nDataFrame with specific number of rows...\n",dataFrame.head(7))

देता है

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा

DataFrame...
           Car       Place   UnitsSold
0         Audi   Bangalore          80
1      Porsche      Mumbai         110
2   RollsRoyce        Pune         100
3          BMW       Delhi          95
4     Mercedes   Hyderabad          80
5  Lamborghini  Chandigarh          80
6         Audi      Mumbai         100
7     Mercedes        Pune         120
8  Lamborghini       Delhi         100

Number of rows and colums in our DataFrame = (9, 3)

Get the summarry of statistics of a DataFrame =
       UnitsSold
count   9.000000
mean   96.111111
std    14.092945
min    80.000000
25%    80.000000
50%   100.000000
75%   100.000000
max   120.000000

DataFrame with specific number of rows ...
           Car       Place   UnitsSold
0         Audi   Bangalore          80
1      Porsche      Mumbai         110
2   RollsRoyce        Pune         100
3          BMW       Delhi          95
4     Mercedes   Hyderabad          80
5  Lamborghini  Chandigarh          80
6         Audi      Mumbai         100

  1. पायथन - पांडस डेटाफ्रेम में कॉलम में NaN घटनाओं की गणना कैसे करें?

    एक कॉलम में NaN आवृत्तियों की गणना करने के लिए, isna () का उपयोग करें। मानों को जोड़ने और गिनती खोजने के लिए योग () का उपयोग करें। सबसे पहले, आइए आवश्यक पुस्तकालयों को उनके संबंधित उपनामों के साथ आयात करें - import pandas as pd import numpy as np एक डेटाफ़्रेम बनाएँ। हमने Units_Sold कॉलम में Numpy

  1. डाउनट्रेंड प्रदर्शित करने के लिए डेटासेट प्लॉट करें - पायथन पांडा

    टाइम सीरीज़ एनालिसिस द्वारा प्रदर्शित डाउनवर्ड पैटर्न जिसे हम डाउनट्रेंड कहते हैं। मान लें कि निम्नलिखित हमारा डेटासेट है यानी SalesRecords2.csv सबसे पहले, आवश्यक पुस्तकालयों को आयात करें - import pandas as pd import matplotlib.pyplot as plt CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dat

  1. अपट्रेंड प्रदर्शित करने के लिए डेटासेट प्लॉट करें - पायथन पांडस

    टाइम सीरीज़ एनालिसिस द्वारा प्रदर्शित अपवर्ड पैटर्न जिसे हम अपट्रेंड कहते हैं। मान लें कि निम्नलिखित हमारा डेटासेट है यानी SalesRecords.csv सबसे पहले, आवश्यक पुस्तकालयों को आयात करें - import pandas as pd import matplotlib.pyplot as plt CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFram