Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पंडों के डेटाफ़्रेम को एक सामान्य कॉलम के साथ मर्ज करें और बेजोड़ मानों के लिए NaN सेट करें

दो पांडा डेटाफ़्रेम को सामान्य कॉलम के साथ मर्ज करने के लिए, मर्ज () . का उपयोग करें कार्य करें और चालू . सेट करें स्तंभ नाम के रूप में पैरामीटर। बेजोड़ मानों के लिए NaN सेट करने के लिए, "कैसे . का उपयोग करें ” पैरामीटर और इसे बाएं सेट करें या दाएं . इसका मतलब होगा, बाएँ या दाएँ विलय करना।

सबसे पहले, आइए एक उपनाम के साथ पांडा पुस्तकालय को आयात करें -

import pandas as pd

आइए DataFrame1 बनाएं -

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

आइए DataFrame2 बनाएं

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

अब, DataFrames को कॉमन कॉलम Car के साथ मर्ज करें। बायां" "बाएं डेटाफ़्रेम के सभी मान प्रदर्शित करता है और 2 nd से बेजोड़ मानों के लिए NaN सेट करता है डेटाफ़्रेम -

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")

उदाहरण

निम्नलिखित कोड है

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print("DataFrame1 ...\n",dataFrame1)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print("\nDataFrame2 ...\n",dataFrame2)

# merge DataFrames with common column Car and "left" sets NaN for unmatched values from second DataFrame
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print("\nMerged data frame with common column...\n", mergedRes)

आउटपुट

निम्नलिखित कोड है -

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2     Tesla        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

Merged data frame with common column...
       Car   Units   Reg_Price
0      BMW     100      7000.0
1    Lexus     150      1500.0
2     Audi     110         NaN
3  Mustang      80      8000.0
4  Bentley     110         NaN
5   Jaguar      90      6000.0

  1. पायथन पांडा - एक-से-एक संबंध के साथ डेटाफ़्रेम को मर्ज करें

    पांडा डेटाफ़्रेम को मर्ज करने के लिए, मर्ज का उपयोग करें () समारोह। एक-से-एक संबंध सत्यापित करें . के अंतर्गत सेटिंग करके दोनों डेटाफ़्रेम पर कार्यान्वित किया जाता है मर्ज () फ़ंक्शन का पैरामीटर यानी − validate = “one-to-one” or validate = “1:1” एक-से-अनेक संबंध जाँचता है कि

  1. Matplotlib के साथ पंडों डेटाफ्रेम के लिए एक रेखा ग्राफ प्लॉट करें?

    हम प्लॉट () का उपयोग करके पंडों के डेटाफ़्रेम के लिए एक लाइन ग्रैप प्लॉट करेंगे। सबसे पहले, आवश्यक पुस्तकालयों को आयात करें - import pandas as pd import matplotlib.pyplot as plt एक डेटाफ़्रेम बनाएँ - dataFrame = pd.DataFrame(    {       "Car": ['BMW', '

  1. पायथन पांडा - डेटाफ़्रेम में सभी NaN तत्वों को 0s . से बदलें

    NaN मानों को बदलने के लिए, fillna() विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटाफ़्रेम में लोड करें - dataFrame = pd.read_csv("C: