Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - लेफ्ट आउटर जॉइन के साथ पंडों के डेटाफ्रेम को मर्ज करें

पांडा डेटाफ़्रेम को मर्ज करने के लिए, मर्ज का उपयोग करें () समारोह। बाएं बाहरी जुड़ाव को "कैसे . के तहत सेट करके दोनों DataFrames पर लागू किया गया है मर्ज () फ़ंक्शन का पैरामीटर यानी −

how = “left”

सबसे पहले, आइए एक उपनाम के साथ पांडा पुस्तकालय को आयात करें -

import pandas as pd

आइए मर्ज किए जाने के लिए दो डेटाफ़्रेम बनाएं -

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

डेटाफ़्रेम को सामान्य कॉलम कार के साथ मर्ज करें और "कैसे" पैरामीटर में "बाएं" लेफ्ट आउटर जॉइन को लागू करता है -

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# merge DataFrames with common column Car and "left" in "how" parameter implements Left Outer Join
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print"\nMerged dataframe with left outer join...\n", mergedRes

आउटपुट

यह निम्नलिखित आउटपुट देगा -

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2     Tesla        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

Merged dataframe with left outer join...
       Car   Units   Reg_Price
0      BMW     100      7000.0
1    Lexus     150      1500.0
2     Audi     110         NaN
3  Mustang      80      8000.0
4  Bentley     110         NaN
5   Jaguar      90      6000.0

  1. पायथन पांडा - डेटाफ़्रेम में सभी NaN तत्वों को 0s . से बदलें

    NaN मानों को बदलने के लिए, fillna() विधि का उपयोग करें। मान लें कि Microsoft Excel में कुछ NaN मानों के साथ खोली गई हमारी CSV फ़ाइल निम्नलिखित है - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटाफ़्रेम में लोड करें - dataFrame = pd.read_csv("C:

  1. पायथन पांडा - कई-से-एक संबंध के साथ डेटाफ़्रेम को मर्ज करें

    पांडा डेटाफ़्रेम को मर्ज करने के लिए, मर्ज () . का उपयोग करें समारोह। अनेक-से-एक संबंध सत्यापित करें . के अंतर्गत सेटिंग करके दोनों डेटाफ़्रेम पर कार्यान्वित किया जाता है मर्ज () फ़ंक्शन का पैरामीटर यानी − validate = “many-to-one” or validate = “m:1” कई-से-एक संबंध जांचता है

  1. पायथन - पांडस डेटाफ्रेम के सबसेट का चयन कैसे करें

    मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, CSV फ़ाइल से पंडों के डेटाफ़्रेम में डेटा लोड करें - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\SalesData.csv") उपसमुच्चय का चयन करने के लिए वर्गाकार कोष्ठकों का प्रयोग करें। कोष्ठक म