Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन पंडों - दो डेटाफ़्रेम के बीच सामान्य पंक्तियों को कॉनकैट के साथ प्राप्त करें ()

दो डेटाफ़्रेम के बीच सामान्य पंक्तियों को लाने के लिए, concat() . का उपयोग करें समारोह। आइए दो कॉलम के साथ DataFrame1 बनाएं -

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
      "Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

दो कॉलम के साथ DataFrame2 बनाएं -

dataFrame2 = pd.DataFrame(
   {
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
)

कॉनकैट () के साथ दो डेटाफ़्रेम के बीच सामान्य पंक्तियों को ढूँढना -

dfRes = pd.concat([dataFrame1, dataFrame2])

अनुक्रमणिका रीसेट करें -

dfRes = dfRes.reset_index(drop=True)

ग्रुपबाय कॉलम -

dfGroup = dfRes.groupby(list(dfRes.columns))

गिनती की गणना करने के लिए प्रत्येक पंक्ति की लंबाई प्राप्त करना। अगर गिनती 1 से अधिक है, तो इसका मतलब है कि सामान्य पंक्तियाँ -

res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1000, 1500, 1100, 800, 1100, 900] }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],
"Reg_Price": [1200, 1500, 1000, 800, 1100, 1000]
}
)

print"\nDataFrame2 ...\n",dataFrame2

# finding common rows between two DataFrames
dfRes = pd.concat([dataFrame1, dataFrame2])

# reset index
dfRes = dfRes.reset_index(drop=True)

# groupby columns
dfGroup = dfRes.groupby(list(dfRes.columns))

# length of each row to calculate the count
# if count is greater than 1, that would mean common rows
res = [k[0] for k in dfGroup.groups.values() if len(k) > 1]

print"\nCommon rows...\n",dfRes.reindex(res)

आउटपुट

यह निम्नलिखित आउटपुट देगा -

DataFrame1 ...
       Car   Reg_Price
0      BMW        1000
1    Lexus        1500
2     Audi        1100
3    Tesla         800
4  Bentley        1100
5   Jaguar         900

DataFrame2 ...
       Car   Reg_Price
0      BMW        1200
1    Lexus        1500
2     Audi        1000
3    Tesla         800
4  Bentley        1100
5   Jaguar        1000

Common rows...
       Car   Reg_Price
3    Tesla         800
1    Lexus        1500
4  Bentley        1100

  1. पायथन पांडा - सीबोर्न के साथ झुंडों को दो श्रेणीबद्ध चर द्वारा समूहित करें

    सीबॉर्न में झुंड प्लॉट का उपयोग गैर-अतिव्यापी बिंदुओं के साथ एक श्रेणीबद्ध स्कैटरप्लॉट बनाने के लिए किया जाता है। इसके लिए Seaborn.swarmplot() का प्रयोग किया जाता है। झुंडों को दो श्रेणीगत चरों द्वारा समूहित करने के लिए, उन चरों को x, y या रंग का उपयोग करके swarmplot() में सेट करें। पैरामीटर। मान ल

  1. पायथन पंडों - दो डेटाफ़्रेम के बीच सामान्य पंक्तियों को कॉनकैट के साथ प्राप्त करें ()

    दो डेटाफ़्रेम के बीच सामान्य पंक्तियों को लाने के लिए, concat() . का उपयोग करें समारोह। आइए दो कॉलम के साथ DataFrame1 बनाएं - dataFrame1 = pd.DataFrame(    {       "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jagu

  1. पायथन पांडस में दो डेटाफ्रेम की तुलना लापता मूल्यों के साथ कैसे करें

    परिचय लापता मान का प्रतिनिधित्व करने के लिए पांडा NumPy NaN (np.nan) ऑब्जेक्ट का उपयोग करता है। इस Numpy NaN मान में कुछ दिलचस्प गणितीय गुण हैं। उदाहरण के लिए, यह स्वयं के बराबर नहीं है। हालांकि, पाइथन कोई नहीं वस्तु स्वयं की तुलना में सत्य के रूप में मूल्यांकन करती है। इसे कैसे करें.. np.nan कैसे