Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन - डुप्लिकेट के बिना पंडों के डेटाफ़्रेम को संयोजित करें

DataFrames को जोड़ने के लिए, concat() विधि का उपयोग करें, लेकिन डुप्लिकेट को अनदेखा करने के लिए, drop_duplicates() विधि का उपयोग करें।

आवश्यक पुस्तकालय आयात करें -

import pandas as pd

जोड़ने के लिए डेटाफ़्रेम बनाएं -

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

अब, हम DataFrame को जोड़ते हैं और डुप्लीकेट हटाते हैं -

concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# concat DataFrames and remove duplicates
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\nConcatenating DataFrame without duplicates...\n", concatRes

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame1 ...
       Car   Units
0      BMW     100
1   Jaguar     150
2     Audi     110
3  Mustang      80

DataFrame2 ...
        Car   Units
0     Tesla     120
1    Jaguar     150
2  Mercedes     180
3   Mustang      80

Concatenating DataFrame without duplicates...
        Car   Units
0       BMW     100
1    Jaguar     150
2      Audi     110
3   Mustang      80
0     Tesla     120
2  Mercedes     180

  1. पायथन पांडा - NaN मूल्यों के बिना वापसी सूचकांक

    NaN मानों के बिना अनुक्रमणिका वापस करने के लिए, index.dropna() . का उपयोग करें पंडों में विधि। सबसे पहले, आवश्यक पुस्तकालयों को आयात करें - import pandas as pd import numpy as np कुछ NaN मानों के साथ-साथ पंडों का अनुक्रमणिका बनाना - index = pd.Index([50, 10, 70, np.nan, 90, 50, np.nan, np.nan, 30])

  1. अजगर - हेडर के बिना पंडों के साथ सीएसवी फ़ाइल पढ़ें?

    हेडर के बिना CSV फ़ाइल पढ़ने के लिए, हेडर पैरामीटर का उपयोग करें और इसे “कोई नहीं . पर सेट करें में read_csv() विधि। मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटा

  1. इंडेक्स को दोहराए बिना दो पंडों की श्रृंखला को एक श्रृंखला में संयोजित करने के लिए एक पायथन कोड लिखें

    इनपुट - मान लें कि आपके पास एक श्रृंखला है और सूचकांक को दोहराए बिना मूल्यों को संयोजित करने का परिणाम है, 0    1 1    2 2    3 3    4 4    5 5    6 समाधान इसे हल करने के लिए, हम इन दो चरणों का पालन करेंगे - दो श्रृंखला परिभाषित करें