Computer >> कंप्यूटर ट्यूटोरियल >  >> प्रोग्रामिंग >> Python

पायथन - डुप्लिकेट के बिना पंडों के डेटाफ़्रेम को संयोजित करें

DataFrames को जोड़ने के लिए, concat() विधि का उपयोग करें, लेकिन डुप्लिकेट को अनदेखा करने के लिए, drop_duplicates() विधि का उपयोग करें।

आवश्यक पुस्तकालय आयात करें -

import pandas as pd

जोड़ने के लिए डेटाफ़्रेम बनाएं -

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

अब, हम DataFrame को जोड़ते हैं और डुप्लीकेट हटाते हैं -

concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()

उदाहरण

निम्नलिखित कोड है -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# concat DataFrames and remove duplicates
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\nConcatenating DataFrame without duplicates...\n", concatRes

आउटपुट

यह निम्नलिखित आउटपुट उत्पन्न करेगा -

DataFrame1 ...
       Car   Units
0      BMW     100
1   Jaguar     150
2     Audi     110
3  Mustang      80

DataFrame2 ...
        Car   Units
0     Tesla     120
1    Jaguar     150
2  Mercedes     180
3   Mustang      80

Concatenating DataFrame without duplicates...
        Car   Units
0       BMW     100
1    Jaguar     150
2      Audi     110
3   Mustang      80
0     Tesla     120
2  Mercedes     180

  1. - पायथन पांडा - NaN मूल्यों के बिना वापसी सूचकांक

    NaN मानों के बिना अनुक्रमणिका वापस करने के लिए, index.dropna() . का उपयोग करें पंडों में विधि। सबसे पहले, आवश्यक पुस्तकालयों को आयात करें - import pandas as pd import numpy as np कुछ NaN मानों के साथ-साथ पंडों का अनुक्रमणिका बनाना - index = pd.Index([50, 10, 70, np.nan, 90, 50, np.nan, np.nan, 30])

  1. अजगर - हेडर के बिना पंडों के साथ सीएसवी फ़ाइल पढ़ें? अजगर - हेडर के बिना पंडों के साथ सीएसवी फ़ाइल पढ़ें?

    हेडर के बिना CSV फ़ाइल पढ़ने के लिए, हेडर पैरामीटर का उपयोग करें और इसे “कोई नहीं . पर सेट करें में read_csv() विधि। मान लें कि Microsoft Excel में खोली गई हमारी CSV फ़ाइल की सामग्री निम्नलिखित हैं - सबसे पहले, आवश्यक पुस्तकालय आयात करें - import pandas as pd CSV फ़ाइल से डेटा को पंडों के डेटा

  1. - इंडेक्स को दोहराए बिना दो पंडों की श्रृंखला को एक श्रृंखला में संयोजित करने के लिए एक पायथन कोड लिखें

    इनपुट - मान लें कि आपके पास एक श्रृंखला है और सूचकांक को दोहराए बिना मूल्यों को संयोजित करने का परिणाम है, 0    1 1    2 2    3 3    4 4    5 5    6 समाधान इसे हल करने के लिए, हम इन दो चरणों का पालन करेंगे - दो श्रृंखला परिभाषित करें