Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

रेगेक्स द्वारा पंडों में पंक्तियों को कैसे फ़िल्टर करें?

एक रेगुलर एक्सप्रेशन (रेगेक्स) वर्णों का एक क्रम है जो एक खोज पैटर्न को परिभाषित करता है। रेगेक्स द्वारा पंडों में पंक्तियों को फ़िल्टर करने के लिए, हम str.match() . का उपयोग कर सकते हैं विधि।

कदम

  • एक द्वि-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा बनाएं, df
  • इनपुट डेटाफ़्रेम प्रिंट करें, df
  • एक चर प्रारंभ करें regex अभिव्यक्ति के लिए। रेगेक्स के रूप में एक स्ट्रिंग मान प्रदान करें, उदाहरण के लिए, स्ट्रिंग 'J.*' 'J' अक्षर से शुरू होने वाली सभी प्रविष्टियों को फ़िल्टर कर देगा।
  • df.column_name.str.match(regex) का उपयोग करें दिए गए कॉलम नाम की सभी प्रविष्टियों को दिए गए रेगेक्स द्वारा फ़िल्टर करने के लिए।

उदाहरण

import pandas as pd

df = pd.DataFrame(
   dict(
      name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'],
      marks=[89, 23, 100, 56, 90],
      subjects=["Math", "Physics", "Chemistry", "Biology", "English"]
   )
)

print "Input DataFrame is:\n", df

regex = 'J.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

regex = 'A.*'
print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]

आउटपुट

Input DataFrame is:

     name    marks   subjects
0    John     89        Math
1   Jacob     23     Physics
2     Tom    100   Chemistry
3     Tim     56     Biology
4    Ally     90     English

After applying J.* DataFrame is:

    name   marks   subjects
0   John     89        Math
1  Jacob     23     Physics

After applying A.* DataFrame is:

    name   marks   subjects
4   Ally     90     English

  1. दिनांक पांडा डेटाफ़्रेम द्वारा एकत्रित प्लॉट कैसे करें?

    दिनांक पांडा डेटाफ़्रेम द्वारा एकत्रित प्लॉट करने के लिए, हम निम्नलिखित कदम उठा सकते हैं - कदम फिगर साइज सेट करें और सबप्लॉट्स के बीच और आसपास पैडिंग को एडजस्ट करें। डेटा फ़्रेम बनाएं, df , द्वि-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा का। दिनांक पांडा डेटाफ़्रेम द्वारा सम

  1. पायथन - पंडों के डेटाफ़्रेम से अशक्त पंक्तियों को कैसे छोड़ें?

    पंडों के डेटाफ़्रेम में अशक्त पंक्तियों को छोड़ने के लिए, ड्रॉपना () विधि का उपयोग करें। मान लें कि कुछ NaN यानी शून्य मानों वाली हमारी CSV फ़ाइल निम्नलिखित है - आइए read_csv() का उपयोग करके CSV फ़ाइल पढ़ें। हमारा सीएसवी डेस्कटॉप पर है - dataFrame = pd.read_csv("C:\\Users\\amit_\\Desktop\\Ca

  1. पंडों में डुप्लिकेट पंक्तियों को कैसे खोजें और फ़िल्टर करें?

    कभी-कभी हमारे डेटा विश्लेषण के दौरान, हमें अपने डेटा को सीधे छोड़ने के बजाय उसके बारे में अधिक समझने के लिए डुप्लिकेट पंक्तियों को देखने की आवश्यकता होती है। सौभाग्य से, पांडा में डुप्लिकेट के साथ खेलने के लिए हमारे पास कुछ तरीके हैं। .duplciated() यह विधि हमें डेटाफ़्रेम में डुप्लिकेट पंक्तियों क