एक रेगुलर एक्सप्रेशन (रेगेक्स) वर्णों का एक क्रम है जो एक खोज पैटर्न को परिभाषित करता है। रेगेक्स द्वारा पंडों में पंक्तियों को फ़िल्टर करने के लिए, हम str.match() . का उपयोग कर सकते हैं विधि।
कदम
- एक द्वि-आयामी, आकार-परिवर्तनीय, संभावित रूप से विषम सारणीबद्ध डेटा बनाएं, df ।
- इनपुट डेटाफ़्रेम प्रिंट करें, df ।
- एक चर प्रारंभ करें regex अभिव्यक्ति के लिए। रेगेक्स के रूप में एक स्ट्रिंग मान प्रदान करें, उदाहरण के लिए, स्ट्रिंग 'J.*' 'J' अक्षर से शुरू होने वाली सभी प्रविष्टियों को फ़िल्टर कर देगा।
- df.column_name.str.match(regex) का उपयोग करें दिए गए कॉलम नाम की सभी प्रविष्टियों को दिए गए रेगेक्स द्वारा फ़िल्टर करने के लिए।
उदाहरण
import pandas as pd df = pd.DataFrame( dict( name=['John', 'Jacob', 'Tom', 'Tim', 'Ally'], marks=[89, 23, 100, 56, 90], subjects=["Math", "Physics", "Chemistry", "Biology", "English"] ) ) print "Input DataFrame is:\n", df regex = 'J.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)] regex = 'A.*' print "After applying ", regex, " DataFrame is:\n", df[df.name.str.match(regex)]
आउटपुट
Input DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics 2 Tom 100 Chemistry 3 Tim 56 Biology 4 Ally 90 English After applying J.* DataFrame is: name marks subjects 0 John 89 Math 1 Jacob 23 Physics After applying A.* DataFrame is: name marks subjects 4 Ally 90 English