पायथन डेटा एनालिटिक्स में टेक्स्ट से केवल नंबर निकालना एक बहुत ही सामान्य आवश्यकता है। यह अजगर नियमित अभिव्यक्ति पुस्तकालय का उपयोग करके आसानी से किया जाता है। यह लाइब्रेरी हमें अंकों के पैटर्न को परिभाषित करने में मदद करती है जिसे सबस्ट्रिंग के रूप में निकाला जा सकता है।
उदाहरण
नीचे दिए गए उदाहरण में हम री मॉड्यूल से फंक्शन फाइंडॉल () का उपयोग करते हैं। इन फ़ंक्शन के पैरामीटर वह पैटर्न हैं जिन्हें हम निकालना चाहते हैं और वह स्ट्रिंग जिससे हम निकालना चाहते हैं। कृपया नीचे दिए गए उदाहरण के साथ ध्यान दें कि हमें केवल अंक मिलते हैं, न कि दशमलव अंक या नकारात्मक चिह्न।
import re
str=input("Enter a String with numbers: \n")
#Create a list to hold the numbers
num_list = re.findall(r'\d+', str)
print(num_list) आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '8', '4', '112']
दशमलव बिंदु और चिह्न कैप्चर करना
हम दशमलव बिंदुओं और नकारात्मक या सकारात्मक चिह्नों को भी खोज परिणाम में शामिल करने के लिए खोज पैटर्न का विस्तार कर सकते हैं।
उदाहरण
import re
str=input("Enter a String with numbers: \n")
#Create a list to hold the numbers
num_list=re.findall(r'[-+]?[.]?[\d]+',str)
print(num_list) आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '.8', '-4', '.112']