पायथन डेटा एनालिटिक्स में टेक्स्ट से केवल नंबर निकालना एक बहुत ही सामान्य आवश्यकता है। यह अजगर नियमित अभिव्यक्ति पुस्तकालय का उपयोग करके आसानी से किया जाता है। यह लाइब्रेरी हमें अंकों के पैटर्न को परिभाषित करने में मदद करती है जिसे सबस्ट्रिंग के रूप में निकाला जा सकता है।
उदाहरण
नीचे दिए गए उदाहरण में हम री मॉड्यूल से फंक्शन फाइंडॉल () का उपयोग करते हैं। इन फ़ंक्शन के पैरामीटर वह पैटर्न हैं जिन्हें हम निकालना चाहते हैं और वह स्ट्रिंग जिससे हम निकालना चाहते हैं। कृपया नीचे दिए गए उदाहरण के साथ ध्यान दें कि हमें केवल अंक मिलते हैं, न कि दशमलव अंक या नकारात्मक चिह्न।
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list = re.findall(r'\d+', str) print(num_list)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '8', '4', '112']
दशमलव बिंदु और चिह्न कैप्चर करना
हम दशमलव बिंदुओं और नकारात्मक या सकारात्मक चिह्नों को भी खोज परिणाम में शामिल करने के लिए खोज पैटर्न का विस्तार कर सकते हैं।
उदाहरण
import re str=input("Enter a String with numbers: \n") #Create a list to hold the numbers num_list=re.findall(r'[-+]?[.]?[\d]+',str) print(num_list)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Enter a String with numbers: Go to 13.8 miles and then -4.112 miles. ['13', '.8', '-4', '.112']