Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन में नियमित अभिव्यक्ति पैटर्न

नियंत्रण वर्णों को छोड़कर, (+ ? . * ^ $ ( ) [ ] { } | \), सभी वर्ण आपस में मेल खाते हैं। आप नियंत्रण वर्ण के पहले बैकस्लैश लगाकर बच सकते हैं।

निम्न तालिका नियमित अभिव्यक्ति सिंटैक्स को सूचीबद्ध करती है जो पायथन में उपलब्ध है -

<टेबल> <थहेड> क्रमांक पैटर्न और विवरण 1 ^
लाइन की शुरुआत से मेल खाता है।
2 $
पंक्ति के अंत से मेल खाता है।
3 .
न्यूलाइन को छोड़कर किसी एक वर्ण से मेल खाता है। एम विकल्प का उपयोग करने से यह न्यूलाइन से भी मेल खा सकता है।
4 [...]
कोष्ठक में किसी एक वर्ण से मेल खाता है।
5 [^...]
किसी एकल वर्ण से मेल खाता है जो कोष्ठक में नहीं है
6 पुनः*
पूर्ववर्ती अभिव्यक्ति की 0 या अधिक घटनाओं से मेल खाता है।
7 फिर से+
पूर्ववर्ती अभिव्यक्ति की 1 या अधिक आवृत्ति से मेल खाता है।
8 फिर से?
पूर्ववर्ती अभिव्यक्ति की 0 या 1 घटना से मेल खाता है।
9 फिर से{ n}
पूर्ववर्ती अभिव्यक्ति की घटनाओं की बिल्कुल n संख्या से मेल खाता है।
10 फिर से{ n,}
पूर्ववर्ती अभिव्यक्ति की n या अधिक घटनाओं से मेल खाता है।
11 पुनः{ n, m}
पूर्ववर्ती अभिव्यक्ति के कम से कम n और अधिक से अधिक m घटनाओं से मेल खाता है।
12 a| ख
या तो ए या बी से मेल खाता है।
13 (पुनः)
रेगुलर एक्सप्रेशन को समूहित करता है और मेल खाने वाले टेक्स्ट को याद रखता है।
14 (?imx)
रेगुलर एक्सप्रेशन के भीतर i, m, या x विकल्पों पर अस्थायी रूप से टॉगल करता है। यदि कोष्ठकों में है, तो केवल वह क्षेत्र प्रभावित होता है।
15 (?-imx)
रेगुलर एक्सप्रेशन में अस्थायी रूप से i, m, या x विकल्पों को टॉगल करता है। यदि कोष्ठकों में है, तो केवल वह क्षेत्र प्रभावित होता है।
16 (?:re)
मेल खाने वाले टेक्स्ट को याद किए बिना रेगुलर एक्सप्रेशन को समूहबद्ध करता है।
17 (?imx:re)
कोष्ठक में i, m, या x विकल्पों पर अस्थायी रूप से टॉगल करता है।
18 (?-imx:re)
कोष्ठक में i, m, या x विकल्पों को अस्थायी रूप से टॉगल करता है।
19 (?#...)
टिप्पणी।
20 (?=re)
एक पैटर्न का उपयोग करके स्थिति निर्दिष्ट करता है। कोई दायरा नहीं है।
21 (?! re)
पैटर्न निषेध का उपयोग करके स्थिति निर्दिष्ट करता है। कोई दायरा नहीं है।
22 (?> पुनः)
बैकट्रैकिंग के बिना स्वतंत्र पैटर्न से मेल खाता है।
23 \w
शब्द वर्णों से मेल खाता है।
24 \W
गैर-शब्द वर्णों से मेल खाता है।
25 \s
व्हाइटस्पेस से मेल खाता है। [\t\n\r\f] के बराबर।
26 \S
गैर-व्हाट्सएप से मेल खाता है।
27 \d
अंकों से मेल खाता है। [0-9] के बराबर।
28 \D
नॉनडिजिट्स से मेल खाता है।
29 \A
स्ट्रिंग की शुरुआत से मेल खाता है।
30 \Z
स्ट्रिंग के अंत से मेल खाता है। यदि कोई नई पंक्ति मौजूद है, तो वह नई पंक्ति से ठीक पहले मेल खाती है।
31 \z
स्ट्रिंग के अंत से मेल खाता है।
32 \G
मैच बिंदु जहां अंतिम मैच समाप्त हुआ।
33 \b
कोष्ठक के बाहर होने पर शब्द सीमाओं से मेल खाता है। ब्रैकेट के अंदर होने पर बैकस्पेस (0x08) से मेल खाता है।
34 \B
गैर-शब्द सीमाओं से मेल खाता है।
35 \n, \t, आदि.
न्यूलाइन, कैरिज रिटर्न, टैब आदि से मेल खाता है।
36 \1...\9
nवें समूहीकृत उप-अभिव्यक्ति से मेल खाता है।
37 \10
यदि यह पहले से मेल खाता है तो nth समूहीकृत उप-अभिव्यक्ति से मेल खाता है। अन्यथा एक वर्ण कोड के अष्टाधारी प्रतिनिधित्व को संदर्भित करता है।
<टेबल>
  1. पाइथन में रेगुलर एक्सप्रेशन ग्रुपिंग कैसे काम करती है?

    समूह बनाना हम रेगुलर एक्सप्रेशन के भाग को कोष्ठकों से घेर कर समूहित करते हैं। इस प्रकार हम एक वर्ण के बजाय पूरे समूह में ऑपरेटरों को लागू करते हैं। ग्रुप कैप्चर करना कोष्ठक न केवल उप-अभिव्यक्तियों को समूहित करते हैं बल्कि वे बैकरेफरेंस भी बनाते हैं। रेगुलर एक्सप्रेशन के समूहीकृत भाग से मेल खाने वाल

  1. पायथन में नियमित अभिव्यक्ति संशोधक कैसे काम करते हैं?

    नियमित अभिव्यक्ति शाब्दिक में मिलान के विभिन्न पहलुओं को नियंत्रित करने के लिए एक वैकल्पिक संशोधक शामिल हो सकता है। संशोधक एक वैकल्पिक ध्वज के रूप में निर्दिष्ट हैं। आप अनन्य OR (|) का उपयोग करके कई संशोधक प्रदान कर सकते हैं, और इनमें से किसी एक द्वारा प्रस्तुत किया जा सकता है - निम्नलिखित विभिन्न

  1. पायथन में नियमित अभिव्यक्ति क्या है?

    सरल शब्दों में, रेगुलर एक्सप्रेशन वर्णों का एक क्रम है जिसका उपयोग मुख्य रूप से स्ट्रिंग या फ़ाइल में पैटर्न खोजने और बदलने के लिए किया जाता है। वे अधिकांश प्रोग्रामिंग भाषाओं जैसे पायथन, पर्ल, आर, जावा आदि द्वारा समर्थित हैं। कोड, लॉग फाइल, स्प्रैडशीट, या यहां तक ​​कि दस्तावेज़ जैसे टेक्स्ट से जान