<पी>
<पी> डेटा विश्लेषण और गणना करने के लिए डेटा की सफाई महत्वपूर्ण है और यह डेटा तैयार करने और फ़ॉर्मेट करने में पहला कदम है। डेटा सफाई का अर्थ है विसंगतियों, त्रुटियों और अवांछित स्वरूपण को दूर करना। उन्नत सफाई के लिए माइक्रोसॉफ्ट एक्सेल की पावर क्वेरी और गूगल शीट्स के रेगेक्स दोनों फ़ंक्शन शक्तिशाली हैं। आइए हम आपको दिखाते हैं कि तुलना करते समय उन्नत डेटा सफाई के लिए पावर क्वेरी और Google शीट्स के REGEX फ़ंक्शन का उपयोग कैसे करें। एक्सेल की पावर क्वेरी
<पी> पावर क्वेरी एक अंतर्निहित एक्सेल सुविधा है जो डेटा परिवर्तन और डेटा सफाई के लिए उपयोगकर्ता के अनुकूल इंटरफेस प्रदान करती है। यह बिना किसी जटिल फ़ॉर्मूले के डेटा को साफ़ और प्रारूपित करता है। पावर क्वेरी विभिन्न स्रोतों से डेटा आयात करती है और मजबूत डेटा कनेक्टिविटी प्रदान करती है। इसमें जटिल डेटा-सफाई कार्य करने के लिए लचीली विशेषताएं हैं। Google शीट्स के REGEX फ़ंक्शन
<पी> Google शीट्स के REGEX फ़ंक्शंस टेक्स्ट डेटा के भीतर पैटर्न ढूंढने के लिए नियमित अभिव्यक्तियों का उपयोग करते हैं, जो इसे पार्सिंग, फ़ॉर्मेटिंग या टेक्स्ट प्रविष्टियों को मान्य करने के लिए आदर्श बनाते हैं। - REGEXREPLACE: रेगुलर एक्सप्रेशन से मेल खाने वाले टेक्स्ट को निर्दिष्ट टेक्स्ट से बदल देता है।
- =REGEXREPLACE(पाठ, रेगुलर_एक्सप्रेशन, प्रतिस्थापन)
- REGEXMATCH: जाँचता है कि क्या टेक्स्ट स्ट्रिंग निर्दिष्ट रेगुलर एक्सप्रेशन से मेल खाती है।
- =REGEXMATCH(टेक्स्ट, रेगुलर_एक्सप्रेशन)
- REGEXEXTRACT: नियमित अभिव्यक्ति के आधार पर पाठ से मेल खाने वाली सबस्ट्रिंग निकालता है।
- =REGEXEXTRACT(text, रेगुलर_एक्सप्रेशन)
<पी> ये फ़ंक्शन डेटा सफ़ाई, पैटर्न पहचान और गतिशील पाठ हेरफेर के लिए उपयोगी हैं। <पी> आइए एक कच्चे डेटासेट पर विचार करें जिसमें गलत स्वरूपण, अवांछित वर्ण, त्रुटियां, रिक्त स्थान इत्यादि शामिल हैं। एक्सेल की पावर क्वेरी और Google शीट्स के REGEX फ़ंक्शंस का उपयोग करके हम आपको एक दूसरे की तुलना करते हुए उन्नत डेटा सफाई दिखाएंगे। अवांछित वर्णों को हटाना
<पी> कोष्ठक, डैश या रिक्त स्थान जैसे अवांछित वर्णों वाले फ़ोन नंबरों के डेटासेट को साफ़ करें। पावर क्वेरी
- डेटा श्रेणी का चयन करें।
- डेटा पर जाएं टैब>> तालिका/श्रेणी से चुनें .
- पावर क्वेरी संपादक पॉप अप हो जाएगा. कॉलम का चयन करें. हमने फ़ोन नंबर चुना कॉलम.
- ट्रांसफ़ॉर्म पर जाएं टैब>> मान बदलें चुनें .
- मान बदलें डायलॉग बॉक्स पॉप अप होगा;
- खोजने योग्य मान में बॉक्स:अवांछित वर्ण ((, ), -, ) को अलग-अलग दर्ज करें।
- में से बदलें बॉक्स:इसे खाली रखें या यदि आपके पास बदलने के लिए कोई मान है तो आप वह मान डाल सकते हैं।
- ठीक क्लिक करें .
<पी>
- बंद करें और लोड करें चुनें साफ़ किए गए डेटा को एक्सेल में वापस लाने के लिए।
<पी>
Google शीट्स का REGEXREPLACE फ़ंक्शन
<पी> आइए REGREPLACE फ़ंक्शन का उपयोग करके Google शीट में फ़ॉर्मेटिंग के साथ-साथ डेटा साफ़ करें। सेल G2 में निम्नलिखित सूत्र डालें।
=ARRAYFORMULA(IF(LEN(REGEXREPLACE(D2:D6, "[^0-9]", ""))=10,
"(" & MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 1, 3) & ") " &
MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 4, 3) & "-" &
MID(REGEXREPLACE(D2:D6, "[^0-9]", ""), 7, 4),
"Invalid"))
<पी> यह फ़ॉर्मूला सभी गैर-संख्यात्मक वर्ण हटा देगा. फिर, यह जांच करेगा कि साफ़ किए गए नंबर में ठीक 10 अंक हैं या नहीं। यदि यह मान्य है, तो इसे (XXX) XXX-XXXX के रूप में प्रारूपित करें; अन्यथा, यह "अमान्य" लौटाता है। <पी>
Google शीट्स का रीग्रेप्लेस फ़ंक्शन
<पी> अनावश्यक विशेष वर्णों को साफ़ करने के लिए आप निम्न सूत्र का उपयोग कर सकते हैं। <पी> सूत्र: पी>
=REGEXREPLACE(D2, "[^a-zA-Z0-9]", "")
<पी> यह [^a-zA-Z0-9] पैटर्न ऐसे किसी भी वर्ण को हटा देता है जो अक्षर या अंक नहीं है। <पी> यदि आप रेगुलर एक्सप्रेशन से परिचित हैं, तो आप REGREPLACE फ़ंक्शन का उपयोग कर सकते हैं, यह एकल सूत्र के भीतर अक्षरों या अंकों को छोड़कर किसी भी वर्ण को हटा देता है। <पी>
टेक्स्ट केस का मानकीकरण
<पी> डेटासेट में मिश्रित पाठ हो सकता है; आप सभी टेक्स्ट प्रविष्टियों को लोअरकेस या शीर्षक केस में परिवर्तित कर सकते हैं। पावर क्वेरी
<पी> डेटा श्रेणी का चयन करके और डेटा पर नेविगेट करके पावर क्वेरी खोलें टैब>> तालिका/श्रेणी से चुनें . - रूपांतरित करने के लिए टेक्स्ट वाले कॉलम का चयन करें।
- ट्रांसफ़ॉर्म पर जाएं टैब>> प्रत्येक शब्द को बड़े अक्षरों में लिखें चुनें .
<पी>
Google शीट्स प्रॉपर फ़ंक्शन
<पी> Google शीट्स में प्रत्येक शब्द को पूरी तरह से रेगेक्स के साथ बड़े अक्षरों में लिखने का कोई तरीका नहीं है, क्योंकि Google शीट्स का REGEXREPLACE सीधे रेगेक्स पैटर्न या प्रतिस्थापन के भीतर ऊपरी और निचले कार्यों का समर्थन नहीं करता है। आप PROPER, UPPER, या LOWER जैसे बाहरी फ़ंक्शंस का उपयोग कर सकते हैं। <पी> यह सूत्र सुनिश्चित करता है कि प्रत्येक शब्द को बड़े अक्षरों में लिखा जाए, और किसी भी गैर-प्रथम अक्षर को छोटे अक्षर में बदल दिया जाए। <पी>
डेटा को डिलीमीटर द्वारा विभाजित करना
<पी> आप किसी भी मर्ज किए गए टेक्स्ट या नाम को सीमांकक द्वारा अलग-अलग कॉलम में विभाजित कर सकते हैं। आइए पावर क्वेरी और Google शीट्स के REGEX फ़ंक्शंस का उपयोग करके डेटा साफ़ करें। पावर क्वेरी
<पी> डेटा श्रेणी का चयन करके और डेटा पर नेविगेट करके पावर क्वेरी खोलें टैब>> तालिका/श्रेणी से चुनें . - नाम वाला कॉलम चुनें।
- घर पर जाएं टैब>> स्प्लिट कॉलम से> डिलीमिटर द्वारा चुनें .
<पी>
- डिलीमिटर द्वारा विभाजित कॉलम में संवाद बॉक्स;
- में डिलीमिटर चुनें और दर्ज करें: एक स्पेस() चुनें .
- ठीक क्लिक करें .
<पी>
- परिणामी कॉलम का नाम बदलकर "प्रथम नाम" और "अंतिम नाम" रखें।
<पी>
Google शीट REGEXEXTRACT फ़ंक्शन
<पी> आप डेटा को सीमांकक द्वारा विभाजित करने के लिए REGEXEXTRACT फ़ंक्शन का उपयोग कर सकते हैं। अपने चयनित सेल में निम्नलिखित सूत्र सम्मिलित करें।
=REGEXEXTRACT(E9, "^([^ ]+) (.+)$")
<पी> यह सूत्र अंतिम नाम और प्रथम नाम को दो कक्षों में अलग करता है। यह आवश्यकतानुसार अतिरिक्त कॉलम का उपयोग करता है। <पी>
पावर क्वेरी बनाम Google शीट REGEX का उपयोग कब करें
<पी> बुनियादी से उन्नत डेटा सफ़ाई के लिए पावर क्वेरी सबसे उपयोगी है। यह उपयोगकर्ता के अनुकूल इंटरफेस के साथ अधिक व्यापक, संरचित डेटा परिवर्तन के लिए आदर्श है। जटिल डेटासेट, संरचित जुड़ाव और मर्जिंग डेटा के साथ काम करते समय यह कुशल है। <पी> Google शीट REGEX फ़ंक्शंस त्वरित टेक्स्ट-आधारित संचालन और व्यक्तिगत कोशिकाओं के भीतर विशिष्ट टेक्स्ट निष्कर्षण के लिए बिल्कुल सही हैं। यदि आप रेगुलर एक्सप्रेशन सिंटैक्स के साथ सहज हैं तो REGEX फ़ंक्शन विशेष रूप से सहायक होते हैं। निष्कर्ष
<पी> पावर क्वेरी और Google शीट्स के REGEX फ़ंक्शन डेटा सफाई के लिए पूरक उपकरण प्रदान करते हैं। पावर क्वेरी एक्सेल उपयोगकर्ताओं के लिए आदर्श है, जिन्हें बड़े डेटासेट पर बैच परिवर्तन की आवश्यकता होती है, जबकि Google शीट REGEX फ़ंक्शंस छोटे डेटासेट में टेक्स्ट-आधारित संचालन के लिए लचीलापन प्रदान करते हैं। आप शक्तिशाली, सुव्यवस्थित डेटा सफाई के लिए दोनों का प्रभावी ढंग से उपयोग कर सकते हैं! दोनों टूल को समझकर, आप अधिकांश सफाई कार्यों को संभाल सकते हैं, चाहे आप एक्सेल में हों या Google शीट में! समाधान के साथ निःशुल्क उन्नत एक्सेल अभ्यास प्राप्त करें!