<पी> ई-कॉमर्स निर्यात डेटा अधिकांश समय गड़बड़ रहता है। एक फ़ाइल में कई SKU विविधताएं, असंगत ग्राहक जानकारी, संयुक्त पता फ़ील्ड, डुप्लिकेट या शून्य मान और बिखरे हुए मूल्य निर्धारण विवरण शामिल हो सकते हैं। यदि आपने कभी एक्सेल या पावर बीआई में ऐसे डेटा का विश्लेषण करने का प्रयास किया है, तो आप जानते हैं कि चीजें कितनी जल्दी जटिल हो जाती हैं। यहीं पर पावर क्वेरी अविश्वसनीय रूप से उपयोगी हो जाती है। इससे कोई फर्क नहीं पड़ता कि आप किस टूल का उपयोग कर रहे हैं - एक्सेल या पावर बीआई - पावर क्वेरी जटिल फॉर्मूले लिखे बिना कच्चे ई-कॉमर्स डेटा को साफ और नया आकार देने में मदद करती है। <पी> इस ट्यूटोरियल में, हम ई-कॉमर्स बिक्री डेटा के लिए पांच आवश्यक पावर क्वेरी ट्रांसफ़ॉर्मेशन सीखेंगे जो विशेष रूप से ऑनलाइन स्टोर डेटासेट के लिए उपयोगी हैं।
SKU वेरिएशन कॉलम को अनपिवोटिंग करना
<पी> कई ई-कॉमर्स निर्यात कई कॉलमों में ऑर्डर किए गए उत्पादों को संग्रहीत करते हैं, जैसे स्टॉक_एस, एसकेयू 1, एसकेयू 2, एसकेयू 3, वेरिएंट 1, वेरिएंट 2 और वेरिएंट 3, प्रत्येक में एक मात्रा होती है। इस संरचना का विश्लेषण करना कठिन है क्योंकि प्रत्येक ऑर्डर उत्पाद विवरण को कई स्तंभों में फैलाता है। पिवोट टेबल, DAX माप और SUM सूत्र इस विस्तृत प्रारूप में प्रभावी ढंग से एकत्रित नहीं हो सकते हैं। अनपिवोटिंग एक लंबी, सामान्यीकृत तथ्य तालिका बनाती है जो विश्लेषण के लिए आदर्श है। <पी> कदम: पी>- अपना डेटा पावर क्वेरी में लोड करें
- एसकेयू कॉलम (स्टॉक एस, एम, एल, एक्सएल) का चयन करें
- ट्रांसफ़ॉर्म पर जाएं टैब>> कॉलम को अनपिवोट करें चुनें
- पावर क्वेरी इन SKU कॉलम को दो नए कॉलम में परिवर्तित करती है और उनका नाम बदल देती है:
- विशेषता: आकार
- मान: मात्रा
<पी> इस परिवर्तन का उपयोग तब करें जब आपका निर्यात एकाधिक ऑर्डर किए गए उत्पादों को अलग-अलग पंक्तियों के बजाय अलग-अलग कॉलम में संग्रहीत करता है। शिपिंग एड्रेस स्ट्रिंग्स को कई फ़ील्ड में विभाजित करना
<पी> लगभग 90% कच्ची ई-कॉमर्स फ़ाइलें संपूर्ण शिपिंग पते को एक स्ट्रिंग में संग्रहीत करती हैं। इस फ़ील्ड को विभाजित करने से राज्य-स्तरीय कर रिपोर्टिंग, शिपिंग लागत अनुकूलन, क्षेत्रीय प्रदर्शन विश्लेषण और मैपिंग सक्षम हो जाती है। <पी> कदम: पी>- शिपिंग पता चुनें स्तंभ
- घर पर जाएं टैब>> स्प्लिट कॉलम चुनें>>डिलीमिटर द्वारा चुनें
- अपने डेटा के आधार पर, एक सीमांकक का उपयोग करें जैसे:
- अल्पविराम
- हाइफ़न
- लाइन ब्रेक
- कस्टम विभाजक
- मौजूदा डेटा के लिए, अल्पविराम चुनें विभाजक के रूप में
- ठीक क्लिक करें
- परिणामस्वरूप कॉलम को सार्थक लेबल में नाम बदलें:स्ट्रीट, शहर, पोस्टकोड और देश
<पी> एक बार पते विभाजित हो जाने पर, आप शहर के अनुसार ऑर्डर, ज़ोन के अनुसार डिलीवरी प्रदर्शन, क्षेत्र के अनुसार बिक्री और विशिष्ट स्थानों से दोहराए जाने वाले ग्राहकों का विश्लेषण कर सकते हैं। यह स्थानीय डिलीवरी व्यवसायों और क्षेत्र-आधारित बिक्री रिपोर्टिंग के लिए विशेष रूप से उपयोगी है। <पी> उन्नत नोट: सभी पते समान प्रारूप का पालन नहीं करते हैं. कुछ में अतिरिक्त हिस्से, गायब हिस्से या अपार्टमेंट विवरण हो सकते हैं। इन मामलों में, आप यह कर सकते हैं: - विभाजन के बाद रिक्त स्थान को ट्रिम करें
- चयनित भागों को वापस एक साथ मिलाएं
- डिलीमिटर से पहले/बाद में टेक्स्ट निकालें का उपयोग करें
- अपवाद प्रबंधन के लिए कस्टम कॉलम बनाएं
डेटा प्रकारों को ट्रिम करना, साफ़ करना और मानकीकृत करना
<पी> बड़े ई-कॉमर्स डेटासेट में, ग्राहक के नाम, SKU, ईमेल पते और उत्पाद श्रेणियों में अक्सर अग्रणी या अनुगामी स्थान, गैर-मुद्रण योग्य वर्ण और असंगत पूंजीकरण होते हैं। डेटा प्रकार भी बेमेल हो सकते हैं, जैसे पाठ के रूप में संग्रहीत संख्यात्मक मान। <पी> ये छोटे-छोटे मुद्दे बड़ी समस्याएँ पैदा कर सकते हैं। एक ही डेटा अलग-अलग मानों के रूप में प्रकट हो सकता है, मर्ज ऑपरेशन में विफल हो सकता है, या डुप्लिकेट समूह बना सकता है। <पी> डेटा साफ़ करना: पी>- रिक्त स्थान ट्रिम करें:
- टेक्स्ट कॉलम चुनें
- ट्रांसफ़ॉर्म पर जाएं>> प्रारूप चुनें>> ट्रिम चुनें
- यह प्रारंभ और अंत से अतिरिक्त रिक्त स्थान हटा देता है
- छिपे हुए अक्षरों को साफ़ करें:
- समान कॉलम चयनित होने पर,
- प्रारूप चुनें>> साफ़ चुनें
- यह गैर-मुद्रण योग्य वर्णों को हटा देता है
- आवरण का मानकीकरण करें:
- ट्रांसफ़ॉर्म पर जाएं>> प्रारूप चुनें>> चुनें:
- प्रत्येक शब्द को बड़े अक्षरों में लिखें नामों के लिए
- लोअरकेस यदि आवश्यक हो तो ईमेल के लिए
<पी> डेटा प्रकारों का मानकीकरण: पी> - तिथि कॉलम चुनें
- घर पर जाएं टैब>> डेटा प्रकार चुनें>>तिथिचुनें
- यदि आवश्यक हो, तो एक कॉलम जोड़ें:
- कॉलम जोड़ें पर जाएं टैब>> दिनांक का विस्तार करें
- वर्ष चुनें , महीना , दिन , तिमाही , सप्ताह का दिन
- मात्रा और कीमत जैसे संख्यात्मक कॉलम चुनें
- कॉलम हेडर आइकन का विस्तार करें>> दशमलव संख्या चुनें
- या ट्रांसफ़ॉर्म पर जाएं टैब>> डेटा प्रकार चुनें>> दशमलव संख्या चुनें या संपूर्ण संख्या
<पी> यह परिवर्तन आवश्यक है क्योंकि यह समूहीकरण, विलय, फ़िल्टरिंग और लुकअप संचालन को अधिक विश्वसनीय बनाता है। डुप्लिकेट हटाना और शून्य मानों को संभालना
<पी> ई-कॉमर्स डेटा में शून्यता आम बात है। कुछ हानिरहित हैं, जबकि अन्य गणनाओं को तोड़ देते हैं। भुगतान गेटवे और सिंक प्रक्रियाएं डुप्लिकेट ऑर्डरआईडी बना सकती हैं, और शून्य मात्रा या कीमतें कुल और दृश्य को तोड़ सकती हैं। यदि शून्य को सही ढंग से नहीं संभाला जाता है, तो परिणाम भ्रामक हो सकते हैं। <पी> डुप्लिकेट हटाना: पी>- ऑर्डरआईडी चुनें और ऑर्डर दिनांक कुंजी के रूप में (यह वैध उसी दिन दोहराए गए आदेशों को हटाने से रोकता है)
- घर पर जाएं टैब>> डुप्लिकेट निकालें चुनें
- केवल सही मायने में टूटी पंक्तियाँ हटाएँ:
- घर पर जाएं टैब>> रिक्त पंक्तियाँ हटाएँ चुनें (पहले उन पंक्तियों को फ़िल्टर करें जहां ऑर्डरआईडी शून्य है)
- यदि रिक्त छूट का मतलब कोई छूट नहीं है, तो शून्य को 0 से बदलें
- सभी मात्रा और मूल्य कॉलम चुनें
- ट्रांसफ़ॉर्म पर जाएं टैब>> मान बदलें चुनें :
- खोजने योग्य मान:शून्य
- इसके साथ बदलें:0
<पी> पाठ मान साफ़ करना: पी> - अनावश्यक उपसर्ग जैसे Stock_ हटाएं
- आकार कॉलम चुनें
- ट्रांसफ़ॉर्म पर जाएं टैब>> मान बदलें चुनें :
- खोजने का मूल्य:स्टॉक_
- इसके साथ बदलें:(खाली छोड़ें)
<पी> अब आकार मान साफ़ और पढ़ने योग्य दिखाई देते हैं। <पी>
<पी> बार-बार मान भरना: पी> - कभी-कभी किसी ऑर्डर की केवल पहली पंक्ति में ही ऑर्डरआईडी या ग्राहक का नाम होता है
- कॉलम चुनें
- ट्रांसफ़ॉर्म पर जाएं>>भरें चुनें>>नीचे चुनें
परिकलित कस्टम कॉलम बनाना
<पी> ई-कॉमर्स डेटा से, आप राजस्व या मार्जिन कॉलम प्राप्त कर सकते हैं। हालाँकि यह एक्सेल फ़ार्मुलों का उपयोग करके किया जा सकता है, लेकिन ताज़ा करने पर वे टूट जाते हैं। पावर क्वेरी कस्टम कॉलम स्वचालित रूप से पुनर्गणना करते हैं और आपकी ईटीएल पाइपलाइन का हिस्सा बने रहते हैं। <पी> नेट_रेवेन्यू: पी>- कॉलम जोड़ें पर जाएं टैब>> कस्टम कॉलम चुनें
- एक नाम दर्ज करें
- निम्न सूत्र सम्मिलित करें
[Unit_Price] * [Qty] * (1 - [Discount_Pct])<पी>
<पी> सकल_मार्जिन: पी> [Net_Revenue] - ([Cost_Per_Unit] * [Qty])<पी> मार्जिन_पीसीटी (%): पी>
if [Net_Revenue] = 0 then 0 else [Gross_Margin] / [Net_Revenue]
- डेटा प्रकार को स्पष्ट रूप से सेट करें:नेट_रेवेन्यू और ग्रॉस_मार्जिन से मुद्रा , मार्जिन_पीसीटी से प्रतिशत तक
<पी> महत्वपूर्ण: हमेशा विभाजन सूत्रों की रक्षा करें। हर में एक शून्य पावर क्वेरी में पूरे कॉलम में त्रुटियों का कारण बन सकता है और लोड के दौरान पंक्तियों को गिरा सकता है। पैटर्न का उपयोग करें यदि [X] =0 तो शून्य अन्यथा... किसी भी परिकलित अनुपात के लिए. उच्च-प्रदर्शन सारांश तालिकाओं के लिए समूहीकरण और एकत्रीकरण
<पी> लाखों पंक्तियों वाली कच्ची ई-कॉमर्स फ़ाइलें रिपोर्ट को धीमा कर सकती हैं। ग्रुपिंग ड्रिल-थ्रू विश्लेषण के लिए विस्तृत प्रश्नों को संरक्षित करते हुए डैशबोर्ड के लिए कुशल समग्र तालिकाएँ बनाती है। <पी> कदम: पी>- ट्रांसफ़ॉर्म पर जाएं>> इसके अनुसार समूह चुनें
- श्रेणी चुनें>> एकत्रीकरण जोड़ें पर क्लिक करें :
- नेट_रेवेन्यू का योग
- Margin_Pct का औसत
- ऑर्डर_आईडी (पंक्तियों) की संख्या
- नई क्वेरी को नाम दें Sales_Summary और मूल प्रति को Sales_Detail के रूप में रखें ड्रिल-थ्रू के लिए
<पी> प्रो टिप: Power BI में, विवरण क्वेरी पर "लोड सक्षम करें" अक्षम करें और प्रदर्शन में सुधार के लिए केवल सारांश और आयाम तालिकाएँ लोड करें। <पी> अंतिम चरण: पी> - घर पर जाएं टैब>> बंद करें और लागू करें चुनें डेटा लोड करने के लिए