<पी> एक सामान्य स्प्रेडशीट गलती कच्चे डेटा को बदलना है। कोई व्यक्ति डेटा की एकमात्र प्रतिलिपि में "सिर्फ एक चीज़ ठीक कर देता है", या गलती से मूल डेटासेट को अधिलेखित कर देता है, और आप गड़बड़ी को ठीक करने में घंटों खर्च कर देते हैं। हम सब वहाँ रहे हैं:एक त्वरित सुधार खोई हुई जानकारी और संदिग्ध परिणामों के दुःस्वप्न में बदल जाता है। <पी> इससे बचने के लिए, सुनहरे नियम का पालन करें:"अपने कच्चे डेटा को न छुएं।" अपने मूल डेटासेट को अछूता रखकर और प्रतियों या व्युत्पन्न संस्करणों पर काम करके, आप त्रुटियों को कम करते हैं, पता लगाने की क्षमता बनाए रखते हैं, और अपने वर्कफ़्लो को अधिक प्रतिलिपि प्रस्तुत करने योग्य बनाते हैं। <पी> इस ट्यूटोरियल में, हम एक सरल वर्कफ़्लो बदलाव के बारे में जानेंगे जो आपको स्वयं से बचा सकता है।
यह वर्कफ़्लो क्यों मायने रखता है
- त्रुटि निवारण: कच्चा डेटा आपकी सच्चाई का स्रोत है। इसे सीधे बदलने से (उदाहरण के लिए, पंक्तियों को हटाना या कोशिकाओं को ओवरराइट करना) अपरिवर्तनीय गलतियाँ हो सकती हैं, खासकर बड़े या जटिल डेटासेट में।
- पुनरुत्पादन: यदि आपको अपने विश्लेषण पर दोबारा गौर करने या इसे दूसरों के साथ साझा करने की आवश्यकता है, तो अछूता कच्चा डेटा होने से आप बिना अनुमान लगाए अपने कदम वापस ले सकते हैं।
- संस्करण नियंत्रण लाइट: कच्चे डेटा को केवल-पढ़ने के लिए उपयोग करना मूल संस्करण नियंत्रण की नकल करता है और आपको "डेटा आपदाओं" से बचाता है।
- दक्षता: डेटा को साफ करने और अलग-अलग शीट में बदलने से सब कुछ व्यवस्थित रहता है, जिससे बाद में इसे पुनरावृत्त करना या स्वचालित करना आसान हो जाता है।
चरण 1:अपना कच्चा डेटा आयात करना
- एक नई स्प्रेडशीट फ़ाइल खोलें
- "Raw_Data" नाम से एक नई शीट बनाएं
- अपना कच्चा डेटासेट आयात करें
- डेटा पर जाएं टैब>> डेटा प्राप्त करें चुनें>> अपना स्रोत चुनें
<पी> मुख्य नियम: पी> <पी> एक बार आयात करने के बाद, आकस्मिक संपादन को रोकने के लिए इस शीट को लॉक कर दें। - शीट टैब पर राइट-क्लिक करें>> प्रोटेक्ट शीट चुनें
- यदि आवश्यक हो तो पासवर्ड सेट करें
- शीर्ष पर एक नोट जोड़ें:"संपादित न करें। केवल डेटा स्रोत करें।"
<पी> यह शीट अब आपका अछूता संग्रह है। यहां कभी भी सेल संपादित न करें। चरण 2:एक सफ़ाई शीट बनाना
- "Cleaned_Data" नामक एक नई शीट जोड़ें
- मानवीय त्रुटि से बचने के लिए कच्चे डेटा को मैन्युअल रूप से कॉपी करने के बजाय उसका संदर्भ लें
- डेटा को गतिशील रूप से खींचने के लिए सूत्रों का उपयोग करें
- सेल A1 में, निम्न सूत्र डालें:
- श्रेणी को भरने के लिए खींचें, या दक्षता के लिए सरणी सूत्रों का उपयोग करें:
<पी> यह सूत्र एक लिंक की गई प्रति बनाता है. अब आप मूल शीट को प्रभावित किए बिना इस शीट को साफ कर सकते हैं। चरण 3:नई शीट में डेटा साफ़ करना
<पी> अब इस शीट में अपना गंदा डेटा साफ़ करें। कॉलम दर कॉलम काम करें या बैच संचालन के लिए अंतर्निहित टूल का उपयोग करें। <पी> असंगत प्रारूपों को ठीक करना (जैसे, दिनांक): पी>- मान लें कि कॉलम A में तारीखें असंगत हैं।
- एक नए कॉलम में, दिनांक को मानकीकृत करने के लिए एक सूत्र का उपयोग करें:
=IF(A2="","", IF(ISNUMBER(A2),A2, IFERROR( DATEVALUE(SUBSTITUTE(SUBSTITUTE(A2,"-","/"),".","/")), DATE(RIGHT(A2,4),MID(A2,4,2),LEFT(A2,2)))))<पी>
<पी> टाइपो और विसंगतियों को संभालना: पी> - PROPER() जैसे सूत्रों का उपयोग करें पाठ के बड़े अक्षरों को मानकीकृत करने के लिए
- Ctrl + Hदबाएँ ढूंढें और बदलें खोलने के लिए संवाद बॉक्स
- गलत प्रविष्टियों को सही मानों से बदलें
- सभी बदलें क्लिक करें
<पी> डुप्लिकेट हटाना: पी> - यदि आवश्यक हो तो कॉलम को क्रमबद्ध करें
- डेटा पर जाएं टैब>> डुप्लिकेट निकालें चुनें
- जैसे सूत्र का उपयोग करके रिक्त स्थान को तार्किक रूप से भरें:
- कुल बिक्री:
- एक बार साफ हो जाने पर, नए कॉलम को कॉपी करें और इसे मूल गंदे कॉलम में मान के रूप में पेस्ट करें
- राइट-क्लिक करें>> पेस्ट स्पेशल चुनें>> मान चुनें
<पी> पूरी प्रक्रिया के दौरान, अपने परिवर्तनों को एक अलग "नोट्स" शीट में या इनलाइन टिप्पणियों (सम्मिलित करें>> टिप्पणी) का उपयोग करके दस्तावेजित करें। चरण 4:रिपोर्ट शीट बनाना (अपने डेटा का विश्लेषण करना)
<पी> विश्लेषण को एक नई शीट में अलग करना अच्छा अभ्यास है। एक और शीट जोड़ें और इसे "विश्लेषण" नाम दें। फ़ॉर्मूले, पिवोटटेबल्स या क्वेरीज़ के लिए "Cleaned_Data" शीट से डेटा का उपयोग करें। <पी> एक पिवोटटेबल बनाना: पी>- सम्मिलित करें पर जाएं टैब>> पिवोटटेबल चुनें
- "Cleaned_Data" से स्रोत श्रेणी का चयन करें
- स्थान चुनें>>ठीकपर क्लिक करें
<पी> मासिक सारांश बनाना: पी> - पिवोटटेबल फ़ील्ड से सूची
- खींचें क्षेत्र और उत्पाद पंक्तियों तक क्षेत्र
- खींचें तिथि कॉलम पर क्षेत्र
- खींचें कुल बिक्री मूल्योंके लिए क्षेत्र
- पिवोटटेबल विश्लेषण पर जाएं टैब>> स्लाइसर डालें चुनें
- क्षेत्र चुनें
- ठीक क्लिक करें
<पी> अब आपकी रिपोर्ट स्वच्छ डेटा पर निर्भर करती है - गंदे निर्यात पर नहीं। यह सफाई को अंतर्दृष्टि से अलग रखता है और यदि आप अपना सफाई तर्क अपडेट करते हैं तो आसानी से ताज़ा होने की अनुमति देता है। चरण 5:एक "ताज़ा" दिनचर्या बनाना (एक आदत जो घंटों बचाती है)
<पी> हर बार एक नया निर्यात आता है:- डेटा को "Raw_Data" शीट में बदलें (समान हेडर रखें)
- ऐसानहींकरें "Raw_Data" शीट में कोई भी मान संपादित करें
- "Cleaned_Data" शीट को अपडेट करें
- स्वचालित रीफ्रेश समय निर्धारित करें या मैन्युअल रूप से रीफ्रेश करें
- डेटा पर जाएं टैब>> सभी को ताज़ा करें पर क्लिक करें
<पी> यह साप्ताहिक रिपोर्टिंग को मैन्युअल सफ़ाई परियोजना के बजाय एक दोहराने योग्य प्रक्रिया में बदल देता है। चरण 6:अपनी फ़ाइल को सहेजना और संस्करणित करना
- इस रूप में सहेजें: "Project_Data_v1.xlsx" जैसे फ़ाइल नामों का उपयोग करें और समय के साथ संस्करण संख्या बढ़ाएँ
- सहयोग के लिए: वर्कफ़्लो अखंडता बनाए रखने के लिए केवल पढ़ने योग्य संस्करण साझा करें
- स्वचालित: कच्चे डेटा को एक क्वेरी में लोड करने के लिए एक्सेल में पावर क्वेरी सीखें जो स्वचालित रूप से साफ हो जाती है और कच्ची शीट को छुए बिना ताज़ा हो जाती है