डेटा माइनिंग के लिए क्रॉस इंडस्ट्री स्टैंडर्ड प्रोसेस (CRISP-DM) को M&V कार्यप्रणाली को और अधिक मानकीकृत करने और ऊर्जा बचत के अधिक कुशल अनुमान की अनुमति देने के दृष्टिकोण के रूप में मान्यता दी गई थी। क्रिस्प-डीएम के कई अनुप्रयोग हैं जो इस प्रकार हैं -
व्यावसायिक समझ - एम एंड वी की मदद के लिए डीएम के आवेदन की व्यवहार्यता बनाने के लिए केस स्टडी के रूप में एक बायोमेडिकल निर्माण सुविधा का चयन किया गया था। प्रक्रिया के मॉडलिंग और मूल्यांकन चरण में परिणामों को निष्पादित करने के लिए विश्लेषण के तहत व्यवसाय की गुणवत्ता की समझ महत्वपूर्ण थी। इसे प्रोसेस वॉक-थ्रू, लर्निंग प्रोसेस फ़्लो डायग्राम, और पाइपिंग और इंस्ट्रुमेंटेशन डायग्राम करके लागू किया गया था।
इस चरण से विश्लेषण की सीमा के भीतर प्रणालियों के ज्ञान की आवश्यकता थी और सुविधा की इंजीनियरिंग टीम के साथ कुछ और मुद्दों को समझा गया था। विश्लेषण की सीमा संपूर्ण विनिर्माण सुविधा में विद्युत ऊर्जा की खपत थी।
डेटा समझ - CRISP-DM संदर्भ मॉडल की डेटा समझने की प्रक्रिया सुविधा में डेटा प्रौद्योगिकी के बुनियादी ढांचे की जांच के माध्यम से पूरी की गई थी। ऊर्जा खपत डेटा के प्रवाह और जिन डेटाबेस में इसे सहेजा गया था, उनकी समझ हासिल कर ली गई थी।
डेटा तैयार करना - मीटरिंग की विशेषता के कारण ऊर्जा खपत डेटा की गणना करना जटिल है। विद्युत ऊर्जा के लिए संचयी मीटर का उपयोग किया जाता है और परिणामस्वरूप, आउटपुट डेटा पर पूर्व-प्रसंस्करण पूरा किया जाना चाहिए। जांच के तहत मामले में, यह उपयोगकर्ता को आउटपुट होने से पहले हासिल किया गया था।
लेकिन डेटा की इस पूर्व-सफाई की परवाह किए बिना, आउटलेयर डेटा सेट में बने रहे क्योंकि पूर्व-सफाई प्रक्रिया ने सभी विसंगतियों को समाप्त नहीं किया। इसलिए, डेटा तैयार करने के चरण का उपयोग उपयोगकर्ता को दिए गए डेटा सेट में कुछ शेष आउटलेयर को समाप्त करने के लिए किया गया था।
साइट पर विद्युत ऊर्जा उपभोक्ताओं के संपूर्ण विश्लेषण के लिए आवश्यक डेटा एकत्र करने के लिए दो डेटा स्रोतों का उपयोग किया गया - ऊर्जा प्रबंधन अनुप्रयोग और पवन टरबाइन प्रबंधन अनुप्रयोग।
साइट पर आकर्षक विद्युत ऊर्जा की गणना संचयी किलोवाट-घंटे (kWh) मीटर द्वारा की जाती है। इस डेटा के पूर्व-प्रसंस्करण में मीटर त्रुटियों से उत्पन्न आउटलेर्स का पता लगाना और kWh से डेटा को किलोवाट (kW) में औसत विद्युत भार में बदलना शामिल था। कुछ डेटा को समान प्रारूप और इकाइयों में विश्लेषण करने के लिए दूसरे चरण की आवश्यकता थी।
मॉडलिंग - डेटा तैयार करने की प्रक्रिया से डेटासेट आउटपुट डेटा क्लींजिंग के परिणाम के रूप में एक स्वच्छ और कार्यात्मक प्रारूप में था। इस केस स्टडी के गॉल के लिए, संपीड़ित हवा का भार मॉडलिंग के लिए चुनी गई मात्रा थी, क्योंकि यह उपलब्ध ऊर्जा डेटा की शक्ति को दर्शाने के लिए सबसे उपयुक्त चर था।
जब लोड को उच्च स्तर पर माना जाता था, तो साइट पर अन्य आवश्यक ऊर्जा उपयोगकर्ताओं के लिए कोई स्पष्ट और स्पष्ट संबंध नहीं था। आपूर्ति के शेड्यूलिंग और मानक संचालन प्रक्रिया की उपस्थिति के कारण अन्य आवश्यक ऊर्जा उपयोगकर्ता अधिक अनुमानित थे।