डेटा माइनिंग सांख्यिकीय और गणितीय तकनीकों सहित पैटर्न पहचान तकनीकों का उपयोग करके, रिपॉजिटरी में सहेजे गए डेटा की एक उच्च मात्रा के माध्यम से उपयोगी नए सहसंबंध, पैटर्न और प्रवृत्तियों को खोजने की प्रक्रिया है। यह अनपेक्षित संबंधों की खोज करने के लिए तथ्यात्मक डेटासेट का विश्लेषण है और डेटा स्वामी के लिए तार्किक और सहायक दोनों तरह के नए तरीकों में रिकॉर्ड को सारांशित करना है।
डेटा माइनिंग तकनीकों का उपयोग तीन प्रकार के कार्यों के लिए तीन प्रकार के मॉडल बनाने के लिए किया जा सकता है जैसे वर्णनात्मक प्रोफाइलिंग, निर्देशित प्रोफाइलिंग और भविष्यवाणी।
विवरणात्मक रूपरेखा - वर्णनात्मक मॉडल परिभाषित करता है कि रिकॉर्ड में क्या है। आउटपुट कई चार्ट या संख्या या ग्राफिक्स है जो परिभाषित करता है कि क्या हो रहा है। परिकल्पना परीक्षण वर्णनात्मक मॉडल बनाता है। दूसरे शब्दों में, जब मॉडल का निर्माण किया जा रहा हो, तो निर्देशित रूपरेखा और भविष्यवाणी दोनों का एक उद्देश्य होता है।
प्रोफाइलिंग मॉडल में, फोकस इनपुट के समान समय सीमा से होता है। भविष्य कहनेवाला मॉडल में, फोकस अगली समय सीमा से होता है। भविष्यवाणी एक अवधि से डेटा में खोज डिजाइनों को परिभाषित करती है जो अगली अवधि में परिणामों को परिभाषित करने में सक्षम हैं। प्रोफाइलिंग और भविष्यवाणी के बीच अंतर को तीव्र करने का कारण यह है कि इसका मॉडलिंग पद्धति के साथ संबंध है, विशेष रूप से मॉडल सेट के निर्माण में समय का विश्लेषण।
निर्देशित प्रोफाइलिंग - प्रोफाइलिंग कई समस्याओं के लिए एक परिचित तरीका है। इसमें किसी परिष्कृत डेटा विश्लेषण को शामिल करने की आवश्यकता नहीं है। उदाहरण के लिए, सर्वेक्षण ग्राहक प्रोफाइल बनाने का एक सामान्य तरीका है। सर्वेक्षण से पता चलता है कि ग्राहक और संभावनाएं कैसी दिखती हैं, या कम से कम सर्वेक्षण के उत्तरदाताओं के सवालों के जवाब देने का तरीका।
प्रोफाइल अक्सर जनसांख्यिकीय चरों पर आधारित होते हैं, जैसे भौगोलिक स्थान, लिंग और आयु। चूंकि विज्ञापन इन्हीं चरों के अनुसार बेचे जाते हैं, जनसांख्यिकीय प्रोफाइल सीधे मीडिया रणनीतियों में बदल सकते हैं।
भविष्यवाणी - अतीत में क्या हुआ, इसका वर्णन करने के लिए प्रोफाइलिंग अतीत के डेटा का उपयोग करती है। भविष्यवाणी एक कदम आगे जाती है। भविष्य में क्या होने की संभावना है, इसका अनुमान लगाने के लिए भविष्यवाणी अतीत के डेटा का उपयोग करती है। यह जानकारी का गतिशील उपयोग है।
जबकि कम भंडारण शेष और सीडी स्वामित्व के बीच संबंध सीडी धारकों के प्रोफाइल में फायदेमंद नहीं हो सकता है, एक उच्च भंडारण शेष होने की संभावना (अन्य संकेतकों के संयोजन में) भविष्य की सीडी खरीद का एक भविष्यवक्ता है।
यह एक भविष्य कहनेवाला मॉडल का निर्माण कर रहा है जिसमें मॉडल इनपुट या भविष्यवक्ताओं और मॉडल आउटपुट के बीच समय में अलगाव की आवश्यकता होती है, भविष्यवाणी की जाने वाली चीज। यदि यह विभाजन समर्थित नहीं है, तो मॉडल काम नहीं करेगा।