डेटा माइनिंग पद्धति से संबंधित विभिन्न उपयोगकर्ता इंटरैक्शन मुद्दे हैं जो इस प्रकार हैं -
डेटाबेस में विभिन्न प्रकार के ज्ञान का खनन -विभिन्न उपयोगकर्ताओं की विभिन्न प्रकार के ज्ञान में रुचि हो सकती है। इस प्रकार, डेटा माइनिंग में डेटा विश्लेषण और ज्ञान खोज कार्यों का एक व्यापक स्पेक्ट्रम शामिल होना चाहिए, जिसमें डेटा लक्षण वर्णन, भेदभाव, संघ, वर्गीकरण, क्लस्टरिंग, प्रवृत्ति और विचलन विश्लेषण और समानता विश्लेषण शामिल हैं।
अमूर्तता के कई स्तरों पर ज्ञान का इंटरएक्टिव खनन - क्योंकि यह जानना जटिल है कि डेटाबेस में क्या पाया जा सकता है, डेटा माइनिंग प्रक्रिया इंटरैक्टिव होनी चाहिए। इंटरएक्टिव माइनिंग उपयोगकर्ताओं को दिए गए परिणामों के आधार पर डेटा माइनिंग अनुरोधों को समर्थन और परिष्कृत करने के लिए पैटर्न की खोज को लक्षित करने में सक्षम बनाता है। यह उपयोगकर्ता को जानकारी देखने और कई बारीकियों और कई कोणों से पैटर्न खोजने में मदद करेगा।
पृष्ठभूमि ज्ञान का समावेश - डेटाबेस से जुड़ा डोमेन ज्ञान, जिसमें अखंडता की कमी और कटौती नियम शामिल हैं, डेटा माइनिंग प्रक्रिया को लक्षित करने और गति देने में मदद कर सकते हैं, या पहचाने गए पैटर्न की दिलचस्पता का न्याय कर सकते हैं।
डेटा माइनिंग क्वेरी भाषाएं और तदर्थ डेटा माइनिंग - एक उच्च-स्तरीय डेटा माइनिंग क्वेरी भाषा विकसित करने की आवश्यकता है जिसे डेटाबेस या डेटा वेयरहाउस क्वेरी भाषा के साथ एकीकृत किया जा सकता है ताकि उपयोगकर्ता विश्लेषण के लिए डेटा के प्रासंगिक सेट के विनिर्देश का समर्थन करके तदर्थ डेटा माइनिंग कार्यों को परिभाषित कर सकें, डोमेन ज्ञान, खनन किए जाने वाले ज्ञान का प्रकार, और पहचान किए गए पैटर्न पर लागू होने वाली शर्तें और दिलचस्पता बाधाएं।
डेटा माइनिंग परिणामों की प्रस्तुति और विज़ुअलाइज़ेशन - खोजे गए ज्ञान को उच्च-स्तरीय भाषाओं, दृश्य परिभाषाओं या अन्य अभिव्यंजक रूपों में परिभाषित किया जाना चाहिए ताकि ज्ञान को आसानी से सीखा जा सके और मनुष्य द्वारा सीधे उपयोग किया जा सके।
बाहरी या अपूर्ण डेटा को संभालना - डेटाबेस में संग्रहीत डेटा बाहरी शोर, असाधारण मामलों, या अपूर्ण डेटा ऑब्जेक्ट को प्रतिबिंबित कर सकता है जो खराब होने के लिए पहचाने गए पैटर्न की सटीकता उत्पन्न कर सकता है। डेटा सफाई विधियों और डेटा विश्लेषण विधियों की आवश्यकता है जो आउटलेर्स को प्रबंधित कर सकते हैं।
पैटर्न मूल्यांकन - एक डेटा माइनिंग सिस्टम सैकड़ों पैटर्न को उजागर कर सकता है। खोजे गए कुछ पैटर्न दिए गए उपयोगकर्ता के लिए रुचिकर नहीं हो सकते हैं, सामान्य ज्ञान को परिभाषित कर सकते हैं या नवीनता की कमी कर सकते हैं। खोज प्रक्रिया का मार्गदर्शन करने और खोज स्थान को कम करने के लिए रुचिकर भाग का उपयोग अनुसंधान का एक अन्य सक्रिय क्षेत्र है।
समानांतर, वितरित, और वृद्धिशील अद्यतन एल्गोरिदम - कई डेटाबेस का बड़ा आकार, डेटा का व्यापक वितरण, और कुछ डेटा माइनिंग विधियों की कम्प्यूटेशनल जटिलता समानांतर और वितरित डेटा माइनिंग एल्गोरिदम की उन्नति को प्रेरित करने वाले कारक हैं।