हीटमैप संख्यात्मक डेटा का एक ग्राफिकल डिस्प्ले है जहां रंग का उपयोग मूल्यों को दर्शाने के लिए किया जाता है। डेटा माइनिंग के संदर्भ में, हीटमैप दो उद्देश्यों के लिए विशेष रूप से उपयोगी होते हैं - सहसंबंध तालिकाओं को देखने के लिए और डेटा में लापता मूल्यों की कल्पना करने के लिए। दोनों ही मामलों में, जानकारी को द्वि-आयामी तालिका में संप्रेषित किया जाता है।
हीटमैप डेटा का एक ग्राफिकल विवरण है जिसे कई मानों को परिभाषित करने के लिए रंग-कोडिंग की एक प्रणाली की आवश्यकता होती है। हीटमैप्स का उपयोग विश्लेषिकी के विभिन्न रूपों में किया जाता है, लेकिन आमतौर पर विशिष्ट वेब पेजों या वेबपेज टेम्प्लेट पर उपयोगकर्ता के व्यवहार को दिखाने के लिए उपयोग किया जाता है। हीटमैप्स का उपयोग यह प्रदर्शित करने के लिए किया जा सकता है कि उपयोगकर्ताओं ने किसी पृष्ठ पर कहां दबाया है, उन्होंने पृष्ठ को कितनी दूर तक स्क्रॉल किया है, या आंखों की ट्रैकिंग परीक्षणों के परिणाम दिखाने के लिए उपयोग किया है।
पी चर के लिए एक सहसंबंध तालिका में पी पंक्तियां और पी कॉलम हैं। एक डेटा तालिका में p कॉलम (चर) और n पंक्तियाँ (अवलोकन) शामिल हैं। यदि कई पंक्तियाँ बड़ी हैं, तो एक सबसेट का उपयोग किया जा सकता है। दोनों ही मामलों में, मूल्यों के बजाय रंग-कोडिंग को स्कैन करना आसान और तेज़ है।
हीटमैप्स बड़ी संख्या में मानों का निर्धारण करते समय सहायक होते हैं, लेकिन वे बार चार्ट सहित अधिक सटीक ग्राफिकल डिस्प्ले के लिए पुनर्स्थापना नहीं हैं, क्योंकि रंग अंतर को ठीक से पहचाना नहीं जा सकता है।
अनुपलब्ध मान हीटमैप में, पंक्तियाँ डेटा से और कॉलम चर से सहसंबंधित होती हैं। इसे प्रारंभिक डेटासेट की बाइनरी कोडिंग की आवश्यकता होती है जहां 1 गुम मान को इंगित करता है और 0 अन्यथा। यह नई बाइनरी तालिका रंगीन है जिसमें केवल अनुपलब्ध मान कक्ष शामिल हैं (मान 1 के साथ) रंगीन हैं।
डेटा में दुनिया भर के कई देशों पर आर्थिक, सामाजिक, राजनीतिक और "कल्याण" डेटा शामिल है (प्रत्येक पंक्ति एक देश है)। चर कई स्रोतों से मर्ज किए गए थे, और प्रत्येक स्रोत के लिए, जानकारी हर देश में हमेशा उपलब्ध नहीं थी।
अनुपलब्ध डेटा हीटमैप संयुक्त डेटा फ़ाइल में "अनुपलब्धता" के स्तर और मात्रा को देखने का समर्थन करता है। "अनुपलब्धता" के कुछ डिज़ाइन ऐसे चर उभर कर आते हैं जो लगभग सभी अवलोकनों के लिए गायब हैं, और पंक्तियों (देशों) के समूहों में कई मान गायब हैं।
कम लापता होने वाले चर भी स्पष्ट हैं। इस डेटा का उपयोग यह तय करने के लिए किया जा सकता है कि गुमपन को कैसे प्रबंधित किया जाए (उदाहरण के लिए, कुछ चर छोड़ना, कुछ डेटा छोड़ना, आरोपित करना, आदि)।
Google Analytics या साइट उत्प्रेरक जैसे विश्लेषिकी उपकरण मेट्रिक्स का समर्थन करने में महान हैं, यह प्रदर्शित करने के लिए कि उपयोगकर्ता किन पृष्ठों पर जाते हैं, लेकिन उन्हें विवरण की आवश्यकता हो सकती है जब यह समझने के लिए कि उपयोगकर्ता उन पृष्ठों का उपयोग कैसे करते हैं। हीटमैप उपयोगकर्ताओं के व्यवहार का अधिक व्यापक अवलोकन दे सकता है।
हीटमैप मानक विश्लेषिकी रिपोर्ट की तुलना में अधिक दृश्यमान होते हैं, जो उन्हें एक नज़र में विश्लेषण करने के लिए आसान बना सकते हैं। यह उन्हें और अधिक सुलभ बनाता है, खासकर उन लोगों के लिए जो बड़ी मात्रा में डेटा का विश्लेषण करने के आदी नहीं हैं।
अच्छे हीट मैपिंग टूल, जैसे कि क्रेज़ीएग, विश्लेषकों को डेटा को विभाजित और फ़िल्टर करने में सक्षम बनाता है। इसका मतलब यह है कि यह देखना आसान हो सकता है कि एक विशिष्ट पृष्ठ के साथ कितने प्रकार के उपयोगकर्ता जुड़ रहे हैं।