सांख्यिकी आंकड़ों से सीखने का विज्ञान है। इसमें रिकॉर्ड के सेट की योजना बनाने और बाद के डेटा प्रशासन से लेकर अंतिम गतिविधियों तक सब कुछ शामिल है, जिसमें डेटा नामक संख्यात्मक तथ्यों से निष्कर्ष निकालना और परिणामों की प्रस्तुति शामिल है। सांख्यिकी सबसे आवश्यक व्यक्ति से संबंधित है:दुनिया के बारे में और अधिक जानने की आवश्यकता और यह कैसे नवाचार और अनिश्चितता के सामने काम करता है।
सूचना ज्ञान का संचार है। डेटा को क्रूड डेटा कहा जाता है न कि स्वयं ज्ञान। डेटा से ज्ञान तक का क्रम इस प्रकार है:डेटा से सूचना तक (डेटा तब सूचना में विकसित होता है जब वे निर्णय समस्या के लिए प्रासंगिक हो जाते हैं); जानकारी से तथ्यों तक (सूचना तब तथ्य बन जाती है जब डेटा इसका समर्थन कर सकता है) और अंत में, तथ्यों से ज्ञान तक (तथ्य तब ज्ञान बन जाते हैं जब उनका उपयोग निर्णय प्रक्रिया की सफल प्रतियोगिता में किया जाता है)।
ज्ञान को व्यवस्थित साक्ष्य आधार पर रखने की आवश्यकता से सांख्यिकी उत्पन्न हुई। इसके लिए संभाव्यता के नियमों, डेटा गुणों और संबंधों के कंप्यूटिंग के विकास आदि के अध्ययन की आवश्यकता थी।
सांख्यिकी संख्यात्मक रिकॉर्ड के विश्लेषण और प्रस्तुति को परिभाषित करती है, जो सभी डेटा माइनिंग एल्गोरिथम का आवश्यक तत्व है। यह बड़ी मात्रा में डेटा से निपटने के लिए टूल और एनालिटिक्स विधियों का समर्थन करता है। सांख्यिकी में योजना बनाना, डिजाइन करना, जानकारी एकत्र करना, विश्लेषण करना और शोध निष्कर्षों की रिपोर्ट करना शामिल है। क्योंकि ये आँकड़े न केवल गणित के लिए परिभाषित हैं, बल्कि एक व्यावसायिक विश्लेषक भी व्यावसायिक मुद्दों को हल करने के लिए आँकड़ों का उपयोग करता है।
जनसंख्या के मापदंडों के मूल्यों का अनुमान लगाने के लिए एक नमूने के लिए अनुमानात्मक आँकड़ों का उपयोग किया जाता है। यह देखने के लिए परिकल्पना परीक्षण कर सकता है कि क्या दो डेटासेट समान या असमान हैं। इसका उपयोग कार्य-कारण समझाने के लिए रैखिक- या बहु-प्रतिगमन विश्लेषण करने के लिए किया जाता है।
परिकल्पना परीक्षण संख्यात्मक रूप से दो डेटासेट की तुलना कर सकता है। उदाहरण के लिए, यह महसूस कर सकता है (परिकल्पना) कि यह बिक्री की मात्रा समान है, या मुख्य प्रतियोगी की तुलना में बेहतर है। यह इस धारणा की गणितीय रूप से पुष्टि या अस्वीकार करने के लिए परिकल्पना परीक्षण का उपयोग कर सकता है।
सहसंबंध विश्लेषण ब्याज के चरों को कई यादृच्छिक चरों से अलग करने का एक सरल उपकरण है, जिसे अक्सर विशाल डेटासेट में देखा जाता है, यह देखने के लिए कि कौन से व्यावसायिक चर वांछित व्यावसायिक परिणाम को महत्वपूर्ण रूप से प्रभावित करते हैं।
गुणवत्ता नियंत्रण के लिए चार्ट तैयार करने के लिए कई आँकड़ों का उपयोग किया जा सकता है, जिसमें शेवार्ट चार्ट और क्यूसम चार्ट (दोनों समूह सारांश आँकड़े प्रदर्शित करते हैं) शामिल हैं। इन आँकड़ों में माध्य, मानक विचलन, श्रेणी, गणना, चलती औसत, चलती मानक विचलन और गतिमान श्रेणी शामिल हैं।