एक विशेषता एक डेटा फ़ील्ड है, जो डेटा ऑब्जेक्ट की विशेषता को परिभाषित करती है। साहित्य में संज्ञा गुण, आयाम, विशेषता और चर का प्रयोग संगत रूप से किया जाता है। आयाम आमतौर पर डेटा वेयरहाउसिंग में उपयोग किया जाता है। मशीन लर्निंग लिटरेचर फीचर शब्द का उपयोग करने के लिए प्रभावित करता है, जबकि सांख्यिकीविद विधि को बदलने योग्य पसंद करते हैं।
डेटा माइनिंग और डेटाबेस विशेषज्ञ आमतौर पर विशेषता शब्द का उपयोग करते हैं। उपयोगकर्ता ऑब्जेक्ट को परिभाषित करने वाली विशेषताओं में शामिल हो सकते हैं, उदाहरण के लिए, ग्राहक आईडी, नाम और पता। किसी दी गई विशेषता के लिए देखे गए मान प्रेक्षण कहलाते हैं।
विशेषताओं का एक सेट किसी दिए गए ऑब्जेक्ट को परिभाषित कर सकता है जिसे विशेषता वेक्टर (या फीचर वेक्टर) के रूप में जाना जाता है। एक विशेषता (या चर) वाले डेटा के वितरण को यूनीवेरिएट के रूप में जाना जाता है। द्विचर वितरण में दो विशेषताएँ होती हैं, आदि।
एक विशेषता के प्रकार का निर्धारण संभावित मूल्यों के सेट द्वारा किया जाता है जिसमें नाममात्र, बाइनरी, ऑर्डिनल, या सांख्यिकीय विशेषता हो सकती है।
नाममात्र गुण -नाममात्र नामों के साथ संबद्धता को परिभाषित करता है। नाममात्र की विशेषता के मूल्य प्रतीक या चीजों के नाम हैं। प्रत्येक मान किसी प्रकार की श्रेणी, कोड, या राज्य आदि को परिभाषित करता है। नाममात्र विशेषताओं को श्रेणीबद्ध के रूप में परिभाषित किया गया है। मानों का कोई महत्वपूर्ण क्रम नहीं है। कंप्यूटर विज्ञान में, मानों को एन्यूमरेशन भी कहा जाता है।
द्विआधारी गुण - एक द्विआधारी विशेषता केवल दो तत्वों या राज्यों जैसे 0 या 1 के साथ एक नाममात्र विशेषता है, जहां 0 आम तौर पर परिभाषित करता है कि विशेषता अनुपस्थित है, और 1 परिभाषित करता है कि यह मौजूद है। बाइनरी विशेषताओं को बूलियन के रूप में परिभाषित किया जाता है यदि दो राज्य सत्य और असत्य के बराबर हैं।
एक द्विआधारी विशेषता सममित है यदि इसके दोनों राज्य समान मूल्यवान हैं और समान भार उत्पन्न करते हैं। ऐसी कोई वरीयता नहीं है जिस पर परिणाम 0 या 1 के रूप में कोडित होना चाहिए। एक उदाहरण विशेषता लिंग हो सकता है जिसमें राज्य पुरुष और महिला हो।
एक द्विआधारी विशेषता असममित है यदि राज्यों के परिणाम समान रूप से महत्वपूर्ण नहीं हैं, जिसमें एचआईवी के लिए एक चिकित्सा परीक्षण के सकारात्मक और नकारात्मक परिणाम शामिल हैं। परंपरा के अनुसार, यह सबसे आवश्यक परिणाम को कोड कर सकता है, जो आम तौर पर निकटतम होता है, 1 (जैसे, एचआईवी पॉजिटिव) और भिन्न 0 (जैसे, एचआईवी नकारात्मक)।
साधारण गुण - एक क्रमसूचक विशेषता संभावित मानों वाली एक विशेषता होती है, जिनके बीच एक महत्वपूर्ण क्रम या रैंकिंग होती है, लेकिन क्रमिक मानों के बीच परिमाण ज्ञात नहीं होता है।
संख्यात्मक विशेषताएं - एक संख्यात्मक विशेषता मात्रात्मक है। यह एक मापने योग्य मात्रा है, जिसे पूर्णांक या वास्तविक मानों में परिभाषित किया गया है। इसे अंतराल-स्केल या अनुपात-स्केल किया जा सकता है।