एक द्विआधारी चर में केवल दो अवस्थाएँ होती हैं जैसे कि 0 या 1, जहाँ 0 परिभाषित करता है कि चर अनुपस्थित है, और 1 परिभाषित करता है कि यह मौजूद है। एक रोगी को परिभाषित करने वाले चर धूम्रपान करने वाले को देखते हुए, उदाहरण के लिए, 1 यह दर्शाता है कि रोगी धूम्रपान करता है, जबकि 0 यह दर्शाता है कि रोगी नहीं करता है। यह द्विआधारी चर पर विचार कर सकता है जैसे कि वे अंतराल-स्केल किए गए हैं जिससे भ्रामक क्लस्टरिंग परिणाम हो सकते हैं। इसलिए, असमानताओं की गणना के लिए बाइनरी डेटा को परिभाषित करने वाली विधियां आवश्यक हैं।
दिए गए बाइनरी डेटा से असमानता मैट्रिक्स की गणना करने की एक विधि है। यदि कुछ द्विआधारी चरों को समान भार के रूप में माना जाता है, तो इसमें 2-बाय-2 आकस्मिक तालिका हो सकती है, जहां q चर की संख्या है जो दोनों वस्तुओं i और j के लिए 1 के समान है, r उन चरों की संख्या है जो ऑब्जेक्ट i के लिए समान 1 लेकिन वह ऑब्जेक्ट j के लिए 0 है, s ऑब्जेक्ट i के लिए समान 0 चरों की संख्या है, लेकिन ऑब्जेक्ट j के लिए 1 के समान है, और t वेरिएबल्स की संख्या है जो दोनों ऑब्जेक्ट्स के लिए 0 के समान है I और जे. चरों की कुल संख्या p है, जहाँ p =q+r +s+t.
एक द्विआधारी चर सममित है यदि इसके दोनों राज्य समान रूप से मूल्यवान हैं और समान भार रखते हैं; यानी, ऐसी कोई वरीयता नहीं है जिस पर परिणामों को 0 या 1 के रूप में कोडित किया जाना चाहिए। विषमता जो सममित बाइनरी चर पर निर्भर करती है उसे सममित बाइनरी असमानता के रूप में जाना जाता है।
एक द्विआधारी चर असममित है यदि राज्यों के परिणाम महत्वपूर्ण नहीं हैं, जिसमें रोग परीक्षण के सकारात्मक और नकारात्मक परिणाम शामिल हैं। परंपरा के अनुसार, हम आवश्यक परिणाम को कोडित करेंगे, जो आम तौर पर सबसे दुर्लभ होता है, 1 (उदाहरण के लिए, एचआईवी पॉजिटिव) और दूसरे को 0 (उदाहरण के लिए, एचआईवी नकारात्मक)।
दो असममित द्विआधारी चर को देखते हुए, दो 1s (एक सकारात्मक मिलान) की सहमति को दो 0s (एक नकारात्मक मिलान) की तुलना में अधिक महत्वपूर्ण माना जाता है। इसलिए, ऐसे बाइनरी वैरिएबल को "मोनरी" के रूप में माना जाता है (जैसे कि एक राज्य हो)।
ऐसे चरों के आधार पर असमानता को असममित द्विआधारी असमानता के रूप में जाना जाता है, जहां कई नकारात्मक मिलान, t, को महत्वहीन माना जाता है और इसलिए गणना में अनदेखा किया जाता है, जैसा कि समीकरण में दिखाया गया है
$$\mathrm{d(i, j)=\:\frac{r+s}{q+r+s}}$$
यह दो द्विआधारी चर के बीच की दूरी की गणना कर सकता है जो असमानता के बजाय समानता की अवधारणा पर निर्भर करता है। उदाहरण के लिए, वस्तुओं i और j, या sim (i, j) के बीच असममित द्विआधारी समानता की गणना इस प्रकार की जा सकती है,
$$\mathrm{sim(i, j)=\:\frac{q}{q+r+s}=1-d(i,j)}$$।
गुणांक sim(i, j) को जैककार्ड गुणांक के रूप में जाना जाता है।