एक आकस्मिक तालिका एक तालिका है जो पंक्तियों में एक चर और स्तंभों में एक अन्य चर के वितरण को दर्शाती है। इसका उपयोग दो चरों के बीच सहसंबंध का अध्ययन करने के लिए किया जाता है। यह एक मल्टीवे टेबल है जो एक डेटासेट का वर्णन करती है जिसमें प्रत्येक अवलोकन कई चरों में से प्रत्येक के लिए एक श्रेणी से संबंधित होता है। इसके अलावा यह मूल रूप से दो या दो से अधिक श्रेणीबद्ध चर के बीच की गणना का एक मिलान है। आकस्मिक तालिकाओं को क्रॉसस्टैब या दो-तरफा तालिका भी कहा जाता है, जिसका उपयोग आंकड़ों में कई श्रेणीगत चर के बीच संबंधों को संक्षेप में प्रस्तुत करने के लिए किया जाता है।
आकस्मिकता गुणांक एसोसिएशन का एक गुणांक है जो बताता है कि दो चर या डेटासेट स्वतंत्र हैं या एक दूसरे पर निर्भर हैं, इसे पियर्सन के गुणांक के रूप में भी जाना जाता है
उदाहरण
नीचे दिए गए उदाहरण में हम विश्लेषण के लिए आईरिस फूल डेटा सेट लेते हैं। इस डेटा सेट में आइरिस (आइरिस सेटोसा, आइरिस वर्जिनिका और आइरिस वर्सिकलर) की तीन प्रजातियों में से प्रत्येक से 50 नमूने शामिल हैं। प्रत्येक नमूने से चार विशेषताओं को मापा गया:सेपल्स और पंखुड़ियों की लंबाई और चौड़ाई, सेंटीमीटर में। हम इन विशेषताओं पर आकस्मिक मॉडल तैयार करेंगे जो अंततः प्रजातियों को एक दूसरे से अलग करने में उपयोग किया जाएगा।
डेटासेट पढ़ना
उदाहरण
npimport पांडा के रूप में pddatainput =pd.read_csv("iris.csv")print (datainput.head(5)) के रूप में numpy आयात करें
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं:
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species0 5.1 3.5 1.4 0.2 Iris-setosa1 4.9 3.0 1.4 0.2 Iris-setosa2 4.7 3.2 1.3 0.2 Iris-setosa3 4.6 3.1 1.5 0.2 Iris-setosa4 5.0 3.6 1.4 0.2 Iris-setosa
डेटा के सामान्य आंकड़े
इसके बाद, हम विवरण () का उपयोग करके डेटा के सामान्य आंकड़े एकत्र करते हैं। आईटी डेटा को कैसे वितरित किया जाता है, इसके माध्य और विभिन्न चतुर्थक के बारे में एक विचार देता है।
उदाहरण
npimport पांडा के रूप में pddatainput =pd.read_csv("iris.csv")print(datainput.describe()) के रूप में numpy आयात करें
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं:
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCmcount 150.000000 150.000000 150.000000 150.000000मीन 5.843333 3.054000 3.758667 1.198667std 0.828066 0.433594 1.764420 0.710063161मिनट 4.300000 4.000000 1.000000 0.10000025% 6.4000003.800000डेटा प्रकार
आगे हम डेटाफ़्रेम में विभिन्न डेटा प्रकार के कॉलम देखते हैं।
उदाहरण
npimport पांडा के रूप में pddatainput =pd.read_csv("iris.csv")print(datainput.dtypes) के रूप में numpy आयात करेंउपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं:
SepalLengthCm float64SepalWidthCm float64PetalLengthCm float64PetalWidthCm float64Species objectdtype:objectआकस्मिक तालिका बनाना
अब हम प्रत्येक प्रजाति के लिए पंखुड़ी की चौड़ाई दिखाने वाले कॉलम के लिए एक आकस्मिक तालिका बनाते हैं। इसके लिए हम पांडा में उपलब्ध क्रॉसस्टैब फ़ंक्शन का उपयोग करते हैं और इन टो कॉलम के नाम इनपुट के रूप में देते हैं।
उदाहरण
npimport पांडा के रूप में pddatainput =pd.read_csv("iris.csv")width_species =pd.crosstab(datainput['PetalWidthCm'],datainput['Species'],margins =False)print(width_species) के रूप में numpy आयात करेंउपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं:
प्रजाति आईरिस-सेटोसा आईरिस-वर्सीकलर आईरिस-वर्जिनिकापेटलविड्थसीएम0.1 6 0 00.2 28 0 00.3 7 0 01.0 0 7 01.1 0 3 01.2 0 5 01.8 0 1 111.9 0 52.0 0 0 62.1 0 0 62.5 0 0 3बहु-भिन्न आकस्मिकता तालिका
इस मामले में हम आकस्मिक तालिका बनाने के लिए दो से अधिक स्तंभों का उपयोग करते हैं। यहां हम प्रत्येक प्रकार की प्रजातियों के लिए पंखुड़ी की लंबाई और पंखुड़ी की चौड़ाई दोनों का उपयोग करते हैं।
pddatainput =pd.read_csv("iris.csv")length_width_species =pd.crosstab([datainput.PetalLengthCm, datainput.PetalWidthCm],datainput.Species, मार्जिन =False) प्रिंट के रूप में numpy आयात करें। /पूर्व>उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं:
प्रजाति आईरिस-सेटोसा आईरिस-वर्सीकलर आईरिस-वर्जिनिकापेटल लेंथसीएम पेटलविड्थसीएम1.0 0.2 1 0 01.1 0.1 1 0 01.2 0.2 2 0 01.3 0.2 4 0 00.3 2 0 0... ... ... ...6.4 2.0 0 0 16.6 2.1 0 0 16.7 2.0 0 0 12.2 0 0 16.9 2.3 0 0 1