Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पंडों में निरपेक्ष और सापेक्ष आवृत्ति

आंकड़ों में, "फ़्रीक्वेंसी" शब्द किसी दिए गए डेटा नमूने में किसी मान की घटनाओं की संख्या को इंगित करता है। गणितीय और वैज्ञानिक विश्लेषण के लिए एक सॉफ्टवेयर के रूप में, पंडों के पास दिए गए नमूने से आवृत्ति की गणना करने के लिए कई अंतर्निहित विधियां हैं।

पूर्ण आवृत्ति यह केवल उस आवृत्ति के समान है जहां डेटा तत्व की घटनाओं की संख्या की गणना की जाती है। नीचे दिए गए उदाहरण में, हम किसी दिए गए डेटाफ़्रेम में किसी शहर का नाम प्रदर्शित होने की संख्या की गणना करते हैं और इसे आवृत्ति के रूप में रिपोर्ट करते हैं।

दृष्टिकोण 1 - हम .value_counts नामक पांडा विधि का उपयोग करते हैं।

उदाहरण

import pandas as pd
# Create Data Frame
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
# use the method .value_counts()
df = pd.Series(data).value_counts()
print(df)

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

Pune          3
Chandigarh    2
Hyderabad     1
dtype: int64

दृष्टिकोण 2 - हम .क्रॉसस्टैब नामक पांडा पद्धति का उपयोग करते हैं

उदाहरण

import pandas as pd
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
df = pd.DataFrame(data,columns=["City"])
tab_result = pd.crosstab(index=df["City"],columns=["count"])
print(tab_result)

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

col_0        count
City
Chandigarh   2
Hyderabad    1
Pune         3

सापेक्ष आवृत्ति - यह दी गई आवृत्ति और डेटा नमूने में अवलोकनों की कुल संख्या के बीच का एक अंश है। तो मान एक फ़्लोटिंग पॉइंट मान हो सकता है जिसे प्रतिशत के रूप में भी व्यक्त किया जा सकता है। इसका पता लगाने के लिए हम पहले आवृत्ति की गणना करते हैं जैसा कि पहले दृष्टिकोण में दिखाया गया है और फिर इसे कुल अवलोकनों से विभाजित करते हैं जो कि लेन () फ़ंक्शन का उपयोग करके पाया जाता है।

उदाहरण

import pandas as pd
# Create Data Frame
data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"]
# use the method .value_counts()
df = pd.Series(data).value_counts()
print(df/len(data))

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

Pune 0.500000
Chandigarh 0.333333
Hyderabad 0.166667
dtype: float64

  1. पायथन में बीएसटी को क्रमबद्ध और अक्रमांकन करें

    मान लीजिए कि हम एक बाइनरी सर्च ट्री को क्रमबद्ध और डीरियलाइज़ करने के लिए एक एल्गोरिथम डिज़ाइन करना चाहते हैं। सीरियलाइजेशन कुछ (डेटा संरचना या ऑब्जेक्ट) को बिट्स के अनुक्रम में परिवर्तित करने की प्रक्रिया है ताकि इसे फ़ाइल या मेमोरी बफर में संग्रहीत किया जा सके, या नेटवर्क कनेक्शन लिंक पर प्रसारित

  1. पायथन डेटा विश्लेषण और विज़ुअलाइज़ेशन

    पांडा डेटा साइंस और एनालिटिक्स के लिए सबसे लोकप्रिय पायथन लाइब्रेरी में से एक है। पांडा पुस्तकालय का उपयोग डेटा हेरफेर, विश्लेषण और सफाई के लिए किया जाता है। यह निम्न-स्तरीय NumPy पर एक उच्च-स्तरीय अमूर्त है जो विशुद्ध रूप से C में लिखा गया है। इस खंड में, हम कुछ सबसे महत्वपूर्ण (अक्सर उपयोग की जाने

  1. पायथन में डेटा विश्लेषण और विज़ुअलाइज़ेशन?

    पायथन डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए मुख्य रूप से सुन्न, पांडा, मैटप्लोटलिब, सीबॉर्न आदि के लिए कई पुस्तकालय प्रदान करता है। इस खंड में, हम डेटा विश्लेषण और विज़ुअलाइज़ेशन के लिए पांडा पुस्तकालय पर चर्चा करने जा रहे हैं, जो एक खुला स्रोत पुस्तकालय है जो सुन्न के ऊपर बनाया गया है। यह हमें ते