आंकड़ों में, "फ़्रीक्वेंसी" शब्द किसी दिए गए डेटा नमूने में किसी मान की घटनाओं की संख्या को इंगित करता है। गणितीय और वैज्ञानिक विश्लेषण के लिए एक सॉफ्टवेयर के रूप में, पंडों के पास दिए गए नमूने से आवृत्ति की गणना करने के लिए कई अंतर्निहित विधियां हैं।
पूर्ण आवृत्ति यह केवल उस आवृत्ति के समान है जहां डेटा तत्व की घटनाओं की संख्या की गणना की जाती है। नीचे दिए गए उदाहरण में, हम किसी दिए गए डेटाफ़्रेम में किसी शहर का नाम प्रदर्शित होने की संख्या की गणना करते हैं और इसे आवृत्ति के रूप में रिपोर्ट करते हैं।
दृष्टिकोण 1 - हम .value_counts नामक पांडा विधि का उपयोग करते हैं।
उदाहरण
import pandas as pd # Create Data Frame data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"] # use the method .value_counts() df = pd.Series(data).value_counts() print(df)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Pune 3 Chandigarh 2 Hyderabad 1 dtype: int64
दृष्टिकोण 2 - हम .क्रॉसस्टैब नामक पांडा पद्धति का उपयोग करते हैं
उदाहरण
import pandas as pd data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"] df = pd.DataFrame(data,columns=["City"]) tab_result = pd.crosstab(index=df["City"],columns=["count"]) print(tab_result)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
col_0 count City Chandigarh 2 Hyderabad 1 Pune 3
सापेक्ष आवृत्ति - यह दी गई आवृत्ति और डेटा नमूने में अवलोकनों की कुल संख्या के बीच का एक अंश है। तो मान एक फ़्लोटिंग पॉइंट मान हो सकता है जिसे प्रतिशत के रूप में भी व्यक्त किया जा सकता है। इसका पता लगाने के लिए हम पहले आवृत्ति की गणना करते हैं जैसा कि पहले दृष्टिकोण में दिखाया गया है और फिर इसे कुल अवलोकनों से विभाजित करते हैं जो कि लेन () फ़ंक्शन का उपयोग करके पाया जाता है।
उदाहरण
import pandas as pd # Create Data Frame data = ["Chandigarh","Hyderabad","Pune","Pune","Chandigarh","Pune"] # use the method .value_counts() df = pd.Series(data).value_counts() print(df/len(data))
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
Pune 0.500000 Chandigarh 0.333333 Hyderabad 0.166667 dtype: float64