डेटा विश्लेषण में माध्य, माध्यिका और बहुलक बहुत बार उपयोग किए जाने वाले सांख्यिकीय कार्य हैं। हालांकि कुछ अजगर पुस्तकालय हैं।
माध्य ढूँढना
संख्याओं की सूची के माध्य को संख्याओं का औसत भी कहा जाता है। यह सभी संख्याओं का योग लेकर संख्याओं की संख्या से भाग देकर ज्ञात किया जाता है। नीचे दिए गए उदाहरण में हम संख्याओं का योग प्राप्त करने के लिए योग () फ़ंक्शन लागू करते हैं और संख्याओं की संख्या प्राप्त करने के लिए th Elen () फ़ंक्शन लागू करते हैं।
उदाहरण
num_list = [21, 11, 19, 3,11,5] # FInd sum of the numbers num_sum = sum(num_list) #divide the sum with length of the list mean = num_sum / len(num_list) print(num_list) print("Mean of the above list of numbers is: " + str(round(mean,2)))
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
[21, 11, 19, 3, 11, 5] Mean of the above list of numbers is: 11.67
माध्यिका ढूँढना
संख्याओं की सूची में माध्यिका सबसे मध्य मान है। यदि सूची में विषम संख्याएँ हैं तो हम खोए हुए को छाँटते हैं और बीच में सबसे अधिक मूल्य चुनते हैं। अगर गिनती एक सम संख्या है तो हम दो सबसे बीच वाले मानों को चुनते हैं और उनके औसत को माध्यिका के रूप में लेते हैं।
उदाहरण
num_list = [21, 13, 19, 3,11,5] # Sort the list num_list.sort() # Finding the position of the median if len(num_list) % 2 == 0: first_median = num_list[len(num_list) // 2] second_median = num_list[len(num_list) // 2 - 1] median = (first_median + second_median) / 2 else: median = num_list[len(num_list) // 2] print(num_list) print("Median of above list is: " + str(median))
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
[3, 5, 11, 13, 19, 21] Median of above list is: 12.0
फाइंडिंग मोड
मोड सूची में वह संख्या है जो सबसे अधिक बार आती है। हम सूची में मौजूद प्रत्येक संख्या की आवृत्ति का पता लगाकर और फिर उच्चतम आवृत्ति वाले को चुनकर इसकी गणना करते हैं।
उदाहरण
import collections # list of elements to calculate mode num_list = [21, 13, 19, 13,19,13] # Print the list print(num_list) # calculate the frequency of each item data = collections.Counter(num_list) data_list = dict(data) # Print the items with frequency print(data_list) # Find the highest frequency max_value = max(list(data.values())) mode_val = [num for num, freq in data_list.items() if freq == max_value] if len(mode_val) == len(num_list): print("No mode in the list") else: print("The Mode of the list is : " + ', '.join(map(str, mode_val)))
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
[21, 13, 19, 13, 19, 13] {21: 1, 13: 3, 19: 2} The Mode of the list is : 13