पायथन डेटा विज़ुअलाइज़ेशन के लिए विभिन्न उपयोग में आसान पुस्तकालय प्रदान करता है। अच्छी बात यह है कि ये पुस्तकालय छोटे या बड़े डेटासेट के साथ काम करते हैं।
डेटा विज़ुअलाइज़ेशन के लिए सबसे अधिक उपयोग किए जाने वाले कुछ पायथन पुस्तकालय हैं -
-
माटप्लोटलिब
-
पांडा
-
प्लॉटली
-
सीबॉर्न
नीचे हम उस डेटा का बेहतर विश्लेषण करने के लिए एक निश्चित डेटा के लिए विभिन्न प्रकार के विज़ुअलाइज़ेशन चार्ट तैयार करने जा रहे हैं।
हम विभिन्न चार्टों के माध्यम से कल्पना करने के लिए नीचे दिए गए डेटा सेट का विश्लेषण करने जा रहे हैं -
देश या क्षेत्र | <वें शैली ="चौड़ाई:23.8938%; पाठ-संरेखण:केंद्र;" चौड़ाई="57">वर्ष (वर्षों)वें> <वें शैली ="चौड़ाई:26.0544%; पाठ-संरेखण:केंद्र;" चौड़ाई="134">वेरिएंट <वें शैली ="चौड़ाई:24.4218%; पाठ-संरेखण:केंद्र;" चौड़ाई="103">मान|||
---|---|---|---|
भारत | 2019 | मध्यम | 1368737.513 |
भारत | 2019 | उच्च | 1378419.072 |
भारत | 2019 | कम | 1359043.965 |
भारत | 2019 | निरंतर उर्वरता | 1373707.838 |
भारत | 2019 | तत्काल प्रतिस्थापन | 1366687.871 |
भारत | 2019 | शून्य माइग्रेशन | 1370868.782 |
भारत | 2019 | निरंतर मृत्यु दर | 1366282.778 |
भारत | 2019 | कोई परिवर्तन नहीं | 1371221.64 |
भारत | 2019 | गति | 1367400.614 |
बेसिक प्लॉट
आइए कुछ बुनियादी प्लॉट बनाएं:लाइन प्लॉट, स्कैटर प्लॉट और हिस्टोग्राम
लाइन प्लॉट
रेखा रेखांकन ऐसे प्लॉट होते हैं जहां x और y मानों के एक विशेष सेट के बीच संबंध दर्शाने के लिए एक रेखा खींची जाती है।
pltYear के रूप में matplotlib.pyplot आयात करें =[2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019] भारत_ जनसंख्या =[1173108018,1189172906,1205073612,1220800359,1266344631,1309053980,1324171354,1339180127, 1354051854,1368737513]plt.plot(वर्ष, India_Population)plt.show()
आउटपुट
बिखरे हुए भूखंड
वैकल्पिक रूप से, आप मात्राओं को डेटा बिंदुओं के रूप में 2 स्थितियों के साथ प्लॉट करना चाह सकते हैं।
लाइन ग्राफ़ के समान डेटा पर विचार करें, स्कैटर प्लॉट बनाने के लिए हमें उपरोक्त कोड में केवल एक पंक्ति को संशोधित करने की आवश्यकता है -
plt.plot(वर्ष, India_Population,'o')
आउटपुट
हिस्टोग्राम
हिस्टोग्राम का उपयोग अक्सर विज्ञान अनुप्रयोगों में किया जाता है और इसकी अत्यधिक संभावना है कि आपको उन्हें किसी बिंदु पर प्लॉट करने की आवश्यकता होगी। वे वितरण की साजिश रचने के लिए बहुत उपयोगी हैं।
pdimport matplotlib.pyplot के रूप में pltdata =[['India', 2019, 'Medium', 1368737.513],['India', 2019, 'high', 1378419.072],['India', 2019, ' के रूप में आयात करें। निम्न', 1359043.965], ['भारत', 2019, 'निरंतर प्रजनन क्षमता', 1373707.838], ['भारत', 2019, 'त्वरित प्रतिस्थापन', 1366687.871], ['भारत', 2019, 'शून्य प्रवास', 1370868.782] ,['भारत', 2019, 'निरंतर मृत्यु दर', 1366282.778],['भारत', 2019, 'कोई बदलाव नहीं', 1371221.64],['भारत', 2019, 'गति', 1367400.14],]df =pd. DataFrame(डेटा, कॉलम =(['देश या क्षेत्र', 'वर्ष (वर्षों)', 'वैरिएंट', 'मान']))df.hist()plt.show()
आउटपुट
पाई चार्ट
pltn =25Z =np.ones(n)Z[-1] *=2.5plt.axes([0.05, 0.05, 0.95, 0.95])plt.pie(Z, विस्फोट) =Z*.05, रंग =['%f'% (i/float(n)) मेरे लिए रेंज में(n)], वेजप्रॉप ={"लाइनविड्थ":1, "एजकलर":"ग्रीन"})plt .gca().set_aspect('equal')plt.xticks([]), plt.yticks([])plt.show()आउटपुट
ध्रुवीय भूखंड
कोड:
npimport matplotlib.pyplot के रूप में pltax =plt.axes([0.5,0.05,0.95,0.95], polar=True)N =25theta =np.arange(0.0, 2.5*np.pi, 2.5*np) के रूप में numpy आयात करें .pi/N)त्रिज्या =10*np.random.rand(N)width =np.pi/4*np.random.rand(N)bars =plt.bar(theta, radii, width=width, नीचे=0.0 )आर के लिए, ज़िप में बार (त्रिज्या, बार):bar.set_facecolor(plt.cm.jet(r/10.))bar.set_alpha(0.5)ax.set_xticklabels([])ax.set_yticklabels([])plt .शो ()
आउटपुट