Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

PySpark SQL परिणामों को प्लॉट करने के लिए Matplotlib का उपयोग कैसे करें?


माटप्लोटलिब को प्लॉट करने के लिए PySpark SQL का उपयोग करना परिणाम, हम निम्नलिखित कदम उठा सकते हैं-

  • आकृति का आकार सेट करें और सबप्लॉट के बीच और आसपास पैडिंग समायोजित करें।
  • उदाहरण प्राप्त करें जो स्पार्क कार्यक्षमता के लिए मुख्य प्रवेश बिंदु है।
  • स्पार्क एसक्यूएल के एक प्रकार का उदाहरण प्राप्त करें जो हाइव में संग्रहीत डेटा के साथ एकीकृत होता है।
  • टपल के रूप में रिकॉर्ड की सूची बनाएं।
  • RDD बनाने के लिए स्थानीय पायथन संग्रह वितरित करें।
  • सूची रिकॉर्ड को DB स्कीमा के रूप में मैप करें।
  • "my_table" में प्रविष्टि करने के लिए स्कीमा इंस्टेंस प्राप्त करें।
  • तालिका में रिकॉर्ड डालें।
  • SQL क्वेरी पढ़ें, रिकॉर्ड पुनर्प्राप्त करें।
  • प्राप्त किए गए रिकॉर्ड को डेटा फ़्रेम में बदलें।
  • इंडेक्स को नाम के साथ सेट करें विशेषता दें और उन्हें प्लॉट करें।
  • आंकड़ा प्रदर्शित करने के लिए, दिखाएं () . का उपयोग करें विधि।

उदाहरण

from pyspark.sql import Row
from pyspark.sql import HiveContext
import pyspark
import matplotlib.pyplot as plt

plt.rcParams["figure.figsize"] = [7.50, 3.50]
plt.rcParams["figure.autolayout"] = True

sc = pyspark.SparkContext()
sqlContext = HiveContext(sc)

test_list = [(1, 'John'), (2, 'James'), (3, 'Jack'), (4, 'Joe')]
rdd = sc.parallelize(test_list)
people = rdd.map(lambda x: Row(id=int(x[0]), name=x[1]))
schemaPeople = sqlContext.createDataFrame(people)
sqlContext.registerDataFrameAsTable(schemaPeople, "my_table")

df = sqlContext.sql("Select * from my_table")
df = df.toPandas()
df.set_index('name').plot()

plt.show()

आउटपुट

PySpark SQL परिणामों को प्लॉट करने के लिए Matplotlib का उपयोग कैसे करें?


  1. कैसे अजगर में एक समोच्च साजिश चेतन करने के लिए matplotlib.animate का उपयोग कैसे करें?

    पायथन में matplotlib में एक समोच्च साजिश को चेतन करने के लिए, हम निम्नलिखित कदम उठा सकते हैं- 10☓10 आयाम के आकार का एक यादृच्छिक डेटा बनाएं। सबप्लॉट () का उपयोग करके एक आकृति और सबप्लॉट का एक सेट बनाएं विधि। किसी फंक्शन को बार-बार कॉल करके एनिमेशन बनाता है *func* FuncAnimation() . का उपयोग करके कक्

  1. Matplotlib में कुल्हाड़ियों को कैसे स्विच करें?

    Matplotlib में कुल्हाड़ियों को स्विच करने के लिए, हम एक आकृति बना सकते हैं और सबप्लॉट्स () विधि का उपयोग करके दो सबप्लॉट जोड़ सकते हैं। वक्र प्लॉट करें, x और y डेटा निकालें, और इन डेटा को दूसरे प्लॉट किए गए वक्र में सेट करें। कदम numpy का उपयोग करके x और y डेटा पॉइंट बनाएं। एक आकृति बनाएं और द

  1. Matplotlib में एक लाइन प्लॉट को कैसे चेतन करें?

    Matplotlib में लाइन प्लॉट को चेतन करने के लिए, हम निम्नलिखित कदम उठा सकते हैं - सबप्लॉट्स () . का उपयोग करके एक फिगर और सबप्लॉट का एक सेट बनाएं विधि। x और y अक्ष पैमाने को सीमित करें। numpy का उपयोग करके x और t डेटा बिंदु बनाएं। निर्देशांक सदिशों, X2 और T2 से निर्देशांक मैट्रिक्स लौटाएं।