Computer >> कंप्यूटर >  >> प्रोग्रामिंग >> Python

पायथन में डेटा आयात करना

पायथन प्रोग्राम चलाते समय, हमें डेटा विश्लेषण के लिए डेटासेट का उपयोग करने की आवश्यकता होती है। पायथन में विभिन्न मॉड्यूल हैं जो हमें बाहरी डेटा को विभिन्न फ़ाइल स्वरूपों में एक पायथन प्रोग्राम में आयात करने में मदद करते हैं। इस उदाहरण में हम देखेंगे कि विभिन्न प्रारूपों के डेटा को एक पायथन प्रोग्राम में कैसे आयात किया जाए।

csv फ़ाइल आयात करें

सीएसवी मॉड्यूल हमें अल्पविराम का उपयोग करके फ़ाइल में प्रत्येक पंक्ति को एक सीमांकक के रूप में पढ़ने में सक्षम बनाता है। हम पहले फ़ाइल को केवल पढ़ने के लिए मोड में खोलते हैं और फिर डिलीमीटर असाइन करते हैं। अंत में csv फ़ाइल से प्रत्येक पंक्ति को पढ़ने के लिए लूप के लिए उपयोग करें।

उदाहरण

import csv

with open("E:\\customers.csv",'r') as custfile:
rows=csv.reader(custfile,delimiter=',')
for r in rows:
print(r)

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn']
['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No']
['5575-GNVDE', 'Male', 'One year', 'No', 'No']
['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes']
['7795-CFOCW', 'Male', 'One year', 'No', 'No']
……
…….

पंडों के साथ

पांडा पुस्तकालय वास्तव में सीएसवी फ़ाइल सहित अधिकांश फ़ाइल प्रकारों को संभाल सकता है। इस कार्यक्रम में देखते हैं कि कैसे पांडा पुस्तकालय read_excel मॉड्यूल का उपयोग करके एक्सेल फ़ाइल को संभालता है। नीचे दिए गए उदाहरण में हम उपरोक्त फ़ाइल के एक्सेल संस्करण को पढ़ते हैं और जब हम फ़ाइल पढ़ते हैं तो वही परिणाम मिलता है।

उदाहरण

import pandas as pd

df = pd.ExcelFile("E:\\customers.xlsx")
data=df.parse("customers")
print(data.head(10))
के रूप में आयात करें

आउटपुट

उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -

  customerID   gender Contract            PaperlessBilling Churn
0 7590-VHVEG Female   Month-to-month         Yes            No
1 5575-GNVDE   Male   One year                No            No
2 3668-QPYBK   Male   Month-to-month         Yes           Yes
3 7795-CFOCW   Male   One year                No            No
4 9237-HQITU Female   Month-to-month        Yes            Yes
5 9305-CDSKC Female   Month-to-month        Yes            Yes
6 1452-KIOVK   Male   Month-to-month        Yes             No
7 6713-OKOMC Female   Month-to-month         No             No
8 7892-POOKP Female   Month-to-month        Yes            Yes
9 6388-TABGU   Male   One year               No             No

pyodbc के साथ

हम pyodbc नामक मॉड्यूल का उपयोग करके डेटाबेस सर्वर से भी जुड़ सकते हैं। यह हमें SQL क्वेरी का उपयोग करके संबंधपरक स्रोतों से डेटा आयात करने में मदद करेगा। बेशक हमें क्वेरी पर जाने से पहले कनेक्शन विवरण को डीबी से परिभाषित करना होगा।

उदाहरण

import pyodbc
sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;")
data_sql = pd.read_sql_query(SQL QUERY’, sql_conn)
data_sql.head()

आउटपुट

SQL क्वेरी के आधार पर परिणाम प्रदर्शित किया जाएगा।


  1. पायथन में सांख्यिकीय सोच

    सांख्यिकी एमएल और एआई सीखने के लिए मौलिक है। चूंकि इन तकनीकों के लिए पायथन पसंद की भाषा है, हम देखेंगे कि पायथन प्रोग्राम कैसे लिखना है जिसमें सांख्यिकीय विश्लेषण शामिल है। इस लेख में हम देखेंगे कि विभिन्न पायथन मॉड्यूल का उपयोग करके ग्राफ और चार्ट कैसे बनाया जाता है। विभिन्न प्रकार के चार्ट हमें डे

  1. पायथन में ग्राहक मंथन की भविष्यवाणी

    हर व्यवसाय ग्राहक की वफादारी पर निर्भर करता है। ग्राहक से दोहराना व्यवसाय व्यावसायिक लाभप्रदता के लिए आधारशिला में से एक है। इसलिए ग्राहकों के व्यवसाय छोड़ने का कारण जानना महत्वपूर्ण है। दूर जाने वाले ग्राहकों को ग्राहक मंथन के रूप में जाना जाता है। पिछले रुझानों को देखकर हम यह आंक सकते हैं कि ग्राह

  1. पायथन में जनगणना के आंकड़ों का विश्लेषण

    जनगणना किसी दी गई आबादी के बारे में व्यवस्थित तरीके से जानकारी दर्ज करने के बारे में है। कैप्चर किए गए डेटा में विभिन्न श्रेणी की जानकारी शामिल होती है जैसे - जनसांख्यिकीय, आर्थिक, आवास विवरण आदि। यह अंततः सरकार को वर्तमान परिदृश्य को समझने के साथ-साथ भविष्य के लिए योजना बनाने में मदद करता है। इस ले