पायथन प्रोग्राम चलाते समय, हमें डेटा विश्लेषण के लिए डेटासेट का उपयोग करने की आवश्यकता होती है। पायथन में विभिन्न मॉड्यूल हैं जो हमें बाहरी डेटा को विभिन्न फ़ाइल स्वरूपों में एक पायथन प्रोग्राम में आयात करने में मदद करते हैं। इस उदाहरण में हम देखेंगे कि विभिन्न प्रारूपों के डेटा को एक पायथन प्रोग्राम में कैसे आयात किया जाए।
csv फ़ाइल आयात करें
सीएसवी मॉड्यूल हमें अल्पविराम का उपयोग करके फ़ाइल में प्रत्येक पंक्ति को एक सीमांकक के रूप में पढ़ने में सक्षम बनाता है। हम पहले फ़ाइल को केवल पढ़ने के लिए मोड में खोलते हैं और फिर डिलीमीटर असाइन करते हैं। अंत में csv फ़ाइल से प्रत्येक पंक्ति को पढ़ने के लिए लूप के लिए उपयोग करें।
उदाहरण
import csv with open("E:\\customers.csv",'r') as custfile: rows=csv.reader(custfile,delimiter=',') for r in rows: print(r)
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn'] ['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No'] ['5575-GNVDE', 'Male', 'One year', 'No', 'No'] ['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes'] ['7795-CFOCW', 'Male', 'One year', 'No', 'No'] …… …….
पंडों के साथ
पांडा पुस्तकालय वास्तव में सीएसवी फ़ाइल सहित अधिकांश फ़ाइल प्रकारों को संभाल सकता है। इस कार्यक्रम में देखते हैं कि कैसे पांडा पुस्तकालय read_excel मॉड्यूल का उपयोग करके एक्सेल फ़ाइल को संभालता है। नीचे दिए गए उदाहरण में हम उपरोक्त फ़ाइल के एक्सेल संस्करण को पढ़ते हैं और जब हम फ़ाइल पढ़ते हैं तो वही परिणाम मिलता है।
उदाहरण
import pandas as pd df = pd.ExcelFile("E:\\customers.xlsx") data=df.parse("customers") print(data.head(10))के रूप में आयात करें
आउटपुट
उपरोक्त कोड को चलाने से हमें निम्नलिखित परिणाम मिलते हैं -
customerID gender Contract PaperlessBilling Churn 0 7590-VHVEG Female Month-to-month Yes No 1 5575-GNVDE Male One year No No 2 3668-QPYBK Male Month-to-month Yes Yes 3 7795-CFOCW Male One year No No 4 9237-HQITU Female Month-to-month Yes Yes 5 9305-CDSKC Female Month-to-month Yes Yes 6 1452-KIOVK Male Month-to-month Yes No 7 6713-OKOMC Female Month-to-month No No 8 7892-POOKP Female Month-to-month Yes Yes 9 6388-TABGU Male One year No No
pyodbc के साथ
हम pyodbc नामक मॉड्यूल का उपयोग करके डेटाबेस सर्वर से भी जुड़ सकते हैं। यह हमें SQL क्वेरी का उपयोग करके संबंधपरक स्रोतों से डेटा आयात करने में मदद करेगा। बेशक हमें क्वेरी पर जाने से पहले कनेक्शन विवरण को डीबी से परिभाषित करना होगा।
उदाहरण
import pyodbc sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;") data_sql = pd.read_sql_query(SQL QUERY’, sql_conn) data_sql.head()
आउटपुट
SQL क्वेरी के आधार पर परिणाम प्रदर्शित किया जाएगा।