डेटाफ़्रेम एक द्वि-आयामी डेटा संरचना है, जहाँ डेटा को पंक्तियों और स्तंभों के रूप में एक सारणीबद्ध प्रारूप में संग्रहीत किया जाता है।
इसे SQL डेटा तालिका या एक्सेल शीट प्रतिनिधित्व के रूप में देखा जा सकता है। इसे निम्नलिखित कंस्ट्रक्टर का उपयोग करके बनाया जा सकता है -
pd.Dataframe(data, index, columns, dtype, copy)
आइए समझते हैं कि सीरीज के शब्दकोश का उपयोग करके डेटाफ्रेम कैसे बनाया जा सकता है।
-
श्रृंखला 'पंडों' पुस्तकालय में मौजूद एक आयामी डेटा संरचना है।
-
अक्ष लेबल को सामूहिक रूप से अनुक्रमणिका के रूप में जाना जाता है।
-
श्रृंखला संरचना किसी भी प्रकार के डेटा को संग्रहीत कर सकती है जैसे पूर्णांक, फ्लोट, स्ट्रिंग, पायथन ऑब्जेक्ट, और इसी तरह।
आइए एक उदाहरण देखें -
उदाहरण
import pandas as pd my_data = {'ab' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'mn' : pd.Series([56, 78, 13, 13], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("The dataframe created from dictionary of series : ") print(my_df)
आउटपुट
The dataframe created from dictionary f series : ab mn a 1.0 56 b 2.0 78 c 3.0 13 d NaN 13
स्पष्टीकरण
-
आवश्यक पुस्तकालयों को आयात किया जाता है, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
-
कुंजी और मान से युक्त शब्दकोश मान बनाए जाते हैं, जिसमें एक मान वास्तव में एक श्रृंखला डेटा संरचना होती है।
-
श्रृंखला के इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
-
श्रृंखला के शब्दकोश को पैरामीटर के रूप में पास करके डेटाफ़्रेम बनाया जाता है।
-
डेटाफ़्रेम कंसोल पर मुद्रित होता है।
नोट - 'NaN' शब्द का अर्थ 'नंबर नहीं' है, जिसका अर्थ है कि विशिष्ट [row, col] मान में कोई मान्य प्रविष्टि नहीं है।