डेटाफ़्रेम एक दो आयामी डेटा संरचना है, जहाँ डेटा को पंक्तियों और स्तंभों के रूप में एक सारणीबद्ध प्रारूप में संग्रहीत किया जाता है। इसे SQL डेटा तालिका या एक्सेल शीट प्रतिनिधित्व के रूप में देखा जा सकता है।
इसे निम्नलिखित कंस्ट्रक्टर का उपयोग करके बनाया जा सकता है -
pd.Dataframe(data, index, columns, dtype, copy)
हमने पहले एक विधि देखी थी जिसमें श्रृंखला डेटा संरचना के रूप में एक नया स्तंभ बनाया गया था। इसे मूल डेटाफ़्रेम में अनुक्रमित किया गया था और इसलिए इसे डेटाफ़्रेम में जोड़ा गया।
आइए हम उपयोग करें कि हम डेटाफ़्रेम के पहले से मौजूद कॉलम का उपयोग करके एक कॉलम कैसे बना सकते हैं। यह तब उपयोगी होता है जब हमें पहले से मौजूद कॉलम पर कुछ गणना करने और उनके परिणाम को एक नए कॉलम में स्टोर करने की आवश्यकता होती है -
उदाहरण
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' :pd.Series([56, 78, 32],index=['a','b','c'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) my_df['gh'] = my_df['ab'] + my_df['ef'] print("After adding column 0 and 2 to the dataframe, :") print(my_df)
आउटपुट
The dataframe is : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN After adding column 0 and 2 to the dataframe, : ab cd ef gh a 1.0 1 56.0 57.0 b 8.0 2 78.0 86.0 c 7.0 0 32.0 39.0 d NaN 9 NaN NaN
स्पष्टीकरण
-
आवश्यक पुस्तकालयों को आयात किया जाता है, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
-
कुंजी और मान से युक्त शब्दकोश मान बनाए जाते हैं, जिसमें एक मान वास्तव में एक श्रृंखला डेटा संरचना होती है।
-
ऐसे अनेक शब्दकोश मान बनाए जाते हैं।
-
इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
-
शब्दकोश को पैरामीटर के रूप में पास करके डेटाफ़्रेम बनाया जाता है।
-
डेटाफ़्रेम में एक नया स्तंभ अनुक्रमित किया जाता है, और इस नए स्तंभ को बनाने के लिए 0वें और दूसरे स्तंभ को जोड़ा जाता है।
-
डेटाफ़्रेम कंसोल पर मुद्रित होता है।
नोट - 'NaN' शब्द का अर्थ 'नंबर नहीं' है, जिसका अर्थ है कि विशिष्ट [row, col] मान में कोई मान्य प्रविष्टि नहीं है।