डेटाफ़्रेम एक द्वि-आयामी डेटा संरचना है, जहाँ डेटा को पंक्तियों और स्तंभों के रूप में एक सारणीबद्ध प्रारूप में संग्रहीत किया जाता है।
इसे SQL डेटा तालिका या एक्सेल शीट प्रतिनिधित्व के रूप में देखा जा सकता है। इसे निम्नलिखित कंस्ट्रक्टर का उपयोग करके बनाया जा सकता है -
pd.Dataframe(data, index, columns, dtype, copy)
डेटाफ़्रेम में अलग-अलग तरीकों से एक नया कॉलम जोड़ा जा सकता है।
आइए उन तरीकों में से एक देखें, जिसमें पहले एक श्रृंखला डेटा संरचना बनाकर और इसे मौजूदा डेटाफ़्रेम में एक अतिरिक्त कॉलम के रूप में पास करके एक नया कॉलम बनाया जाता है।
आइए हम कोड को क्रिया में देखें -
उदाहरण
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])} my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) print ("Adding a new column to the dataframe by passing it as a Series structure :") my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c']) print("After adding a new column to the dataframe, :") print(my_df)
आउटपुट
The dataframe is : ab cd a 1.0 1 b 8.0 2 c 7.0 0 d NaN 9 Adding a new column to the dataframe by passing it as a Series structure : After adding a new column to the dataframe, : ab cd ef a 1.0 1 56.0 b 8.0 2 78.0 c 7.0 0 32.0 d NaN 9 NaN
स्पष्टीकरण
-
आवश्यक पुस्तकालयों को आयात किया जाता है, और उपयोग में आसानी के लिए उपनाम दिए जाते हैं।
-
एक शब्दकोश डेटा संरचना बनाई जाती है, जिसमें एक शब्दकोश में एक कुंजी-मूल्य जोड़ी मौजूद होती है।
-
इस तरह, एक सूची में कई शब्दकोश बनाए और संग्रहीत किए जाते हैं।
-
कुंजी मान युग्म में 'मान' वास्तव में एक श्रृंखला डेटा संरचना है।
-
सूचकांक भी मूल्यों की एक अनुकूलित सूची है।
-
इस शब्दकोश को बाद में 'पांडा' पुस्तकालय में मौजूद 'डेटाफ्रेम' फ़ंक्शन के पैरामीटर के रूप में पारित किया गया है
-
डेटाफ़्रेम शब्दकोश मानों की सूची को पैरामीटर के रूप में पास करके बनाया गया है।
-
एक और नया कॉलम बनाया जाता है और उसमें मानों को इनिशियलाइज़ किया जाता है।
-
यह नया कॉलम मूल डेटाफ़्रेम में अनुक्रमित किया गया है।
-
इस तरह, नया कॉलम डेटाफ़्रेम से जुड़ जाता है।
-
डेटाफ़्रेम कंसोल पर मुद्रित होता है।
नोट - 'NaN' शब्द का अर्थ 'नंबर नहीं' है, जिसका अर्थ है कि विशिष्ट [row, col] मान में कोई मान्य प्रविष्टि नहीं है।