Tensorflow एक मशीन लर्निंग फ्रेमवर्क है जो Google द्वारा प्रदान किया जाता है। यह एक ओपन-सोर्स फ्रेमवर्क है जिसका उपयोग एल्गोरिदम, गहन शिक्षण अनुप्रयोगों और बहुत कुछ को लागू करने के लिए पायथन के साथ संयोजन में किया जाता है। इसका उपयोग अनुसंधान और उत्पादन उद्देश्यों के लिए किया जाता है। इसमें अनुकूलन तकनीकें हैं जो जटिल गणितीय कार्यों को शीघ्रता से करने में मदद करती हैं। ऐसा इसलिए है क्योंकि यह NumPy और बहु-आयामी सरणियों का उपयोग करता है। इन बहु-आयामी सरणियों को 'टेंसर' के रूप में भी जाना जाता है। फ्रेमवर्क गहरे तंत्रिका नेटवर्क के साथ काम करने का समर्थन करता है। यह अत्यधिक मापनीय है, और कई लोकप्रिय डेटासेट के साथ आता है।
Tensor एक डेटा संरचना है जिसका उपयोग TensorFlow में किया जाता है। यह प्रवाह आरेख में किनारों को जोड़ने में मदद करता है। इस प्रवाह आरेख को 'डेटा प्रवाह ग्राफ' के रूप में जाना जाता है। टेंसर और कुछ नहीं बल्कि एक बहुआयामी सरणी या एक सूची है।
प्रतिगमन समस्या के पीछे का उद्देश्य एक निरंतर या असतत चर के उत्पादन की भविष्यवाणी करना है, जैसे कि मूल्य, संभावना, बारिश होगी या नहीं और इसी तरह।
हमारे द्वारा उपयोग किए जाने वाले डेटासेट को 'ऑटो एमपीजी' डेटासेट कहा जाता है। इसमें 1970 और 1980 के दशक के ऑटोमोबाइल की ईंधन दक्षता शामिल है। इसमें वजन, अश्वशक्ति, विस्थापन आदि जैसे गुण शामिल हैं। इसके साथ, हमें विशिष्ट वाहनों की ईंधन दक्षता की भविष्यवाणी करने की आवश्यकता है।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
निम्नलिखित कोड स्निपेट है जिसमें हम देखेंगे कि TensorFlow का उपयोग करके ऑटो MPG डेटासेट के साथ ईंधन दक्षता की भविष्यवाणी करने के लिए डेटा को कैसे विभाजित और निरीक्षण किया जा सकता है -
उदाहरण
print("Splitting the training and testing dataset") train_dataset = dataset.sample(frac=0.7, random_state=0) test_dataset = dataset.drop(train_dataset.index) print("Plotting the training data as a visualization") sns.pairplot(train_dataset[['MPG', 'Cylinders', 'Displacement', 'Weight']], diag_kind='kde') print("Understanding the statistics associated with the data") train_dataset.describe().transpose()
कोड क्रेडिट - https://www.tensorflow.org/tutorials/keras/regression
आउटपुट
Splitting the training and testing dataset Plotting the training data as a visualization Understanding the statistics associated with the data
स्पष्टीकरण
-
डेटा साफ़ हो जाने के बाद, डेटा को प्रशिक्षण और परीक्षण डेटासेट में विभाजित किया जाता है।
-
70 प्रतिशत डेटा प्रशिक्षण के लिए और शेष 30 प्रतिशत परीक्षण के लिए उपयोग किया जाता है।
-
इस प्रशिक्षण डेटा को सीबॉर्न पैकेज का उपयोग करके कंसोल पर देखा जाता है।
-
डेटा के आँकड़े, जैसे कि गिनती, माध्य, माध्यिका, इत्यादि को 'डिस्क्राइब' फ़ंक्शन का उपयोग करके प्रदर्शित किया जाता है।