डेटासेट के पूर्वानुमान प्रदर्शन को बेहतर बनाने के लिए बूस्टेड ट्री के साथ Tensorflow का उपयोग किया जा सकता है। डेटा लोड किया जाता है, और पूर्व-संसाधित जिस तरह से यह आमतौर पर किया जाता है, लेकिन जब भविष्यवाणियां की जाती हैं, तो भविष्यवाणियों के लिए कई मॉडलों का उपयोग किया जाता है, और इन सभी मॉडलों के आउटपुट को अंतिम परिणाम देने के लिए जोड़ा जाता है।
और पढ़ें: TensorFlow क्या है और Keras कैसे तंत्रिका नेटवर्क बनाने के लिए TensorFlow के साथ काम करता है?
हम केरस अनुक्रमिक एपीआई का उपयोग करेंगे, जो एक अनुक्रमिक मॉडल बनाने में सहायक है जिसका उपयोग परतों के एक सादे ढेर के साथ काम करने के लिए किया जाता है, जहां हर परत में एक इनपुट टेंसर और एक आउटपुट टेंसर होता है।
एक तंत्रिका नेटवर्क जिसमें कम से कम एक परत होती है, एक दृढ़ परत के रूप में जानी जाती है। हम लर्निंग मॉडल बनाने के लिए कन्वेन्शनल न्यूरल नेटवर्क का उपयोग कर सकते हैं।
हम नीचे दिए गए कोड को चलाने के लिए Google सहयोग का उपयोग कर रहे हैं। Google Colab या Colaboratory ब्राउज़र पर पायथन कोड चलाने में मदद करता है और इसके लिए शून्य कॉन्फ़िगरेशन और GPU (ग्राफ़िकल प्रोसेसिंग यूनिट) तक मुफ्त पहुंच की आवश्यकता होती है। जुपिटर नोटबुक के ऊपर कोलैबोरेटरी बनाई गई है।
हम देखेंगे कि कैसे एक ग्रेडिएंट बूस्टिंग मॉडल को डिसीजन ट्री और tf.estimator API का उपयोग करके प्रशिक्षित किया जा सकता है। बूस्टेड ट्री मॉडल को प्रतिगमन के साथ-साथ वर्गीकरण के लिए सबसे लोकप्रिय और प्रभावी मशीन लर्निंग दृष्टिकोण माना जाता है। यह एक पहनावा तकनीक है जो कई (10s या 100s या 1000s) ट्री मॉडल की भविष्यवाणियों को जोड़ती है। वे न्यूनतम हाइपरपैरामीटर ट्यूनिंग के साथ प्रभावशाली प्रदर्शन प्राप्त करने में मदद करते हैं।
उदाहरण
import numpy as np
import pandas as pd
from IPython.display import clear_output
from matplotlib import pyplot as plt
print("Load the dataset")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("Delete the column 'survived'")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
import tensorflow as tf
tf.random.set_seed(123) के रूप में टेंसरफ़्लो आयात करें कोड क्रेडिट -https://www.tensorflow.org/tutorials/estimator/boosted_trees
आउटपुट
Load the dataset Delete the column 'survived'
स्पष्टीकरण
- आवश्यक पैकगैस आयात किए जाते हैं।
- डेटासेट लोड हो गया है।
- इसे एक csv फ़ाइल के रूप में पढ़ा जाता है।
- 'बचाया' कॉलम हटा दिया गया है।