मास्टर एलएलएम एजेंट:लैंगग्राफ और क्रूएआई के साथ स्वचालित कॉम्प्लेक्स वर्कफ़्लोज़

<पी> क्या आपको कभी ऐसा महसूस हुआ है कि आपके एआई उपकरण कुछ हद तक निष्क्रिय हैं? जैसे वे वहीं बैठे हों, आपके अगले आदेश की प्रतीक्षा कर रहे हों? कल्पना करें कि क्या वे पहल कर सकते हैं, बड़ी समस्याओं का समाधान कर सकते हैं, और काम पूरा करने के लिए मिलकर काम भी कर सकते हैं।

<पी> एलएलएम एजेंट बिल्कुल यही बात सामने लाते हैं। वे बदल रहे हैं कि हम जटिल कार्यों को कैसे स्वचालित करते हैं, और वे हमारे एआई विचारों को बिल्कुल नए तरीके से जीवन में लाने में मदद कर सकते हैं।

<पी> इस लेख में, हम जानेंगे कि एलएलएम एजेंट क्या हैं, वे कैसे काम करते हैं, और आप अद्भुत ओपन-सोर्स फ्रेमवर्क का उपयोग करके अपना खुद का निर्माण कैसे कर सकते हैं।

हम क्या कवर करेंगे:

<पी> एलएलएम एजेंटों की वर्तमान स्थिति
- <पी> चैटबॉट्स से लेकर स्वायत्त एजेंट
  तक
- <पी> एजेंट आज क्या कर सकते हैं?
- <पी> निर्माण के लिए क्या उपलब्ध है?
- <पी> क्यों अभी सीखने का सबसे अच्छा समय है
<पी> एलएलएम एजेंट क्या हैं और वे एक बड़ी डील क्यों हैं?
- <पी> एलएलएम क्या है?
- <पी> तो, एलएलएम एजेंट क्या है?
- <पी> यह क्यों मायने रखता है?
<पी> ओपन-सोर्स एजेंट फ्रेमवर्क का उदय
- <पी> लोकप्रिय ओपन-सोर्स एजेंट फ्रेमवर्क
- <पी> ये उपकरण क्या सक्षम करते हैं
- <पी> स्क्रैच से निर्माण के बजाय फ्रेमवर्क का उपयोग क्यों करें?
<पी> एजेंट डिज़ाइन के पीछे मुख्य अवधारणाएँ
- <पी> एजेंट लूप
- <पी> एक एजेंट के प्रमुख घटक
- <पी> बहु-एजेंट सहयोग
<पी> प्रोजेक्ट:ईमेल से अपना दैनिक शेड्यूल स्वचालित करें
- <पी> हम क्या स्वचालित कर रहे हैं
- <पी> चरण 1:आवश्यक उपकरण स्थापित करें
- <पी> चरण 2:कार्य को परिभाषित करें
- <पी> चरण 3:लैंगग्राफ के साथ वर्कफ़्लो बनाएं
<पी> CrewAI
के साथ मल्टी-एजेंट सहयोग
- <पी> क्रूएआई क्या है?
- <पी> ईमेल सारांश कार्य के लिए नमूना भूमिकाएँ
- <पी> नमूना CrewAI कोड
<पी> निष्पादन के दौरान वास्तव में क्या होता है?
<पी> क्या एलएलएम एजेंट सुरक्षित हैं? सुरक्षा और गोपनीयता के बारे में क्या जानें
<पी> समस्या निवारण एवं युक्तियाँ
<पी> अधिक दैनिक स्वचालनों का अन्वेषण करें
<पी> एजेंट टेक्नोलॉजी में आगे क्या है?
<पी> अंतिम सारांश

एलएलएम एजेंटों की वर्तमान स्थिति

<पी> एलएलएम एजेंट इस समय एआई में सबसे रोमांचक विकासों में से एक हैं। वे पहले से ही वास्तविक कार्यों को स्वचालित करने में मदद कर रहे हैं लेकिन वे अभी भी विकसित हो रहे हैं। तो आज हम कहां हैं?

चैटबॉट्स से स्वायत्त एजेंटों तक

<पी> GPT-4, क्लाउड, जेमिनी और LLaMA जैसे बड़े भाषा मॉडल (LLM) सरल चैटबॉट से आश्चर्यजनक रूप से सक्षम तर्क इंजन में विकसित हुए हैं। वे सामान्य प्रश्नों के उत्तर देने और निबंध तैयार करने से लेकर जटिल तर्क करने, बहु-चरणीय निर्देशों का पालन करने और वेब खोज और कोड दुभाषियों जैसे उपकरणों के साथ बातचीत करने तक चले गए हैं।

<पी> लेकिन यहाँ एक समस्या है:ये मॉडल प्रतिक्रियाशील हैं . वे इनपुट की प्रतीक्षा करते हैं और आउटपुट देते हैं। वे कार्यों के बीच स्मृति बनाए नहीं रखते, आगे की योजना नहीं बनाते, या स्वयं लक्ष्य का पीछा नहीं करते। यहीं एलएलएम एजेंट हैं अंदर आएं - वे संरचना, स्मृति और स्वायत्तता को जोड़कर इस अंतर को पाटते हैं।

एजेंट आज क्या कर सकते हैं?

<पी> अभी, एलएलएम एजेंटों का उपयोग पहले से ही किया जा रहा है:

<पी> ईमेल या दस्तावेज़ों का सारांश
<पी> दैनिक कार्यक्रम की योजना बनाना
<पी> DevOps स्क्रिप्ट चलाना
<पी> उत्तरों के लिए एपीआई या उपकरण खोजना
<पी> जटिल कार्यों को पूरा करने के लिए छोटी "टीमों" में सहयोग करना

<पी> लेकिन वे अभी तक परिपूर्ण नहीं हैं. एजेंट अभी भी कर सकते हैं:

<पी> लूप्स में फंस जाओ
<पी> लक्ष्यों को गलत समझना
<पी> विस्तृत संकेतों और रेलिंगों की आवश्यकता है

<पी> ऐसा इसलिए क्योंकि यह तकनीक अभी प्रारंभिक चरण में है। फ्रेमवर्क तेजी से बेहतर हो रहे हैं, लेकिन विश्वसनीयता और मेमोरी पर अभी भी काम चल रहा है। इसलिए प्रयोग करते समय बस इसे ध्यान में रखें।

सीखने का सबसे अच्छा समय अभी क्यों है

<पी> सच तो यह है:हम अभी भी जल्दी हैं। लेकिन भी नहीं जल्दी.

<पी> एजेंटों के साथ प्रयोग शुरू करने का यह सही समय है:

<पी> वास्तविक प्रोजेक्ट बनाने के लिए टूलींग पर्याप्त परिपक्व है
<पी> समुदाय तेजी से बढ़ रहा है
<पी> और आपको एआई विशेषज्ञ होने की ज़रूरत नहीं है, सिर्फ पायथन के साथ सहज होना जरूरी है

एलएलएम एजेंट क्या हैं और वे एक बड़ी डील क्यों हैं?

<पी> इससे पहले कि हम एजेंटों की रोमांचक दुनिया में उतरें, आइए बुनियादी बातों के बारे में थोड़ा और बात करें।

एलएलएम क्या है?

<पी> एलएलएम, या लार्ज लैंग्वेज मॉडल, मूल रूप से एक एआई है जो इंटरनेट से बड़ी मात्रा में पाठ से सीखा जाता है - किताबें, लेख, कोड और बहुत कुछ सोचें। आप इसे एक सुपर-स्मार्ट स्वत:पूर्ण इंजन के रूप में देख सकते हैं। लेकिन यह आपके वाक्यों को ख़त्म करने से कहीं अधिक महत्वपूर्ण है। यह भी हो सकता है:

<पी> पेचीदा सवालों के जवाब दें
<पी> लंबे लेखों या दस्तावेज़ों को सारांशित करें
<पी> कोड, ईमेल या रचनात्मक कहानियाँ लिखें
<पी> भाषाओं का तुरंत अनुवाद करें
<पी> यहां तक कि तर्क पहेलियां भी सुलझाएं और आकर्षक बातचीत करें

<पी> संभावना है कि आपने ChatGPT के बारे में सुना होगा, जो OpenAI के GPT मॉडल द्वारा संचालित है। अन्य लोकप्रिय एलएलएम जो आपको मिल सकते हैं उनमें क्लाउड (एंथ्रोपिक से), एलएलएएमए (मेटा द्वारा), मिस्ट्रल, और जेमिनी (Google से) शामिल हैं।

<पी> ये मॉडल संदर्भ के आधार पर वाक्य में अगले शब्द की भविष्यवाणी करके काम करते हैं। हालांकि यह सीधा लगता है, जब अरबों शब्दों पर प्रशिक्षित किया जाता है, तो एलएलएम आश्चर्यजनक रूप से बुद्धिमान व्यवहार करने, आपके निर्देशों को समझने, चरण-दर-चरण तर्क का पालन करने और लगभग किसी भी विषय पर सुसंगत प्रतिक्रिया उत्पन्न करने में सक्षम हो जाते हैं जिसकी आप कल्पना कर सकते हैं।

तो, एलएलएम एजेंट क्या है?

<पी> जबकि एलएलएम अत्यधिक शक्तिशाली हैं, वे आम तौर पर केवल प्रतिक्रिया - करते हैं वे तभी उत्तर देते हैं जब आप उनसे कुछ पूछते हैं। दूसरी ओर, एक एलएलएम एजेंट, सक्रिय होता है .

<पी> एलएलएम एजेंट ये कर सकते हैं:

<पी> बड़े, जटिल कार्यों को छोटे, प्रबंधनीय चरणों में विभाजित करें
<पी> स्मार्ट निर्णय लें और तय करें कि आगे क्या करना है
<पी> वेब खोज, कैलकुलेटर, या यहां तक कि अन्य ऐप्स
जैसे "टूल्स" का उपयोग करें
<पी> एक लक्ष्य की ओर काम करें, भले ही इसके लिए कई कदम उठाने पड़ें या कोशिशें करनी पड़े
<पी> साझा उद्देश्यों को पूरा करने के लिए अन्य एजेंटों के साथ टीम बनाएं

<पी> संक्षेप में, एलएलएम एजेंट सोच सकते हैं, योजना बना सकते हैं, कार्य कर सकते हैं और अनुकूलन कर सकते हैं।

<पी> एक एलएलएम एजेंट के बारे में अपने अति-कुशल नए सहायक की तरह सोचें:आप उसे एक लक्ष्य देते हैं, और वह यह पता लगाता है कि इसे अपने आप कैसे हासिल किया जाए।

यह मायने क्यों रखता है?

<पी> केवल सक्रिय रूप से लक्ष्यों का पीछा करने के लिए प्रतिक्रिया देने से यह बदलाव कई रोमांचक संभावनाओं को खोलता है:

<पी> उबाऊ IT या DevOps कार्यों को स्वचालित करना
<पी> कच्चे डेटा से विस्तृत रिपोर्ट तैयार करना
<पी> बहु-चरणीय अनुसंधान परियोजनाओं में आपकी सहायता करना
<पी> अपने दैनिक ईमेल पढ़ना और मुख्य जानकारी हाइलाइट करना
<पी> वास्तविक दुनिया की कार्रवाई करने के लिए अपने आंतरिक उपकरण चलाएँ

<पी> पुराने, नियम-आधारित बॉट्स के विपरीत, एलएलएम एजेंट अपने प्रयासों से तर्क कर सकते हैं, प्रतिबिंबित कर सकते हैं और सीख सकते हैं। यह उन्हें वास्तविक दुनिया के कार्यों के लिए अधिक उपयुक्त बनाता है जो गड़बड़ हैं, लचीलेपन की आवश्यकता होती है और संदर्भ को समझने पर निर्भर करते हैं।

ओपन-सोर्स एजेंट फ्रेमवर्क का उदय

<पी> बहुत पहले नहीं, यदि आप एक एआई सिस्टम बनाना चाहते थे जो स्वायत्त रूप से कार्य कर सके, तो इसका मतलब था ढेर सारे कस्टम कोड लिखना, श्रमपूर्वक मेमोरी का प्रबंधन करना और दर्जनों घटकों को एक साथ जोड़ने की कोशिश करना। यह एक जटिल, नाजुक और अत्यधिक विशिष्ट कार्य था।

<पी> लेकिन सोचो क्या? अब वैसा मामला नहीं है.

<पी> 2024 में, शानदार ओपन-सोर्स फ्रेमवर्क की लहर सामने आई। इन उपकरणों ने आपको हर बार पहिये का आविष्कार किए बिना शक्तिशाली एलएलएम एजेंटों का निर्माण करना नाटकीय रूप से आसान बना दिया है।

ये उपकरण क्या सक्षम करते हैं

<पी> ये ढाँचे आपको एजेंट बनाने के पेचीदा हिस्सों को संभालने के लिए तैयार बिल्डिंग ब्लॉक्स देते हैं:

<पी> योजना बनाना – एजेंटों को अपना अगला कदम तय करने दें
<पी> उपकरण का उपयोग – एजेंटों को फ़ाइल सिस्टम, वेब ब्राउज़र, एपीआई या डेटाबेस जैसी चीज़ों से आसानी से जोड़ना
<पी> स्मृति – दीर्घकालिक संदर्भ के लिए पिछली जानकारी या मध्यवर्ती परिणामों को संग्रहीत करना और पुनः प्राप्त करना
<पी> मल्टी-एजेंट सहयोग - एजेंटों की टीमों की स्थापना करना जो साझा लक्ष्यों पर एक साथ काम करते हैं

स्क्रैच से निर्माण के बजाय फ्रेमवर्क का उपयोग क्यों करें?

<पी> जबकि आप कर सकते थे शुरू से ही एक कस्टम एजेंट बनाएं, एक फ्रेमवर्क का उपयोग करने से आपका काफी समय और प्रयास बचेगा। ओपन-सोर्स एजेंट लाइब्रेरीज़ निम्नलिखित से भरी हुई हैं:

<पी> एलएलएम को ऑर्केस्ट्रेट करने के लिए अंतर्निहित समर्थन
<पी> कार्य योजना बनाने, आप कहां हैं इसका ध्यान रखने और फीडबैक प्राप्त करने के लिए सिद्ध पैटर्न
<पी> OpenAI जैसे लोकप्रिय मॉडल, या यहां तक कि आपके द्वारा स्थानीय रूप से चलाए जाने वाले मॉडल के साथ आसान एकीकरण।
<पी> एक सहायक एजेंट से एजेंटों की पूरी टीम तक बढ़ने का लचीलापन

<पी> मूल रूप से, ये ढाँचे आपको इस बात पर ध्यान केंद्रित करने देते हैं कि आपके एजेंट को क्या करना चाहिए , बजाय इसके कि सभी आंतरिक कामकाज को कैसे तैयार किया जाए, इसमें उलझे रहें। साथ ही, ओपन सोर्स चुनने का मतलब है कि आपको सामुदायिक योगदान, उनके काम करने के तरीके में पारदर्शिता और किसी एक विक्रेता से बंधे बिना उन्हें अपनी सटीक जरूरतों के अनुसार बदलने की आजादी से लाभ मिलता है।

एजेंट डिज़ाइन के पीछे मुख्य अवधारणाएँ

<पी> वास्तव में यह समझने के लिए कि एलएलएम एजेंट कैसे काम करते हैं, उन्हें लक्ष्य-संचालित प्रणालियों के रूप में सोचने में मदद मिलती है जो लगातार अवलोकन, तर्क और अभिनय के माध्यम से चक्र करते हैं। यह निरंतर लूप उन्हें ऐसे कार्यों से निपटने की अनुमति देता है जो सरल प्रश्नों और उत्तरों से परे, वास्तविक स्वचालन, टूल उपयोग और तुरंत अनुकूलन की ओर बढ़ते हैं।

एजेंट लूप

<पी> अधिकांश एलएलएम एजेंट एजेंट लूप नामक मानसिक मॉडल के आधार पर कार्य करते हैं एक चरण-दर-चरण चक्र जो कार्य पूरा होने तक दोहराया जाता है। यहां बताया गया है कि यह आम तौर पर कैसे काम करता है:

<पी> समझें: एजेंट अपने वातावरण में कुछ नोटिस करने या नई जानकारी प्राप्त करने से शुरुआत करता है। यह आपका संकेत, डेटा का एक टुकड़ा, या सिस्टम की वर्तमान स्थिति हो सकती है।
<पी> योजना: वह जो समझता है और अपने समग्र लक्ष्य के आधार पर, एजेंट निर्णय लेता है कि आगे क्या करना है। यह कार्य को छोटे उप-लक्ष्यों में विभाजित कर सकता है या कार्य के लिए सर्वोत्तम उपकरण का पता लगा सकता है।
<पी> कार्य: एजेंट तब कार्य करता है। इसका मतलब एक फ़ंक्शन चलाना, एपीआई कॉल करना, वेब पर खोज करना, डेटाबेस के साथ इंटरैक्ट करना या यहां तक कि किसी अन्य एजेंट से मदद मांगना हो सकता है।
<पी> चिंतन करें: कार्य करने के बाद, एजेंट परिणाम को देखता है:क्या इसने काम किया? क्या परिणाम उपयोगी था? क्या इसे एक अलग दृष्टिकोण आज़माना चाहिए? इसके आधार पर, यह अपनी योजना को अद्यतन करता है और कार्य पूरा होने तक चलता रहता है।

<पी> यह लूप एजेंटों को इतना गतिशील बनाता है। यह उन्हें लगातार बदलते कार्यों को संभालने, आंशिक परिणामों से सीखने और अपने पाठ्यक्रम गुणों को सही करने की अनुमति देता है जो वास्तव में उपयोगी एआई सहायकों के निर्माण के लिए महत्वपूर्ण हैं।

एजेंट के प्रमुख घटक

<पी> अपना काम प्रभावी ढंग से करने के लिए, एजेंट कई महत्वपूर्ण भागों के आधार पर बनाए जाते हैं:

<पी> उपकरण एक एजेंट वास्तविक (या डिजिटल) दुनिया के साथ कैसे इंटरैक्ट करता है। ये खोज इंजन, कोड निष्पादन वातावरण, फ़ाइल रीडर या एपीआई क्लाइंट से लेकर सरल कैलकुलेटर या कमांड-लाइन स्क्रिप्ट तक कुछ भी हो सकते हैं।
<पी> स्मृति एजेंटों को यह याद रखने देता है कि उन्होंने विभिन्न चरणों में क्या किया है या क्या देखा है। इसमें आपके द्वारा कही गई पिछली बातें, अस्थायी परिणाम या महत्वपूर्ण निर्णय शामिल हो सकते हैं। कुछ ढाँचे अल्पकालिक स्मृति (सिर्फ एक सत्र के लिए) प्रदान करते हैं, जबकि अन्य दीर्घकालिक स्मृति का समर्थन करते हैं जो कई सत्रों या लक्ष्यों तक फैल सकती है।
<पी> पर्यावरण बाहरी डेटा या सिस्टम संदर्भ को संदर्भित करता है जिसे एजेंट थिंक एपीआई, दस्तावेज़, डेटाबेस, फ़ाइलें या सेंसर इनपुट के भीतर संचालित करता है। एक एजेंट के पास अपने परिवेश तक जितनी अधिक जानकारी और पहुंच होगी, वह उतने ही अधिक सार्थक कार्य कर सकता है।
<पी> लक्ष्य एजेंट का अंतिम उद्देश्य है:वह क्या हासिल करने की कोशिश कर रहा है। लक्ष्य विशिष्ट और स्पष्ट होने चाहिए, उदाहरण के लिए, "दैनिक शेड्यूल बनाएं," "इस दस्तावेज़ को सारांशित करें," या "ईमेल से कार्य निकालें।"

मल्टी-एजेंट सहयोग

<पी> अधिक उन्नत प्रणालियों के लिए, आपके पास एक साझा लक्ष्य को हासिल करने के लिए एक साथ काम करने वाले कई एजेंट भी हो सकते हैं। प्रत्येक एजेंट को एक विशिष्टभूमिका दी जा सकती है जो एक टीम में काम करने वाले लोगों की तरह ही इसकी खासियत को उजागर करता है।

<पी> उदाहरण के लिए:

<पी> एक शोधकर्ता एजेंट जानकारी इकट्ठा करने का काम सौंपा जा सकता है।
<पी> एक कोडर एजेंट पायथन स्क्रिप्ट या ऑटोमेशन रूटीन लिख सकता है।
<पी> एक समीक्षक एजेंट परिणामों की जांच कर सकता है और सुनिश्चित कर सकता है कि सब कुछ सही है।

<पी> ये एजेंट एक-दूसरे से चैट कर सकते हैं, जानकारी साझा कर सकते हैं और यहां तक कि निर्णयों पर बहस या वोट भी कर सकते हैं। इस प्रकार का टीम वर्क एआई सिस्टम को चीजों को व्यवस्थित और मॉड्यूलर रखते हुए बड़े, अधिक जटिल कार्यों से निपटने की अनुमति देता है।

प्रोजेक्ट:ईमेल से अपने दैनिक शेड्यूल को स्वचालित करें

हम क्या स्वचालित कर रहे हैं

<पी> अपनी सामान्य सुबह की दिनचर्या के बारे में सोचें:

<पी> आप अपना इनबॉक्स खोलें.
<पी> आप ईमेल के एक समूह को तुरंत स्कैन करते हैं।
<पी> आप मीटिंगों, कार्यों और महत्वपूर्ण अनुस्मारकों को पहचानने का प्रयास करते हैं।
<पी> फिर, आप मैन्युअल रूप से एक कार्य सूची लिखते हैं या चीजों को अपने कैलेंडर में जोड़ते हैं।

<पी> आइए उस प्रक्रिया को सरल बनाने के लिए एलएलएम एजेंट का उपयोग करें। हमारा एजेंट करेगा:

<पी> अपने ईमेल संदेशों की सूची पढ़ें
<पी> बैठकों या समय-सीमाओं जैसी समय-संवेदनशील वस्तुओं को हटा दें
<पी> हर चीज़ को एक अच्छे, स्वच्छ दैनिक शेड्यूल में सारांशित करें

चरण 1:आवश्यक उपकरण स्थापित करें

<पी> आरंभ करने के लिए, आपको तीन मुख्य टूल की आवश्यकता होगी:पायथन, VSCode, और एक OpenAI API कुंजी।

1. Python 3.9 या उच्चतर स्थापित करें

<पी> आधिकारिक वेबसाइट से Python 3.9+ का नवीनतम संस्करण प्राप्त करें:https://www.python.org/downloads/

<पी> एक बार यह इंस्टॉल हो जाए, तो python --version चलाकर इसे दोबारा जांचें आपके टर्मिनल में.

<पी> यह कमांड बस आपके सिस्टम से वर्तमान में स्थापित पायथन संस्करण की रिपोर्ट करने के लिए कहता है। आप हमारे प्रोजेक्ट के साथ अनुकूलता सुनिश्चित करने के लिए Python 3.9.x या कुछ उच्चतर देखना चाहेंगे।

2. VSCode स्थापित करें (वैकल्पिक लेकिन अनुशंसित)

<पी> VSCode एक शानदार, उपयोगकर्ता-अनुकूल कोड संपादक है जो पायथन के साथ पूरी तरह से काम करता है। आप इसे यहीं डाउनलोड कर सकते हैं:https://code.visualstudio.com/.

3. अपनी OpenAI API कुंजी प्राप्त करें

<पी> यहां जाएं:https://platform.openai.com

<पी> साइन इन करें या नया खाता बनाएं. अपने एपीआई कुंजी पृष्ठ पर नेविगेट करें। "नई गुप्त कुंजी बनाएं" पर क्लिक करें और सुनिश्चित करें कि उस कुंजी को बाद के लिए किसी सुरक्षित स्थान पर कॉपी कर लिया जाए।

4. पायथन लाइब्रेरीज़ स्थापित करें

<पी> अपना टर्मिनल या कमांड प्रॉम्प्ट खोलें और ये आवश्यक पैकेज इंस्टॉल करें:

pip install langgraph langchain openai

<पी> यह कमांड हमारे एजेंट के लिए तीन महत्वपूर्ण लाइब्रेरीज़ को डाउनलोड और इंस्टॉल करने के लिए पाइप, पायथन के पैकेज मैनेजर का उपयोग करता है:

<पी> लैंगग्राफ:मुख्य ढांचा जिसका उपयोग हम अपने एजेंट के वर्कफ़्लो को बनाने के लिए करेंगे।
<पी> लैंगचैन:बड़े भाषा मॉडल के साथ काम करने के लिए एक मूलभूत पुस्तकालय, जिस पर लैंगग्राफ बनाया गया है।
<पी> openai:OpenAI के शक्तिशाली AI मॉडल से जुड़ने के लिए आधिकारिक पायथन लाइब्रेरी।

<पी> यदि आप मल्टी-एजेंट सेटअप (जिसे हम चरण 5 में कवर करेंगे) आज़माने के लिए उत्साहित हैं, तो CrewAI भी इंस्टॉल करें:

pip install crewai

<पी> यह कमांड CrewAI स्थापित करता है, एक विशेष ढांचा जो एक टीम के रूप में एक साथ काम करने वाले कई AI एजेंटों को व्यवस्थित करना आसान बनाता है।

<पी> 5. अपनी OpenAI API कुंजी सेट करें <पी> आपको यह सुनिश्चित करना होगा कि आपका पायथन कोड आपकी OpenAI API कुंजी ढूंढ सके और उसका उपयोग कर सके। यह आम तौर पर इसे एक पर्यावरण चर के रूप में सेट करके किया जाता है।

<पी> MacOS/Linux पर, इसे अपने टर्मिनल में चलाएँ ("your-api-key" को अपनी वास्तविक कुंजी से बदलें):

export OPENAI_API_KEY="your-api-key"

<पी> यह कमांड OPENAI_API_KEY नामक एक पर्यावरण चर सेट करता है। पर्यावरण चर अनुप्रयोगों (जैसे आपकी पायथन स्क्रिप्ट) के लिए संवेदनशील जानकारी को सीधे कोड में हार्डकोड किए बिना एक्सेस करने का एक सुरक्षित तरीका है।

<पी> विंडोज़ पर (कमांड प्रॉम्प्ट का उपयोग करके), यह करें:

set OPENAI_API_KEY="your-api-key"

<पी> यह OPENAI_API_KEY सेट करने के लिए विंडोज़ समतुल्य कमांड है पर्यावरण चर.

<पी> अब, आपका पायथन कोड OpenAI मॉडल से बात करने के लिए पूरी तरह तैयार हो जाएगा!

चरण 2:कार्य को परिभाषित करें

<पी> हमने इस अनुभाग की शुरुआत में इस पर संक्षेप में चर्चा की। लेकिन दोहराने के लिए, हम यही चाहेंगे कि हमारा एजेंट ऐसा करे:

<पी> बैठकों, आयोजनों और महत्वपूर्ण कार्यों के लिए स्कैन करें।
<पी> उन्हें तुरंत एक नोटबुक या ऐप में लिख लें।
<पी> अपने दिन के लिए एक मोटी मानसिक योजना बनाएं।

<पी> इस दिनचर्या में समय और मानसिक ऊर्जा लगती है। इसलिए एक एजेंट का हमारे लिए यह काम करना बहुत मददगार होगा।

चरण 3:लैंगग्राफ के साथ वर्कफ़्लो बनाएं

लैंगग्राफ क्या है?

<पी> लैंगग्राफ एक अच्छा ढांचा है जो आपको "ग्राफ़-आधारित" वर्कफ़्लो का उपयोग करके एजेंट बनाने में मदद करता है, जैसे कि फ़्लोचार्ट बनाना। यह लैंगचेन द्वारा संचालित है और आपको इस बात पर अधिक नियंत्रण देता है कि आपके एजेंट की प्रक्रिया में प्रत्येक चरण कैसे सामने आता है।

<पी> इस ग्राफ़ में प्रत्येक "नोड" एक निर्णय बिंदु या एक फ़ंक्शन का प्रतिनिधित्व करता है जो:

<पी> कुछ इनपुट लेता है (इसकी वर्तमान "स्थिति")।
<पी> कुछ तर्क करता है या कोई कार्रवाई करता है (अक्सर एलएलएम और उसके उपकरण शामिल होते हैं)।
<पी> एक अद्यतन आउटपुट (एक नई "स्थिति") लौटाता है।

<पी> आप इन नोड्स के बीच कनेक्शन बनाते हैं, और लैंगग्राफ इसे एक स्मार्ट, स्वचालित राज्य मशीन की तरह निष्पादित करता है।

लैंगग्राफ का उपयोग क्यों करें?

<पी> आप निष्पादन के सटीक क्रम को नियंत्रित कर सकते हैं।
<पी> यह वर्कफ़्लो बनाने के लिए शानदार है जिसमें कई चरण होते हैं या यहां तक कि अलग-अलग पथों में शाखाएं होती हैं।
<पी> यह क्लाउड-आधारित मॉडल (जैसे OpenAI) और आपके द्वारा स्थानीय रूप से चलाए जाने वाले मॉडल दोनों के साथ अच्छी तरह से चलता है।

<पी> ठीक है - अब कोड लिखते हैं।

1. ईमेल इनपुट का अनुकरण करें

<पी> एक वास्तविक एप्लिकेशन में, आपका एजेंट संभवतः आपके वास्तविक ईमेल लाने के लिए जीमेल या आउटलुक से कनेक्ट होगा। हालाँकि, इस उदाहरण के लिए, हम चीजों को सरल बनाए रखने के लिए कुछ नमूना संदेशों को हार्डकोड करेंगे:

Python
emails = """
1. Subject: Standup Call at 10 AM
2. Subject: Client Review due by 5 PM
3. Subject: Lunch with Sarah at noon
4. Subject: AWS Budget Warning – 80% usage
5. Subject: Dentist Appointment - 4 PM
"""

<पी> यह मल्टीलाइन पायथन स्ट्रिंग, emails , वास्तविक ईमेल सामग्री के लिए हमारे स्टैंड-इन के रूप में कार्य करता है। हम यह दर्शाने के लिए ईमेल विषयों की एक सरल, संरचित सूची प्रदान कर रहे हैं कि एजेंट टेक्स्ट को कैसे संसाधित करेगा।

2. एजेंट लॉजिक को परिभाषित करें

<पी> अब, हम OpenAI के GPT मॉडल को बताएंगे कि इस ईमेल टेक्स्ट को कैसे संसाधित किया जाए और इसे सारांश में कैसे बदला जाए।

from langchain_openai import ChatOpenAI
from langgraph.graph import StateGraph, END
from typing import TypedDict, Annotated, List
import operator
# Define the state for our graph
class AgentState(TypedDict):
 emails: str
 result: str
llm = ChatOpenAI(temperature=0, model="gpt-4o") # Using gpt-4o for better performance
def calendar_summary_agent(state: AgentState) -> AgentState:
 emails = state["emails"]
 prompt = f"Summarize today's schedule based on these emails, listing time-sensitive items first and then other important notes. Be concise and use bullet points:\n{emails}"
 summary = llm.invoke(prompt).content
 return {"result": summary, "emails": emails} # Ensure emails is also returned

<पी> यहाँ क्या हो रहा है:

<पी> आयात :हम आवश्यक घटक लाते हैं:
- <पी> ChatOpenAI एलएलएम से जुड़ने के लिए,
- <पी> StateGraph और END langgraph.graph से हमारे एजेंट वर्कफ़्लो का निर्माण करने के लिए,
- <पी> TypedDict , Annotated , और List typing से प्रकार की जाँच और संरचना के लिए,
- <पी> operator (हालांकि इस स्निपेट में इसका उपयोग नहीं किया गया है, यह तुलना या तर्क में मदद कर सकता है)।
<पी> एजेंटस्टेट :यह TypedDict उस डेटा के आकार को परिभाषित करता है जिसके साथ हमारा एजेंट काम करेगा। इसमें शामिल हैं:
- <पी> emails :कच्चे इनपुट संदेश।
- <पी> result :अंतिम आउटपुट (दैनिक सारांश)।
<पी> llm =ChatOpenAI(...) :भाषा मॉडल को आरंभ करता है। हम temperature=0 के साथ GPT-4o का उपयोग कर रहे हैं संरचित सारांश कार्यों के लिए सुसंगत, पूर्वानुमानित आउटपुट सुनिश्चित करना।
<पी> कैलेंडर_सारांश_एजेंट(राज्य:एजेंटस्टेट) :यह फ़ंक्शन हमारे एजेंट का "मस्तिष्क" है। यह:
- <पी> वर्तमान स्थिति में लेता है, जिसमें ईमेल की एक सूची शामिल है।
- <पी> उस स्थिति से ईमेल निकालता है।
- <पी> एक संकेत का निर्माण करता है जो मॉडल को समय-संवेदनशील वस्तुओं को प्राथमिकता देते हुए बुलेट बिंदुओं का उपयोग करके एक संक्षिप्त दैनिक शेड्यूल सारांश उत्पन्न करने के लिए कहता है।
- <पी> यह संकेत llm.invoke(prompt).content वाले मॉडल को भेजता है , जो एलएलएम की प्रतिक्रिया को सादे पाठ के रूप में लौटाता है।
- <पी> एक नया AgentState लौटाता है शब्दकोश युक्त:
  - <पी> result :उत्पन्न सारांश,
  - <पी> emails :यदि हमें डाउनस्ट्रीम में इसकी आवश्यकता होती है तो इसे संरक्षित किया जाता है।

3. ग्राफ़ बनाएँ और चलाएँ

<पी> अब, आइए अपने एकल-एजेंट कार्य के प्रवाह को मैप करने और फिर उसे चलाने के लिए लैंगग्राफ का उपयोग करें।

builder = StateGraph(AgentState)
builder.add_node("calendar", calendar_summary_agent)
builder.set_entry_point("calendar")
builder.set_finish_point("calendar") # END is implicit if not set explicitly
graph = builder.compile()
# Run the graph using your simulated email data
result = graph.invoke({"emails": emails})
print(result["result"])

<पी> यहाँ क्या हो रहा है:

<पी> बिल्डर =स्टेटग्राफ(एजेंटस्टेट): हम एक स्टेटग्राफ ऑब्जेक्ट आरंभ कर रहे हैं। एजेंटस्टेट को पास करके, हम लैंगग्राफ को उसकी आंतरिक स्थिति के लिए अपेक्षित डेटा संरचना बता रहे हैं।
<पी> बिल्डर.एड_नोड("कैलेंडर", कैलेंडर_सारांश_एजेंट): यह पंक्ति हमारे ग्राफ़ में एक नामित "नोड" जोड़ती है। हम इसे "कैलेंडर" कह रहे हैं, और हम इसे अपने calendar_summary_agent से जोड़ रहे हैं फ़ंक्शन, जिसका अर्थ है कि फ़ंक्शन तब निष्पादित किया जाएगा जब यह नोड सक्रिय होगा।
<पी> बिल्डर.सेट_एंट्री_पॉइंट("कैलेंडर"): यह "कैलेंडर" को हमारे वर्कफ़्लो में सबसे पहले चरण के रूप में सेट करता है। जब हम ग्राफ़ शुरू करते हैं, तो निष्पादन यहां शुरू हो जाएगा।
<पी> बिल्डर.सेट_फिनिश_पॉइंट("कैलेंडर"): यह लैंगग्राफ को बताता है कि एक बार जब "कैलेंडर" नोड अपना काम पूरा कर लेता है, तो पूरी ग्राफ़ प्रक्रिया पूरी हो जाती है।
<पी> ग्राफ =बिल्डर.कंपाइल(): यह कमांड हमारे परिभाषित ग्राफ़ ब्लूप्रिंट को लेता है और इसे एक निष्पादन योग्य वर्कफ़्लो में "संकलित" करता है।
<पी> परिणाम =ग्राफ़.इनवोक({"ईमेल":ईमेल}): यहीं पर जादू होता है! हम अपने ग्राफ़ को चलना शुरू करने के लिए कह रहे हैं। हम इसे एक प्रारंभिक अवस्था में पास करते हैं जिसमें हमारा ईमेल डेटा होता है। ग्राफ़ तब तक इस डेटा को अपने नोड्स के माध्यम से संसाधित करेगा जब तक कि यह अंतिम बिंदु तक नहीं पहुंच जाता, अंतिम स्थिति लौटा देता है।
<पी> प्रिंट(परिणाम["परिणाम"]): अंत में, हम परिणाम (हमारे ग्राफ़ की अंतिम स्थिति) से सारांशित शेड्यूल लेते हैं और इसे कंसोल पर प्रिंट करते हैं।

उदाहरण आउटपुट

<पी> Your Schedule:
- 10:00 AM – Standup Call
- 12:00 PM – Lunch with Sarah
- 4:00 PM – Dentist Appointment
- Submit client report by 5:00 PM
- AWS Budget Warning – check usage <पी> बूम! आपने अभी-अभी एक AI एजेंट बनाया है जो आपके ईमेल पढ़ सकता है और आपके दैनिक शेड्यूल को बेहतर बना सकता है। बहुत बढ़िया, है ना? यह एलएलएम एजेंट कोड की कुछ पंक्तियों के साथ क्या कर सकते हैं, इसकी एक सरल लेकिन शक्तिशाली झलक है।

CrewAI के साथ मल्टी-एजेंट सहयोग

क्रूएआई क्या है?

<पी> CrewAI एक रोमांचक ओपन-सोर्स फ्रेमवर्क है जो आपको टीम बनाने की सुविधा देता है ऐसे एजेंट जो वास्तविक दुनिया की प्रोजेक्ट टीम की तरह एक साथ मिलकर काम करते हैं! CrewAI सेटअप में प्रत्येक एजेंट:

<पी> एक विशिष्ट, विशिष्ट भूमिका है।
<पी> अपने साथियों के साथ संवाद और जानकारी साझा कर सकता है।
<पी> साझा लक्ष्य हासिल करने के लिए सहयोग करता है।

<पी> यह बहु-एजेंट दृष्टिकोण तब बहुत उपयोगी होता है जब आपका कार्य केवल एक एजेंट के लिए बहुत बड़ा या बहुत जटिल होता है, या जब इसे विशेष भागों में विभाजित करना इसे स्पष्ट और अधिक कुशल बनाता है।

ईमेल सारांश कार्य के लिए नमूना भूमिकाएँ

<पी> आइए कल्पना करें कि हमारा ईमेल सारांश कार्य एजेंटों की एक छोटी टीम द्वारा संभाला जा रहा है:

एजेंट का नाम भूमिका जिम्मेदारी एक्सट्रैक्टरईमेल स्कैनर"ईमेल से मीटिंग, रिमाइंडर और कार्य ढूंढें"प्राथमिकता शेड्यूल ऑप्टिमाइज़रअत्यावश्यकता और समय के अनुसार आइटम सॉर्ट करेंफॉर्मेटरआउटपुट जेनरेटर"एक साफ़, परिष्कृत दैनिक एजेंडा लिखें"

नमूना CrewAI कोड

from crewai import Agent, Crew, Task, Process
from langchain_openai import ChatOpenAI
import os
# Set your OpenAI API key from environment variables
# os.environ["OPENAI_API_KEY"] = "YOUR_API_KEY" # Make sure this is set, or defined directly
# Initialize the LLM (using gpt-4o for better performance)
llm = ChatOpenAI(temperature=0, model="gpt-4o")
# Define the agents with specific roles and goals
extractor = Agent(
 role="Email Scanner",
 goal="Find all meetings, reminders, and tasks from the given emails, accurately extracting details like time, date, and subject.",
 backstory="You are an expert at scanning emails for key information. You meticulously extract every relevant detail.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)
prioritizer = Agent(
 role="Schedule Optimizer",
 goal="Sort extracted items by urgency and time, preparing them for a daily agenda.",
 backstory="You are a master of time management, always knowing what needs to be done first. You organize tasks logically.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)
formatter = Agent(
 role="Output Generator",
 goal="Generate a clean, polished, and concise daily agenda in bullet-point format, clearly listing all schedule items.",
 backstory="You are a professional secretary, ensuring all outputs are perfectly formatted and easy to read. You prioritize clarity.",
 verbose=True,
 allow_delegation=False,
 llm=llm
)
# Simulate email input
emails = """
1. Subject: Standup Call at 10 AM
2. Subject: Client Review due by 5 PM
3. Subject: Lunch with Sarah at noon
4. Subject: AWS Budget Warning – 80% usage
5. Subject: Dentist Appointment - 4 PM
"""
# Define the tasks for each agent
extract_task = Task(
 description=f"Extract all relevant events, meetings, and tasks from these emails: {emails}. Focus on precise details.",
 agent=extractor,
 expected_output="A list of extracted items with their details (e.g., '- Standup Call at 10 AM', '- Client Review due by 5 PM')."
)
prioritize_task = Task(
 description="Prioritize the extracted items by time and urgency. Meetings first, then deadlines, then other notes.",
 agent=prioritizer,
 context=[extract_task], # The output of extract_task is the input here
 expected_output="A prioritized list of schedule items."
)
format_task = Task(
 description="Format the prioritized schedule into a clean, easy-to-read daily agenda using bullet points. Ensure concise language.",
 agent=formatter,
 context=[prioritize_task], # The output of prioritize_task is the input here
 expected_output="A well-formatted daily agenda with bullet points."
)
# Instantiate the crew
crew = Crew(
 agents=[extractor, prioritizer, formatter],
 tasks=[extract_task, prioritize_task, format_task],
 process=Process.sequential, # Tasks are executed sequentially
 verbose=2 # Outputs more details during execution
)
# Run the crew
result = crew.kickoff()
print("\n########################")
print("## Final Daily Agenda ##")
print("########################\n")
print(result)

<पी> यहाँ क्या हो रहा है:

<पी> आयात: हम CrewAI से प्रमुख कक्षाएं लाते हैं:एजेंट, क्रू, कार्य और प्रक्रिया। हम ChatOpenAI भी आयात करते हैं पर्यावरण चर को संभालने के लिए हमारे भाषा मॉडल और ओएस के लिए।
<पी> llm =ChatOpenAI(...): लैंगग्राफ उदाहरण की तरह, यह हमारे ओपनएआई भाषा मॉडल को सेट करता है, यह सुनिश्चित करता है कि इसकी प्रतिक्रियाएँ प्रत्यक्ष (तापमान=0) हैं और जीपीटी-4ओ मॉडल का उपयोग करती हैं।
<पी> एजेंट परिभाषाएँ (एक्सट्रैक्टर, प्राथमिकताकर्ता, फ़ॉर्मेटर):
- <पी> इनमें से प्रत्येक चर एक एजेंट उदाहरण बनाता है। एक एजेंट को उसकी भूमिका (वह क्या करता है), एक विशिष्ट लक्ष्य जिसे वह हासिल करने की कोशिश कर रहा है, और एक बैकस्टोरी (एक प्रकार का व्यक्तित्व या विशेषज्ञता जो एलएलएम को उसके उद्देश्य को बेहतर ढंग से समझने में मदद करता है) से परिभाषित किया जाता है।
- <पी> verbose=True डिबगिंग के लिए अत्यधिक सहायक है, क्योंकि यह एजेंटों को काम करते समय उनके "विचारों" को प्रिंट करने देता है।
- <पी> अनुमति_प्रतिनिधिमंडल=गलत का अर्थ है कि ये एजेंट अपने सौंपे गए कार्यों को अन्य एजेंटों को नहीं सौंपेंगे (हालाँकि इसे अधिक जटिल प्रतिनिधिमंडल परिदृश्यों के लिए सही पर सेट किया जा सकता है)।
- <पी> llm=llm प्रत्येक एजेंट को हमारे OpenAI भाषा मॉडल से जोड़ता है।
<पी> नकली ईमेल: हम इस उदाहरण के लिए उसी नमूना ईमेल डेटा का पुन:उपयोग करते हैं।
<पी> कार्य परिभाषाएँ (निकालें_कार्य, प्राथमिकता_कार्य, प्रारूप_कार्य):
- <पी> प्रत्येक कार्य एक विशिष्ट कार्य को परिभाषित करता है जिसे एक एजेंट को निष्पादित करने की आवश्यकता होती है।
- <पी> विवरण एजेंट को स्पष्ट रूप से बताता है कि कार्य में क्या शामिल है।
- <पी> एजेंट यह कार्य हमारे परिभाषित एजेंटों में से एक को सौंपता है (उदाहरण के लिए, extract_task के लिए एक्सट्रैक्टर)।
- <पी> context=[...] क्रूएआई के सहयोग का एक महत्वपूर्ण हिस्सा है। यह किसी कार्य को आउटपुट का उपयोग करने के लिए कहता है पिछले कार्य को इसके इनपुट के रूप में . उदाहरण के लिए, प्रायोरिटीज़_टास्क एक्सट्रैक्ट_टास्क के आउटपुट को अपने संदर्भ के रूप में लेता है।
- <पी> अपेक्षित_आउटपुट एजेंट को यह अंदाज़ा देता है कि इसका परिणाम कैसा दिखना चाहिए, जिससे एलएलएम का मार्गदर्शन करने में मदद मिलती है।
<पी> क्रू =क्रू(...):
- <पी> यहीं पर हम अपनी टीम को इकट्ठा करते हैं! हम एक क्रू इंस्टेंस बनाते हैं, उसे अपने एजेंटों और कार्यों की सूची देते हैं।
- <पी> प्रक्रिया=प्रोसेस.अनुक्रमिक क्रू को कार्य सूची में परिभाषित क्रम में कार्यों को एक के बाद एक निष्पादित करने के लिए कहता है। CrewAI पदानुक्रमित जैसी अधिक उन्नत प्रक्रियाओं का भी समर्थन करता है।
- <पी> verbose=2 आपको क्रू के आंतरिक कामकाज और संचार का एक बहुत विस्तृत लॉग दिखाएगा।
<पी> परिणाम =क्रू.किकऑफ(): यह आदेश आधिकारिक तौर पर संपूर्ण मल्टी-एजेंट वर्कफ़्लो प्रारंभ करता है। एजेंट सहयोग करना, जानकारी देना और अपने निर्धारित कार्यों को क्रम से पूरा करना शुरू कर देंगे।
<पी> fprint(परिणाम): अंत में, पूरे दल के सहयोगात्मक प्रयास से समेकित आउटपुट आपके कंसोल पर मुद्रित होता है।

<पी> CrewAI चतुराई से एजेंटों के बीच सभी संचार को संभालता है, यह पता लगाता है कि किसे क्या और कब काम करना है, और आउटपुट को एक एजेंट से दूसरे एजेंट तक आसानी से भेजता है, यह एक मिनी AI असेंबली लाइन की तरह है!

निष्पादन के दौरान वास्तव में क्या होता है?

<पी> तो, चाहे आप लैंगग्राफ या क्रूएआई का उपयोग कर रहे हों, जब कोई एजेंट दौड़ता है तो पर्दे के पीछे वास्तव में क्या चल रहा होता है? आइए निष्पादन प्रक्रिया को तोड़ें:

<पी> सिस्टम को एक इनपुट स्थिति मिलती है (उदाहरण के लिए, आपके ईमेल).
<पी> पहला एजेंट या ग्राफ़ नोड इस इनपुट को पढ़ता है और बड़े भाषा मॉडल (एलएलएम) का उपयोग करता है इसे समझने के लिए।
<पी> अपनी समझ के आधार पर, एजेंट किसी कार्यकारी पर निर्णय लेता है जैसे प्रमुख घटनाओं को बाहर निकालना या किसी विशिष्ट टूल को कॉल करना।
<पी> यदि आवश्यक हो, तो एजेंट उपकरणों का उपयोग कर सकता है (जैसे वेब खोज या फ़ाइल रीडर) अधिक संदर्भ प्राप्त करने या बाहरी संचालन करने के लिए।
<पी> उस कार्रवाई का परिणाम फिर अगले एजेंट को भेज दिया जाता है टीम में (यदि यह एक बहु-एजेंट सेटअप है) या सीधे आपके पास लौटाया गया है।

<पी> निष्पादन तब तक चलता रहता है:

<पी> कार्य पूर्णतः पूर्ण हो गया है।
<पी> सभी एजेंटों ने अपनी निर्धारित भूमिकाएँ पूरी कर ली हैं।
<पी> वर्कफ़्लो में एक रुकने की स्थिति या निर्दिष्ट "अंत" बिंदु तक पहुँच गया है।

<पी> इसे एक सुपर-स्मार्ट वर्कफ़्लो इंजन के रूप में सोचें जहां हर एक चरण में तर्क करना, निर्णय लेना और पिछली बातचीत को याद रखना शामिल है।

क्या एलएलएम एजेंट सुरक्षित हैं? सुरक्षा और गोपनीयता के बारे में क्या जानें

<पी> एलएलएम एजेंट जितने अच्छे होते हैं, वे एक महत्वपूर्ण सवाल उठाते हैं:क्या आप वास्तव में अपने वर्कफ़्लो के कुछ हिस्सों को चलाने या अपने डेटा के साथ इंटरैक्ट करने के लिए एआई पर भरोसा कर सकते हैं? यह निर्भर करता है. यदि आप OpenAI या एंथ्रोपिक जैसी सेवाओं का उपयोग कर रहे हैं, तो आपका डेटा ट्रांज़िट में एन्क्रिप्ट किया गया है और (अभी तक) प्रशिक्षण के लिए उपयोग नहीं किया जाता है।

<पी> लेकिन दुरुपयोग को रोकने के लिए कुछ डेटा अभी भी अस्थायी रूप से लॉग किया जा सकता है। यह आमतौर पर परीक्षण और व्यक्तिगत परियोजनाओं के लिए ठीक है, लेकिन यदि आप संवेदनशील व्यावसायिक जानकारी, ग्राहक डेटा, या किसी भी निजी चीज़ के साथ काम कर रहे हैं, तो आप सावधान रहना चाहेंगे।

<पी> अज्ञात इनपुट का उपयोग करें, पूर्ण डेटासेट को उजागर करने से बचें, और यदि पूर्ण नियंत्रण आपके लिए मायने रखता है तो LLaMA या मिस्ट्रल जैसे ओपन-सोर्स मॉडल का उपयोग करके स्थानीय रूप से एजेंटों को चलाने पर विचार करें।

<पी> आप अपने एजेंटों के लिए स्पष्ट सीमाएँ भी निर्धारित कर सकते हैं ताकि वे आगे न बढ़ें। इसे एक नए इंटर्न को शामिल करने जैसा समझें:आप उन्हें पहले ही दिन हर चीज़ तक पहुंच नहीं देंगे।

<पी> एजेंटों को केवल वे उपकरण और फ़ाइलें दें जिनकी उन्हें आवश्यकता है, वे जो करते हैं उसका लॉग रखें और उन्हें वास्तविक परिवर्तन करने देने से पहले हमेशा परिणामों की समीक्षा करें।

<पी> जैसे-जैसे यह तकनीक बढ़ती है, बेहतर सैंडबॉक्सिंग, मेमोरी सीमा और भूमिका-आधारित पहुंच जैसी अधिक सुरक्षा सुविधाएं आ रही हैं। लेकिन अभी के लिए, अपने एजेंटों के साथ शक्तिशाली सहायकों की तरह व्यवहार करना समझदारी है, जिन्हें अभी भी कुछ मानवीय पर्यवेक्षण की आवश्यकता है।

समस्या निवारण एवं युक्तियाँ

<पी> कभी-कभी, एजेंट थोड़े विचित्र हो सकते हैं! यहां कुछ सामान्य समस्याएं दी गई हैं जिनका सामना आप कर सकते हैं और उन्हें कैसे ठीक करें:

मुद्दा सुझाया गया समाधान ऐसा लगता है कि एजेंट हमेशा के लिए लूप करता है, अधिकतम संख्या में पुनरावृत्तियों को सेट करता है या एक स्पष्ट स्टॉपिंग पॉइंट को परिभाषित करता है। आउटपुट बहुत अधिक बातूनी है या अधिक विशिष्ट संकेतों का उपयोग करता है (उदाहरण के लिए, "केवल बुलेट पॉइंट्स में उत्तर दें")। इनपुट बहुत लंबा है या कट जाता है। सामग्री के बड़े टुकड़ों को छोटे टुकड़ों में तोड़ें और उन्हें व्यक्तिगत रूप से सारांशित करें। एजेंट बहुत धीरे चलता है। जीपीटी-3.5 जैसे तेज़ एलएलएम मॉडल का उपयोग करने का प्रयास करें या स्थानीय मॉडल चलाने पर विचार करें। <पी> एक आसान टिप:आप प्रत्येक चरण में क्या हो रहा है यह देखने और राज्य परिवर्तन को डीबग करने के लिए अपने एजेंट फ़ंक्शन के अंदर प्रिंट() स्टेटमेंट या लॉगिंग संदेश भी जोड़ सकते हैं।

अधिक दैनिक स्वचालनों का अन्वेषण करें

<पी> एक बार जब आप एक एजेंट-आधारित कार्य बना लेते हैं, तो आपके लिए अन्य ऑटोमेशन के लिए पैटर्न को अनुकूलित करना अविश्वसनीय रूप से आसान हो जाएगा। आपके रचनात्मक रस को प्रवाहित करने के लिए यहां कुछ बेहतरीन विचार दिए गए हैं:

कार्य प्रकार उदाहरण स्वचालन डेवऑप्स असिस्टेंट"सिस्टम लॉग पढ़ें, संभावित समस्याओं का पता लगाएं और समाधान सुझाएं।"फाइनेंस ट्रैकरबैंक स्टेटमेंट या सीएसवी फाइलें पढ़ें और अपनी खर्च करने की आदतों/बजटों को सारांशित करें। मीटिंग ऑर्गनाइज़र मीटिंग के बाद, स्वचालित रूप से एक्शन आइटम निकालें और मालिकों को असाइन करें। इनबॉक्स क्लीनर"गैर-जरूरी ईमेल को स्वचालित रूप से लेबल करें, संग्रहित करें और हटाएं।" नोट सारांश अपने दैनिक नोट्स को एक साफ-सुथरे स्वरूपित टू-डू सूची या सारांश में बदलें। लिंक चेकर दस्तावेजों से यूआरएल निकालें और स्वचालित रूप से परीक्षण करें कि क्या वे अभी भी वैध हैं। रेज़्यूमे फ़ॉर्मेटरस्कोर नौकरी विवरण के विरुद्ध रेज़्युमे बनाता है और उन्हें स्वचालित रूप से प्रारूपित करता है। <पी> इनमें से प्रत्येक को उन्हीं सिद्धांतों और रूपरेखाओं का उपयोग करके बनाया जा सकता है जिन पर हमने चर्चा की है, चाहे वह लैंगग्राफ हो या क्रूएआई।

एजेंट टेक्नोलॉजी में आगे क्या है?

<पी> एलएलएम एजेंट बिजली की गति से विकसित हो रहे हैं, और नवाचार की अगली लहर पहले से ही यहां है:

<पी> स्मार्ट मेमोरी सिस्टम :एजेंटों से बेहतर दीर्घकालिक स्मृति की अपेक्षा करें, जिससे उन्हें विस्तारित अवधि में सीखने और पिछली बातचीत और कार्यों को याद रखने की अनुमति मिलेगी।
<पी> मल्टी-मॉडल एजेंट :एजेंट अब केवल टेक्स्ट को संभाल नहीं पाएंगे! वे छवियों, ऑडियो और वीडियो को संसाधित करने और समझने में सक्षम होंगे, जिससे वे अधिक बहुमुखी बन जाएंगे।
<पी> उन्नत योजना ढाँचे :रिएक्ट, टूलफॉर्मर और ऑटोजेन जैसी तकनीकें एजेंटों की तर्क करने, योजना बनाने और उन कष्टप्रद "मतिभ्रम" को कम करने की क्षमता में लगातार सुधार कर रही हैं।
<पी> एज परिनियोजन :कल्पना करें कि एजेंट आपके स्थानीय कंप्यूटर या डिवाइस पर LLaMA 3 या मिस्ट्रल जैसे हल्के मॉडल का उपयोग करके पूरी तरह से ऑफ़लाइन चल रहे हैं।

<पी> निकट भविष्य में, आप एजेंटों को इसमें निर्बाध रूप से एकीकृत होते देखेंगे:

<पी> आपकी DevOps पाइपलाइन
<पी> बड़े उद्यम वर्कफ़्लो
<पी> रोजमर्रा की उत्पादकता के उपकरण
<पी> मोबाइल ऐप्स और स्मार्ट डिवाइस
<पी> गेम, सिमुलेशन और शैक्षिक प्लेटफ़ॉर्म

अंतिम सारांश

<पी> ठीक है, आइए जल्दी से उन सभी बेहतरीन चीज़ों को दोबारा दोहराएँ जो आपने अभी सीखी और हासिल की हैं:

<पी> आपको इस बात की अच्छी समझ हो गई होगी कि एलएलएम एजेंट क्या हैं और वे इतने शक्तिशाली क्यों हैं।
<पी> आपने देखा है कि कैसे लैंगग्राफ और क्रूएआई जैसे ओपन-सोर्स फ्रेमवर्क बिल्डिंग एजेंटों को बहुत आसान बनाते हैं।
<पी> आपने एक सामान्य दैनिक कार्य को स्वचालित करने के लिए लैंगग्राफ का उपयोग करके एक वास्तविक एलएलएम एजेंट बनाया है:अपने इनबॉक्स का सारांश!
<पी> आपने क्रूएआई के साथ मल्टी-एजेंट सहयोग की दुनिया का पता लगाया है, यह समझते हुए कि एआई की टीमें एक साथ कैसे काम कर सकती हैं।
<पी> आपने सीखा है कि इन सिद्धांतों को कैसे अपनाया जाए और अनगिनत अन्य कार्यों को स्वचालित करने के लिए उन्हें कैसे बढ़ाया जाए।

<पी> तो, अगली बार जब आप खुद को किसी दोहराव वाले काम में फंसता हुआ पाएं, तो बस अपने आप से पूछें:"अरे, क्या मैं इसके लिए एक एजेंट बना सकता हूं?" इसका उत्तर संभवतः हाँ है!

संसाधन पुनर्कथन

<पी> यदि आप एलएलएम एजेंटों के निर्माण में गहराई से उतरना चाहते हैं तो यहां कुछ उपयोगी संसाधन दिए गए हैं:

<पी> मुफ़्त में कोड करना सीखें. freeCodeCamp's open source curriculum has helped more than 40,000 people get jobs as developers. Get started

मास्टर एलएलएम एजेंट:लैंगग्राफ और क्रूएआई के साथ स्वचालित कॉम्प्लेक्स वर्कफ़्लोज़ - ओपन सोर्स हैंडबुक

हम क्या कवर करेंगे:

एलएलएम एजेंटों की वर्तमान स्थिति

चैटबॉट्स से स्वायत्त एजेंटों तक

एजेंट आज क्या कर सकते हैं?

सीखने का सबसे अच्छा समय अभी क्यों है

एलएलएम एजेंट क्या हैं और वे एक बड़ी डील क्यों हैं?

एलएलएम क्या है?

तो, एलएलएम एजेंट क्या है?

यह मायने क्यों रखता है?

ओपन-सोर्स एजेंट फ्रेमवर्क का उदय

लोकप्रिय ओपन-सोर्स एजेंट फ्रेमवर्क

ये उपकरण क्या सक्षम करते हैं

स्क्रैच से निर्माण के बजाय फ्रेमवर्क का उपयोग क्यों करें?

एजेंट डिज़ाइन के पीछे मुख्य अवधारणाएँ

एजेंट लूप

एजेंट के प्रमुख घटक

मल्टी-एजेंट सहयोग

प्रोजेक्ट:ईमेल से अपने दैनिक शेड्यूल को स्वचालित करें

हम क्या स्वचालित कर रहे हैं

चरण 1:आवश्यक उपकरण स्थापित करें

1. Python 3.9 या उच्चतर स्थापित करें

2. VSCode स्थापित करें (वैकल्पिक लेकिन अनुशंसित)

3. अपनी OpenAI API कुंजी प्राप्त करें

4. पायथन लाइब्रेरीज़ स्थापित करें

चरण 2:कार्य को परिभाषित करें

चरण 3:लैंगग्राफ के साथ वर्कफ़्लो बनाएं

लैंगग्राफ क्या है?

लैंगग्राफ का उपयोग क्यों करें?

1. ईमेल इनपुट का अनुकरण करें

2. एजेंट लॉजिक को परिभाषित करें

3. ग्राफ़ बनाएँ और चलाएँ

उदाहरण आउटपुट

CrewAI के साथ मल्टी-एजेंट सहयोग

क्रूएआई क्या है?

ईमेल सारांश कार्य के लिए नमूना भूमिकाएँ

नमूना CrewAI कोड

निष्पादन के दौरान वास्तव में क्या होता है?

क्या एलएलएम एजेंट सुरक्षित हैं? सुरक्षा और गोपनीयता के बारे में क्या जानें

समस्या निवारण एवं युक्तियाँ

अधिक दैनिक स्वचालनों का अन्वेषण करें

एजेंट टेक्नोलॉजी में आगे क्या है?

अंतिम सारांश

संसाधन पुनर्कथन