हाल ही में ओपनएआई ने अपना एआई एजेंट Operator लॉन्च किया है, जो कि यूजर्स के लिए वेब पर विभिन्न काम करता है। कंपनी के अनुसार, यह अपने ब्राउजर का प्रयोग कर सकते हैं। सबसे बड़ी खासियत यह है कि ओपनएआई का पहला ऐसा एआई एजेंट है जो स्वतंत्र रुप से कार्य कर सकता है यानी इसे किसी कमांड की जरुरत नहीं है। हालांकि, यह अभी रिसर्च प्रीव्यू के लिए लॉन्च किया गया है, इसका मतलब है कि इसमें अभी कुछ सीमाएं हैं और यह यूजर्स के फीडबैक के लिए खुला है।
कहां-कहां Operator AI Agent का इस्तेमाल कर रहे हैं
Operator को विभिन्न प्रकार के रूटीन ब्राउजर कार्यों के लिए उपयोग किया जा सकता है। जैसे कि- फॉर्म फिल करना, ग्रॉसरी ऑर्डर करना और मीम्स बनाना। ओपनएआई का प्लान है कि इसे जल्द ही Plus, Team और Enterprise यूजर्स के लिए उपलब्ध कराया जाए और इसे भविष्य में ChatGPT में एकीकृत किया जाए। इतना ही नहीं, कंपनी ने ब्लॉग में बताया है कि यह GPT-4o की विजन क्षमताओं और एडवांस्ड रीजनिंग को रिइन्फोर्समेंट लर्निंग के माध्यम से जोड़ता है। यह ग्राफिकल यूजर इंटरफेस (GUI) जैसे बटन, मेन्यू और टेक्स्ट फील्ड, के साथ इंटरैक्ट करना सीखता है।
इसकी खासियत यह Operator स्क्रीनशॉट के जरिए ब्राइजर को ‘देख’ सकता है और माउस और कीबोर्ड एक्शन के जरिए इंटरैक्ट कर सकता है। इसके लिए कस्टम API इंटीग्रेशन की जरुरत नहीं होती। अगर Operator किसी समस्या या गलती का सामना करता है, तो यह अपने रीजनिंह एबिलिटीज का उपयोग करके खुद को सही कर सकता है।
No tags for this post.