OpenAI تطلق ChatGPT كوكيل ذكي لإنجاز المهام بكفاءة عالية

أعلنت شركة OpenAI عن إطلاق ميزة جديدة تعرف بـChatGPT Agent، التي تمثل تحولاً جذرياً في تطوير نماذج الذكاء الاصطناعي، حيث أصبح بإمكان ChatGPT التفكير والتصرف بشكل مستقل من خلال جهازه الحاسوبي الافتراضي لتنفيذ مجموعة من المهام المعقدة نيابة عن المستخدم، وهذا يشمل التعلم والتحليل والبحث والتفاعل مع المواقع الإلكترونية، بالإضافة إلى إنتاج نتائج قابلة للتعديل كالعروض التقديمية وجداول البيانات.
النظام الجديد | المهام الممكنة |
---|---|
ChatGPT Agent | تنفيذ مهام مثل مراجعة التقويمات والتخطيط للوجبات وتحليل المنافسين |
ووفقًا لبيان رسمي، يمكن للمستخدم توجيه أوامر متقدمة لـChatGPT مثل “راجع تقويمي وأعد لي ملخصاً لاجتماعات العملاء القادمة بناءً على آخر الأخبار” أو “خطط واشترِ مكونات لتحضير وجبة إفطار يابانية لأربعة أشخاص”، أو حتى “حلل 3 منافسين واصنع عرض شرائح تقديمي”، وهذا يتيح للمستخدمين طرقًا جديدة للتفاعل مع التكنولوجيا بطريقة عملية.
النموذج يمكنه الاستفادة من أدوات متعددة تتضمن متصفح ويب بصري ونصي، بالإضافة إلى واجهة طرفية لكتابة الأكواد (Terminal) والوصول المباشر إلى واجهات برمجية للتطبيقات (API)، ويمكنه الحديث مع المستخدم ليطلب منه تسجيل الدخول بأمان عند الحاجة، مما يسهل التحكم في إتمام المهام المطلوبة بانسيابية.
وكيل رقمي موحد
النظام الجديد يستند إلى مفهوم “الوكيل الموحد” الذي يجمع بين ثلاث ركائز رئيسية وهي خدمة “Operator” المتخصصة في التفاعل مع المواقع الإلكترونية، وقوة “البحث العميق Deep Research” في تحليل وتلخيص المعلومات، وأخيرًا روبوت الدردشة الشهير ChatGPT، مما يجعل من الممكن الانتقال بسهولة بين مراحل التفكير والتنفيذ لتحقيق المهام بشكل كامل وبدقة عالية.
دمج هذه الخدمات يضمن أن ChatGPT يمكنه تحريك العمل بين التفكير والتنفيذ seamlessly، بناءً على التعليمات المحددة من قبل المستخدم، الذي يبقى في مكانة التحكم الكامل خلال سير العمل، حيث لا يتم اتخاذ أي قرار أو إجراء إلا بإذن صريح منه، مما يعزز من استراتيجيات الأمان والاستخدام.
الميزة الجديدة متاحة حاليًا لمستخدمي خطط Pro وPlus وTeam ويمكن تفعيلها من خلال قائمة الأدوات في أي محادثة عبر خيار “وضع الوكيل” Agent Mode، مما يتيح لهم استخدام هذه الإمكانات المتقدمة بسهولة.
OpenAI تشير إلى أن هذه التطورات تمثل بداية الطريق، حيث تنوي الشركة توسيع قدرات ChatGPT Agent وتحسين أدائه بمرور الوقت، وذلك بناءً على الملاحظات الواردة من المستخدمين وتجارب الاستخدام المختلفة.
كما تم دمج ميزات “Operator” و”البحث العميق” داخل النموذج الجديد، مما أتاح تعزيز الكفاءة في تنفيذ استفسارات المستخدمين، إذ أظهرت النتائج أن تلبية الطلبات قد تكون أكثر فعالية من خلال دمج هذه الإمكانيات.
النموذج يتمكن الآن من التفاعل الذكي مع المواقع الإلكترونية، تصفح المحتوى، تطبيق عوامل تصفية دقيقة، ما يؤدي إلى تحقيق نتائج أفضل وأكثر كفاءة، بحيث تبدأ المحادثة بسؤال بسيط ثم تنتقل بسلاسة إلى تنفيذ فعلي للمهام في إطار السياق نفسه.
تم تزويد ChatGPT Agent بمجموعة شاملة من الأدوات تشمل متصفحاً بصرياً للتفاعل مع المواقع عبر واجهة رسومية ومتصفح نصي للاستفسارات الأساسية، بالإضافة إلى واجهة طرفية لأوامر البرمجة، إلى جانب الوصول المباشر لتطبيقات مثل Gmail وGitHub، مما يزيد من مرونة البحث والتنفيذ.
جميع هذه الأدوات تعمل من خلال جهاز افتراضي يحافظ على سياق المهام، حتى عند استخدام أدوات متعددة في آن واحد، على سبيل المثال، يمكن للنموذج فتح صفحة باستخدام المتصفح النصي، ثم تحميل وتعديل ملف، وأخيراً عرض النتائج مجددًا عبر المتصفح البصري، مما يعزز إنجاز المهام بسرعة عالية.
تجربة تفاعلية
صُمم ChatGPT Agent ليكون أداة تفاعلية يمكن المستخدم من مقاطعة التعليمات في أي مرحلة لتقديم توضيحات إضافية أو إعادة تحديد المسار بشكل كامل، دون فقدان التقدم المحقق، وهذا يشجع على مزيد من التفاعل والتعاون بين المستخدم والنموذج.
بالإضافة إلى ذلك، يمكن للنموذج في حال ظهور حاجة لمعلومات إضافية أن يطلبها تلقائيًا لضمان استمرارية المهمة بشكل صحيح، وفي حال كان التنفيذ يتطلب وقتًا طويلاً، يسمح للمستخدم بإيقاف المهمة، وطلب ملخص مرحلي، أو إنهائها للحصول على النتائج الجزئية، ويمكن لتطبيق ChatGPT على الهاتف إرسال إشعار عند اكتمال المهمة حتى وإن تم البدء بها عبر حساب المستخدم على الحاسوب.
هذه القدرات الجديدة تعزز من فائدة ChatGPT في البيئات المهنية واليومية، حيث يمكن استخدامه لأتمتة المهام الروتينية، مثل تحويل لقطات الشاشة إلى عروض تقديمية قابلة للتعديل، إعادة ترتيب الاجتماعات، تخطيط الفعاليات، وتحديث جداول البيانات بأحدث المعلومات دون التأثير على التنسيق.
وعلى المستوى الشخصي، يمكن استخدام هذا النظام لتنظيم رحلات السفر، تنسيق حفلات العشاء، أو البحث عن مختصين وجدولة مواعيد بكل سهولة ويسر.
نتائج الاختبارات
اختبارات الأداء للنموذج الجديد أظهرت نتائج مبهرة، حيث حقق ChatGPT Agent نسبة نجاح بلغت 41.6% في اختبار Humanity’s Last Exam، وهو اختبار يقيم أداء الذكاء الاصطناعي في أسئلة احترافية، وتمت زيادة هذه النسبة إلى 44.4% باستخدام استراتيجية التكرار المتوازي، كما أحرز 27.4% في اختبار FrontierMath، متفوقًا بذلك على جميع النماذج السابقة.
فضلاً عن ذلك، تفوق ChatGPT Agent في اختبارات محاكاة لمهام العمل الواقعية، مثل تحليل مزودي خدمات الرعاية الصحية الطارئة، إعداد جداول إطفاء الديون، وتحديد مواقع آبار المياه لمشروعات الهيدروجين الأخضر، حيث حقق أداءً مماثلاً أو أفضل من البشر في نحو نصف الحالات، متجاوزاً نماذج o3 وo4-mini.
في اختبار SpreadsheetBench، سجل ChatGPT Agent نسبة 45.5% عند تعديل الجداول مباشرة، مقارنة بـ20% لنموذج Copilot في Excel، مما يعكس تفوق النموذج في معالجة البيانات بشكل فعال.
كما حقق ChatGPT Agent نتائج ممتازة في اختبار DSBench الخاص بتحليل البيانات، وفي اختبار BrowseComp المخصص لتقييم القدرات البحثية الدقيقة، حيث تفوّق بنسبة 68.9%، أي أعلى بـ17.4 نقطة مئوية من نموذج “البحث العميق”.
مستوى فائق من الحماية الرقمية
من ناحية الأمان، أكدت OpenAI أن الإصدار الجديد من ChatGPT، الذي يسمح له باتخاذ إجراءات فعلية على الإنترنت، يتطلب تعزيزات في أنظمة الحماية وخاصة عند التعامل مع البيانات الحساسة والمواقع ذات الوصول المحدود، مما يعكس أهمية الأمان الرقمي في هذا العصر المتقدم.
تم تدريب النموذج ضد محاولات “حقن الأوامر الخبيثة”، والتي قد تخفى ضمن عناصر غير مرئية في صفحات الويب، وإذا ما نجحت هذه الهجمات، فقد تؤدي إلى نتائج ضارة، لكن OpenAI أوضحت أنها تعتمد على أنظمة مراقبة فورية واستراتيجيات حماية فعالة لمواجهة هذه التحديات.
كما تشمل الضمانات الأمنية أيضًا ضرورة تأكيد المستخدم قبل أي إجراء له تبعات حقيقية، فضلاً عن معارضة المهام ذات المخاطر العالية مثل التحويلات البنكية، وتوفر عناصر تحكم في الخصوصية تتيح حذف بيانات التصفح بنقرة واحدة وعدم تخزين أي كلمات مرور خلال الجلسات.
مع مراعاة القدرات المتزايدة للنموذج، تعتبر OpenAI أن ChatGPT Agent ينتمي إلى فئة المخاطر البيولوجية والكيميائية العالية، رغم عدم وجود دليل على احتمالية استخدامه بشكل مؤذٍ مباشرة، وقد تم اتخاذ جميع تدابير الحماية اللازمة بما في ذلك مراجعات من قبل خبراء في الأمان الحيوي واختبارات من فرق تقييم خارجية.
الشركة تعترف أن ميزة العروض التقديمية لا تزال في مرحلة “النسخة التجريبية”، وقد تبدو النتائج في بعض الأحيان بسيطة من حيث التنسيق، إلا أنها تعمل على تدريب النموذج لضمان إنتاج محتوى أكثر احترافية ودعماً أفضل للعروض المعدّلة.
كما أكدت OpenAI أن تحسينات الأداء والكفاءة ستستمر خلال الفترة المقبلة، مع تخفيف الحاجة إلى تدخل المستخدم، في الوقت الذي تظل فيه أعلى درجات الأمان على رأس أولويات الشركة.