مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

63 خبر
  • مونديال 2026
  • العملية العسكرية الروسية في أوكرانيا
  • فيديوهات
  • مونديال 2026

    مونديال 2026

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • تبادل الضربات بين إسرائيل وإيران

    تبادل الضربات بين إسرائيل وإيران

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

السعودية.. سماع دوي انفجارات وبيان عاجل من منصة الإنذار المبكر في حالات الطوارئ

الحرس الثوري يهدد دول المنطقة: اللعبة الخطيرة ستطال كل مواقع الطاقة

موقع إيراني: وقعنا في الفخ

ترامب يأمر نتنياهو وقف الهجوم ويخاطبه: من الأفضل أن تكون حذرا جدا وقد تجد نفسك وحيدا في مواجهة إيران

غضب إسرائيلي متصاعد: الليلة إيران أنهت دور إسرائيل في المنطقة وحولتها لـ"ملطشة" الشرق الأوسط

بعد الهجوم الإيراني نتنياهو أمام أخطر اختبار: رد قاس أو ثمن سياسي باهظ

"خاتم الأنبياء" يتوعد إسرائيل: ردنا سيكون مدمرا في حال قصفتم إيران.. سنوجه ضربة ساحقة لتل أبيب

"الأمن القومي" بالبرلمان الإيراني: سنرد على استهداف الضاحية.. ترقبوا سماء الأراضي المحتلة الليلة

ترامب يكشف تفاصيل الاتفاق المرتقب مع إيران و"مصير" مجتبى خامنئي

الحرس الثوري: العدو الصهيوني استهداف مواقع داخل إيران بصواريخ باليستية جوية

إسرائيل تترقب ردا إيرانيا وشيكا وتستعد لهجوم صاروخي محتمل واسع على تل أبيب خلال ساعات

مسؤول أمريكي يكشف تفاصيل مكالمة ترامب مع نتنياهو

تحول استراتيجي إسرائيلي.. البنية التحتية الإيرانية في خطر

"إسرائيل هيوم": معادلة جديدة تشكلت وتساؤلات بشأن الخطوة التالية ضد طهران

الجيش الإسرائيلي يعلن تنفيذ غارات على أهداف عسكرية في غرب ووسط إيران

عراقجي يبحث مع نظرائه في فرنسا وبريطانيا وتركيا وقائد الجيش الباكستاني قصف إيران لإسرائيل

التلفزيون الإيراني يعلن عن إطلاق موجة جديدة من الصواريخ على إسرائيل