مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

48 خبر
  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات
  • العملية العسكرية الروسية في أوكرانيا
  • مونديال 2026
  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

    اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • مونديال 2026

    مونديال 2026

  • إسرائيل تواصل عملياتها في لبنان

    إسرائيل تواصل عملياتها في لبنان

  • فيديوهات

    فيديوهات

  • مفاجأة مدوية في كأس العالم 2026

    مفاجأة مدوية في كأس العالم 2026

  • الحكم بالسجن على لاعب إسباني بتهمة الاعتداء الجنسي

    الحكم بالسجن على لاعب إسباني بتهمة الاعتداء الجنسي

  • سجن وغرامة مالية بحق عضو مجلس إدارة الزمالك بسبب النادي الأهلي

    سجن وغرامة مالية بحق عضو مجلس إدارة الزمالك بسبب النادي الأهلي

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

المجلس الأعلى للأمن القومي الإيراني يصدر "بيانا للشعب" عقب إعلان الاتفاق مع واشنطن

مصدر إيراني مطلع: تنازل استثنائي انتزعه قاليباف من ترامب في اللحظة الأخيرة

التلفزيون الإيراني يعلن رسميا التوصل لاتفاق مع الولايات المتحدة (فيديو)

تحطم قاذفة أمريكية من طراز "بي-52 ستراتوفورتريس" بعد إقلاعها من قاعدة بولاية كاليفورنيا (صور+ فيديو)

بيان مشترك لأربع دول أوروبية تؤكد استعدادها لرفع العقوبات عن إيران

علي أكبر ولايتي: ساعة الصفر حانت والمنصات تأخذ وضعية الإطلاق

نائب وزير الخارجية الإيراني يكشف تفاصيل محادثات الـ60 يوما مع واشنطن

قرقاش: الاتفاق الأمريكي - الإيراني قد يطوي صفحة الحرب في المنطقة

"القناة 12" العبرية: ترامب يتحدث عن نتنياهو بطريقة لم يسبق لأي زعيم أن تحدث بها عنه علنا من قبل

ترامب يعلن التوصل إلى اتفاق سلام مع إيران والرفع الفوري للحصار البحري وفتح مضيق هرمز بالكامل

بعد انفجار ترامب غضبا في وجه نتنياهو.. بن غفير يتحدى ويوجه رسالة لسيده ورئيسه

ترامب يشيد بدور بوتين وشي في تسهيل التوصل إلى تسوية مع إيران

"سنرد قريبا جدا".. إيران ترفض عرضا قدمه ترامب مقابل ضبط النفس وعدم مهاجمة إسرائيل

"قبل بزوغ الفجر".. الحرس الثوري الإيراني يتوعد إسرائيل برد مزلزل بعد قصف الضاحية الجنوبية لبيروت

يزن 500 كغ.. الشرطة الإيرانية تعلن تفكيك صاروخ "توماهوك" متطور سقط في فارامين (صور)

إعلام إسرائيلي: التعليمات صدرت للجيش بمنع إطلاق النار تجاه أي شخص في جنوب لبنان إلا بشرط واحد

باكستان: أمريكا وإيران اتفقتا على وقف فوري ونهائي لإطلاق النار على كل الجبهات بما في ذلك لبنان

فانس: الولايات المتحدة وإيران وقعتا بالفعل اتفاقية السلام إلكترونيا يوم الأحد

ترامب: حاول العديد من الرؤساء إحلال السلام مع إيران قبل مجيئي لكنهم أخفقوا جميعا

أمين مجلس الأمن القومي الإيراني: لبنان حياتنا ورد جند الإسلام قادم