أطلقت OpenAI LifeSciBench مع 750 مهمة خبراء لتقييم الذكاء الاصطناعي في سير عمل علمية حقيقية

2026-06-19 15:30:44

ووفقاً لOdaily، أصدرت OpenAI LifeSciBench، وهو معيار تقييم جديد يضم 750 مهمة مكتوبة من خبراء، تغطي 7 مسارات لبحث علمي و7 مجالات في علم الأحياء. تم تطوير المعيار بواسطة 173 باحثاً حاصلين على الدكتوراه، مع خبرة في صناعات التكنولوجيا الحيوية أو الأدوية.

تتطلب أكثر من 79% من المهام تفكيراً متعدد الخطوات، بمتوسط 4 خطوات استدلال لكل مهمة، مع 1,062 مرفق بيانات علمية حقيقية تشمل أوراقاً بحثية ورسوماً بيانية وبيانات تسلسل وملفات بنيوية. يقيم المعيار قدرات بحثية معقدة مثل دمج الأدلة، وتصميم التجارب، وتحليل البيانات، والاستدلال العلمي، والتواصل البحثي.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 10 س

أوبن إيه آي تطلق تحليلات الاستخدام وضوابط الإنفاق لـ ChatGPT Enterprise

منذ 13 س

أطلقت OpenAI ميزة "التسجيل وإعادة التشغيل" لـ Codex لأتمتة سير العمل

06-18 15:45

سينا ويبو تفتح كود VibeThinker-3B للمصدر المفتوح، ويطابق نموذج 3B عددَ المعلمات أداءَ التفكير على مستوى الطليعة

06-18 06:30

هيئة الخدمات المالية في كوريا الجنوبية تطبّق إرشادات للذكاء الاصطناعي عبر سبعة مبادئ في 22 يونيو

06-18 06:30

أطلق Block أداة Builderbot الذكية للمطورين، تتولى 15% من التغييرات في كود الإنتاج

تحليل متعمق