OpenAI випустила LifeSciBench із 750 експертними завданнями для оцінювання ШІ в реальних наукових робочих процесах

2026-06-19 15:30:44

За даними Odaily, OpenAI випустила LifeSciBench — новий оціночний бенчмарк, який складається з 750 завдань, написаних експертами, у межах 7 науково-дослідницьких робочих процесів і 7 біологічних доменів. Бенчмарк розробили 173 дослідники з PhD та досвідом у біотехнологічній або фармацевтичній індустріях.

Понад 79% завдань вимагають багатокрокового міркування, у середньому 4 кроки міркування на завдання, а також 1 062 реальні наукові додатки з даними, включно з статтями, графіками, даними послідовностей і структурними файлами. Бенчмарк оцінює складні дослідницькі можливості, такі як інтеграція доказів, експериментальний дизайн, аналіз даних, наукове міркування та дослідницька комунікація.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

10год тому

OpenAI запускає аналітику використання та елементи контролю витрат для ChatGPT Enterprise

13год тому

OpenAI запускає функцію «Запис і відтворення» для Codex, щоб автоматизувати робочі процеси

06-18 15:45

Sina Weibo публікує у відкритому доступі VibeThinker-3B: модель із 3B параметрами відповідає можливостям щодо рівня міркувань на рівні лідерів

06-18 06:30

Комісія фінансових послуг Південної Кореї впроваджує AI-вказівки з сімома принципами 22 червня

06-18 06:30

Block запускає інструмент для розробників Builderbot на базі ШІ, який обробляє 15% змін у виробничому коді

Поглиблений аналіз