OpenAI veröffentlicht LifeSciBench mit 750 Expertenaufgaben, um KI in realen wissenschaftlichen Workflows zu bewerten

Laut Odaily hat OpenAI LifeSciBench veröffentlicht, einen neuen Bewertungsmaßstab mit 750 von Experten verfassten Aufgaben, die 7 wissenschaftliche Forschungs-Workflows und 7 Biologie-Domänen abdecken. Der Benchmark wurde von 173 Forschern mit PhDs entwickelt, die Erfahrung in der Biotech- oder Pharmaindustrie haben.

Mehr als 79% der Aufgaben erfordern mehrstufiges Denken, im Schnitt 4 Denkschritte pro Aufgabe, mit 1.062 echten wissenschaftlichen Datenanhängen, darunter Papers, Diagramme, Sequenzdaten und strukturierte Dateien. Der Benchmark bewertet komplexe Forschungsfähigkeiten wie Evidenzintegration, Versuchsdesign, Datenanalyse, wissenschaftliches Schlussfolgern und Forschungskommunikation.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare