A OpenAI Lança o LifeSciBench com 750 tarefas especializadas para avaliar a IA em fluxos de trabalho científicos reais

De acordo com a Odaily, a OpenAI lançou o LifeSciBench, uma nova referência de avaliação que inclui 750 tarefas escritas por especialistas, abrangendo 7 fluxos de trabalho de investigação científica e 7 domínios de biologia. A referência foi desenvolvida por 173 investigadores com doutoramento (PhDs) e experiência nas indústrias de biotecnologia ou farmacêutica.

Mais de 79% das tarefas exigem raciocínio em múltiplos passos, com uma média de 4 passos de raciocínio por tarefa, e 1.062 anexos de dados científicos reais, incluindo artigos, gráficos, dados de sequências e ficheiros estruturais. A referência avalia capacidades complexas de investigação, como integração de evidências, desenho experimental, análise de dados, raciocínio científico e comunicação de investigação.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário