OpenClaw fundador partilha classificação de adaptação de modelos de IA, com minimax-m2.1 e kimi-k2.5 nacionais ocupando as posições 2 e 3.

Gate News notícia, 8 de março, Peter Steinberger, fundador do OpenClaw (framework de desenvolvimento de agentes de IA), compartilhou os resultados de um teste de referência realizado por uma terceira parte, PinchBench, que avalia o desempenho de grandes modelos de linguagem de IA em tarefas de agentes OpenClaw. Os resultados mostram que o Gemini 3 Flash alcançou uma taxa de sucesso de 95,1% nas tarefas OpenClaw, ficando em primeiro lugar. Os modelos nacionais minimax-m2.1 e kimi-k2.5 ficaram em segundo e terceiro lugar, com 93,6% e 93,4%, respectivamente. Claude Sonnet 4.5 obteve uma taxa de sucesso de 92,7%, enquanto GPT-4o atingiu 85,2%.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário