DeepSeek lança DeepSeek-OCR 2, a IA consegue "ver" uma imagem na mesma sequência lógica que os humanos

PANews 27 de janeiro de notícias, de acordo com Jin10, a DeepSeek lançou o novo modelo DeepSeek-OCR 2, que utiliza a inovadora abordagem DeepEncoder V2, permitindo que a IA reorganize dinamicamente as diferentes partes de uma imagem com base no seu significado, em vez de simplesmente escanear de esquerda para direita de forma mecânica. Essa abordagem simula o fluxo lógico que os humanos seguem ao observar uma cena. Por fim, o modelo demonstrou desempenho superior ao dos modelos tradicionais de visão-linguagem ao processar imagens com layouts complexos (como documentos ou gráficos), alcançando uma compreensão visual mais inteligente e com maior capacidade de raciocínio causal.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários