DeepSeek lança DeepSeek-OCR 2, a IA consegue "ver" uma imagem na mesma sequência lógica que os humanos

PANews 27 de janeiro de notícias, de acordo com Jin10, a DeepSeek lançou o novo modelo DeepSeek-OCR 2, que utiliza a inovadora abordagem DeepEncoder V2, permitindo que a IA reorganize dinamicamente as diferentes partes de uma imagem com base no seu significado, em vez de simplesmente escanear de esquerda para direita de forma mecânica. Essa abordagem simula o fluxo lógico que os humanos seguem ao observar uma cena. Por fim, o modelo demonstrou desempenho superior ao dos modelos tradicionais de visão-linguagem ao processar imagens com layouts complexos (como documentos ou gráficos), alcançando uma compreensão visual mais inteligente e com maior capacidade de raciocínio causal.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)