DeepSeek lanza DeepSeek-OCR 2, la IA puede "ver" una imagen en el mismo orden lógico que los humanos

PANews informó el 27 de enero que DeepSeek lanzó un nuevo modelo DeepSeek-OCR 2, utilizando el innovador método DeepEncoder V2, que permite a la IA reorganizar dinámicamente partes de una imagen según el significado de la imagen, en lugar de limitarse a escanear mecánicamente de izquierda a derecha. Este enfoque simula el flujo lógico que los humanos siguen al observar una escena. En última instancia, el modelo supera a los modelos tradicionales de visión y lenguaje al procesar imágenes con diseños complejos, como documentos o diagramas, lo que permite una comprensión visual del razonamiento más inteligente y causal.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)