De Digitalizações a Voz: Como o Google Está Redefinindo a IA na Saúde

Resumidamente

A Google atualizou o seu AI médico de código aberto MedGemma com capacidades para interpretar escansões como TC e RM, além de lançar uma ferramenta de reconhecimento de fala para texto open MedASR.

Google’s MedGemma Upgrade Signals New Era For AI-Driven Medical Diagnosis

A empresa de tecnologia Google anunciou uma atualização ao seu modelo AI MedGemma, melhorando o suporte para aplicações de imagiologia médica

O novo modelo MedGemma 1.5 4B incorpora feedback da comunidade de desenvolvedores para suportar melhor múltiplas modalidades de imagiologia médica, incluindo escansões de alta dimensão como TC e RM, imagens de histopatologia, imagiologia longitudinal como séries temporais de radiografias de tórax, e tarefas de localização anatómica

Também melhora a compreensão de documentos médicos, permitindo a extração de dados estruturados de relatórios laboratoriais. Comparado com o MedGemma 1 4B anterior, a atualização 1.5 4B oferece maior precisão para texto, registos médicos e imagiologia 2D, mantendo-se compacta o suficiente para funcionar offline

Para aplicações mais complexas baseadas em texto, os desenvolvedores podem continuar a usar o modelo MedGemma com 27B de parâmetros. Detalhes completos e benchmarks estão disponíveis no cartão do modelo MedGemma 1.5.

O MedGemma foi originalmente criado como um sistema multimodal para refletir o ambiente de dados complexo da medicina, com versões iniciais suportando a interpretação de imagens médicas bidimensionais como radiografias de tórax, imagens dermatológicas, escansões de retina e amostras de histopatologia. A última versão, MedGemma 1.5, expande essas capacidades para incluir imagiologia médica de alta dimensão, incorporando dados de TC e RM tridimensionais, bem como histopatologia de lâmina inteira. Os desenvolvedores podem agora criar aplicações que processam múltiplas fatias ou patches de imagem juntamente com prompts específicos para tarefas, permitindo casos de uso mais avançados de diagnóstico e análise.

De acordo com avaliações internas, o MedGemma 1.5 demonstra melhorias notáveis de desempenho em várias áreas, incluindo classificação de achados de TC e RM, análise de histopatologia, localização anatómica em radiografias de tórax, revisão longitudinal de imagens e extração estruturada de dados de relatórios laboratoriais. O modelo também apresenta ganhos substanciais na compreensão de texto médico e na resposta a perguntas de registos eletrónicos de saúde, refletindo avanços mais amplos tanto na visão quanto na linguagem.

Esta funcionalidade expandida baseia-se nas ferramentas anteriores de base de TC da Google e representa um dos primeiros modelos multimodais abertos disponíveis ao público capazes de lidar com dados médicos de alta dimensão juntamente com texto tradicional e imagens 2D. Embora estas funcionalidades ainda estejam em evolução, a empresa espera que os desenvolvedores alcancem melhorias adicionais através de ajuste fino específico de domínio, apoiado por tutoriais e recursos recentemente lançados para aplicações de TC e histopatologia na Hugging Face e no Model Garden.

Google Apresenta MedASR Para Melhorar o Reconhecimento de Fala Médica E Fluxos de Trabalho Clínicos de IA

Além disso, a Google lançou o MedASR, um modelo de reconhecimento automático de fala aberto, ajustado para ditado médico, que converte fala em texto e funciona em conjunto com o MedGemma para tarefas de raciocínio avançado

Embora o texto continue a ser a interface dominante para grandes modelos de linguagem, a comunicação falada continua a desempenhar um papel central na prática clínica, desde o ditado do médico até consultas em tempo real com pacientes, tornando o reconhecimento de fala preciso uma capacidade essencial.

O MedASR foi projetado especificamente para linguagem médica, permitindo uma transcrição mais fiável de terminologia específica do domínio e servindo como método de entrada natural para o MedGemma. Em testes comparativos contra o modelo Whisper large-v3 de uso geral, o MedASR demonstrou uma precisão significativamente maior, produzindo erros de transcrição substancialmente menores tanto em ditados de radiografias de tórax quanto numa ampla referência interna que cobre várias especialidades médicas e perfis de oradores.

Todos os modelos HAI-DEF, incluindo o MedGemma 1.5, MedASR e o codificador de imagem MedSigLIP, permanecem gratuitos para uso de investigação e comercial e podem ser acessados na Hugging Face ou integrados em aplicações escaláveis no Vertex AI.

MedGemma Ganha Tração Global À Medida Que Sistemas de Saúde E Investigadores Expandem A Adoção De IA

De acordo com a Google, a adoção do MedGemma está a expandir-se entre startups de tecnologia de saúde e equipas de investigação em todo o mundo, com o modelo sendo cada vez mais utilizado para acelerar o desenvolvimento em uma vasta gama de aplicações médicas

Na Malásia, a Qmed Asia integrou o MedGemma no askCPG, um sistema de conversação projetado para fornecer acesso a mais de 150 diretrizes clínicas nacionais. Segundo o Ministério da Saúde da Malásia, a interface melhorou a usabilidade dessas diretrizes na tomada de decisão clínica de rotina, enquanto programas piloto iniciais relataram feedback particularmente positivo sobre as funcionalidades de imagiologia médica multimodal alimentadas pelo MedGemma.

Em Taiwan, a Administração Nacional de Seguros de Saúde aplicou o MedGemma para analisar avaliações pré-operatórias de cirurgias de câncer de pulmão. Ao extrair insights estruturados de dezenas de milhares de relatórios de patologia e outros dados clínicos não estruturados, a iniciativa apoia análises estatísticas em grande escala destinadas a informar decisões políticas e melhorar o planeamento cirúrgico e os resultados dos pacientes.

Desde o seu lançamento no início deste ano, o MedGemma também tem sido amplamente referido na investigação académica de IA médica, onde demonstrou forte desempenho como modelo fundamental para tarefas como compreensão de texto médico, suporte à decisão clínica multidisciplinar e relatórios de mamografia.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)