A IBM irá colaborar com a Deepgram, planeando integrar a tecnologia de reconhecimento de voz da Deepgram na plataforma watsonx Orchestrate da IBM. Com esta parceria, a Deepgram será o primeiro parceiro de tecnologia de voz da IBM.
De acordo com o acordo, a tecnologia de reconhecimento e conversão de voz da Deepgram será incorporada na plataforma da IBM para construir e gerir agentes de inteligência artificial e fluxos de trabalho automatizados. Este movimento visa estabelecer uma base para transcrições em toda a empresa, legendas em tempo real e diálogos naturais para agentes digitais.
As duas empresas afirmam que esta colaboração estabelece as bases para criar agentes e fluxos de trabalho que suportam voz em tempo real em áreas como suporte ao cliente, análise de chamadas e entrada de dados de voz. Isto reflete a necessidade das empresas de simplificar a interação com agentes de software. A Grand View Research Inc. prevê que o mercado de voz e reconhecimento de voz crescerá de 20,2 mil milhões de dólares em 2023 (aproximadamente 29,568 triliões de won sul-coreanos) para 2030, com uma taxa de crescimento anual de 15%.
A tecnologia da Deepgram foca em resolver desafios como ruído, múltiplos sotaques e diálogos reais. Ela suporta 35 idiomas, incluindo várias variantes do árabe e do hindi. A Deepgram consegue oferecer uma precisão superior a 90% com uma latência inferior a 300 milissegundos.
Esta integração visa expandir as funcionalidades do watsonx. O watsonx inclui ferramentas para construir, treinar e gerir modelos de IA, bem como a capacidade de orquestrar agentes de IA através de processos de negócio. A IBM posiciona o watsonx como o núcleo da sua oferta de IA aberta e empresarial, integrando-o com ambientes de nuvem híbrida.