23.5 C
Brasília
segunda-feira, novembro 25, 2024
Continua após a publicidade..

Deepgram consegue novo dinheiro para expandir seu negócio de reconhecimento de voz empresarial

A Deepgram, uma empresa que desenvolve tecnologia de reconhecimento de voz para empresas, levantou hoje US$ 47 milhões em novos financiamentos liderados pelo Madrona Venture Group com a participação do Citi Ventures e Alkeon. Uma extensão da Série B da Deepgram que começou em fevereiro de 2021, liderada pela Tiger Global, eleva o total da startup para US $ 86 milhões, que o CEO Scott Stephenson diz que está sendo direcionado para P&D em áreas como detecção de emoções, reconhecimento de intenções, resumo, tópico detecção, tradução e redação.

“Estamos satisfeitos que o Deepgram tenha alcançado sua maior avaliação pré e pós-dinheiro, mesmo apesar das condições desafiadoras do mercado”, disse Stephenson ao Techreporter em uma entrevista por e-mail . (Infelizmente, ele não revelou qual era exatamente a avaliação.) “Acreditamos que a Deepgram está em uma posição forte para prosperar neste ambiente macroeconômico mais difícil. A IA de fala da Deepgram é a principal tecnologia por trás de muitos dos aplicativos de nossos clientes, e a demanda por compreensão de fala cresce à medida que as empresas buscam maior eficiência. soluções de reconhecimento para clientes como Spotify, Auth0 e até NASA. Os cientistas de dados da empresa obtêm, criam, rotulam e avaliam dados de fala para produzir modelos de reconhecimento de fala que podem entender marcas e jargões, capturar uma variedade de idiomas e sotaques e se adaptar a ambientes de áudio desafiadores. Por exemplo, para a NASA, a Deepgram construiu um modelo para transcrever as comunicações entre o Controle da Missão e a Estação Espacial Internacional.

Continua após a publicidade..

“Os dados de áudio são uma das maiores fontes de dados inexploradas do mundo. [Mas] é difícil de usar em seu formato de áudio porque o áudio é um tipo de dados não estruturado e, portanto, não pode ser extraído para insights sem processamento adicional”, disse Stephenson. “O Deepgram pega dados de áudio não estruturados e os estrutura como texto e metadados em alta velocidade e baixo custo projetado para escala empresarial… [Com] o Deepgram, [empresas] podem enviar todo o áudio de seus clientes — centenas de milhares ou milhões de horas — para serem transcritos e analisados.”

De onde vêm os dados de áudio para treinar os modelos do Deepgram? Stephenson foi um pouco tímido, embora não tenha negado que a Deepgram usa dados de clientes para melhorar seus sistemas. Ele foi rápido em apontar que a empresa está em conformidade com o GDPR e permite que os usuários solicitem que seus dados sejam excluídos a qualquer momento.

“Os modelos do Deepgram são treinados principalmente em dados coletados ou gerados por nossa curadoria de dados especialistas, juntamente com alguns dados anônimos enviados por nossos usuários”, disse Stephenson. “Treinar modelos em dados do mundo real é a base da qualidade de nosso produto; é o que permite que sistemas de aprendizado de máquina como o nosso produzam resultados semelhantes aos humanos. Dito isso, permitimos que nossos usuários optem por não ter seus dados anônimos usados ​​para treinamento, se assim o desejarem. automações e experiências do cliente baseadas em Para organizações em setores altamente regulamentados, como saúde e governo, o Deepgram oferece uma opção de implantação local que permite aos clientes gerenciar e processar dados localmente. (Vale a pena notar que a In-Q-Tel, o braço de investimento estratégico da CIA, apoiou a Deepgram no passado.)

Deepgram – um graduado da Y Combinator fundado por Stephenson e Noah Shutty, uma Universidade de Formado em física em Michigan – compete com vários fornecedores em um mercado de reconhecimento de fala que pode valer US$ 48,8 bilhões até 2030, de acordo com uma fonte (otimista?). Gigantes da tecnologia como Nuance, Cisco, Google, Microsoft e Amazon oferecem serviços de transcrição e legendagem de voz em tempo real, assim como startups como Otter, Speechmatics, Voicera e Verbit.

A tecnologia tem obstáculos a superar. De acordo com um relatório de 2022 da Speechmatics, 29% dos executivos observaram viés de IA em tecnologias de voz – especificamente desequilíbrios nos tipos de vozes que são compreendidas pelo reconhecimento de fala. Mas a demanda é evidentemente forte o suficiente para sustentar a gama de fornecedores lá fora; Stephenson afirma que as margens brutas da Deepgram estão “alinhadas com empresas de software de alto desempenho”. A divisão Alexa da Amazon está prestes a perder US$ 10 bilhões este ano. E há rumores de que o Google está de olho em cortes no desenvolvimento do Google Assistant em favor de projetos mais lucrativos.

e dividir transcrições de conversas multiway. A empresa também está crescendo, alcançando agora mais de 300 clientes e mais de 15.000 usuários.

Em busca de novos negócios, a Deepgram lançou recentemente o Deepgram Startup Program, que oferece US$ 10 milhões em créditos gratuitos de reconhecimento de fala na plataforma da Deepgram para startups em educação e corporativa. As empresas participantes não precisam pagar nenhum tipo de taxa e podem usar os fundos em conjunto com os benefícios existentes de concessão, semente, incubadora e aceleradora.

“Os negócios da Deepgram continuam a crescer rapidamente. Como uma empresa fundamental de infraestrutura de IA, não vimos uma redução na demanda pelo Deepgram”, disse Stephenson. “Na verdade, observamos as empresas procurarem maneiras de cortar custos e delegar tarefas repetitivas e servis a IAs – dando aos humanos mais tempo para realizar trabalhos interessantes e importantes. Exemplos disso incluem a redução de grandes custos de computação em nuvem, trocando a transcrição de grande nuvem para o produto de transcrição da Deepgram, ou em novos casos de uso, como pedidos drive-thru e triagem da primeira rodada de respostas de atendimento ao cliente.”

Deepgram atualmente possui 146 funcionários distribuídos em escritórios em Ann Arbor e San Francisco. Quando questionado sobre os planos de contratação para o resto do ano, Stephenson se recusou a responder – sem dúvida, ciente da imprevisibilidade da economia global atual e da ótica de se comprometer com um número firme.

Check out other tags:

0