Uma amostra dos dados sintéticos do Domínio Paralelo mostrando uma visão de mapa de seus recursos do mundo virtual.
Crédito da imagem: Parallel Domain
Confira as sessões sob demanda do Low- Code/No-Code Summit para aprender como inovar com sucesso e obter eficiência aprimorando e dimensionando desenvolvedores cidadãos. Assista agora.
Inteligência artificial (IA) pode estar comendo o mundo como o conhecemos, mas especialistas dizem que a própria IA também está morrendo de fome – e precisa mudar sua dieta. Uma empresa diz que os dados sintéticos são a resposta.
“Os dados são alimento para a IA, mas a IA hoje é subalimentada e desnutrida”, disse Kevin McNamara, CEO e cofundador do provedor de plataforma de dados sintéticos, Domínio Paralelo, que apenas arrecadou $ 30 milhões em uma rodada da série B liderada por Março Capital. “É por isso que as coisas estão crescendo lentamente. Mas se pudermos alimentar melhor essa IA, os modelos crescerão mais rápido e de maneira mais saudável. Dados sintéticos são como alimento para treinamento de IA.”
Pesquisas mostraram que cerca de 90% das implantações de IA e aprendizado de máquina (ML) falham. A Datagen relatório do início deste ano apontou que muita falha se deve à falta de dados de treinamento. Ele descobriu que 99% dos profissionais de visão computacional dizem que tiveram um projeto de ML interrompido especificamente por causa da falta de dados para vê-lo. Mesmo os projetos que não são totalmente cancelados por falta de dados sofrem atrasos significativos, tirando-os do caminho certo, relataram 100% dos entrevistados.
Nesse sentido, o Gartner prevê que os dados sintéticos serão cada vez mais usados como um suplemento para fins de treinamento de IA e ML. O gigante da pesquisa projeta que, até 2024, dados sintéticos serão usados para acelerar 60% de projetos de IA.
Evento
Cúpula de Segurança Inteligente
Aprenda o papel crítico da IA e ML na segurança cibernética e estudos de caso específicos do setor em 8 de dezembro. Registre-se para o seu passe livre hoje.
- Registrar agora
Dados sintéticos são gerados por algoritmos de aprendizado de máquina que ingerem dados reais para treinar em padrões comportamentais e criar dados simulados que retêm as propriedades estatísticas do conjunto de dados original. Os dados resultantes replicam as circunstâncias do mundo real, mas, ao contrário dos conjuntos de dados anônimos padrão, não são vulneráveis às mesmas falhas dos dados reais.
Tirando a IA da ‘Idade da Pedra’
Pode parecer incomum ouvir que uma tecnologia tão avançada quanto a IA está presa em uma espécie de “Idade da Pedra”, mas é isso que McNamara vê – e sem a adoção de dados sintéticos, continuará assim, diz ele.
“No momento, o desenvolvimento de IA é mais ou menos como a programação de computadores era nos anos 60 ou 70, quando as pessoas usavam a programação de cartões perfurados – um processo manual e trabalhoso”, ele disse. “Bem, o mundo acabou se afastando disso e para a programação digital. Queremos fazer isso para o desenvolvimento da IA.”
Os três maiores gargalos que mantêm a IA na Idade da Pedra são os seguintes, de acordo com McNamara:
Coleta de dados do mundo real — o que nem sempre é viável. Mesmo para algo como o jaywalking, que acontece com bastante frequência em cidades ao redor do mundo, se você precisar de milhões de exemplos para treinar seu algoritmo, isso rapidamente se torna inatingível para as empresas saírem e obterem do mundo real. Marcação — que muitas vezes requer milhares de horas de tempo humano e pode ser impreciso porque, bem, os humanos cometem erros.
Iterando os dados uma vez rotulado – o que requer que você ajuste as configurações do sensor, etc. e, em seguida, aplique-o para realmente começar a treinar sua IA.