A Meta criou uma IA capaz de vencer os humanos em uma versão online do Diplomacy, um popular jogo de estratégia no qual sete jogadores competem pelo controle da Europa movendo peças em um mapa. Ao contrário de outros jogos de tabuleiro que a IA domina, como xadrez e Go, o Diplomacy exige que os jogadores conversem entre si – formando alianças, táticas de negociação – e identifiquem quando os outros estão blefando.
A IA, chamada Cicero, ficou entre os 10% melhores em 40 jogos online contra 82 jogadores humanos (que não sabiam que estavam competindo contra um bot). Em um torneio de oito jogos envolvendo 21 jogadores, Cícero ficou em primeiro lugar. A Meta descreveu seu trabalho em um artigo publicado na Science.
Aprender a jogar Diplomacia é importante por vários motivos. Não só envolve vários jogadores, que fazem jogadas ao mesmo tempo, mas cada turno é precedido por uma breve negociação em que os jogadores conversam em pares na tentativa de formar alianças ou conspirar contra os rivais. Após essa rodada de negociação, os jogadores decidem quais peças mover – e se devem honrar ou descumprir um acordo.
Em cada ponto do jogo, Cícero modela como os outros jogadores provavelmente agirão com base no estado do quadro e em suas conversas anteriores com eles. Em seguida, ele descobre como os jogadores podem trabalhar juntos para benefício mútuo e gera mensagens projetadas para atingir esses objetivos.
Para construir Cicero, Meta combina dois tipos diferentes de IA: um modelo de aprendizado por reforço que descobre o que movimentos a fazer e um grande modelo de linguagem que negocia com outros jogadores.
Cícero não é perfeito. Ainda enviava mensagens que continham erros, às vezes contrariando seus próprios planos ou cometendo erros estratégicos. Mas a Meta afirma que os humanos frequentemente optam por colaborar com ela em detrimento de outros jogadores.
E é significativo porque, embora jogos como xadrez ou Go terminem com um vencedor e um perdedor, os problemas do mundo real geralmente não têm resoluções tão diretas. Encontrar trade-offs e soluções alternativas costuma ser mais valioso do que vencer. A Meta afirma que Cicero é um passo em direção à IA que pode ajudar com uma série de problemas complexos que exigem comprometimento, desde o planejamento de rotas em torno do trânsito intenso até a negociação de contratos.