exameinformatica

Uma parceria VISÃO

Siga-nos nas redes

Perfil

Ciência

Inteligência Artificial do Facebook vence jogadores profissionais de póquer

Uma equipa de investigadores do Facebook e da Universidade Carnegie Mellon criou um bot de Inteligência Artificial que joga póquer e sabe quando é que deve ir a jogo ou quando deve parar.

  • 333

Exame Informática

Mais de 12 profissionais de póquer jogaram um torneio de Texas Hold’em, uma variante do jogo de cartas, e contaram com um parceiro invulgar: um bot com IA criado pelo Facebook e por cientistas da Universidade Carnegie Mellon. Os especialistas consideram que ter um sistema artificial a jogar póquer e vencer profissionais humanos é uma tarefa difícil, uma vez que o jogo tem regras claras, mas não se vê a mão do adversário e é preciso recorrer a várias manipulações emocionais e táticas como bluff.

No torneio em questão, as partidas eram disputadas com seis jogadores, aumentando a complexidade da tarefa para o sistema de IA, explica a Cnet. O Facebook destaca que era foi a primeira vez que um bot conseguiu derrotar profissionais de topo num jogo com mais de dois jogadores ou equipas. Os especialistas em póquer que acompanharam o torneio consideraram que a performance do bot Pluribus foi sobrehumana, tendo derrotado campeões da World Series of Poker e do World Poker Tour.

Noam Brown, um dos cientistas da Facebook AI Research, explica que um jogo de póquer é um bom benchmark para lidar com o desafio de informação oculta e num ambiente complexo com múltiplos participantes. Houve dois tipos de desafios: um em que um jogador humano jogava contra cinco bots Pluribus e outro em que cinco jogadores humanos enfrentavam um bot Pluribus. Em ambos os tipos, a máquina levou a melhor. No primeiro cenário foram jogadas cinco mil partidas por dois campões humanos diferentes contra cinco bots. Os profissionais receberam dois mil dólares para participar e ganhavam mais dois mil se tivessem um melhor desempenho do que o outro humano contra a IA. O Pluribus venceu os humanos por 32 milli big blinds por jogo.

Na outra experiência, 13 jogadores enfrentaram o sistema Pluribus. Os desafios decorreram durante 12 dias, com cinco humanos contra a máquina, num total de dez mil mãos. Neste cenário, o Pluribus venceu com uma média de 48 milli big blinds por jogo.

A maior força do Pluribus foi a capacidade de usar múltiplas estratégias em jogo, de forma completamente aleatória, algo que os jogadores humanos também tentam fazer, mas onde ainda têm algumas falhas.

  • 333