A equipa sujeitou o sistema a 180 anos de treino por dia, durante 19 dias e organizou depois um desafio de DOTA 2 onde a máquina enfrentou uma equipa do top 1% de jogadores amadores. Os investigadores usaram um método de aprendizagem por reforço, com sucessivas jogadas com tentativa e erro. O sistema jogou contra si próprio para obter as recompensas espalhadas em cada fase, explica a New Scientist.
O objetivo desta equipa passa por continuar o treino e, mais para o fianl do ano, organizar um desafio no The International, o maior evento de e-sports. Aí, os investigadores da OpenAI esperam conseguir vencer equipas de profissionais.
O desafio para a Inteligência Artificial conseguir vingar no mundo real prende-se com as interações que têm de ser realizadas em tempo real e com a necessidade de se tomarem decisões quando não se tem toda a informação necessária.
«Mostramos que a IA consegue ter comportamentos muito inteligentes e queremos encontrar outros domínios onde os aplicar», afirmou Greg Brockman, da Open AI.