A equipa da Wayve, composta por investigadores do Departamento de Engenharia da Universidade de Cambridge, usou o mesmo método aplicado pela DeepMind e pela OpenAI para ensinar um carro autónomo a andar sozinho e a manter-se na sua faixa de rodagem durante um período de 15 a 20 minutos.
O método de aprendizam por reforço tem provado ser útil para ensinar estes sistemas a lidar com tarefas complexas como jogar Dota 2 ou defrontar humanos no jogo clássico Go. Agora, o mesmo método é usado para ensinar um carro autónomo a circular, sem ser necessária programação complexa ou mapas detalhados. O carro modificado da Wayve é um Renault e que dispensa «modelos massivos, sensores e dados sem fim», explica o comunicado da empresa citado pela Cnet. «Queremos que os nossos carros tenham melhores cérebros e não mais hardware», disse em maio Amar Shah, um dos fundadores da Wayve.
Os próximos passos da equipa passam por ensinar tarefas mais complexas do que manter o carro na faixa e torna-lo capaz de conseguir lidar com semáforos e a circular corretamente em rotundas ou interesecções.
Veja o vídeo que demonstra esta primeira experiência.