O modelo RT-2 do Google ajuda os robôs a realizar ações com mais facilidade em novas situações
O Google anunciou um novo modelo de visão-linguagem-ação (VLA) chamado Robotics Transformer 2 (RT-2), que descreve como “o primeiro de seu tipo”. De acordo com o Google, o RT-2 é capaz de receber entradas de texto ou imagem e gerar ações robóticas.
A empresa disse que o treinamento de robôs pode ser um “esforço hercúleo” porque eles precisam de treinamento em bilhões de pontos de dados para cada objeto, ambiente, tarefa e situação no mundo. Com o RT-2, no entanto, o Google diz que há uma enorme promessa para robôs de uso geral.
Embora a empresa esteja entusiasmada com o que o RT-2 pode desbloquear, ela disse que muito trabalho precisa ser feito para habilitar robôs úteis em ambientes centrados no ser humano. No final, de acordo com a DeepMind , um robô físico de uso geral pode resultar de modelos VLA e eles podem raciocinar, resolver problemas e interpretar informações para executar tarefas do mundo real.
Como o nome sugere, esta não é a primeira iteração do modelo Robotics Transformer VLA. A DeepMind disse que o RT-2 se baseia no trabalho do RT-1 e mostra capacidades de generalização aprimoradas em comparação com modelos anteriores e tem melhor desempenho em tarefas novas e inéditas.
Outra nova habilidade que o RT-2 era capaz de ter em relação aos seus predecessores é o raciocínio simbólico, o que significa que ele pode entender conceitos abstratos e manipulá-los logicamente. Um exemplo disso é quando o robô foi solicitado a mover o bana para a soma de 2 mais 1 e executou a tarefa corretamente, embora não tenha sido explicitamente treinado para fazer matemática abstrata ou manipulação simbólica.
Embora o RT-2 seja um grande avanço para a robótica, não seria justo declarar que os robôs Terminator chegaram. O modelo ainda requer entrada e supervisão humana e apresenta limitações técnicas significativas nas operações de robôs do mundo real.
Com isso dito, esperamos que leve a alguns robôs interessantes que podem executar tarefas que antes não eram possíveis ou fáceis de fazer.
Deixe um comentário