Entrar em um pavilhão da Consumer Electronics Show (CES) é uma experiência única: você pode ver carros que voam, TVs gigantes e robôs – muitos deles. Um clássico da maior feira de tecnologia do mundo, que acontece todos os anos em Las Vegas, nos EUA, a robótica ganhou um espaço ainda maior neste ano, com a promessa de que a inteligência artificial (IA) está inaugurando uma nova fase do setor e que esse desenvolvimento vai colocar um robô muito perto de você em breve.
É uma mudança que há muito tempo esteve na iminência de acontecer, desde que a IA deu um salto para as ferramentas generativas e modelos de linguagem começaram a ser amplamente usados em diversas partes da robótica. “A robótica, ao meu ver, é talvez a melhor materialização da inteligência artificial para o público em geral. Ela é a personificação, talvez, de todas as evoluções que a IA tem conquistado nessa última década”, afirma Anderson Soares, coordenador do Centro de Excelência em Inteligência Artificial da Universidade Federal de Goiás (UFG).
O grande “padrinho” dessa nova era da IA é Jensen Huang, CEO e fundador da Nvidia, a principal empresa que fornece chips e processadores para o desenvolvimento da tecnologia.
Segundo Huang, os robôs com capacidade humana – e não apenas chatbots, mas robôs domésticos e industriais, que possuem corpo – estão muito perto de serem utilizados no dia a dia. O mercado também parece ter começado a entender que a robótica será o próximo grande passo do desenvolvimento da IA.
Na CES, um setor inteiro da feira foi dedicado aos robôs, com empresas como Siemens, Unitree e Boston Dynamics apresentando diferentes tipos de dispositivos.
Segundo John Kelley, diretor do evento, nunca houve um espaço dedicado tão grande para o segmento na história da feira. “O futuro da IA são os robôs, porque com ChatGPT ou Gemini, a IA pode pensar, te dar um feedback intelectual e é isso. Com a IA integrada nos robôs, ela ganha movimento, ganha corpo e pode fazer muito mais coisas”, afirma um portavoz da Wonik Robotics.
A empresa fabrica braços robóticos que podem ser usados na indústria, apresentou modelos com capacidade de identificar e pinçar objetos, além de versões com articulações e dedos. Para chegar ao resultado de movimentos semelhantes às mãos humanas, a companhia utiliza uma tecnologia que usa a função chamada VLA (Vision Language Action), na qual o robô reconhece os dados da imagem da câmera, determina a tarefa de forma independente e separa os objetos em caixas. IA Física.
IA física
Tudo isso deve ser proporcionado graças à IA física, um conceito de modelos de inteligências artificiais generativas que conseguem aplicar leis da física de forma real aos seus produtos. Esse tipo de IA tem sido um dos desafios do setor, por exigir um grande uso de dados para treinamento e máquinas capazes de serem exaustivamente testadas.
“IA física é o termo que tem sido usado para IA que percebe, raciocina e age no mundo físico ( robôs, veículos autônomos, manipulação). Na prática, a IA física utiliza algoritmos de aprendizado de máquina ( como aprendizado profundo e aprendizado por reforço) para permitir que os robôs possam aprender a tomar decisões ideais de acordo com suas percepções do mundo”, explica o coordenador do curso de Engenharia de Robôs FEI e pesquisador em IA e Robótica, Danilo Perico.
Nesse tipo de IA, a ideia é que um modelo seja alimentado de dados, como vídeos, que ilustram como uma ação acontece na vida real – como a gravidade impacta no peso, manuseio e interação de um objeto no ambiente, por exemplo. A partir disso, um segundo modelo é responsável por interpretar esses dados e criar simulações com a mesma situação, chamados dados sintéticos, sempre obedecendo às leis da física nos conteúdos gerados.
Essas novas técnicas baseadas em modelos que aprendem por contexto, como as que viabilizaram o desenvolvimento de IAs como ChatGPT e Gemini, permitiram que os robôs aprendessem a se adaptar aos movimentos, baseando-se em seus sentidos, acredita Fabio de Miranda, professor de Robótica Computacional e Pesquisador em IA.
“Pode-se dizer que anteriormente todo o trabalho de engenharia de robôs era muito específico para cada tipo ou modelo de robô. Agora, estes avanços permitem que qualquer corpo robótico possa ser controlado por uma mesma rede neural generalista. Esta nova situação acelerou muito a programação de novos robôs”, explica o professor.
A Nvidia tem sido porta-voz dessa nova era da IA com a construção de processadores cada vez mais voltados para essa tecnologia. Além de defender a ideia, a Nvidia tem se mantido na liderança para viabilizar o pensamento de Huang. A empresa lançou nesta semana o Vera Rubin, seu novo sistema de processamento de IA.
O supercomputador é um dos jeitos de alavancar essa capacidade maior de processamento de dados. As parcerias de mercado também já têm adotado o conceito. A Siemens está desenvolvendo uma área de treinamento em robótica que usa sistemas que geram dados sintéticos e treinam robôs por repetição. A pesquisa tem sido feita com softwares da Nvidia.
“Se eu quisesse criar um conjunto de dados suficiente para treinar um agente apenas a partir de teleoperações, levaria cerca de 9 a 10 meses fazendo a mesma coisa”, explica Dimitrios Chatzis, engenheiro da Siemens, em entrevista ao Estadão. “Com simulação, você pode fazer isso em 5 a 10 minutos. Após o sucesso, somos capazes de treinar o agente. No final, o agente é capaz de realizar a tarefa que queríamos – aqui não há codificação. A rede neural está realmente fazendo o trabalho. É como se eles estivessem pensando”.
Dificuldade
O domínio da IA física e dos modelos que trazem esse conceito nos próximos anos deve ser o diferencial – e a feira de tecnologia deste ano representou uma corrida para mostrar que será possível que os aparelhos estejam disponíveis em um curto espaço de tempo.
“Estamos estudando a generalização da robótica. Isso significa que o robô seria capaz de fazer qualquer coisa. Por que não temos robôs em nossas casas? Por que temos robôs fora delas? Temos robôs apenas em ambientes muito específicos, em ambientes muito fechados, onde eles realizam tarefas simples. Queremos que os robôs sejam capazes de fazer coisas complexas, talvez perigosas, e também se desloquem de um ambiente para outro. É isso que chamamos de generalização da robótica. E, para conseguir isso, precisamos dessa ação”, explica Chatzis.
Para Jensen Huang, a viabilidade dos robôs, mesmo com o desafio de construir esse tipo de tecnologia, já é o primeiro sinal de como o futuro deve se apresentar. Em uma coletiva de imprensa na CES, em que o Estadão esteve presente, o CEO da Nvidia foi perguntado quando esse tipo de robô poderá ser encontrado no nosso dia a dia. A resposta foi simples e curta: “Ainda neste ano”.
*A repórter viajou para Las Vegas a convite da CTA


