A IA generativa está remodelando setores que valem trilhões de dólares, e a NVIDIA, líder em robótica inteligente, está aproveitando o momento. O vice-presidente de robótica e computação de borda da NVIDIA, Deepu Talla, detalha na CES como a NVIDIA e seus parceiros estão unindo a IA generativa e a robótica.
É um ajuste natural, com uma lista cada vez maior de parceiros – incluindo Boston Dynamics, Collaborative Robotics, Covariant, Sanctuary AI, Unitree Robotics e outros – adotando grandes modelos de linguagem (LLM) acelerados por GPU para oferecer níveis sem precedentes de inteligência e adaptabilidade a máquinas de todos os tipos.
“Os robôs autônomos alimentados por inteligência artificial estão sendo cada vez mais utilizados para melhorar a eficiência, diminuir os custos e enfrentar a escassez de mão de obra”, afirma Talla.
Presente na criação
A NVIDIA tem sido fundamental para a revolução da IA generativa desde o início. Há uma década, o fundador e CEO da NVIDIA, Jensen Huang, entregou em mãos o primeiro supercomputador de IA, NVIDIA DGX para a OpenAI. Agora, graças ao ChatGPT da OpenAI, a IA generativa se tornou uma das tecnologias de crescimento mais rápido do nosso tempo.
O impacto da IA generativa irá além da geração de textos e imagens, chegando a residências e escritórios, fazendas e fábricas, hospitais e laboratórios. O segredo: os LLMs, semelhantes ao centro de linguagem do cérebro, permitirão que os robôs entendam e respondam às instruções humanas de forma mais natural.
Essas máquinas serão capazes de aprender continuamente com os humanos, entre si e com o mundo ao seu redor. “Com esses atributos, a IA generativa é adequada para a robótica”, ressalta Talla.
Como os robôs estão usando a IA generativa
A Agility Robotics, a NTT e outras empresas estão incorporando a IA generativa em seus robôs para ajudá-los a entender comandos de texto ou de voz. Os aspiradores de pó robóticos da Dreame Technology estão sendo treinados em espaços simulados criados por modelos de IA generativa. E a Electric Sheep está desenvolvendo um modelo mundial para o corte autônomo de grama.
As tecnologias da NVIDIA, como as plataformas NVIDIA Isaac e Jetson, que facilitam o desenvolvimento e a implantação de robôs alimentados por IA, já contam com a confiança de mais de 1,2 milhão de desenvolvedores e 10.000 clientes e parceiros.
Muitas delas estão na CES, incluindo Analog Devices, Aurora Labs, Canonical, Dreame Innovation Technology, DriveU, e-con Systems, Ecotron, Enchanted Tools, GlüxKind, Hesai Technology, Leopard Imaging, Segway-Ninebot (Willand (Beijing) Technology Co., Ltd.), Nodar, Orbbec, QT Group, Robosense, Spartan Radar, TDK Corporation, Telit, Unitree Robotics, Voyant Photonics e ZVISION Technologies Co., Ltd.
“A IA generativa gera uma contribuição positiva para diversos setores e a NVIDIA impulsiona essa tecnologia por meio de suas plataformas e ferramentas. Os desenvolvedores podem aproveitar as aplicações para realizar uma infinidade de tarefas que impactam a sociedade, melhorando a qualidade de vida das pessoas”, afirma Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Dois cérebros são melhores do que um
Em sua palestra na CES, Talla mostra o modelo de computador duplo (abaixo) essencial para a implantação de IA em robótica, demonstrando a abordagem abrangente da NVIDIA para o desenvolvimento e a aplicação de IA.
O primeiro computador, chamado de “fábrica de IA”, é fundamental para a criação e o aprimoramento contínuo dos modelos de IA.
As fábricas de IA usam a infraestrutura de computação do data center da NVIDIA junto com suas plataformas AI e NVIDIA Omniverse para a simulação e o treinamento de modelos de IA. O segundo computador representa o ambiente de tempo de execução do robô.
Isso varia de acordo com a aplicação: Pode estar na nuvem ou em um data center; em um servidor local para tarefas como inspeção de defeitos na fabricação de semicondutores; ou em uma máquina autônoma equipada com vários sensores e câmeras.
Geração de ativos e cenas de qualidade
Talla também destaca o papel dos LLMs na quebra de barreiras técnicas, transformando usuários comuns em artistas técnicos capazes de criar células de trabalho de robótica complexas ou simulações de armazéns inteiros.
Com ferramentas de IA generativas, como o NVIDIA Picasso, os usuários podem gerar recursos 3D realistas a partir de simples comandos de texto e adicioná-los a cenas digitais para ambientes de treinamento de robôs dinâmicos e abrangentes.
O mesmo recurso se estende à criação de cenários diversos e fisicamente precisos no Omniverse, aprimorando o teste e o treinamento de robôs para garantir a aplicabilidade no mundo real.
Isso se encaixa no potencial transformador da IA generativa para reconfigurar a implantação de robôs. Tradicionalmente, os robôs são criados para tarefas específicas, e modificá-los para outras tarefas é um processo demorado.
Mas os avanços nos LLMs e nos modelos de linguagem de visão estão eliminando esse gargalo, permitindo interações mais intuitivas com os robôs por meio da linguagem natural, explica Talla.
Essas máquinas – adaptáveis e conscientes do ambiente ao seu redor – logo se espalharão pelo mundo.