NVIDIA amplia a IA local baseada em agentes

12 de junho de 2026 Rafael

Os agentes pessoais estão se popularizando rapidamente, com projetos de código aberto como OpenClaw e Hermes registrando forte adoção pelas comunidades de desenvolvedores de IA no GitHub. Desenvolvidos para se adaptar às preferências e fluxos de trabalho individuais, esses agentes podem interagir com aplicativos, gerar conteúdo, automatizar processos repetitivos e gerenciar tarefas de múltiplas etapas — tudo isso executado localmente no dispositivo. Durante o NVIDIA GTC Taipei na COMPUTEX, a NVIDIA revelou o NVIDIA RTX Spark — uma nova categoria de PCs Windows desenvolvida especificamente para agentes pessoais — juntamente com uma série de atualizações que expandem os agentes locais por todo o ecossistema NVIDIA RTX e DGX.

Executar agentes de forma segura e privada exige hardware capaz de lidar com essa demanda. Com 1 petaflop de capacidade de processamento para IA e 128 GB de memória unificada, o RTX Spark atende às exigências computacionais dos agentes executados localmente, oferecendo uma nova categoria de computador que evolui de ferramenta a companheiro de trabalho. Projetado para IA, criação de conteúdo e jogos, o RTX Spark reúne os 30 anos de inovação tecnológica da NVIDIA em notebooks Windows finos com bateria para o dia todo e desktops ultracompactos altamente eficientes.

A parceria da NVIDIA com o Windows se estende de soluções pessoais até corporativas. Também apresentado durante o evento, o NVIDIA RTX Station é o supercomputador de mesa definitivo para IA voltado a profissionais, trazendo GPU e CPU de classe de data center para inferência em um sistema desktop equipado com Windows, garantindo gerenciamento, segurança e compatibilidade.

Outros anúncios incluem:

O runtime NVIDIA OpenShell chegará ao Windows, desenvolvido sobre os novos mecanismos de segurança para agentes da Microsoft, oferecendo aos desenvolvedores um pacote de fácil implementação para agentes seguros executados localmente. Hermes Agent e OpenClaw também integrarão o OpenShell e os mecanismos de segurança da Microsoft em seus novos aplicativos para Windows.
O blueprint NVIDIA NemoClaw está sendo expandido para toda a linha de IA local da NVIDIA — GeForce RTX, RTX PRO, RTX e DGX Spark, RTX e DGX Station — com novos instaladores simplificados e suporte ao Hermes Agent.
Desempenho de inferência até 2x superior nos principais modelos agentivos com previsão de múltiplos tokens em llama.cpp e vLLM, além de novas otimizações multi-GPU para llama.cpp e ComfyUI.
A H Company está lançando ferramentas de uso de computador — incluindo novos modelos e uma futura estrutura para agentes de desktop — otimizadas para PCs RTX e DGX.
A Adobe está reformulando seus aplicativos Photoshop e Premiere, o Blender está adicionando NVIDIA DLSS 4.5 Ray Reconstruction, e a NVIDIA revelou o RTX Video Frame Generation, que chegará ao ComfyUI. Todas essas atualizações serão lançadas no segundo semestre juntamente com o RTX Spark.
A atualização NVIDIA Broadcast 2.2 traz otimizações para o recurso Studio Voice e suporte ao Elgato Stream Deck. O NVIDIA Project G-Assist também passa a contar com integração ao Stream Deck.

IA Agentiva Local: pessoal, privada e rápida em PCs Windows RTX

A ampla adoção de agentes tem sido limitada pela incapacidade de executá-los de forma segura e privada nos PCs principais dos usuários.

A NVIDIA e a Microsoft estão trabalhando em parceria para resolver esse desafio, oferecendo uma plataforma Windows robusta e segura para agentes executados diretamente no dispositivo.

A colaboração começa com uma base sólida — os novos mecanismos de segurança do Windows e o runtime NVIDIA OpenShell — para garantir que os agentes operem com segurança e sob total controle do usuário.

Os novos mecanismos do Windows oferecem recursos de identidade, contenção, políticas e segurança ponta a ponta para criar e executar agentes nativamente. O NVIDIA OpenShell fornece recursos adicionais de política para que os usuários definam o que os agentes podem ou não fazer, a capacidade de direcionar consultas de forma inteligente para modelos locais com base nas políticas de privacidade do usuário e a possibilidade de mascarar informações pessoais em consultas enviadas para modelos em nuvem.

Essa robusta camada de segurança e privacidade está sendo adotada por desenvolvedores líderes de agentes, como Hermes Agent e OpenClaw, em seus novos aplicativos para Windows. Esses novos aplicativos facilitarão o acesso seguro dos usuários a agentes locais avançados capazes de executar tarefas em aplicativos Windows, raciocinar sobre fluxos de trabalho entre diferentes programas, gerar imagens e vídeos, desenvolver plug-ins e aplicativos, além de realizar buscas semânticas em arquivos locais.

Executar agentes em dispositivos locais exige tanto segurança robusta quanto hardware de alto desempenho. O RTX Spark oferece até 1 petaflop de processamento para IA e 128 GB de memória unificada para atender às demandas de processamento desses agentes.

A NVIDIA também está acelerando o ecossistema de modelos abertos locais dos quais esses agentes dependem.

A NVIDIA colaborou com a comunidade llama.cpp para habilitar recursos e otimizações como a previsão de múltiplos tokens (MTP) — uma técnica de decodificação especulativa em que um modelo menor propõe vários tokens simultaneamente, enquanto o modelo principal os valida em uma única passagem. Combinada a outras otimizações, como o programmatic dependent launch, essa tecnologia entrega desempenho até 2x superior nos modelos Qwen 3.6 e 3.5 27B, além de um ganho de 1,6x nos modelos Qwen 3.6 e 3.5 35B. Essas atualizações estão disponíveis por meio da interface web do llama.cpp e do LM Studio.

Legenda: Os ganhos de desempenho demonstrados com as mais recentes otimizações da NVIDIA para o llama.cpp mostra que o Qwen3.6-27B alcança até 2x mais throughput e o Qwen3.6-35B até 1,6x em uma GeForce RTX 5090, acelerando cargas de trabalho de IA agentiva local por meio da colaboração com a comunidade de código aberto.

Para entusiastas de IA que utilizam sistemas com múltiplas GPUs, a NVIDIA colaborou com a comunidade de código aberto para aprimorar duas das ferramentas de IA local mais populares:

O llama.cpp adiciona paralelismo de tensores para oferecer até 2x mais memória e 1,8x mais capacidade computacional utilizando duas GPUs equivalentes.
O ComfyUI recebe um novo método de classifier-free guidance que proporciona até 2x mais desempenho com duas GPUs equivalentes, além da possibilidade de dividir cadeias de modelos entre GPUs para aproveitar a memória combinada.

Legenda: Demonstra melhorias no desempenho de geração de tokens da técnica Tensor Parallel Multi-GPU em comparação com inferência via pipeline parallel e GPU única no llama.cpp.

Legenda: Demonstra melhorias no tempo de geração com técnicas multi-GPU no ComfyUI.

A NVIDIA também está expandindo as capacidades dos agentes em parceria com a H Company. A estrutura de uso de computador da H Company permite que agentes naveguem em um PC observando a tela e operando mouse e teclado como um usuário real, mesmo em aplicativos que não possuem APIs, e chegará em breve aos PCs RTX e DGX com suporte a modelos locais.

A NVIDIA colaborou com a H Company para quantizar seus avançados modelos Holo Computer Use, além de acelerar sua estrutura, proporcionando um ganho de velocidade de 2x em GPUs NVIDIA e reduzindo o consumo de memória em 35%. Os modelos já estão disponíveis para download, e o aplicativo Holo Desktop será lançado em breve.

Otimizações para agentes no Linux

Para desenvolvedores que precisam de agentes locais sempre acessíveis, o NVIDIA DGX Spark é o computador pessoal de IA para agentes mais avançado para quem necessita de um ambiente Linux, unificando grande capacidade de memória, processamento acelerado e compatibilidade com o ecossistema NVIDIA CUDA.

A atualização do sistema operacional DGX Spark deste mês traz a experiência mais simplificada já oferecida, com um instalador otimizado do NemoClaw e inferência mais rápida nos principais modelos agentivos.

O NemoClaw agora está disponível para todos os PCs NVIDIA RTX e DGX executando Linux e Windows Subsystem for Linux. Implante agentes locais com segurança no Linux utilizando novos instaladores simplificados, que oferecem sandboxing automático e suporte adicional ao Hermes Agent.

A NVIDIA colaborou com o vLLM para otimizar a inferência para agentes, trazendo melhorias ao vLLM e novos checkpoints NVFP4 otimizados para o Qwen 3.6 35B. As atualizações entregam desempenho 2,6x superior no DGX Spark em comparação aos checkpoints NVFP4 anteriormente disponíveis pela Unsloth, incluindo melhorias de kernel, precisão mista e suporte a CUDA Graph para MTP.

Leia o blog do vLLM para uma análise completa sobre a implementação de modelos mixture-of-experts NVFP4 no DGX Spark — desde o ajuste de memória unificada até uma configuração de referência funcional baseada no NVIDIA Nemotron 3 Super.

Experiências criativas avançadas com Adobe

A NVIDIA está trabalhando em parceria com a Adobe para reformular o Adobe Premiere e o Photoshop para o RTX Spark. O Generative Fill do Photoshop e o Generative Extend do Premiere, ambos impulsionados pelo Firefly, estão entre as centenas de ferramentas aceleradas que oferecem mais poder criativo, precisão e controle. O RTX Spark amplia essas capacidades, proporcionando até 2x mais desempenho em IA, edição, correção de cor e efeitos ao longo dos fluxos criativos.

O Adobe Premiere contará com um novo pipeline de vídeo que aproveita a memória unificada do RTX Spark, a GPU Blackwell e o software TensorRT, oferecendo desempenho em tempo real para edição e correção de cor, desempenho acelerado por IA na GPU e renderização mais eficiente de timelines complexas. Além disso, o Adobe Substance 3D Painter e o Stager serão executados nativamente no RTX Spark para fluxos de trabalho de texturização 3D e na criação de cenas mais fluidas e responsivas.

A próxima geração do mecanismo do Photoshop será otimizada para composição acelerada por GPU, permitindo filtros em tempo real, alto alcance dinâmico e pincéis naturais modernos. O pipeline nativo para IA foi desenvolvido para aproveitar todo o potencial do RTX Spark, incluindo o TensorRT.

A Adobe também ampliará os recursos do Premiere e do Photoshop para permitir que usuários criem, editem e desenvolvam projetos com agentes Windows, oferecendo aos criadores um parceiro colaborativo capaz de acelerar seus fluxos de trabalho.

As atualizações dos aplicativos criativos da Adobe, como Premiere, Photoshop e Substance, devem começar a ser disponibilizadas juntamente com a chegada do RTX Spark.

Novas ferramentas e atualizações de aplicativos para criadores

Novas atualizações da plataforma NVIDIA e otimizações de aplicativos parceiros estão sendo distribuídas por todo o ecossistema RTX — algumas já disponíveis e outras chegando junto ao RTX Spark no segundo semestre.

O NVIDIA Broadcast 2.2 promove o Studio Voice — recurso de IA que faz qualquer microfone soar com qualidade de estúdio — que sai da fase beta a partir de hoje. O Studio Voice agora é executado em GPUs GeForce RTX 3060 ou superiores com desempenho aprimorado. O aplicativo também recebe integração com o Elgato Stream Deck e atalhos de teclado configuráveis.

O Project G-Assist também adiciona suporte ao Stream Deck por meio do Elgato MCP Server, permitindo que os usuários habilitem recursos do assistente de IA em suas configurações de streaming.

Além disso, o Blender Cycles está integrando o DLSS 4.5 Ray Reconstruction como um novo sistema de remoção de ruído, transformando a viewport com path tracing em um visualizador interativo em tempo real. Isso permite que artistas 3D naveguem pela cena visualizando uma qualidade próxima à renderização final, transformando os fluxos de trabalho de iluminação e desenvolvimento visual. A atualização será lançada com o Blender 5.3 no segundo semestre, juntamente com o RTX Spark.

Também chegando com o RTX Spark, o RTX Video Frame Generation é um novo efeito de IA que dobra ou quadruplica a taxa de quadros de vídeos em tempo real — ideal para aprimorar conteúdos gerados por modelos de IA que normalmente produzem entre 15 e 20 quadros por segundo (fps). O recurso será disponibilizado como um pacote Python Wheel e um nó para ComfyUI, permitindo que artistas de IA gerem vídeos rapidamente em baixas taxas de quadros e depois os interpolam para reprodução suave.

Caso você não tenha visto: as novidades do RTX AI Garage

Leia o anúncio completo do NVIDIA RTX Spark para conhecer mais detalhes sobre o superchip, o trabalho da NVIDIA com o Windows em agentes e os notebooks e desktops compactos desenvolvidos por parceiros.
Os notebooks para criadores ASUS ProArt agora são fornecidos com o FLUX.2 Klein 4B, da Black Forest Labs — um modelo de geração de imagens destilado pré-instalado por meio do aplicativo MuseTree, otimizado com o formato NVFP4 e o SDK NVIDIA TensorRT para RTX. Os criadores obtêm até 2,5x mais desempenho e redução de 560% no uso de memória, com uma experiência pronta para uso que permite gerar imagens localmente imediatamente após retirar o produto da caixa, sem necessidade de downloads de modelos ou configuração do ComfyUI.
O SDK NVIDIA AI for Media está recebendo atualizações, incluindo novos microsserviços NVIDIA NIM LipSync otimizados para francês, alemão e espanhol. O microsserviço NIM Active Speaker Detection também passa a oferecer suporte a múltiplas câmeras com correlação de locutores entre diferentes vídeos.
Confira a mais recente publicação do blog RTX AI Garage sobre o Hermes Agent e a IA autoaperfeiçoável em PCs RTX e DGX Spark.