Mercado & Negócios

Huawei Cloud traz ao Brasil plataforma de IA com DeepSeek V4 e chip Ascend 

A Huawei Cloud lança no Brasil o Model as a Service, o MaaS, plataforma que permite a empresas acessar modelos avançados de inteligência artificial por API sem precisar montar infraestrutura própria para hospedar, operar e escalar modelos de grande porte. A solução chega ao país com foco em reduzir o custo de uso de IA generativa em ambientes corporativos, ampliar a previsibilidade do consumo de tokens e acelerar a criação de aplicações como assistentes virtuais, agentes de atendimento, análise documental, automação de processos e geração de código. 

O lançamento ocorre em um momento em que empresas brasileiras avançam da fase de testes para projetos de IA em produção, mas ainda enfrentam barreiras relacionadas ao custo dos tokens, à complexidade técnica, à escolha de modelos, à latência e à segurança no tratamento de dados. Em comparações com modelos de desempenho equivalente disponíveis no mercado, o DeepSeek V3.2, posicionado como alternativa ao GPT-4o para uso geral, pode representar uma economia de até 89% em cenários de uso intensivo. 

A plataforma reúne modelos como DeepSeek V3.2, DeepSeek R1, GLM-5 e GLM-5.1, além de já contemplar o DeepSeek V4, nova geração da família DeepSeek. Para aplicações de raciocínio avançado, o DeepSeek R1 representa uma redução de 96% no custo por token em relação ao OpenAI o1. O GLM-5, especializado em documentos longos e geração de código, oferece 67% de economia frente ao GPT-4o. O GLM-5.1, modelo topo de linha da família, representa 78% de economia em relação ao GPT-4o Advanced e ao Claude Opus 4.6. Com isso, o MaaS amplia o portfólio de modelos acessíveis para empresas que buscam aplicações de linguagem, raciocínio avançado, análise de documentos, desenvolvimento assistido por IA e criação de agentes corporativos. 

Na prática, o MaaS não funciona como um chatbot pronto ou uma aplicação final para o usuário. A solução atua como uma camada de back-end para empresas e desenvolvedores, fornecendo o modelo, o processamento e a geração de tokens para que cada organização construa suas próprias aplicações. Os modelos rodam nos servidores da Huawei Cloud, em infraestrutura otimizada com chips de IA Ascend, desenvolvidos pela própria Huawei. 

“A inteligência artificial deixou de ser uma discussão experimental e passou a entrar nos processos centrais das empresas. O desafio agora é fazer isso com escala, custo previsível e segurança. O MaaS foi criado para reduzir essa barreira, oferecendo acesso a modelos avançados por API, sem que a empresa precise montar toda a infraestrutura por trás da operação”, afirma Mark Chen, CEO da Huawei Cloud na América Latina. 

Segundo o executivo, o modelo permite acelerar o desenvolvimento de soluções corporativas ao abstrair etapas técnicas como implantação de modelos, adaptação de frameworks de inferência, otimização de operadores, programação de recursos de IA e gestão de infraestrutura. “A empresa passa a consumir a capacidade de IA como serviço, pagando conforme o uso e direcionando seus times para a criação de valor no negócio, e não para a complexidade da infraestrutura”, completa. 

O anúncio foi feito durante evento da companhia em São Paulo e integra a expansão da solução para outros mercados, incluindo México, Singapura, Tailândia, Indonésia, Arábia Saudita, Emirados Árabes Unidos, África do Sul e Turquia. No Brasil, a expectativa da Huawei Cloud é atender principalmente setores com grande volume de dados e demanda por automação, como serviços financeiros, varejo, indústria, tecnologia, educação, saúde e setor público. 

Um dos principais desafios enfrentados por empresas que escalam IA generativa é a imprevisibilidade do consumo. Em aplicações com agentes, atendimento automatizado ou análise de grandes volumes de documentos, a quantidade de tokens pode crescer rapidamente, pressionando margens e dificultando o planejamento financeiro. Ao oferecer modelos sob demanda e cobrança proporcional ao uso, o MaaS busca dar mais flexibilidade para que empresas ajustem seus projetos conforme o volume real de utilização. 

Do ponto de vista técnico, a solução combina modelos abertos, infraestrutura cloud e aceleração por hardware próprio. A execução nos servidores da Huawei Cloud com chips Ascend registra latência média de 35 ms TPOT (tempo por token de saída) no DeepSeek V3.2, com capacidade de adicionar até 10 milhões de tokens por minuto em cerca de dois minutos em situações de pico. Em caso de falha de hardware, o sistema recupera a operação em até 10 segundos sem interrupção de sessão do usuário, por meio de mecanismo de retransmissão em nível de token. A comparação de desempenho entre os chips Ascend e GPUs convencionais aponta ganhos de 3x a 4x em determinados cenários de inferência.

No benchmark independente SWE-Bench Pro, referência global para avaliação de modelos em tarefas reais de engenharia de software, o GLM-5.1 ocupa a primeira posição, superando GPT-5.4 e Claude Opus 4.6. O modelo suporta janelas de contexto de 200 mil tokens, sendo indicado para análise de contratos extensos, auditorias de código e automação de processos com múltiplas iterações. O GLM-5 lidera o ranking LMArena Code entre modelos abertos, com desempenho superior em tarefas de geração e manutenção de código. 

A segurança de dados é outro eixo da oferta. De acordo com a Huawei Cloud, os dados de inferência não são gravados em disco, não são utilizados para treinamento ou otimização dos modelos e são excluídos após a conclusão do serviço. A transmissão conta com criptografia TLS de ponta a ponta, mecanismos de isolamento de rede, controle de acesso e autenticação por IAM para usuários corporativos. A plataforma mantém certificações SOC, ISO, HIPAA e GDPR, reconhecidas globalmente, e detém a certificação ISO 42001, o primeiro padrão internacional para Sistemas de Gestão de Inteligência Artificial (AIMS) — credencial especialmente relevante para setores regulados como saúde, serviços financeiros e setor público. 

Além disso, o MaaS foi estruturado para facilitar a integração com ferramentas já utilizadas por times técnicos. A solução oferece APIs compatíveis com padrões amplamente adotados pelo mercado, incluindo formatos compatíveis com OpenAI API e Anthropic API, o que permite integração com ambientes de desenvolvimento, plataformas de agentes, ferramentas de automação e frameworks como Dify, Cline, Cursor, OpenCode, RAGFlow, Claude Code, n8n e outras soluções usadas por equipes de tecnologia. Empresas interessadas podem realizar um ciclo de validação técnica em três dias, com cenários recomendados que incluem automação de marketing via WhatsApp com DeepSeek V3.2, análise de contratos com DeepSeek R1 e geração de código em escala com GLM-5 ou GLM-5.1. 

Para empresas brasileiras, os principais casos de uso incluem atendimento inteligente, triagem de documentos, análise de contratos, apoio a áreas jurídicas e de compliance, extração de informações de relatórios, automação de backoffice, desenvolvimento de software e criação de agentes especializados para processos internos. 

“O próximo passo da inteligência artificial nas empresas não será apenas escolher o melhor modelo, mas encontrar a melhor combinação entre desempenho, custo, segurança e capacidade de integração. É nesse ponto que o MaaS se posiciona, oferecendo variedade de modelos, infraestrutura otimizada e uma camada de acesso simples para que as empresas possam colocar IA em produção com mais velocidade”, conclui Chen. 

Rafael

Rafael de Souza Mota é especialista em tecnologia, mobilidade e inovação, criador do Inteligência Móvel. Atua como gerente de projetos e produz reviews, análises e conteúdos sobre smartphones, gadgets, automóveis e lifestyle digital.