Como a General Compute reduz consumo energético em inferência de IA

Daiane de Souza

2 dias atrás

Advertising

O avanço acelerado da inteligência artificial generativa trouxe uma nova preocupação para o mercado global de tecnologia: o consumo energético da infraestrutura necessária para operar modelos de IA em larga escala.

Nos últimos anos, o crescimento de chatbots, copilotos de programação, agentes autônomos e sistemas multimodais aumentou drasticamente a demanda por processamento em data centers. Dessa forma, fez com que empresas do setor passassem a buscar alternativas capazes de equilibrar desempenho, escalabilidade e eficiência energética.

É justamente nesse contexto que a General Compute tenta se destacar. A startup afirma estar construindo uma infraestrutura de inferência de inteligência artificial muito mais eficiente do ponto de vista energético do que ambientes tradicionais baseados em GPUs.

Segundo a companhia, seu modelo pode consumir até dez vezes menos energia em comparação com estruturas convencionais utilizadas atualmente no mercado de IA.

Advertising

O crescimento energético da IA

A popularização da inteligência artificial generativa transformou data centers em uma das áreas de maior crescimento energético do setor de tecnologia.

Grandes modelos de linguagem exigem enorme capacidade computacional tanto para treinamento quanto para inferência — etapa responsável por gerar respostas em tempo real para os usuários.

Toda vez que alguém utiliza ferramentas como chatbots, sistemas de voz ou agentes autônomos, existe uma infraestrutura processando bilhões de cálculos continuamente.

Grande parte desse processamento atualmente depende de GPUs fabricadas por empresas como a NVIDIA. Embora extremamente parrudas, essas GPUs também são conhecidas pelo alto consumo energético e pela necessidade de sistemas avançados de refrigeração.

A crítica da General Compute às GPUs

Segundo a General Compute, o principal problema é que GPUs nunca foram criadas originalmente para LLM inference.

Na visão da empresa, essas arquiteturas carregam décadas de desenvolvimento voltado para gráficos, renderização e computação paralela genérica.

A companhia afirma que o mercado de IA acabou adaptando GPUs para inferência porque elas já estavam disponíveis, mas isso criou gargalos relacionados a:

consumo de energia;
movimentação de memória;
refrigeração;
eficiência por token processado;
latência.

O posicionamento da startup resume essa ideia em uma frase utilizada em sua comunicação institucional: “GPUs were built for graphics. We’re built for inference.”

ASICs desenvolvidos para inferência

Para tentar resolver esse problema, a General Compute aposta em ASICs (Application-Specific Integrated Circuits).

Diferentemente das GPUs tradicionais, os ASICs são chips desenvolvidos especificamente para workloads de inferência de IA.

Segundo a empresa, isso permite eliminar desperdícios computacionais presentes em arquiteturas genéricas.

Os chips da companhia foram projetados para maximizar:

throughput de tokens;
eficiência energética;
velocidade de inferência;
redução de latência;
desempenho contínuo em tempo real.

A empresa afirma que seus racks consomem cerca de 17 kW, enquanto infraestruturas equivalentes baseadas em GPU podem ultrapassar 120 kW.

Refrigeração a ar em vez de água

Outro ponto central da estratégia energética da General Compute é a refrigeração.

Atualmente, muitos data centers de IA dependem de sistemas de refrigeração líquida para evitar superaquecimento das GPUs.

Esses sistemas frequentemente exigem grandes volumes de água e aumentam significativamente os custos operacionais da infraestrutura.

Segundo a General Compute, seus ASICs conseguem operar utilizando apenas refrigeração a ar.

Dessa forma, elimina a necessidade de sistemas complexos de resfriamento líquido e reduz o impacto ambiental da operação.

A empresa afirma que essa abordagem ajuda a diminuir tanto o consumo energético quanto os custos de manutenção dos data centers.

Paraguai como estratégia energética

Parte da estratégia da General Compute envolve a instalação de operações no Paraguai.

Segundo a empresa, o país oferece acesso a energia hidrelétrica extremamente barata, fator considerado estratégico para workloads de inteligência artificial.

A companhia afirma trabalhar com custos energéticos próximos de US$ 0,035 por kWh, valor muito inferior à média comercial americana, estimada em aproximadamente US$ 0,13 por kWh.

Além disso, a startup afirma conseguir reutilizar estruturas anteriormente utilizadas para mineração de criptomoedas. Como seus chips operam com refrigeração a ar, esses ambientes podem ser convertidos em data centers de IA com menor custo de adaptação.

Segundo a empresa, essa combinação ajuda a reduzir drasticamente o custo operacional da inferência de inteligência artificial.

Eficiência e velocidade ao mesmo tempo

A General Compute argumenta que eficiência energética não significa perda de desempenho. Pelo contrário: a empresa afirma que seus ASICs conseguem entregar velocidades muito superiores às infraestruturas tradicionais.

Segundo os dados divulgados pela companhia:

infraestruturas convencionais operam próximas de 100 a 120 tokens por segundo;
os sistemas da General Compute podem atingir até 950 tokens por segundo em determinados cenários.

A empresa também afirma que sua nuvem pode ser até sete vezes mais rápida do que soluções tradicionais baseadas em GPU.

O futuro da IA em tempo real

Segundo Finn Puklowski, Chief Executive Officer da General Compute, o crescimento dos agentes autônomos tornará a eficiência energética ainda mais importante nos próximos anos.

Isso porque sistemas autônomos exigem processamento contínuo e baixa latência para executar tarefas em tempo real.

A General Compute acredita que existirão mais de 1 bilhão de agentes ativos até 2029, criando uma demanda gigantesca por infraestrutura escalável e eficiente.

Uma nova disputa no mercado de IA

A estratégia da General Compute mostra que a próxima grande disputa da inteligência artificial pode acontecer não apenas nos modelos de linguagem, mas também na infraestrutura responsável por executá-los.

Ao apostar em ASICs especializados, refrigeração a ar e energia hidrelétrica barata, a empresa tenta construir uma alternativa mais sustentável para inference AI.

Com o crescimento acelerado da IA generativa, eficiência energética deve se tornar um dos fatores mais importantes para empresas que desejam operar inteligência artificial em larga escala sem elevar drasticamente seus custos operacionais.