2025-4-08
Novo mainframe da IBM conta com processador Telum II e acelerador Spyre, fruto de anos de investigação e co-desenvolvimento para responder às exigências emergentes da IA empresarial
A IBM apresentou o z17, a mais recente versão do seu mainframe, responsável por processar cerca de 70% das transações financeiras a nível mundial. No centro desta nova geração estão o processador IBM Telum II e o Spyre Accelerator, desenvolvidos em colaboração com a IBM Research, componentes estes que foram concebidos para dar resposta às novas exigências das aplicações empresariais de Inteligência Artificial (IA), especialmente em ambientes onde a segurança dos dados e a latência reduzida são determinantes. Com o z17, a IBM pretende marcar uma nova era de aplicações de IA empresariais e tirar partido de aceleradores desenvolvidos em estreita colaboração entre a IBM Research e as equipas de infraestrutura da empresa. O Spyre, que estará disponível no último trimestre de 2025, poderá ser adicionado ao sistema como uma placa PCIe opcional, permitindo escalabilidade conforme as necessidades do cliente. A engenharia por trás do z17O processador Telum II e o acelerador Spyre são o resultado de anos de investigação no IBM Research AI Hardware Center. O desenvolvimento assentou num esforço conjunto de co-design de hardware e software, com o envolvimento direto de clientes IBM Z para alinhar as funcionalidades com as exigências do mercado. “Construímos um acelerador completo”, explicou Jeff Burns, diretor do centro, referindo-se ao pacote tecnológico que inclui chip, placa, compilador, tempo de execução e driver. Nos primeiros testes, o protótipo do Spyre revelou uma eficiência energética três vezes superior à das GPU de última geração, processando significativamente mais imagens por segundo por watt consumido. Este desempenho tornou-se um ponto-chave numa altura em que a sustentabilidade energética das soluções de IA é uma preocupação crescente. Spyre: da hipótese ao produtoA génese do Spyre remonta a 2015, com uma investigação sobre computação de baixa precisão aplicada ao deep learning. Na altura, a hipótese da equipa liderada por Burns era clara: um chip desenhado de raiz para IA poderia ser mais eficiente do que as soluções baseadas em GPU ou CPU existentes. A aposta na especialização — e não na versatilidade — levou ao desenvolvimento da chamada AIU (Unidade de Inteligência Artificial), atualmente materializada no acelerador Spyre. Segundo Viji Srinivasan, cientista da IBM Research, o equilíbrio entre inovação em hardware e avanços no software foi essencial para tirar partido do potencial total do Telum II e do Spyre. Esta abordagem permitiu acelerar inferência de IA, crucial para casos como deteção de fraude financeira, prevenção de branqueamento de capitais e avaliação de risco de crédito – áreas com mais de 250 casos de uso já identificados para o IBM Z. Preparado para um futuro em constante evoluçãoProjetar chips para IA obriga a antecipar mudanças num setor altamente volátil. John Rozen, diretor do programa do AI Hardware Center, lembra que “as cargas de trabalho estavam já a mudar rapidamente antes mesmo do ChatGPT”. O roadmap da equipa watsonx revelou-se essencial neste processo, ao prever a necessidade de hardware otimizado para IA generativa e raciocínio estratégico já em 2025 e 2026, respetivamente. O Spyre foi, por isso, desenvolvido não apenas para os modelos dominantes atuais, mas também para os que ainda estão a emergir. A tendência aponta agora para modelos mais pequenos, específicos e adequados à finalidade, bem como para novos tipos como os modelos de espaço de estado. O objetivo da IBM foi criar um acelerador capaz de acompanhar estas transformações, oferecendo simultaneamente flexibilidade e desempenho. |