Google’s nieuwe Ironwood-chip is 24x krachtiger dan 's werelds snelste supercomputer

Google’s nieuwe Ironwood-chip is 24x krachtiger dan 's werelds snelste supercomputer

Google Cloud heeft op woensdag zijn zevende generatie Tensor Processing Unit (TPU), Ironwood, onthuld. Deze op maat gemaakte AI-accelerator levert volgens het bedrijf meer dan 24 keer de rekenkracht van 's werelds snelste supercomputer wanneer deze op grote schaal wordt ingezet.

De nieuwe chip, aangekondigd tijdens Google Cloud Next '25, vertegenwoordigt een belangrijke verschuiving in de meer dan tienjarige strategie van Google voor de ontwikkeling van AI-chips. Terwijl eerdere generaties TPU's voornamelijk waren ontworpen voor zowel trainings- als inferentiewerkzaamheden, is Ironwood de eerste die specifiek is gebouwd voor inferentie — het proces waarbij getrainde AI-modellen worden ingezet om voorspellingen te doen of antwoorden te genereren.

Doorbreken van rekenkundige barrières: De 42,5 exaflops van Ironwood

De technische specificaties van Ironwood zijn indrukwekkend. Wanneer deze wordt opgeschaald naar 9.216 chips per pod, levert Ironwood 42,5 exaflops aan rekenkracht — een enorme verbetering ten opzichte van El Capitan, 's werelds snelste supercomputer met 1,7 exaflops. Elke individuele Ironwood-chip levert een piekcomputing van 4.614 teraflops.

Ironwood biedt ook aanzienlijke verbeteringen op het gebied van geheugen en bandbreedte. Elke chip heeft 192GB High Bandwidth Memory (HBM), zes keer meer dan Trillium, Google’s vorige generatie TPU die vorig jaar werd aangekondigd. De geheugendoorvoersnelheid bereikt 7,2 terabits per seconde per chip, een verbetering van 4,5 keer ten opzichte van Trillium.

Misschien nog belangrijker is dat Ironwood in een tijdperk van energiebeperkte datacenters twee keer de prestaties per watt levert vergeleken met Trillium en bijna 30 keer energie-efficiënter is dan Google’s eerste Cloud TPU uit 2018.

"In een tijd waarin beschikbare energie een van de beperkingen is voor het leveren van AI-capaciteiten, bieden we aanzienlijk meer capaciteit per watt voor klantwerkbelastingen," legde Vahdat uit.

Van modelbouw tot 'denkende machines': Waarom de focus op inferentie nu belangrijk is

De nadruk op inferentie in plaats van training vertegenwoordigt een belangrijke keerpunt in de AI-tijdlijn. De industrie heeft zich jarenlang gefocust op het bouwen van steeds grotere fundamentmodellen, waarbij bedrijven voornamelijk concurreerden op basis van het aantal parameters en trainingscapaciteiten. Google’s verschuiving naar inferentie-optimalisatie suggereert dat we een nieuwe fase ingaan waarin efficiëntie van implementatie en redeneercapaciteiten centraal staan.

Deze overgang is logisch. Training vindt eenmaal plaats, maar inferentie-operaties zijn continu en hebben directe invloed op de gebruikerservaring. Dit betekent dat, naarmate bedrijven verder gaan met het ontwikkelen van geavanceerdere AI-oplossingen, de noodzaak om deze modellen effectief te implementeren en hun prestaties in de echte wereld te maximaliseren, steeds belangrijker wordt.

Met de komst van Ironwood, dat speciaal is ontwikkeld voor deze taak, is Google goed gepositioneerd om voorop te lopen in de AI-competitie. Door te investeren in inferentie kan het bedrijf niet alleen de efficiëntie van hun systemen verbeteren, maar ook de kwaliteit van de AI-diensten die ze aan hun klanten bieden.

De toekomst van AI: Samenwerking en inzichten

De verschuiving naar inferentie betekent ook dat AI-agenten proactief gegevens zullen ophalen en genereren om samen inzichten en antwoorden te bieden, niet alleen data. Dit is wat Google de 'tijdperk van inferentie' noemt. Amin Vahdat, Vice President en General Manager van ML, Systems en Cloud AI bij Google, gaf aan dat Ironwood is gebouwd om deze volgende fase van generatieve AI te ondersteunen, met enorme computationele en communicatieve vereisten.

Met Ironwood kan Google niet alleen de kracht van AI benutten, maar ook de samenwerking tussen verschillende systemen en applicaties verbeteren. Dit zal resulteren in meer geavanceerde en nuttige toepassingen van AI in het dagelijks leven, van gezondheidszorg tot financiën en daarbuiten.

In deze context is het belangrijk om te beseffen dat de ontwikkelingen in AI niet alleen technische vooruitgang zijn, maar ook een bredere impact hebben op de manier waarop we met technologie omgaan en hoe deze onze wereld vormgeeft. Ironwood is een belangrijke stap in die richting, en de toekomst ziet er veelbelovend uit.

Vertaald met ChatGPT gpt-4o-mini