Maak kennis met de nieuwe koning van AI-codering: Google’s Gemini 2.5 Pro I/O-editie verdringt Claude 3.7 Sonnet

Maak kennis met de nieuwe koning van AI-codering: Google’s Gemini 2.5 Pro I/O-editie verdringt Claude 3.7 Sonnet

Er is een nieuwe koning op de troon van AI-codemodellen: Vandaag heeft Google’s DeepMind AI-onderzoeksunit de Gemini 2.5 Pro "I/O" editie onthuld, een nieuwe versie van het succesvolle Gemini 2.5 Pro multimodale taalmodel dat in maart werd gelanceerd. DeepMind CEO Demis Hassabis verklaarde op X dat dit het beste codemodel is dat ze ooit hebben gebouwd!

De eerste benchmarks die door het bedrijf zijn vrijgegeven, wijzen erop dat Google de leiding heeft genomen — voor het eerst sinds de race om generatieve AI serieus begon met de lancering van ChatGPT eind 2022 — boven alle andere modellen op minstens één belangrijke coderingsbenchmark.

De nieuwe versie van Gemini

De nieuwe versie, aangeduid als “gemini-2.5-pro-preview-05-06,” vervangt de eerdere 03-25 release en is nu beschikbaar voor onafhankelijke ontwikkelaars in Google AI Studio en voor bedrijven in het Vertex AI cloudplatform, evenals voor individuele gebruikers in de Gemini-app. In een blogpost van Google werd vermeld dat het ook de Canvas-functie van de Gemini mobiele app en andere functies aandrijft.

Deze nieuwe versie ondersteunt de ontwikkeling van functies in apps zoals Gemini 95, waar het model helpt om visuele stijlen automatisch over componenten te matchen. Het stelt ook workflows in staat zoals het omzetten van YouTube-video's in volledig uitgeruste leerapplicaties en het creëren van stijlvol vormgegeven componenten — zoals responsieve videospelers of geanimeerde dicteer-interfaces — met weinig tot geen handmatige CSS-bewerking.

Betaalmodel en kosten

Het is een propriëtair model, wat betekent dat bedrijven Google moeten betalen om het te gebruiken en het alleen toegankelijk is via de webdiensten van Google. Dit verandert echter niets aan de prijs of de gebruikslimieten; huidige gebruikers van Gemini 2.5 Pro worden automatisch doorverwezen naar het bijgewerkte model, dat $1.25/$10 per miljoen tokens kost (voor contextlengtes van 200.000 tokens) vergeleken met Claude 3.7 Sonnet’s $3/$15.

Een reactie op gebruikersfeedback

Het bedrijf presenteert deze stap — voorafgaand aan Google’s jaarlijkse I/O (input/output) ontwikkelaarsconferentie later deze maand in Mountain View en online, van 20-21 mei — als een reactie op sterke feedback vanuit de community over de praktische bruikbaarheid van Gemini in de generatie van echte code en interfaceontwerpen.

Logan Kilpatrick, Senior Product Manager voor Gemini API en Google AI Studio, bevestigde in een blogpost voor ontwikkelaars dat de update ook belangrijke feedback van ontwikkelaars over functietoevoegingen aanpakt, met verbeteringen in foutreductie en betrouwbaarheid van triggers.

Topresultaten bij het genereren van webapplicaties

Op de WebDev Arena Leaderboard, een externe maatstaf die modellen rangschikt op basis van menselijke voorkeur op hun vermogen om visueel aantrekkelijke en functionele webapplicaties te genereren, heeft Gemini 2.5 Pro Preview (05-06) nu de eerste plaats veroverd, net boven Anthropic’s Claude 3.7 Sonnet.

De nieuwe versie scoorde 1499.95 op de leaderboard, wat het goed vooruit plaatst ten opzichte van Sonnet 3.7’s 1377.10. Het vorige Gemini 2.5 Pro (03-25) model had de derde plaats met een score van 1278.96, wat betekent dat de I/O-editie een sprong van 221 punten vertegenwoordigt.

Met deze indrukwekkende prestaties lijkt Gemini 2.5 Pro I/O-editie een belangrijke speler te worden in de wereld van AI-codering, en biedt het ontwikkelaars nieuwe mogelijkheden om hun creativiteit en innovatie te benutten.

Vertaald met ChatGPT gpt-4o-mini