De drie grootste verrassingen van deze week’s AI-extravaganza

De drie grootste verrassingen van deze week’s AI-extravaganza

Basketbal heeft de March Madness. Technologie heeft de Consumer Electronics Show. AI heeft gewacht op zijn grote moment - en deze week zou dat eindelijk kunnen zijn.

Met de Build-conferentie van Microsoft en de I/O-ontwikkelaarsconferentie van Google die vlak achter elkaar plaatsvonden, was het al een belangrijke week. Microsoft kondigde maar liefst 50 nieuwe AI-tools aan, en Google volgde een dag later met zijn eigen reeks aankondigingen. Vervolgens, uit het niets, kwam Anthropic met Claude 4, de nieuwste versie van zijn grote taalmodel, op donderdag.

Terwijl de stortvloed aan aankondigingen ook enkele interessante gadgets omvatte (we kijken naar jou, Google Virtual Try-On), zullen degenen die een bedrijf willen opbouwen met AI voldoende redenen hebben om enthousiast te zijn en zelfs enkele nieuwe tools vinden om onmiddellijk te gebruiken.

Heb je moeite om bij te blijven? Hier zijn de grootste aankondigingen van elk bedrijf en hoe ze het AI-landschap in de komende maanden zullen vormgeven.

Microsoft wil dat AI-agenten met elkaar communiceren

Door AI de mogelijkheid te geven om werk uit te voeren zoals een mens in plaats van alleen maar als een mens te praten, vertegenwoordigen agenten een duidelijke volgende stap voor grote taalmodellen. Maar er was één belangrijke hindernis die hen heeft tegengehouden: ze kunnen niet eenvoudig met elkaar communiceren. Een agentische AI die vliegtickets boekt voor zakenreizen en een andere die hotels boekt klinkt geweldig, totdat je in Londen landt met een hotelkamer in Madrid.

Microsoft heeft een grote stap gezet in het oplossen van dit probleem door het Model Context Protocol (MCP) te adopteren, een standaardmanier voor verschillende agenten – zelfs die met verschillende grote taalmodellen – om te communiceren. Anthropic heeft deze standaard in november 2024 gecreëerd. Toch betekent de adoptie door Microsoft dat het goed op weg is om een vast onderdeel te worden van toekomstige agentische architectuur, net zoals HTML dat was voor het open web. Microsoft heeft MCP ook toegevoegd aan Azure AI Foundry, zijn tool voor het creëren van AI-apps, zodat gebruikers onmiddellijk agenten kunnen bouwen die met elkaar communiceren.

Claude 4 laat programmeurs zwijmelen

Met een marktaandeel van slechts 3,3% in de generatieve AI-markt, worden ChatGPT en Gemini vaak overschaduwd door Claude. Ontwikkelaars zullen echter niet op Claude Opus 4 en Sonnet 4 willen slapen, die onverwacht op donderdag arriveerden met enkele indrukwekkende programmeercapaciteiten.

Misschien nog het meest indrukwekkend is dat Claude 4 marathonruntime tot zeven uur biedt in zijn 'uitgebreide denkmodus', waarmee het duizenden stappen kan nemen en tools zoals websearch kan gebruiken. Anthropic beweert dat het ook meer benaderingen zal verkennen, meer fouten zal opmerken en zijn redeneervaardigheden zal uitleggen voor complexere problemen.

Met deze verbeteringen schoot Claude Opus 4 naar de top van de populaire SWE-bench benchmark voor software-engineering met een score van 72,5%, waarmee het zowel OpenAI o3 (69,1%) als Gemini 2.5 Pro (63,2%) overtrof.

Vertaald met ChatGPT gpt-4o-mini