Hoe Google’s Genie wereldmodel Amerikaanse straten simuleert met Street View
In de Verenigde Staten heeft Google een innovatieve stap gezet in de wereld van kunstmatige intelligentie met de integratie van Street View in Project Genie. Deze ontwikkeling maakt het mogelijk om straten en hun omgeving op een interactieve manier te simuleren. Denk aan de mogelijkheid om het weer aan te passen of de omgeving te zien in een scenario zoals dat van de film 'The Day After Tomorrow'. Dit is een spannende uitbreiding van Google’s mogelijkheden, waarmee gebruikers nu nog realistischere ervaringen kunnen creëren.
Tijdens de Google I/O ontwikkelaarsconferentie werd deze nieuwe functie aangekondigd. Jack Parker-Holder, een onderzoeker van het DeepMind-team dat zich bezighoudt met open-endedness, benadrukte de kracht van deze technologie voor zowel robots als mensen. Hij gaf een voorbeeld van een robot die in Londen wordt ingezet, een stad die zelden zonlicht ziet. Met Genie kan deze robot situaties simuleren waarin de zon af en toe doorbreekt, zodat hij niet geschrokken wordt door het onverwachte zonlicht.
Interactiviteit en simulatie
De mogelijkheid om de omgeving te simuleren gaat verder dan alleen de esthetiek. Gebruikers kunnen nu ook specifieke scenarios creëren, zoals een sneeuwbedekte straat in New York City, ongeacht het seizoen. Dit biedt een unieke ervaring waarbij men de effecten van weersomstandigheden op een specifieke locatie kan verkennen.
Google heeft in de afgelopen 20 jaar een enorme hoeveelheid data verzameld via Street View, met meer dan 280 miljard beelden uit 110 landen en zeven continenten. Dit rijke bronmateriaal stelt ontwikkelaars in staat om de echte wereld te combineren met de kracht van simulatie. Parker-Holder beschrijft hoe deze combinatie een potentieel krachtige tool is voor verschillende toepassingen.
Genie 3 en zijn toepassingen
In augustus 2023 introduceerde Google Genie 3, een model dat nu in een onderzoeksversie beschikbaar is. In januari kregen Google AI Ultra-abonnees in de VS toegang tot deze tool, waarmee gebruikers interactieve gamewerelden kunnen creëren op basis van tekst of afbeeldingen. Het doel is om Genie te gebruiken voor educatieve toepassingen, gaming en robotica-training.
Genie 3 heeft ook al een rol gespeeld in de simulators van Waymo, waar het wordt gebruikt om zelfrijdende auto's voor te bereiden op zeldzame gebeurtenissen zoals tornado's of ontmoetingen met olifanten. Door Street View-data toe te voegen, kan Waymo zich beter voorbereiden op de uitrol in meer Amerikaanse steden.
Een nieuwe kijk op simulaties
Waymo heeft zijn eigen simulatoren ontwikkeld om de AI-bestuurder in verschillende steden te testen. Het belangrijkste verschil met Genie is dat de simulaties van Waymo voornamelijk vanuit het perspectief van de auto zijn. Street View biedt de mogelijkheid om de simulatie te verplaatsen naar andere agenten, zoals mensen of robots, wat de ervaring aanzienlijk verrijkt.
De toegang tot Street View in Genie wordt geleidelijk uitgerold naar Ultra-gebruikers in de Verenigde Staten, met de verwachting dat gebruikers wereldwijd in de komende weken ook toegang krijgen. Dit stelt een breder publiek in staat om met deze nieuwe technologie aan de slag te gaan.
Experimenteren met precisie
Diego Rivas, productmanager bij DeepMind, benadrukte dat het doel is om deze nieuwe functionaliteit zo toegankelijk mogelijk te maken. Hij waarschuwde echter dat zowel Street View als Genie nog in de experimentele fase zijn. Dit betekent dat er nog veel werk aan de winkel is om de nauwkeurigheid en functionaliteit te verbeteren.
De eerste demonstraties van deze technologie tonen indrukwekkende, maar nog steeds videogame-achtige beelden, in plaats van fotorealistische simulaties. Bovendien zijn de modellen nog niet fysica-bewust, wat betekent dat ze niet alle fysieke wetten volgen zoals in de echte wereld. Dit geeft aan dat er veel ruimte voor verbetering is, wat spannend is voor de toekomst van deze technologie.
Vertaald met ChatGPT gpt-4o-mini