Nous Research lanceert Hermes 4 AI-modellen die ChatGPT overtreffen zonder inhoudsbeperkingen

Nous Research lanceert Hermes 4 AI-modellen die ChatGPT overtreffen zonder inhoudsbeperkingen
Photo by Andrea De Santis / Unsplash

Nous Research, een geheime startup op het gebied van kunstmatige intelligentie die zich heeft ontwikkeld tot een vooraanstaande stem binnen de open-source AI-beweging, heeft op maandag stilletjes Hermes 4 uitgebracht. Dit is een familie van grote taalmodellen die volgens het bedrijf kunnen wedijveren met de prestaties van toonaangevende propriëtaire systemen, terwijl ze ongekende controle voor de gebruiker bieden en minimale inhoudsbeperkingen hanteren.

Deze release vertegenwoordigt een belangrijke escalatie in de strijd tussen voorstanders van open-source AI en grote technologiebedrijven over wie de controle moet hebben over de toegang tot geavanceerde kunstmatige intelligentiecapaciteiten. In tegenstelling tot modellen van OpenAI, Google of Anthropic, is Hermes 4 ontworpen om op bijna elke aanvraag te reageren zonder de veiligheidsmaatregelen die standaard zijn geworden in commerciële AI-systemen.

“Hermes 4 bouwt voort op onze erfenis van gebruikersgerichte modellen met uitgebreide rekenmogelijkheden tijdens het testen,” kondigde Nous Research aan op X (voorheen Twitter). “Er is speciale aandacht besteed aan het maken van de modellen creatief en interessant om mee te communiceren, zonder censuur, en neutraal afgestemd, terwijl we de prestaties op het gebied van wiskunde, coderen en redeneren op topniveau behouden voor modellen met open gewichten.”

Hoe de ‘hybride redenering’ van Hermes 4 ChatGPT en Claude overtreft op wiskundige benchmarks

Hermes 4 introduceert wat Nous Research “hybride redenering” noemt, waarmee gebruikers kunnen schakelen tussen snelle antwoorden en diepere, stap-voor-stap denkwijzen. Wanneer geactiveerd, genereert het model zijn interne redenering binnen speciale <think>-tags voordat het een definitief antwoord geeft — vergelijkbaar met de o1 redeneringsmodellen van OpenAI, maar met volledige transparantie in het denkproces van de AI.

De technische prestatie is aanzienlijk. Bij tests scoorde het grootste model van Hermes 4, met 405 miljard parameters, 96,3% op de MATH-500 benchmark in redeneringsmodus en 81,9% op de uitdagende AIME’24 wiskundewedstrijd — prestaties die rivaliseren of zelfs overtreffen met veel propriëtaire systemen die miljoenen meer kosten om te ontwikkelen.

“De uitdaging is om denktraces nuttig en verifieerbaar te maken zonder dat de redenering uit de hand loopt,” merkte AI-onderzoeker Rohan Paul op X op, waarbij hij een van de technische doorbraken in de release benadrukte.

Hermes 4 scoort hoog op de RefusalBench

Misschien nog opvallender is dat Hermes 4 de hoogste score behaalde onder alle geteste modellen op “RefusalBench”, een nieuwe benchmark die Nous Research heeft ontwikkeld om te meten hoe vaak AI-systemen weigeren vragen te beantwoorden. Het model scoorde 57,1% in redeneringsmodus, wat aanzienlijk beter is dan GPT-4o (17,67%) en Claude Sonnet 4 (17%).

Hermes 4-modellen van Nous Research beantwoordden aanzienlijk meer vragen dan concurrerende AI-systemen op RefusalBench, een test die meet hoe vaak modellen weigeren te antwoorden. Dit benadrukt de unieke benadering van Nous Research om gebruikers meer controle en mogelijkheden te bieden bij het werken met AI.

De toekomst van open-source AI

Met de release van Hermes 4 lijkt Nous Research niet alleen de concurrentie aan te gaan met gevestigde namen in de AI-industrie, maar ook een nieuwe standaard te zetten voor open-source modellen. De mogelijkheid om gebruikers de vrijheid te geven om hun AI-ervaring aan te passen zonder de beperkingen van censuur kan een belangrijke verschuiving betekenen in hoe AI wordt gebruikt en ontwikkeld.

Als het succes van Hermes 4 aanhoudt, kan dit wel eens de weg vrijmaken voor een toekomst waarin open-source AI niet alleen een alternatief is voor propriëtaire systemen, maar ook de voorkeur geniet van een breed scala aan gebruikers, van ontwikkelaars tot bedrijven en individuele gebruikers.

De evolutie van AI-modellen zoals Hermes 4 laat zien dat de strijd om de controle over kunstmatige intelligentie nog lang niet voorbij is en dat open-source oplossingen een steeds grotere rol spelen in deze dynamische en snel ontwikkelende sector.

Conclusie

De lancering van Hermes 4 door Nous Research markeert een belangrijke stap in de richting van meer transparantie en controle voor gebruikers van kunstmatige intelligentie. Met zijn krachtige prestaties en innovatieve benadering van redeneren, biedt Hermes 4 een veelbelovende toekomst voor open-source AI. Het is een ontwikkeling die niet alleen de huidige markt uitdaagt, maar ook de manier waarop we denken over en omgaan met AI zal herdefiniëren.

Vertaald met ChatGPT gpt-4o-mini