Mistral AI introduceert Devstral: krachtige nieuwe open-source SWE-agentmodel dat op laptops draait
De goed gefinancierde Franse AI-modelmaker Mistral heeft sinds de lancering van zijn eigen krachtige open-source fundamentmodel in de herfst van 2023 constant indruk gemaakt. Recent kreeg het echter kritiek van ontwikkelaars op X vanwege de lancering van een proprietary groot taalmodel genaamd Medium 3. Sommige ontwikkelaars beschouwden deze stap als een verraad aan de open-source principes van het bedrijf.
Open-source modellen kunnen vrijelijk door iedereen worden aangepast, terwijl proprietary modellen betaald moeten worden en hun aanpassingsmogelijkheden beperkt zijn en gecontroleerd worden door de maker van het model.
Vandaag is Mistral terug en herbevestigt het zijn toewijding aan de open-source AI-gemeenschap, met een bijzondere focus op AI-gedreven softwareontwikkeling. Het bedrijf heeft samengewerkt met de open-source startup All Hands AI, de makers van Open Devin, om Devstral uit te brengen, een nieuw open-source taalmodel met 24 miljoen parameters. Dit is veel kleiner dan veel rivalen, waarvan de modellen in de miljarden liggen, en vereist daardoor veel minder rekenkracht, zodat het op een laptop kan draaien. Devstral is ontworpen voor agent-gebaseerde AI-ontwikkeling.
In tegenstelling tot traditionele LLM's die zijn ontworpen voor korte code-aanvullingen of geïsoleerde functie-generatie, is Devstral geoptimaliseerd om te functioneren als een volledige software-engineering agent. Het kan context begrijpen over verschillende bestanden heen, grote codebases navigeren en reële problemen oplossen.
Het model is nu gratis beschikbaar onder de permissieve Apache 2.0-licentie, waardoor ontwikkelaars en organisaties het zonder restricties kunnen implementeren, aanpassen en commercialiseren.
“We wilden iets open releases voor de ontwikkelaars- en enthousiastengemeenschap—iets dat ze lokaal, privé kunnen draaien en naar eigen wens kunnen aanpassen,” zei Baptiste Rozière, onderzoekswetenschapper bij Mistral AI. “Het is vrijgegeven onder Apache 2.0, dus mensen kunnen er eigenlijk mee doen wat ze willen.”
Bouwen op Codestral
Devstral vertegenwoordigt de volgende stap in Mistral’s groeiende portfolio van codegerichte modellen, na het eerdere succes met de Codestral-reeks. Codestral, dat in mei 2024 werd gelanceerd, was Mistral’s eerste stap in gespecialiseerde coding LLM's. Het was een model met 22 miljard parameters dat was getraind om meer dan 80 programmeertalen te verwerken en werd goed gewaardeerd om zijn prestaties in codegeneratie en -aanvulling.
De populariteit en technische kwaliteiten van het model leidden tot snelle iteraties, waaronder de lancering van Codestral-Mamba—een verbeterde versie die is gebouwd op de Mamba-architectuur—en meest recent, Codestral 25.01, dat is geadopteerd door IDE-pluginontwikkelaars en zakelijke gebruikers die op zoek zijn naar modellen met hoge frequentie en lage latentie.
De opkomst van Codestral hielp Mistral te vestigen als een belangrijke speler in het ecosysteem van code-modellen en legde de basis voor de ontwikkeling van Devstral—het uitbreiden van snelle aanvullingen naar volledige agent-takenuitvoering.
Overtreft grotere modellen op belangrijke SWE benchmarks
Devstral behaalt een score van 46,8% op de SWE-Bench Verified benchmark, een dataset van 500 reële GitHub-issues die handmatig zijn gevalideerd op correctheid. Deze benchmark is cruciaal voor het meten van de effectiviteit van software-engineering modellen en toont aan dat Devstral sterke prestaties levert, zelfs in vergelijking met grotere, meer geavanceerde modellen.
Door zijn veelzijdigheid en efficiënte gebruik van rekenkracht is Devstral niet alleen een krachtig hulpmiddel voor individuele ontwikkelaars, maar ook voor bedrijven die op zoek zijn naar betrouwbare oplossingen voor hun software-ontwikkeling. De mogelijkheid om het model lokaal te draaien en aan te passen, maakt het bijzonder aantrekkelijk voor een breed scala aan gebruikers binnen de tech-gemeenschap.
Met de lancering van Devstral herbevestigt Mistral zijn rol als pionier in de open-source AI-ruimte en biedt het krachtige middelen voor een nieuwe generatie softwareontwikkeling.
Vertaald met ChatGPT gpt-4o-mini