By aiexpertcoach in AI — 26 apr. 2025

Ethisch Getrainde AI-Startup Pleias Lanceert Nieuwe Kleine Redeneringsmodellen Geoptimaliseerd voor RAG met Ingebouwde Citaten

Het Franse AI-startup Pleias heeft eind vorig jaar veel aandacht getrokken met de lancering van de ethisch getrainde Pleias 1.0-familie van kleine taalmodellen. Deze modellen zijn een van de eerste en enige die volledig zijn opgebouwd uit "open" data, dat wil zeggen data die expliciet is gelabeld als openbaar domein, open source of ongelicensed en niet onderhevig aan auteursrecht.

Nu heeft het bedrijf de release aangekondigd van twee open source kleine redeneringsmodellen die specifiek zijn ontworpen voor retrieval-augmented generation (RAG), citatie-synthese en gestructureerde meertalige output. Deze lancering bevat twee kernmodellen — Pleias-RAG-350M en Pleias-RAG-1B — die ook beschikbaar zijn in CPU-geoptimaliseerd GGUF-formaat, wat in totaal vier inzetbare varianten oplevert.

Alle modellen zijn gebaseerd op Pleias 1.0 en kunnen onafhankelijk of in combinatie met andere LLM's worden gebruikt die de organisatie al heeft of van plan is in te zetten. Ze zijn allemaal beschikbaar onder een permissieve Apache 2.0 open source licentie, wat betekent dat ze geschikt zijn voor organisaties om te gebruiken, aan te passen en in te zetten voor commerciële toepassingen.

Wat is RAG en Waarom is het Belangrijk?

RAG is een veelgebruikte techniek die bedrijven en organisaties kunnen inzetten om een AI groot taalmodel (LLM) zoals OpenAI's GPT-4o, Google's Gemini 2.5 Flash, Anthropic's Claude Sonnet 3.7 of Cohere's Command-A, of open source alternatieven zoals Llama 4 en DeepSeek V3 te verbinden met externe kennisdatabases, zoals bedrijfsdocumenten en cloudopslag. Dit is vaak noodzakelijk voor bedrijven die chatbots en andere AI-toepassingen willen bouwen die verwijzen naar hun interne beleidslijnen of productcatalogi.

Het is een alternatieve aanpak waarbij een lang context-LLM met alle benodigde informatie wordt aangestuurd, wat mogelijk niet geschikt is voor bedrijfsgebruik waarbij beveiliging en kosten per token een punt van zorg zijn.

Pleias-RAG Modellen: Een Nieuwe Standaard

De Pleias-RAG modelfamilie is de laatste inspanning om de kloof tussen nauwkeurigheid en efficiëntie in kleine taalmodellen te overbruggen. Deze modellen zijn gericht op bedrijven, ontwikkelaars en onderzoekers die op zoek zijn naar kosteneffectieve alternatieven voor grootschalige taalmodellen zonder in te boeten op traceerbaarheid, meertalige mogelijkheden of gestructureerde redeneringsworkflows.

De doelgroep is eigenlijk het thuiscontinent van Pleias, Europa. Co-founder Alexander Doria liet in een direct bericht aan VentureBeat weten: “Een belangrijke motivatie was de moeilijkheid om RAG-toepassingen in Europa op te schalen. De meeste particuliere organisaties hebben weinig GPU's (dit kan veranderd zijn, maar niet zo lang geleden had minder dan 2% van alle Nvidia H100 GPU's zich in Europa bevonden). En tegelijkertijd zijn er sterke prikkels om zelf te hosten om gereguleerde redenen, waaronder de GDPR.”

De Uitdagingen van Kleine Taalmodellen

“SLM's hebben het afgelopen jaar aanzienlijke vooruitgang geboekt, maar ze worden te vaak gezien als ‘mini-chatbots’ en we hebben een significante afname in prestaties op niet-Engelse talen waargenomen, zowel qua bronbegrip als de kwaliteit van tekstgeneratie. We zijn er daarom tevreden mee dat we de meeste van onze doelen hebben bereikt.”

De Pleias-RAG-modellen zijn ontworpen om een echte alternatieve oplossing te bieden voor 7-8b modellen voor RAG, zelfs op CPU's en andere beperkingen. Dit zorgt ervoor dat bedrijven in Europa de voordelen van AI kunnen benutten zonder de kosten en complexiteit die grootschalige modellen met zich meebrengen.

De Toekomst van AI in Europa

Naarmate de technologie zich verder ontwikkelt, is het belangrijk dat Europese bedrijven toegang hebben tot efficiënte en effectieve AI-oplossingen. De Pleias-RAG-modellen bieden een antwoord op de groeiende vraag naar meer toegankelijke AI-technologieën die passen binnen de unieke behoeften en regelgeving van de Europese markt. Dit is niet alleen een stap voorwaarts voor Pleias, maar ook voor de bredere AI-gemeenschap in Europa.

In conclusie, de lancering van deze nieuwe modellen markeert een belangrijke ontwikkeling in de wereld van AI. Het biedt bedrijven de mogelijkheid om de kracht van AI te benutten zonder de traditionele barrières van kosten en complexiteit. Met de Pleias-RAG-modellen in de hand, kunnen organisaties nu betere en efficiëntere AI-toepassingen ontwikkelen die aan hun specifieke behoeften voldoen.

Vertaald met ChatGPT gpt-4o-mini