ZeroSearch: Alibaba's revolutie voor het efficiënt en autonoom trainen van AI

Laatste update: Mei 12 2025
  • ZeroSearch verlaagt de kosten voor het trainen van AI-modellen via gesimuleerde zoekopdrachten aanzienlijk, waardoor u niet langer afhankelijk bent van externe zoekmachines.
  • Er wordt gebruikgemaakt van een systeem van supervised reinforcement learning dat het herinnerings- en redeneervermogen van LLM's verbetert.
  • Bedrijven en ontwikkelaars kunnen hiermee geavanceerde modellen tegen lage kosten trainen en krijgen zo autonomie en controle over het proces.

Wat is ZeroSearch, kunstmatige intelligentie?

De innovatie op het gebied van kunstmatige intelligentie is de afgelopen jaren enorm toegenomen, vooral op het gebied van grote taalmodellen (LLM's). Een van de belangrijkste doorbraken van 2025 is ZeroSearch, een technologie ontwikkeld door Alibaba die de basis van de manier waarop deze modellen worden getraind, op zijn kop zet. Waar gaat ZeroSearch precies over en waarom zorgt het voor zoveel ophef in de sector? In dit artikel bespreken we deze nieuwe methodologie uitgebreid. We leggen uit hoe deze werkt, welke voordelen deze biedt ten opzichte van traditionele methoden en hoe deze de ontwikkeling van AI op alle niveaus kan veranderen.

In techkringen wordt erover gesproken: ZeroSearch belooft de trainingskosten voor kunstmatige intelligentiemodellen met maar liefst 88% te verlagen.. Deze sprong voorwaarts in efficiëntie is niet zomaar een marketingtruc. Het heeft grote gevolgen voor grote en kleine bedrijven, voor ontwikkelaars en uiteraard voor de vooruitgang van kunstmatige intelligentie in het algemeen.

Wat is ZeroSearch en waar komt het vandaan?

ZeroSearch is een nieuwe techniek op basis van reinforcement learning, waarmee u taalmodellen kunt trainen zonder dat u tijdens het trainingsproces afhankelijk bent van echte externe zoekmachines. Deze innovatie komt uit het Tongyi-laboratorium van Alibaba en heeft als doel twee veelvoorkomende problemen op te lossen bij het trainen van AI-modellen die gebruikmaken van webzoekopdrachten: de hoge economische kosten voor het gebruik van API's en de onvoorspelbaarheid in de kwaliteit van de herstelde documenten.

Tot nu toe was het voor de ontwikkeling van geavanceerde assistenten, chatbots en aanbevelingsmachines nodig om tienduizenden zoekopdrachten via betaalde diensten naar zoekmachines als Google te sturen. Dit verhoogde de kosten en beperkte de schaalbaarheid, vooral voor bedrijven met een krap budget.

ZeroSearch verandert de spelregels door te wedden op een systeem waarin De LLM zelf leert de werking van een zoekmachine te simulerenhet genereren van relevante of zelfs onbelangrijke (irrelevante) documenten als antwoord op vragen en zo training mogelijk maken zonder externe interactie.

Hoe ZeroSearch werkt in AI

Hoe werkt ZeroSearch? Gedetailleerde technische uitleg

De kern van ZeroSearch wordt gevormd door een reinforcement learning (RL)-framework dat de noodzaak van daadwerkelijke webzoekopdrachten tijdens de training elimineert. Laten we dit proces stap voor stap bekijken, op basis van Alibaba's aanpak en de uitgebreide gepubliceerde analyses van de techniek.

  Alles over generatieve kunstmatige intelligentie: hoe het werkt, wat het gebruikt en wat de risico's zijn

1. Lichtgewicht begeleide afstemming om zoekopdrachten te simuleren

Alles begint bij één begeleide fine-tuning (SFT) waarin de LLM wordt opgeleid om te functioneren als een informatieophaalmodule. Door deze aanpassing leert het antwoorddocumenten voor zoekopdrachten te genereren, die qua tekststijl en inhoud lijken op die van een echte zoekmachine. In deze beginfase worden de interactietrajecten tussen het model en een zoekmachine verzameld. Hiermee worden registraties van opgehaalde zoekopdrachten en documenten vastgelegd.

Succesvolle paden, dat wil zeggen paden die naar het juiste antwoord leiden, worden gemarkeerd als positief (nuttige documenten), terwijl paden die fouten of onjuiste antwoorden opleveren, worden gemarkeerd als negatief (documenten met veel ruis). Deze differentiatie helpt het model later om de dynamiek van een realistische zoekopdracht te begrijpen en te reproduceren, inclusief relevante en minder bruikbare resultaten.

2. De rol van reinforcement learning bij curriculumsimulatie

Na de begeleide afstemming gaat het model over naar de versterkingstrainingsfase, waarin goede praktijken worden versterkt en fouten worden bestraft. In deze situatie fungeert de gesimuleerde LLM zelf als een zoekmachine. Deze reageert op zoekopdrachten die door het beleidsmodel worden gegenereerd en retourneert documenten die nuttig of juist onduidelijk kunnen zijn.

De moeilijkheidsgraad van het model neemt geleidelijk toe, volgens een curriculumstrategie die de kwaliteit van de gegenereerde documenten langzaam doet afnemen, zodat Het systeem leert eerst in gecontroleerde omgevingen en wordt naarmate het vordert geconfronteerd met voorbeelden die steeds ruisiger of complexer zijn.. Dankzij deze aanpak ontwikkelt het model robuuste zoek- en redeneercapaciteiten onder realistische omstandigheden.

3. Ontwerp van beloningen en evaluatiemetrieken

Om het leren te begeleiden, gebruikt ZeroSearch een functie van beloning gebaseerd op de F1-score, waarbij de nauwkeurigheid en het geheugen in evenwicht worden gebracht door rekening te houden met de woordovereenkomst tussen de voorspelling en het juiste antwoord. Het doel is om de nauwkeurigheid van de uiteindelijke antwoorden die het model genereert te maximaliseren, zonder dat u zich te veel zorgen hoeft te maken over de opmaak. LLM's produceren namelijk doorgaans van nature goed opgemaakte teksten.

4. Multi-turn interactie- en redeneersjablonen

Tijdens de training worden interactiesjablonen gebruikt die het proces in drie fasen verdelen: interne redenering (gescheiden tussen tags zoals <think>...</think>), het uitvoeren van de consultatie (<search>...</search>) En responsgeneratie (<answer>...</answer>). Hierdoor kan het model beter relevante vragen stellen en goed onderbouwde antwoorden geven.

5. Compatibiliteit en schaalbaarheid

ZeroSearch ondersteunt belangrijke taalmodellen, zoals de Qwen-2.5-familie, Qwen-2.5, LLaMA-3.2 en basis- of instructie-afgestemde varianten. Bovendien kan het worden geïmplementeerd met verschillende versterkingsalgoritmen (PPO, GRPO, en andere), waardoor de toepassing in verschillende ontwikkelomgevingen wordt vereenvoudigd.

  Gemini voor Android: een revolutie in kunstmatige intelligentie en mobiele productiviteit

ZeroSearch-toepassingen en -resultaten

Gegevens uit de praktijk: Hoeveel bespaart ZeroSearch en wat zijn de prestaties?

Experimenten die door Alibaba zijn uitgevoerd en waarover in gespecialiseerde publicaties en databanken wordt bericht, tonen aan dat ZeroSearch vergelijkbare of zelfs betere prestaties levert dan de prestaties van echte commerciële zoekmachines.. De kostenbesparingen zijn vooral opmerkelijk:

  • Het uitvoeren van 64.000 zoekopdrachten met behulp van de Google Search API kan ongeveer Dollar 586,70 (ongeveer € 540).
  • Hetzelfde queryvolume, gegenereerd en beheerd met een LLM van 14.000 miljard parameters met behulp van ZeroSearch, verlaagt de kosten tot slechts Dollar 70,80 (ongeveer € 65).
  • Dit differentieel impliceert een 88% besparing op opleidingskostenwaardoor de afhankelijkheid van externe API's wordt geëlimineerd en er een grotere schaalbaarheid mogelijk is.

De kwaliteitsresultaten zijn daarentegen indrukwekkend: experimenten laten zien dat een ophaalmodule met 7B-parameters qua prestaties overeenkomt met systemen die zijn gebaseerd op Google Zoeken, terwijl het model met 14B-parameters het zelfs overtreft in vraag-en-antwoordtaken, waarbij zowel single-hop- als complexe inferentiedatasets worden gebruikt.

Belangrijkste voordelen en impact op de kunstmatige intelligentiesector

De komst van ZeroSearch betekent een radicale verandering in de manier waarop bedrijven en ontwikkelaars geavanceerde modellen kunnen trainen.:

  • Drastische verlaging van de economische barrière:Maakt het voor het MKB, startups en zelfstandige ontwikkelaars mogelijk om toegang te krijgen tot geavanceerde AI-technieken, die voorheen werden belemmerd door de kosten van commerciële API's.
  • Meer controle over de trainingDoor gesimuleerde documenten te genereren, kunnen teams precies definiëren welke informatie het model ontvangt, en de moeilijkheidsgraad en kwaliteit aanpassen aan hun behoeften.
  • Versterking van de technische autonomie: Minimaliseert de afhankelijkheid van grote buitenlandse technologieplatformen en bevordert de lokale ontwikkeling van op maat gemaakte AI-oplossingen.
  • Aanpassingsvermogen en modulariteitZeroSearch kan op verschillende modellen worden ingezet en worden afgestemd op verschillende workflows en zakelijke vereisten.

Verschillen met eerdere strategieën: RAG, echte zoekopdrachten en simulaties

Vóór ZeroSearch was RAG (Retrieval-Augmented Generation) de meestgebruikte oplossing om LLM's van actuele en nauwkeurige informatie te voorzien. Hierbij raadpleegt het model externe bronnen met behulp van zoekopdrachten in de echte wereld. Dit brengt echter een aantal duidelijke problemen met zich mee:

  • Hoge kosten:Voortdurend gebruik van API's kan budgetten de pan uit laten rijzen.
  • Variabele kwaliteit:Opgehaalde documenten kunnen erg inconsistent zijn, afhankelijk van de zoekopdrachten en de API zelf.
  • Juridische en privacybeperkingen:Het vertrouwen op diensten van derden brengt juridische en politieke risico's met zich mee, vooral als u traint met gevoelige informatie.

Met ZeroSearch is het niet langer nodig om voortdurend externe bronnen te raadplegen. Hierdoor kan het model leren om ‘binnen zichzelf’ te zoeken, terwijl het de ervaring van interactie met een zoekmachine simuleert.

  Machine Learning: basis- en geavanceerde concepten

Impact en toepassingen in de praktijk: van Quark tot de democratisering van AI

Alibaba heeft ZeroSearch al geïntegreerd in commerciële producten. Dankzij deze techniek zijn hun Quark-applicatie, aangestuurd door Qwen-modellen, aanzienlijk verbeterd in redenering en nauwkeurige antwoorden op complexe vragen. Maar misschien is het meest relevante wel dat ZeroSearch biedt kleinere bedrijven de mogelijkheid om hun eigen geavanceerde modellen te ontwerpen, zonder dat hiervoor dure externe infrastructuur nodig is..

hand ia-0
Gerelateerd artikel:
Alles wat je moet weten over Manus, de AI-agent die jouw werk wil doen

De onderzoeksgemeenschap heeft toegang tot de codeopslag, datasets en vooraf getrainde modellen op zowel GitHub als Hugging Face, wat wereldwijde acceptatie en experimenten stimuleert.

Hoe ziet de toekomst van AI-training eruit dankzij ZeroSearch?

Naarmate deze technieken zich ontwikkelen, zullen we steeds meer intelligente assistenten zien met geavanceerde zoekmogelijkheden, zonder dat ze afhankelijk zijn van Google, Bing en dergelijke. Dit creëert nieuwe kansen in het onderwijs, het bedrijfsleven en onderzoek, terwijl tegelijkertijd de dominantie van grote zoekmachines op het gebied van kunstmatige intelligentie mogelijk wordt ondermijnd.

Voor Spanje en Europa biedt dit de mogelijkheid tot autonome groei, minder technologische afhankelijkheid en kosten en meer strategische controle over cruciale informatiesystemen.

De opkomst van ZeroSearch markeert het begin van een nieuw tijdperk waarin het trainen van AI-modellen niet langer een luxe is die slechts voor een selecte groep is weggelegd, maar een toegankelijk, schaalbaar en steeds geavanceerder hulpmiddel wordt. Door AI te leren zoeken zonder de eigen omgeving te verlaten, heeft Alibaba een grote stap gezet in de ontwikkeling van zelfvoorzienende, efficiënte systemen die zich aan elke behoefte kunnen aanpassen.. Het gaat niet langer alleen om het verlagen van kosten, maar om het opnieuw uitvinden van de spelregels voor de gehele kunstmatige-intelligentiesector.

Wat is e-commerce
Gerelateerd artikel:
Wat is e-commerce: 10 sleutels om elektronische handel te begrijpen