- ZeroSearch vähendab dramaatiliselt tehisintellekti mudelite treenimise kulusid simuleeritud otsingute abil, välistades sõltuvuse välistest otsingumootoritest.
- See kasutab juhendatud tugevdusõppe süsteemi, mis parandab õigusteaduse bakalaureuseõppega õpilaste meenutamis- ja arutlusvõimet.
- See võimaldab ettevõtetel ja arendajatel treenida edasijõudnud mudeleid madalate kuludega, saavutades protsessi üle autonoomia ja kontrolli.
Innovatsioon tehisintellekti valdkonnas on viimastel aastatel plahvatuslikult kasvanud, eriti seoses suurte keelemudelitega (LLM-id). Üks 2025. aasta olulisemaid läbimurdeid on olnud Alibaba väljatöötatud tehnoloogia ZeroSearch, mis raputab nende mudelite treenimise alustalasid. Millest ZeroSearch täpselt räägib ja miks see selles valdkonnas nii palju elevust tekitab? Selles artiklis vaatleme üksikasjalikult seda uut metoodikat, sealhulgas selle toimimist, eeliseid traditsiooniliste meetodite ees ja seda, kuidas see saab muuta tehisintellekti arengut kõigil tasanditel.
Tehnoloogiaringkondades räägitakse ainult sellest: ZeroSearch lubab vähendada tehisintellekti mudelite koolituskulusid vähemalt 88%.. See efektiivsuse hüpe, mis pole kaugeltki pelgalt turundustrikk, avaldab sügavat mõju nii suurtele kui ka väikestele ettevõtetele, arendajatele ja loomulikult ka üldise tehisintellekti arengule.
Mis on ZeroSearch ja kust see pärit on?
ZeroSearch on uus tugevdusõppel põhinev tehnika, mis on loodud keelemudelite treenimiseks ilma treeningprotsessi ajal reaalsetele välistele otsingumootoritele toetumata. See innovatsioon pärineb Alibaba Tongyi laborist eesmärgiga lahendada kaks levinud probleemi veebiotsinguid kasutavate tehisintellekti mudelite treenimisel: kõrge majanduslik kulu API-de ja taastatud dokumentide kvaliteedi ettearvamatus.
Seni nõudis täiustatud assistentide, vestlusrobotite või soovitusmootorite arendamine kümnete tuhandete päringute saatmist otsingumootoritele, näiteks Google'ile, tasuliste teenuste kaudu, mis suurendas kulusid ja piiras skaleeritavust, eriti piiratud eelarvega ettevõtete jaoks.
ZeroSearch muudab mängureegleid, panustades süsteemile, kus LLM ise õpib otsingumootori toimimist simuleerima, genereerides päringutele vastuseks asjakohaseid või isegi mürarikkaid (ebaolulisi) dokumente ja võimaldades seega treenimist ilma välise sekkumiseta.
Kuidas ZeroSearch töötab? Üksikasjalik tehniline selgitus
ZeroSearchi keskmes on tugevdusõppe (RL) raamistik, mis välistab vajaduse tegelike veebiotsingute järele treeningu ajal. Vaatleme seda protsessi samm-sammult, tuginedes Alibaba lähenemisviisile ja tehnika ulatuslikele avaldatud analüüsidele.
1. Kerge juhendatud häälestamine otsingute simuleerimiseks
Kõik algab ühest järelevalve all olev peenhäälestus (SFT) milles LLM-i treenitakse käituma infootsingu moodulina. Selle kohandamise abil õpib see genereerima päringutele vastuseid, jäljendades tekstistiili ja sisutüüpi, mida päris otsingumootor pakuks. Selle algfaasi käigus kogutakse mudeli ja otsingumootori vahelisi interaktsioonitrajektoore, luues andmeid päringute ja leitud dokumentide kohta.
Edukad teed, st need, mis viivad õige vastuseni, on märgistatud positiivsetena (kasulikud dokumendid), samas kui need, mis viivad vigade või valede vastusteni, on märgitud negatiivsetena (mürarikkad dokumendid). See eristamine aitab mudelil hiljem mõista ja taasesitada realistliku otsingu dünaamikat, sealhulgas asjakohaseid ja vähem kasulikke tulemusi.
2. Tugevdusõppe roll õppekava simulatsioonis
Pärast juhendatud häälestamist liigub mudel tugevduskoolituse faasi, kus head tavad kinnistatakse ja vigu karistatakse. Siin toimib simuleeritud LLM ise otsingumootorina, vastates poliitikamudeli genereeritud päringutele ja tagastades dokumente, mis võivad olla kasulikud või mürarikkad.
Mudeli raskusaste suureneb järk-järgult, järgides õppekava strateegiat, mis aeglaselt halvendab loodud dokumentide kvaliteeti, nii et Süsteem õpib esmalt kontrollitud keskkondades ja edenedes seisab silmitsi üha mürarikkamate või keerukamate näidetega.. See lähenemisviis aitab mudelil arendada realistlikes tingimustes tugevaid otsingu- ja arutlusvõimeid.
3. Preemiate ja hindamismõõdikute kujundamine
Õppimise suunamiseks kasutab ZeroSearch funktsiooni F1 skoori alusel makstav preemia, mis tasakaalustab täpsust ja meeldejäävust, võttes arvesse ennustuse ja õige vastuse sõnade vastavust. Eesmärk on maksimeerida mudeli abil genereeritavate lõppvastuste täpsust, ilma et peaks liialt muretsema vormindamise pärast, kuna õigusteaduse spetsialistid toodavad tavaliselt loomulikult hästi vormindatud tekste.
4. Mitme pöördega interaktsiooni- ja arutluskäigu mallid
Koolituse ajal kasutatakse interaktsioonimalle, mis jagavad protsessi kolmeks etapiks: sisemine arutluskäik (eraldatud siltidega nagu <think>...</think>
), konsultatsiooni läbiviimine (<search>...</search>
) Ja vastuste genereerimine (<answer>...</answer>
). See võimaldab mudelil parandada oma võimet sõnastada asjakohaseid päringuid ja anda põhjendatud vastuseid.
5. Ühilduvus ja skaleeritavus
ZeroSearch toetab peamisi keelemudeleid, näiteks Qwen-2.5 perekonda, Qwen-2.5, LLaMA-3.2 ja baas- või käskude järgi häälestatud variandid. Lisaks saab seda rakendada erinevate tugevdusalgoritmidega (muuhulgas PPO, GRPO), mis hõlbustab selle kasutuselevõttu erinevates arenduskeskkondades.
Reaalmaailma andmed: kui palju ZeroSearch salvestab ja kuidas see toimib?
Alibaba läbiviidud ja erialastes väljaannetes ning repositooriumides avaldatud katsed näitavad, et ZeroSearch saavutab jõudluse, mis on võrreldav ja isegi parem kui päris kommertsotsingumootorite abil saavutatav.. Kulude kokkuhoid on eriti märgatav:
- Google Search API abil 64.000 XNUMX päringu tegemine võib maksta umbes USA dollari 586,70 (umbes 540 eurot).
- Sama päringute maht, mis genereeritakse ja hallatakse 14.000 miljardi parameetriga LLM-iga, kasutades ZeroSearchi, vähendab kulu vaid USA dollari 70,80 (umbes 65 eurot).
- See erinevus viitab a 88% kokkuhoid koolituskuludelt, kõrvaldades sõltuvuse välistest API-dest ja võimaldades suuremat skaleeritavust.
Teisest küljest on kvaliteeditulemused muljetavaldavad: katsed näitavad, et 7B-parameetriga otsingumoodul vastab Google'i otsingul põhinevate süsteemide jõudlusele, samas kui 14B parameetriga mudel edestab seda isegi küsimuste ja vastuste ülesannetes, kasutades nii ühe hüppega kui ka keerulisi järeldusandmestikke.
Peamised eelised ja mõju tehisintellekti tööstusele
ZeroSearchi tulek kujutab endast radikaalset muutust selles, kuidas ettevõtted ja arendajad saavad läheneda täiustatud mudelite koolitamisele.:
- Majandusbarjääri drastiline vähendamineHõlbustab juurdepääsu täiustatud tehisintellekti tehnikatele VKEdele, idufirmadele ja sõltumatutele arendajatele, keda varem takistas kommerts-API-de hind.
- Suurem kontroll treeningu üleSimuleeritud dokumentide genereerimise abil saavad meeskonnad täpselt määratleda, millist teavet mudel saab, kohandades raskusastet ja kvaliteeti vastavalt oma vajadustele.
- Tehnilise autonoomia suurendamineMinimeerib sõltuvust suurtest välismaistest tehnoloogiaplatvormidest, edendades kohandatud tehisintellekti lahenduste kohalikku arendamist.
- Kohanduvus ja modulaarsusZeroSearchi saab juurutada mitmesugustel mudelitel ja kohandada vastavalt erinevatele töövoogudele ja ärivajadustele.
Erinevused varasematest strateegiatest: RAG, reaalsed otsingud ja simulatsioonid
Enne ZeroSearchi oli LLM-idele ajakohase ja täpse teabe pakkumiseks kõige levinum lahendus RAG-i (Retrieval-Augmented Generation) kasutamine, kus mudel pärib välistest allikatest reaalsete otsingute abil. See tekitab aga mõned ilmsed probleemid:
- Kõrge hindAPI-de jätkuv kasutamine võib eelarveid hüppeliselt suurendada.
- Muutuv kvaliteet: Leitud dokumendid võivad otsingutest ja API-st endast olenevalt olla väga vastuolulised.
- Õiguslikud ja privaatsuspiirangudKolmandate osapoolte teenustele lootmine toob kaasa õiguslikke ja poliitilisi riske, eriti kui treenite tundliku teabega.
ZeroSearch välistab vajaduse pidevalt viidata välistele allikatele, võimaldades mudelil õppida otsima "iseenda seest", simuleerides otsingumootoriga suhtlemise kogemust.
Mõju ja reaalsed rakendused: Quarkist tehisintellekti demokratiseerimiseni
Alibaba on ZeroSearchi juba kommertstoodetesse integreerinud. Nende Quarki rakendus, mis põhineb Qweni mudelitel, on tänu sellele tehnikale märkimisväärselt paranenud arutluskäigus ja keerukatele päringutele vastuste täpsemaks muutmises. Aga võib-olla kõige olulisem on see, et ZeroSearch avab väiksematele ettevõtetele ukse oma täiustatud mudelite kujundamiseks ilma kalli välise infrastruktuuri vajaduseta..
Teadusringkondadel on juurdepääs nii GitHubi kui ka Hugging Face'i koodihoidlale, andmekogumitele ja eelkoolitatud mudelitele, mis soodustab ülemaailmset kasutuselevõttu ja katsetamist.
Milline näeb välja tehisintellekti koolituse tulevik tänu ZeroSearchile?
Nende tehnikate küpsedes näeme intelligentsete assistentide levikut, millel on täiustatud otsinguvõimalused ilma Google'ile, Bingile või muule sarnasele toetumata. See avab uusi võimalusi hariduses, ettevõtluses ja teadustöös, samal ajal potentsiaalselt õõnestades suurte otsingumootorite domineerimist tehisintellekti sektoris.
Hispaania ja Euroopa jaoks tähendab see autonoomse kasvu, tehnoloogilise sõltuvuse ja kulude vähenemise ning kriitiliste infosüsteemide üle suurema strateegilise kontrolli võimalust.
ZeroSearchi esiletõus tähistab uue ajastu algust, kus tehisintellekti mudelite treenimine lakkab olemast vaid vähestele kättesaadav luksus ja muutub ligipääsetavaks, skaleeritavaks ja üha keerukamaks tööriistaks. Õpetades tehisintellekti otsima oma keskkonnast lahkumata, on Alibaba astunud hiiglasliku sammu iseseisvate ja tõhusate süsteemide arendamise suunas, mis kohanduvad iga vajadusega.. Asi pole enam ainult kulude vähendamises, vaid kogu tehisintellekti tööstuse mängureeglite uuesti leiutamises.
Sisukord
- Mis on ZeroSearch ja kust see pärit on?
- Kuidas ZeroSearch töötab? Üksikasjalik tehniline selgitus
- Reaalmaailma andmed: kui palju ZeroSearch salvestab ja kuidas see toimib?
- Peamised eelised ja mõju tehisintellekti tööstusele
- Erinevused varasematest strateegiatest: RAG, reaalsed otsingud ja simulatsioonid
- Mõju ja reaalsed rakendused: Quarkist tehisintellekti demokratiseerimiseni
- Milline näeb välja tehisintellekti koolituse tulevik tänu ZeroSearchile?