ZeroSearch: Alibabas Revolution für effizientes und autonomes KI-Training

Letzte Aktualisierung: Mai 12 2025
  • ZeroSearch reduziert die Kosten für das Training von KI-Modellen durch simulierte Suchvorgänge erheblich und macht die Abhängigkeit von externen Suchmaschinen überflüssig.
  • Es verwendet ein überwachtes Verstärkungslernsystem, das die Erinnerungs- und Denkfähigkeiten von LLMs verbessert.
  • Es ermöglicht Unternehmen und Entwicklern, fortschrittliche Modelle kostengünstig zu trainieren und dabei Autonomie und Kontrolle über den Prozess zu erlangen.

Was ist ZeroSearch, künstliche Intelligenz

Die Innovationen im Bereich der künstlichen Intelligenz haben in den letzten Jahren explosionsartig zugenommen, insbesondere im Zusammenhang mit großen Sprachmodellen (LLMs). Einer der bedeutendsten Durchbrüche des Jahres 2025 war ZeroSearch, eine von Alibaba entwickelte Technologie, die die Grundlagen der Schulung dieser Modelle erschüttert. Worum genau geht es bei ZeroSearch und warum sorgt es in der Branche für so viel Aufsehen? In diesem Artikel werfen wir einen detaillierten Blick auf diese neue Methodik, einschließlich ihrer Funktionsweise, ihrer Vorteile gegenüber herkömmlichen Methoden und wie sie die Entwicklung der KI auf allen Ebenen verändern kann.

In Tech-Kreisen ist es in aller Munde: ZeroSearch verspricht, die Trainingskosten von KI-Modellen um sage und schreibe 88 Prozent zu senken.. Dieser Effizienzsprung ist weit mehr als nur ein Marketing-Gag, sondern hat tiefgreifende Auswirkungen auf große und kleine Unternehmen, Entwickler und natürlich auf die Weiterentwicklung der künstlichen Intelligenz im Allgemeinen.

Was ist ZeroSearch und woher kommt es?

ZeroSearch ist eine neue, auf bestärkendem Lernen basierende Technik, die zum Trainieren von Sprachmodellen entwickelt wurde, ohne während des Trainingsprozesses auf echte externe Suchmaschinen angewiesen zu sein. Diese Innovation stammt aus dem Tongyi-Labor von Alibaba und zielt darauf ab, zwei häufige Probleme beim Training von KI-Modellen zu lösen, die Websuchen verwenden: die hoher volkswirtschaftlicher Aufwand für die Nutzung von APIs und die Unvorhersehbarkeit in der Qualität der wiederhergestellten Dokumente.

Bislang war für die Entwicklung fortschrittlicher Assistenten, Chatbots oder Empfehlungsmaschinen das Senden von Zehntausenden von Anfragen an Suchmaschinen wie Google über kostenpflichtige Dienste erforderlich. Dies erhöhte die Kosten und schränkte die Skalierbarkeit ein, insbesondere für Unternehmen mit knappen Budgets.

ZeroSearch ändert die Spielregeln, indem es auf ein System setzt, in dem Der LLM selbst lernt, den Betrieb einer Suchmaschine zu simulieren, wodurch relevante oder auch verrauschte (irrelevante) Dokumente als Antwort auf Abfragen generiert werden und so Schulungen ohne externe Interaktion ermöglicht werden.

So funktioniert ZeroSearch in der KI

Wie funktioniert ZeroSearch? Detaillierte technische Erklärung

Das Herzstück von ZeroSearch ist ein Framework für bestärkendes Lernen (RL), das die Notwendigkeit tatsächlicher Websuchen während des Trainings überflüssig macht. Sehen wir uns diesen Prozess Schritt für Schritt an, basierend auf dem Ansatz von Alibaba und den umfangreichen veröffentlichten Analysen der Technik.

  Gemini God Mode: Googles fortschrittlichste Funktion ist da

1. Leichtgewichtige, überwachte Optimierung zur Simulation von Suchvorgängen

Alles beginnt mit einem überwachte Feinabstimmung (SFT) in dem das LLM darauf trainiert wird, sich als Informationsabrufmodul zu verhalten. Durch diese Anpassung lernt es, Antwortdokumente für Abfragen zu generieren und dabei den Textstil und die Art des Inhalts nachzuahmen, den eine echte Suchmaschine anbieten würde. Während dieser ersten Phase werden Interaktionsverläufe zwischen dem Modell und einer Suchmaschine erfasst, wodurch Aufzeichnungen der Abfragen und abgerufenen Dokumente erstellt werden.

Erfolgreiche Pfade, also solche, die zur richtigen Antwort führen, werden als positiv gekennzeichnet (nützliche Dokumente), während solche, die zu Fehlern oder falschen Antworten führen, als negativ markiert werden (störende Dokumente). Diese Differenzierung hilft dem Modell später, die Dynamik einer realistischen Suche zu verstehen und zu reproduzieren, einschließlich relevanter und weniger nützlicher Ergebnisse.

2. Rolle des bestärkenden Lernens bei der Lehrplansimulation

Nach der überwachten Feinabstimmung geht das Modell in die Phase des Verstärkungstrainings über, in der bewährte Vorgehensweisen verstärkt und Fehler bestraft werden. Dabei fungiert das simulierte LLM selbst als Suchmaschine, die auf vom Richtlinienmodell generierte Abfragen reagiert und Dokumente zurückgibt, die nützlich oder problematisch sein können.

Der Schwierigkeitsgrad des Modells steigt schrittweise an, wobei eine curriculare Strategie verfolgt wird, die die Qualität der erstellten Dokumente langsam verschlechtert, so dass Das System lernt zunächst in kontrollierten Umgebungen und wird im weiteren Verlauf mit zunehmend lauteren oder komplexeren Beispielen konfrontiert.. Dieser Ansatz hilft dem Modell, unter realistischen Bedingungen robuste Such- und Argumentationsfähigkeiten zu entwickeln.

3. Gestaltung von Belohnungen und Bewertungsmetriken

Um das Lernen zu steuern, verwendet ZeroSearch eine Funktion von Belohnung basierend auf dem F1-Score, das Präzision und Rückruf ausgleicht, indem es die Wortübereinstimmung zwischen der Vorhersage und der richtigen Antwort berücksichtigt. Das Ziel besteht darin, die Genauigkeit der endgültigen Antworten, die das Modell generieren kann, zu maximieren, ohne sich übermäßig um die Formatierung zu kümmern, da LLMs in der Regel von Natur aus gut formatierte Texte produzieren.

4. Mehrstufige Interaktions- und Argumentationsvorlagen

Während des Trainings werden Interaktionsvorlagen verwendet, die den Prozess in drei Phasen unterteilen: interne Argumentation (getrennt zwischen Tags wie <think>...</think>), Durchführung der Beratung (<search>...</search>) Und Antwortgenerierung (<answer>...</answer>). Dadurch verbessert das Modell seine Fähigkeit, relevante Anfragen zu formulieren und fundierte Antworten zu liefern.

5. Kompatibilität und Skalierbarkeit

ZeroSearch unterstützt wichtige Sprachmodelle wie die Qwen-2.5-Familie, Qwen-2.5, LLaMA-3.2 und Basis- oder anweisungsoptimierte Varianten. Darüber hinaus kann es mit verschiedenen Verstärkungsalgorithmen (u. a. PPO, GRPO) implementiert werden, was seine Übernahme in verschiedene Entwicklungsumgebungen erleichtert.

  Künstliche Intelligenz im Marketing und die Entwicklung der Suchmaschinenoptimierung

ZeroSearch-Anwendungen und -Ergebnisse

Daten aus der Praxis: Wie viel spart ZeroSearch und wie ist die Leistung?

Von Alibaba durchgeführte und in Fachpublikationen und Datenbanken veröffentlichte Experimente zeigen, dass ZeroSearch eine Leistung erreicht, die mit der Leistung echter kommerzieller Suchmaschinen vergleichbar oder sogar besser ist.. Besonders hervorzuheben sind die Kosteneinsparungen:

  • Die Durchführung von 64.000 Abfragen mit der Google Search API kann etwa kosten Dollar 586,70 (ca. 540 €).
  • Das gleiche Abfragevolumen, generiert und verwaltet mit einem 14.000 Milliarden Parameter umfassenden LLM unter Verwendung von ZeroSearch, reduziert die Kosten auf nur Dollar 70,80 (ca. 65 €).
  • Dieses Differenzial impliziert eine 88 % Einsparungen bei den Schulungskosten, wodurch die Abhängigkeit von externen APIs beseitigt und eine größere Skalierbarkeit ermöglicht wird.

Andererseits sind die Qualitätsergebnisse beeindruckend: Experimente zeigen, dass ein Abrufmodul mit 7 Milliarden Parametern die Leistung von Systemen erreicht, die auf der Google-Suche basieren, während das Modell mit 14 Milliarden Parametern diese bei Frage-und-Antwort-Aufgaben sowohl bei Single-Hop- als auch bei komplexen Inferenz-Datensätzen sogar übertrifft.

Wichtige Vorteile und Auswirkungen auf die künstliche Intelligenzbranche

Die Einführung von ZeroSearch stellt einen radikalen Wandel in der Art und Weise dar, wie Unternehmen und Entwickler an das Training fortgeschrittener Modelle herangehen können.:

  • Drastische Reduzierung der wirtschaftlichen Barriere: Erleichtert KMU, Startups und unabhängigen Entwicklern den Zugang zu fortschrittlichen KI-Techniken, die bisher durch die Kosten kommerzieller APIs zurückgehalten wurden.
  • Mehr Kontrolle über das TrainingDurch die Generierung simulierter Dokumente können Teams genau definieren, welche Informationen das Modell erhält, und den Schwierigkeitsgrad und die Qualität an ihre Bedürfnisse anpassen.
  • Stärkung der technischen Autonomie: Minimiert die Abhängigkeit von großen ausländischen Technologieplattformen und fördert die lokale Entwicklung maßgeschneiderter KI-Lösungen.
  • Anpassungsfähigkeit und ModularitätZeroSearch kann auf einer Vielzahl von Modellen eingesetzt und an unterschiedliche Arbeitsabläufe und Geschäftsanforderungen angepasst werden.

Unterschiede zu bisherigen Strategien: RAG, reale Suche und Simulation

Vor ZeroSearch war die gängigste Lösung zur Bereitstellung aktueller und genauer Informationen für LLMs die Verwendung von RAG (Retrieval-Augmented Generation), bei der das Modell externe Quellen mithilfe realer Suchvorgänge abfragt. Dies bringt jedoch einige offensichtliche Probleme mit sich:

  • Hohe Kosten: Die fortgesetzte Nutzung von APIs kann die Budgets in die Höhe treiben.
  • Variable Qualität: Abgerufene Dokumente können je nach Suchvorgängen und der API selbst sehr inkonsistent sein.
  • Rechtliche und datenschutzrechtliche Einschränkungen: Sich auf Dienste Dritter zu verlassen, birgt rechtliche und politische Risiken, insbesondere wenn Sie mit vertraulichen Informationen trainieren.

ZeroSearch macht die ständige Bezugnahme auf externe Quellen überflüssig und ermöglicht es dem Modell, die Suche „in sich selbst“ zu erlernen, während es die Erfahrung der Interaktion mit einer Suchmaschine simuliert.

  Sora AI: Erstellen von Videos mit Text

Auswirkungen und Anwendungen im realen Leben: Von Quark bis zur Demokratisierung der KI

Alibaba hat ZeroSearch bereits in kommerzielle Produkte integriert. Ihre Quark-Anwendung, die auf Qwen-Modellen basiert, konnte dank dieser Technik erhebliche Verbesserungen bei der Argumentation und präzisen Beantwortung komplexer Anfragen erzielen. Aber das Wichtigste ist vielleicht, dass ZeroSearch ermöglicht kleineren Unternehmen die Entwicklung eigener fortschrittlicher Modelle, ohne dass hierfür eine teure externe Infrastruktur erforderlich ist..

manus ia-0
Verwandte Artikel:
Alles, was Sie über Manus wissen müssen, den KI-Agenten, der Ihre Arbeit erledigen möchte

Die Forschungsgemeinschaft hat Zugriff auf das Code-Repository, die Datensätze und die vortrainierten Modelle sowohl auf GitHub als auch auf Hugging Face, was die weltweite Akzeptanz und das Experimentieren fördert.

Wie wird die Zukunft des KI-Trainings dank ZeroSearch aussehen?

Mit der Weiterentwicklung dieser Techniken werden wir eine zunehmende Verbreitung intelligenter Assistenten mit erweiterten Suchfunktionen erleben, ohne auf Google, Bing oder ähnliche Dienste angewiesen zu sein. Dies eröffnet neue Möglichkeiten in den Bereichen Bildung, Wirtschaft und Forschung und könnte gleichzeitig die Dominanz der großen Suchmaschinen im Bereich der künstlichen Intelligenz untergraben.

Für Spanien und Europa bedeutet dies die Möglichkeit eines autonomen Wachstums, einer geringeren technologischen Abhängigkeit und geringeren Kosten sowie einer größeren strategischen Kontrolle über kritische Informationssysteme.

Der Aufstieg von ZeroSearch markiert den Beginn einer neuen Ära, in der das Trainieren von KI-Modellen kein Luxus mehr ist, der nur wenigen Auserwählten zur Verfügung steht, sondern zu einem zugänglichen, skalierbaren und zunehmend ausgefeilteren Werkzeug wird. Indem Alibaba der KI beibringt, zu suchen, ohne ihre eigene Umgebung zu verlassen, hat das Unternehmen einen riesigen Schritt in Richtung der Entwicklung autarker, effizienter Systeme gemacht, die sich an alle Anforderungen anpassen.. Es geht nicht mehr nur darum, Kosten zu senken, sondern die Spielregeln für die gesamte Branche der künstlichen Intelligenz neu zu erfinden.

Was ist E-Commerce?
Verwandte Artikel:
Was ist E-Commerce: 10 Schlüssel zum Verständnis des elektronischen Handels