- Sora 2 liefert synchronisiertes Video und Audio mit größerem physischen Realismus und Multi-Shot-Kontinuität.
- Die soziale iOS-App ermöglicht verifizierte Cameos, Remixe und einen anpassbaren Feed.
- In den USA/Kanada auf Einladung verfügbar; in Spanien gibt es Methoden zur Installation und Verwendung mit einem VPN.
In den letzten Wochen drehte sich alles um Sora 2, das Das neue Audio-Video-Modell von OpenAI und eine soziale App, die audiovisuelle Kreationen so unmittelbar wie das Schreiben eines Textes machen soll. Jenseits des Hypes sprechen wir von einem Vorschlag, der die Bild-, Bewegungs- und Tonerzeugung aus einer einzigen Eingabeaufforderung heraus integriert, mit einer sozialen Ebene, die zum Erstellen und Remixen von Clips im Stil von Kurzvideoplattformen entwickelt wurde.
In den nächsten Zeilen finden Sie Was ist Sora 2, wie funktioniert es und welche Verbesserung bietet es gegenüber Sora 1?, wie die Einführung voranschreitet (einschließlich des Status in Spanien), was die neue iPhone-App enthält, wie Sie Cameos mit Ihrem Gesicht und Ihrer Stimme konfigurieren und welche Einschränkungen und Sicherheitsmaßnahmen angekündigt wurden. Wir überprüfen auch die Zugriffswege vom US/Kanada-App-Store zur Verwendung mit VPNs im Internet und erwähnen Integrationen von Drittanbietern.
Was ist Sora 2 und wie funktioniert es?
Sora 2 ist beides ein Machine-Learning-Modell und eine ProduktebeneDas Modell wandelt Textbeschreibungen – und optional Quellbilder – in kurze Videos mit synchronisiertem Ton um; der Produktteil umfasst eine Website und, was am wichtigsten ist, eine Social-App für iOS, mit der Sie Inhalte erstellen, teilen und remixen können.
Wenn Sie von ChatGPT oder DALL·E kommen, ist Ihnen die Idee bekannt: Sie schreiben, was Sie möchten, und die KI interpretiert es in natürlicher Sprache.Das Besondere an Sora 2 ist, dass die Bild- und Audioclips im selben Prozess erstellt werden, sodass die Lippensynchronisation und die mit dem Gesehenen verbundenen Soundeffekte (Schritte, zuschlagende Türen, Atmosphäre) bereits aufeinander abgestimmt sind.
Die technische Basis verfügt über eine Simulation der plausibelsten WeltHöhere Objektpermanenz, konsistente Beziehungen zwischen Elementen innerhalb der Szene und Respekt für plausible physikalische Dynamik. Dies führt zu natürlicheren Bewegungen und weniger ungewöhnlichen Artefakten im Vergleich zur ersten Generation.
Zusätzlich zum Starten von Text von Grund auf ermöglicht das System aus einem Bild und erstellen Sie daraus eine animierte Aufnahme. Und mit der Cameo-Funktion können Sie Ihr eigenes Gesicht und Ihre verifizierte Stimme als Star im Video hinzufügen und so benutzerdefinierte Clips erstellen, ohne dass herkömmliche Dreharbeiten erforderlich sind.
Neue Funktionen und Verbesserungen im Vergleich zu Sora 1
Die vorherige Version überraschte bereits durch die Qualität der Einzelbilder, aber es gelang nicht, die Konsistenz und Bewegungsphysik beizubehalten. Sora 2 macht in drei wichtigen Bereichen einen großen Sprung nach vorne: Bewegungsrealismus, Kontinuität von Einstellung zu Einstellung und synchronisierter nativer Ton.
In Bezug auf Realismus und Physik respektiert das Modell besser Impuls, Kollisionen, Auftrieb und Reibung, sodass Aktionen wie Springen, Rückwärtssaltos auf einem Paddleboard oder das Aufprallen eines Basketballs glaubwürdig wirken. Während Sora 1 Objekte „teleportieren“ oder Flugbahnen unterbrechen konnte, kommt die neue Version dem Verhalten in der realen Welt näher.
In der Multi-Shot-Konsistenz behält Sora 2 Objekte, Charaktere und Stile über mehrere Ebenen hinweg, unterstützt komplexe Befehle und führt Kamerabewegungen und Bildausschnitte mit größerer Genauigkeit aus. Dies ermöglicht Sequenzen mit kleinen Handlungssträngen und Übergängen, ohne dass dabei wichtige Elemente verloren gehen.
Audio kommt jetzt nativ an: Dialoge, Geräuschemacher und Ambiente Sie werden zusammen mit dem Video generiert. Sie können ein Skript in Ihre Eingabeaufforderung einfügen, sodass eine Figur „spricht“ und der Clip mit lippensynchronen Klanglandschaften und entsprechend abgestimmten Effekten ausgegeben wird.
Schließlich ist die stilistische Bandbreite größer. Sie können fragen Fotorealismus, Kinematographie, Anime-Ästhetik oder andere Varianten, und das System versteht diese Nuancen besser, um die Ästhetik an Ihre Beschreibung anzupassen.
Cameos: Ihr Gesicht und Ihre Stimme in Videos
Eine der Hauptfunktionen sind Cameos. In der App richten Sie Ihren Cameo mit einem Schnellkontrolle durch Zahlenlesen und Kopfdrehen um Gesichtszüge und Stimme zu erfassen. Mit diesem Material kann Sora 2 Sie als Protagonisten generierter Szenen einfügen, ohne komplizierte Modelle trainieren oder LoRAs verwenden zu müssen.
Das Tool beinhaltet Zustimmungskontrollen: Du entscheidest, ob die Inhalte nur für dich, freigegebene Freunde, deine gesamte Freundesliste oder die gesamte Community bestimmt sind. Du kannst den Zugriff auch später widerrufen oder Videos löschen, in denen du zu sehen bist. Das ist wichtig, um unerwünschte Nutzung zu verhindern.
Das soziale Phänomen ließ nicht lange auf sich warten. Sam Altmans öffentlicher Cameo-Auftritt hat eine memetische Welle ausgelöst mit humorvollen Remixen; die Plattform ermöglicht es einer einzelnen Generation, mehrere Cameos zu präsentieren, sodass Sie sich für gemeinsame Sketche mit anderen Leuten in derselben Szene austauschen können.
Auf praktischer Ebene erfolgt die Erzeugung ein paar Minuten pro ClipSie können mehrere Clips gleichzeitig starten, und es gibt tägliche Limits (Benutzererfahrungen zufolge bis zu 100 pro Tag). Derzeit sind typische Clips etwa neun Sekunden lang und das Format kann Hochformat oder Breitbild sein, je nachdem, was Sie in der Eingabeaufforderung angeben.
OpenAI begleitet das Modell mit einem Social-App für das iPhone Der Feed erinnert an TikTok: ein Karussell aus Videos, Kommentaren, Likes und nativen Remixen. Im Gegensatz zu anderen Netzwerken zeigt die Standardbeschreibung die ursprüngliche Eingabeaufforderung an, wodurch das Lernen und Replizieren von Ideen erleichtert wird.
Die App enthält einen Selektor von „Stimmung“, um anzupassen, was Sie sehen möchtenOpenAI behauptet, dass seine Empfehlungsalgorithmen mit natürlicher Sprache konfiguriert werden können. Um Doomscrolling zu vermeiden, priorisiert das Unternehmen nach eigenen Angaben die Erstellung gegenüber dem Konsum, mit regelmäßigen Umfragen zum Wohlbefinden und Optionen zur Anpassung des Feeds.
In Ton und Geist beschreiben viele Benutzer die Erfahrung als eine Vines Rückkehr zur AgilitätSchnelle Clips, direkter Humor und weniger Perfektionsdruck. Es gibt auch Möglichkeiten, Videos anderer zu „remixen“ und Memes mit Variationen zu erweitern, was den kreativen Prozess beschleunigt.
Es treten jedoch Probleme mit dem geistigen Eigentum auf. Die App blockiert die Generierung geschützte Zeichen direkt (Die Simpsons, Dragon Ball usw.), obwohl einige versuchen, Filter mit alternativen Wörtern zu umgehen. Die Grenze zwischen inspirierten Stilen und der Verwendung urheberrechtlich geschützter Charaktere wird genau geprüft, und das Unternehmen verstärkt die Mäßigung und Begrenzung.
Verfügbarkeit, Länder und was in Spanien passiert
Zum Zeitpunkt der Veröffentlichung ist Sora 2 in Testphase nur auf Einladung und zunächst in den USA und Kanada erhältlich. Es gibt weder für Spanien noch für die endgültige Version, die ohne Einladung geöffnet wird, einen offiziellen Veröffentlichungstermin.
La Sora-App für iOS Die App ist derzeit nur in den App Stores der USA und Kanadas verfügbar. Die Web-Funktion ist vorhanden, für einige beliebte Funktionen – wie das Einrichten von Cameos – ist jedoch – zumindest derzeit – die iPhone-App erforderlich.
Der Service startet kostenlos, aber mit variable Limits je nach Bedarf (verfügbare Rechenkapazität). Wenn Sie einen kostenpflichtigen ChatGPT-Plan haben, erhalten Sie vorrangigen Zugriff, eine höhere Bildqualität und weniger Einschränkungen. Diese Details können sich jedoch mit zunehmender Skalierung der Bereitstellung ändern.
So laden Sie die App auf das iPhone herunter, wenn Sie in Spanien sind
Es gibt eine Methode, die App ohne VPN zu installieren, wenn Sie sich in Spanien befinden: Verwenden Sie ein Apple-Konto aus den USA oder KanadaSie verlieren Ihre Daten nicht und können nach dem Download zu Ihrem regulären Konto zurückkehren. Sie müssen die Aktualisierung jedoch über Ihr nordamerikanisches Konto durchführen.
- Gehen Sie zur Apple-ID-Website (appleid.apple.com/account) und Ein Konto erstellen mit Ihren echten Daten.
- Wählen Sie im Feld Land oder Region USA oder Kanada.
- Füllen Sie das Captcha aus und Die Schöpfung endet.
- Öffnen Sie auf Ihrem iPhone den App Store, melden Sie sich ab und Melden Sie sich mit dem neuen Konto an. Suchen Sie nach „Sora by OpenAI“ und laden Sie es herunter.
Nach der Installation können Sie zu Ihrem spanischen Konto zurückkehren. Die App funktioniert weiterhin; Wenn Sie auf „Aktualisieren“ tippen, wird der Kontowechsel wiederholt. Beachten Sie, dass Sie für die Nutzung von Sora 2 eine aktive Einladung benötigen.
Wenn Sie den Browser bevorzugen, Webversion von Sora Außerdem ist eine Einladung erforderlich. Für Nutzer außerhalb der Einführungsländer ist die Nutzung eines VPN mit einem Server in den USA oder Kanada erforderlich. Ohne dieses VPN ist der Zugriff auf die erste Version des Modells Berichten zufolge eingeschränkt.
Melden Sie sich mit Ihrem OpenAI/ChatGPT-Konto an und prüfen Sie, welche Funktionen verfügbar sind. Für den Moment, Cameos werden in der iOS-App konfiguriert, daher fehlen dem Web wichtige Elemente der sozialen Erfahrung, was sich nach Abschluss der Einführung ändern könnte.
Preise, Limits und die Erwähnung von „Sora 2 Pro“
OpenAI positioniert Sora 2 als Dienst mit eingeschränkte kostenlose Nutzung und Premium-Optionen an ihre Abonnementpläne gebunden. Eine Sora 2 Pro-Variante wurde für Entwickler erwähnt, die eine höhere Auflösung und Laufzeit wünschen, integriert mit ChatGPT Pro und mit einer Zahlungs-API auf dem Weg.
Die analysierten Quellen sprechen von vorrangiger Zugang für Abonnenten und eine zukünftige API mit Abrechnung pro Clip oder pro Sekunde, wobei zum Zeitpunkt der Ankündigung noch keine offiziellen Tarife angegeben waren. Es wird auch auf ChatGPT Pro als experimentellen Zugriffspfad verwiesen, da die Web-App in dieses Ökosystem integriert wird.
Außerhalb des offiziellen Kanals versichern einige Drittanbieter – wie CometAPI – Sora 2-Kompatibilität über API im Rahmen eines Pay-per-Use-Modells (angegeben mit 0,16 $ pro Ausführung mit Streaming) und zeigen Beispiele für die Ausführung von Chat-Anfragen an einem einheitlichen Endpunkt. Wenn Sie Entwickler sind, überprüfen Sie immer die Bedingungen und Beschränkungen, bevor Sie Dienste von Drittanbietern integrieren.
curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: sk-XXXX' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "sora-2",
"stream": true,
"messages": [{"role": "user", "content": "Generate a cute kitten sitting on a cloud, cartoon style"}]
}'
In Bezug auf die Leistung gibt es Zeugenaussagen unter Berufung auf Clips von bis zu 10 Sekunden mit perfekter Audio-Video-Synchronisation und Verbesserungen im Vergleich zu Alternativen wie dem Veo 3 in bestimmten Szenen. Diese Angaben können je nach Verfügbarkeit, Kostenkontrolle und Modellentwicklung variieren.
Einschränkungen, Sicherheit und geistiges Eigentum
OpenAI hat Sicherheits- und Moderationskontrollen: Standardlimits für Teenager, Tools zum Anpassen der Personalisierung, Belästigungserkennung, menschliche Moderation und Optionen zur Kindersicherung in den ChatGPT-Einstellungen (Nutzungszeiten, Personalisierung deaktivieren, Direktnachrichten moderieren).
Das Unternehmen behauptet, über Mechanismen zu verfügen, um Personen des öffentlichen Lebens einschränken und explizite Inhalte blockieren. Auch Liveness-Checks für Cameos, Metadaten oder Wasserzeichen werden erwähnt, sowie Optionen zum Widerruf der Verwendung Ihres Bildes, alles mit dem Ziel, Identitätsdiebstahl und Missbrauch zu verhindern.
Im Copyright-Feld versucht die App zu filtern Charaktere mit geschützten Rechten; dennoch suchen einige Benutzer nach Schlupflöchern mit alternativen Bedingungen. Das Problem wird von Urheberrechtsinhabern geprüft, und OpenAI sieht sich bereits mit Rechtsstreitigkeiten wegen des Trainings mit geschützten Inhalten konfrontiert, sodass mit ständigen Anpassungen zu rechnen ist.
Sora 2 sollte nicht dort eingesetzt werden, wo es erforderlich ist eindeutige sachliche RichtigkeitEs handelt sich um ein generatives System: Es kann plausible Details erfinden und sollte daher in sensiblen Berichtskontexten oder bei rechtlichen Anforderungen als kreatives Unterstützungstool und nicht als Ersatz behandelt werden.
Benutzererfahrung und Remix-Kultur
Das Gefühl, das der erste Feed vermittelt, ist von Leichtigkeit und Humor: Witzige Schnitte, absichtlich peinliche Stille oder Blicke in die Kamera, die das Model auch ohne explizite Anfrage einfügt, wenn sie zum komödiantischen Effekt beitragen. Dieses Feintuning steigert das virale Potenzial kurzer Sketche.
Die App erleichtert kreative Nachahmung mit standardmäßig sichtbaren Remix-Funktionen und Eingabeaufforderungen. Dies beschleunigt das gemeinsame Lernen und fördert die Ideenentwicklung in einer Kette mit minimalen Variationen, was wir bereits bei anderen Kurzvideoformaten erfolgreich gesehen haben.
Manche beschreiben Sora als „Dart“ gegen Meta, das Vibes startete, sein Netzwerk selbst erstellter Clips mit kreativem/künstlerischem Geist. Der Ansatz von OpenAI ist respektloser und zugänglicher und versucht, das Schaffen wichtiger zu machen als den passiven Konsum, um der Ermüdung durch endloses Scrollen entgegenzuwirken.
Wettbewerb und Panorama
Der Sektor entwickelt sich rasant. Google treibt mit Veo 3 und Creator-Tools auf YouTube; Meta entwickelt sich mit Vibes weiter; TikTok verfolgt restriktivere Richtlinien für KI-Videos zu sensiblen Themen. Der Kampf könnte sich auch auf die Monetarisierung verlagern und darum, wer diese Funktionen am besten in reale Arbeitsabläufe integriert.
Parallel dazu gibt es eine grundlegende Debatte über Schulung mit bestehenden Inhalten (Fernsehsendungen, Plattformvideos usw.). Einige Veröffentlichungen weisen darauf hin, dass sogar Artikel wie dieser zum Trainieren zukünftiger Modelle verwendet werden könnten, wobei der Schwerpunkt auf Vereinbarungen, Lizenzen und Transparenz liegen könnte.
Im Apple-Ökosystem wurden verwandte Ressourcen zitiert, wie beispielsweise Image Playground um Bilder und allgemeinere Inhalte zu Apps und Spielen zu generieren, die den kreativen Kontext auf iOS definieren. Die wachsende Rolle von YouTube innerhalb der Google-Suchmaschine wird ebenfalls diskutiert und zeigt, wie Videos zu einem zentralen Knotenpunkt für Entdeckungen werden.
Ideale Anwendungsfälle … und wann man sie nicht verwenden sollte
- Kurzes Social-Video: schnelle Iteration, Remix-Kultur und Cameos für virale Clips.
- Prototyping für Film, Werbung oder Spiele: Visuelle und animierte Mockups mit stimmigem Audio.
- Bildungs- und Marketinganimationen: Erzählung abgestimmt auf visuelle Elemente und Ton.
- Kleine Studios und Schöpfer: ausgefeilte Ergebnisse ohne großes Budget.
- Großformat und präzise VFX: Bild-für-Bild-Steuerung, die herkömmlichen Pipelines sogar überlegen ist.
- Kontexte, die sachliche Genauigkeit erfordern: Das Modell kann plausible, aber fehlerhafte Details erfinden.
Betrachtet man das Ganze, Sora 2 bringt die Idee wie nie zuvor in den letzten Clip.: Beschreiben Sie die Szene, fügen Sie Stil hinzu, fügen Sie Ihren Cameo-Auftritt ein und erstellen Sie ein Video mit synchronisiertem Ton, das Sie teilen oder remixen können. Es gibt noch viel zu optimieren – von der weltweiten Verfügbarkeit bis hin zu Lizenzierung und Kosten – aber das kreative und soziale Potenzial, das bereits in diesem frühen Stadium erkennbar ist, erklärt, warum so viele Menschen es unbedingt ausprobieren möchten.
Inhaltsverzeichnis
- Was ist Sora 2 und wie funktioniert es?
- Neue Funktionen und Verbesserungen im Vergleich zu Sora 1
- Cameos: Ihr Gesicht und Ihre Stimme in Videos
- Die neue Social-App Sora
- Verfügbarkeit, Länder und was in Spanien passiert
- So laden Sie die App auf das iPhone herunter, wenn Sie in Spanien sind
- Zugriff über den Browser und auf dem Mac
- Preise, Limits und die Erwähnung von „Sora 2 Pro“
- Einschränkungen, Sicherheit und geistiges Eigentum
- Benutzererfahrung und Remix-Kultur
- Wettbewerb und Panorama
- Ideale Anwendungsfälle … und wann man sie nicht verwenden sollte