OpenAI hat in seinem Produktportfolio für 2026 von einem einzigen ChatGPT auf 7 Produktachsen expandiert: Sprachmodelle (GPT-5,5-Serie), Programmier-Agents (Codex), Videogenerierung (Sora 2), Browser-Agents (Operator), Bildgenerierung (gpt-image-1), Spracherkennung (Whisper) und Vektor-Embeddings (Embeddings). Dieser Artikel ordnet jede Produktlinie nach Positionierung, Preis, Anwendungsfällen und Abo-Stufen zu – damit du keine einzelnen offiziellen Dokumente von OpenAI lesen musst, um innerhalb von 5 Minuten zu wissen, wie viel du zahlen musst und was du nutzen kannst.

OpenAI Produktlinien – komplette Übersicht (Stand: Mai 2026, aktuellste Version)

Produkt Typ Zweck Beschaffungsweg GPT-5,5-Serie Sprachmodell Schreiben, Forschung, Programmierung, Schlussfolgern ChatGPT App, API Codex Programmier-agent Code schreiben, Codebase ändern, Shell ausführen Codex App (Desktop), CLI, IDE-Integration Sora 2 Videogenerierung Kurzfilme, Werbung, visuelle Inhalte Sora-Website, ChatGPT-Integration Operator Browser-agent Webseiten bedienen, Termine buchen, einkaufen, Formulare ausfüllen ChatGPT Pro integriert gpt-image-1 Bildgenerierung Produktbilder, Illustrationen, Community-Materialien ChatGPT integriert, API Whisper Spracherkennung Meeting-Transkriptionen, Untertitel, Spracheingabe API (nach Minuten abgerechnet) Embeddings Vektor-Embeddings RAG-Recherche, semantische Suche, Ähnlichkeit API (nach Token abgerechnet)

GPT-5,5-Serie: OpenAIs primäres Sprachmodell

GPT-5,5 ist das aktuelle Flaggschiff-Modell, das OpenAI am 24. April 2026 veröffentlicht hat. Die Serie ist in drei Stufen gegliedert:

GPT-5,5: Standardversion, als Voreinstellung im ChatGPT-Plus-Abo, API bereits verfügbar

GPT-5,5 Pro: Flaggschiffversion, exklusiv für ChatGPT Pro ($200/Monat), stark bei komplexen Schlussfolgerungsaufgaben gegenüber 5,5

GPT-5,5-mini: günstige Version, Einsatz bei großen API-Mengenaufgaben

Haupt-Upgrade von GPT-5,5: context von 200K auf 1M Token erhöht, Genauigkeit bei Agent-Aufgaben und Tool-Nutzung verbessert, Terminal-Bench auf 82,7% gebracht (OpenAI stärkster Benchmark für Agent-Aufgaben). Mehr dazu im abmedia-Artikel zum GPT-5,5-Launch.

Außerdem gibt es GPT-5.4-Cyber (Sicherheitsmodus, nur für verifizierte Verteidiger), alte GPT-4o- und GPT-4-Turbo-Modelle sind weiterhin per API auswählbar, sind aber nicht mehr die Voreinstellung. Neue Projekte sollten direkt die 5,5-Serie nutzen, ohne alte Versionen vorzuhalten.

Codex: OpenAIs Programmier-Agent

Codex ist ein Programmier-agent, den OpenAI für Entwickler gebaut hat; die Ausrichtung ist ähnlich wie bei Anthropic’s Claude Code. Er kann lokale Dateien direkt lesen und schreiben, Shell-Befehle ausführen, GitHub für PRs ansteuern und mehrstufige Aufgaben zur Programm-Neustrukturierung bearbeiten.

Beschaffungswege von Codex:

Codex Desktop-App: macOS/Windows, mit grafischer Multi-Session-Ansicht parallel

Codex CLI: Terminal-Version, lässt sich in Shell-Skripte integrieren

IDE-Integration: als Erweiterung in VS Code und JetBrains-Reihen verfügbar

Die von Codex im Mai 2026 veröffentlichten Daten: Nach einer Woche Laufzeit verdoppelte sich die API-Umsatzwachstumsrate innerhalb der ersten Woche, und es ist die aktuell am schnellsten wachsende Produktachse von OpenAI (siehe Bericht vom 2.5.). Zu den jüngsten Updates gehören „Codex Pets“ (angepasste Sprite-Anzeige auf dem Desktop – beeinflusst nicht die Arbeit, erhöht aber das Gefühl der Immersion), Korrekturen am Verhalten von Goblin sowie ein Multi-Session-Management für Unternehmenskunden. Details siehe OpenAI Codex vollständiges Teaching-Pillar.

Sora 2: OpenAIs Videogenerierungsmodell

Sora 2 ist ein Videogenerierungsmodell, das OpenAI in der zweiten Hälfte 2025 veröffentlicht hat und 2026 bereits stabil an Nutzer von ChatGPT Plus und Pro ausliefert. Es kann aus Textbeschreibungen hochauflösende Kurzfilme mit 5 bis 60 Sekunden erzeugen, unterstützt Figurenbewegungen, Szenenwechsel sowie Kameraworkflow-Steuerung.

Zugriffsmöglichkeiten auf Sora 2:

Sora-spezifische Website: sora.openai.com, bietet eine vollständige Generierungsoberfläche und eine Materialbibliothek

ChatGPT-Integration: im Chat direkt prompten, um einen Kurzfilm zu generieren

API: Abrechnung nach generierten Sekunden und Auflösung (Details in OpenAIs Ankündigung)

In der Praxis besteht der Vorteil von Sora 2 darin, dass das Verständnis von „Text zu Video“-Anweisungen sehr hoch ist – bei komplexen Szenen (mehrere Figuren, Wechsel zwischen Innen- und Außenbereichen, spezifische Kamerabewegungen) ist die Trefferquote deutlich besser als bei der ursprünglichen Sora-Version. Nachteil: Bei langen Videos (über 60 Sekunden) gibt es gelegentlich Uneinheitlichkeiten bei der Figurenkonsistenz, und komplexe physische Interaktionen weisen weiterhin manchmal Brüche auf. Typische Szenarien von Nutzern in Taiwan: Kurzfilme für Community-Marketing, Produkt-Demos, Animations-Bodenvorlagen für Erklärvideos.

Operator: OpenAIs Browser-Agent

Operator ist ein Agent, den OpenAI für Browser-Automatisierung bereitstellt: Nutzer können Anweisungen geben, damit Operator Webseiten öffnet, Formulare ausfüllt, Termine bucht, einkauft, Daten abruft und anschließende Verarbeitung übernimmt. Operator ist im ChatGPT-Pro-Plan ($200/Monat) integriert, für Plus-Nutzer noch nicht verfügbar.

Typische Anwendungen:

„Hilf mir, nächsten Mittwoch um 19 Uhr in Taipeh Xinyi District ein französisches Restaurant zu buchen“ → Operator öffnet den Browser, sucht, bewertet, ruft an oder bucht

„Vergleiche die Preise für 5 Nächte im nächsten Monat für diese 3 Hotels und stelle sie als Tabelle zusammen“ → Operator ruft bei Booking, Agoda und den offiziellen Websites einzeln nach

„Ändere in AWS diese Einstellungen für den S3-Bucket so, dass nur bestimmte IPs erlaubt sind“ → Operator führt die Aktion in der Konsole aus

Unterschied zwischen Operator und Codex: Codex bearbeitet Code und Dateien, Operator bedient „Webseiten und Formulare“. Für Nicht-Engineering-Nutzer ist Operator die intuitivere Automatisierungsoption; für Entwickler bleibt Codex das primäre Werkzeug zum Programmieren.

gpt-image-1, Whisper, Embeddings: API-Tools

Neben Consumer-Produkten stellt OpenAI drei API-Tools speziell für Entwickler bereit:

gpt-image-1 – das Bildgenerierungsmodell von 2026, ersetzt DALL-E 3 und wird zu OpenAIs neuem Hauptmodell. Es kann viele Größen wie 1024×1024, 1024×1792, 1536×1024 etc. erzeugen; Qualität und Konsistenz sind gegenüber DALL-E 3 verbessert. In ChatGPT kann es direkt in Gesprächen aufgerufen werden, in der API wird nach Anzahl der generierten Bilder abgerechnet. Die nächste Generation gpt-image-2 erscheint im April 2026 und erfordert eine Verifizierung über die OpenAI-Organisation, bevor sie via API genutzt werden kann; die in ChatGPT integrierte Version wird Abonnenten direkt bereitgestellt.

Whisper – Spracherkennungsmodell, unterstützt viele Sprachen (inkl. traditionellem Chinesisch und taiwanesischem Akzent), Abrechnung nach Minuten der Audiodaten. Praktische Anwendungen: automatische Transkription von Meetings, Podcast-Untertitel, Voice-to-text-Eingabetools. Whisper ist das einzige OpenAI-Produkt mit öffentlich verfügbaren Modellgewichten (zum Download für Selbsthosting), aber die Cloud-API liefert in der Praxis meist bessere Ergebnisse; außerdem kommt es mit automatischen Updates.

Embeddings – Vektor-Embedding-Modelle, die Text in hochdimensionale Vektoren umwandeln und für RAG (Retrieval-Augmented Generation), semantische Suche und Dokumentähnlichkeitsvergleiche genutzt werden. OpenAIs aktuell wichtigste Endpoints sind text-embedding-3-large und text-embedding-3-small. Für Entwickler, die einen unternehmensinternen Wissensspeicher aufbauen, Kundendienst-FAQ-Systeme entwickeln oder Dokumente klassifizieren müssen, sind Embeddings grundlegende Infrastruktur.

OpenAI-Abonnementstufen: Welche Produkte welche Pläne abdecken

Plan Monatliche Gebühr Hauptunterschied Free $0 GPT-5,5 eingeschränkt, kein Sora/Operator/Codex Pro Plus $20 GPT-5,5 vollständig, Sora 2, gpt-image-1, Codex Standardkontingent Pro $200 GPT-5,5 Pro, Operator, Codex hohes Kontingent, Prioritäts-Compute Team $25/Nutzer Unternehmenszusammenarbeit, Team-Wissensdatenbank, keine Modellentwicklung (kein Training) garantiert Enterprise Preisverhandlung mit SSO, SOC 2, Vertragsanpassungen, keine Kontingentgrenzen

Für Einzelpersonen sind $20 Plus mit hoher Wahrscheinlichkeit für die meisten Szenarien ausreichend – nur Entwickler mit Heavy-Use von Operator, Codex oder Bedarf an GPT-5,5 Pro müssen auf $200 Pro upgraden. Für Team- oder Unternehmensnutzer ist die „Daten werden nicht trainiert“-Garantie des Team-Plans in den meisten Compliance-Szenarien eine notwendige Voraussetzung.

Häufige Fragen FAQ

Muss man OpenAI unbedingt abonnieren? Was kann die kostenlose Version?

Nein. Die kostenlose Version kann GPT-5,5 nutzen (eingeschränkt), grundlegende Bildgenerierung sowie Spracheingabe. Sora, Operator, Codex sowie GPT-5,5 Pro benötigen ein Abo. Für die meisten Nutzer reicht $20 Plus.

Lohnt sich ChatGPT Pro für $200?

Kommt darauf an, wie du es nutzt: Wenn du täglich massenhaft programmierst (Codex Heavy-Use), du die stärkste Schlussfolgerungsleistung von GPT-5,5 Pro brauchst oder Operator für Automatisierung von Webarbeiten einsetzen musst – dann lohnt es sich. Für normales Schreiben, Recherchieren und Suchen von Nutzern ist $20 Plus bereits ausreichend.

OpenAI API vs ChatGPT-Abonnement – was ist günstiger?

API wird nach Token abgerechnet und eignet sich für Entwickler, die OpenAI in Programme integrieren möchten. ChatGPT-Abos werden als Monats-Flatrate mit Nutzungslimits verkauft und eignen sich für Nutzer, die „mit einer Chat-Oberfläche arbeiten“ möchten. Die meisten Menschen haben beides: Abonnement für ChatGPT, API für eigene Tools.

Kann man Sora 2 in Taiwan nutzen?

Ja. OpenAI hat in Taiwan keine Regionsbeschränkung, und die Zahlung wird per Kreditkarte unterstützt. Sora 2 ist in ChatGPT Plus und Pro verfügbar.

Welche ist besser: OpenAI Codex oder Anthropic Claude Code?

Beides hat Stärken. Codex integriert die OpenAI-Ökologie (Sora, gpt-image-1, Operator) umfassender; Claude Code wird bei CLI/Desktop-Multi-Session und beim strikten Befolgen von Anweisungen von Entwicklern häufig als erste Wahl genannt. Wenn das Budget es erlaubt, kannst du beide jeweils einen Monat testen und schauen, welche besser zu deinem Workflow passt. Details siehe ChatGPT vs Claude vs Gemini vollständiger Vergleich.

Was ist anders zwischen OpenAIs Operator und Anthropic-Agenten?

Operator ist auf Browserbedienung fokussiert (Webseiten, Formulare, Buchungen); das Ziel ist, Arbeiten zu ersetzen, bei denen jemand „vor dem Computer sitzt und mit der Maus klickt“. Anthropic verfolgt bei Agents die Richtung Claude Code und Mythos: erstere operiert auf Code und Dateien, letztere ist ein automatisierter Forschungs-agent im Stadium eines research previews. Die beiden Ansätze sind verschieden, und die tatsächliche Auswahl hängt davon ab, in welchen Arbeitskontexten du dich befindest.

Dieser Artikel OpenAI vollständiges Produktportfolio 2026: GPT-5,5, Codex, Sora, Operator, wie man Abos auswählt, erschien zuerst in 鏈新聞 ABMedia.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Kommentieren

0/400

Keine Kommentare