Der OpenAI Bildbearbeitungsdienst ermöglicht das Hochladen beliebig vieler Bilder und Anweisungen und gibt die bearbeiteten Bilder aus. Die Schnittstelle unterstützt derzeit gleichzeitigDocumentation Index
Fetch the complete documentation index at: https://docs.xhuoapi.ai/llms.txt
Use this file to discover all available pages before exploring further.
dall-e-2, gpt-image-1, das neueste gpt-image-2 sowie über dieselbe Schnittstelle angebundene Modelle der nano-banana / nano-banana-2 / nano-banana-pro Serie.
Dieses Dokument beschreibt hauptsächlich den Nutzungsprozess der OpenAI Images Edits API. Damit können wir die offizielle OpenAI Bildbearbeitungsfunktion einfach verwenden.
Beantragungsprozess
Um die OpenAI Images Edits API zu nutzen, können Sie zunächst auf der Seite OpenAI Images Edits API den Button „Acquire“ anklicken, um die für Anfragen benötigten Zugangsdaten zu erhalten:
Wenn Sie noch nicht eingeloggt oder registriert sind, werden Sie automatisch zur Login-Seite weitergeleitet, um sich zu registrieren und anzumelden. Nach der Anmeldung kehren Sie automatisch auf diese Seite zurück.
Bei der ersten Beantragung erhalten Sie ein kostenloses Kontingent, mit dem Sie die API kostenlos nutzen können.
GPT-Image-2 Modell
gpt-image-2 bietet im Bildbearbeitungsszenario gegenüber gpt-image-1 deutliche Verbesserungen:
- Stabilere Struktur: Beim Ändern von Skin, Farbgebung oder Hintergrund wird das Layout und die Komposition des Originalbildes kaum zerstört.
- Genauere Texterhaltung: Bei Infografiken, Postern, Menüs und anderen Bildern mit Text bleibt der Text nach der Bearbeitung klar und lesbar.
- Unterstützt direkte URL-Übergabe: Neben dem traditionellen Upload per
multipart/form-dataunterstütztgpt-image-2zusätzlich die Übergabe von Bild-URLs im JSON-Format, ohne dass das Bild vorher lokal heruntergeladen werden muss – ideal für serverseitige Pipelines. - Unterstützt hochauflösendes Neuzeichnen: Sie können ein 1K-Originalbild hochladen und über den Parameter
sizeeine 2K- oder 4K-Ausgabe anfordern; das Modell vergrößert das Bild während der Bearbeitung.
Unterstützte size Werte und Abrechnungsstufen
Die Beschränkungen für size im Bearbeitungs-API sind identisch mit denen der Generierungs-API – gpt-image-2 akzeptiert nur size als auto, leer oder im Format WIDTHxHEIGHT. Andere Werte führen zu einem 400 Fehler. Die Abrechnung erfolgt in zwei Stufen, unabhängig von der Originalauflösung, nur basierend auf dem angefragten size Wert:
- 1K Standardpreis: Beliebige 1K-Empfehlungsgrößen aus der Tabelle oder gängige 1K-Ausgabe-Aliase (
1254x1254,1672x941,941x1672). - Andere Stufen (1,5×): Empfohlene 2K / 4K Voreinstellungen aus der Tabelle sowie beliebige benutzerdefinierte
WIDTHxHEIGHTWerte.
| Seitenverhältnis | 1K (Standardpreis) | 2K Empfehlung (×1,5) | 4K Empfehlung (×1,5) |
|---|---|---|---|
| 1:1 | 1024x1024 | 2048x2048 | 2880x2880 |
| 4:3 | 1536x1024 | 2048x1536 | 3264x2448 |
| 3:4 | 1024x1536 | 1536x2048 | 2448x3264 |
| 16:9 | 1792x1024 | 2048x1152 | 3840x2160 |
| 9:16 | 1024x1792 | 1152x2048 | 2160x3840 |
Beispiel: Wenn das Originalbild1024x1024ist undsizeauf2048x2048gesetzt wird, zeichnet das Modell das Bild gemäß der Bearbeitungsanweisung neu und gibt ein 2K-Bild aus, das nach der „anderen“ Stufe abgerechnet wird; bei3840x2160wird ein 4K Querformat-Bild ausgegeben, ebenfalls nach „anderer“ Stufe abgerechnet; beiautooder leer erfolgt die Abrechnung zum 1K Standardpreis.
Zum ParameterIm Folgenden zeigen wir anhand zweier realer Beispiele aus unterschiedlichen Perspektiven die Bearbeitungsfähigkeiten vonnDiegpt-image-2Bearbeitungs-API unterstützt derzeit keinn > 1: Dieser Parameter wird stillschweigend ignoriert, egal obn=1odern=10übergeben wird, es wird immer nur ein Bild pro Anfrage zurückgegeben und nur für ein Bild abgerechnet. Wenn Sie mehrere Kandidatenbilder gleichzeitig erhalten möchten, müssen Sie mehrere Anfragen parallel senden. Diese Einschränkung gilt auch fürgpt-image-1/gpt-image-1.5sowie dienano-banana/nano-banana-2/nano-banana-proSerien.dall-e-2ist derzeit das einzige native Bearbeitungsmodell, dasn > 1unterstützt.
gpt-image-2.
Aufrufmethode 1: JSON + Bild-URL (empfohlen)
Senden Sie die Anfrage direkt alsapplication/json mit dem Feld image, das eine Bild-URL enthält. Das Modell lädt das Bild herunter und bearbeitet es gemäß dem prompt.
Zum Beispiel ist das folgende Originalbild eine mit gpt-image-2 generierte Infografik:


Hinweis: Das Feldimageunterstützt auch ein Array, z. B."image": ["url1", "url2", "url3"], mit bis zu 16 Referenzbildern, die das Modell bei der Bearbeitung berücksichtigen kann.
Aufrufmethode 2: JSON + mehrere Referenzbilder
gpt-image-2 unterstützt auch die gleichzeitige Referenzierung mehrerer Bilder zur Erzeugung des Endergebnisses, z. B. das Kombinieren mehrerer Produktfotos in einen Geschenkkorb:
Anwendungsbeispiel: Stilwechsel + Struktur erhalten
Hier ein weiteres Beispiel, bei dem ein hölzernes Bücherregal durch ein modernes schwebendes Regal ersetzt wird, dabei aber die Anzahl und Anordnung der Bücher auf jeder Ebene strikt erhalten bleibt. Originalbild (mitgpt-image-2 generiertes hölzernes Regal):

task_id: e9544dba-727e-44a2-81e1-223d49869380):

Aufrufmethode 3: multipart/form-data (kompatibel mit OpenAI SDK)
Wenn Sie bereits das offizielle OpenAI Python SDK verwenden, ist die bisherige Upload-Methode permultipart/form-data weiterhin gültig, ändern Sie einfach model auf gpt-image-2:
OPENAI_BASE_URL auf https://api.xhuoapi.ai/v1/openai und OPENAI_API_KEY auf das beantragte Token:
Nano Banana Serienmodelle
Dienano-banana Serie ist ebenfalls über /openai/images/edits angebunden, ändern Sie einfach model auf einen der folgenden Werte:
| Modell | Abrechnung (Credits / Anfrage) | Anwendungsbereich |
|---|---|---|
nano-banana | 0.14 | Normale Bildbearbeitung, schnellste und kostengünstigste Variante |
nano-banana-2 | 0.28 | Deutlich verbesserte Qualität und Details |
nano-banana-pro | 0.35 | Flaggschiff der Serie, beste Erhaltung von Struktur, Text und Stil |
Wichtig: Unterstützte Parameter Nano Banana ist über eine Adaptionsschicht an das OpenAI-Protokoll angebunden und unterstützt nur folgende Parameter:model,prompt,image.
imagekann entweder permultipart/form-dataals Datei hochgeladen werden (intern wird es indata:<mime>;base64,...umgewandelt und an den Upstream gesendet) oder als Bild-URL-String im Formularfeld.- Parameter wie
mask,n,size,response_formatwerden nicht unterstützt und ignoriert.- Die Rückgabestruktur folgt dem OpenAI-Format (
data[].url),createdist immer0, es gibt keinb64_jsonundrevised_promptentspricht immer dem ursprünglichenprompt.
Aufruf per Formular + Bild-URL

Aufruf per Formular + lokale Datei
Asynchrone Callback
Dascallback_url asynchrone Callback-Verfahren funktioniert auch bei nano-banana, der Ablauf ist identisch mit anderen Modellen, siehe Abschnitt Asynchrones Callback.
Grundlegende Nutzung
Nun können Sie die API per Code aufrufen, hier ein Beispiel mit CURL:authorization (kann aus Dropdown ausgewählt werden), model (Modelltyp, siehe unsere Modellübersicht), prompt (Textbeschreibung für die Bildgenerierung) und image (Pfad zum zu bearbeitenden Bild). Das Beispielbild sieht so aus:

OPENAI_BASE_URL auf https://api.xhuoapi.ai/v1/openai und OPENAI_API_KEY auf das erhaltene Token. Unter Mac OS:
gift-basket.png erzeugt, das Ergebnis sieht so aus:

dall-e-2, gpt-image-1 und gpt-image-2. Das empfohlene Modell ist gpt-image-2, siehe Abschnitt GPT-Image-2 Modell.
Asynchrones Callback
Da die Bildbearbeitung mit der OpenAI Images Edits API relativ lange dauern kann, würde eine lange Wartezeit auf die HTTP-Antwort unnötige Systemressourcen binden. Deshalb unterstützt die API auch asynchrone Callbacks. Der Ablauf ist: Der Client sendet bei der Anfrage zusätzlich ein Feldcallback_url mit. Die API antwortet sofort mit einem Ergebnis, das ein task_id enthält, die aktuelle Aufgaben-ID. Nach Abschluss der Bearbeitung sendet die API das Ergebnis per POST-JSON an die angegebene callback_url, inklusive der task_id, sodass die Aufgabe eindeutig zugeordnet werden kann.
Ein Beispiel:
Zunächst ist der Webhook ein HTTP-Endpunkt, den Sie selbst bereitstellen sollten. Zur Demonstration verwenden wir die öffentliche Webhook-Seite https://webhook.site/, wo Sie eine URL erhalten, z. B.:
Diese URL kopieren Sie und verwenden sie als callback_url, z. B. https://webhook.site/3d32690d-6780-4187-a65c-870061e8c8ab.
Dann senden Sie die Anfrage mit callback_url:
task_id:
task_id Feld und das data Feld mit dem gleichen Bildbearbeitungsergebnis wie bei synchronem Aufruf. Über task_id können Sie die Aufgabe eindeutig zuordnen.
Fehlerbehandlung
Bei Fehlern gibt die API entsprechende Fehlercodes und Meldungen zurück, z. B.:400 token_mismatched: Ungültige Anfrage, möglicherweise fehlende oder falsche Parameter.400 api_not_implemented: Ungültige Anfrage, möglicherweise fehlende oder falsche Parameter.401 invalid_token: Nicht autorisiert, ungültiges oder fehlendes Token.429 too_many_requests: Zu viele Anfragen, Rate Limit überschritten.500 api_error: Interner Serverfehler.

