API

OpenAI-kompatibel. Jedes Modell.

Richte dein bestehendes OpenAI SDK auf https://api.yout.chat/v1 mit deinem Yout.chat-Schlüssel und alle großen Modelle gehören dir. Ein Guthabenpool, eine Rechnung, keine Verträge pro Modell.

Basis-URL: https://api.yout.chat/v1 · Auth: Authorization: Bearer <your-key>

Direkter Ersatz

Wenn dein Code bereits mit der OpenAI API kommuniziert, änderst du nur zwei Dinge.

from openai import OpenAI

client = OpenAI(
    api_key="yout-...",                  # ← from Account → API keys
    base_url="https://api.yout.chat/v1",       # ← that's it
)

resp = client.chat.completions.create(
    model="anthropic-claude-sonnet-46",
    messages=[
        {"role": "user", "content": "Write a haiku about caching."},
    ],
)
print(resp.choices[0].message.content)

Funktioniert unverändert mit OpenAI Python SDK, OpenAI Node SDK, LangChain, LlamaIndex, Vercel AI SDK, LiteLLM, und allem anderen, das das OpenAI-Format spricht.

Endpunkte

Alle Endpunkte akzeptieren Authorization: Bearer <key>. Session-Cookies funktionieren für die Web-App.

POST/v1/chat/completions

OpenAI-kompatibel. Übergib stream: true für SSE. Guthaben wird atomar abgebucht.

Request-Body
{
  "model": "anthropic-claude-sonnet-46",
  "messages": [
    {"role": "system", "content": "You are helpful."},
    {"role": "user",   "content": "What is 2+2?"}
  ],
  "stream": false,
  "temperature": 0.7,
  "max_tokens": 512
}
Antwort (kein Stream)
{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "model": "anthropic-claude-sonnet-46",
  "choices": [{"index":0,"message":{"role":"assistant","content":"Four."},"finish_reason":"stop"}],
  "usage": {"prompt_tokens": 15, "completion_tokens": 2, "total_tokens": 17},
  "yout": {"credits_charged": 10, "balance": 14999990}
}
GET/v1/models

OpenAI-kompatible Modellliste. Jedes aktive Modell mit id, context_window, und Guthabenkosten pro Token.

POST/api/chat/stream/

Nativer Streaming-Endpunkt — einfacheres JSON-Format als das von OpenAI, von der Web-App genutzt. Bevorzuge /v1/chat/completions für die Kompatibilität mit Drittanbieter-SDKs.

GET/api/chat/models/

Umfangreicherer Modellkatalog mit Aufgaben-Tags, Modalität und Pro-only-Kennzeichnung. Nutze diesen in deiner eigenen Oberfläche.

GET/api/chat/limit/

Dein aktuelles Kontingent — Guthabenstand + Plan-Status oder anonymes Tageskontingent.

GET/api/chat/keys/

Liste deiner aktiven API-Schlüssel (maskiert).

POST/api/chat/keys/

Erstelle einen benannten API-Schlüssel. Das vollständige Token wird einmal zurückgegeben — speichere es.

Request-Body
{"name": "production"}
POST/api/chat/keys/<id>/revoke/

Widerrufe einen Schlüssel. Bestehende Sitzungen, die ihn nutzen, erhalten 401 beim nächsten Aufruf.

POST/api/media/image/

Bildgenerierungs-Job. Gibt job_uuid; Abfragen /api/media/jobs/<uuid>/.

POST/api/media/video/

Videogenerierungs-Job. ~1,2 Mio. Guthaben für 5-Sekunden-Veo. Guthaben wird bei Fehlschlag automatisch erstattet.

POST/api/media/speech/

Text-zu-Sprache. Gibt job_uuid; die Ausgabe ist nach Fertigstellung eine signierte Audio-URL.

GET/api/media/jobs/<uuid>/

Einen Generierungs-Job abfragen: status, output_url, error, credits_cost.

POST/api/chat/share/

Erstelle einen öffentlichen, schreibgeschützten Snapshot. Gibt eine /c/<slug> URL zurück.

POST/api/chat/purge/

Lösche deine Konversationen, Nachrichten und das Nutzungs-Ledger serverseitig.

Abrechnung

Die API-Nutzung zieht aus demselben Guthabenpool wie die Web-App. Keine separate API-Abrechnung.

Preise pro Token

Textmodelle berechnen credits_per_1k_input × Eingabe-Tokens + credits_per_1k_output × Ausgabe-Tokens. Medienmodelle berechnen einen pauschalen credits_per_call.

Mindestgebühr

Jeder erfolgreiche Aufruf bucht mindestens 10 Guthaben ab, um den Mehraufwand zu decken, unabhängig von der Token-Anzahl.

Erstattung bei Fehlschlag

Bild-/Video-/Sprach-Jobs, die upstream fehlschlagen, erstatten das Guthaben automatisch. Fehlgeschlagene Text-Streams berechnen nur das, was produziert wurde.

Überziehung

Aufrufe geben 402 insufficient_credits zurück, wenn dein Guthaben die geschätzten Kosten nicht decken kann. Pläne werden nicht gedrosselt, solange plan_active wahr ist und das Guthaben positiv ist.

Authentifizierung & Datenschutz

  • Bearer-Token — pro Nutzer, zu finden auf deiner Kontoseite. Rotiere durch Löschen + Neuanlegen deines Kontos (ein richtiger Rotations-Endpunkt steht auf der Roadmap).
  • Keine Nutzerkennungen weitergeleitet — wir leiten an Anbieter weiter ohne deine E-Mail, IP, deinen User-Agent oder deine Konto-ID. Nur ein generischer HTTP-Referer: yout.chat wird verwendet.
  • no-log Signal — wird upstream gesendet, damit Modellanbieter gebeten werden, deine Prompts nicht zu protokollieren/zu trainieren, wo ihre Verträge dies zulassen.
  • Standardmäßig kein Nachrichteninhalt gespeichert — wir schreiben eine UsageLedger Zeile (Tokens + Guthaben + Modell), aber nicht den Prompt oder die Antwort.

Roadmap

  • OpenAI-kompatibler /v1/chat/completions Shim, damit bestehende SDKs unverändert funktionieren
  • Webhook-Callbacks für langlaufende Medien-Jobs (ersetzen das Polling)
  • Token-Rotation + Geltungsbereiche pro Token
  • Idempotenz-Schlüssel für /stream/ + wiederholungssichere Job-Erstellung
  • Selbstbedienungs-Steuerung der Ratenbegrenzung

Bereit zum Loslegen?

Der kostenlose Tarif gibt dir 50K Guthaben zum Ausprobieren. Upgrade, wenn du mehr brauchst.