API

Compatível com OpenAI. Todos os modelos.

Aponte o seu SDK da OpenAI existente para https://api.yout.chat/v1 com a sua chave Yout.chat e todos os principais modelos são seus. Um único pool de créditos, uma única fatura, sem contratos por modelo.

URL base: https://api.yout.chat/v1 · Autenticação: Authorization: Bearer <your-key>

Substituição direta

Se o seu código já fala com a API da OpenAI, só precisa de mudar duas coisas.

from openai import OpenAI

client = OpenAI(
    api_key="yout-...",                  # ← from Account → API keys
    base_url="https://api.yout.chat/v1",       # ← that's it
)

resp = client.chat.completions.create(
    model="anthropic-claude-sonnet-46",
    messages=[
        {"role": "user", "content": "Write a haiku about caching."},
    ],
)
print(resp.choices[0].message.content)

Funciona sem alterações com OpenAI Python SDK, OpenAI Node SDK, LangChain, LlamaIndex, Vercel AI SDK, LiteLLM, e qualquer outra coisa que fale o formato da OpenAI.

Endpoints

Todos os endpoints aceitam Authorization: Bearer <key>. Os cookies de sessão funcionam para a aplicação web.

POST/v1/chat/completions

Compatível com OpenAI. Passe stream: true para SSE. Créditos debitados atomicamente.

Corpo do pedido
{
  "model": "anthropic-claude-sonnet-46",
  "messages": [
    {"role": "system", "content": "You are helpful."},
    {"role": "user",   "content": "What is 2+2?"}
  ],
  "stream": false,
  "temperature": 0.7,
  "max_tokens": 512
}
Resposta (sem streaming)
{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "model": "anthropic-claude-sonnet-46",
  "choices": [{"index":0,"message":{"role":"assistant","content":"Four."},"finish_reason":"stop"}],
  "usage": {"prompt_tokens": 15, "completion_tokens": 2, "total_tokens": 17},
  "yout": {"credits_charged": 10, "balance": 14999990}
}
GET/v1/models

Lista de modelos compatível com OpenAI. Todos os modelos ativos com id, context_window, e custo em créditos por token.

POST/api/chat/stream/

Endpoint de streaming nativo — formato JSON mais simples do que o da OpenAI, usado pela aplicação web. Prefira /v1/chat/completions para compatibilidade com SDKs de terceiros.

GET/api/chat/models/

Catálogo de modelos mais rico, com etiquetas de tarefa, modalidade e indicador exclusivo para Pro. Use-o na sua própria interface.

GET/api/chat/limit/

A sua quota atual — saldo de créditos + estado do plano, ou subsídio diário anónimo.

GET/api/chat/keys/

Liste as suas chaves de API ativas (mascaradas).

POST/api/chat/keys/

Crie uma chave de API com nome. O token completo é devolvido uma única vez — guarde-o.

Corpo do pedido
{"name": "production"}
POST/api/chat/keys/<id>/revoke/

Revogue uma chave. As sessões existentes que a usam recebem 401 na chamada seguinte.

POST/api/media/image/

Tarefa de geração de imagem. Devolve job_uuid; consulte /api/media/jobs/<uuid>/.

POST/api/media/video/

Tarefa de geração de vídeo. ~1,2M créditos para 5 segundos de Veo. Créditos reembolsados automaticamente em caso de falha.

POST/api/media/speech/

Texto para fala. Devolve job_uuid; o resultado é um URL de áudio assinado assim que concluído.

GET/api/media/jobs/<uuid>/

Consulte uma tarefa de geração: status, output_url, error, credits_cost.

POST/api/chat/share/

Crie um instantâneo público apenas de leitura. Devolve um /c/<slug> URL.

POST/api/chat/purge/

Apague as suas conversas, mensagens e o registo de utilização no servidor.

Faturação

A utilização da API consome o mesmo pool de créditos que a aplicação web. Não há faturação de API separada.

Preço por token

Os modelos de texto cobram credits_per_1k_input × tokens de entrada + credits_per_1k_output × tokens de saída. Os modelos de média cobram um valor fixo credits_per_call.

Cobrança mínima

Cada chamada bem-sucedida debita pelo menos 10 créditos para cobrir custos gerais, independentemente do número de tokens.

Reembolso por falha

As tarefas de imagem/vídeo/fala que falham a montante reembolsam automaticamente os créditos. As falhas de streaming de texto cobram apenas o que foi produzido.

Saldo insuficiente

As chamadas devolvem 402 insufficient_credits quando o seu saldo não cobre o custo estimado. Os planos não são limitados desde que plan_active seja verdadeiro e o saldo seja positivo.

Autenticação & privacidade

  • Token Bearer — por utilizador, encontrado na sua página de Conta. Rode-o eliminando + recriando a sua conta (endpoint de rotação adequado planeado).
  • Nenhum identificador de utilizador é encaminhado — fazemos proxy para os fornecedores sem o seu email, IP, agente de utilizador ou ID de conta. Apenas um HTTP-Referer: yout.chat genérico.
  • no-log sinal — enviado a montante para que os fornecedores de modelos sejam solicitados a não registar/treinar com os seus prompts, sempre que os seus contratos o permitam.
  • Nenhum conteúdo de mensagens é guardado por predefinição — escrevemos uma UsageLedger linha (tokens + créditos + modelo) mas não o prompt nem a resposta.

Roteiro

  • Compatível com OpenAI /v1/chat/completions shim para que os SDKs existentes funcionem sem alterações
  • Callbacks de webhook para tarefas de média de longa duração (substituem a consulta)
  • Rotação de tokens + escopos por token
  • Chaves de idempotência em /stream/ + criação de tarefas segura para repetições
  • Controlos de limite de taxa em autosserviço

Pronto para começar?

O plano gratuito dá-lhe 50K créditos para experimentar. Faça upgrade quando precisar de mais.