API

Tương thích OpenAI. Mọi mô hình.

Trỏ OpenAI SDK hiện có của bạn đến https://api.yout.chat/v1 bằng khóa Yout.chat của bạn và mọi mô hình lớn đều thuộc về bạn. Một quỹ tín dụng, một hóa đơn, không hợp đồng riêng cho từng mô hình.

URL cơ sở: https://api.yout.chat/v1 · Xác thực: Authorization: Bearer <your-key>

Thay thế tức thì

Nếu mã của bạn đã giao tiếp với OpenAI API, bạn chỉ cần thay đổi hai thứ.

from openai import OpenAI

client = OpenAI(
    api_key="yout-...",                  # ← from Account → API keys
    base_url="https://api.yout.chat/v1",       # ← that's it
)

resp = client.chat.completions.create(
    model="anthropic-claude-sonnet-46",
    messages=[
        {"role": "user", "content": "Write a haiku about caching."},
    ],
)
print(resp.choices[0].message.content)

Hoạt động không cần chỉnh sửa với OpenAI Python SDK, OpenAI Node SDK, LangChain, LlamaIndex, Vercel AI SDK, LiteLLM, và mọi thứ khác hiểu được định dạng OpenAI.

Điểm cuối

Tất cả điểm cuối đều chấp nhận Authorization: Bearer <key>. Cookie phiên hoạt động cho ứng dụng web.

POST/v1/chat/completions

Tương thích OpenAI. Truyền stream: true cho SSE. Tín dụng được trừ một cách nguyên tử.

Thân yêu cầu
{
  "model": "anthropic-claude-sonnet-46",
  "messages": [
    {"role": "system", "content": "You are helpful."},
    {"role": "user",   "content": "What is 2+2?"}
  ],
  "stream": false,
  "temperature": 0.7,
  "max_tokens": 512
}
Phản hồi (không phát trực tuyến)
{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "model": "anthropic-claude-sonnet-46",
  "choices": [{"index":0,"message":{"role":"assistant","content":"Four."},"finish_reason":"stop"}],
  "usage": {"prompt_tokens": 15, "completion_tokens": 2, "total_tokens": 17},
  "yout": {"credits_charged": 10, "balance": 14999990}
}
GET/v1/models

Danh sách mô hình tương thích OpenAI. Mọi mô hình đang hoạt động với id, context_window, và chi phí tín dụng theo mỗi token.

POST/api/chat/stream/

Điểm cuối phát trực tuyến gốc — định dạng JSON đơn giản hơn của OpenAI, được ứng dụng web sử dụng. Ưu tiên /v1/chat/completions để tương thích với SDK bên thứ ba.

GET/api/chat/models/

Danh mục mô hình phong phú hơn với thẻ tác vụ, phương thức, cờ chỉ-dành-cho-pro. Dùng cái này trong giao diện riêng của bạn.

GET/api/chat/limit/

Hạn mức hiện tại của bạn — số dư tín dụng + trạng thái gói, hoặc hạn mức hằng ngày cho người dùng ẩn danh.

GET/api/chat/keys/

Liệt kê các khóa API đang hoạt động của bạn (được che).

POST/api/chat/keys/

Tạo một khóa API có tên. Token đầy đủ chỉ được trả về một lần — hãy lưu lại.

Thân yêu cầu
{"name": "production"}
POST/api/chat/keys/<id>/revoke/

Thu hồi một khóa. Các phiên hiện có dùng nó sẽ nhận 401 ở lần gọi tiếp theo.

POST/api/media/image/

Tác vụ tạo hình ảnh. Trả về job_uuid; thăm dò /api/media/jobs/<uuid>/.

POST/api/media/video/

Tác vụ tạo video. ~1.2M tín dụng cho 5 giây Veo. Tín dụng tự động hoàn lại khi thất bại.

POST/api/media/speech/

Chuyển văn bản thành giọng nói. Trả về job_uuid; đầu ra là URL âm thanh có chữ ký khi hoàn tất.

GET/api/media/jobs/<uuid>/

Thăm dò một tác vụ tạo: status, output_url, error, credits_cost.

POST/api/chat/share/

Tạo một ảnh chụp công khai chỉ-đọc. Trả về một /c/<slug> URL.

POST/api/chat/purge/

Xóa các cuộc trò chuyện, tin nhắn và sổ cái sử dụng của bạn ở phía máy chủ.

Thanh toán

Việc sử dụng API rút từ cùng một quỹ tín dụng với ứng dụng web. Không có thanh toán API riêng.

Giá theo mỗi token

Mô hình văn bản tính phí credits_per_1k_input × token đầu vào + credits_per_1k_output × token đầu ra. Mô hình media tính phí cố định credits_per_call.

Phí tối thiểu

Mỗi lần gọi thành công đều trừ ít nhất 10 tín dụng để bù chi phí phụ trợ, bất kể số lượng token.

Hoàn tiền khi thất bại

Các tác vụ hình ảnh/video/giọng nói thất bại ở phía upstream sẽ tự động hoàn lại tín dụng. Lỗi luồng văn bản chỉ tính phí phần đã tạo ra.

Vượt số dư

Các lần gọi trả về 402 insufficient_credits khi số dư của bạn không đủ chi trả chi phí ước tính. Các gói không bị giới hạn miễn là plan_active đúng và số dư dương.

Xác thực & quyền riêng tư

  • Token Bearer — cho mỗi người dùng, có trên trang Tài khoản của bạn. Xoay vòng bằng cách xóa + tạo lại tài khoản (điểm cuối xoay vòng đúng nghĩa nằm trong lộ trình).
  • Không chuyển tiếp định danh người dùng — chúng tôi chuyển tiếp đến các nhà cung cấp mà không kèm email, IP, user agent hay ID tài khoản của bạn. Chỉ một HTTP-Referer: yout.chat chung chung.
  • no-log tín hiệu — được gửi lên upstream để các nhà cung cấp mô hình được yêu cầu không ghi lại/huấn luyện trên các prompt của bạn ở những nơi hợp đồng của họ cho phép.
  • Mặc định không lưu nội dung tin nhắn — chúng tôi ghi một dòng UsageLedger (token + tín dụng + mô hình) nhưng không lưu prompt hoặc phản hồi.

Lộ trình

  • Lớp đệm tương thích OpenAI /v1/chat/completions để các SDK hiện có hoạt động không cần chỉnh sửa
  • Gọi lại qua webhook cho các tác vụ media chạy lâu (thay cho thăm dò)
  • Xoay vòng token + phạm vi theo từng token
  • Khóa bất biến trên /stream/ + tạo tác vụ an toàn khi thử lại
  • Tự kiểm soát giới hạn tốc độ

Sẵn sàng triển khai?

Gói miễn phí cho bạn 50K tín dụng để dùng thử. Nâng cấp khi bạn cần thêm.