API

OpenAI-संगत। हर मॉडल।

अपने मौजूदा OpenAI SDK को https://api.yout.chat/v1 पर अपनी Yout.chat कुंजी के साथ इंगित करें और हर बड़ा मॉडल आपका है। एक क्रेडिट पूल, एक बिल, कोई प्रति-मॉडल अनुबंध नहीं।

बेस URL: https://api.yout.chat/v1 · प्रमाणीकरण: Authorization: Bearer <your-key>

ड्रॉप-इन प्रतिस्थापन

अगर आपका कोड पहले से ही OpenAI API से बात करता है, तो आप केवल दो चीज़ें बदलते हैं।

from openai import OpenAI

client = OpenAI(
    api_key="yout-...",                  # ← from Account → API keys
    base_url="https://api.yout.chat/v1",       # ← that's it
)

resp = client.chat.completions.create(
    model="anthropic-claude-sonnet-46",
    messages=[
        {"role": "user", "content": "Write a haiku about caching."},
    ],
)
print(resp.choices[0].message.content)

बिना बदलाव के काम करता है OpenAI Python SDK, OpenAI Node SDK, LangChain, LlamaIndex, Vercel AI SDK, LiteLLM, और किसी भी ऐसी चीज़ के साथ जो OpenAI आकार बोलती है।

एंडपॉइंट्स

सभी एंडपॉइंट्स स्वीकार करते हैं Authorization: Bearer <key>. सत्र कुकीज़ वेब ऐप के लिए काम करती हैं।

POST/v1/chat/completions

OpenAI-संगत। पास करें stream: true SSE के लिए। क्रेडिट परमाणु रूप से डेबिट किए जाते हैं।

अनुरोध बॉडी
{
  "model": "anthropic-claude-sonnet-46",
  "messages": [
    {"role": "system", "content": "You are helpful."},
    {"role": "user",   "content": "What is 2+2?"}
  ],
  "stream": false,
  "temperature": 0.7,
  "max_tokens": 512
}
प्रतिक्रिया (नॉन-स्ट्रीम)
{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "model": "anthropic-claude-sonnet-46",
  "choices": [{"index":0,"message":{"role":"assistant","content":"Four."},"finish_reason":"stop"}],
  "usage": {"prompt_tokens": 15, "completion_tokens": 2, "total_tokens": 17},
  "yout": {"credits_charged": 10, "balance": 14999990}
}
GET/v1/models

OpenAI-संगत मॉडल सूची। हर सक्रिय मॉडल जिसमें id, context_window, और प्रति-टोकन क्रेडिट लागत हो।

POST/api/chat/stream/

नेटिव स्ट्रीमिंग एंडपॉइंट — OpenAI के मुकाबले सरल JSON आकार, वेब ऐप द्वारा उपयोग किया जाता है। प्राथमिकता दें /v1/chat/completions तृतीय-पक्ष SDK संगतता के लिए।

GET/api/chat/models/

टास्क टैग, मोडैलिटी, प्रो-ओनली फ्लैग के साथ समृद्ध मॉडल कैटलॉग। इसे अपने स्वयं के UI में उपयोग करें।

GET/api/chat/limit/

आपका वर्तमान कोटा — क्रेडिट बैलेंस + प्लान स्थिति, या एनन दैनिक भत्ता।

GET/api/chat/keys/

अपनी सक्रिय API कुंजियाँ सूचीबद्ध करें (मास्क की गईं)।

POST/api/chat/keys/

एक नामित API कुंजी बनाएं। पूरा टोकन एक बार लौटाया जाता है — इसे सहेजें।

अनुरोध बॉडी
{"name": "production"}
POST/api/chat/keys/<id>/revoke/

एक कुंजी रद्द करें। इसका उपयोग करने वाले मौजूदा सत्रों को अगली कॉल पर 401 मिलता है।

POST/api/media/image/

छवि जनरेशन जॉब। लौटाता है job_uuid; पोल करें /api/media/jobs/<uuid>/.

POST/api/media/video/

वीडियो जनरेशन जॉब। 5-सेकंड Veo के लिए ~1.2M क्रेडिट। विफलता पर क्रेडिट स्वचालित रूप से वापस कर दिए जाते हैं।

POST/api/media/speech/

टेक्स्ट-टू-स्पीच। लौटाता है job_uuid; आउटपुट पूरा होने पर एक साइन किया हुआ ऑडियो URL होता है।

GET/api/media/jobs/<uuid>/

एक जनरेशन जॉब पोल करें: status, output_url, error, credits_cost.

POST/api/chat/share/

एक सार्वजनिक रीड-ओनली स्नैपशॉट बनाएं। एक /c/<slug> URL लौटाता है।

POST/api/chat/purge/

अपनी बातचीत, संदेश, और उपयोग लेजर सर्वर-साइड मिटाएं।

बिलिंग

API उपयोग वेब ऐप के समान क्रेडिट पूल से खींचता है। कोई अलग API बिलिंग नहीं।

प्रति-टोकन मूल्य निर्धारण

टेक्स्ट मॉडल चार्ज करते हैं credits_per_1k_input × इनपुट टोकन + credits_per_1k_output × आउटपुट टोकन। मीडिया मॉडल एक फ्लैट चार्ज करते हैं credits_per_call.

न्यूनतम शुल्क

हर सफल कॉल टोकन गिनती की परवाह किए बिना ओवरहेड को कवर करने के लिए कम से कम 10 क्रेडिट डेबिट करती है।

विफलता रिफंड

छवि/वीडियो/स्पीच जॉब जो अपस्ट्रीम विफल होते हैं स्वचालित रूप से क्रेडिट वापस करते हैं। टेक्स्ट स्ट्रीम विफलताएं केवल उत्पादित का बिल बनाती हैं।

ओवरड्राफ्ट

कॉल लौटाती हैं 402 insufficient_credits जब आपका बैलेंस अनुमानित लागत को कवर नहीं कर सकता। जब तक plan_active सत्य है और बैलेंस सकारात्मक है तब तक प्लान थ्रॉटल नहीं किए जाते।

प्रमाणीकरण & गोपनीयता

  • Bearer टोकन — प्रति उपयोगकर्ता, आपके खाता पृष्ठ पर पाया जाता है। अपने खाते को हटाकर + फिर से बनाकर घुमाएं (उचित रोटेट एंडपॉइंट रोडमैप पर है)।
  • कोई उपयोगकर्ता पहचानकर्ता अग्रेषित नहीं — हम आपके ईमेल, IP, उपयोगकर्ता एजेंट, या खाता ID के बिना प्रदाताओं को प्रॉक्सी करते हैं। केवल सामान्य HTTP-Referer: yout.chat ही।
  • no-log सिग्नल — अपस्ट्रीम भेजा जाता है ताकि मॉडल प्रदाताओं से आपके प्रॉम्प्ट्स को लॉग/ट्रेन न करने के लिए कहा जाए जहां उनके अनुबंध इसका समर्थन करते हैं।
  • डिफ़ॉल्ट रूप से कोई संदेश सामग्री संग्रहीत नहीं — हम एक UsageLedger पंक्ति (टोकन + क्रेडिट + मॉडल) लिखते हैं लेकिन प्रॉम्प्ट या प्रतिक्रिया नहीं।

रोडमैप

  • OpenAI-संगत /v1/chat/completions शिम ताकि मौजूदा SDK बिना बदलाव के काम करें
  • लंबे समय तक चलने वाले मीडिया जॉब के लिए वेबहुक कॉलबैक (पोलिंग को बदलें)
  • टोकन रोटेशन + प्रति-टोकन स्कोप
  • इडेम्पोटेंसी कुंजियाँ /stream/ + रिट्राई-सुरक्षित जॉब निर्माण पर
  • सेल्फ-सर्व रेट-लिमिट नियंत्रण

शिप करने के लिए तैयार?

फ्री टियर आपको खेलने के लिए 50K क्रेडिट देता है। जब आपको और चाहिए तब अपग्रेड करें।