GPT, эмбеддинги и стриминг — через единый endpoint, без зарубежных карт и серых схем. Прозрачный биллинг до копейки: вы всегда знаете, за что платите.
Мы построили AIRUS Gateway, потому что сами устали от этого.
Зарубежные API-платформы не принимают российские карты, аккаунты блокируют
Prepaid-баланс в рублях: пополнил — работаешь. Никаких зарубежных карт и посредников.
Каждый провайдер — свой SDK, свои ключи, свой формат ответов
Один OpenAI-совместимый endpoint. Меняешь base_url — и весь твой код уже работает.
Счёт за LLM приходит «сюрпризом» в конце месяца
Ledger-прозрачность: резерв до запроса, списание по факту, каждая копейка в журнале.
Страшно отправлять данные: кто и что логирует — неизвестно
Metadata-only режим: содержимое промптов и ответов не сохраняется. Только цифры.
Токены летят клиенту по мере генерации. TTFT и латентность — в логах каждого запроса.
Резерв до запроса, финализация по фактическим токенам. Отрицательный баланс невозможен.
Каждая операция — неизменяемое событие. Баланс восстанавливается из журнала до копейки.
API-ключи хранятся только хэшами, показываются один раз, отзываются мгновенно.
Прозрачные цены ₽ за 1M токенов. Алиасы моделей — апгрейд без правки кода.
Raw-промпты и ответы не логируются. Rate limits на каждый ключ. Изоляция тенантов.
Поменяйте base_url в официальном OpenAI SDK — это вся миграция.
from openai import OpenAI
client = OpenAI(
api_key="airus_sk_...",
base_url="https://airus.world/v1",
)
stream = client.chat.completions.create(
model="cheap-chat",
messages=[{"role": "user", "content": "Привет!"}],
stream=True,
)
for chunk in stream:
print(chunk.choices[0].delta.content or "", end="")За 1M токенов. Без подписок, без минимальных платежей — платите только за использование.
Email и пароль. Тенант, проект и рублёвый счёт создаются автоматически.
Пополните баланс, создайте API-ключ — он показывается один раз.
Подставьте base_url в свой SDK и получите стриминг-ответ.