- docs.qcode.cc

Узнайте о методах оплаты QCode.cc, источниках данных о ценах и логике расчёта комиссии

Информация о тарификации ¶

В данном документе подробно описаны способы тарификации и логика ценообразования в QCode.cc, которые помогут вам понять, как рассчитывается стоимость.

Принцип тарификации ¶

QCode.cc осуществляет тарификацию на основе количества токенов. При каждом вызове AI-модели стоимость складывается из двух частей:

Входные токены (Input Tokens): контент, отправляемый модели, включая промпты, контекст, содержимое файлов и т.д.
Выходные токены (Output Tokens): контент, сгенерированный моделью в качестве ответа

Что такое токен? Токен — это базовая единица обработки текста моделью. В английском языке 1 токен приблизительно соответствует 4 символам или ¾ слова; в китайском языке 1 иероглиф обычно соответствует 1-2 токенам.

Формула расчёта стоимости:

Общая стоимость = входные токены × цена за входные токены + выходные токены × цена за выходные токены

Модельные провайдеры, такие как Anthropic и OpenAI, публикуют цены за API-вызовы, но не раскрывают полные правила внутреннего подсчёта токенов (например: входят ли системные промпты в подсчёт, как учитываются токены при tool use, как тарифицируется попадание в кэш и т.д.). Это приводит к расхождениям между оценкой стоимости по официальным ценам и фактическим счётом.

Прейскурант LiteLLM с открытым исходным кодом ¶

Для обеспечения прозрачности и справедливости тарификации, QCode.cc использует прейскурант моделей, поддерживаемый широко известным открытым проектом LiteLLM, который широко применяется в индустрии:

Адрес источника данных: github.com/BerriAI/litellm/model_prices_and_context_window.json

Почему выбран LiteLLM?

Отраслевой стандарт: LiteLLM — один из самых популярных шлюзов LLM API-프окси, используемый тысячами компаний и разработчиков
Поддержка сообщества: данные о ценах постоянно поддерживаются и проверяются открытым сообществом, что обеспечивает точность
Полный охват: включает все модели основных модельных провайдеров, таких как Anthropic, OpenAI, Google и других
Открытость и прозрачность: все данные находятся в открытом доступе на GitHub, любой желающий может их просмотреть и проверить
Своевременные обновления: при изменении цен модельными провайдерами сообщество оперативно обновляет данные о ценах

Справочная информация о ценах на основные модели ¶

Ниже приведены цены на часто используемые модели (единица измерения: доллар США / миллион токенов):

Серия Claude (Anthropic)¶

Модель	Цена за входные	Цена за выходные	Запись в кэш	Чтение из кэша
claude-opus-4-6	$5.00	$25.00	$6.25	$0.50
claude-sonnet-4-6	$3.00	$15.00	$3.75	$0.30
claude-opus-4-5-20251101	$5.00	$25.00	$6.25	$0.50
claude-sonnet-4-5-20250929	$3.00	$15.00	$3.75	$0.30
claude-haiku-4-5-20251001	$1.00	$5.00	$1.25	$0.10

Серия GPT / Codex (OpenAI)¶

Модель	Цена за входные	Цена за выходные	Чтение из кэша
gpt-5.4	$2.00	$16.00	$0.20
gpt-5.4-pro (gpt-5.4 Pro)	$2.00	$16.00	$0.20
gpt-5.4-codex	$2.00	$16.00	$0.20
gpt-5.3-codex-spark	$1.75	$14.00	$0.175
gpt-5.3-codex	$1.75	$14.00	$0.175

Примечание: приведённые выше цены взяты из прейскуранта LiteLLM и могут изменяться при корректировке цен провайдерами. Актуальные цены см. в источнике данных LiteLLM. Серия gpt-5.4 — это модель новейшего поколения.

О ценообразовании на кэширование ¶

Некоторые модели (например, серия Claude) поддерживают Prompt Caching — кэширование контекстного содержимого, используемого повторно. Ценообразование, связанное с кэшированием:

Запись в кэш (Cache Write): стоимость первой записи содержимого в кэш, обычно несколько выше обычной цены за входные токены
Чтение из кэша (Cache Read): стоимость при попадании в кэш, обычно составляет около 10% от обычной цены за входные токены

Механизм кэширования позволяет существенно снизить стоимость использования в сценариях с повторяющимся контекстом.

Пример расчёта тарификации ¶

Допустим, вы используете claude-sonnet-4-5-20250929 для одного запроса вопросов по коду:

Позиция	Количество	Цена за единицу	Стоимость
Входные токены	5,000	$3.00 / миллион	$0.015
Выходные токены	2,000	$15.00 / миллион	$0.030
Итого			$0.045

В реальном использовании один полный сеанс взаимодействия Claude Code обычно включает несколько API-вызовов (анализ кода, генерация решений, выполнение операций и т.д.), поэтому фактическая стоимость будет выше, чем при однократном вызове.

Механизм обновления цен ¶

QCode.cc регулярно синхронизирует актуальные данные о ценах из LiteLLM
Когда модельные провайдеры объявляют об изменении цен, сообщество LiteLLM оперативно обновляет источник данных, и мы同步зируемся同步相应的更改
Обновление цен не влияет на ранее накопленные исторические данные — изменения применяются только к новым операциям после обновления

Как просмотреть статистику использования ¶

Dashboard (рекомендуется)¶

Войдите в консоль QCode.cc и перейдите на страницу «Статистика использования», где вы можете увидеть:

Детализация вызовов модели: информация о каждом вызове — модель, количество токенов и стоимость
Сводка расходов: статистика расходов по дням и месяцам
Прогресс потребления тарифного плана: текущий статус использования квоты вашей подписки

Просмотр через CLI ¶

В Claude Code используйте команду /cost для быстрого просмотра обзора использования текущей сессии:

/cost

Подсказка: стоимость, отображаемая командой /cost, является приблизительной оценкой, рекомендуется ориентироваться на данные Dashboard.

Часто задаваемые вопросы ¶

Совпадают ли ваши цены с официальными?¶

Наша цена за токен напрямую взята из прейскуранта LiteLLM с открытым исходным кодом и соответствует опубликованным API-ценам различных провайдеров. Различия в основном связаны с методологией подсчёта токенов — внутренние правила подсчёта токенов провайдеров не являются полностью открытыми, поэтому возможны небольшие расхождения с оценками встроенной команды /cost CLI.

Как часто обновляются данные о ценах?¶

Мы регулярно同步同步 данных из источника LiteLLM. Обычно обновление выполняется в течение нескольких дней после объявления провайдером об изменении цен.

Как самостоятельно проверить цены?¶

Вы можете напрямую просмотреть источник данных о ценах LiteLLM:

Перейдите по ссылке model_prices_and_context_window.json
Найдите название модели, которую вы используете (например, claude-sonnet-4-5-20250929)
Просмотрите поля input_cost_per_token и output_cost_per_token
Умножьте цену за один токен на 1,000,000 — получите цену за миллион токенов

Почему выбран сторонний прейскурант вместо собственных цен?¶

Выбор открытого и прозрачного стороннего источника данных обеспечивает справедливость. Прейскурант LiteLLM поддерживается совместно сообществом, любой желающий может проверить и верифицировать данные, что исключает ценовые споры.

Связанные страницы ¶

Тарифы и планы — Текущие планы и скидки
Модели и цены — Актуальные цены и ставки для всех поддерживаемых моделей

← Предыдущая

Справочник кодов ошибок

Цены на модели

🚀

Начните с QCode — Claude Code & Codex

Один тариф для Claude Code и Codex, низкая задержка в Азии

Посмотреть тарифы → Создать аккаунт

Команда 3+?

Enterprise: выделенный домен + управление ключами + защита от бана, от ¥250/чел/мес

Enterprise →