Узнайте о методах оплаты QCode.cc, источниках данных о ценах и логике расчёта комиссии

Информация о тарификации

В данном документе подробно описаны способы тарификации и логика ценообразования в QCode.cc, которые помогут вам понять, как рассчитывается стоимость.

Принцип тарификации

QCode.cc осуществляет тарификацию на основе количества токенов. При каждом вызове AI-модели стоимость складывается из двух частей:

  • Входные токены (Input Tokens): контент, отправляемый модели, включая промпты, контекст, содержимое файлов и т.д.

  • Выходные токены (Output Tokens): контент, сгенерированный моделью в качестве ответа

Что такое токен? Токен — это базовая единица обработки текста моделью. В английском языке 1 токен приблизительно соответствует 4 символам или ¾ слова; в китайском языке 1 иероглиф обычно соответствует 1-2 токенам.

Формула расчёта стоимости:

Общая стоимость = входные токены × цена за входные токены + выходные токены × цена за выходные токены

Источник данных о ценах

Почему не использовать официальные цены напрямую?

Модельные провайдеры, такие как Anthropic и OpenAI, публикуют цены за API-вызовы, но не раскрывают полные правила внутреннего подсчёта токенов (например: входят ли системные промпты в подсчёт, как учитываются токены при tool use, как тарифицируется попадание в кэш и т.д.). Это приводит к расхождениям между оценкой стоимости по официальным ценам и фактическим счётом.

Прейскурант LiteLLM с открытым исходным кодом

Для обеспечения прозрачности и справедливости тарификации, QCode.cc использует прейскурант моделей, поддерживаемый широко известным открытым проектом LiteLLM, который широко применяется в индустрии:

Адрес источника данных: github.com/BerriAI/litellm/model_prices_and_context_window.json

Почему выбран LiteLLM?

  • Отраслевой стандарт: LiteLLM — один из самых популярных шлюзов LLM API-프окси, используемый тысячами компаний и разработчиков

  • Поддержка сообщества: данные о ценах постоянно поддерживаются и проверяются открытым сообществом, что обеспечивает точность

  • Полный охват: включает все модели основных модельных провайдеров, таких как Anthropic, OpenAI, Google и других

  • Открытость и прозрачность: все данные находятся в открытом доступе на GitHub, любой желающий может их просмотреть и проверить

  • Своевременные обновления: при изменении цен модельными провайдерами сообщество оперативно обновляет данные о ценах

Справочная информация о ценах на основные модели

Ниже приведены цены на часто используемые модели (единица измерения: доллар США / миллион токенов):

Серия Claude (Anthropic)

Модель Цена за входные Цена за выходные Запись в кэш Чтение из кэша
claude-opus-4-6 $5.00 $25.00 $6.25 $0.50
claude-sonnet-4-6 $3.00 $15.00 $3.75 $0.30
claude-opus-4-5-20251101 $5.00 $25.00 $6.25 $0.50
claude-sonnet-4-5-20250929 $3.00 $15.00 $3.75 $0.30
claude-haiku-4-5-20251001 $1.00 $5.00 $1.25 $0.10

Серия GPT / Codex (OpenAI)

Модель Цена за входные Цена за выходные Чтение из кэша
gpt-5.4 $2.00 $16.00 $0.20
gpt-5.4-pro (gpt-5.4 Pro) $2.00 $16.00 $0.20
gpt-5.4-codex $2.00 $16.00 $0.20
gpt-5.3-codex-spark $1.75 $14.00 $0.175
gpt-5.3-codex $1.75 $14.00 $0.175

Примечание: приведённые выше цены взяты из прейскуранта LiteLLM и могут изменяться при корректировке цен провайдерами. Актуальные цены см. в источнике данных LiteLLM. Серия gpt-5.4 — это модель новейшего поколения.

О ценообразовании на кэширование

Некоторые модели (например, серия Claude) поддерживают Prompt Caching — кэширование контекстного содержимого, используемого повторно. Ценообразование, связанное с кэшированием:

  • Запись в кэш (Cache Write): стоимость первой записи содержимого в кэш, обычно несколько выше обычной цены за входные токены

  • Чтение из кэша (Cache Read): стоимость при попадании в кэш, обычно составляет около 10% от обычной цены за входные токены

Механизм кэширования позволяет существенно снизить стоимость использования в сценариях с повторяющимся контекстом.

Пример расчёта тарификации

Допустим, вы используете claude-sonnet-4-5-20250929 для одного запроса вопросов по коду:

Позиция Количество Цена за единицу Стоимость
Входные токены 5,000 $3.00 / миллион $0.015
Выходные токены 2,000 $15.00 / миллион $0.030
Итого $0.045

В реальном использовании один полный сеанс взаимодействия Claude Code обычно включает несколько API-вызовов (анализ кода, генерация решений, выполнение операций и т.д.), поэтому фактическая стоимость будет выше, чем при однократном вызове.

Механизм обновления цен

  • QCode.cc регулярно синхронизирует актуальные данные о ценах из LiteLLM

  • Когда модельные провайдеры объявляют об изменении цен, сообщество LiteLLM оперативно обновляет источник данных, и мы同步зируемся同步相应的更改

  • Обновление цен не влияет на ранее накопленные исторические данные — изменения применяются только к новым операциям после обновления

Как просмотреть статистику использования

Dashboard (рекомендуется)

Войдите в консоль QCode.cc и перейдите на страницу «Статистика использования», где вы можете увидеть:

  • Детализация вызовов модели: информация о каждом вызове — модель, количество токенов и стоимость

  • Сводка расходов: статистика расходов по дням и месяцам

  • Прогресс потребления тарифного плана: текущий статус использования квоты вашей подписки

Просмотр через CLI

В Claude Code используйте команду /cost для быстрого просмотра обзора использования текущей сессии:

/cost

Подсказка: стоимость, отображаемая командой /cost, является приблизительной оценкой, рекомендуется ориентироваться на данные Dashboard.

Часто задаваемые вопросы

Совпадают ли ваши цены с официальными?

Наша цена за токен напрямую взята из прейскуранта LiteLLM с открытым исходным кодом и соответствует опубликованным API-ценам различных провайдеров. Различия в основном связаны с методологией подсчёта токенов — внутренние правила подсчёта токенов провайдеров не являются полностью открытыми, поэтому возможны небольшие расхождения с оценками встроенной команды /cost CLI.

Как часто обновляются данные о ценах?

Мы регулярно同步同步 данных из источника LiteLLM. Обычно обновление выполняется в течение нескольких дней после объявления провайдером об изменении цен.

Как самостоятельно проверить цены?

Вы можете напрямую просмотреть источник данных о ценах LiteLLM:

  1. Перейдите по ссылке model_prices_and_context_window.json

  2. Найдите название модели, которую вы используете (например, claude-sonnet-4-5-20250929)

  3. Просмотрите поля input_cost_per_token и output_cost_per_token

  4. Умножьте цену за один токен на 1,000,000 — получите цену за миллион токенов

Почему выбран сторонний прейскурант вместо собственных цен?

Выбор открытого и прозрачного стороннего источника данных обеспечивает справедливость. Прейскурант LiteLLM поддерживается совместно сообществом, любой желающий может проверить и верифицировать данные, что исключает ценовые споры.

🚀
Начните с QCode — ИИ-ассистент для программистов
Официальный ретранслятор Claude Code, быстро и надёжно
Посмотреть тарифы → Создать аккаунт