Узнайте о методах оплаты QCode.cc, источниках данных о ценах и логике расчёта комиссии
Информация о тарификации¶
В данном документе подробно описаны способы тарификации и логика ценообразования в QCode.cc, которые помогут вам понять, как рассчитывается стоимость.
Принцип тарификации¶
QCode.cc осуществляет тарификацию на основе количества токенов. При каждом вызове AI-модели стоимость складывается из двух частей:
-
Входные токены (Input Tokens): контент, отправляемый модели, включая промпты, контекст, содержимое файлов и т.д.
-
Выходные токены (Output Tokens): контент, сгенерированный моделью в качестве ответа
Что такое токен? Токен — это базовая единица обработки текста моделью. В английском языке 1 токен приблизительно соответствует 4 символам или ¾ слова; в китайском языке 1 иероглиф обычно соответствует 1-2 токенам.
Формула расчёта стоимости:
Общая стоимость = входные токены × цена за входные токены + выходные токены × цена за выходные токены
Источник данных о ценах¶
Почему не использовать официальные цены напрямую?¶
Модельные провайдеры, такие как Anthropic и OpenAI, публикуют цены за API-вызовы, но не раскрывают полные правила внутреннего подсчёта токенов (например: входят ли системные промпты в подсчёт, как учитываются токены при tool use, как тарифицируется попадание в кэш и т.д.). Это приводит к расхождениям между оценкой стоимости по официальным ценам и фактическим счётом.
Прейскурант LiteLLM с открытым исходным кодом¶
Для обеспечения прозрачности и справедливости тарификации, QCode.cc использует прейскурант моделей, поддерживаемый широко известным открытым проектом LiteLLM, который широко применяется в индустрии:
Адрес источника данных: github.com/BerriAI/litellm/model_prices_and_context_window.json
Почему выбран LiteLLM?
-
Отраслевой стандарт: LiteLLM — один из самых популярных шлюзов LLM API-프окси, используемый тысячами компаний и разработчиков
-
Поддержка сообщества: данные о ценах постоянно поддерживаются и проверяются открытым сообществом, что обеспечивает точность
-
Полный охват: включает все модели основных модельных провайдеров, таких как Anthropic, OpenAI, Google и других
-
Открытость и прозрачность: все данные находятся в открытом доступе на GitHub, любой желающий может их просмотреть и проверить
-
Своевременные обновления: при изменении цен модельными провайдерами сообщество оперативно обновляет данные о ценах
Справочная информация о ценах на основные модели¶
Ниже приведены цены на часто используемые модели (единица измерения: доллар США / миллион токенов):
Серия Claude (Anthropic)¶
| Модель | Цена за входные | Цена за выходные | Запись в кэш | Чтение из кэша |
|---|---|---|---|---|
| claude-opus-4-6 | $5.00 | $25.00 | $6.25 | $0.50 |
| claude-sonnet-4-6 | $3.00 | $15.00 | $3.75 | $0.30 |
| claude-opus-4-5-20251101 | $5.00 | $25.00 | $6.25 | $0.50 |
| claude-sonnet-4-5-20250929 | $3.00 | $15.00 | $3.75 | $0.30 |
| claude-haiku-4-5-20251001 | $1.00 | $5.00 | $1.25 | $0.10 |
Серия GPT / Codex (OpenAI)¶
| Модель | Цена за входные | Цена за выходные | Чтение из кэша |
|---|---|---|---|
| gpt-5.4 | $2.00 | $16.00 | $0.20 |
| gpt-5.4-pro (gpt-5.4 Pro) | $2.00 | $16.00 | $0.20 |
| gpt-5.4-codex | $2.00 | $16.00 | $0.20 |
| gpt-5.3-codex-spark | $1.75 | $14.00 | $0.175 |
| gpt-5.3-codex | $1.75 | $14.00 | $0.175 |
Примечание: приведённые выше цены взяты из прейскуранта LiteLLM и могут изменяться при корректировке цен провайдерами. Актуальные цены см. в источнике данных LiteLLM. Серия gpt-5.4 — это модель новейшего поколения.
О ценообразовании на кэширование¶
Некоторые модели (например, серия Claude) поддерживают Prompt Caching — кэширование контекстного содержимого, используемого повторно. Ценообразование, связанное с кэшированием:
-
Запись в кэш (Cache Write): стоимость первой записи содержимого в кэш, обычно несколько выше обычной цены за входные токены
-
Чтение из кэша (Cache Read): стоимость при попадании в кэш, обычно составляет около 10% от обычной цены за входные токены
Механизм кэширования позволяет существенно снизить стоимость использования в сценариях с повторяющимся контекстом.
Пример расчёта тарификации¶
Допустим, вы используете claude-sonnet-4-5-20250929 для одного запроса вопросов по коду:
| Позиция | Количество | Цена за единицу | Стоимость |
|---|---|---|---|
| Входные токены | 5,000 | $3.00 / миллион | $0.015 |
| Выходные токены | 2,000 | $15.00 / миллион | $0.030 |
| Итого | $0.045 |
В реальном использовании один полный сеанс взаимодействия Claude Code обычно включает несколько API-вызовов (анализ кода, генерация решений, выполнение операций и т.д.), поэтому фактическая стоимость будет выше, чем при однократном вызове.
Механизм обновления цен¶
-
QCode.cc регулярно синхронизирует актуальные данные о ценах из LiteLLM
-
Когда модельные провайдеры объявляют об изменении цен, сообщество LiteLLM оперативно обновляет источник данных, и мы同步зируемся同步相应的更改
-
Обновление цен не влияет на ранее накопленные исторические данные — изменения применяются только к новым операциям после обновления
Как просмотреть статистику использования¶
Dashboard (рекомендуется)¶
Войдите в консоль QCode.cc и перейдите на страницу «Статистика использования», где вы можете увидеть:
-
Детализация вызовов модели: информация о каждом вызове — модель, количество токенов и стоимость
-
Сводка расходов: статистика расходов по дням и месяцам
-
Прогресс потребления тарифного плана: текущий статус использования квоты вашей подписки
Просмотр через CLI¶
В Claude Code используйте команду /cost для быстрого просмотра обзора использования текущей сессии:
/cost
Подсказка: стоимость, отображаемая командой
/cost, является приблизительной оценкой, рекомендуется ориентироваться на данные Dashboard.
Часто задаваемые вопросы¶
Совпадают ли ваши цены с официальными?¶
Наша цена за токен напрямую взята из прейскуранта LiteLLM с открытым исходным кодом и соответствует опубликованным API-ценам различных провайдеров. Различия в основном связаны с методологией подсчёта токенов — внутренние правила подсчёта токенов провайдеров не являются полностью открытыми, поэтому возможны небольшие расхождения с оценками встроенной команды /cost CLI.
Как часто обновляются данные о ценах?¶
Мы регулярно同步同步 данных из источника LiteLLM. Обычно обновление выполняется в течение нескольких дней после объявления провайдером об изменении цен.
Как самостоятельно проверить цены?¶
Вы можете напрямую просмотреть источник данных о ценах LiteLLM:
-
Перейдите по ссылке model_prices_and_context_window.json
-
Найдите название модели, которую вы используете (например,
claude-sonnet-4-5-20250929) -
Просмотрите поля
input_cost_per_tokenиoutput_cost_per_token -
Умножьте цену за один токен на 1,000,000 — получите цену за миллион токенов
Почему выбран сторонний прейскурант вместо собственных цен?¶
Выбор открытого и прозрачного стороннего источника данных обеспечивает справедливость. Прейскурант LiteLLM поддерживается совместно сообществом, любой желающий может проверить и верифицировать данные, что исключает ценовые споры.