Расчет стоимости генерации
Система расчетов стоимости при работе с нейросетями основана на токенах — это универсальная единица измерения для искусственного интеллекта.
- Генерация текста. Всегда идет по токенам.
- Генерация изображений. Может идти за кол-во сгенерированных изображений (старые нейросети) или по токенам (новое поколение нейросетей).
Что такое «токен»?
Представьте, что токены — это «строительные блоки» языка для нейросети. Это не совсем слова и не совсем буквы, а скорее части слов или целые короткие слова.
Одно слово на русском языке может состоять из 1-3 токенов. Например, слово «нейросеть» может быть разбито на «нейро» и «сеть». Знаки препинания и даже пробелы также считаются токенами.
Каждая нейросеть считает токены по-своему. В среднем, 1000 токенов — это примерно 500-600 слов на русском языке.
Наша формула расчета: прозрачно и просто
Каждый раз, когда вы нажимаете «Отправить» в чате, стоимость генерации текста рассчитывается по единой формуле:
Стоимость генерации = (TQ + TA + TH) * 1K_PRICE
Где:
- TQ – токены в запросе. Это всё, что вы отправляете нейросети в запросе. Сюда входит: текст вашего запроса + прикрепленные файлы. Если вы прикрепляете файлы в запросе, то содержимое файла также рассчитывается по токенам и считается в TQ.
- TA – токены в ответе нейросети. Это то, что нейросеть сгенерировала для вас в ответ на ваш запрос. Чем длиннее ответ, тем больше токенов.
- TH – токены в переданной истории сообщений (если она была передана). Это «память» вашего диалога. Чтобы нейросеть помнила, о чем вы говорили ранее, и давала осмысленные ответы. Она каждый раз «перечитывает» предыдущие сообщения в текущем чате. Это одна из самых важных, но неочевидных частей расхода. Подробнее о передаче истории сообщений.
- 1K_PRICE – цена за 1000 токенов модели. У каждой модели своя стоимость. Простые модели, как YandexGPT-lite, очень дешевые. Мощные, как Gemini 3 Pro, — дороже, потому что они им требуется больше ресурсов и благодаря этому они могут решать сложные задачи. Актуальные цены всегда можно найти на странице Тарифы и цены.
Давайте разберем на примерах
Представим, что у нас есть две модели:
- «Базовая» (цена: 0.2 ₽ за 1000 токенов)
- «Профи» (цена: 1.5 ₽ за 1000 токенов)
Пример 1: Простой запрос (первое сообщение в чате)

Вы открываете новый чат и пишете «Базовой» модели:
- Ваш запрос: «Сколько планет в Солнечной системе?»
- TQ (Токены запроса): 7 токенов
- TH (Токены истории): 0 токенов (так как это первое сообщение)
Нейросеть отвечает:
- Ответ: «В Солнечной системе 8 планет: Меркурий, Венера, Земля, Марс, Юпитер, Сатурн, Уран и Нептун.»
- TA (Токены ответа): 20 токенов
Всего токенов: 7 (запрос) + 20 (ответ) + 0 (история) = 27 токенов.
Стоимость: (27 / 1000) * 0.2 ₽ = 0.0054 ₽. (меньше одной копейки)
Пример 2: Продолжение диалога (второе сообщение)

Вы продолжаете тот же чат и спрашиваете:
- Ваш запрос: «А какая из них самая большая?»
- TQ (Токены запроса): 6 токенов
Нейросеть отвечает:
- Ответ: «Самая большая планета — Юпитер.»
- TA (Токены ответа): 5 токенов
А теперь самое интересное — история:
- TH (Токены истории): Нейросеть «перечитала» ваш первый вопрос (7 токенов) и свой первый ответ (20 токенов). Итого: 7 + 20 = 27 токенов.
Всего токенов: 6 (запрос) + 5 (ответ) + 27 (история) = 38 токенов.
Стоимость: (38 / 1000) * 0.2 ₽ = 0.0076 ₽
Как видите, даже при коротком вопросе и ответе стоимость немного выросла из-за «памяти» чата.
Пример 3: Сложная задача с файлом

Вы хотите, чтобы мощная модель «Профи» сделала краткую выжимку из вашей статьи.
- Ваш запрос: «Сделай краткое саммари этого текста в 3-х пунктах.»
- TQ (Токены запроса): 10 токенов
- TQ (Токены файла): ~1800 токенов (текстовый документ на 4000 слов).
Нейросеть делает выжимку:
- Ответ: Краткое саммари на 150 слов.
- TA (Токены ответа): 270 токенов
- TH (Токены истории): 0 токенов (это новый чат)
Всего токенов: 1810 (запрос с файлом) + 270 (ответ) + 0 (история) = 2080 токенов.
Стоимость: (2080 / 1000) * 1.5 ₽ = 3.12 ₽.
Как экономить токены? 3 простых совета
- Для новой задачи — новый чат. Это самый эффективный способ обнулить «Токены истории» (TH) и не платить за старую переписку.
- Будьте точны в запросах. Чем четче и короче ваш запрос, тем меньше токенов вы потратите на TQ.
- Выбирайте модель под задачу. Для простых вопросов (как с планетами) используйте базовые, дешевые модели. Для анализа документов, написания кода или сложного креатива — включайте «Профи».