Расчет стоимости генерации

Расчет стоимости генерации

Система расчетов стоимости при работе с нейросетями основана на токенах — это универсальная единица измерения для искусственного интеллекта.

  • Генерация текста. Всегда идет по токенам.
  • Генерация изображений. Может идти за кол-во сгенерированных изображений (старые нейросети) или по токенам (новое поколение нейросетей).

Что такое «токен»?

Представьте, что токены — это «строительные блоки» языка для нейросети. Это не совсем слова и не совсем буквы, а скорее части слов или целые короткие слова.

Одно слово на русском языке может состоять из 1-3 токенов. Например, слово «нейросеть» может быть разбито на «нейро» и «сеть». Знаки препинания и даже пробелы также считаются токенами.

Каждая нейросеть считает токены по-своему. В среднем, 1000 токенов — это примерно 500-600 слов на русском языке.

Наша формула расчета: прозрачно и просто

Каждый раз, когда вы нажимаете «Отправить» в чате, стоимость генерации текста рассчитывается по единой формуле:

Стоимость генерации = (TQ + TA + TH) * 1K_PRICE

Где:

  • TQ – токены в запросе. Это всё, что вы отправляете нейросети в запросе. Сюда входит: текст вашего запроса + прикрепленные файлы. Если вы прикрепляете файлы в запросе, то содержимое файла также рассчитывается по токенам и считается в TQ.
  • TA – токены в ответе нейросети. Это то, что нейросеть сгенерировала для вас в ответ на ваш запрос. Чем длиннее ответ, тем больше токенов.
  • TH – токены в переданной истории сообщений (если она была передана). Это «память» вашего диалога. Чтобы нейросеть помнила, о чем вы говорили ранее, и давала осмысленные ответы. Она каждый раз «перечитывает» предыдущие сообщения в текущем чате. Это одна из самых важных, но неочевидных частей расхода. Подробнее о передаче истории сообщений.
  • 1K_PRICE – цена за 1000 токенов модели. У каждой модели своя стоимость. Простые модели, как YandexGPT-lite, очень дешевые. Мощные, как Gemini 3 Pro, — дороже, потому что они им требуется больше ресурсов и благодаря этому они могут решать сложные задачи. Актуальные цены всегда можно найти на странице Тарифы и цены.

Давайте разберем на примерах

Представим, что у нас есть две модели:

  • «Базовая» (цена: 0.2 ₽ за 1000 токенов)
  • «Профи» (цена: 1.5 ₽ за 1000 токенов)

Пример 1: Простой запрос (первое сообщение в чате)

Окно диалога с нейросетью
Cоздаем новый диалог и отправляем сообщение в чат

Вы открываете новый чат и пишете «Базовой» модели:

  • Ваш запрос: «Сколько планет в Солнечной системе?»
  • TQ (Токены запроса): 7 токенов
  • TH (Токены истории): 0 токенов (так как это первое сообщение)

Нейросеть отвечает:

  • Ответ: «В Солнечной системе 8 планет: Меркурий, Венера, Земля, Марс, Юпитер, Сатурн, Уран и Нептун.»
  • TA (Токены ответа): 20 токенов

Всего токенов: 7 (запрос) + 20 (ответ) + 0 (история) = 27 токенов.

Стоимость: (27 / 1000) * 0.2 ₽ = 0.0054 ₽. (меньше одной копейки)

Пример 2: Продолжение диалога (второе сообщение)

Продолжение диалога с нейросетью
Включаем передачу истории сообщений и продолжаем диалог

Вы продолжаете тот же чат и спрашиваете:

  • Ваш запрос: «А какая из них самая большая?»
  • TQ (Токены запроса): 6 токенов

Нейросеть отвечает:

  • Ответ: «Самая большая планета — Юпитер.»
  • TA (Токены ответа): 5 токенов

А теперь самое интересное — история:

  • TH (Токены истории): Нейросеть «перечитала» ваш первый вопрос (7 токенов) и свой первый ответ (20 токенов). Итого: 7 + 20 = 27 токенов.

Всего токенов: 6 (запрос) + 5 (ответ) + 27 (история) = 38 токенов.

Стоимость: (38 / 1000) * 0.2 ₽ = 0.0076 ₽

Как видите, даже при коротком вопросе и ответе стоимость немного выросла из-за «памяти» чата.

Пример 3: Сложная задача с файлом

Отправка файла для обработки нейросетью
Пишем запрос в диалог, прикрепляя PDF файл

Вы хотите, чтобы мощная модель «Профи» сделала краткую выжимку из вашей статьи.

  • Ваш запрос: «Сделай краткое саммари этого текста в 3-х пунктах.»
  • TQ (Токены запроса): 10 токенов
  • TQ (Токены файла): ~1800 токенов (текстовый документ на 4000 слов).

Нейросеть делает выжимку:

  • Ответ: Краткое саммари на 150 слов.
  • TA (Токены ответа): 270 токенов
  • TH (Токены истории): 0 токенов (это новый чат)

Всего токенов: 1810 (запрос с файлом) + 270 (ответ) + 0 (история) = 2080 токенов.

Стоимость: (2080 / 1000) * 1.5 ₽ = 3.12 ₽.

Как экономить токены? 3 простых совета

  • Для новой задачи — новый чат. Это самый эффективный способ обнулить «Токены истории» (TH) и не платить за старую переписку.
  • Будьте точны в запросах. Чем четче и короче ваш запрос, тем меньше токенов вы потратите на TQ.
  • Выбирайте модель под задачу. Для простых вопросов (как с планетами) используйте базовые, дешевые модели. Для анализа документов, написания кода или сложного креатива — включайте «Профи».
Чат-боты

Выберите чат-бота на интересующую вас тематику и начните с ним работу

Сайт использует cookies

Продолжая работу, вы принимаете оферту, пользовательское соглашение и политику конфиденциальности.