Немного терминологииТокены в контексте ИИ — это базовые единицы обработки текста, на которые модель разбивает полученный текст. В русском языке один токен обычно соответствует примерно 3-4 символам или части слова, хотя это может варьироваться. Для примерной оценки: страница обычного текста (около 2000 символов) может содержать около 500-700 токенов.
Контекстное окно - максимальный объем текста, который она способна обработать за один запрос, в современных моделях окно может достигать миллионов токенов.
В работе с ИИ важно различать
входной контекст (весь текст, который отправляется модели, включая промпт и историю сообщений) и
выходную генерацию (ответ модели). Выходная генерация не равна контекстному окну, обычно она составляет от 4 до 64 тыс. токенов, параметр "Максимальная длина" в ChatAI как раз ограничивает выходную генерацию.
Таким образом затраты на токены формируются исходя из кол-ва текста в исходящем запросе (весь контекст переписки) и полученного ответа. Каждый запрос/ответ добавляется в виде одной трансакции списания в кабинете F5AI, вы сможете сразу увидеть, сколько списывается за каждое сообщение. Актуальная стоимость всех GPT моделей указана на странице
https://f5ai.ru/price.