Эта модель ориентирована на баланс скорости и качества для прикладных задач: диалоговые ассистенты, генерация и анализ текста, помощь разработчикам (написание/рефакторинг/объяснение кода), разбор больших документов и многошаговые сценарии, где важно аккуратное рассуждение и устойчивость ответа.
Ценообразование основано на количестве токенов (стоимость указана за 1 млн).
Итоговая сумма зависит от выбранного канала обработки. Вы можете использовать стандартный доступ с гарантиями SLA или выбрать запуск на свободных ресурсах системы: это обеспечивает минимальную цену для задач, где не требуется фиксированная скорость ответа. Подробнее...