Gemini 2.5 Flash-Lite — это облегчённая и бюджетная мультимодальная языковая модель из серии Gemini 2.5 от Google DeepMind, предназначенная для задач с ультра-низкой задержкой, высокой пропускной способностью и минимальными затратами при сохранении ключевых возможностей семейства. Эта модель поддерживает контекстное окно до 1 048 576 токенов и может выдавать ответы объёмом до 65 536 токенов, что позволяет ей эффективно обрабатывать многошаговые запросы, длинные диалоги, крупные документы и мультимодальные данные — текст, изображения, аудио и видео — без потери связности. Gemini 2.5 Flash-Lite оптимизирована для низкой стоимости и скорости отклика, что делает её идеальным выбором для приложений, чувствительных к задержкам, таких как чат-боты, автоматизированная поддержка клиентов, быстрый анализ текста и интеграция в продукты с высокой потребной пропускной способностью. Модель также поддерживает контролируемое рассуждение (thinking budgets), интеграцию с инструментами, включая Google Search, выполнение кода и функции структурированного вывода, что расширяет её применение от простых классификаций до более сложных рабочих процессов. Благодаря сочетанию масштабного контекстного окна, высокой скорости и доступной стоимости Gemini 2.5 Flash-Lite становится привлекательной платформой для разработчиков и команд, которым нужны эффективные и масштабируемые AI-решения в real-time продуктах и корпоративных средах.
Ценообразование основано на количестве токенов (стоимость указана за 1 млн).
Итоговая сумма зависит от выбранного канала обработки. Вы можете использовать стандартный доступ с гарантиями SLA или выбрать запуск на свободных ресурсах системы: это обеспечивает минимальную цену для задач, где не требуется фиксированная скорость ответа. Подробнее...