Gemini 2.5 Flash Lite

    gemini-2.5-flash-lite
    Google
    Уровень мышления
    Низкий
    Скорость
    Наивысшая
    Цена
    9,23 ₽·36,94 ₽
    Запрос – Ответ
    Форматы входа
    text, image
    Форматы выхода
    text

    Gemini 2.5 Flash-Lite

    Gemini 2.5 Flash-Lite — это облегчённая и бюджетная мультимодальная языковая модель из серии Gemini 2.5 от Google DeepMind, предназначенная для задач с ультра-низкой задержкой, высокой пропускной способностью и минимальными затратами при сохранении ключевых возможностей семейства. Эта модель поддерживает контекстное окно до 1 048 576 токенов и может выдавать ответы объёмом до 65 536 токенов, что позволяет ей эффективно обрабатывать многошаговые запросы, длинные диалоги, крупные документы и мультимодальные данные — текст, изображения, аудио и видео — без потери связности. Gemini 2.5 Flash-Lite оптимизирована для низкой стоимости и скорости отклика, что делает её идеальным выбором для приложений, чувствительных к задержкам, таких как чат-боты, автоматизированная поддержка клиентов, быстрый анализ текста и интеграция в продукты с высокой потребной пропускной способностью. Модель также поддерживает контролируемое рассуждение (thinking budgets), интеграцию с инструментами, включая Google Search, выполнение кода и функции структурированного вывода, что расширяет её применение от простых классификаций до более сложных рабочих процессов. Благодаря сочетанию масштабного контекстного окна, высокой скорости и доступной стоимости Gemini 2.5 Flash-Lite становится привлекательной платформой для разработчиков и команд, которым нужны эффективные и масштабируемые AI-решения в real-time продуктах и корпоративных средах.

    Макс. контекст окна
    1000000
    Макс. токены вывода
    66000
    Конец знаний
    Январь 2025 г.
    Поддерживает мышление
    Да

    Цена

    Ценообразование основано на количестве токенов (стоимость указана за 1 млн).

    Итоговая сумма зависит от выбранного канала обработки. Вы можете использовать стандартный доступ с гарантиями SLA или выбрать запуск на свободных ресурсах системы: это обеспечивает минимальную цену для задач, где не требуется фиксированная скорость ответа. Подробнее...

    Запрос
    $0.11
    Ответ
    $0.46
    Запрос
    9,23 ₽
    Ответ
    36,94 ₽

    Больше моделей от Google