ИИ-стартап Stability AI представил демо-версию модели Stable Cascade для генерации изображений

Нейросеть отличается от конкурентов трехступенчатой архитектурой, т.е. объединяет в себе три разные модели машинного обучения. В демо-версии у новинки порядка 10 млрд параметров.

Stable Cascade создает картинки по текстовому описанию или на основе изображения, загруженного пользователем (режим “image-to-image”).

Сторонние разработчики могут поэкспериментировать с моделью и настроить ее под свои нужды. Запуск можно выполнить при помощи специальных “блокнотов” (“notebooks”), представленных в разделе вывода.

Также Stability AI предоставляют код для обучения Stable Cascade с нуля, для тонкой настройки функций (ControlNet) и работы с LoRA. Подробные инструкции доступны в папке с обучением.

Функции Stable Cascade, доступные пользователям

ИИ-модель дает возможность изменять готовые картинки и генерировать несколько вариаций одного изображения с разным ракурсом или деталями.

  1. Inpainting / Outpainting — позволяет загружать изображения с маской и запросом, который заполнит область маски с учетом содержимого.
  2. Функция Inpainting/Outpainting
    Функция Inpainting/Outpainting

  3. Canny Edge — возможность генерировать картинки по линиям границ или по наброскам.
  4. Функция Canny Edge
    Функция Canny Edge

  5. 2x Super Resolution — позволяет увеличивать разрешение изображений.
  6. Функция 2x Super Resolution
    Функция 2x Super Resolution

  7. Image variation — модель “считывает” изображение, что дает возможность создавать различные его вариации (в данном случае – даже без использования промта).
  8. Функция Image variation
    Функция Image variation

Источник: https://github.com/Stability-AI/StableCascade?tab=readme-ov-file