Содержание
ИИ-стартап Stability AI представил демо-версию модели Stable Cascade для генерации изображений
Нейросеть отличается от конкурентов трехступенчатой архитектурой, т.е. объединяет в себе три разные модели машинного обучения. В демо-версии у новинки порядка 10 млрд параметров.
Stable Cascade создает картинки по текстовому описанию или на основе изображения, загруженного пользователем (режим “image-to-image”).
Сторонние разработчики могут поэкспериментировать с моделью и настроить ее под свои нужды. Запуск можно выполнить при помощи специальных “блокнотов” (“notebooks”), представленных в разделе вывода.
Также Stability AI предоставляют код для обучения Stable Cascade с нуля, для тонкой настройки функций (ControlNet) и работы с LoRA. Подробные инструкции доступны в папке с обучением.
Функции Stable Cascade, доступные пользователям
ИИ-модель дает возможность изменять готовые картинки и генерировать несколько вариаций одного изображения с разным ракурсом или деталями.
- Inpainting / Outpainting — позволяет загружать изображения с маской и запросом, который заполнит область маски с учетом содержимого.
- Canny Edge — возможность генерировать картинки по линиям границ или по наброскам.
- 2x Super Resolution — позволяет увеличивать разрешение изображений.
- Image variation — модель “считывает” изображение, что дает возможность создавать различные его вариации (в данном случае – даже без использования промта).
Источник: https://github.com/Stability-AI/StableCascade?tab=readme-ov-file