Подписаться ВК
 22.11.2023 в 21:57   OpenAI

Новые нейросети Kandinsky 3.0 и Kandinsky Video от Сбер

Поделиться
с друзьями:

На конференции по искусственному интеллекту и машинному обучению AI Journey была представлена новая версия нейросети Kandinsky, которая лучше предыдущих понимает пользователя. Она способна создавать ещё более фотореалистичные изображения и генерировать художественные картины. Также нейросеть Kandinsky 3.0 знакома с элементами культурного кода России - она знает в лицо российских и советских известных личностей и персонажей, а также легко изображает элементы народного искусства России.

Статьи к прочтению:

Что нового в нейросети Kandinsky?

Пример изображения созданного с помощью нейросети Кандинский 3.0 от Сбера:

Промпт: Милый котенок, в новогодней шапке, пушистый, сказочно. Cтиль: Цифровая живопись.

Разработчики использовали обновлённый датасет в размере 1,5 млрд пар «текст — изображение» для обучения нейросети. Эти данные прошли значительные процедуры фильтрации, что привело к заметному повышению качества генераций.

Kandinsky 3.0 распознает культурный код России и создает художественные картины в разных стилях.

Kandinsky 3.0 разработана и обучена разработчиками Sber AI при поддержке Унверситета искусственного интеллекта AIRI, используя объединенный датасет Sber AI и компании SberDevices. Эта модель понимает запросы на более чем 100 языках, а пользователи могут создавать изображения в любом стиле в неограниченном количестве.

Где протестировать Kandinsky 3.0 от Сбера?

Дополнительную информацию о обновлении Kandinsky 3.0 можно найти в блоге Сбера на Хабре , а протестировать новую нейросеть его можно:

Что такое Kandinsky Video?

Еще одна крутая фишка - это Kandinsky Video, первая в России нейронная сеть, способная генерировать видео с плавным видеорядом и скоростью 30 кадров в секунду. Кроме того, пользователи могут создавать видеоролики продолжительностью до 8 секунд. Модель Kandinsky Video обучалась с использованием датасета из 300 000 пар "текст - видео" и состоит из двух ключевых блоков, работающих вместе. Один блок отвечает за структуру сюжета, а другой блок - за плавность движений. Для генерации кадров в Kandinsky Video используется обновленная модель Kandinsky 3.0.

Подробнее про нейросеть Kandinsky Video можно прочесть в блоге Сбера на Хабре, а протестировать — на платформе fusionbrain.ai или Telegram-боте.

Пример видео созданного с помощью нейросети Кандински Video от Сбера:

Промпт: Реалистичное изображение красиво украшенной рождественской елки с разнообразными мягкими и красочными украшениями и мягко мерцающими огоньками. Елка возвышается в уютной и темной гостиной, окруженная грудой красиво завернутых подарков. Четкий фокус. Мягкие блики, интерьерная фотография.

Комментарии: