вторник, 12 декабря 2023 г.

Новинки нейросетей от СБЕРа

Кандинский 3.0

Сравнительно недавно Сбер анонсировал новый инструмент Кандинский 3.0, который также генерирует короткое четырёхсекундное видео из текста. Я не делал отдельного обзора по этому инструменту, так как далеко не всегда нас может удовлетворить  качество созданного видео. Но не буду навязывать собственного мнения. Лучше посмотрите и попробуйте сами. Тем более работать с Кандинским 3.0 очень просто.

Сегодня же речь пойдёт про новую технологию синтеза полноценного видео по текстовому описанию, которую назвали Kandinsky Video.


Это первая в стране нейросеть, которая может генерировать короткие видео.

Kandinsky Video умеет создавать 8-секундные ролики с разрешением 512×512 пикселей, разным соотношением сторон и частотой кадров 30 к/с. Нейросеть использует последнюю модель Kandinsky 3.0, чтобы генерировать сотни кадров, которые затем складываются и плавно переходят друг в друга.

ИИ-видео представляют собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики Kandinsky Video от анимационных роликов, в которых динамика достигается за счет моделирования пролета камеры относительно статичной сцены.

По данным Сбера, Kandinsky Video обучена на базе данных, состоящей из 300 000 пар «текст-видео». Генерация короткого ролика занимает до трех минут.

Никита Лактюшин
https://hi-tech.mail.ru

Комментариев нет:

Отправить комментарий