Кандинский 3.0
Сравнительно недавно Сбер анонсировал новый инструмент Кандинский 3.0, который также генерирует короткое четырёхсекундное видео из текста. Я не делал отдельного обзора по этому инструменту, так как далеко не всегда нас может удовлетворить качество созданного видео. Но не буду навязывать собственного мнения. Лучше посмотрите и попробуйте сами. Тем более работать с Кандинским 3.0 очень просто.
Сегодня же речь пойдёт про новую технологию синтеза полноценного видео по текстовому описанию, которую назвали Kandinsky Video.
Это первая в стране нейросеть, которая может генерировать короткие видео.
Kandinsky Video умеет создавать 8-секундные ролики с разрешением 512×512 пикселей, разным соотношением сторон и частотой кадров 30 к/с. Нейросеть использует последнюю модель Kandinsky 3.0, чтобы генерировать сотни кадров, которые затем складываются и плавно переходят друг в друга.
ИИ-видео представляют собой непрерывную сцену с движением как объекта, так и фона. Именно это отличает видеоролики Kandinsky Video от анимационных роликов, в которых динамика достигается за счет моделирования пролета камеры относительно статичной сцены.
По данным Сбера, Kandinsky Video обучена на базе данных, состоящей из 300 000 пар «текст-видео». Генерация короткого ролика занимает до трех минут.
Никита Лактюшин
https://hi-tech.mail.ru
Комментариев нет:
Отправить комментарий