пятница, 3 сентября 2021 г.

Нейролирика

Жизнь современного человека невозможно представить без цифровых технологий. Компьютеры помогают нам в самых разных областях. Нейронные сети широко применяются и в искусстве: кинематографе, графике, дизайне и т. д.

Но может ли программа сама стать автором художественного произведения? Совсем недавно такая постановка вопроса казалась бредовой, ведь рациональный подход машин несовместим с требованиями эстетики, но за последние годы нейросети смогли произвести настоящий прорыв в освоении мира искусства, в том числе и поэзии.

История стихов, созданных без участия человека, начинается задолго до эпохи нейронных сетей. Ещё в 1924 году основоположник дадаизма, румынский и французский поэт Тристан Тцара предложил складывать строки из газетных вырезок, разложенных в случайном порядке. Информация о вычислительных машинах, сочиняющих поэтические тексты, появилась впервые в 50-е годы в СССР и была не более чем мифом. Художественный рассказ о компьютере-стихотворце был опубликован в одном из американских научно-популярных журналов и был принят советскими переводчиками за чистую монету. История неоднократно публиковалась в отечественных изданиях.

Уже в 60-х компьютеры действительно стали составлять стихотворения почти по тому же принципу, который использовал Тристан Тцара. Назвать стихами произведенные тексты даже с большой натяжкой было тяжело, однако скорость обработки данных электронными машинами уже тогда многократно превышала человеческие возможности, позволяла подбирать рифмы, составлять анаграммы и палиндромы, давала почву для творческих экспериментов.

Компьютерный анализ текстов положил начало целому направлению – компьютерной лингвистике. На основе этой дисциплины норвежский славист Гейр Хьетсо в 1984 году доказал подлинность авторства Михаила Шолохова в отношении романа «Тихий Дон». По иронии судьбы, писатель, полвека отстаивавший право создателя эпопеи, умер в том же году. Практическая польза от использования цифровых технологий в отношении художественного текста стала очевидной.

В 90-е – начале 2000-х лингвистические программы получили широкое распространение, а различные генераторы рифм стали доступны любителям высоких технологий и высокой словесности по всему миру. В 2002 году пермский программист-поэт Сергей Тетерин выступил на российских федеральных каналах с презентацией машины для сочинения стихов «Кибер-Пушкин 1.0 бета».

«Я научил его всему что нужно: поэтическому ритму, правилам рифмования, специфике поэтического лексикона, а также "поэтическому взгляду на мир". Забил в базу данных лучшие образцы поэзии Есенина, Мандельштама, Вертинского и Пригова Дмитрия Александровича» – отмечал автор.

Однако, по его же признанию «"Кибер-Пушкин" писал полную белиберду, да еще и с чудовищными орфографическими ошибками». В 2002 году эта новость была принята исключительно в ироничном ключе. Никто не мог подумать, что уже через 15 лет потребуется тщательный анализ, чтобы отличить строки, написанные человеком, от текстов машины.

В 2006 году «Яндекс» презентовал в качестве эксперимента генератор стихов на основе лексикона произведений А. С. Пушкина. Проект вызвал интерес, и в 2013 году был представлен робот «Яндекс. Автопоэт», создающий стихи из поисковых запросов пользователей браузера. Программа безошибочно генерировала ритм и подбирала рифмы. Составляла сонеты, хокку, лимерики и даже онегинские строфы. В сутки робот был способен создавать до 800 тысяч четверостиший. И вполне естественно возникает вопрос: «Зачем?». Несмотря на складный текст, главным недостатком Автопоэта было отсутствие в произведениях средств художественной выразительности и хотя бы малой толики смысла. Решение этой проблемы стало основной задачей для разработчиков лингвистических нейронных сетей последних лет.

Как ни странно, решению этой проблемы способствовал рост интереса к рэпу, тексты которого не могут в целом конкурировать словарным запасом и образностью с произведениями поэтов. В 2017 году в Казани прошел первый рэп-баттл нейросетей «БИИТВА». За основу для написания текстов были взяты термины программирования, анализ произведений рэперов и поэтов. Разработчики роботов неумело зачитали сгенерированные строки, в которых сложно найти художественную ценность, хотя и можно рассмотреть отдельные образы. Пилотному выпуску шоу суждено было стать последним.

Поворотным моментом в становлении нейронной поэзии стали разработки хельсинского университета Аалто, который в 2017 году представил программу, писавшую рэп, анализируя тексты на английском и финском языках. Робот сохранял не только форму и стилистику текстов исполнителей, но воспроизводил в различных вариациях основные идеи и образы рэперов.

В том же году американский школьник Робби Баррат смог самостоятельно создать нейронную сеть, которая генерировала тексты, на основе творчество рэпера Канье Уэста. Кроме того, подросток научил программу зачитывать текст, учитывая интонацию, громкость и расстановку пауз. Позже, уже будучи одним из самых молодых сотрудников Стенфордского университета, тот же Робби Баррат научил робота рисовать «обнаженку», но это уже совсем другая история.

В 2018 году опыт и знания зарубежных коллег успешно переняли и дополнили разработчики «Яндекса». Нейросеть создала тексты в стиле самых популярных российских рэперов. Результаты работы программы озвучил известный блогер и пародист Кирилл Нечаев. Особый успех у слушателей приобрел текст нейросети, основанный на творчестве российского рэпера Oxxxymironа, ставший впоследствии вирусным:

«Как корабли плывем с тобой мы к берегам мироздания.

Это империя, чума повсюду, давит сознание.

И я плевать хотел на мнение юных дев этого муравейника.

Я горожанин мордора на пиру не сняв ошейника.

Я был богатым, был бедным, был как поэт не понят.

Повсюду элита, я в бегстве, но все равно в загоне.

Мы загоним эти продажные принципы в угол,

Чтоб наконец-то просто слышать тихий голос друг друга.»

Первой напечатанной книгой стихов, написанных компьютером, стал сборник «Нейролирика» (2018), созданный доцентом Школы лингвистики НИУ ВШЭ кандидатом филологических наук Борисом Ореховым. Книга включает стихи, сгенерированные на основе анализа произведений поэтов разных эпох и направлений: Гомера, Анны Ахматовой, Владислава Ходасевича, Андрея Сен-Сенькова, Осипа Мандельштама, Лесика Панасика и Галины Рымбу.

Не будем забывать о том, что наряду с лингвистическим нейросетями бурно развиваются роботы генерирующие видео- и аудиопродукцию. Дипфэйки досконально копируют внешность людей, нейросети мастерски подделывают голос. Например, проект Vera Voice Тимура Бекмамбетова осенью прошлого года представил выступление на основе голоса Владимира Высоцкого в театре на Таганке.

Не нужно обладать даром предвидения, чтобы спрогнозировать появление не только созданных с помощью нейронных сетей новых стихов давно умерших поэтов, которые будет сложно отличить от авторских, но и полноценных поэтических выступлений. Роботы смогут восстанавливать внешность и голос авторов.

Тема нейронной поэзии кажется настолько же опасной, насколько и интересной. Смогут ли живые авторы противостоять искусственному интеллекту или будут вынуждены отступить, как это произошло с шахматистами? Сможет ли машина освоить механизмы воздействия поэзии на человека? Ответы на эти и другие вопросы станут известны уже в ближайшие годы, а сейчас мы знаем главный недостаток роботов в создании произведений искусства. Машина способна идеально воспроизводить творчество в самых разных вариациях, но ни одна программа еще не смогла развить собственный стиль, создать что-то действительно новое. Возможно, когда-нибудь роботы научатся эволюционировать, приобретут склонность к новаторству, как в произведениях Айзека Азимова, но тогда и относиться к машинам нужно будет совсем иначе.

Джамиль Нилов

https://sovlit.ru/

 Обученные нейросети порождают собственные тексты, напоминающие исходники разными чертами стиля. Соблюдаются ритм, размер, синтаксис, интонации, излюбленные слова поэтов.

Сотрудники «Яндекса» в 2016 году выпустили альбом «Нейронная оборона» со стихами роботов, написанными в стиле Егора Летова, основателя группы «Гражданская оборона»).

https://music.yandex.ru/artist/4445922

Интерес к нейроэкспериментам явно растет. Похожее явление известно и в изобразительном искусстве. Нейросети, обученные распознавать изображения на картинах или фотографиях, порождают собственную живопись. Термин, обозначающий это явление, — инцепционизм (inceptionism) — отчасти можно перенести и на нейронную поэзию. Она тоже инспирирована уже существующими произведениями.

Нейросеть как математическая концепция способного к обучению искусственного интеллекта — задумка давняя. Она восходит к 1940-м годам, когда ученые пробовали воссоздать в технике биологические нейронные сети — человеческий мозг. 

В случае со стихами используются многослойные рекуррентные нейронные сети, которые работают с последовательностями — например, текстами, которые и есть цепочки слов и букв.

Сеть, которая умеет читать буквы, получает текст. Она старается в нем разобраться: выявить, почему одна буква следует за другой и предшествует третьей, с какой частотой это происходит и пр. 

Умные устройства чувствительны к объему обучающей выборки. Для того, чтобы порождать тексты приемлемого качества, им нужно проанализировать сотни тысяч стихотворных строк.

Обычно считается, что лирика — подчеркнуто авторское высказывание. Ее создатель выражает свои чувства, мысли, интенции. Это и есть сообщение, транслируемое текстом. Однако нейролирика ничего не сообщает. Компьютеры научились имитировать поэтический язык, эффектно расставлять слова. Но текст без автора «одновременно оказывается текстом без смысла признают исследователи.

https://hum.hse.ru

Нейросеть ruGPT-3 для генерации текстового контента

https://russiannlp.github.io/rugpt-demo/

PT-3 (Generative Pre-trained Transformer) — крупнейшая языковая модель в мире, разработанная компанией OpenAI для решения любых задач на английском языке. На русском языке, более сложном с точки зрения структуры, до появления ruGPT-3 аналогичных качественных моделей не существовало.

Отечественная GPT-3 постоянно обучается на суперкомпьютере Сбера «Кристофари» на гигантском массиве данных, так что её возможности растут с каждым днём.

RuGPT-3 может не только создавать тексты любого профиля (новости, романы, стихи, пародии, техническую документацию и так далее), но также исправлять грамматические ошибки, вести диалоги и писать программный код.

По сути, это прообраз общего, или сильного, искусственного интеллекта (Artificial General Intelligence, AGI), способного решать разноплановые задачи в различных сферах деятельности

К сожалению, не все так гладко.

https://www.cnews.ru/


Комментариев нет:

Отправить комментарий