Страница 1 из 9

Пытаясь проснуться

Пепперштейн Павел Викторович

Павел Пепперштейн, Нейро Пепперштейн

Пытаясь проснуться

Предисловие главного редактора Individuum

Перед вами необычная книга. Дело не только в том, что произведения Павла Пепперштейна, неутомимого выдумщика, творца сказочных миров и зачинателя психоделического реализма, сложно вообще назвать обычными. «Пытаясь проснуться» отличается как от случайных соседей по книжным полкам, так и от других книг Павла. Это первый в истории человечества опыт сотрудничества писателя и нейросети, зафиксированный в виде бумажной книги. Из 24 текстов в этом сборнике только половина принадлежит Пепперштейну – еще дюжину сочинил его цифровой «двойник». Можно назвать его суперкомпьютером, но точнее будет сказать, что 12 рассказов в этом сборнике написала генеративная нейросеть ruGPT-3, дополнительно обученная на корпусе текстов Павла и запущенная на суперкомпьютере «Кристофари» (для работы модели GPT-3 требуются мощности, в сотни раз превышающие возможности обычных лэптопов). «Двойник», прозванный разработчиками НейроПепперштейном (Павел же предложил имя Тесорйен), писал тексты в несколько заходов, с промежуточной калибрацией и дополнительным обучением. Дальше рассказы проходили многоступенчатую фильтрацию: сначала создатели нейросети, представители нескольких отделов «Сбера», в первую очередь исследовательского подразделения SberDevices – AGI NLP[1], – направляли «НейроПепперштейна» в нужное русло, следя за сходством текстов двух авторов и отсеивая брак, а затем наиболее удачные образцы машинного творчества отбирали мы с Павлом. Помимо создания архитектуры нейросети, ее обучения и отбора текстов вмешательство человека в творчество «НейроПепперштейна» ограничилось работой корректора. Другими словами, сочинения нейросети никак не подгонялись под человеческое представление о логике, складности и изяществе слога: вы прочитаете их в том виде, в котором их вывел алгоритм. В свою очередь, Павел познакомился с написанными машиной рассказами, прежде чем садиться писать свои, чтобы не только алгоритм обучался писать на его прозе, но и наоборот. Соображения по поводу замысла и реализации сборника Павел подробно излагает в послесловии к книге, поэтому не будем повторяться, скажем только, что работа любого талантливого стилиста в чем-то подобна деятельности нейросети, впитывающей нюансы чужой подачи, чтобы разгадать ее устройство и научиться воспроизводить. А любую работу, которую можно объяснить и разложить на последовательность действий, можно и автоматизировать.

С точки зрения же производственного процесса, важно отметить, что это не случай ста тысяч обезьянок за ста тысячами печатных машинок, когда из огромного массива случайных текстов можно вынуть те, что более-менее похожи на человеческие, – пул рассказов был не так уж велик, около пятидесяти, а весь процесс занял несколько месяцев. Как редактор я могу сказать, что почти все это были неплохие тексты. Если фокусироваться на характере текста – напоминающего вещий сон, – то здесь есть с чем провести параллели: Individuum выпускал мистические сказки Романа Михайлова, треть «Муравечества» Кауфмана – кислотный трип; конечно, вклад нейросети – по определению – безумен, но при этом она хорошо задает загадки и умеет рассказать историю. Не все люди так могут.

Вначале были сомнения. Первые пробы походили больше на макраме из творчества знакомого писателя – то здесь, то там попадались не аллюзии, а целиковые фразы. По словам тимлида AGI NLP Татьяны Шавриной, модель время от времени сбивалась на стихи (плохие), не создавала финалов для рассказа (могла генерировать текст бесконечно, постепенно уходя в абсурд), а пытаясь скомпоновать длинную фразу «в духе Пепперштейна», могла к концу предложения запутаться в родовых и падежных окончаниях. Потребовалось увеличить количество данных для дообучения и убрать из них все лишнее, чтобы нейросеть строже усвоила литературную форму рассказа. Модель теперь пишет более гладко и стабильно, без типовых ошибок, строже придерживается авторского стиля и – возможно, это просто кажется, – выбирает более деятельные сюжеты и более отрешённые диалоги, пробуждая в читателе отзвук поэтического чувства. Что до уникальных примет творчества нейросети, Шаврина указывает на зыбкость описываемого ею мира и на нестандартное словоупотребление: «Иногда „нейроавтор“ выражается необычно и неоднозначно – как и писатели-люди. Но ведь писатели – творцы новых слов и выражений. Возможно, однажды мы будем подхватывать популярные фразочки, даже не зная, что они от ruGPT-3 или какого-нибудь следующего поколения русскоязычных генеративных нейросетей». По мере усложнения модели нейрорассказчик обрел свою «интонацию» – сновидческую, афористичную, интуитивно понятную и немного тревожащую. Мы бы не стали выпускать сборник, если бы за ним не стояло ощущение небывалого технологического прорыва и успешности проведенной стыковки «человек – машина». Как сказал Денис Шевелев, сценарист и аналитик AGI NLP, занимавшийся подбором данных и первичной фильтрацией созданного нейросетью текста: «Трудность работы секретарем у писателя-машины была не в том, что время от времени генерация оказывалась неудачной. Наоборот, иногда труднее было поверить, что текст, который ты сейчас читаешь, создан не человеком… И дождаться от модели, когда она решит продолжать именно его, а не вилять сюжетно в одну или другую сторону, откуда может не вернуться к столь увлекательно начатой истории. Потому что каждое такое возвращение становилось открытием».

Важно подчеркнуть, что у каждого рассказа в «Пытаясь проснуться» – один автор. Мы решили, что так будет честнее – и это позволит объективнее продемонстрировать возможности и ограничения (о)нейрописьма. Мы не стали отнимать у читателей удовольствие угадывать, кому принадлежит тот или иной рассказ: человеку или машине. В разделе с содержанием книги мы оставили вам возможность поставить пометку, кто написал тот или иной рассказ, – и сравнить свои догадки с другими читателями. В будущем, с ростом мастеровитости нейроавторов, сделать правильный выбор будет намного сложнее.

С каждым днем мы все чаще сталкиваемся с деятельностью генеративных нейросетей, которые дорисовывают изображения (с их помощью делается уже львиная доля цифровых ремастеров старых фильмов и видеоигр), пишут музыку и код, поют за мертвых рок-знаменитостей, синтезируют фотографии людей, которых никогда не было. Как показывают исследования, эти порожденные машинами фотографии уже вызывают большее доверие, чем настоящие снимки. Да и исполнение нейросетью Курта Кобейна[2] находится на той грани правдопобия, где уже заканчивается «зловещая долина». К слову, в голографическом мареве обложки «Пытаясь проснуться» вы можете различить две картины. Одну написал Павел, а вторую – нейросеть, но другая (ruDall-E), впрочем, тоже предварительно «изучившая» творчество Пепперштейна-художника. Что касается литературы, то без участия человека нейросеть уже может справляться, например, с фанфиками, где сеттинг и известные читателю персонажи важнее, чем высокий стиль, – или с селфхелпом, который сводится по большей части к терапевтическим повторам однообразных душеспасительных советов. С конца прошлого десятилетия алгоритмы указывают на потенциальные бестселлеры западным издателям и продюсерам, а в прошлом году в Южной Корее вышел роман, целиком написанный нейроавтором. Можно предположить, что в будущем нейросети, заточенные на диалог с пользователем, смогут плести сюжеты для компьютерных игр и подменять сценаристов сериалов на поденной работе. Направление совместного творчества в рамках одного произведения, когда алгоритм предлагает завязку или сеттинг, а его белковый коллега развивает начатое, кажется не менее перспективным. Как выразился американский писатель и программист Робин Слоан, склепавший шесть лет назад простенькую оболочку для такого рода совместного сочинительства: «Представьте, что вы пишете с сумасшедшим, но очень начитанным попугаем на вашем плече». Впрочем, шесть лет назад успехи машинного перевода тоже оставляли желать лучшего, а сегодня специализированные инструменты в умелых руках справляются с переводами литературы определенных жанров[3]. Отдельно можно упомянуть, что человеческие представления о качестве текста – не единственные возможные и со временем AI-литературе и машинному глитчингу языка потребуются новые инструменты оценки, которые позволят выработать собственный канон. Чтобы задать планку гуманизма в отношениях с пишущими машинами, мы решили условиться, что переведем часть дохода от продаж книги – правда, не самому алгоритму, поскольку, будучи кодом, он лишен каких-либо потребностей, а суперкомпьютеру «Кристофари», для которого новая видеокарта или кулер – неплохая добавка к продолжительности жизни. На этом наша работа с нейросетями в литературной плоскости не заканчивается – единожды открыв этот ящик Пандоры, крайне сложно устоять от соблазна продолжить эксперименты. Появление НейроПепперштейна заставляет задуматься как о природе человеческой фантазии, так и о том, как строится наше восприятие литературы, – ведь в конечном счете именно читатель достраивает контекст и распознает сюжеты. И пока вы читаете этот сборник, сотрудничество человека и нейросети продолжается, но уже на другом уровне.

AGI NLP входит в состав Управления экспериментальных систем машинного обучения компании SberDevices. – Прим. ред.

https://www.youtube.com/watch?v=muT6x7VXx5I/. – Прим. ред.

Если вас интересуют возможности современного машинного перевода и перспективы автоматизации в разных областях человеческой деятельности, вам следует познакомиться с книгой Дэниела Сасскинда «Будущее без работы»: https://individuumbooks.ru/budushchee_bez_raboty/. – Прим. ред.