Страница 4 из 6
В 2009 пионер SETI Сет Шостак начал проповедовать идею о том, что если человечество когда-нибудь соберётся отправить к звёздам хоть что-нибудь, то пусть лучше это будет всё — полное содержимое нашей Всемирной паутины. Передача современного состояния Сети в микроволновом диапазоне заняла бы месяцы, но доставить её по определённому адресу посредством высокоскоростного оптоволокна можно меньше чем за день.
Однако, как выяснилось, обитатели 47 Ursae Majoris опередили нас, отправив нам то, что мы окрестили Ретикулумом — их инопланетный аналог Всемирной паутины.
— Мои предшественники в лаборатории первыми занялись автоматическим подписыванием изображений, — говорила Эмили. — Это настолько привычная функция в современных камерах, что мы о ней даже не задумываемся. Однако по большей части именно разработанные для неё методы позволили нам разобраться в Ретикулуме. — Она стояла у настенного монитора в Обществе Межзвёздных Коммуникаций; монитор демонстрировал изображение трёх инопланетян.
Ханна Плакстон пригляделась к подписи под изображением.
— Доктор лечит пациента, — прочитала она вслух.
— Верно, — сказала Эмили. Она взмахнула рукой, и на фото появились надписи, идентифицирующие изображённые на нём объекты: «доктор», «пациент», «субъект», «лоток», «оборудование».
Ханна указала на «субъект».
— А этот тип почему не упомянут?
Эмили кивнула.
— Фото подписывают нейронные сети; они всё время обучаются. Чем больше изображений они видели, тем лучше у них получается выделять главное. Посмотрите на глазные стебельки двоих, упомянутых в подписи. Стебельки доктора обращены к пациенту; она смотрит на пациента. А стебельки пациента? Они обращены к доктору. Эти двое смотрят друг на друга. Но что же третий, почему он не упомянут? Программа, разумеется, увидела его, однако он не смотрит ни на кого из двух других; его глаза повёрнуты к чему-то за пределами кадра. И потому программа решила, что он просто случайно попавший в кадр прохожий и не является частью изображённой на фото сценки.
— Интересно, — сказала Ханна. — На большинстве наших фото — то есть, фото, сделанных людьми — люди на фотографии смотрят не друг на друга, а в камеру.
— Правильно. И, если задуматься, это так неестественно. Собственно, если такое случается в телешоу или в кино, нас это отталкивает — актёры почти никогда не разворачиваются прямо к камере. Однако Ретикулум, похоже, вообще не содержит постановочных фото. И, я уверена, это многое может сказать об их обществе. В любой цивилизации камеры становятся дешёвыми и вездесущими. И хранение информации тоже дешевеет так, что вы записываете всё подряд.
— А как же тайна частной жизни?
— Возможно, в этой цивилизации она вообще никогда не считалась ценностью. Посмотрите, как мало одежды на них надето. И вся она сугубо функциональна: пояс с карманами для всякой всячины, или защитное снаряжение, или узорчатые ленты. Ни одна часть их анатомии не остаётся прикрытой всегда, так что у них явно отсутствует табу на наготу. Кроме того, полно снимков, на которых субъекты на заднем плане, по-видимому, занимаются сексом.
— То есть даже для этого они не ищут уединения?
— Возможно, нам оно требовалось, потому что во время секса мы особенно уязвимы для внезапной атаки. Однако когда повсюду постоянно работающие камеры, ты, вероятно, всегда чувствуешь себя в полной безопасности, так что к чему стесняться? Для нас в любом изображении, на котором изображён секс, неважно, на переднем плане или на заднем, он будет тем, на чём фокусируется наше внимание. Но из положения глазных стебельков ясно, что у них этому акту не придаётся никакого особенного значения. Секс не игнорируется — нет, инопланетяне не отводят скромно взгляд, когда видят пару, занимающуюся сексом; есть много фотографий, на которых посторонние смотрят на происходящее. Но нельзя сказать, что их непропорционально много.
— Это объясняет, почему их Ретикулум меньше, чем наша Паутина: нет табу на наготу и секс — нет порнографии. Наша сеть полегчала бы на целые зеттабайты, если бы в ней не было всего этого дела.
— Именно. Но это ещё не всё. У инопланетян три руки. У самцов две слева и одна справа, у самок наоборот. Это довольно странный диморфизм, но можно понять, каким образом он закрепился в ходе эволюции. Они прислали нам множество изображений семейных групп; самец и самка по бокам, ребёнок посередине. Они не держатся за клешни, однако самка кладёт левую клешню ребёнку на одно плечо, а самец — правую клешню на другое, и таким образом ребёнок оказывается под защитой, в то время как у каждого из взрослых остаётся две свободные руки с внешней стороны, верно?
— Ну… да, — сказала Ханна.
— Алгоритмы разглядели в этом более глубокий смысл. Сознательно или нет, инопланетяне явно помещают ценные для них вещи с той стороны, где у них одна рука. Мы назвали их «моносторона» и «бисторона», и всё, имеющее большую ценность и нуждающееся в защите, всегда находится на моностороне.
— И всё это сделали алгоритмы? Начав с нуля?
— Не с нуля. Они начали с сотен миллионов изображений, каждое из которых просмотрели с терпением и вдумчивостью, недоступной человеку.
Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.
— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.
— Спасибо.
— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.
— Спасибо. Это была командная работа.
— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?
— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.
Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.
Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.
— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.
— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».
— Должна признаться, что я и сам не знаю, в чём разница.