Страница 17 из 19
Группа эмоционального программирования выдвинула множество идей и создала множество проектов и изобретений, но одним из самых действительно важных результатов ее работы в лаборатории стали ее партнерские связи. В группе работало множество невероятно талантливых людей, и у многих из них сложились важные деловые отношения. В частности, одно партнерство послужило началом ряда новых технологий и коммерческих предприятий.
Рана эль Калиуби родилась и выросла в Каире, Египет, и там же получила степень бакалавра и магистра. Во время учебы в магистратуре у нее появилась идея использовать компьютеры, чтобы изменить связи людей друг с другом. Примерно в то же время ее жених Уаэль Амин, основавший технологический стартап в Каире, дал ей прочесть отзыв на знаменитую книгу Пикард 1997 года. Эль Калиуби заказала книгу и – через четыре месяца получив книгу – прочла ее. Она посчитала работу Пикард вдохновляющей, не в последнюю очередь потому, что ее написала женщина-инженер, которая стала для нее образцом для подражания, а позже учителем. Благодаря книге Пикард эль Калиуби решила, что будет заниматься разработкой систем, способных читать выражения лиц.
После магистратуры – темой диплома была система слежения за выражением лица – эль Калиуби приехала в Англию. Она собиралась получить докторскую степень в Кембриджском университете, но оказалось, что там никто не знал об эмоциональном программировании. Ее засыпали вопросами о том, почему она выбрала именно это направление. На одной из ее презентаций присутствовавший в аудитории молодой человек рассказал, что ему знакомы некоторые проблемы, возникшие перед эль Калиуби, потому что у его брата такие проблемы возникают каждый день. Его брат был аутистом.
Эль Калиуби ничего не знала об аутизме и начала исследования в этой области, поскольку надеялась найти подсказки. Когда она начала работу, директор Центра исследования аутизма, эксперт в области когнитивной нейробиологии Саймон Барон-Коэн сам работал над созданием видеокаталога выражений человеческого лица. Проект должен был помочь людям, страдающим расстройствами аутического спектра, распознавать выражения лица, поскольку неспособность читать человеческую мимику – широко распространенная проблема среди аутистов. Каждый видеоролик оценивала коллегия из двадцати специалистов. В результате в рамках проекта собрали свыше четырехсот одобренных видеороликов, которые эль Калиуби могла использовать для обучения своих программ. Алгоритмы машинного обучения обрабатывали все видеоролики, снабженные меткой отдельной эмоции – например, радости или смущения, – а затем находили общие черты в лицах, показанных во всех роликах. Программа знала, как выглядит то или иное выражение лица, и могла обучаться за счет дополнительных примеров и обратной связи.
Однажды настанет время, когда во все устройства будет встроен эмоциональный чип. Ваше устройство будет реагировать на ваши эмоции и приспосабливаться к ним.
В результате эль Калиуби разработала первый «протез» социальных навыков – очки с вмонтированной веб-камерой, которая выводила изображение на диодные дисплеи, обращенные к пользователю. Во время беседы устройство определяло выражение лица слушателя и предоставляло владельцу обратную связь в режиме реального времени. Светодиодный экран светился зеленым, желтым или красным цветом в зависимости от того, заинтересован собеседник в разговоре, настроен нейтрально или ему скучно. К концу пребывания в Кембридже эль Калиуби разработала систему, которая с точностью 88 % распознавала не только базовые эмоции, но и достаточно большой спектр выражений. Она дала устройству название MindReader.
В 2004 году, когда эль Калиуби разрабатывала MindReader в рамках работы над докторской диссертацией, ее лабораторию в Кембридже посетила Розалинд Пикард. Женщины очень быстро нашли общий язык15. Сложность и стабильность системы эль Калиуби произвели такое впечатление на Пикард, что они вместе усовершенствовали MindReader. Эль Калиуби попросила Пикард дать оценку ее докторской диссертации, а Пикард пригласила эль Калиуби в группу эмоционального программирования при Междисциплинарной исследовательской лаборатории. В 2006 году, получив докторскую степень, эль Калиуби присоединилась к группе. Они успешно работали вместе и вскоре получили от Национального научного фонда около миллиона долларов на разработку iSET, «протеза» эмоциональных навыков, на основе созданной эль Калиуби программы FaceSense.
Пикард и эль Калиуби сотрудничали по ряду проектов, основанных на технологиях iCalm и MindReader. На протяжении пяти лет они разрабатывали и тестировали свои устройства на детях в Гроден-центре и центре исследования аутизма в Провиденсе, Род-Айленд. Они просвещали людей, испытывающих проблемы с переживанием и распознанием эмоций, и работа в этой области была успешной.
Междисциплинарная исследовательская лаборатория дважды в год организовывала «спонсорскую неделю», когда сотрудники демонстрировали свои проекты корпоративным спонсорам, то есть компаниям, понимавшим потенциал того или иного исследования. Помимо благосклонности, которую обеспечивала эта информационно-просветительская акция, исследователи получали обратную связь. Хотя прогресс в работе Пикард и эль Калиуби впечатлял спонсоров, они считали объем работы над проектами недостаточным. Ученым постоянно говорили, что их технологии имеют огромный коммерческий потенциал, в частности для присвоения коммерческим продуктам марочных названий и исследования товарного рынка. Через некоторое время приложение MindReader загрузили на серверы Междисциплинарной лаборатории, и корпоративные спонсоры смогли протестировать продукт на стадии разработки. Приложение быстро стало самым скачиваемым продуктом лаборатории. Несмотря наживой интерес спонсоров, вместе с популярностью пришел и целый ряд вопросов. Самые разные компании хотели знать, что это за разработка и что она означает. Банк Америки, а также компании FOX, Gibson, HP, Hallmark, Microsoft, NASA, Nokia, Pepsi, Toyota и Yamaha продемонстрировали заинтересованность в приложении. Пикард и эль Калиуби были польщены, что их разработка может найти коммерческое применение помимо помощи людям, страдающим аутизмом, но и немного напуганы. Все же они были учеными, а не бизнесменами. Они хотели заниматься исследовательской работой, а не запускать стартапы.
Точность разрабатываемых устройств и систем продолжала постепенно повышаться. Одно из полезных качеств алгоритмов машинного обучения заключалось, в общих чертах, в том, что чем больше данных получали программы, тем лучше они становились. Некоторые модификации повышали скорость распознавания, например асимметричный сканер рта, созданный для систем распознавания лиц. Сначала системы распознавали рот человека симметрично. Но форма и расположение рта у человека часто отличается с разных сторон. При ухмылке, а также насмешливой или кривой улыбке левая сторона рта обычно отличается от правой. Сканер рта считывал данные с двух сторон независимо друг от друга, и точность распознавания значительно повысилась.
Несмотря на периодические модификации, машинное обучение еще было куда улучшать. Чтобы усовершенствовать точность программ, требовалось как можно больше примеров для обучения – огромные объемы данных. К сожалению, сотрудники группы по эмоциональному программированию не могли предоставить образцы в таком количестве. Более того, процесс получения образцов был трудоемким. Были необходимы тысячи, вернее десятки, а возможно, и сотни тысяч людей для обучения систем. Позже Пикард подсчитала, что если продолжить добывать образцы тем же способом, которым добывали до этого, процесс обошелся бы в миллиард долларов! Несмотря на все успехи лаборатории, получить такой бюджет было за гранью возможного.
Запросы от спонсоров продолжали поступать, и в конце концов Пикард и эль Калиуби обратились к директору лаборатории Фрэнку Моссу с просьбой привлечь к проекту больше исследователей. Мосс отказал, сказав, что для дальнейшего развития технологии нужно ориентироваться на бизнес-проекты. Мосс дал совет: «Пришло время действовать самостоятельно», добавив, что коммерческое использование сделает приложения более стабильными и многофункциональными16. Женщины хотели заниматься исследованиями, а не управлять компанией, но понимали, что выход на рынок неизбежен. Чтобы усовершенствовать разработку и повысить ее качество, придется выйти за пределы привычной академической среды и с головой погрузиться в жестокий мир бизнеса.