Страница 5 из 11
Технология глубинного обучения коренным образом изменила сам характер исследований в области ИИ, вдохнув новую жизнь в позабытые было амбициозные планы по созданию компьютерного зрения, распознаванию речи, обработке естественных языков, реализации проектов в области робототехники. Первые программы распознавания речи были созданы в 2012 г. (например, всем известный сервис Google Now). Затем стали появляться приложения, распознающие фотографии (данная функция в настоящее время интегрирована в сервис Google Photos).
До недавнего времени искусственные нейронные сети использовались в значительной степени для распознавания статичных образов. Однако постепенно получил известность другой тип нейро-сетей – рекуррентные нейронные сети, которые стали применяться в основном для анализа процессов, протекающих во времени. В частности, такие сети оказались способны корректно выполнять обработку аудио- и видеоизображений, а также некоторых других видов информации. Последовательные данные состоят из блоков (фонем, слов), которые следуют друг за другом. Процесс обработки входных сигналов с помощью рекуррентных нейросетей имеет сходство с работой мозга, ведь и в головном мозге во время обработки информации, поступающей от органов чувств, происходит постоянное изменение сигналов, циркулирующих между нейронами. Получается, что состояние каждого нейрона во внутренних слоях постоянно меняется в зависимости от мощности сигналов, поступающих в головной мозг из внешней среды, а на выходе мы получаем последовательность команд, которые инициируют двигательную активность разных частей тела, направленную на достижение конкретной цели.
Рекуррентные нейронные сети способны предсказывать, например, каким будет следующее слово в предложении, а оно, это слово, в свою очередь тоже может использоваться для генерирования новых последовательностей слов. Кроме того, с помощью рекуррентных нейронных сетей можно решать и более сложные задачи.
Нейросети могут использовать временную память компьютера для обработки нескольких рассредоточенных кусков информации (например, идеи, содержащиеся в различных предложениях, разбросанных по документу).
Дэвид Кроуфорд, директор по разработке программного обеспечения в компании Alation, которая занимается каталогизацией данных, полагает, что сейчас по-прежнему существуют области, где алгоритмы нуждаются в людях. Искусственный интеллект может работать только в тех сферах деятельности, которые человек может точно описать.
Работа аналитика выходит за рамки проведения анализа в закрытой среде. Анализ должен быть применен к внешнему миру, где контекст влияет на интерпретацию результатов.
Маловероятно, что в ближайшее время алгоритмы научатся понимать людей. Этого не случится, пока человечеству не удастся улучшить интерфейсы взаимодействия мозга человека и компьютера.
Будущее аналитиков менее мрачно, чем об этом говорится в заголовках СМИ. Достижения в области ИИ во многом напоминают эффективных помощников, а не замену аналитикам. В будущем аналитики получат группу алгоритмов с ИИ, которые будут проводить анализ данных. Задача аналитиков будет состоять в том, чтобы указать ИИ на правильные вопросы для анализа и решить, как применять результаты анализа для решения проблем в реальном мире. Пока конечный потребитель аналитики – человек, аналитики никуда не денутся.
Лидером внедрения искусственного интеллекта в процесс борьбы с преступностью является ФБР США. Основные работы в этом направлении ведутся Информационном центре ФБР (NCIC).
NCIC – это метабаза, включающая на начало 2017 года 21 базу данных, содержащих досье на 12 млн. активных индивидуальных преступников и членов преступных организаций. NCIC в среднем отвечает на 14 млн. запросов в день. Помимо ФБР, NCIC обслуживает более 90 тыс. точек доступа в органах уголовного правосудия, а также судах, прокуратуре, системе исправительных учреждений и т.п.
Информационный центр ФБР находится в разгаре модернизации, известной как проект N3G. В рамках проекта в систему включаются принципиально новые блоки обработки и анализа информации, базирующиеся на интеллектуальном анализе Больших данных. В 2017 г. началось сооружение и оснащение здания нового Центра данных и вычислений взамен действующего.
Новый Центр будет запущен в рамках проекта N4G. По площади он будет в 12 раз превосходить действующий в настоящее время Центр в Бриджпорте (штат Коннектикут), и иметь более чем в 50 раз большую емкость и мощность хранения и обработки данных. Предусматривается, что Центр будет подключен к национальной сети суперкомпьютеров АНБ и Министерства энергетики. Программно-аппаратная архитектура Центра проектируется вокруг программно-аппаратных комплексов искусственного интеллекта.
Работы ведутся совместно с Лабораторией искусственного интеллекта корпорации Google выработали инженерное определение искусственного интеллекта, о котором говорилось в предыдущей главе. Именно оно будет положено в разработку концепции архитектуры и перечня программных решений для N4G.
Особое внимание ФБР уделяет скачкообразному увеличению быстродействия компьютеров. От многих из нас укрылось определяющее обстоятельство. Выигрыш компьютеров в Го у человека был осуществлен не просто компьютером Google, а программно-аппаратным комплексом, где за программу отвечали алгоритмисты Google, а железо сделала канадская компания, недавно купленная Google – Google Deep Mind. Deep Mind – это единственная сегодня компания в мире, которой удалось создать действующий квазиквантовый компьютер. Квази потому, что значительная часть вычислений осуществляется в рамках традиционного кремниевого электромеханического компьютера, и лишь некоторые выполняет квантовый компонент. Но даже в таком виде обеспечивается на порядки более высокая скорость, чем у современных кремниевых суперкомпьютеров. Чем выше скорость, тем проще осуществлять глубокое обучение методом проб и ошибок.
Двусторонние и многосторонние встречи, открытые конференции и совещания за закрытыми дверями позволили определить основные направления использования искусственного интеллекта и его элементов в работе ФБР и полиции штатов. Эти направления нашли отражение в концепции N4G. В число основных направлений включаются:
1. Использование в аналитико-ситуационных центрах в офисах ФБР на местах и аналогичных офисах полиции штатов программно-аппаратной среды с единой интегральной обработкой файлов различной размерности и формы представления, включая текстовые, табличные, аудио, видео, сигналы от датчиков, банковские транзакции, показания локации и т.п.
До конца 2017 г. минимум в пяти полицейских управлениях на уровне штатов и в двух отделах ФБР будут запущены подобные пилотные ситуационные центры.
2. В настоящее время ФБР и полиция подвергается частично оправданной критике за хранение избыточной информации об американцах. Например, в 2016 г., в Конгрессе США рассматривался доклад Центра по конфиденциальности и технологиям университета Джорджтауна. В ходе дискуссий по докладу выяснилось, что в настоящее время в базе данных ФБР и полиции содержатся биометрические данные на 130 млн. американцев, т.е. более половины взрослого населения страны. В ходе обмена мнениями стороны согласились, что порядка 35 млн. единиц хранения являются избыточными, поскольку эти люди никогда не совершали противоправных поступков, не имели связей и отношений с террористами и преступниками, а также не совершали предосудительных поступков в общественном плане. На этом совещании представитель ФБР был вынужден признать, что в базе не оказалось примерно полутора миллиона единиц хранения биометрических данных американцев, впервые совершивших преступления в период 2010-2015 гг. (Полные профили, включающие до 50 параметров содержатся на 12 млн. американцев. В то же время на 130 млн. американцев в базе ФБР содержатся фотографии, голосовые данные и т.п. Они не считаются полным профилем и не составляют индивидуальный идентификационный файл гражданина).