Страница 5 из 11

Технологии будущего против криминала

Овчинский Владимир Семенович

Технология глубинного обучения коренным образом изменила сам характер исследований в области ИИ, вдохнув новую жизнь в позабытые было амбициозные планы по созданию компьютерного зрения, распознаванию речи, обработке естественных языков, реализации проектов в области робототехники. Первые программы распознавания речи были созданы в 2012 г. (например, всем известный сервис Google Now). Затем стали появляться приложения, распознающие фотографии (данная функция в настоящее время интегрирована в сервис Google Photos).

До недавнего времени искусственные нейронные сети использовались в значительной степени для распознавания статичных образов. Однако постепенно получил известность другой тип нейро-сетей – рекуррентные нейронные сети, которые стали применяться в основном для анализа процессов, протекающих во времени. В частности, такие сети оказались способны корректно выполнять обработку аудио- и видеоизображений, а также некоторых других видов информации. Последовательные данные состоят из блоков (фонем, слов), которые следуют друг за другом. Процесс обработки входных сигналов с помощью рекуррентных нейросетей имеет сходство с работой мозга, ведь и в головном мозге во время обработки информации, поступающей от органов чувств, происходит постоянное изменение сигналов, циркулирующих между нейронами. Получается, что состояние каждого нейрона во внутренних слоях постоянно меняется в зависимости от мощности сигналов, поступающих в головной мозг из внешней среды, а на выходе мы получаем последовательность команд, которые инициируют двигательную активность разных частей тела, направленную на достижение конкретной цели.

Рекуррентные нейронные сети способны предсказывать, например, каким будет следующее слово в предложении, а оно, это слово, в свою очередь тоже может использоваться для генерирования новых последовательностей слов. Кроме того, с помощью рекуррентных нейронных сетей можно решать и более сложные задачи.

Нейросети могут использовать временную память компьютера для обработки нескольких рассредоточенных кусков информации (например, идеи, содержащиеся в различных предложениях, разбросанных по документу).

Дэвид Кроуфорд, директор по разработке программного обеспечения в компании Alation, которая занимается каталогизацией данных, полагает, что сейчас по-прежнему существуют области, где алгоритмы нуждаются в людях. Искусственный интеллект может работать только в тех сферах деятельности, которые человек может точно описать.

Работа аналитика выходит за рамки проведения анализа в закрытой среде. Анализ должен быть применен к внешнему миру, где контекст влияет на интерпретацию результатов.

Маловероятно, что в ближайшее время алгоритмы научатся понимать людей. Этого не случится, пока человечеству не удастся улучшить интерфейсы взаимодействия мозга человека и компьютера.

Будущее аналитиков менее мрачно, чем об этом говорится в заголовках СМИ. Достижения в области ИИ во многом напоминают эффективных помощников, а не замену аналитикам. В будущем аналитики получат группу алгоритмов с ИИ, которые будут проводить анализ данных. Задача аналитиков будет состоять в том, чтобы указать ИИ на правильные вопросы для анализа и решить, как применять результаты анализа для решения проблем в реальном мире. Пока конечный потребитель аналитики – человек, аналитики никуда не денутся.

Лидером внедрения искусственного интеллекта в процесс борьбы с преступностью является ФБР США. Основные работы в этом направлении ведутся Информационном центре ФБР (NCIC).

NCIC – это метабаза, включающая на начало 2017 года 21 базу данных, содержащих досье на 12 млн. активных индивидуальных преступников и членов преступных организаций. NCIC в среднем отвечает на 14 млн. запросов в день. Помимо ФБР, NCIC обслуживает более 90 тыс. точек доступа в органах уголовного правосудия, а также судах, прокуратуре, системе исправительных учреждений и т.п.

Информационный центр ФБР находится в разгаре модернизации, известной как проект N3G. В рамках проекта в систему включаются принципиально новые блоки обработки и анализа информации, базирующиеся на интеллектуальном анализе Больших данных. В 2017 г. началось сооружение и оснащение здания нового Центра данных и вычислений взамен действующего.

Новый Центр будет запущен в рамках проекта N4G. По площади он будет в 12 раз превосходить действующий в настоящее время Центр в Бриджпорте (штат Коннектикут), и иметь более чем в 50 раз большую емкость и мощность хранения и обработки данных. Предусматривается, что Центр будет подключен к национальной сети суперкомпьютеров АНБ и Министерства энергетики. Программно-аппаратная архитектура Центра проектируется вокруг программно-аппаратных комплексов искусственного интеллекта.

Работы ведутся совместно с Лабораторией искусственного интеллекта корпорации Google выработали инженерное определение искусственного интеллекта, о котором говорилось в предыдущей главе. Именно оно будет положено в разработку концепции архитектуры и перечня программных решений для N4G.

Особое внимание ФБР уделяет скачкообразному увеличению быстродействия компьютеров. От многих из нас укрылось определяющее обстоятельство. Выигрыш компьютеров в Го у человека был осуществлен не просто компьютером Google, а программно-аппаратным комплексом, где за программу отвечали алгоритмисты Google, а железо сделала канадская компания, недавно купленная Google – Google Deep Mind. Deep Mind – это единственная сегодня компания в мире, которой удалось создать действующий квазиквантовый компьютер. Квази потому, что значительная часть вычислений осуществляется в рамках традиционного кремниевого электромеханического компьютера, и лишь некоторые выполняет квантовый компонент. Но даже в таком виде обеспечивается на порядки более высокая скорость, чем у современных кремниевых суперкомпьютеров. Чем выше скорость, тем проще осуществлять глубокое обучение методом проб и ошибок.

Двусторонние и многосторонние встречи, открытые конференции и совещания за закрытыми дверями позволили определить основные направления использования искусственного интеллекта и его элементов в работе ФБР и полиции штатов. Эти направления нашли отражение в концепции N4G. В число основных направлений включаются:

1. Использование в аналитико-ситуационных центрах в офисах ФБР на местах и аналогичных офисах полиции штатов программно-аппаратной среды с единой интегральной обработкой файлов различной размерности и формы представления, включая текстовые, табличные, аудио, видео, сигналы от датчиков, банковские транзакции, показания локации и т.п.

До конца 2017 г. минимум в пяти полицейских управлениях на уровне штатов и в двух отделах ФБР будут запущены подобные пилотные ситуационные центры.

2. В настоящее время ФБР и полиция подвергается частично оправданной критике за хранение избыточной информации об американцах. Например, в 2016 г., в Конгрессе США рассматривался доклад Центра по конфиденциальности и технологиям университета Джорджтауна. В ходе дискуссий по докладу выяснилось, что в настоящее время в базе данных ФБР и полиции содержатся биометрические данные на 130 млн. американцев, т.е. более половины взрослого населения страны. В ходе обмена мнениями стороны согласились, что порядка 35 млн. единиц хранения являются избыточными, поскольку эти люди никогда не совершали противоправных поступков, не имели связей и отношений с террористами и преступниками, а также не совершали предосудительных поступков в общественном плане. На этом совещании представитель ФБР был вынужден признать, что в базе не оказалось примерно полутора миллиона единиц хранения биометрических данных американцев, впервые совершивших преступления в период 2010-2015 гг. (Полные профили, включающие до 50 параметров содержатся на 12 млн. американцев. В то же время на 130 млн. американцев в базе ФБР содержатся фотографии, голосовые данные и т.п. Они не считаются полным профилем и не составляют индивидуальный идентификационный файл гражданина).