Страница 6 из 14
Эффективность форсайта во многом зависит от того, насколько правительство способно использовать «большие данные» и прогнозный анализ. Новейшие системы хранения данных позволяют накапливать информацию в различных форматах и во все увеличивающихся объемах. Предполагается, что с 2013 по 2020 год «цифровая вселенная» вырастет в десять раз – с 4,4 трлн до 44 трлн гигабайт. Международная консалтинговая компания International Data Corporation (IDC) предполагает, что объем хранимых данных к 2016 году вырастет до 3,77 зеттабайт[18]. Согласно IDC, сегодня только 5 % данных являются «ценными или многоцелевыми», однако эта цифра к 2020 году увеличится более чем вдвое благодаря большим данным и другим технологиям[19].
Создание данных – постоянный и повсеместный процесс. Что бы мы ни делали, будь то управление автомобилем, включение домашних приборов или использование мобильного телефона, – мы производим данные. С помощью датчиков, пронизывающих ткань нашего физического мира, и портативных устройств доступа в интернет – мы производим данные. Добавьте сюда компании, производящие и хранящие данные всех видов, фиксирующие мельчайшие детали миллиардов контактов между участниками рынка, и правительства, собирающие информацию о своих гражданах – об их здоровье, поездках, домашнем хозяйстве и финансовых делах. Такие массивы данных порождают возможности, но и создают проблемы, связанные с их организацией, хранением, поиском, анализом и отображением. Эти задачи решаются средствами больших данных.
Точное происхождение термина «большие данные» неизвестно. Многие считают, что впервые его употребил еще в 1990-х годах Джон Мэши, главный научный сотрудник компании Silicon Graphics[20]. Но какова бы ни была этимология этого термина, большие данные приобретают все большую важность и для государственного, и для частного сектора.
Большие данные – серия подходов, инструментов и методов обработки огромных объемов структурированных и неструктурированных данных, с которыми не могут эффективно справляться стандартные инструменты. Одним из способов описания больших данных является модель 3V, разработанная фирмой Gartner, ведущей исследования в области информационных технологий. Эти три V–Volume (объем), Velocity (скорость), Variety (многообразие), то есть физический объем, скорость прироста и обработки, а также диапазон типов и источников данных. В большие данные входят и те данные, которые хранятся в памяти, и те, которые создаются с использованием других данных.
Большие данные не только порождают проблемы, но и создают беспрецедентные возможности и для государственного, и для частного сектора. Наряду с новейшими, передовыми инструментами управления базами данных и методами прогнозного анализа, большие данные открывают доступ к ценной информации о множественных взаимосвязях, закономерностях и воздействиях.
Преобразования в действии: здоровье нации
Феномен больших данных – революционный фактор как для сферы государственного управления, так и для многих отраслей экономики. Организации государственного сектора аккумулируют огромные массивы информации. В Великобритании, например, Национальная служба здравоохранения (NHS), одна из самых больших в мире финансируемых государством систем здравоохранения и крупнейший работодатель, хранит гигантский объем клинической информации и данных о пациентах. Помимо прочего, NHS публикует данные по каждому медицинскому назначению, сделанному каждым врачом по месяцам, что в итоге составляет 400 миллионов точек данных[21]. Сегодня большие данные NHS используются государственными службами для анализа работы этой службы и поиска путей ее усовершенствования.
Например, компания Mastodon C, специализирующаяся на больших данных, проводит оценку работы NHS через разнообразный анализ клинических данных[22]. Целью одного из исследований было изучение работы клиник врачей общей практики. Mastodon C использовал данные, чтобы определить, влияет ли размер клиники на внедрение передовых методов работы, – оказалось, что в небольших клиниках этот процесс идет медленнее, чем в крупных. Кроме того, выяснилось, что небольшие клиники реже прописывали новое лекарство от диабета, чем крупные. Однако данные также показали, что соседство клиник явилось более существенным фактором внедрения рекомендованных методов, нежели их размер[23]. А исследуя, как в различных клиниках прописывают патентованные лекарства и воспроизведенные лекарства – дженерики, команда из Mastodon C пришла к выводу, что патентованные статины прописываются гораздо чаще, чем дженерики, – и эта разница обходилась NHS приблизительно в 200 млн ф. ст. в год[24].
Работы Глобального института McKinsey (MGI) подтвердили вывод о том, что использование больших данных способно повысить эффективность и результативность общественного сектора[25]. Согласно оценке MGI, эффективное использование больших данных могло бы снизить административные издержки в Европейском союзе на 15–20 %, что эквивалентно примерно 150–300 млрд евро в стоимостном выражении (как результат роста эффективности, так и за счет ликвидации разрыва между потенциальной и фактической суммой поступлений от сбора налогов).
В отчете указано пять широких областей, в которых большие данные могут существенно помочь правительствам. Бóльшая прозрачность и обмен данными между министерствами позволят, например, ведомствам, федеральным органам и гражданам оптимизировать заполнение различных форм, поскольку многие данные, запрашиваемые у организаций и физических лиц одним государственным органом, нередко хранятся в другом.
Опираясь на принцип открытых данных, правительства смогут предоставлять гражданам и организациям доступ к некоторым из имеющихся у них информационным массивам, что будет способствовать прогрессу во многих областях, экономии средств и совершенствованию обслуживания населения. Примеры использования этого принципа приводятся на британском сайте data.gov.uk и на испанском сетевом портале Aporta (www. proyectoaporta.es). В частности, местный информационный ресурс может стать результатом объединения возможностей социальных сетей и доступа к данным открытых правительственных источников, например статистике преступлений или погодных катаклизмов. Открытая информация может также использоваться для оценки качества услуг и предложения возможных усовершенствований.
Доступ к большим данным позволяет правительству более подробно анализировать деятельность своих министерств и ведомств, сравнивать их результаты. В отчете McKinsey предполагается, что использование «приборных панелей» результативности (рейтингов и визуализации данных) отдельных коллективов в составе государственных ведомств приведет к совершенствованию их деятельности, поскольку менеджеры будут стремиться превзойти друг друга.
Разнообразие вариантов, отраженное в больших данных, поможет гражданам более взвешенно принимать жизненно важные решения – например, при выборе больницы для лечения определенных заболеваний или школы для детей. Весьма вероятно, что предоставление широкого доступа к таким данным позволит улучшить качество услуг в целом.
Ценность больших данных для развития сегментации и улучшения планирования целевых государственных услуг уже доказана во многих странах. Так, например, Федеральное агентство по труду Германии использовало массу накопленных им данных за прошедшие периоды, чтобы ускорить процесс трудоустройства безработных[26].
18
www.computerworld.com/slideshow/detail/143723
19
www.emc.com/leadership/digital-universe/2014iview/executive-summary.htm
20
www.bits.blogs.nytimes.com/2013/02/01/the-origins-of-big-data-anetymo-logical-detective-story/?_r=0
21
www.youtube.com/embed/VKAdGEEgC5o?autoplay=1
22
More about Mastodon C at www.blog.mastodonc.com/
23
www.youtube.com/embed/VKAdGEEgC5o?autoplay=1
24
www.openhealthdata.cdehub.org/
25
«Big Data: The Next Frontier for I
26
www.googlepolicyeurope.blogspot.co.uk/2012/05/2012-year-of-big-data.html