Страница 2 из 6
Учетные данные, помогающие принимать решения по персоналу (мы уже говорили о них), являются структурированными (легко представляются в виде таблицы), количественными и относительно небольшими по объему (не более терабайта или двух даже в очень крупных компаниях). Такие данные традиционно использовались в аналитике, поэтому назовем их малыми данными. Долгое время аналитики ни с чем другим дела не имели.
Но сегодня крупные компании, некоммерческие организации и даже стартапы сталкиваются с так называемыми большими данными – неструктурированными массивами информации колоссальных объемов. Их источниками могут быть онлайновые дискуссии в интернете, видеоматериалы или данные анализа ДНК пациентов больницы. У данных такого рода объем намного больше – иногда тысячи петабайт[3]. Например, Google обрабатывает порядка 24 петабайт интернет-данных ежедневно, а AT&T[4] передает по телекоммуникационным сетям около 30 петабайт музыки и прочих данных в день. Благодаря новым прикладным компьютерным программам и техническим новшествам мы можем анализировать огромные массивы данных и извлекать из них полезную информацию.
Термин большие данные применяется для обозначения данных уникально большого объема или неструктурированных данных. Приведем несколько примеров:
• За месяц 600 миллионов пользователей Facebook добавили в сеть 30 миллиардов единиц контента.
• Компания Zynga, занимающаяся сетевыми виртуальными играми, ежедневно обрабатывает более петабайта игровой информации.
• Пользователи YouTube просматривают более двух миллиардов видеоклипов в день.
• Пользователи Twitter выполняют 32 миллиарда поисковых запросов в месяц.
• Пользователи Google в 2011 году выполняли почти 5 миллиардов поисковых запросов в день.
• В 2009 году ежедневно отсылалось более 2,5 миллиарда текстовых сообщений.
• В 2010 году население планеты использовало 5 миллиардов мобильных телефонов.
• Объем файла с полной расшифровкой человеческого генома составляет около одного терабайта.
• Беспроводной датчик для контроля физических параметров одной коровы передает около 200 мегабайт данных в год.
• В 2008 году количество подключенных к интернету устройств превысило численность населения земного шара.
• По оценке компании Cisco Systems, к концу 2011 года двадцать типичных домохозяйств генерировали более интенсивный интернет-трафик, чем все пользователи интернета в 2008 году.
• McKinsey & Company считает, что почти в каждой отрасли американской экономики компании с численностью персонала более 1000 человек накапливают в среднем больший объем информации, чем Библиотека Конгресса США.
Большие данные и основанная на них аналитика способны существенно изменить практически каждую отрасль экономики и бизнес-процессы в течение следующих десяти лет. Любая организация (и любой ее сотрудник), если вовремя ознакомится с сутью и методами обработки больших данных, получит огромное конкурентное преимущество. Точно так же как компании, в свое время первыми освоившие методы обработки малых данных, опередили своих конкурентов, сейчас на позиции лидеров выйдут те, кто раньше других сумеет использовать возможности больших данных.
Потенциал больших данных можно реализовать благодаря глобальным устройствам их сбора и обработки. Сенсоры и микропроцессоры в скором времени будут везде. Практически каждое механическое или электронное устройство регистрирует свои действия, местонахождение или состояние. Эти устройства и люди, их эксплуатирующие, поддерживают связь через интернет, а это еще один колоссальный источник данных. Если добавить к этому объемы информации, проходящие через прочие средства связи (беспроводные и проводные телефонные линии, кабели, спутники и т. п.), трудно даже оценить все перспективы.
Доступность всех этих данных означает, что практически любая предпринимательская или управленческая деятельность может рассматриваться либо как проблема больших данных, либо как возможность их обработки. Производство, в котором значительная часть оборудования оснащена одним или несколькими микропроцессорами, все чаще становится средой, где функционируют большие данные. Потребительский маркетинг с мириадами покупок и историй посещений покупателей также сталкивается с проблемой их обработки. Google даже описывала свою самоходную повозку из будущего как проект, связанный с обработкой больших данных.
Гэри Лавмен, CEO[5] компании Caesars Entertainment (известный своим выражением «Мы так полагаем или мы знаем?»), глава Amazon Джефф Безос («Мы никогда не пренебрегаем данными») и Рид Хоффман, руководящий LinkedIn («Web 3.0 – это сеть с новым типом данных»), публично заявляли, что аналитическое мышление и принятие решений – это надежный способ обеспечить успех компании и свой личный успех. Любая компания в любой отрасли заинтересована в том, чтобы извлечь пользу из вала данных. Для этого требуются люди, умеющие провести их детальный анализ. У них разные имена, но всех их называют квантами[6], и эта книга предназначена не им. А еще компаниям нужны люди, способные принимать оптимальные решения на основе анализа и воплощать их в жизнь. Именно для них написана эта книга. Это вовсе не те самые кванты, не аналитики, у них нет математической подготовки, но им приходится работать с количественными данными и принимать решения на основе их анализа.
Какую пользу вы извлечете из этой книги
У нас, авторов, по этому вопросу разные мнения, но общая цель: расширить применение аналитического мышления в бизнесе и обществе, в первую очередь помогая не-квантам извлекать больше пользы из массивов данных. Том вообще не очень-то серьезно относится к квантам, будучи социологом по образованию и не слишком хорошо разбираясь в статистике, но ему приходится заниматься аналитикой и определять направления ее применения в бизнесе. В течение двадцати лет Том вел исследования, писал книги, обучал студентов и консультировал компании по вопросам формирования аналитического потенциала. Его опыт работы с менеджерами и обучения их аналитическим исследованиям лег в основу этой книги. Кроме того, Том – автор и соавтор бестселлеров Competing on Analytics («Аналитика как конкурентное преимущество»)[7] и Analytics at Work («Аналитика в работе»), в которых рассказывается о том, какую роль аналитика играет в разработке стратегии больших компаний. В предлагаемой вниманию читателей книге основное внимание уделено тому, как помочь сотрудникам развить аналитические навыки и способности.
Джин Хо в университете учился именно деловому администрированию и статистике и, естественно, стал убежденным квантом. Он исследовал применение аналитических методов для решения разнообразных проблем в бизнесе и общественной деятельности. Кроме того, он разработал и вел образовательный курс по развитию аналитических способностей сотрудников. Джин Хо получил в Корее звание профессора делового администрирования и статистики, написал шесть книг, в том числе 100 Common Senses in Statistics («100 здравых смыслов в статистике») и Freak Statistics («Причудливая статистика»). Главная их цель – помочь людям без статистической или математической подготовки лучше понимать и интерпретировать статистические данные и результаты.
Мы надеемся, что эта книга поможет вам разобраться в аналитике и уверенно использовать статистическую информацию. Она облегчит сотрудничество с квантами и научит на равных дискутировать с ними об аналитических процедурах и методиках. Вы заговорите языком количественного анализа и сможете задавать правильные вопросы. Может быть, она даже вдохновит вас на то, чтобы стать квантом!
3
Один петабайт равен 1 073 741 824 мегабайтам. Прим. перев.
4
AT&T Inc – одна из крупнейших телекоммуникационных компаний в США, провайдер телефонной и беспроводной связи. Прим. ред.
5
CEO – высшее должностное лицо компании, ближайший российский аналог – генеральный директор.
6
От англ. quant – специалист по применению математических методов, методов количественного анализа в решении финансовых вопросов, оценке рисков и пр. Сленговое сокращение от quantitative analyst, quantitative analysis – количественные методы анализа. Прим. ред.
7
Издана на русском языке: Харрис Д., Дэвенпорт Т. Аналитика как конкурентное преимущество. М.: BestBussinessBooks, 2010. 264 с.