Добавить в цитаты Настройки чтения

Страница 3 из 5



Второй момент состоит в том, что ключевой компонент РАД – визуализация данных, т. е. представление данных в виде понятных и полезных картинок. Важно отметить, что роль картинок гораздо больше, нежели просто «сжать» информацию и представить ее в компактном виде. Зачастую они дают нам «новую» информацию, которой «как бы не было» при ином ее представлении. Дело в том, что правильная картинка позволяет нам увидеть не только сами значения данных, но и их связь друг с другом, а также наличие тех или иных особенностей и структур в поведении данных, не обнаруживаемых при их текстовом или табличном представлении.

Есть и чисто физиологическая причина того, что, глядя на картинку, человек часто видит много нового по сравнению с текстовым изображением или таблицей: мы воспринимаем картинку и текст разными полушариями мозга (логическим и эмоциональным) [Роэм 2009]. Другими словами, именно картинки часто служат тем мостиком, с помощью которого мы переходим от одной ступени DIKW к другой.

Следуя вышеприведенным стихотворным образцам, мы предлагаем такую модель:

Как превратить данные в информацию, информацию в знание, знание в мудрость?

Ответ: с помощью разведочного анализа данных (РАД).

Семь (девять) простых методов РАД

1. Визуализация

2. Диаграммы потока процесса

3. Контрольные листки

4. Контрольные карты Шухарта

5. Гистограммы

6. Стратификация данных

7. Диаграмма Парето (80/20)

8. Схема Исикава

9. Диаграмма рассеяния

В РАД мы включаем семь простых методов контроля качества [Куме 1990], семь новых методов контроля качества [Адлер 2000, Кане 2008], визуализацию данных, метод построения диаграмм (блок-схем) потока процессов (flowcharts), ящик с усами, правило семи вопросов, ментальные карты и любые другие полезные для понимания картинки. Поскольку все перечисленные методы нужны не только при контроле качества, а при анализе любых данных в любых сферах деятельности, мы далее опускаем слова «контроль качества» и говорим о семи простых и семи новых методах РАД, включив в семь простых диаграммы потока и визуализацию как самостоятельный метод (т. е. по сути семь простых у нас состоят из девяти инструментов)[2].

Семь новых методов РАД

Диаграмма сродства

Граф связей

Метод иерархических структур

Матричная диаграмма (домик)



Анализ матричных диаграмм

Блок-схема принятия решений

Сетевой график (метод ПЕРТ)

Один из самых простых способов превратить данные в информацию – добавить к ним ответы на семь простых вопросов: кто? когда? как? где? зачем их собирал? сколько чего собрали? и что, собственно, они означают?

В англоязычной литературе это хорошо известное и очень популярное, особенно у японцев,

Правило 5W+2H:

Но вербальных ответов недостаточно – они по-прежнему не позволяют нам обнаружить структуры и тренды (если, конечно, они есть – а они есть в большинстве случаев реальной жизни). Чтобы обнаружить структуры и тренды в данных, их – данные – нужно визуализировать.

Наиболее употребительные практические инструменты визуализации данных перечислены в табл. 1.1.

Бóльшая часть того, что перечислено в этой таблице, будет рассмотрена в разных местах книги, но сначала разберем несколько примеров того, как визуализация помогает нам обнаружить то, что нельзя увидеть из цифр. В табл. 1.2 приведена часть таблицы Росстата с данными о валовом внутреннем продукте (ВВП) РФ в постоянных ценах 2011 г. (вся таблица просто не поместится на одной странице). Значения ВВП приведены в миллиардах рублей. Данные даны поквартально, но из таблицы вряд ли вы увидите какие-то закономерности.

На рис. 1.2 показан ход ВВП во времени с 1995 по 2016 г. в постоянных ценах 2008 г. Из рисунка видно, что рост ВВП начался сразу после дефолта 1998 г. и дальше до 2007 г. шел с практически идентичной структурой данных, что говорит о постоянстве системы, т. е. рост ВВП на этом участке был обусловлен восстановлением экономики после дефолта. В 2008 г. произошел обвал вследствие мирового экономического кризиса, после чего снова начался рост, прекратившийся примерно в 2012 г. После этого экономика не растет, т. е. имеет место так называемая стагнация экономики страны. Все вышесказанное очевидно любому человеку, и для этого не нужно ничего считать, так же как и не нужно никаких специальных экономических знаний. Нам все рассказала простая картинка, на которой показан ход процесса во времени. Такая картинка получила название «карта хода процесса». Англоязычный аналог этого термина – run chart.

Глава 2

История возникновения статистического мышления. Основы теории вариабельности

Мышление – это то, чем каждый из нас, слава богу, обладает от рождения. И пока что оно нас не подводит. Но что такое «статистическое мышление»? И зачем оно нам нужно (если нужно)? Такие вопросы могут возникнуть у читателя после знакомства с названием этого параграфа. Простых ответов на подобные вопросы нам дать не удастся. Поэтому вам придется довольствоваться сложными разъяснениями. Но прежде, чем мы попытаемся их дать, заметим, что сам термин «статистическое мышление» представляется не совсем удачным. Дело в том, что слово «статистический» у многих людей вызывает неприятие, поскольку напоминает об изучавшейся когда-то в институте дисциплине под названием «математическая статистика», которую большинство людей не помнит и побаивается.

Между тем под «статистическим мышлением» мы понимаем[3] подход к принятию любых решений как в жизни отдельного человека, так и на всех уровнях организации, причем решений как оперативных или тактических, так и стратегических. Более точно наше понимание сформулировано во врезке ниже.

Статистическое мышление – это умение принимать системные решения в мире, подверженном вариабельности.

Ниже мы постараемся расшифровать смысл приведенного определения, а здесь просто заметим, что статистическое мышление – это вовсе не использование статистических методов, по крайней мере в подавляющем большинстве жизненных ситуаций. Статистическое мышление – это точка зрения, позиция, взгляд на мир, помогающие принимать эффективные решения благодаря системному подходу к возникающим проблемам. Очевидна важность этой позиции, ибо если мы делаем ошибку любого типа – совершения или несовершения – т. е. вмешиваемся в процесс, когда этого делать не надо, или не вмешиваемся, когда это крайне важно, то процесс только ухудшается. Аналогичный результат возникает, если в процесс вмешиваются не те люди, кому следует это делать, и не вмешиваются те, кому следовало. Попробуем же разобраться в сути обсуждаемого подхода, для чего сначала бросим взгляд на историческую ретроспективу его возникновения и эволюции.

2

Термины «семь простых» и «семь новых» настолько широко вошли в уже имеющуюся литературу, что мы не видим смысла их менять.

3

Такое понимание не есть прерогатива авторов данной книги (подробнее см. ниже).