Добавить в цитаты Настройки чтения

Страница 41 из 45



Другой подтип - это графики с областями (stack graph). Они тоже относятся к классическим методам визуализации, используемым в тех случаях, когда важно изобразить как динамику значений каждого объекта в отдельности, так и их влияние на общую динамику системы, которую они составляют. В качестве примера можно привести диаграмму, иллюстрирующую изменение численности населения в пригородах Сан-Франциско. Точную высоту отдельной области можно просмотреть, кликнув на ней мышью [3].

Следующая категория используемых в ManyEyes визуализаций предназначена для визуального сравнения разных значений. К этому типу относятся обычные и «блоковые» гистограммы, а также «пузыри» (bubble chart). В отличие от столбцов в стандартной гистограмме, в «блоковой» значения отображаются в виде поставленных друг на друга прямоугольников одинаковых размеров. Использовать такую форму представления имеет смысл в том случае, если автор хочет показать отдельные элементы, образующие данное значение. В этом примере визуализированы данные о ВВП на душу населения в различных странах. Ось абсцисс соответствует показателю в миллионах долларов, а ось ординат соответствует числу стран с примерно одинаковым уровнем ВВП на человека. Каждый блок представляет отдельное государство [4].

«Пузыри», как правило, используются в том случае, когда необходимо отразить на диаграмме большое множество значений. Также они применяются, если порядки значений различаются и их демонстрация на гистограмме не очень наглядна. Положительные величины отображаются кругами голубого цвета, отрицательные - красного. Если автор использует больше одного измерения данных, для просмотра понадобятся выпадающие под диаграммой меню (это, впрочем, справедливо и для диаграмм других типов). На картинке изображена диаграмма наиболее часто скачиваемых книг из библиотеки «Проекта Гуттенберг». При выборе нескольких книг (клики с удерживанием Ctrl) внизу справа появляется сумма абсолютных и относительных значений выбранных объектов.

Для отражения связей между сущностями используются диаграммы облаков рассеяния (scatterplot visualisation) и графы (network diagram). Облака позволяют показать корреляционную зависимость между различными показателями (например, погодой и коровьими удоями в каком-нибудь британском графстве) в виде сосредоточения большей части точек в конкретных областях диаграммы. Так, на иллюстрации изображена попытка одного из пользователей отыскать зависимость между коррупцией и ВВП. Каждой точке соответствует определенная страна. В меню можно поменять местами оси со значениями степени коррумпированности и размерами ВВП, а также определить, какой из этих факторов будет определять диаметр точки. Если кажется, что это только мешает получить ясную картинку, то все точки можно «уравнять», выбрав в разделе «Dot Size» пункт «Not selection» [5].

Графы предлагается использовать в первую очередь для визуализации различных социальных сетей. В качестве примера таблицы исходных данных разработчики приводят следующий массив:

Но на деле пользователи нашли этому инструменту гораздо более широкое поле применения. В частности, на иллюстрации изображен фрагмент графа, увязывающего названия авиаконцернов с типами выпускаемой ими продукции (танкеры, пассажирские самолеты, бомбардировщики и т. д.). Масштаб сети можно изменять скроллингом мыши, а узлы расставлять в произвольном порядке.



Завершают список инструментов визуализации диаграммы для отображения частей целого, к коим помимо стандартной круговой с выделением отдельных сегментов разработчики относят древовидные карты (treemap). Они очень удобны для отображения значений, сгруппированных в несколько категорий по определенному признаку. Например (см. скриншот c SmartMoney Map), если указать в качестве анализируемых данных изменение курса ценных бумаг отдельных компаний, объединенных по сфере деятельности, и обозначить повышение (положительные значения) зеленым цветом, а снижение (отрицательные) красным, то древовидная карта рынка очень хорошо продемонстрирует негативный тренд, распространяющийся на отрасль в целом.

В момент запуска альфа-версии все содержимое библиотеки визуализаций сводилось к десятку простеньких демонстраций функциональности сервиса. Хотя даже эти начальные графики вполне отражали масштабность проекта, показывая результаты анализа самых разнообразных данных: от пищевой ценности сухих завтраков до кривой рождаемости в мире.

В настоящее время на ManyEyes опубликовано уже около 750 визуализаций. Кстати, к тому времени, когда эта статья будет опубликована, цифра может существенно вырасти. Большая часть размещенных на сайте исследований активно обсуждается на форуме, причем многие из графиков уже были неоднократно расширены и модифицированы.

Станет ли ManyEyes глобальной копилкой аналитических исследований, подобно тому, как Wikipedia превратилась в сборник энциклопедических знаний, - покажет время, однако задумка интересная, так что будем надеяться, что проект в обозримом будущем выкарабкается из статуса альфа-версии.