Добавить в цитаты Настройки чтения

Страница 40 из 45



Впрочем, также ни для кого не является секретом, что создатели всех wiki-приложений и подобных им сервисов сталкиваются со спамерами, вандалистами и прочими любителями «посорить в общественных местах», вносящими некорректные правки в статьи, документы или, как в данном случае, наборы данных. Так например, в Wikipedia пришлось даже отказаться от излишней «демократии» во внесении правок, поскольку этим правом слишком часто злоупотребляли, что существенно подорвало репутацию проекта. Подастся ли модерированию ManyEyes или же в будущем возможности по редактированию визуализаций также придется ограничить, покажет время. Пока сервис еще не получил столь массовой популярности, и эти проблемы обходят его стороной.

Весь ресурс делится на две глобальных части - для участников и любопытствующих. Последние могут помимо библиотеки визуализаций ознакомиться со списком исходных табличных данных и лентой последних комментариев в обсуждениях, на которую можно оформить RSS-подписку. Также они имеют право создавать свои собственные диаграммы на основе внесенных другими участниками данных. Для того чтобы загрузить собственные информационные массивы, нужно зарегистрироваться и получить общий для всех веб-ресурсов IBM идентификатор (IBM ID). Высказать свою точку зрения на форуме можно и без аутентификации. Пока в ManyEyes разрешены сообщения от анонимных пользователей. Сразу нужно оговориться, что для просмотра визуализаций необходимо обзавестись последней версией Java-плагина для браузера. Причем, он, похоже, не умеет работать с кириллицей. По крайней мере, у меня данные, введенные на русском языке, в табличном виде смотрелись нормально, а на сгенерированных графиках не отображались.

Загрузить свои исходные данные в систему (например, изменение рождаемости в зависимости от динамики среднедушевого дохода в стране) достаточно просто. Стандартной формой представления экспортных данных является таблица. Ее можно загрузить в виде текстового файла, в котором значения отделяются табуляцией, а первой строкой идут заголовки колонок. Например:

Fruit Color Calories

Apple Red 100

Banana Yellow 120

Размер файла не должен превышать пяти мегабайт. Или же можно скопировать и вставить соответствующую табличку из Excel.

Разработчиками HistoryFlow и ManyEyes в разное время были созданы такие сервисы визуализации, как SmartMoney Map of The Market и Shape of Song . Первый позволяет анализировать котировки акций на бирже и демонстрирует изменения курса, группируя компании по отраслям. На его основе позднее в ManyEyes был разработан один из типов визуализаций (древовидные карты).



Shape of Song - это попытка разложить музыкальные композиции на составляющие, представить их в виде арок и получить графическое отображение той или иной мелодии. На сайте проекта можно провести свой анализ, загрузив midi-файл.

Вместе с тем к структуре экспортируемых данных предъявляется довольно широкий круг требований. Среди самых распространенных ошибок ввода можно отметить указание значка "$" перед числами. Подобного финансового формата в MoneyEyes не предусмотрено, так что доллары, как и любые другие единицы измерения, необходимо указывать в заголовке.

Есть и другие тонкости. Например, в том случае, если в нескольких ячейках загружаемой таблицы нет значений и проставлены соответствующие символы («n/a» или "*"), система обработает данные корректно. Однако если в определенном столбце большинство ячеек содержат текстовые указания на отсутствующие данные, то встроенный анализатор присваивает всем ячейкам в этой колонке текстовый тип данных вместо числового. Изменить это можно вручную, выбрав соответствующий пункт в выпадающем меню. Другое дело, что на типы данных пользователи зачастую не обращают внимания. Впрочем, все эти особенности приложения быстро познаются на опыте и перестают досаждать.

На выбор пользователю предлагается несколько типов визуализаций. Первый - географический - включает карту мира и США. Кстати, ориентация сервиса прежде всего на американских пользователей проявляется во многих мелочах. Например, в качестве источников для загрузки исходной информации предлагаются правительственные сайты страны, а указанные в данных аббревиатуры вроде AZ или MA распознаются как названия соответствующих штатов.

В качестве примера использования карточного типа можно привести исследование Amnesty International по применению смертной казни в различных странах. Замечу, что автор карты позволяет просмотреть данные, как по степени неприятия высшей меры по четырехбалльной шкале (отрицается законодательно, не используется на практике, используется в отдельных случаях, используется постоянно), так и по времени отказа различных государств от подобного наказания - по мере приближения к настоящему времени цвет становится насыщеннее. Встроенный инструментарий позволяет наблюдателю увеличить масштаб и просмотреть данные по отдельным странам [1].

Второй тип визуализации - это графики трех типов. Линейные диаграммы (line graph) - «классический» и самый простой вид графического отображения данных; большинство представленных в библиотеке проектов реализовано именно в этой форме. На рисунке продемонстрирован рост доли пользователей Интернета среди детей младшего, среднего и старшего школьного возраста в Южной Корее. Точное значение координат в конкретной точке графика можно узнать, просто наведя курсор. Можно просмотреть график только по одному показателю, что очень полезно в визуализациях, описывающих изменение динамики сразу десятка или более объектов. Для выбора нужно кликнуть по соответствующему заголовку в расположенной слева от диаграммы легенде. Отметить отдельные значения на графике для последующего обсуждения можно, кликнув по ним с удерживаемой клавишей Ctrl [2].