Страница 9 из 14
Широкое распространение статистических методов привело к тесной смысловой привязке термина data к термину statistics. В 1897 году в документальных источниках на английском языке слово data стало использоваться в новом значении – «факты в числовом виде, собранные для дальнейшего использования».
В XX веке спектр значений cлова data существенно расширился.
В 1946 году появилось значение «передаваемая и хранимая информация, с помощью которой осуществляется выполнение компьютерных операций»[36].
Стали использоваться новые термины: «обработка данных» (data processing) – с 1954 года, «база данных» (database) – с 1962 года, «ввод данных» (data entry) – с 1970 года[37].
В русском языке слово «данные» – производное от «дать», «давать». Родственно древнеиндийскому слову datis – «дар». Данные – то, что дано, найдено. В толковом словаре Даля «данныя, данности – известное, бесспорное, очевидное, верное, все, что служит основанием для какого-либо вывода, расчета, заключения»[38]. В энциклопедическом словаре Брокгауза и Ефрона приведено следующее определение: «В вопросах математики данные суть величины, значения которых известны или предполагаются известными; зная их, требуется в рассматриваемом вопросе определить искомые неизвестные величины.
Данные (Δεδόμενα) есть заглавие одного из сочинений Эвклида, составляющего продолжение его “Элементов”. Можно указать несколько изданий этой книги: Гарди в 1625 году с греческим текстом и Баррова в 1659 году Эвклид называет данным все то, что на основании теорем, заключающихся в элементах, непосредственно следует из условий задачи. Например, если проводим из данной точки прямую, касательную к данному кругу, то эта прямая есть данная по величине и положению»[39].
Приведем несколько современных определений.
Согласно «Оксфордскому словарю современного английского языка»[40]:
● Data: 1) Известные факты, используемые для вывода или расчета. 2) Числовые и нечисловые значения характеристик кого-либо (чего-либо), с которыми выполняет операции компьютер или какое-нибудь другое подобное устройство.
● Information: 1) a) Что-то, что было сообщено; знания. б) Элементы знаний; новости. 2) Обвинение или жалоба, поданная в суд и т. п.
Согласно «Новому словарю русского языка»[41]:
● Данные: 1) Сведения, факты, характеризующие кого-либо, что-либо, необходимые для каких-либо выводов, решений. 2) Свойства, способности, качества как условия или основания, необходимые для чего-либо.
● Информация: 1) Сообщение о положении дел где-либо, о состоянии чего-либо. 2) а) Сведения об окружающем мире и протекающих в нем процессах, воспринимаемые человеком или специальными устройствами. б) Обмен такими сведениями между людьми и специальными устройствами. в) Обмен сигналами в животном и растительном мире. 3) То же, что: информирование.
Все это позволяет понять разницу между понятиями «данные» и «информация» и очертить преимущественные сферы их применения.
Следует заметить, что здесь в отношении термина «информация» мы ограничиваемся его общепринятыми нестрогими определениями и не обсуждаем научные определения, используемые в теории связи, теории информации и кибернетике и связанные с понятием количества информации. Отметим только, что известны два основных сугубо научных подхода к определению этого термина[42].
Согласно первому, информация – это внешнее описание объекта, содержащееся в передаваемом сообщении. Количество информации определяется как мера неопределенности, снимаемой полученным сообщением. Такое представление в 1948 году ввел Клод Шеннон[43] в своей статье «Математическая теория связи», попутно предложив для обозначения наименьшей единицы информации использовать слово «бит».
Согласно второму подходу, информация не связывается с передаваемым сообщением. Она относится к объекту и есть мера его разнообразия. Автор этого представления – Уильям Эшби[44].
Указанные научные определения в дальнейшем в этой книге не используются, поскольку ценность информации слабо связана с ее количеством. Важность информации субъективна и зависит от цели ее потребителя. Все способы количественного определения ценности основаны на представлении о цели, достижению которой способствует полученная информация. Чем больше информация помогает достижению цели, тем более ценной она считается[45]. Массив информации объемом в сотни гигабайт может иметь колоссальную важность для одной организации и нулевую для другой.
Основываясь на приведенных сведениях, можно продолжить обсуждение вопросов, относящихся к ценности данных.
Как уже говорилось выше, применительно к сфере управления данными термины «данные» и «информация» часто используются как синонимы. Кроме того, как видно из приведенных выше определений, термин «информация» иногда заменяется термином «знания».
Всегда ли допустимо такое обобщение и не приводит ли оно к недоразумениям? В частности, к существенному недопониманию между участниками многочисленных проектов по внедрению различного рода информационных систем, а также между участниками их дальнейшей эксплуатации и пользователями. В том числе и по вопросам определения ценности данных.
Для ответа необходимо более подробно обсудить взаимосвязь понятий «данные» и «информация», а также соотнести их с понятиями «знания» (knowledge) и «мудрость» (wisdom).
2.2. Информационная иерархия
При обсуждении взаимосвязи понятий «данные», «информация», «знания» и «мудрость» обычно используется классическое представление – иерархия Data-Information-Knowledge-Wisdom (DIKW). Часто в литературе применяются названия «иерархия знаний», «пирамида знаний» или же «информационная иерархия», «информационная пирамида».
В большинстве исследований, посвященных происхождению иерархии DIKW (например,[46][47][48]) в качестве одного из наиболее ранних источников, в которых встречается ее описание, обычно упоминается статья Харлана Кливленда[49] «Информация как ресурс». Она была опубликована в 1982 году в американском журнале The Futurist[50].
По мнению Кливленда, данные образуются в результате исследований, а также путем создания или сбора или же совершения открытий, в то время как информация имеет контекст. Данные превращаются в информацию с помощью организации их таким образом, чтобы мы могли легко делать какие-либо заключения. Кроме того, они преобразуются в информацию с помощью представления (презентации), например в визуальной или аудиальной (звуковой) форме.
Хотя известно несколько более ранних публикаций других авторов, затрагивающих эту тему[51], статья Кливленда цитируется особенно часто и примечательна фрагментом из поэмы Томаса Элиота[52] «Камень» (The Rock), написанной в 1934 году, в которой отражена иерархическая взаимосвязь понятий «информация», «знания» и «мудрость».
36
В это время в США проводились работы по созданию первого в мире лампового компьютера, в ходе которых была предложена и реализована знаменитая «архитектура фон Неймана», основанная на принципе совместного хранения команд и данных в компьютерной памяти и применяемая сегодня в подавляющем большинстве вычислительных машин.
37
https://www.etymonline.com/word/data.
38
https://ecanet.ru/word/Данные.
39
http://1slovar.ru/d/brokgauz_efron/122384/.
40
Oxford Dictionary of Current English / Edited by Della Thompson: 2nd Edition, Oxford University Press, 1993.
41
Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный. В 2 т. – М.: Русский язык, 2000.
42
Шамис А. Л. Модели поведения, восприятия и мышления: курс лекций. – М.: Интуит НОУ, 2016. – URL: https://intuit.ru/studies/courses/2191/423/info.
43
Клод Шеннон (Claude Elwood Sha
44
Уильям Эшби (William Ross Ashby) – английский психиатр, крупный теоретик кибернетики.
45
Чернавский Д. С. Синергетика и информация (динамическая теория информации). 2-е изд., испр. и доп. – М.: Едиториал УРСС, 2004.
46
Sharma N. The origin of the data information knowledge wisdom hierarchy, 2005. – URL: https://web.archive.org/web/20051221151426/http://www-personal.si.umich.edu/~nsharma/dikw_origin.htm.
47
Rowley J. The wisdom hierarchy: representations of the DIKW hierarchy. Journal of Information Science, 2007, 33(2), 163–180. DOI: 10.1177/0165551506070706. – URL: http://www-public.imtbs-tsp.eu/~gibson/Teaching/Teaching-ReadingMaterial/Rowley06.pdf.
48
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and I
49
Харлан Кливленд (Harlan Cleveland) – американский дипломат, педагог и писатель.
50
Cleveland H. Information as Resource. The Futurist, 1982. Vol. 16. No. 6, Pp. 34–39.
51
Williams D. Models, Metaphors and Symbols for Information and Knowledge Systems // Journal of Entrepreneurship Management and I
52
Томас Элиот (Thomas Stearns Eliot) – выдающийся английский поэт, лауреат Нобелевской премии по литературе 1948 года.