Добавить в цитаты Настройки чтения

Страница 54 из 105

Это можно называть коллаборативной наукой или даже Наукой 2.0. Просвещение добилось настоящего чуда, превратив исследование в знания, породив практику публикации научных данных. Но столетнее движение в сторону открытости на этом не закончилось. Сегодня на грани запуска находится новая научная парадигма сопоставимой значимости, вдохновлённая теми же технологическими силами, которые превращают Сеть в пространство для массовой совместной работы.

Так же как механизмы и приёмы совместной деятельности изменяют предприятия, новая Сеть навсегда изменит то, как учёные публикуют данные и управляют ими, а также сотрудничают за рамками своих институтов. Стены, разделяющие различные учреждения, разрушатся, а их место займут открытые научные сети. Все научные и исследовательские данные мира станут, наконец, доступны каждому исследователю бесплатно, без предубеждений или ограничений.

Вы скажете — это утопия? Не совсем, если представить, что традиционный научный издательский процесс для пользователей является медленным и дорогим, а вопросы, которых он касается, наоборот, связаны со всё более серьёзными проблемами в науке. Зайдите на территорию любого университета — и услышите как никогда громкие крики о том, что старую парадигму нужно отмести в сторону. По мере появления новых форм пирингового сотрудничества и публикаций в открытом доступе, это становится всё больше похоже на правду. Но до того как описать эту новую парадигму, давайте коротко остановимся на проблемах.

Традиционные журналы собирают научные статьи по теме и используют высокоструктурированные системы для оценки и размещения собранных знаний научного сообщества. Каждая статья оценивается двумя или более экспертами и может неоднократно изменяться до того, как будет принята к печати. Расстроенные авторы могут обнаружить, что их новейшие открытия стареют в ходе сложнейшего процесса оценки, отдаляющего публикацию на год, а иногда и больше. Для той скорости, с которой развивается сейчас наука, это просто слишком медленно.

Другая проблема состоит в том, что большинство опубликованных исследований доступно только на платных условиях. В то же время как никогда высокая стоимость подписки сокращает возможность доступа к этой информации. Что ещё хуже, эти препятствия упорно сохраняются, несмотря на доступность гораздо более дешёвых электронных методов публикации. Хотя к цифровым версиям может получить доступ неограниченное количество дополнительных читателей без дополнительной оплаты, издатели боятся создать феномен, аналогичный Napster.

Без сомнения, эти проблемы являются результатом действующего способа физического распространения информации и незначительного объёма публикаций. Существующий сегодня издательский процесс возник в Европе XVII века, когда скорость открытий была несоизмеримо более медленной по сравнению со стандартами XXI века. Научные издания предоставляли первичную инфраструктуру для общения и сотрудничества. Помимо ежегодных академических симпозиумов, журналы были местом, где учёные могли получить информацию, обмениваться ею и аккуратно критиковать работу друг друга. Издание журналов стоило дорого, требуя значительного капитала и операционных расходов.

Однако по мере того, как набирает скорость и размах научное разви тие, всё большее количество участников научной экосистемы задаётся вопросом, насколько адекватна их нуждам эта старомодная журнальная система. При новых коммуникационных технологиях бумажный издательский процесс стареет. Традиционная система пирингового рецензирования журналов дополняется, если не заменяется, возрастающими объёмами пирингового сотрудничества.

Организация поиска знаний в пиринговой манере, конечно, не является чем-то новым в науке. Однако последние исследования показывают, что рост сотрудничества имеет взрывной характер. Одно исследование, проведённое Институтом Санта-Фе,[220] показало, что средний исследователь в области физики высоких энергий имеет в своей лаборатории около ста семидесяти трёх сотрудников. По результатам того же исследования, среднее количество авторов научных статьи удвоилось и утроилось во многих областях. Всё большее количество статей цитируется от двухсот до пятисот раз, а самая высокорейтинговая публикация имеет индекс цитирования 1681.[221]

Агрегаторы знаний должны принять новые условия, например, рост использования баз данных в Интернете и всё большее развитие масштабных совместных проектов в Сети. Рассмотрим в качестве примера эксперимент с Большим адронным коллайдером (БАК), проводимый Европейским советом по ядерным исследованиям[222] Ожидалось, что с 2007 года[223] крупнейший в мире ускоритель частиц начнёт производить петабайты сырых данных в год, данных, которые будут предварительно обработаны, структурированы и проанализированы командами из тысяч физиков по всему миру (заметьте, что петабайт — это квадриллион[224] байтов, другими словами, очень много данных!). В ходе этого процесса данных будет создано ещё больше. Появится необходимость управлять сотнями миллионов файлов, что включает их размещение в сотнях институтов.

Помимо этого существует ещё Решетка земной системы[225] (ESG), опытная таблица данных, включающая возможности суперкомпьютера с масштабными серверами для сохранения и анализа данных, созданная для учёных, занимающихся совместными исследованиями климатических явлений. Будучи когда-то единственным в своём роде, данный проект создаёт виртуальное пространство для сотрудничества, которое объединяет распределённые центры, пользователей, модели и данные на территории США. Данные для этого проекта собираются из самых разных источников, включая наземные и спутниковые датчики, компьютерное моделирование, а также тысячи независимых исследователей, размещающих в системе свои файлы. Специальные программы позволят учёным выполнять долгосрочное моделирование высокого разрешения, используя распределённые системы данных сообщества. Основатели ESG предполагают, что проект приведёт к революции в нашем понимании глобальных изменений климата.

Такие проекты вдохновляют исследователей во многих областях знаний на генерирование изменений, уже сейчас замещающих такие дисциплины, как биоинформатика и физика высоких энергий (физика элементарных частиц). Возьмите, например, астрономию. Редакторы журнала Nature недавно заметили: «Десятилетие назад астрономия во многом касалась групп, хранящих результаты своих наблюдений в секрете и публикующих частные выводы. Сейчас данная наука организована вокруг больших объёмов данных, которыми обмениваются, которые кодируют и делают доступными общественности».[226]

По мере того как масштабные научные совместные проекты становятся нормой, учёные больше полагаются на распределённые методы сбора данных, проверяя точность открытий, тестируя гипотезы не только для ускорения работы, но и для повышения достоверности самих научных знаний. Быстрое, повторяющееся раскрытие информации привлечёт к пиринговому процессу ещё больше членов научного сообщества. Результаты будут проверены сотнями участников сообщества в один момент, а не пятёркой анонимных рецензентов чуть ли не через год. Это позволит новым знаниям быстрее поступать к практикам и предпринимателям.

В быстроразвивающихся дисциплинах, например, в физике высоких энергий и биоинформатике, этот совместный метод сбора и оценки публикаций уже становится реальностью. В 1991 году Пол Джинспарг[227] основал arXiv — общественный сервер, на котором физики могли размещать цифровые копии своих рукописей до публикации. Начав жизнь как механизм для обмена допечатными текстами в теоретической физике, ресурс быстро стал главной библиотекой для большой части исследовательской литературы по физике, компьютерным наукам, астрономии и многим математическим дисциплинам.

220

Santa Fe Institute.





221

Стабильно растёт и среднее количество авторов на научную работу. За последние шестьдесят лет среднее значение чуть больше i стабильно росло до — 2,22 в области компьютерных наук, 2,66 в области физики твердых тел, 3,35 в области астрофизики, 3,75 в области биомедицины и 8,96 в области ядерной физики больших энергий. Количество ссылок на работы других авторов колеблется между 200 и 500, а рекордное количество ссылок в одной работе составляло поразительные 1681 ссылку. См. М. Е. J. Newman, "Who is the besl co

222

European Council for Nuclear Research (CERN).

223

Первые значительные испытания БАК прошли в сентябре 2008 года. Однако вследствие вскоре произошедшей аварии БАК возобновит свою работу летом-осенью 2009 года. — Прим. издателя.

224

Квадриллион (франц. quadrillion) — число, изображаемое единицей с 15 нулями, т. е. число ю' Иногда квадриллионом называют число 1024.

225

Earth Syslem Grid.

226

В рамках проекта Sloan Digital Sky Survey, сотни исследователей из пятидесяти организаций, разбросанных по всему миру, могут использовать потенциал ю тысяч компьютеров, а объём данных для исследования миллионов планет и звёзд составляет более пятнадцати терабайтов. Свободный и открытый обмен информацией и идеями даст учёным невиданную ранее картину Вселенной, причём данные могут быть получены в сотни раз быстрее, чем при использовании традиционных методов. См."Let data s" peak to data," Nature, том 438, номер 531 (i декабря 2005 г.).

227

Paul Ginsparg.