Добавить в цитаты Настройки чтения

Страница 9 из 23



2. Смешение

Одной из самых хитрых проблем, ожидающих решения при взаимодействии двух дисциплин, является контроль нежелательных переменных и распознавание роли каждой переменной в сложных неэкспериментальных ситуациях взаимодействия. Без адекватной процедуры разработки эксперимента слишком легко спутать одну переменную с другой, принять результаты за причины, смешать функциональные отношения с каузальными и совершить бесчисленное количество других смертных грехов. Конечно, легко быть пуристом и просто все критиковать, но, даже если мы попытаемся быть позитивными и не будем подходить с чрезмерной строгостью, проблемы будут поджидать нас за каждым углом нашего исследовательского пути. Давайте рассмотрим следующий простой пример. Социолог обычно смотрит на процессы размежевания индивидов, групп, социальных классов, культур и т. п. Релевантные переменные, позволяющие предсказывать расслоение, возвращают нас к личностным характеристикам индивида. Географ же обычно смотрит на пространственный аспект и видит пространственную близость как первичную переменную в определении течения процесса размежевания. Допустим, так случилось, что люди одного социального класса живут поблизости. Как тогда мы определим, насколько это следствие влияния пространственной переменной, а насколько – характеристик личности? В любой ситуации мы должны рассмотреть их совместное воздействие, и, к сожалению, эти аспекты не являются независимыми друг от друга. Оказывается, у нас нет адекватного неэкспериментального исследовательского дизайна, позволяющего нам решать такого рода проблемы не кустарным способом.

Эти проблемы смешения характерны для работ по социальным процессам даже в тех случаях, когда они задумываются как независимые от пространственной формы. Представляется, что для социолога так же важно нивелировать влияние пространства в своих аргументах, как и для географа вынести за скобки социальное влияние на пространство – в своих. Если эти последствия смешения не элиминированы в дизайне исследования, будет слишком просто получить статистически значимое, но в действительности сомнительное подтверждение гипотезы. Я подозреваю, что бо́льшая часть работ по социальным процессам страдает, потому что не может распознать серьезных аналитических проблем, которые возникают из-за смешения пространственных и социологических результатов. Таким же образом можно подвергнуть критике большинство работ, посвященных исключительно пространственным аспектам. Работа на стыке дисциплин не создает новых проблем; она проливает свет на истинную природу некоторых старых проблем и показывает, что социальный аналитик и пространственный аналитик не могут позволить себе работать, игнорируя друг друга.

3. Статистический анализ

Проблемы индивидуации и смешения ведут к проблемам в статистическом анализе. Их достаточно легко объяснить, но сложно разрешить. В идеале нам нужен метаязык, на котором мы могли бы обсуждать статистическую значимость одновременно в социологическом и пространственном смысле. В отсутствие этого мы должны прибегать к тестам, сконструированным на двух разных языках, и как-то комбинировать их в применяемой структуре статистического анализа. Тесты, пригодные для проверки гипотез относительно внепространственного социального процесса, разработаны достаточно хорошо. Используя эти гипотезы, мы можем сформировать определенные ожидания и затем попробовать показать, что нет большой разницы между этими ожиданиями и данными наблюдения. Отсутствие каких-либо значимых различий обычно означает, что гипотеза подтверждается, хотя это действительно только при определенных допущениях о том, как получаются результаты наблюдения (например, элиминирование всех неучтенных переменных (confounding variables)[4]), и о том, как формулируется сама гипотеза и т. д. Тесты, подходящие для изучения моделей пространственного распределения, разработаны не так глубоко. Мы можем сформулировать определенные ожидания в отношении пространственных феноменов и затем сравнить эти ожидания с наблюдаемыми пространственными распределениями. Есть тесты для проверки пространственного представления табличных данных (Cliff and Ord, 1972). Однако сравнение двух поверхностей представляется не таким простым, и нам сложно выразить словами расхождение наших ожиданий относительно определенной поверхности с данными ее наблюдения. Аналогично, у нас нет настоящего понимания смысла статистически значимой разницы в анализе распределения точечных объектов (point pattern arrangement)[5]. Поэтому в целом у нас нет общепринятого определения статистической значимости в пространственном анализе и, следовательно, у нас есть серьезные проблемы в тестировании гипотез о пространственных распределениях. Кажется, единственный способ сформулировать понятие значимости – это делать предположения относительно природы пространственного распределения. Поскольку мы часто озабочены тем, чтобы выявить, а не тем, чтобы предположить пространственное распределение, этот подход не всегда помогает. Но похоже, это единственный вариант для нас в настоящее время. По этой причине критиковать нынешние методы обращения с пространственными данными ничего не стоит (Granger, 1969).

Комбинирование социальных и пространственных процедур в одной концептуальной рамке статистического исследования все же имеет шанс на успех. Рассмотрим следующий пример, в котором мы попробуем предсказать распространенность некоторых социальных характеристик в пространстве – скажем, численность цветного населения в ряде переписных участков города. В рамках этой гипотезы мы можем сформировать предположения относительно численности небелого населения на каждом участке, представленной ячейкой в таблице данных. Чтобы проверить эту гипотезу, нам нужно показать, что она правильно указывает количество людей на каждом участке. Мы можем проверить это, сравнивая распределение ячеек по частотным характеристикам, как они представлены в гипотезе и как они выглядят в реальности. Мы можем выяснить, есть ли значимая разница на пятипроцентном уровне или ее нет. Но нам надо также показать, что модель предсказывает правильное пространственное распределение предсказаний по участкам. Мы можем использовать цветовой тест смежности (k-color contiguity test), чтобы показать пространственное распределение, предполагаемое в гипотезе, и пространственное распределение в реальности. Если эти тесты совершенно независимы друг от друга, мы можем увеличить эти два уровня значимости по правилу мультипликации (умножения) и сказать, что общий тест показывает уровень значимости[6] 0,25 %. Но очевидно, что тесты не независимы друг от друга. По сути, объединение двух тестов таким образом может вовлечь нас (и часто так и бывает) в конфликт со статистической логикой. Тесты социальных процессов основываются на независимости каждой единицы данных, а пространственная статистика явным образом озабочена измерением степени пространственной зависимости в данных. Поэтому мы автоматически привносим в измерение социальных процессов проблему автокорреляции, и это означает, что мы нарушаем основания тестирования, если только как-то не контролируем этот процесс (фильтруя данные и т. д.). Подобная проблема возникает почти на каждом участке работы в зоне взаимодействия дисциплин. Она далека от решения и часто вообще не замечается. Мне всегда казалось странным, что, например, многовариантные методы районирования полагаются на измерения корреляции, которые, если они считаются значимыми, требуют независимости данных наблюдения, когда целью всей процедуры является группировка единиц по регионам, имеющим сходные (и поэтому пространственно автокоррелированные) характеристики. Метод и цель в этом случае кажутся логически не согласованными или, в лучшем случае, дают такую группировку регионов, которую по большому счету можно считать бессмысленной. Похоже, это формирует непреодолимый барьер для использования факторного анализа в схемах районирования. Проблема автокорреляции, однако, хорошо освещена в эконометрической литературе в отношении временного измерения (временных рядов), и мы можем использовать эту область знания как источник вдохновения (и определенных техник). Но, как указал Грэнджер (Granger, 1969), между временным измерением, которое обладает, к большому удобству, направленностью и необратимостью, и пространственным изменением, которое обладает не этими ценными характеристиками, а сложной нестационарностью и странными разрывами, огромная разница. Эти проблемы привели Грэнджера к сомнениям относительно того, что техники, используемые в эконометрике для работы с временными рядами, могут применяться к пространственным данным, за исключением некоторого класса задач. Проблема пространственной автокорреляции кажется слишком сложной, чтобы найти ей приемлемое решение, а вся базовая структура статистического исследования в междисциплинарной зоне зависит от нее.

4



Неучтенные переменные – переменные, связанные с исследуемым фактором и определенным образом влияющие на результат. Например, известно, что мужчины чаще, чем женщины, болеют ИБС. Однако это может быть связано не с исследуемым фактором (пол), а с тем, что мужчины чаще курят, больше подвергаются стрессам. Влияние неучтенных переменных может приводить к возникновению ложных корреляций и систематических ошибок. – Прим. ред.

5

Речь идет об одном из методов анализа пространственного распределения объектов – анализе распределения точечных объектов (PPA: Point Pattern Analysis). Этот метод часто применяется для исследования распределения численности и плотности населения на конкретных территориях. – Прим. ред.

6

Уровень значимости – это такое (достаточно малое) значение вероятности события, при котором событие уже можно считать неслучайным. В данном примере: 0,05×0,05=0,0025≡0,25 %. – Прим. ред.