Еще один вопрос, широко распространенный в естественных экспериментах, неизменно встает перед исследователем, если тот использует для сравнения статистические инструменты (хотя неявно он присутствует даже тогда, когда сравнение проводится нарративно, без статистических тестов). Может ли статистическая корреляция сама по себе свидетельствовать о наличии причины или механизма?
Конечно нет: чтобы подтвердить наличие причины или механизма, требуется по меньшей мере еще три шага, и все они подробно описаны в обширной методологической литературе. Во-первых, существует проблема обратной причинно-следственной связи: если А и В коррелируют, то, возможно, не А вызвало B, как предполагает исследователь; возможно, наоборот, B вызвало A. Часто эту проблему можно решить, обратившись ко временны́м отношениям — то есть, попросту говоря, изменилось ли А до появления B, или наоборот? Для определения вектора причинно-следственной связи часто применяется статистический метод, называемый тестом Грейнджера на причинность. Также используются и более сложные методы. Возьмем, например, недавнее исследование[394], в котором объясняется, какие участки мозга стимулируют другие определенные участки мозга, когда люди переходят от расслабленного состояния к настороженному. Его авторы нашли ответ, рассмотрев, как разности фаз между независимыми и зависимыми переменными изменяются с частотой их колебаний.
Во-вторых, следует учитывать то, что называют смещением опущенной переменной: возмущающая переменная, идентифицированная в ходе «эксперимента», на самом деле может быть частью взаимосвязанного комплекса изменений, в рамках которого имеются и другие переменные, и в действительности дисперсию результатов, возможно, вызывает именно одна из них. (По сути, это и есть тот самый риск, который исследователи, изучающие естественные эксперименты, пытаются минимизировать, хотя и без возможности полного успеха, как мы описали тремя абзацами выше.) С этой проблемой борются как Банерджи и Айер в своем исследовании последствий британского колониального налогообложения в Индии (глава 6), так и Аджемоглу и соавторы в исследовании наполеоновского влияния (глава 7). Среди множества методов, которые статистики используют для ее решения, часто применяют технику множественной регрессии: иными словами, непосредственно проверяют воздействие других возможных объясняющих факторов и смотрят, не пропадает ли кажущаяся объяснительная сила изначально выбранной переменной, когда во внимание принимаются эти остальные переменные.
В-третьих, даже если имеются убедительные доказательства того, что А является причиной В, для того чтобы определить механизм, посредством которого А вызывает B, часто требуется дополнительная информация. Например, расселение людей на экологически уязвимых тихоокеанских островах коррелирует с обезлесением, последовавшим за прибытием человека, и, конечно, нет сомнений, что именно колонизация повлекла за собой обезлесение, а не обезлесение вызвало произошедшую до него колонизацию. Тем не менее это наблюдение само по себе не объясняет, как именно человеческое расселение привело к обезлесению. Возможно, это были прямые действия людей (например, сжигание лесов, вырубка деревьев или использование древесного топлива) или различные косвенные последствия появления человека (например, поедание или повреждение крысами, привезенными человеком, семян деревьев). Дополнительная информация, которая может помочь выделить среди этих механизмов верный, включает в себя археологические и палеоботанические свидетельства: пни с отметинами от топора, угли от древесины опознаваемых видов в очагах и семена со следами крысиных зубов.
В статистическом анализе, как и в нарративном, несравнительном, неквантитативном историческом исследовании, необходимо искать золотую середину между чрезмерно упрощенным и чрезмерно усложненным объяснениями. С одной стороны, существует опасение, что статистический анализ приведет к упрощенным объяснениям, если исследователь после выявления одного-двух первых факторов перестанет искать дальнейшие причины, объясняющие результат. Но в действительности статистики стараются добавлять во множественную регрессию как можно больше независимых переменных, а также проводят анализ остатка, чтобы обнаружить еще больше объясняющих факторов, чем в ходе первого этапа анализа. И наоборот, можно с подозрением относиться к излишне сложным объяснениям — вспомнить хотя бы такую часто встречающуюся насмешку: «Дайте мне две переменные, и я нарисую вам слона; дайте мне третью переменную, и он начнет махать хоботом». На самом деле же статистики обязательно используют специальные тесты, например, так называемый