Статистическая значимость
Вам может показаться, что определить наличие корреляции между двумя факторами очень просто: либо они коррелируют между собой, либо нет. Но это не так. Когда вы рассматриваете большое количество данных, вам нужно провести статистический анализ, чтобы определить, имеется ли корреляция между двумя факторами. Ответом не будет однозначное «да» или «нет». Это вероятность, которую мы называем статистической значимостью. Статистическая значимость – это мера измерения того, можно ли считать полученный результат эксперимента надежным, или он всего лишь обусловлен случайными факторами. Если вы трижды подбросите монету и трижды выпадет орел, то, скорее всего, это случайность. Если же вы подбросите монету сто раз и каждый раз будет выпадать орел, вы можете быть полностью уверены, что у этой монеты орел с обеих сторон. В этом и заключается идея, лежащая в основе понятия статистической значимости: это вероятность, что корреляция (или другие результаты) действительно существует, что это не игра случая.
Считается, что результат исследования статистически значим, если вероятность того, что он обусловлен случайными факторами, менее 5 %. Это означает, например, что существует 95 %-ная вероятность того, что при повторном исследовании мы получим тот же результат. Точка отсечения на уровне 95 % произвольна, тем не менее это стандартный показатель. Другая произвольная точка отсечения – 99 %. Если результат соответствует этому показателю, говорят, что он имеет высокую статистическую значимость. В приведенном в этой книге анализе питания и болезней время от времени используется понятие статистической значимости, и оно может применяться для оценки надежности, или весомости, доказательства.
Часто корреляция считается более надежной, если другие исследования указывают на биологическую взаимосвязь тех же факторов. Например, между телефонными столбами и сердечно-сосудистыми заболеваниями существует положительная корреляция, однако нет исследований, которые бы показывали наличие биологической связи между телефонными столбами и этими заболеваниями. Однако существуют исследования, в которых рассматриваются процессы, посредством которых прием в пищу белка и рак печени могут иметь биологическую и причинно-следственную взаимосвязи (об этом речь пойдет в главе 3). Знание процесса, посредством которого в организме что-либо происходит, означает знание «механизма действия». А знание механизма действия подкрепляет доказательство. Иными словами, это означает, что два коррелирующих фактора взаимосвязаны биологически правдоподобным способом. Если взаимосвязь правдоподобна с биологической точки зрения, она считается гораздо более убедительной.
Наконец, мы должны понимать идею метаанализа. Метаанализ заключается в объединении данных из различных исследований и их анализе как единого набора данных. Результат может стать гораздо более убедительным после аккумулирования и анализа большого массива информации. Таким образом, выводы, полученные в результате метаанализа, гораздо более значимы, чем результаты отдельно взятых исследований, хотя, как и во всех других случаях, могут быть исключения.
Получив результаты из различных исследований, мы можем затем использовать эти инструменты и концепции для оценки убедительности доказательств. Таким образом мы можем понять, что, скорее всего, верно, и действовать соответственно. Альтернативные гипотезы уже не кажутся правдоподобными, и мы можем быть вполне уверены в результате. Абсолютные доказательства с технической точки зрения недостижимы, и это не имеет значения. Однако доказательства с точки зрения здравого смысла (вероятность 99 %) достижимы и очень важны. Так, именно благодаря изложенному процессу интерпретации исследований мы сформировали наши взгляды на взаимосвязь курения и здоровья. Никогда не существовало стопроцентных доказательств, что курение вызывает рак легких, но вероятность того, что курение никак не связано с раком легких, настолько пренебрежимо мала, что этот вопрос давно считается закрытым.