Вероятность, Библия, 9/11 и отпечатки пальцев
Как-то раз один ученый показал мне ловкий трюк. 50-я буква в Книге Бытия на иврите – Т. Отсчитайте еще 50 букв – и вы окажетесь на букве О. Еще 50 букв – и мы на Р, а 200-я буква (еще плюс 50) – А. Произнесем все вместе… ТОРА! Слово на иврите, призванное обозначить Пятикнижие, или Учение! Случайное ли это совпадение? Или так было задумано? Когда-то в прошлом люди часто развлекались, прочесывая Библию на предмет самых разных интервалов, исполненных скрытого смысла, и на эту тему даже писали книги и статьи. Так правда ли Священное Писание содержит тайные послания наподобие этого? Если оставить в стороне богословские аспекты, то это прежде всего статистический вопрос, который мы можем задать и о других пространных книгах, таких как та же «Война и мир». Не содержатся ли в них интересные комбинации? Что же, скорее всего, они там есть. Множество любопытных распределений таят в себе и «Моби Дик», и «Анна Каренина», и много других больших-больших книг. (Просто представьте, сколько их можно найти в романе «В поисках утраченного времени», семитомном сочинении Марселя Пруста!)
После террористических атак 11 сентября 2001 г. жители Нью-Йорка были поражены совпадением случайных «фактов», возникших вокруг злодеяния. Например, номер рейса первого самолета, который врезался во Всемирный торговый центр, – 11! В сочетании «Нью-Йорк Сити» 11 букв, равно как и в английском написании слова «Афганистан» (Afghanistan), и в имени президента Буша (George W. Bush). Кроме того, 11 сентября – это 254-й день года. «И что?» – спросите вы. Как что? 2 + 5 + 4 = 11! Даже форма башен-близнецов напоминает число 11. Вот теперь и правда становится страшно!
Еще одна интересная проблема, косвенно с этим связанная, – раскрытие преступлений по отпечаткам пальцев. Я выступаю в защиту такого мнения: когда суды готовятся предъявить кому-либо обвинение, поскольку его отпечатки пальцев совпали с теми, что нашлись на месте преступления, сперва неплохо бы подумать о том, сколь густо населена округа. Насколько мне известно, совпадения по отпечаткам пальцев никогда не бывают идеальными: совпадает лишь определенное количество идентичных форм. (Возможно, вы помните, как сказал Бенджамин Франклин: уверенным быть можно в двух вещах – в налогах и в смерти. Об отпечатках пальцев он не упоминал.) Вероятность того, что совпадут неидентичные отпечатки, составляет 1:100 000 или 1:200 000, в зависимости от того, что за книгу вы держите в руках. Итак, если отпечатки найдены на месте преступления в поселке, где проживают двести человек, и у нас есть подозреваемый, чьи отпечатки совпадают с найденными на месте преступления, тогда шанс того, что мы нашли преступника, весьма высок: вряд ли мы найдем в этом городишке другого жителя с такими же пальчиками. Но, когда этот метод применяют к преступлению, совершенному, скажем, в Нью-Йорке или Токио, разумно предположить, что там мы можем найти гораздо больше людей со схожим паттерном отпечатков.
О средних величинах и медианах
Хотя средние величины часто упоминаются в самых разных повседневных контекстах, мне кажется, что «среднее» – это одна из самых запутанных проблем в мире статистики. Например, нам скажут, что средняя месячная зарплата в условном Хэппиленде – стране счастливой жизни – составляет $100 000. Что это значит? Я спросил нескольких умных людей, и оказалось, что многие понимают это так: примерно у 50 % жителей Хэппиленда доход превышает $100 000, а у другой половины он ниже этой отметки. Конечно же это ошибка. Величина, разделяющая население надвое, – это не среднее, а медиана. Что же до средней величины, о которой упоминалось выше, то очень вероятно, что в стране есть горстка избранных с баснословными доходами, гораздо выше уровня $100 000, а все остальные – большинство – зарабатывают меньше. Представим такую картинку: семеро работают в гипотетическом филиале банка. У шестерых обычные зарплаты, а у менеджера – $7 млн. Выходит, средняя зарплата по банку – более $1 млн. Да, как-то так – ведь даже если мы возьмем одну только зарплату менеджера и разделим ее на семь равных частей, у нас в каждой части будет по миллиону, значит, реальная средняя величина должна быть выше. В этом примере только один человек получает больше остальных, а все остальные получают меньше, и, как видно, доходы меньше средней зарплаты не у половины сотрудников, а у гораздо большего их числа. Известен тот факт, что в некоторых странах только у 30–40 % работников заработная плата больше средней.