Колонки создают впечатление того, что спонсор ролика на голову превосходит конкурентов. Интересно, кто-нибудь раскусил это?
Бенджамин Дизраэли (1804–1881), вероятно, был прав, когда сказал, что есть три вида лжи: ложь, гнусная ложь и статистика. Впрочем, если по правде, то эта история, скорее всего, тоже ложь. Эту ремарку приписывал британскому премьер-министру Марк Твен (1835–1910), но никто и никогда не слышал того, чтобы Дизраэли произносил это знаменитое высказывание, и ни в одном из его сочинений такой фразы не нашли.
Парадокс Симпсона
В 1973 г. исследователи, решившие изучить жалобы на гендерные предрассудки в Калифорнийском университете в Беркли, выяснили, что, после того как примерно 8000 мужчин и 4000 женщин подали документы в аспирантуру, доля мужчин, которых туда принимали, оказалась намного выше доли женщин. На университет подали в суд за предвзятость. Но была ли здесь дискриминация женщин на самом деле? Исследователи проверили данные приемных комиссий по отдельным факультетам и выяснили вот что: если и была причина для обращения в суд, то по поводу совершенно иной дискриминации! Все факультеты отдавали предпочтение женщинам – и, если судить в процентном отношении, принимали их чаще, чем мужчин.
Если вам не знакома статистика (или законы исчисления дробей), это может показаться невозможным. Если бы все факультеты проявили предвзятость и оказывали благосклонность женщинам, тогда и весь университет проявил бы такие же гендерные предрассудки – а все обстояло совершенно иначе.
Английский статистик Эдвард Симпсон (1922–2019) описал этот феномен в своей статье, вышедшей в 1951 г. и озаглавленной «Интерпретация взаимодействия в таблицах сопряженности»[22]. Сегодня мы называем это явление парадоксом Симпсона, или эффектом Юла – Симпсона (Удни Юл, статистик из Великобритании, уже упоминал о похожем эффекте в 1901 г.). Я объясню это без практических данных Беркли – с помощью простой гипотетической версии.
Предположим, у нас есть университет, в котором только два факультета – математический и юридический. Пусть 100 женщин и 100 мужчин подают документы на факультет математики, куда проходят 60 женщин (или 60 %) и 58 мужчин (58 %). Кажется, на математическом женщины в фаворе. На юридический подают документы 100 женщин, совершенно других, из них проходят 40 (40 %); что же касается мужчин, то юриспруденцию хотят изучать всего трое, а проходит только один. Один из трех – это меньше чем 40 %, и создается впечатление, что оба факультета предпочитают брать к себе женщин. Но если мы посмотрим на общие цифры по университету, то окажется, что из 200 женщин, подавших документы, принято 100, то есть 50 %, а из 103 мужчин, подавших документы, принято 59, то есть больше 50 %.
И как все это объяснить?
Вместо того чтобы переходить к техническим сложностям, позвольте привести интуитивно понятное объяснение. На основании имеющихся данных видно, что юридический факультет относится к поступающим намного суровее. И когда много женщин (100) подают документы на юридический факультет, отношение поступивших к общему числу, выраженное как 60 %, становится гораздо менее ценным. Поскольку равное количество женщин подает документы на каждый факультет, общее процентное отношение женщин, принятых в университет, к женщинам, подавшим документы, – это среднее арифметическое от 60 и 40, то есть 50. Но по причине того, что все знают, сколь суров и жесток юридический факультет, документы туда подают только трое мужчин, а поступает только один (и ничего бы не изменилось, если бы не поступил никто) – и это почти никак не влияет на процентное соотношение мужчин, принятых на математический факультет, к мужчинам, подавшим туда документы.
Вывод: да, оба факультета отдавали предпочтение женщинам. Но именно потому, что на юридический факультет, где процент зачисленных ниже, пытались поступить в большинстве своем женщины, а мужчины почти не шли, при объединении процентных соотношений доля мужчин действительно оказывается больше.
Сказать по правде, парадокс Симпсона сообщает нам кое-что очень простое о законах дробей. Приведенные ниже строки – это не более чем та же самая история, только в виде дробей: