Как не ошибаться

Как не ошибаться

Джордан Элленберг

Ошибка Берксона, или Почему красивые мужчины такие кретины?

Тот факт, что корреляция может быть обусловлена необнаруженной общей причиной, уже создает путаницу, но это еще не все. Корреляция может также проистекать из общего
следствия
. Этот феномен известен как
ошибка Берксона
, по имени специалиста по медицинской статистике Джозефа Берксона, который объяснил нам в 
восьмой главе
, как слепой расчет на 
p
-значение может привести к выводу о том, что небольшая группа людей с участием альбиноса состоит из негуманоидов.

Сам Берксон, подобно Фишеру, весьма скептически относился к идее о наличии связи между табаком и раком. Берксон, будучи доктором медицины, представлял старую школу эпидемиологии и с большим недоверием воспринимал любые заявления, обоснование которых было скорее статистическим, чем медицинским. Он считал, что такие заявления представляют собой вторжение наивных теоретиков в ту область, которая по праву принадлежит медикам; по этому поводу он писал в 1958 году:

Рак – это биологическая, а не статистическая проблема. Статистики могут должным образом сыграть вспомогательную роль в объяснении его причин. Однако, если биологи позволят статистикам выступать в качестве третейских судей по биологическим вопросам, научная катастрофа неизбежна
{245}
.

Особое беспокойство вызывал у Берксона тот факт, что потребление табака связывают не только с таким заболеванием, как рак легких, но и со многими другими болезнями, поражающими все системы организма человека. Для Берксона мысль о том, что табак оказывает столь радикальное губительное воздействие, была совершенно неправдоподобной:

Это все равно, что в процессе изучения лекарственного препарата от обычной простуды сделать вывод, что он не только облегчает насморк, но и лечит воспаление легких, рак и многие другие болезни. Ученый сказал бы в таком случае: «Должно быть, с этим методом исследования что-то не так»
{246}
.

Берксон, как и Фишер, был более склонен верить в так называемую конституциональную гипотезу, согласно которой относительное хорошее состояние здоровья некурящих можно объяснить существованием врожденных различий между людьми, которые не курят, и курильщиками:

Если от 85 до 95 % населения относятся к числу курильщиков, тогда очевидно, что у незначительного меньшинства некурящих особая конституция. Не так уж невероятно, что в среднем они должны жить относительно дольше, а это подразумевает, что уровень смертности в этом сегменте населения сравнительно низкий. В конце концов, небольшая группа людей, которые успешно сопротивляются непрестанным уговорам и обусловливанию со стороны компаний, размещающих рекламу сигарет, – это стойкие люди, и если они способны противостоять такому напору, то у них не должно быть особых трудностей с предотвращением туберкулеза и даже рака!

{247}
Берксон выдвигал возражения и против результатов первоначального исследования Долла и Хилла, которое проводилось среди пациентов британских больниц. Он обратил внимание в 1938 году на то, что такой способ отбора пациентов может создать видимость связей, которых на самом деле нет.

Предположим, например, что вы хотите узнать, является ли высокое кровяное давление фактором риска заболевания диабетом. Для этого вы можете провести среди пациентов своей больницы опрос, цель которого – определить, где больше пациентов с высоким давлением, среди тех, кто не страдает диабетом, или среди диабетиков. К своему большому удивлению, вы обнаруживаете, что гипертония
менее

распространена среди пациентов, страдающих диабетом. В таком случае вы можете склоняться к выводу, что высокое кровяное давление защищает от развития диабета или как минимум от появления настолько тяжелых симптомов диабета, когда требуется госпитализация. Однако, прежде чем вы начнете рекомендовать своим пациентам из числа диабетиков увеличить потребление соленых закусок, проанализируйте следующую информацию:
1000 человек, входящих в генеральную совокупность;

300 человек, страдающих гипертонией;
400 человек, страдающих диабетом;
120 человек, страдающих и гипертонией, и диабетом.
Предположим, в нашем городке живет 1000 человек, из которых 30 % страдают гипертонией и 40 % страдают диабетом. (Обитатели нашего города любят как соленые, так и сладкие закуски.) Предположим, что между этими двумя условиями нет никакой связи, а значит, 30 % из 400 диабетиков, или всего 120 человек, страдают также от высокого кровяного давления.

Если все больные обитатели города попали бы в больницу, тогда среди пациентов больницы было бы:
180 человек с гипертонией, но без диабета;
280 человек с диабетом, но без гипертонии;
120 человек с гипертонией и диабетом.

Из 400 лежащих в больнице диабетиков 120, или 30 %, страдают также гипертонией. Однако из 180 пациентов без диабета все 100 % имеют высокое кровяное давление! Было бы глупо делать из этого вывод, что гипертония предотвращает диабет. Между этими двумя состояниями существует отрицательная корреляция, но не потому, что одно из них приводит к отсутствию другого. Причина также не в существовании некоего скрытого фактора, который и поднимает кровяное давление, и помогает регулировать уровень инсулина в крови. Причина в том, что у этих двух состояний общее

следствие
, а именно – они оба приводят к тому, что человек попадает в больницу.
Проще говоря, если вы находитесь в больнице, то вы попали туда по какой-то причине. Если вы не диабетик, тогда больше вероятность того, что эта причина – высокое кровяное давление. Следовательно, то, что на первый взгляд кажется причинно-следственной связью между гипертонией и диабетом, на самом деле всего лишь статистический фантом.

Этот эффект может работать и в обратном направлении. В реальной жизни наличие двух болезней с большей долей вероятности может отправить вас в больницу, чем одна болезнь.
Все

120 пациентов, которые являются одновременно и гипертониками, и диабетиками, могут оказаться в больнице, но 90 % относительно здоровых людей, страдающих только одной болезнью, остаются дома. Более того, в больнице можно оказаться и по другим причинам: например, в первый снежный день года многие пытаются привести свои снегоочистители в порядок руками и в результате отрезают палец. В таком случае общая совокупность пациентов больницы может выглядеть так:

10 человек без диабета и гипертонии, но с отрезанным пальцем;
18 человек с гипертонией, но без диабета;
28 человек с диабетом, но без гипертонии;
120 человек с гипертонией и диабетом.

Теперь после проведения исследования в больнице вы обнаружите, что 120 из 148 диабетиков, или 81 %, страдают гипертонией. Однако только 18 из 28 пациентов, не страдающих диабетом, или 64 %, страдают гипертонией. Создается впечатление, что гипертония увеличивает вероятность того, что у вас есть еще и диабет. Но это снова иллюзия: мы с вами установили всего лишь тот факт, что множество людей, попадающих в больницу, не является случайной выборкой из генеральной совокупности.

Ошибка Берксона имеет смысл и за пределами медицины; на самом деле эту концепцию можно применить за пределами тех областей, в которых характеристики поддаются точной количественной оценке. Возможно, вы обратили внимание на то, что среди всех мужчин
[285]

в вашем списке возможных партнеров красивые мужчины, как правило, не бывают хорошими, тогда как хорошие не бывают красивыми. Может, причина в том, что симметричное лицо делает человека жестоким? Или в том, что хорошее обхождение с другими людьми делает человека некрасивым? Возможно. Но так не должно быть. Посмотрите на представленный ниже «большой квадрат мужчин».


В качестве рабочей гипотезы я допускаю, что все мужчины распределены по этому квадрату равномерно; в частности, здесь примерно в равном количестве присутствуют хорошие красивые мужчины, хорошие уродливые мужчины, плохие красивые мужчины и плохие уродливые мужчины.

Однако у хорошего характера и красоты есть общее следствие: эти качества относят мужчин к той группе, на которую вы обращаете внимание. Скажите честно: ведь вы даже не станете рассматривать в качестве кандидатов в спутники жизни уродов с плохим характером. Таким образом, внутри «большого квадрата» есть «небольшой треугольник приемлемых мужчин».


Теперь источник этого явления очевиден. Самые красивые мужчины в вашем треугольнике представляют весь диапазон личностей, от самых добрых до самых жестоких. В среднем они почти такие же хорошие, как среднестатистический мужчина во всей совокупности мужчин, которая, надо признать, не такая уж хорошая. Точно так же самые хорошие мужчины всего лишь в среднем красивы. Однако некрасивые парни, которые вам нравятся (они образуют крошечный сегмент треугольника), очень хорошие люди – они должны быть такими, иначе вы их вообще не заметите. Отрицательная корреляция между внешностью и личностью в вашем списке потенциальных партнеров абсолютно реальна. Однако, если вы попытаетесь улучшить телосложение своего парня, научив его вести себя плохо, вы станете жертвой ошибки Берксона.

По такому же принципу действует литературный снобизм. Вы знаете, почему популярные романы настолько ужасны? Причина не в том, что массовый читатель не ценит качество. Причина в том, что существует «большой квадрат романов», а также в том, что вы слышали только о тех романах, попадающих в «треугольник приемлемых романов», которые являются либо популярными, либо хорошими. Если вы заставите себя прочитать непопулярные романы, выбранные, по сути, случайным образом (я входил как-то в жюри по присуждению литературных премий, так что я реально занимался этим), вы обнаружите, что большинство из них, как и популярные романы, довольно низкого качества.

Безусловно, «большой квадрат» – слишком простой инструмент. Существует гораздо больше двух измерений, по которым вы можете оценивать своих возлюбленных или книги для чтения. Так что «большой квадрат» следовало бы назвать «большим гиперкубом». И речь идет только о ваших личных предпочтениях! Если вы попытаетесь понять, что происходит с населением в целом, вам понадобится разобраться с тем фактом, что разные люди по-разному определяют привлекательность; они могут присваивать разный вес разным критериям, или у них просто могут быть несовместимые предпочтения. Процесс агрегирования мнений, предпочтений и желаний множества разных людей создает очередной ряд трудностей, а это значит, что у нас появилась еще одна возможность позаниматься математикой. Ею мы и займемся.

Все материалы, размещенные в боте и канале, получены из открытых источников сети Интернет, либо присланы пользователями  бота. 
Все права на тексты книг принадлежат их авторам и владельцам. Тексты книг предоставлены исключительно для ознакомления. Администрация бота не несет ответственности за материалы, расположенные здесь

Report Page