Мозгоускорители

Мозгоускорители

Ричард Нисбетт

8. Связи

Статистика может быть полезна, а иногда даже необходима, чтобы дать чему-либо точную характеристику. Кроме того, статистика позволяет определить, существует ли связь между одним явлением и другим. Как несложно догадаться, с уверенностью говорить о наличии или отсутствии связей между явлениями может быть еще труднее, чем точно охарактеризовать какое-либо явление, предмет или человека.

Вам нужно правильно охарактеризовать явление 1, а также явление 2. Затем вам нужно подсчитать, насколько часто явление первого типа возникает вместе с явлением второго типа, как часто явление первого типа не возникает вместе с явлением второго типа и т.д. Если переменные величины непрерывны, задача усложняется еще больше. Нужно рассчитать, связаны ли более высокие показатели явлений первого типа с более высокими показателями явлений второго типа. Даже такое абстрактное рассуждение ясно дает понять, что у нас возникнут большие проблемы при попытке оценить степень связи между переменными величинами. И в самом деле, наши трудности с поиском ковариаций (или корреляций) очень серьезны. А последствия наших ложных оценок могут быть весьма и весьма неблагоприятными.


Корреляция
Посмотрите на таблицу 3 внизу. Связан ли симптом X с болезнью А? Другими словами, можно ли по симптому X диагностировать болезнь А?
Таблица 3.
Связь между болезнью А и симптомом X


В таблице 3 говорится о том, что у 20 человек, страдающих болезнью А, присутствует симптом X, а у 80 человек, страдающих болезнью А, он отсутствует; при этом у десяти человек, не страдающих болезнью А, также присутствует этот симптом, а у 40 человек, не страдающих этой болезнью, отсутствует. На первый взгляд может показаться, что это простейшая задача на поиск ковариации, которую только можно себе представить. Вариантов всего два (или/или). Вам не нужно собирать информацию, или кодировать исходные данные и присваивать им численные значения, или вспоминать всю информацию об этих данных. У вас нет никаких предубеждений, которые могут повлиять на ваш выбор в пользу одного ответа, а не другого; и информация представлена для вас уже в виде сводки. Как же люди справляются с этой базовой задачей на поиск ковариации?

На самом деле очень плохо.
Самая распространенная ошибка в решении этой задачи — полагаться исключительно на графу «да/присутствует». «Да, этот симптом связан с этой болезнью. У некоторых людей с симптомом X обнаружена эта болезнь». Тенденция к выражению такого рода мнения является примером необъективности подтверждения — склонности искать доказательства, которые подтвердят уже имеющуюся гипотезу, не учитывая при этом тех доказательств, которые могут эту гипотезу опровергнуть.

Другие, взглянув на таблицу, обращают внимание на две графы. Кое-кто делает вывод, что симптом связан с этой болезнью, «потому что людей, имеющих этот симптом и страдающих этой болезнью, больше, чем людей, имеющих этот симптом и не болеющих этой болезнью». Другие делают вывод, что симптом не связан с болезнью, «потому что среди страдающих этой болезнью людей больше тех, кто не имеет этого симптома, чем тех, кто его имеет».

Не имея представления о статистике как науке, мало кто понимает, что нужно принимать во внимание все четыре графы таблицы, чтобы суметь ответить на простой вопрос о связи между этими двумя явлениями.

Нужно составить пропорцию для сравнения количества людей, у которых диагностировали данное заболевание в сочетании с данным симптомом, и количества людей, у которых обнаружили данную болезнь, но не этот конкретный симптом. Затем вы составляете пропорцию для сравнения количества людей, у которых нет данного заболевания, но есть этот симптом, и количества людей, у которых нет заболевания и нет симптома. Так как в результате получаются две одинаковые пропорции, мы понимаем, что этот симптом ничуть не больше связан с этой болезнью, чем с ее отсутствием.

Вас, наверное, встревожит тот факт, что большинство людей, включая врачей и медсестер, которые ежедневно занимаются лечением болезней, как правило, затрудняются дать правильный ответ при изучении таких данных, как приведенные в таблице 3
[108]

. К примеру, можно показать им таблицу, в которой отмечено, сколько больных некой болезнью выздоровели в результате определенного вида лечения, сколько не выздоровели, а также сколько больных выздоровели без этого лечения и не выздоровели без этого лечения. Врачи иногда могут предположить, что определенное лечение помогает больным, потому что из получивших его большее количество людей выздоровело, чем не выздоровело. Но, не зная соотношения этого количества людей с количеством выздоровевших без этого лечения и количеством людей, не выздоровевших без этого лечения, невозможно сделать верные выводы. В связи с этим такие таблицы иногда называют таблицы 2x2, или четырехпольные таблицы.

Существует статистический критерий, называемый хи-квадрат, который рассматривает вероятность того, что две пропорции достаточно отличаются друг от друга, чтобы можно было с уверенностью утверждать, что перед нами подлинная взаимосвязь явлений. Мы называем взаимосвязь подлинной, если разница между двумя пропорциями статистически значима.

Типичный критерий, на основе которого можно утверждать, значима связь или нет, формулируется так: показывает ли тест (хи-квадрат или любой другой статистический тест), что данная степень связи может оказаться случайной лишь в пяти случаях из ста. Если так, мы говорим, что уровень статистической значимости равен 0,05. Тест оценки значимости можно применять не только к дихотомическим данным (или/или), но и к непрерывным.

Когда мы имеем дело с непрерывными случайными величинами и хотим знать, насколько тесно они связаны одна с другой, мы применяем статистический метод корреляции. Возьмем две переменные величины, которые очевидно коррелируют между собой, — рост и вес. Конечно, связь между ними не абсолютная, потому что, как мы знаем, есть много примеров невысоких людей с относительно большим весом и, наоборот, высоких людей с относительно небольшим весом.

Статистические методы могут рассказать нам о том, насколько тесна связь между двумя величинами. Один из часто используемых методов исследования степени связи между непрерывными величинами называется методом корреляции смешанных моментов Пирсона. Корреляция, равная 0, означает, что между двумя величинами нет никакой связи. Корреляция, равная +1, означает, что между двумя величинами существует полная положительная связь, то есть если значение первой величины увеличивается, то значение второй величины увеличивается в соответствующей степени. Корреляция, равная -1, означает полную отрицательную связь.


Рис. 3.
Диаграмма разброса и корреляции

На рисунке 3 с помощью так называемых диаграмм разброса показано, насколько велика корреляция такого масштаба. Отдельные графики называются диаграммами разброса, потому что они показывают степени разброса относительно прямой линии — полной функциональной связи.
Корреляцию, равную 0,3, трудно распознать визуально, но на практике она может быть очень важна. Корреляция уровня 0,3 соответствует, например, прогнозируемости уровня дохода в зависимости от IQ

[109]
или успеваемости в аспирантуре в зависимости от оценок в колледже
[110]
. В такой же степени можно спрогнозировать вероятность развития сердечно-сосудистых заболеваний в зависимости от веса человека.

Корреляция 0,3 это вовсе не пустяк — это значит, что если кто-то находится в 84-м процентиле (одно СКО выше среднего значения) переменной величины А, то этот человек скорее всего будет в 63-м процентиле по величине Б (0,3 СКО выше среднего значения). А это уже более высокая прогнозируемость для величины Б, чем та, что была у вас, когда вы ничего не знали о величине А. В этом случае вы должны догадаться, что 50-й процентиль для каждого — среднее значение распределения величины Б. Иногда такой факт может решить судьбу вашего бизнеса — будет он процветать или обанкротится.

Корреляция 0,5 соответствует степени связи между уровнем 1(2 и качеством исполнения служебных обязанностей на средней должности. (Корреляция в данном случае будет выше, когда работа сложная и ответственная, и ниже, когда работа более легкая.)

Корреляция 0,7 соответствует степени связи между ростом и весом — она существенна, но все же это не полная взаимосвязь. Корреляция 0,8 соответствует степени связи между баллами за тестирование знаний по математике за один год и баллами за этот же тест на следующий год — это довольно высокая корреляция, но все же разница между двумя оценками в среднем может быть велика.

Корреляция не означает наличие причинно-следственной связи

Расчет коэффициента корреляции — только один из шагов в определении причинно-следственных связей. Если между величиной А и величиной Б нет корреляции, тогда между ними (вероятно) нет и причинно-следственной связи. (Исключением может быть такой случай, когда существует третья величина В, которая маскирует корреляцию между А и Б, когда между ними на самом деле есть причинно-следственная связь.) Если между А и Б есть корреляция, это еще не говорит о том, что изменение величины А является причиной изменения величины Б. Возможно, А влияет на Б или Б влияет на А, а также ассоциация может возникнуть вследствие того, что А и Б связаны с некой третьей величиной В, но между А и Б нет никакой причинно-следственно связи.

Практически любой человек с высшим образованием признает, что теоретически эти утверждения верны. Но зачастую конкретная корреляция настолько согласуется с весьма правдоподобными объяснениями некой взаимообусловленности, что мы автоматически принимаем ее как доказательство наличия причинно-следственной связи. Нам так хорошо удается строить гипотезы о причинах и следствиях, что это происходит практически само собой. Выводы о причинах и следствиях, которые возникают у нас в голове, часто бывают настолько соблазнительны, что нам трудно от них отказаться. Если я скажу вам, что у людей, которые едят много шоколада, чаще бывают прыщи, трудно не сделать вывод, что шоколад вызывает появление прыщей. (Как известно, это не так.) Если я скажу вам, что пары, которые тщательно готовятся к свадьбе, потом дольше живут в браке, у вас возникнет естественный вопрос: каким же образом тщательно продуманная свадебная церемония продлевает брак? Не так давно в статье в одной очень известной газете автор утверждал, что такая корреляция существует, и пускался в размышления, почему совместная работа по планированию свадьбы производит такой эффект. Если поразмыслить над этой корреляцией, вы поймете, что тщательное планирование свадьбы не является случайным событием; скорее, можно сказать, что это событие с большей вероятностью произойдет у тех, у кого больше друзей, больше свободного времени друг для друга, больше денег и много чего еще. Любой из этих аспектов, а лучше сказать, все они и влияют на прод

Взгляните на причинно-следственные связи, изложенные в подборке 1. Все они реальны. Некоторые из них выглядят весьма правдоподобно, другие наоборот — весьма неправдоподобно. Независимо от того, считаете вы причинно-следственную связь правдоподобной или нет, подумайте, можете ли вы дать объяснения следующих типов: 1) А приводит к Б; 2) Б приводит к А; 3) что-либо, связанное и с А, и с Б, оказывает влияние, а между А и Б нет связи. Затем взгляните на возможные ответы в подборке 2.

Подборка 1. Размышляем о корреляциях: какими могут быть причинно-следственные связи?
1. В статье, опубликованной в журнале
Time,
утверждается, что попытки родителей контролировать, сколько едят их дети, приводят к тому, что дети набирают избыточный вес. Если родители перестанут контролировать количество еды, похудеют ли эти дети?
2. В тех странах, где выше средний уровень IQ, выше и среднее благосостояние граждан, измеряемое в ВВП на душу населения. Делает ли наличие умных людей страну богаче?

3. Уровень смертности среди людей, посещающих церковь, ниже, чем среди тех, кто церковь не посещает. Означает ли это, что вера в Бога делает жизни людей длиннее?
4. Владельцы домашних животных реже страдают от депрессии. Если подарить страдающему от депрессии человеку кота, станет ли он счастливее?

5. В странах, в которых пропагандируется воздержание от сексуальной жизни, совершается больше убийств. Вызывает ли агрессию пропаганда воздержания от сексуальной жизни? Если изменить данную область образования и больше рассказывать людям о сексуальной жизни, снизится ли в этих странах процент убийств?
6. У умных мужчин сперма лучше — ее больше и она более активна. Означает ли это, что учеба в колледже, благодаря которой можно стать умнее, также улучшает качество спермы?

7. Те, кто курит марихуану, с большей вероятностью будут употреблять также и кокаин, чем те, кто не курит марихуану. Значит ли это, что курение марихуаны приводит к употреблению кокаина?
8. В 1950-е гг. была установлена практически полная корреляция между употреблением мороженого и заболеванием полиомиелитом, представлявшем тогда серьезную угрозу. Разумно ли было бы запретить продавать мороженое в те годы?

Подборка 2. Возможные ответы на вопросы о корреляциях из подборки 1

1. Возможно, родители начинают контролировать количество еды, съедаемой ребенком, если у ребенка появляется избыточный вес. В таком случае направление причинно-следственной связи прямо противоположно гипотезе журнала
Time.

Вы не вызываете у ребенка ожирение, контролируя размер его порций, — вы начинаете контролировать ребенка, если у него появится избыточный вес. Бывает также, что в не очень счастливых семьях, где царит атмосфера стресса, родители чрезмерно контролируют детей, а дети страдают от ожирения, но и в этом случае не наблюдается причинно-следственной связи между попытками контроля питания и весом ребенка.

2. Возможно, в более благополучных странах лучше развита система образования, а значит, у людей есть возможность достигать высокого уровня IQ. В этом случае благосостояние влияет на уровень интеллекта, а не наоборот. Также возможно, что какой-нибудь третий фактор, например физическое здоровье, влияет как на благосостояние общества, так и на уровень интеллекта граждан. (Между прочим, все три эти причинно-следственные связи существуют на самом деле.)

3. Возможно, более здоровые люди в принципе чаще участвуют в различных событиях социальной жизни, включая посещение церкви. Если так, направление причинно-следственной связи здесь прямо противоположно тому, что подразумевается в вопросе: не посещение церкви делает людей здоровее, а люди ходят в церковь, потому что они здоровы. Или, может быть, интерес к социальной жизни, такой как посещение церкви, побуждает людей и быть более активными, и оставаться более здоровыми.

4. Возможно, люди, страдающие от депрессии, менее склонны предпринимать что-либо для своего развлечения, например заводить домашнее животное. А если так, значит, вновь перепутаны причина и следствие: не покупка кота снижает вероятность депрессии, а депрессия снижает вероятность покупки кота. (На самом деле если человеку, страдающему от депрессии, подарить домашнего питомца, это может улучшить его настроение, так что животные действительно положительно влияют на наше психологическое состояние; однако для доказательства этого одной только корреляции между присутствием кота и отсутствием депрессии недостаточно.)

5. Возможно, в бедных государствах чаще совершаются убийства, а также пропагандируется воспитание в духе безусловного воздержания от секса. (На самом деле то и другое правда.) Поэтому между сексуальным просвещением и убийствами может вовсе не быть причинно-следственной связи. Скорее с ними могут быть связаны бедность, низкий образовательный уровень или какие-то следствия этих социальных бед.

6. Возможно, крепкое здоровье помогает людям быть умнее и улучшает качество спермы. А возможно, дело в каком-то другом факторе, связанном и с интеллектом, и с качеством спермы, например в отказе от алкоголя или наркотиков. Таким образом, между интеллектом и качеством спермы может не быть никакой причинно-следственной связи.

7. Возможно, люди, которые употребляют наркотики любого вида, более склонны к поиску новых ощущений, а потому они пробуют что-то, возбуждающее эмоции, даже если это противозаконно. Курение марихуаны не приводит к употреблению кокаина, так же как и употребление кокаина не приводит к курению марихуаны. Скорее, на то и другое влияет третий фактор — жажда новых ощущений.

8. В 1950-е гг. была установлена высокая корреляция между потреблением мороженого и заболеванием полиомиелитом, потому что полиомиелитом было легко заразиться в бассейнах и водоемах. А дети едят мороженое и купаются в одно и то же время года — летом.

Иллюзорная корреляция

Невозможно описать, как это важно — собирать данные систематически, а затем делать расчеты, чтобы определить, насколько сильна ассоциация между двумя переменными величинами. Это необходимо, потому что, просто живя и наблюдая за явлениями в мире, можно постоянно получать безнадежно неверное представление о взаимосвязи между событиями. Риск иллюзорной корреляции абсолютно реален.

Если вы считаете, что положительная корреляция между двумя величинами кажется правдоподобной (чем больше А, тем больше Б), ваши наблюдения за причинами и следствиями, скорее всего, еще больше убедят вас, что вы правы. Но часто так бывает не только когда положительная корреляция между величинами отсутствует, но и тогда, когда между ними имеется отрицательная корреляция. Если вы видите и вспоминаете больше тех случаев, которые поддерживают вашу гипотезу, чем тех, что опровергают ее, это еще одно проявление необъективности подтверждения.

И наоборот, если связь кажется вам неправдоподобной, вы вряд ли обнаружите ее, даже если она очень сильна. Психологи сажали голубей в помещение с автоматической кормушкой. На полу был установлен диск, который время от времени светился. Корм появлялся тогда, когда светился диск, и при условии, что голубь не клевал сам диск. Если голубь начинал клевать диск, корм не появлялся. Птица едва не умирала от голода, прежде чем понимала, что, если не клевать диск, появится корм. Голуби считали неправдоподобным, что если не клевать что-то, то от этого появится корм.

Так же, как этим голубям, людям бывает трудно перешагнуть через свои изначальные предположения. Экспериментаторы демонстрировали клиническим психологам страницы теста Роршаха якобы с ответами пациентов о возникших у них ассоциациях. Там же были написаны симптомы психологических нарушений, якобы выявленные у этих несуществующих пациентов
[111]

. Например, на одной картинке было обозначено, что пациент а) увидел на рисунке гениталии и б) у него имеются сексуальные расстройства. После этого клинические психологи довольно часто утверждали, что пациенты, увидевшие на рисунке гениталии, скорее всего имеют проблемы сексуального характера, даже если все имеющиеся данные говорили, что эти пациенты менее склонны к сексуальным расстройствам. Однако идея о том, что проблемы сексуального характера могут сочетаться с повышенным вниманием к гениталиям, выглядит очень правдоподобной, и подтверждающие это примеры более заметны.

Когда психологам говорили, что они ошибаются и результаты теста Роршаха выявили отрицательную корреляцию (у пациентов, которые видят гениталии, менее вероятны сексуальные отклонения), это вызывало у испытуемых усмешку. Они утверждали, что в их клинической практике гениталии на картинках теста Роршаха чаще видят люди с сексуальными проблемами. В действительности это не так. Анализ имеющихся данных по тесту Роршаха такой связи не показывает.

На самом деле ассоциации могут быть практически любыми, и они ничего не скажут вам о человеке
[112]
. На исследования с помощью теста Роршаха были потрачены сотни тысяч часов и миллионы долларов, прежде чем кто-то задался вопросом, а есть ли связь между ответами и симптомами. Но еще несколько десятков лет после того, как отсутствие связи было установлено, иллюзия корреляции продолжала поддерживать популярность этого теста и заставляла вновь и вновь тратить время и средства.

Я не собираюсь придираться к психологам и психиатрам с этими примерами. Выпускники университетов допускают те же самые ошибки, что и врачи, ставя эксперименты над иллюзорной корреляцией с использованием теста Роршаха и отмечая, что, если пациент видит на рисунках гениталии, это говорит о его сексуальных проблемах, если чьи-то глаза — это свидетельство паранойи, а если оружие — то враждебности.


Все материалы, размещенные в боте и канале, получены из открытых источников сети Интернет, либо присланы пользователями  бота. 
Все права на тексты книг принадлежат их авторам и владельцам. Тексты книг предоставлены исключительно для ознакомления. Администрация бота не несет ответственности за материалы, расположенные здесь

Report Page