(Не)совершенная случайность

(Не)совершенная случайность

Леонард Млодинов

Подобные исследования проводились и до Кетле, однако Кетле сделал с цифрами нечто большее, чем просто изучил средние значения, — он внимательно присмотрелся к тому, каким образом данные отклоняются от среднего значения. И всюду находил нормальное распределение: в предрасположенности к преступлению, браку и самоубийству, в высоте роста американских индейцев, в размерах грудной клетки шотландских солдат (на данные обмеров 5 738 солдат он наткнулся в старом номере «Эдинбургского журнала по медицине и хирургии»). Что касалось данных по росту 100 тыс. молодых французов призывного возраста, то в отклонениях от нормального распределения он также обнаружил определенные закономерности. Если изобразить данные по числу призывников и данные по их росту в виде графика, то колоколообразная кривая получится искаженной: слишком мало новобранцев, чей рост превышал 158 см, зато тех, чей рост оказался чуть меньше, в качестве компенсации наблюдалось в избытке. Кетле счел, что разница — около 2 200 лишних «коротышек» — получилась в результате мошенничества или, мягко говоря, те, чей рост оказался ниже 158 см, были освобождены от службы.

Десятилетия спустя великий французский математик Пуанкаре воспользовался методом Кетле, чтобы поймать нечистого на руку булочника, который обвешивал покупателей. Пуанкаре, каждый день покупавший буханку свежего хлеба, решил взвесить буханки и заметил: в среднем они весят 950 г, а не обозначенный в прейскуранте 1 кг. Стоило Пуанкаре пожаловаться властям, как ему стали продавать буханки большего веса. Но Пуанкаре все равно не отпускало ощущение, будто хлеб его «не кошерный». И вот он с терпением, какое присуще только ученым великим или же с приличным стажем, принялся взвешивать буханки: каждый день в течение года. Да, теперь по весу буханки в среднем приблизились к 1 кг; однако если булочник в самом деле давал Пуанкаре первую попавшуюся буханку, число буханок большего веса и меньшего веса, которые должны быть у булочника — об этом я говорил в главе 7 — должно сократиться в соответствии с колоколообразной кривой закона ошибок. Вместо этого Пуанкаре обнаружил слишком мало буханок меньшего веса и избыток буханок большего веса. Из чего сделал вывод: булочник продолжал свое дело, просто теперь, стремясь усыпить бдительность Пуанкаре, продавал ему буханки побольше. Полиция вновь навестила булочника-мошенника, который, судя по словам свидетелей, оказался совершенно не готов к такому визиту и, по-видимому, дал слово исправиться

{165}
.

Кетле наткнулся на полезное открытие: характер распределения случайностей настолько надежен, что в определенных социологических данных его искажение может быть воспринято как свидетельство правонарушения. В наше время подобным образом анализируют данные, слишком обширные для анализа времен Кетле. В последние годы такое «статистическое выслеживание» распространилось, возникло даже новое направление — судебная экономика, — самым известным примером которой является изучение статистической информации с целью выявления компаний, проводящих свои опционные гранты задним числом. Идея проста: компании предоставляют опционные гранты — право покупки акций — позже по цене этих акций на дату предоставления права — в качестве поощрения менеджеров. Если гранты проводятся задним числом, на дату особенно низкой стоимости акций, менеджеры соответственно получают максимальные доходы. Ловко придумано, однако тайное исполнение этой придумки выливается в нарушение законодательства по ценным бумагам. Кроме того, остаются статистические «отпечатки пальчиков», которые уже привели к раскрытию подобной практики в десятке крупных компаний

{166}
. В менее известном случае Джастин Вулферс, экономист из бизнес-школы Уортона, обнаружил свидетельства мошенничества в результатах более 70 тыс. баскетбольных игр, сыгранных между колледжами
{167}
.

Вулферс обнаружил аномальность, сравнивая форы лас-вегасских букмекеров с истинными исходами игр. Когда одна команда является фаворитом, букмекеры предлагают форы, чтобы привлечь примерно одинаковое число ставок на обе команды. Предположим, что баскетбольную команду Калифорнийского технологического посчитали лучше команды Калифорнийского университета в Лос-Анджелесе (что до спортивных фанатов колледжа, то да, так оно и было в 1950-х гг.). Чем заключать пари с неравномерным распределением, букмекеры могли предложить ставки с равными шансами на победу, однако выплачивать только в том случае, если, к примеру, Калифорнийский технологический выигрывал у Калифорнийского университета с перевесом в 13 и более очков.

Хотя форы устанавливаются букмекерами, на самом деле они зависят от тех, кто делает ставки, поскольку букмекеры выстраивают свою «линию» так, чтобы уравновесить спрос. (Букмекеры зарабатывают на марже, которую закладывают в свои прогнозы, поэтому им выгодно, чтобы по каждому участнику соревнования получалась равная сумма ставок — таким образом, они не остаются в накладе при любом исходе игры.) Чтобы определить, насколько умело оценивают обе команды те, кто делает ставки, экономисты используют число, называемое ошибкой прогнозирования — оно представляет собой разницу между преимуществом команды-фаворита и форой букмекера. Может показаться неудивительным, что ошибка прогнозирования, будучи ошибкой определенного типа, распределяется в соответствии с принципом нормального распределения. Вулферс обнаружил, что ее среднее — 0, то есть форы не стремятся ни переоценить, ни недооценить команды, и их среднее отклонение равно 10,9 очкам маржи победы. (При изучении футбольных игр профессиональных команд получился сходный результат: среднее — 0 и среднее отклонение — 13,9 очков.)

{168}

Когда Вулферс изучил подмножество игр, которые включали явных фаворитов, он обнаружил нечто поразительное: слишком мало игр, в которых явные фавориты выигрывали со счетом чуть большим, чем фора, и неожиданно много игр, в которых фаворит выигрывал со счетом чуть меньшим. Что снова возвращает к аномальности Кетле. И, как и Кетле с Пуанкаре, Вулферс сделал вывод о мошенничестве. Свой анализ он строил следующим образом: даже сильнейшему игроку трудно преодолеть фору, однако если команда является явным фаворитом, игрок, не ставя под угрозу шансы команды на победу, может снизить темп в достаточной мере, чтобы команда не преодолела фору. Таким образом, если нечистоплотные игроки на тотализаторе задумают жульничество, результатом окажутся те самые искажения, обнаруженные Вулферсом. Доказывает ли работа, проделанная Вулферсом, что в случае определенного процента баскетбольных игр между колледжами игроки брали взятки? Нет, но, как говорит Вулферс, «не должно быть такого, чтобы ситуация на игровом поле отражала ситуацию в игровых заведениях Лас-Вегаса». И вот что еще любопытно: в недавних опросах Национальной студенческой спортивной ассоциации 1,5% игроков признались: они знают товарищей по команде, кто «соглашается брать деньги за плохую игру»

{169}
.

Кетле не ставил перед собой цели найти применение своим идеям в судебных расследованиях. Он метил выше: разобраться с помощью принципа нормального распределения в природе людей и общества. Кетле писал: если сделать 1 тыс. копий статуи, копии окажутся разными из-за ошибок в измерениях и самой работе резчика, и эти отклонения будут подчиняться закону ошибок. Он утверждал: если разнообразие физических признаков у людей подчиняется все тому же закону, напрашивается вывод: мы представляем собой несовершенные копии прообраза. Кетле назвал этот прообраз

l'homme moyen
, то есть «средний человек». Он подозревал, что и для человеческого поведения существует шаблон. Может, менеджер большого универмага и не определит с уверенностью, прикарманит ли недавно взятая на работу чудаковатая кассирша приглянувшийся ей флакончик элитных духов «Chanel Allure», однако он знает: в розничной торговле потери товаров год от года держатся примерно на уровне 1,6%, причем раз за разом от 45% до 48% от этих потерь приходятся на долю краж со стороны персонала
{170}

. Кетле писал, что преступления «сродни отчислениям по финансовой смете, которые совершаются с ужасающей регулярностью»
{171}
.
Кетле признавал, что
l'homme moyen
был бы разным для разных культур и что он менялся бы с изменением социальных условий. Именно эти изменения, а также их причины и стремился изучить Кетле. «Человек рождается, растет и умирает в соответствии с определенными законами, — писал он, — и законы эти до сих пор еще не изучены»
{172}

. Ньютон стал отцом современной физики, сформулировав ряд законов, управляющих Вселенной. Видя перед собой пример Ньютона, Кетле жаждал создать новую «социальную физику», которая описывала бы законы поведения человека. По аналогии Кетле выходило: как объект, не будучи потревожен, продолжает двигаться, так и общество при неизменных социальных условиях не меняется. Ньютон описывал, как в результате воздействия физических сил объект отклоняется от движения по прямолинейной траектории; Кетле тоже искал законы поведения человека, описывающие, как социальные силы влияют на общество. Например, Кетле считал, что существенная разница в доходах и большие колебания цен ответственны за преступность и социальные волнения, а вот устойчивый уровень преступности говорит о состоянии равновесия, которое изменяется с изменением основополагающих причин. Недавним примером изменений в социальном равновесии, случившихся после террористического акта 11 сентября 2001 г., может служить следующее: люди стали бояться самолетов, предпочтя передвигаться на машинах. Их страх привел к тому, что смертность на дорогах увеличилась по сравнению с результатами прошлого года на 1 тыс. случаев — что называется, неявные потери теракта

{173}
.

Однако одно дело верить в существование социальной физики, и совсем другое — описать ее. Кетле понял: в случае с истинной наукой теории можно исследовать экспериментальным путем — помещая людей в различные ситуации и оценивая их поведение. Поскольку это невозможно, Кетле сделал вывод, что социология более походит на астрономию, нежели на физику: социологические исследования строятся на основе пассивных наблюдений. Таким образом, пытаясь раскрыть законы социальной физики, Кетле изучал временные и культурные изменения, происходящие с

l'homme moyen
.
Идеи Кетле были восприняты другими учеными, особенно во Франции и Великобритании. Один физиолог даже зашел так далеко, что собрал из писсуара в мужском туалете при железнодорожной станции образцы мочи людей разных национальностей с тем, чтобы выделить свойства «среднеевропейской мочи»
{174}

. В Британии у Кетле был ученик, уверовавший в его идеи с особенным энтузиазмом — Генри Томас Бокль, состоятельный человек, шахматист и историк, более известный своим многотомным трудом «История цивилизации в Англии», отличавшимся смелостью замысла. К несчастью, в 1861 г., остановившись во время путешествия в Дамаске, сорокалетний Бокль заболел тифом. Ему советовали местного врача, однако он, узнав, что врач — француз, отказался, в результате чего умер. Бокль не закончил свой труд. Однако успел написать два тома; в первом история представлялась с точки зрения статистики и была основана на работе Кетле. Труд Бокля тут же получил признание. Он распространился по всей Европе, вышли переводы на французский, немецкий, русский. Дарвин читал труд Бокля, и Альфред Рассел Уоллес читал, а Достоевский — даже дважды

{175}
.

Несмотря на популярность произведения Бокля, вердикт истории был таков: в математических изысканиях Кетле оказалось больше смысла, нежели в изысканиях социальной физики. Во-первых, не все то, что происходит в обществе, особенно в мире финансов, соответствует нормальному распределению. Например, если бы доходы от показа фильма распределялись нормально, большинство фильмов приносили бы некий средний доход, а две трети доходов от всех фильмов оставались бы в пределах среднего отклонения. Однако в кинематографическом бизнесе 20% фильмов приносят 80% доходов. Такие сферы деятельности, которые развиваются за счет хитов, хотя и совершенно непредсказуемы, повинуются совсем иному распределению, такому, для которого понятия «среднее» и «среднее отклонение» ничего не значат ввиду отсутствия «типичного» производства, а мегахитовые выбросы, которые в обычной сфере деятельности бывают раз в несколько сот лет, тут происходят неизмеримо чаще

{176}
.

Да, Кетле обошел своим вниманием распределения другой вероятности, однако обиднее то, что ему не удалось осуществить свое намерение — значительно продвинуться в попытках раскрыть законы и силы, которым он отдал столько сил и времени. Поэтому в конце концов непосредственное влияние Кетле на социальные науки оказалось весьма скромным, однако его наследие невозможно переоценить, оно имело далеко идущие последствия. И не для социальных наук, а для наук естественных, где его подход к толкованию порядка в большом количестве случайных событий вдохновил многих ученых и послужил толчком к созданию революционного труда, трансформировавшего способ мышления и в биологии, и в физике.


Именно двоюродный брат Чарльза Дарвина применил статистический анализ в биологии. В 1840 г. Фрэнсис Гальтон, человек, располагавший временем, поступил в кембриджский Тринити-Колледж
{177}

. Поначалу он изучал медицину, но затем по совету Дарвина занялся математикой. Ему было двадцать два, когда отец умер, в результате чего Фрэнсис унаследовал немалое состояние. Гальтону никогда не приходилось зарабатывать себе на жизнь, и он, оставаясь любителем, занялся наукой. Особенно его интересовали измерения. Он измерял человеческие головы, носы, руки и ноги, количество суетливых движений, которые слушатели совершали во время лекций, степень привлекательности девушек на улице (лондонские девушки получили самые высокие баллы, самые низкие оказались у девушек из шотландского Абердина). Он измерял характерные особенности отпечатков пальцев — потом, в 1901 г., эту практику распознавания по отпечаткам пальцев взяли на вооружение в Скотленд-Ярде. Он даже высчитал продолжительность жизни правителей и священников, которая оказалась такой же, как и у людей другого положения и рода деятельности, из чего Гальтон заключил: молитва в этом отношении не дает никаких преимуществ.

В своей книге 1869 г. под названием «Наследственность таланта. Законы и последствия» Гальтон написал: часть людей, выстроенных по росту, должна со временем сохранить практически то же соотношение, а принципу нормального распределения подчиняется не только рост, но и прочие физические признаки: окружность головы, размер мозга, вес серого вещества, количество мозговых нитей и так далее. Однако на этом Гальтон не остановился. Он верил, что и характер человека также задается наследственностью и, как и физические черты, подчиняется принципу нормального распределения. Согласно Гальтону, мужчины не «равны как ячейки общества, [не] каждый из них имеет право голоса и прочее»

{178}
. Гальтон утверждал: около 250 мужчин из каждого миллиона наследуют исключительные способности к тому или иному занятию и в результате добиваются в своей области значительных успехов. (Поскольку во времена Гальтона женщины не работали, для них он такой анализ не проводил.) Основываясь на этих идеях, Гальтон основал новую науку и назвал ее евгеникой: от греческих
eu
(хороший) и
genos

(рождение). Спустя годы принципами евгеники воспользовались совершенно разные люди в совершенно разных целях. Термин и некоторые концепции Гальтона переняли нацисты, однако нет никаких свидетельств тому, что сам Гальтон одобрил бы их кровавые замыслы. Он стремился найти способ, с помощью которого можно было бы улучшить человеческую породу посредством селекционного отбора.

Большая часть главы 9 посвящена выяснению причин, по которым простое причинно-следственное толкование Гальтоном успеха казалось таким привлекательным. Однако в главе 10 мы увидим, что из-за великого множества предсказуемых и случайных препятствий, которые нужно преодолеть, чтобы справиться с задачей любой сложности, связь между способностями и исполнением вовсе не такая прямая, чтобы идеи Гальтона ее объясняли. В последние годы психологи обнаружили: в плане достижения успеха способность преодолеть трудности не менее важна, чем наличие таланта

{179}

. Вот почему эксперты часто говорят о «правиле десяти лет», подразумевая, что для большинства занятий требуется как минимум десять лет напряженного труда, чтобы добиться значительных результатов. При мысли о том, что огромное значение имеет не только наличие врожденных способностей, но и прилагаемые усилия, в конце концов, удача, кто-то может и приуныть. Однако я смотрю на это совсем иначе: пусть наше генетическое «лицо» и не поддается контролю, мы можем прилагать усилия ровно в той степени, в какой считаем нужным. Да и с удачей все не так безнадежно: путем большого числа повторений мы можем повысить свои шансы на успех.

Какими бы ни были плюсы и минусы евгеники, исследования Гальтона в области наследственности привели к открытию двух математических понятий, которые являются центральными в современной статистике. Первое открытие Гальтон совершил в 1875 г., после того, как раздал семи друзьям пакетики со стручками душистого горошка. Каждый друг получил семена одинакового размера и веса, а вернул Гальтону семена уже следующих урожаев. Гальтон измерил семена: в среднем диаметр семян, уродившихся от мелких горошин, был больше, чем диаметр родителей. Позднее, подключив данные из лаборатории, основанной им в Лондоне, Гальтон заметил то же самое и в отношении роста уже людей: родителей и детей. Этот феномен — когда группа крайних результатов сопровождается результатами, которые в среднем менее экстремальны, — Гальтон назвал регрессией к среднему.

Вскоре Гальтону стало ясно: процессы, не подпадающие под определение регрессии к среднему, в конце концов выходят из-под контроля. Например, предположим, что сыновья высоких отцов в среднем будут такими же высокими, как и их отцы. Поскольку рост каждого разнится, некоторые сыновья окажутся выше. А теперь представим следующее поколение, и предположим, что сыновья более высоких сыновей, внуки, тоже в среднем такие же высокие, как и их отцы. Некоторые из них также будут выделяться ростом по сравнению с отцами. Таким образом, из поколения в поколение самые высокие будут становиться все выше и выше. Однако благодаря регрессии к среднему этого не происходит. То же самое можно сказать и о врожденных умственных способностях, художественном таланте или способности ловко бить по мячу в гольфе. Очень высоким родителям не следует ожидать таких же высоких детей, очень умным родителям не стоит ожидать, что их отпрыски будут семи пядей во лбу, а многочисленные Пикассо и Тайгеры Вудсы

[15]
зря понадеются на то, что их прямые потомки сравняются с ними своим гением. С одной стороны, у очень приземистых родителей могут родиться высокие дети, так что те из нас, кто не может похвастать блестящим умом или не умеет рисовать, вполне могут надеяться на исправление этих недостатков в следующих поколениях.

Через объявления Гальтон привлекал испытуемых в свою лабораторию, где проводил измерения: роста, веса, даже некоторых костей. Его целью было найти определенный метод, позволявший вычислять данные детей, основываясь на данных их родителей. На одном из графиков Гальтона были показаны данные по росту родителей и детей. Если, скажем, рост всегда был одним и тем же, получалась аккуратная прямая, поднимавшаяся под углом в 45 градусов. Если же это соотношение в целом сохранялось, однако индивидуальные данные отличались, возникал пунктир выше и ниже прямой. Таким образом, график Гальтона демонстрировал наглядно не только общее отношение между ростом родителей и детей, но и то, до какой степени это отношение сохранялось. Что является вторым важным открытием и вкладом в статистику: определение математического показателя, описывающего это отношение. Гальтон назвал этот показатель коэффициентом корреляции.

Коэффициент корреляции — это число между −1 и 1; если оно приближается к ±1, две переменные связаны между собой линейно; 0 же означает отсутствие связи. Например, данные показывают: наедаясь в «Макдоналдсе» на 1 тыс. калорий раз в неделю, человек поправляется на 4,5 кг в год, а съедая 1 тыс. калорий дважды в неделю, на 9 кг. И так далее. Коэффициент корреляции в таком случае равен 1. Если по какой-то причине каждый, наоборот, терял бы этот вес, коэффициент корреляции был бы равен −1. А если бы данные о прибавке в весе и его потере были бы разбросаны по всему графику и не зависели от потребления еды, коэффициент равнялся бы 0. В наше время понятие «коэффициент корреляции» — одно из самых широко употребимых в статистике. К примеру, оно используется для того, чтобы проследить связь между количеством выкуренных сигарет и раковых заболеваний, расстоянием звезд от Земли и скоростью, с которой они удаляются от нашей планеты, баллами, получаемыми студентами по унифицированным тестам, и доходом в семьях этих студентов.


Все материалы, размещенные в боте и канале, получены из открытых источников сети Интернет, либо присланы пользователями  бота. 
Все права на тексты книг принадлежат их авторам и владельцам. Тексты книг предоставлены исключительно для ознакомления. Администрация бота не несет ответственности за материалы, расположенные здесь

Report Page