Книга: Как нас водят за нос с помощью статистики

Книга: Как нас водят за нос с помощью статистики

Агентство Сообща
Статистика не только источник полезной информации, но и орудие манипуляции мнением людей.

Рецензия

Статистика, по мнению большинства людей, – лучший способ изложить факты компактно и наглядно. Это точная наука: словами можно описать, передать впечатление, кое-что приукрасить, а цифры отражают действительность такой, какая она есть. Цифры не лгут. И все же… Профессор Дортмундского технического университета Вальтер Кремер показывает в своей классической, выдержавшей множество переизданий работе, какие приемы для подгонки фактов и цифр под желаемые результаты используются при получении и обработке данных. Плавная кривая в новом варианте графика вдруг эффектно взмывает вверх, красочная схема искажает реальное соотношение величин, наводящие вопросы анкеты позволяют получить необходимые ответы, некорректная выборка обеспечивает нужные показатели для газетных заголовков. Об этих и многих других приемах фальсификации, рассчитанных на наше некритическое мышление и особенности восприятия, автор рассказывает доходчиво, интересно и с юмором, иллюстрируя свои наблюдения множеством примеров и графиков. Профессионалы вряд ли найдут в книге много нового, но широкому кругу читателей, как полагаем, ее можно рекомендовать как полезное и занимательное чтение.

Из краткого содержания книги вы узнаете:

  • Зачем и как подгоняются статистические данные
  • Какие приемы для этого наиболее часто используются
  • На что следует обращать внимание, чтобы не поддаться на обман

 


Основные идеи

  • Статистика предполагает точность, отчего мы часто относимся к ней слишком доверчиво.
  • Некруглые числа кажутся нам достовернее круглых – но эта достоверность может оказаться иллюзией.
  • С помощью диаграммы можно заметно исказить количественное соотношение данных.
  • График можно сделать эффектнее и динамичнее путем растяжения и сжатия делений на осях координат или изменения точки отсчета.
  • Серьезное статистическое исследование невозможно без правильно выбранной базы для сравнения.
  • С помощью наводящих вопросов можно заставить респондентов отвечать так, как того хочет исследователь.
  • Усредненные показатели нередко сглаживают существенную неравномерность распределения благ, имущества и так далее.
  • На основе краткосрочной тенденции нельзя строить прогноз на будущее.
  • Провозглашение чего-то самым лучшим в своей области неправомерно, если выбирается слишком узкий сегмент для исследования.
  • Если мы обнаружили корреляцию, то о причинной связи говорить еще рано.

 

Краткое содержание

Обманчивая достоверность

Статистика призвана дать нам точную и наглядную картину окружающей действительности – вот почему мы часто воспринимаем ее на интуитивном уровне, не особенно задумываясь. Такое восприятие открывает путь для всевозможных уловок, причем не всегда искажения допускаются теми, кто преследует корыстные цели. Иногда руководители компаний, приобретая активы, полагаются на неверно отражающие действительность цифры из лучших побуждений. Нередко фальсификация данных оправдывается как “ложь во спасение”: так, завышение статистики заболеваемости СПИДом позволяет получить больше средств на исследования, а завышение темпов глобального потепления помогает всколыхнуть общественность и привлечь ее внимание к проблемам экологии. Какие же приемы используются при манипулировании данными статистики?

Иллюзия точности

Часто ли вы получаете счета за коммунальные услуги с круглыми числами? Трудно поверить в то, чтобы телефонная компания требовала с вас за месяц ровно 100 евро. Неудивительно, что некруглые числа всегда кажутся нам более вероятными и правдоподобными, чем круглые. Однако эта точность довольно часто оказывается мнимой. Когда мы, например, узнаем из публикаций Федерального статистического управления о том, что в Германии зарегистрировано 667 259 налогоплательщиков с неограниченной налоговой обязанностью или что за год в ДТП пострадало 325 519 человек, не стоит принимать это за чистую монету – таких точных результатов статистическое исследование не может дать в принципе. Даже при переписи населения всегда получаются лишь приблизительные данные. Основываясь на особенности восприятия точных цифр, писатели используют их как художественный прием: гигант Гаргантюа утопил в своей моче ни больше ни меньше как 260 418 парижан.


“За время чтения утренней прессы мы получаем больше статистической информации, чем Шиллер или Гете получили за всю свою жизнь”.

Диаграммы и схемы

Представим себе PR-менеджера крупной компании, который должен представить отчет по случаю десятилетнего юбилея фирмы. В этом отчете, естественно, нужно рассказать о головокружительном успехе. Но никакого успеха на самом деле не было: по сравнению с первым годом объем продаж вырос всего на 5%, причем было два года, когда он падал на полпроцента, а в остальные повышался очень незначительно, всего на 1–2%. Что же делает наш пиарщик? Он составляет диаграмму следующим образом: на вертикальной оси, показывающей проценты, вместо того чтобы начать отсчет от 0%, он начинает от 100%, откладывая деления как можно крупнее. Вся вертикальная шкала – это диапазон от 100 до 105%. На горизонтальной оси, показывающей годы, деления, наоборот, делаются как можно мельче. И вот уже перед нами впечатляющая кривая роста, взмывающая к небесам! Так благодаря сжатию или растяжению делений на осях координат еле заметный изгиб оборачивается крутым зигзагом.


“Статистическими данными часто манипулируют сознательно: в одних случаях искажаются сами цифры, а в других вводит в заблуждение то, как они представлены”.

Аналогичные эффекты достигаются изменением масштаба на одной из осей – когда, например, каждое деление сначала соответствует году, но потом с какого-то момента начинает обозначать пятилетний срок. Кроме того, можно “выхватывать” из общего срока произвольные временные промежутки, и получится кривая с резкими перепадами, хотя для общей картины в долгосрочной перспективе они не имеют никакого значения. Этот трюк особенно часто используется при графическом изображении динамики курсов акций.

Схемы, как правило, нагляднее обычных диаграмм, но при этом они лучше подходят и для того, чтобы представить действительность в искаженном виде. Например, в одной федеральной земле средняя оплата труда составляет 10 евро в час, а в другой – 20 евро. Если изобразить это соотношение как два столбика из монет по одному евро, то правильная пропорция – один к двум – будет сохранена. Но стоит только представить то же самое соотношение в виде двух банкнот, одной в 10 евро и другой в 20, причем купюру в 20 евро нарисовать в два раза шире и длиннее, то создастся совсем другое впечатление – ведь площадь у крупной купюры будет не в два, а уже в четыре раза больше, чем у мелкой. Трехмерная схема работает еще лучше: если все ту же ситуацию изобразить как два золотых слитка, один из которых вдвое больше другого во всех трех измерениях, то соотношение объемов будет уже один к восьми!


“Один психиатр однажды написал, что все человечество сошло с ума. На вопрос, как он пришел к такому убеждению, он ответил: «Посмотрите на людей, которые у меня лечатся!»”.

Смотря с чем сравнивать

Все познается в сравнении – любая информация оценивается нами в зависимости от того, в каком контексте мы ее воспринимаем. На белом фоне серое кажется темным, а на черном – наоборот, светлым. Так, по материалам Times, из всех убийств женщин около 50% были совершены мужьями и сожителями и всего лишь около 10% – незнакомыми людьми. Свидетельствует ли это об опасности совместной жизни, как утверждает газета? Неужели и правда спать на садовой скамейке безопаснее, чем у себя в постели? Едва ли. Во-первых, мотив и возможность убить человека чаще появляются у его родных и знакомых, просто потому, что они чаще оказываются вместе с ним, чем незнакомцы. Во-вторых, заключения Times не учитывают, что дома мы проводим намного больше времени, чем на улице.


“«Число женщин-депутатов в нашей партии возросло на 50%!» – с гордостью заявляет лидер. «Ну да, – думают про себя депутаты, – было четыре, а стало шесть»”.

Искаженная картина создается и тогда, когда область для сравнения определяется слишком узко или слишком широко. “Чем мы старше, тем мы счастливее” – гласит заголовок статьи в одной немецкой газете. Такой вывод делается на том основании, что наибольшая доля самоубийств из всех случаев смерти приходится на возрастную группу до 20 лет – 25%. От 30 до 40 лет доля суицидов составляет уже 10%, а у людей старше 70 лет – всего около 2%. Однако такой результат совсем не удивляет, если учесть, что число случаев естественной смерти, в соотношении с которым исчисляется процент самоубийств, с возрастом неуклонно растет.

Исследование предоставляет полезные данные лишь тогда, когда выборка репрезентативна. После Второй мировой войны американские военные задались целью выяснить, нормально ли питается городское население Германии. Весы, на которых люди могли взвешиваться, были установлены в общественных местах и на вокзалах. Это классический пример неправильной выборки: нищие, голодные и больные намного реже появляются в общественных местах и ездят в транспорте, чем их более благополучные сограждане.


“Все, о чем нам сообщают газеты, радио и телевидение, – это всего лишь выборка из огромного множества возможных информационных сообщений; эта выборка сделана исходя из мировоззрения и предвзятых убеждений данного СМИ”.

Наводящие вопросы

Если результаты опросов на одну и ту же тему кардинально расходятся, то, скорее всего, дело в том, как формулировались вопросы анкеты. Нередко используется такой прием, как наводящие вопросы. Например, согласно исследованию профсоюза IG Metall, 95% опрошенных отказываются работать по субботам, а по данным Оффенбахского Marplan-Institut – совсем наоборот: 72% вполне готовы трудиться по выходным. Почему так получилось, становится ясно, если заглянуть в анкеты.


“Среднее арифметическое часто помогает скрыть неравенство. Оно совершенно ничего не говорит о том, как именно величины распределяются вокруг среднего значения”.

В опроснике IG Metall одобрение занятости по выходным искусно увязано с отказом от общения с семьей и друзьями: трудолюбивый гражданин предстает в них как нелюдим, избегающий общества и своих родных. Столь же наводящие вопросы, только с противоположными намерениями, предлагались и в анкете Marplan-Institut. Работа по субботам увязывалась с добровольным участием в улучшении экономического положения компании-работодателя. И вот еще немаловажная деталь: люди всегда более склонны отвечать “да”, чем “нет”, – конечно же, это учитывается и при составлении анкет. Вопрос IG Metall был сформулирован так, что “да” означало не согласие или несогласие трудиться в выходной, а желание избежать возможных негативных последствий такого рабочего графика.

Усредненные показатели и прогнозы на будущее

Насколько показательны средние значения? В деревне из десяти жителей, у одного из которых сорок коров, а у остальных – ни одной, на каждого жителя в среднем приходится по четыре коровы. Еще более удивительные сюрпризы получаются при вычислении медианы. Медиана представляет собой число, которое при расположении всех данных по возрастанию оказывается ровно посередине, – то есть в нашем примере это число будет равняться нулю (ни одной коровы). Кроме того, обычное среднее арифметическое часто применяется там, где следовало бы вычислять среднее взвешенное. На эту тему есть хороший анекдот. Как-то раз хозяин одной американской таверны предложил посетителям блюдо из дичи, и когда гости спросили, из какого мяса оно сделано, он честно признался, что в него подмешана конина. На следующий вопрос: “А сколько ее там?” – хозяин ответил: “Ровно половина – один конь приходится на одного кролика”.


“Экстраполировать на будущее краткосрочные тенденции – все равно что ехать по прямой дороге с выключенными фарами: так можно продолжать только до места, где дорога круто поворачивает”.

Другой пример: в одной фирме мужчины зарабатывают по 30 евро в час, а женщины – по 20 евро. Можно ли сказать, что средний заработок составляет 25 евро в час? Да, но только если женщин и мужчин в фирме работает поровну. Если это не так, то при вычислении средней зарплаты нужно учесть долю каждой гендерной группы в общем числе работников.


“Не только бедность или безработица, но и многое другое, что мы оцениваем, может выглядеть совершенно по-разному в зависимости от того, через какие очки мы смотрим на это явление”.

Еще менее осторожно оцениваются тенденции и составляются прогнозы на будущее. Если та или иная тенденция наблюдается, скажем, в течение последних пяти лет, то мы склонны смело утверждать, что так будет и дальше. Однако правомерно ли это? Следуя такой логике, получится, что если за последние годы коровы стали давать больше молока, то к 2500 году средний удой коровы возрастет до 40 тысяч литров в день; если рост человека будет все так же увеличиваться, то через тысячу лет наши потомки будут ростом с динозавра; если глобальное потепление пойдет такими же темпами, как в последние десятилетия, то уже совсем скоро вода будет кипеть без огня на вершинах альпийских гор.

Самый быстрый, самый большой, самый красивый

Эксмурский национальный парк в Великобритании гордится самой большой и самой разнообразной популяцией тропических птиц на севере графства Девоншир. А сколько вообще птичьих заповедников в этом регионе? По всей видимости, только один.


“Анкеты составляются из наводящих вопросов, средние показатели, пропорции и темпы развития вычисляются некорректно, прогнозы на будущее притянуты за уши, выборки нерепрезентативны… для многих людей статистика и обман – это Пат и Паташон”.

Подобные манипуляции с превосходной степенью особенно распространены в спорте. Допустим, теннисист Б. принял участие в десяти турнирах – двух на твердом покрытии и восьми на грунте; оба на твердом покрытии он проиграл, а из восьми на грунте выиграл семь. Сообщить об этом в прессе можно по-разному: “Б. в лучшей форме – победил почти во всех играх на грунте!” Или наоборот: “Худший результат у Б. – ни одой победы на твердом покрытии!” Реальную ценность превосходной степени легко проверить – достаточно расширить базу сравнения: если, например, вблизи графства Девоншир есть еще один парк и популяция тропических птиц там богаче, то притязания рекламы Эксмура тем более теряют смысл.


“Статистика часто бывает нам нужна затем же, что и пьяному фонарный столб: не столько для того, чтобы осветить картину, сколько для того, чтобы было на что опереться”.

Дайте точное определение!

Занижается или завышается разными источниками доля безработных в отношении к занятому населению? Оба утверждения убедительно аргументируются. Завышается, утверждают одни, указывая на многочисленных государственных служащих, военнослужащих и фрилансеров, которые не учитываются при подсчете занятых. Занижается, настаивают другие, призывая не учитывать тех, кто не работает, получая доход от недвижимости. Таким образом, как относительными, так и абсолютными значениями можно манипулировать, потому что нет четкого, общепринятого определения понятия “безработный”. Федеральное агентство занятости ФРГ выработало следующие критерии: “безработный – это гражданин от 15 до 65 лет, в данный момент ищущий работу, способный приступить к новым обязанностям немедленно, имеющий желание и возможность работать более 18 часов в неделю”. Любая полемика, в частности ведущаяся политическими партиями, должна была бы основываться на подобных точных определениях. Сравнивая уровень безработицы в разных странах, также нужно иметь в виду, что это понятие может трактоваться в них совершенно по-разному.

Считается, что каждый пятый гражданин ФРГ живет в бедности. При этом бедным считается тот, кто располагает менее чем половиной среднего дохода. Однако при таком определении преодоление бедности превращается в заведомо невыполнимую задачу. Что изменится, если все граждане станут зарабатывать вдвое или втрое больше? Ничего: число “бедных” останется точно таким же. Еще один “удивительный факт”: сейчас в Германии около 7,5 миллиона безграмотных, а при кайзере Вильгельме их было всего 10 тысяч! Но и здесь все дело в определении: сейчас речь идет о “неспособности использовать техники чтения, письма и арифметических вычислений для участия в жизни общества и собственного развития”. Тогда безграмотным назывался тот, кто не мог написать собственное имя.


“Правдивое изложение фактов зависит не от умения, а от желания – его-то, очевидно, и недостает многим из тех, кто грешит против истины”.

Мнимые причинные связи и вероятности

Если два процесса развиваются параллельно, легко прийти к ошибочному выводу, будто между ними существует причинно-следственная связь. Возьмем пример с аистами: их популяция в Германии уменьшалась приблизительно такими же темпами, как рождаемость у людей. Означает ли это, что младенцев и вправду приносят аисты?


“К счастью, в статистике, как и везде, все тайное становится явным; или, как говорят в Анголе, даже если пустил газы в воду, все равно на поверхности забулькает”.

По материалам опроса, проведенного газетой Handelsblatt среди сотрудников 44 компаний, начальный оклад выпускника вуза тем выше, чем больше времени он учился. Но это не подтверждается нашим повседневным опытом. Как же был получен такой результат? В один котел были брошены самые разные специальности – в частности, те, которые в силу своей трудоемкости осваиваются особенно долго, например химия или медицина. Начинающие специалисты в этих областях действительно сразу получают высокий оклад, но не потому, что они учились не торопясь, а потому, что такова специфика их образования.

Еще одна сфера, в которой часто случаются логические ошибки, – это вычисление вероятности. По данным Frankfurter Allgemeine Zeitung, если играть в лотерею дважды в неделю, то главный выигрыш гарантирован вам… через 135 тысяч лет. Это, разумеется, совсем не так – хотя бы потому, что одни и те же номера могут выпадать многократно. Или еще один пример: то и дело сообщается о том, что вблизи атомных электростанций резко возрастает количество случаев лейкемии. Конечно же, эти наблюдения не следует оставлять без внимания. Но в первую очередь стоит выяснить, не учтены ли только отдельные электростанции, вокруг которых уровень заболеваний действительно высок. Чтобы получились достоверные данные, следует собрать данные по всем действующим АЭС.

Об авторе

Вальтер Кремер – профессор экономической и социальной статистики в Техническом университете Дортмунда.




Report Page