Теория игр

Теория игр — это строгое стратегическое мышление. Это искусство предугадывать следующий ход соперника вкупе со знанием того, что он занимается тем же самым. Основная часть теории противоречит обычной житейской мудрости и здравому смыслу, поэтому ее изучение может сформировать новый взгляд на устройство мира и взаимодействие людей. На примерах из кино, спорта, политики, истории авторы показывают, как почти все компании и люди вовлечены во взаимодействия, описываемые теорией игр. Знание этого предмета сделает вас более успешным в бизнесе и жизни.

Авинаш Диксит, Барри Нейлбафф. Теория игр. Искусство стратегического мышления в бизнесе и жизни – М.: Манн, Иванов и Фербер, 2015. – 464 с.

Глава 1. Десять историй о стратегии

История 4. Быть или не быть лидером. После первых четырех заплывов в финале Кубка Америки яхта Liberty со шкипером Деннисом Коннером вела со счетом 3:1 в серии до 4 побед. На старте пятого заплыва яхта Liberty получила 37 секунд преимущества, когда Australia II совершила фальстарт и поэтому вернулась на линию старта. Шкипер австралийской яхты Джон Бертран попытался наверстать упущенное, отклонившись от курса влево в надежде на удачную перемену ветра. Деннис Коннер решил оставить Liberty справа от курса. Но рискованный шаг Бертрана оправдал себя. Направление ветра сместилось на пять градусов в выгодную для Australia II сторону; в итоге эта яхта выиграла гонку, опередив Liberty на 1 минуту 47 секунд. Коннера раскритиковали за то, что он не последовал по тому же курсу, который взяла Australia II, это оказалось серьезной стратегической ошибкой. После еще двух заплывов яхта Australia II выиграла всю серию.

Парусная регата дает возможность проанализировать интересный обратный вариант стратегии следования за лидером. Как правило, лидирующий парусник копирует стратегию корабля, идущего вслед за ним. Когда отстающий парусник меняет курс, лидер делает то же самое. Лидер копирует действия отстающего, даже если стратегия последнего явно неэффективна. Почему? Потому что в парусном спорте важна только победа. Если вы уже занимаете первое место, самый верный способ оставаться первым — имитировать действия тех, кто идет следом за вами (защищая свою лидирующую позицию).

История 7. Дилемма Бафетта. В статье, посвященной реформе финансирования избирательных кампаний, Уоррен Баффет предложил ограничить взносы частных лиц суммой от 1000 до 5000 долларов, а также запретить все остальные взносы. Никаких взносов от корпораций, профсоюзов; никаких «мягких денег». Звучит замечательно, за исключением того, что это неосуществимо. Реформа финансирования избирательных кампаний встречает такое сопротивление, поскольку законодатели, которые должны ее одобрить, больше всего теряют, если она будет принята. Именно преимущества в сборе пожертвований гарантируют их занятость. Как можно заставить людей делать то, что противоречит их интересам? Это значит поставить их в ситуацию, известную как дилемма заключенных. Вот что говорит об этом Уоррен Баффет: Представьте себе, что некий эксцентричный миллиардер (только не я!) делает такое предложение: если законопроект будет отклонен, этот эксцентричный миллиардер любым допустимым способом пожертвует миллиард долларов («мягкие деньги» делают возможным все) в пользу политической партии, которая отдаст больше всего голосов за принятие законопроекта. Благодаря такому дьявольскому применению теории игр законопроект спокойно пройдет через Конгресс, на что наш эксцентричный миллиардер не потратит ни цента (а это говорит о том, что он не так уж эксцентричен).

Представьте себе, что вы законодатель от Демократической партии, и проанализируйте возможные варианты своих действий. Если вы считаете, что республиканцы поддерживают законопроект, а вы сами выступаете против, тогда в случае успеха вы обеспечите республиканцам 1 миллиард долларов, тем самым отдав в их руки ресурсы, благодаря которым они будут занимать доминирующее положение на протяжении следующих десяти лет. Следовательно, вам нет никакого смысла выступать против законопроекта, если его поддерживают республиканцы. С другой стороны, если республиканцы выступают против этого законопроекта, а вы поддерживаете его, у вас есть шанс заработать 1 миллиард долларов.

Глава 2. Решение игр методом обратных рассуждений

Отличительный признак любой стратегической игры — взаимозависимость решений игроков. Участники такой игры могут придерживаться двух способов взаимодействия: последовательного или параллельного. Общий принцип всех игр с последовательными ходами гласит, что каждый игрок должен проанализировать будущие ответные действия других игроков и эту информацию использовать для поиска своего оптимального хода в настоящем.

Правило №1: смотрите вперед и рассуждайте в обратном порядке.

Процесс принятия решений можно представить в виде древовидной схемы. С помощью такого дерева также можно показать возможные варианты развития событий в стратегической игре. Чтобы подчеркнуть разницу, мы будем использовать два термина для обозначения деревьев: «дерево игры» — это дерево, которое отображает последовательность решений в стратегической игре; «дерево решений» представляет последовательность решений, принимаемых одним человеком.

В реалити-шоу Survivor канала CBS в одном из эпизодов две команды (два племени) сыграли в игру, которая стала прекрасной иллюстрацией применения принципа «смотреть вперед и рассуждать в обратном порядке». На игровом поле между племенами установили двадцать один флажок; члены каждого племени должны были по очереди убирать эти флажки. Когда наступала очередь одного из племен, его представитель мог убрать 1, 2 или 3 флажка. Убирать 0 флажков (иными словами, передавать свою очередь) не разрешалось, так же как убирать четыре или больше флажков за один раз. Побеждала команда, которая забирала последний флажок, если он оставался один, или все, если оставалось два или три.

Участники шоу были разделены на два племени — Сук Джай и Чуай Ган; племя Сук Джай делало первый ход. В этом племени начали с того, что убрали 2 флажка, оставив на поле 19 флажков. Прежде чем читать дальше, сделайте небольшую паузу и подумайте: сколько флажков вы решили бы убрать на их месте?

Возможно, вы догадались, что в конце игры оппонентов нужно оставить с четырьмя флажками. Чтобы добиться этого на предыдущем ходе нужно оставить их с 8 флажками. Эти же рассуждения можно продолжить в обратном порядке. Для того чтобы оставить другое племя с 8 флажками, вам следует оставить его с 12 флажками на предыдущем ходе; для этого необходимо оставить его с 16 флажками на ход раньше и с 20 флажками на ход до этого хода. Таким образом, племени Сук Джай следовало начать игру, убрав с игрового поля только 1 флажок. И они гарантировали себе победу при любых действиях оппонентов!

У игры с флажками было одно свойство, которое делало ее полностью разрешимой, — это отсутствие неопределенности любого вида. Как правило мы сталкиваемся с тремя видами неопределенности. Во-первых, присутствует элемент чистой случайности, которую создает сама природа. Во-вторых, не всегда легко определить цели (мотивы) других игроков. И последнее: участники многих игр сталкиваются с неопределенностью выбора других игроков, которую иногда обозначают термином «стратегическая неопределенность».

Кроме того, наше поведение не всегда остается рациональным. Иррациональности поведения посвящено немало исследований в области поведенческой экономики (см., например, Дэн Ариели. Поведенческая экономика).

Глава 3. Решение дилеммы заключенных

В простейшем случае дилемма заключенных – стратегическая игра двух участников, у которых есть по два варианта выбора. Допустим, есть две компании (RE и BB), которые торгуют рубашками себестоимостью по $20. Назначив цену $80, каждая из них сможет продать по 1200 штук, заработав по (80 – 20) * 1200 = 72 000 прибыли. Если только одна из компаний снизит цену до $70, то переманит 800 покупателей второй компании и привлечет дополнительно 200 покупателей, ранее не покупавших рубашки из-за дороговизны. Ее прибыль составит (70 – 20) * (1200 + 800 + 200) = 110 000. Если обе компании снизят цену до $70, то привлекут по 200 дополнительных покупателей каждая, заработав (70 – 20) * (1200 + 200) = 70 000 прибыли (рис. 1).

Рис. 1. Таблица для игры 2 х 2; светлый треугольник относится к строчкам, темный – к столбцам

Если в игре с параллельными ходами присутствует оптимальный выбор, не зависящий от выбора других игроков, специалисты по теории игр говорят о наличии «доминирующей стратегии».

Правило №2: если у вас есть доминирующая стратегия, примените ее.

В обобщенном описании дилеммы заключенных две стратегии, имеющиеся в распоряжении каждого игрока, обозначаются так: «сотрудничать» и «предать». Предательство — это доминирующая стратегия для каждого игрока; если оба игрока выберут эту стратегию, их выигрыш будет меньше, чем в случае выбора стратегии сотрудничества.

Стратегия равноценных ответных действий — один из вариантов правила поведения «поступайте с другими так, как они поступают с вами». Эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе. По мнению профессора математики университета в Торонто Роберта Аксельрода стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение.

Мы считаем, что стратегия равноценных ответных действий — ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

В современных экспериментах с играми в дилемму заключенных с несколькими участниками используется вариант, получивший название «игра со взносами в общий фонд». Каждому игроку предоставляется некая начальная сумма, скажем, 10 долларов. После этого он решает, какую часть этой суммы оставит себе и какую отдаст в общий фонд. Затем экспериментатор удваивает сумму, накопившуюся в общем фонде, и делит ее поровну между всеми участниками игры (как теми, которые сделали взнос в общий фонд, так и теми, которые оставили всю сумму себе).

Каждый участник игры может рассчитывать на то, что он сможет стать «безбилетником» — получить выгоду от действий других игроков, не делая никакого взноса в общий фонд. Если все четыре игрока будут придерживаться своей доминирующей стратегии, общий фонд останется пустым, а каждый участник игры просто сохранит свою первоначальную сумму 10 долларов. Если каждый попытается проехаться «зайцем», автобус так и не сдвинется с места. С другой стороны, если бы каждый игрок внес в общий фонд всю имеющуюся у него сумму — 10 долларов, после удваивания в фонде оказалось бы 80 долларов, а доля каждого игрока составила бы 20 долларов.

Можно выделить ряд предпосылок и стратегий успешного сотрудничества. Нельзя наказывать кого-то за обман, не установив сам факт обмана. Необходимо решить, каким именно должно быть наказание. Потенциальный обманщик должен понимать границы приемлемого поведения, а также последствия обмана. Игроки должны быть уверены в том, что предательство будет наказано, а сотрудничество — вознаграждено. Можно ввести достаточно серьезное наказание, которое действительно станет сдерживающим фактором.

Пример дилеммы заключенных в бизнесе. Самый известный случай нарушения антимонопольных законов, который используется в школах бизнеса в качестве учебного примера, произошел на рынке больших турбин для производства электроэнергии. В 1950-х годах на американском рынке турбин работали три компании: GE была самой крупной из них — на ее долю приходилось 60% рынка; Westinghouse — около 30% рынка и Allied-Chalmers — около 10%. Они сохраняли за собой эти рыночные доли и поддерживали высокие цены с помощью тщательно продуманной схемы координации действий. Вот как она работала. Электроэнергетические компании объявляли тендер на турбины, которые они собирались покупать. Если приглашение на участие в тендере поступало с 1-го по 17-й день лунного месяца, Westinghouse и Allied-Chalmers должны были выставить очень высокие цены на свои турбины, с тем чтобы их предложения наверняка проиграли тендер, а GE по взаимному сговору становилась победителем тендера, предложив самую низкую цену (которая была все же монопольной ценой, обеспечивающей высокую прибыль). Точно так же компания Westinghouse становилась заранее известным победителем, если приглашение на тендер поступало с 18-го по 25-й лунный день, и Allied-Chalmers — с 26-го по 28-й лунный день. Поскольку электроэнергетические компании рассылали приглашения на участие в тендере не по лунному календарю, со временем каждый из производителей получал свою долю на рынке. Любая попытка нарушить договоренность сразу же была бы замечена конкурентами. Однако, поскольку сотрудникам Министерства юстиции даже не пришло в голову привязывать победителей тендера к лунному циклу, этот сговор был защищен от угрозы обнаружения. В итоге органы власти все-таки разобрались в ситуации, некоторые руководители этих трех компаний были приговорены к тюремному заключению, а столь прибыльный сговор провалился.

Каждый человек стремится потреблять как можно больше ресурсов ради личной выгоды, перекладывая последствия своих действий на всех остальных людей или на будущие поколения. Профессор Калифорнийского университета Гаррет Хардин назвал этот феномен трагедией общин и использовал в качестве одного из примеров чрезмерный выпас общих пастбищ в Англии в XV и XVI столетиях. В настоящее время заявил о себе более значительный пример этой проблемы — глобальное потепление. Никто не извлекает личной выгоды из сокращения выбросов углекислого газа, но, если каждый будет преследовать только собственные интересы, от этого пострадают все.

Введение права собственности — вот что произошло в Англии. Когда земля находится в частной собственности, невидимая рука закрывает ворота ровно настолько, насколько это необходимо. Однако, в отношении глобальных проблем возможны только административные решения.

Глава 4. Прекрасное равновесие

Проанализируем пример из предыдущей главы, увеличив число вариантов выбора. Предоставим компаниям возможность менять цену на один доллар в диапазоне, от 42 до 38 долларов (рис. 2). Если RE считает, что BB выберет цену 42 доллара, тогда прибыль RE в случае выбора других возможных цен отображена в левом нижнем углу каждой ячейки первого столбца прибылей в представленной таблице. Максимальное из этих пяти чисел — 43 260 долларов, что соответствует цене 41 доллар. Следовательно, это и есть оптимальный ответный ход RE в случае, если BB выберет 42 доллара. Точно так же можно определить следующие оптимальные ходы RE: 40 долларов в случае, если, по мнению RE, компания BB выберет 41, 40 или 39 долларов, и 39 долларов — если BB выберет 38 долларов. Для наглядности мы выделили эти цифры в таблице жирным шрифтом. Оптимальные ответные ходы BB на различные варианты выбора RE показаны в верхних правых углах соответствующих ячеек и тоже выделены жирным шрифтом.

Рис. 2. Таблица для поиска точки равновесия

В одной из ячеек (той, в которой каждая компания выбирает цену 40 долларов) выделены жирным шрифтом обе цифры, отображающие прибыль, которую может получить каждая компания, а именно 40 тысяч долларов. Если RE считает, что BB выберет цену 40 долларов, ее оптимальная цена тоже составит 40 долларов, и наоборот. Если обе компании назначат на свои рубашки цену 40 долларов, субъективная оценка каждой из этих компаний в отношении цены другой компании будет подтверждена фактическим результатом. В таком случае у одной компании не будет причин для изменения цены, если ей станет известна информация о том, какую цену выбрала другая компания. Следовательно, эти варианты выбора образуют в данной игре устойчивую конфигурацию. Это и есть определение равновесия Нэша.

В каждой игре может быть несколько равновесий Нэша. Но, если на одном из них сходятся ожидания игроков, мы называем это фокальной точкой. Это одна из нескольких новаторских концепций, которые ввел в теорию игр Томас Шеллинг.

Профессор Дэвид Крепс из Стэнфордской школы бизнеса провел на занятиях следующий эксперимент. Каждый из двух студентов должен был сделать выбор, не имея возможности обменяться информацией с другим студентом. Их задача состояла в том, чтобы разделить между собой список городов. Одному студенту достался Бостон, другому — Сан-Франциско (эта информация была открытой, так что оба знали города друг друга). Затем каждому дали список из девяти американских городов (Атланта, Чикаго, Даллас, Денвер, Хьюстон, Лос-Анджелес, Нью-Йорк, Филадельфия и Сиэтл) и предложили выбрать несколько из этих городов. Если студенты получали в результате два непересекающихся подмножества городов, каждому из них давали приз. Но если в их общем списке не хватало одного города или были повторения, они оба ничего не получали.

В этой игре существует 29 = 512 равновесий Нэша. Однако в 80% случаев студенты делили список по географическому принципу: те, за кем был закреплен Бостон, выбирали города, расположенные к востоку от Миссисипи, а те, за кем был закреплен Сан-Франциско, — к западу.

Игры с бесконечным множеством стратегий. В реальной жизни цены могут быть выражены в любом количестве долларов и центов; в сущности, их можно выбирать из непрерывного диапазона чисел. Мы можем представить цены, которые две компании назначают на свои товары, в виде двумерного графика, расположив цены RE по оси Х, а цены BB по оси Y (рис. 3).

Рис. 3. График для игр с бесконечным числом стратегий

В реальной жизни, изучая игры или участвуя в них, начинайте с равновесия Нэша, а затем проанализируйте причины того, как и почему результат игры отличается от прогнозов, полученных согласно теории Нэша. Такой двойственный подход позволит вам лучше понять реальную игру или добиться более весомых успехов в ней, чем любая позиция отрицания или слепая приверженность равновесию Нэша.

Рассмотрим игру по следующим правилам: вы и я должны выбрать целое число от 0 до 100 включительно. Приз в размере 100 долларов получит тот игрок, число которого окажется ближе к половине числа, выбранного другим игроком. Если вы выбрали 25, значит решили, что я выберу 50, т.е. подумали на шаг вперед. А как насчет двух шагов вперед? Может быть, вы теперь решите назвать 12? Или 6, или 3? Единственный вариант, при котором мы оба окажемся правы, — если оба выберем число 0. Это и есть равновесие Нэша. В любом случае, если вы выбрали Х, а мы выбрали 0, значит, мы выиграли, поскольку 0 ближе к Х/2 чем Х к 0/2 = 0.

Когда люди играют в эту игру, они редко выбирают число 0 во время первого раунда. Это убедительное доказательство против прогнозирующей способности равновесия Нэша. С другой стороны, после двух-трех раундов игры ее участники очень близко подходят к равновесию Нэша. Это убедительный аргумент в пользу равновесия Нэша.

Теория игр

Report Page