Что говорит, и чего не говорит теорема Ауманна

ReverendBayes

Помните, я ранее рассказывал про теорему Ауманна в двух частях? Первая была "рукомахательная для гуманитариев", вторая была "зубодробительная для математиков". Проблема была только в том, что когда я писал первую, я все еще не до конца понимал ТА, и потому наряду с правильными и корректными указаниями сделал ряд откровенно неверных.

И вот сегодня я хочу исправить ситуацию и еще раз рассказать кое-что про то, чем является теорема Ауманна, а чем не является. Причем без привлечения какой-то суровой математики.

Фактически эта статья будет некоторым дополнением к уже написанным - я буду не столько рассказывать о вещах, окружающих ТА, сколько подсвечивать важные моменты в том, что часто о ней говорится, и что о ней обычно думают неправильно.

Ее до сих пор понимают неправильно

У меня очень большая претензия к тому, как сам Ауманн изложил всё в своей оригинальной статье. Он взял расхожую английскую фразу "agree to disagree", каким-то произвольным образом прицепил ее к своей теореме в качестве мнемонического правила, а саму теорему сформулировал вроде бы корректно, но упуская все критически важные логические связки. В результате люди легко поняли, что теорема Ауманна - это про то, что нельзя согласиться не соглашаться, но не смогли продраться через математическую часть, где не хватает половины важных вещей.

Вот так, вроде бы ни слова не соврал, а всех запутал. Потому что в мнемонической формуле несложно разобраться, и из нее можно вывести совершенно отдельный, хороший и правильный смысл, и даже как-то выражать его математически... Ну и с тех пор так и повелось - всем кажется, что они почти полностью понимают теорему Ауманна - осталось только разобраться с технической частью! - но на самом деле понимают что-то тоже хорошее, но не теорему Ауманна.

Ну это как если бы Пифагор сказал бы про теорему своего имени "один квадрат равен сумме двух других", и люди думали бы, что теорема Пифагора - она про квадраты, а не про треугольники. И потом еще говорили: "Вот знаете про иррациональность корня из двух? Теорема Пифагора про это - вы складываете два квадрата площадью 1 и получаете другой площадью 2, и получаете противоречие". И вот это всё, конечно, правда, но не то чтобы теорема Пифагора была именно про это и только про это.

Я в свое время потратил кучу времени, нервов и когнитивки, пытаясь перейти от "рационалисты не могут согласиться не соглашаться" к "сравнивая эти две формулы, получаем q1=q2, ЧТД". У меня ушло на это две попытки - сначала, дотошно расспросив Михаила Дегтярева в lw-слаке, я подумал, что уже почти понял теорему Ауманна (на самом деле понял много важного, но кое-что очень важное капитально упустил); и только со второго захода, когда оказалось, что я явно гоню какую-то пургу даже "с высоты своего уже почти понимания", я смог разобраться в ней до конца. И вот теперь снова попытаюсь передать это понимание другим, потому что чертовски жаль всех этих усилий, когда люди (начиная от Юдковского) все еще повторяют несущественную часть предусловий теоремы Ауманна, но не рассказывают о самой сути теоремы.

Про что теорема Ауманна

Итак, ближе к сути. Во-первых, краеугольный камень ТА - это общее знание (ОЗ) о каких-то фактах между несколькими агентами. Собственно, пример с голубоглазыми островитянами или с ̶и̶д̶е̶а̶л̶ь̶н̶ы̶м̶и̶ ̶р̶а̶ц̶и̶о̶н̶а̶л̶и̶с̶т̶а̶м̶и̶,̶ ̶и̶г̶р̶а̶ю̶щ̶и̶м̶и̶ ̶в̶ ̶г̶р̶я̶з̶и̶ вампирами, играющими в крови - именно про общее знание, хотя еще не про ТА, т.к. там не хватает некоторых важных условий, и присутствуют некоторые другие. Этот пример очень важно понять, чтобы вообще разбираться с ТА, и он действительно очень вштыривает, так что оно того стоит, если вы еще не.

Откуда берется ОЗ о каком-то факте? Ну, самый простой способ - один агент сказал вслух другому про этот факт (и между обоими агентами есть взаимное доверие). Тогда, с некоторой натяжкой, можно считать, что между ними ОЗ есть. Позже я скажу и про другие источники ОЗ, но пока этого достаточно.

Далее - условия теоремы Ауманна, часть "Если" из "Если-То". Там требуется довольно много важных штук, а именно:

Оба агента должны быть идеальными байесианцами (или, по крайней мере, уметь правильно и безошибочно считать всё по теории вероятности), и этот факт должен быть ОЗ между ними;
В начальный момент времени у них должны быть в точности совпадающие априорные вероятности обо всем на свете (на самом деле позже это требование можно будет ослабить, указав - относительно чего они могут совпадать, а относительно чего не совпадать, но пока будем считать, что важно совпадение вообще всех приоров); и этот факт тоже должен быть ОЗ между ними;
В будущем агенты отправятся жить каждый своей жизнью, получая новую информацию; можно сказать, что они будут ставить некоторые эксперименты (или проводить наблюдения), из которых эту информацию и получат. При этом они не будут знать, какие результаты дали эксперименты оппонента, но они обязаны заранее знать суть экспериментов друг друга и все возможные исходы, и это знание тоже обязано быть общим! Собственно, именно эту часть требований почти всегда пропускают, при том, что она является ключевой! Да, агенты не знают, как именно будет жить второй, но они, если угодно, досконально знают алгоритмы друг друга: "если случится X, то он увидит Y и будет делать Z"; единственное, что им неизвестно - это входные условия от мира, т.к. каждый из них будет реагировать на свою часть этих условий (и не столкнется с той частью, которая досталась второму).

Итак, теперь у нас есть все предусловия. Далее скажем про некоторое событие или некоторый факт A, постериоры которого (мнение агентов после того, как они прожили каждый свою жизнь) нас интересуют. Теорема Ауманна гласит, что если А каким-то удивительным образом оказалось таково, что постериоры обоих агентов о нем являются общим знанием, то эти постериоры будут совпадать.

И сразу важные замечания:

Если А оказалось не таким, что постериоры являются ОЗ между агентами, то совпадать они вовсе не обязаны, и "рационалисты МОГУТ согласиться не соглашаться"!!!
Если все-таки всё хорошо, то постериоры агентов не "в конце концов совпадут", они "уже совпадают"!
Самый цимес именно в том - а что значит, что постериоры являются общим знанием, и как именно это может произойти.

Откуда берется общее знание о постериорах

Итак, еще одна критически важная часть, про которую почти никогда не говорят. Откуда именно берется общее знание о постериорах? Мне известно три сценария: один тривиальный; второй я в свое время не понимал настолько, что громогласно отвергал факт его существования - он, к слову, имеет некоторое отношение к "игре Ауманна", откуда игра и получила свое название; третий - является моим изобретением (наверное примерно в том же смысле, что радио является изобретением Попова - создал он его независимо от других, но идея уже настолько витает в воздухе, что наверняка многие другие пришли к тому же, но еще не заявляли свои права на авторство). Причем ни один из этих сценариев не сводится к другому; можно привести пример, когда все они будут действовать по-разному.

Обменяться всей информацией

Итак, способ номер раз. Агенты снова встретились, и просто пересказали друг другу всё, что успели увидеть за свою жизнь. Теперь они снова обладают одинаковой информацией, и постериоры вообще обо всем у них снова совпадают, и, конечно же, являются ОЗ. Тут всё просто.

Стандартный протокол экономистов

Способ номер два. Агенты снова встречаются, но ничего друг другу не рассказывают. При этом событие А оказалось таково, что у них пока нет ОЗ про постериоры друг друга относительно его. И вот тогда они могут провести протокол общения, за счет которого их постериоры "в конце концов" станут ОЗ, и в этом случае неизбежно совпадут! Собственно, это протокол, отчасти похожий на тот, который используется в "игре Ауманна", хотя на самом деле совсем другой (как минимум, там нет одного события А, про которое можно было бы говорить про постериоры).

А именно:

Вначале первый агент озвучивает свои текущие постериоры;
Второй агент, зная о характере экспериментов, которые проводил первый, из этого объявления понимает кое-что про то, что же именно узнал второй. Тогда он включает эту информацию в свой багаж знаний, и на основе этого обновляет свои постериоры и называет их.
Затем первый тоже извлекает из обновленных постериоров второго всю доступную информацию, и тоже обновляет свои постериоры и вновь называет их.

И так продолжается до упора. И вот утверждается (Ауманн мельком упомянул об этом в конце своей статьи, но позже это было подробно расписано в статье других авторов), что однажды этот процесс сойдется, и у агентов возникнет ОЗ о постериорах друг друга о событии А. Которые по ТА с неизбежностью будут к этому моменту совпадать.

Телепатия для математиков

И наконец способ три. В некоторых случаях агентам вообще не нужно встречаться и хоть что-то говорить друг другу. Просто каждый, посмотрев на свою часть реальности, может понять: а, ну второй про событие А будет знать либо то же самое, что и я, либо немного другое, но его постериоры все равно будут совпадать с моими. Это, собственно, как раз тот случай, когда событие А случайно оказывается настолько удачным, что постериоры агентов относительно него сразу оказываются ОЗ.

В моей первой статье про ТА я подробно объяснял этот способ на примере того, как Шеф и Коллега выясняют, куда же они должны двигаться для задержания преступника.

Думаю, это всё, что важно понимать про теорему Ауманна, чтобы наконец проникнуть именно в ее суть (и потом, при желании, легко разобраться в несложной математике). Конечно, мантра "рационалисты не могут согласиться не соглашаться" тоже очень полезная и правильная, но ее наличие не должно затмевать тот факт, что ТА совсем про другое.

Эта статья в моем телеграм-канале: https://t.me/bayesian_little_list/33