Русская Википедия:Задача о двух конвертах
Задача о двух конвертах (Парадокс двух конвертов) — известный парадокс, демонстрирующий как особенности субъективного восприятия теории вероятностей, так и Шаблон:Нет АИ 2. В облике двух конвертов этот парадокс предстал в конце 1980-х годов, хотя в различных формулировках известен математикам с первой половины XX века.
Формулировка
Есть два неразличимых конверта с деньгами. В одном находится сумма в два раза большая, чем во втором. Величина этой суммы неизвестна. Конверты дают двум игрокам. Каждый из них может открыть свой конверт и пересчитать в нём деньги. После этого игроки должны решить: стоит ли обменять свой конверт на чужой?
Оба игрока рассуждают следующим образом. Я вижу в своём конверте сумму <math>X</math>. В чужом конверте равновероятно может находиться <math>2X</math> или <math>\frac{X}{2}</math>. Поэтому если я поменяю конверт, то у меня в среднем будет <math>\left(2X+\frac{X}{2}\right)/2 = \frac54X</math>, то есть больше, чем сейчас. Значит, обмен выгоден. Однако обмен не может быть выгоден обоим игрокам. Где в их рассуждениях кроется ошибка?
История
В 1953 году бельгийский математик Морис Крайчик предложил похожую задачу на примере двух галстуков[1]: Шаблон:Начало цитаты Каждый из двух лиц утверждает, что его галстук красивее. Чтобы решить спор, они обращаются к третейскому судье. Победитель должен подарить побеждённому свой галстук в утешение. Каждый из спорщиков рассуждает следующим образом: «Я знаю, сколько стоит мой галстук. Я могу проиграть его, но могу и выиграть более красивый галстук, поэтому в этом споре преимущество на моей стороне». Как может в одной игре с двумя участниками преимущество быть на стороне каждого из них? Шаблон:Конец цитаты
Крайчик утверждает, что симметрия в игре существует, но предполагает неправомерность использования вероятности 1/2 при вычислении среднего дохода[2]: Шаблон:Начало цитаты С точки зрения обоих участников спора игра симметрична и каждый имеет равную вероятность выиграть. Однако вероятность не является объективно данным фактом и зависит от знания условий задачи. В данном случае разумным является не пытаться оценивать вероятность. Шаблон:Oq Шаблон:Конец цитаты
Задача стала популярна благодаря Мартину Гарднеру, который описал её в 1982 году под названием «Чей кошелёк толще?»[3]. Гарднер соглашается с Крайчиком и в том, что игра «честная» (симметричная), и в том, что игра не может быть одновременно выгодной обеим сторонам, а также в том, что рассуждения игроков кажутся сомнительными: Шаблон:Начало цитаты Может ли одна и та же игра «быть выгоднее» для каждого из двух партнёров? Ясно, что не может. Не возникает ли парадокс из-за того, что каждый игрок ошибочно полагает, будто его шансы на выигрыш и проигрыш равны? Шаблон:Конец цитаты Однако Гарднер отмечает также, что подробного математического разбора задачи Крайчиком не было сделано: Шаблон:Начало цитаты к сожалению, это ничего не говорит нам о том, где именно в рассуждениях двух игроков кроется ошибка. Как мы ни бились, нам так и не удалось найти простое и удовлетворительное решение парадокса Крайчика. Шаблон:Конец цитаты В дальнейшем задача принимала названия «парадокса двух шкатулок», «парадокса двух карманов», «парадокс обмена» и т. д.
Новый интерес к парадоксу возник после публикации Барри Нейлбуфом статьи с перечнем ряда парадоксов теории вероятностей в журнале Journal of Economic Perspectives[4]. После получения множества откликов на эту публикацию им была подготовлена вторая статья «Чужой конверт — всегда зеленее» (Шаблон:Lang-en), посвящённая непосредственно задаче конвертов[2]. В предложенной им формулировке имеется два конверта[2]: Шаблон:Начало цитаты В один конверт помещается некоторая сумма денег, неизвестная для других, и этот конверт отдаётся Али. Затем скрытно подбрасывается монета. Если выпадает орёл, во второй конверт кладётся сумма в два раза большая, чем в первом. В противном случае во второй конверт кладётся сумма в два раза меньшая. Этот конверт отдаётся Бабе. Али и Баба могут открыть свои конверты, не сообщая один другому суммы, которые они там видят. После этого они могут (по обоюдному согласию) обменяться конвертами.
Предположим, что Али видит в своём конверте 10 долларов. Али предполагает, что в конверте у Бабы равновероятно могут находиться 5 долларов или 20 долларов. В этом случае обмен конвертами приносит Али 2,5 долларов (или 25 %). Аналогично Баба считает, что в конверте Али равновероятно находится сумма в два раза меньшая или большая, чем <math>x</math>, которая находится у него. Поэтому, в среднем, при обмене конвертов он получает <math>(-0{,}5 x + x)/2 = 0{,}25 x</math>. Таким образом, Баба также ожидает получить в среднем 25 % дохода по сравнению с суммой в своём конверте.
Однако это является парадоксальным. Обмен конвертами не может быть выгоден обоим участникам. Где ошибка в их рассуждениях?
Модификация Нейлбуфа условия задачи и предложенные им решения позволили многое прояснить по сути парадокса. Однако подбрасывание монетки после наполнения первого конверта заметно нарушало первоначальную симметрию капиталов игроков. При решении акцент смещался на доказательство неравноценности стартовых условий для Бабы по сравнению с Али. Поэтому в результате дальнейшей эволюции[5] из условия задачи исчезла монетка, с помощью которой у Нейлбуфа определялось содержимое второго конверта.
На сегодняшний день наиболее широко известна и вызывает наибольший интерес у математиков идеально симметричная постановка с внешне неразличимыми конвертами, содержащими меньшую и в два раза большую суммы, причём один из конвертов можно открыть прежде, чем начать рассуждение о выгодности обмена.
Разрешение парадокса
С точки зрения Нейлбуфа[2], первое удовлетворительное объяснение его задачи дано Санди Забеллом в статье «Убытки и доходы: парадокс обмена» [6]. Несколько переформулируя, Нейлбуф пишет: Шаблон:Начало цитаты Баба́ считает, что сумма, которую он видит, не имеет значения ввиду возможности того, что впоследствии в его конверте окажется бо́льшая сумма. Это значит, что Баба полагает, что вероятность того, что сумма в его конверте больше, составляет ½ независимо от увиденной суммы. Это верно, только если каждое значение от нуля до бесконечности равновероятно. Но если всё бесконечное число возможностей равновероятно, шанс каждого значения имеет нулевую вероятность. Тогда у каждого исхода нулевой шанс. А это нонсенс. Шаблон:Oq Шаблон:Конец цитаты
- Формальная аргументация
Обозначим через <math>f(x)</math> вероятность того, что в конверте Али находится сумма <math>x</math>. Когда Баба наблюдает в своём конверте сумму <math>X</math>, условная вероятность того, что Али в своём конверте имеет <math>2X</math>, равна
- <math>P(A = 2X \mid B = X) = \frac{f(2X)}{f(X/2) + f(2X)}.</math>
В формулировке задачи Баба считает, что эта вероятность равна ½ независимо от того, какую сумму <math>X</math> он видит в своём конверте. Поэтому <math>f(X/2) = f(2X)</math> для всех <math>X > 0</math>. Соответственно, <math>f(x)</math> должна быть постоянна на интервале от <math>0</math> до бесконечности. Однако такое допущение неправомерно: если вероятность положительна и постоянна на всей положительной полуоси, то её интеграл равен бесконечности, что невозможно. Итак, исходное предположение парадокса (равновероятность <math>X/2</math> и <math>2X</math>) нереализуемо.
- Решение парадокса в исходной формулировке.
Обозначим сумму в конверте первого игрока через <math>\xi_1</math>, сумму в конверте второго игрока через <math>\xi_2</math>, а их отношение <math>\eta=\xi_1/\xi_2</math>. По условию задачи, <math>\eta</math> принимает значения 2 и ½ с вероятностями по ½, и таким образом <math>{\mathrm M}\eta=5/4</math>. То же самое можно сказать о распределении (а значит и матожидании) обратной величины <math>1/\eta=\xi_2/\xi_1</math>. О распределении случайных величин <math>\xi_1</math> и <math>\xi_2</math> нет никакой информации, кроме той, что их отношение <math>\eta</math> распределено по описанному закону. Игроки наблюдают в своих конвертах результаты одного испытания над «своими» случайными величинами, но не знают этот результат для другого игрока и для отношения сумм в конвертах. Обозначим <math>g_1=\xi_2-\xi_1</math> - выигрыш первого игрока (в случае обмена), и соответственно <math>g_2=\xi_1-\xi_2</math> - выигрыш второго игрока. Тогда суммарный выигрыш <math>g_1+g_2=0</math>, и в частности <math>{\mathrm M}g_1+{\mathrm M}g_2=0</math>. В то же время:
<math>{\mathrm M}g_2={\mathrm M}(\xi_2\eta)-{\mathrm M}\xi_2\ ?=?\ ({\mathrm M}\xi_2){\mathrm M}\eta-{\mathrm M}\xi_2=\frac{1}{4}{\mathrm M}\xi_2</math>,
где равенство с вопросом верно в случае если величины <math>\xi_2</math> и <math>\eta</math> не коррелируют (в частности, если они независимы). Аналогично,
<math>{\mathrm M}g_1={\mathrm M}(\xi_1/\eta)-{\mathrm M}\xi_1\ ? =?\ ({\mathrm M}\xi_1){\mathrm M}(1/\eta)-{\mathrm M}\xi_1=\frac{1}{4}{\mathrm M}\xi_1</math>,
где равенство с вопросом верно в случае если величины <math>\xi_1</math> и <math>1/\eta</math> не коррелируют (в частности, если <math>\xi_1</math> и <math>\eta</math> независимы).
В случае «наивного» восприятия игрок считает величину <math>\eta</math> и «свою» величину (<math>\xi_1</math> или <math>\xi_2</math>) независимыми, то есть несмотря на испытание, полагает апостериорное распределение <math>\eta</math> совпадающим с априорным. Возможно, один из них прав, тогда одно из равенств с вопросом верно. Но оба равенства верны быть не могут, так как в этом случае получилось бы <math>{\mathrm M}g_1+{\mathrm M}g_2={\mathrm M}\xi_1/4+{\mathrm M}\xi_2/4>0</math>.
Таким образом, возможно, что один из игроков прав, считая обмен выгодным для себя — например, это верно если сумма в его конверте и отношение сумм в конвертах независимы (или хотя бы не коррелируют). Но для обоих сразу это невозможно, так что противоречия нет.
Например, в формулировке Нейлбуфа величины <math>\xi_1</math> и <math>\eta</math> как раз независимы (а потому <math>\xi_1</math> и <math>1/\eta</math> не коррелируют), потому что монета бросается и выпадает независимо от суммы в конверте Али. Таким образом, обмен ему выгоден. Но он ровно настолько же невыгоден Бабе. Если Баба соглашается на обмен, то либо потому что не может понять невыгодность для него такого сценария, либо потому что введен в заблуждение организаторами игры.
Кажущаяся парадоксальность (неочевидность) всей этой ситуации может быть устранена пониманием того, что деньги циркулируют не только в конвертах двух игроков, а еще и у организаторов (спонсоров) игры. То есть игроков на самом деле трое. Вышеизложенные соображения о равенстве бесконечности (невозможности равновероятности всех исходов) тогда формулируются в терминах того, являются спонсоры бесконечно богатыми, или их капитал ограничен. В первом случае противоречия нет, и интуитивное соображение игроков о выгодности обмена в чем-то верно - их общий доход берется у бесконечно богатого спонсора. Во втором случае невозможна равновероятность всех сумм в конвертах, так как интеграл должен сходиться. Значит, наблюдение в конверте некой суммы, вообще говоря, как-то влияет на вероятность отношения сумм в конвертах. Вместе с тем, если спонсор - миллиардер, а Баба видит в своем конверте сто долларов, то суммы в сто и двести долларов для миллиардера ничтожны. Вероятности того, что в конвертах 50 и 100 долларов, и того, что там 100 и 200 - равновероятны, и таким образом, парадокс все еще не решен.
Примечания