Русская Википедия:Цена стабильности

Цена стабильности (Шаблон:Lang-en, PoS) для игры — отношение оптимального значения целевой функции в одном из её равновесных состояний и оптимального исхода. Цена стабильности имеет смысл для игр, имеющих некую высшую силу или условия игры, которые каким-либо образом влияют на положение игроков и могут помочь им сойтись к равновесию Нэша. При измерении эффективности равновесия Нэша в какой-либо игре имеет смысл рассматривать и цену анархии (Шаблон:Lang-en, PoA).

Примеры

PoS можно выразить следующим образом:

<math> PoS = \frac {N} {S},\ PoS \geqslant 0.</math>

Здесь <math display="inline">N</math> — значение лучшего равновесия Нэша, <math display="inline">S</math> — значение оптимального решения.

В приведённой ниже игре «Дилемма заключённого» игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах, поскольку имеется единственное равновесие (<math display="inline">B</math>, <math display="inline">R</math>), мы имеем <math>PoS = PoA = \tfrac{1}{2}</math>.

Дилемма заключённого
	<math display="inline">L</math>	<math display="inline">R</math>
<math display="inline">T</math>	(2,2)	(0,3)
<math display="inline">B</math>	(3,0)	(1,1)

Этот пример является версией игры «битва полов». В нем имеются две точки равновесия, (<math display="inline">T</math>, <math display="inline">L</math>) и (<math display="inline">B</math>, <math display="inline">R</math>) со значениями 3 и 15 соответственно. Оптимальным значением является 15. Тогда <math>PoS = 1</math>, в то время как <math>PoA = \tfrac{1}{5}</math>.

Битва полов
	<math display="inline">L</math>	<math display="inline">R</math>
<math display="inline">T</math>	(2,1)	(0,0)
<math display="inline">B</math>	(0,0)	(5,10)

Предпосылки и вехи

Цену стабильности первыми изучили А. Шульцан и Н. Мозес, а сам термин появился в работах Е. Аншелевича. Они показали, что равновесие Нэша всегда существует в чистых стратегиях, и цена стабильности этой игры не превосходит n-го гармонического числа в ориентированных графах. Для неориентированных графов Аншелевич и другие представили определили жёсткую границу стабильности в 4/3 для случая одного источника и двух игроков. Йен Ли доказал, что для таких графов с различными точками назначения для всех игроков, с которыми все игроки должны иметь связь, цена стабильности потока игры на построение сети Шепли равна <math>O(\log n/\log\log n),</math> где <math>n</math> — число игроков. С другой стороны, цена анархии для игры равна примерно <math>n</math>.

Игры на построение сети

Условия игры

Игры построения сети имеют естественное обоснование для цены стабильности. В этих играх цена анархии может быть намного меньше цены стабильности.

Пример следующей игры:

<math>n</math> игроков;
целью каждого <math>i</math>-го игрока является соединение вершин <math>s_i</math> и <math>t_i</math> в ориентированном графе <math>G = (V, E)</math>;
стратегиями <math>P_i</math> для игрока являются все пути из <math>s_i</math> в <math>t_i</math> в графе <math>G</math>;
каждая дуга имеет цену <math>c_i</math>;
«справедливое распределение цен»: Если <math>n_e</math> игроков выбирают дугу <math>e</math>, то цена <math>d_e(n_e) = \frac{c_e}{n_e}</math> распределяется равно между ними;
цена для игрока составляет <math>C_i(S) = \sum_{e \in P_i} \frac{c_e}{n_e}</math>;
социальная цена равна сумме цен для игроков: <math>SC(S) = \sum_i C_i(S) = \sum_{e \in S} n_e \frac{c_e}{n_e} = \sum_{e \in S} c_e</math>.

Файл:Network-design-poa.svg

Игра на построение сети с ценой анархии <math>\Omega(n)</math>

Цена анархии

Цена анархии может составлять <math>\Omega(n)</math>. Пример следующей игры на построение сети.

Файл:Network-design-pos.svg

Патологическая цена стабильности игры

В этой игре есть 2 различных равновесия. Если все разделяют дугу <math>1 + \varepsilon</math>, то социальная цена равна <math>1 + \varepsilon</math>. Более того, это равновесие оптимально. Однако, разделение всеми дуги <math>n</math> является также равновесием Нэша. Любой агент имеет цену <math>1</math> в равновесной стратегии, и переключение его на другую дугу повышает его цену до <math>1+\varepsilon</math>.

Нижняя граница цены стабильности

Здесь приведена патологическая игра с таким же поведением, но уже для цены стабильности. Присутствует <math>n</math> игроков, каждый из которых начинает с вершины <math>s_i</math> и пытается соединить её с вершиной <math>t</math>. Допустим, цены непомеченных дуг равны 0.

Оптимальной стратегией для всех игроков является общее использование дуги <math>1+\varepsilon</math>, что даёт социальную цену <math>1+ \varepsilon</math>. Однако имеется единственная стратегия с равновесием Нэша для этой игры. В случае оптимальности, каждый игрок платит <math>\textstyle \frac{1 + \varepsilon}{n}</math> и игрок 1 может уменьшить свою цену путём переключения на дугу <math>\tfrac{1}{n}</math>. Если это происходит, то игроку 2 становится выгодным переключиться на дугу <math>\tfrac{1}{n-1}</math> и так далее. В конце концов, агенты достигнут равновесия Нэша, оплачивая свою собственную отдельную дугу. Такое распределение имеет социальную цену <math>1 + \tfrac{1}{2} + \cdots + \tfrac{1}{n} = H_n</math>, где <math>H_n</math> является <math>n</math>-ым гармоническим числом, что равно <math>\Theta(\log n)</math>. Хотя это значение не ограничено, цена стабильности экспоненциально лучше цены анархии в этой игре.

Верхняя граница цены стабильности

По определению игры на построение сети являются Шаблон:Нп5, поэтому они допускают потенциальную функцию <math>\Phi = \sum_e \sum_{i=1}^{n_e} \frac{c_e}{i}</math>.

Теорема. [Теорема 19.13 из книги 1] Предположим, что существует константы <math>A</math> и <math>B</math>, такие, что для любой стратегии <math>S</math>

<math> A \cdot SC(S) \leqslant \Phi(S) \leqslant B \cdot SC(S).</math>

Тогда цена стабильности меньше <math>B/A</math>.

Доказательство. Глобальный минимум <math>NE</math> функции <math>\Phi</math> является равновесием Нэша, так что

<math> SC(NE) \leqslant 1/A \cdot \Phi(NE) \leqslant 1/A \cdot \Phi(OPT) \leqslant B/A \cdot SC(OPT).</math>

Социальная цена была определена как сумма цен по дугам, так что

<math> \Phi(S) = \sum_{e \in S} \sum_{i=1}^{n_e} \frac{c_e}{i} =

\sum_{e \in S} c_e H_{n_e} \leqslant \sum_{e \in S} c_e H_n = H_n \cdot SC(S). </math>

Тривиально получаем <math>A = 1</math> и вычисления выше дают <math>B = H_n</math>, так что можно привлечь теорему для верхней границы цены стабильности.

См. также

Шаблон:Нп5 — игра без цены стабильности.

Примечания

Шаблон:Примечания

Литература

Шаблон:Refbegin

Шаблон:Refend

Шаблон:Теория игр Шаблон:Rq

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:Цена стабильности

Содержание