2013 03 17_game_theory_lecture_03

Теорема об ожидаемой полезности иантагонистические игры

И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 1 / 31

Пример

Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1

3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?

Математическое ожидание равно

90 · 13− 60 · 2

3= −10 > −20.

Но правильно ли его использовать?


Пример

Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1

3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?Математическое ожидание равно

90 · 13− 60 · 2

3= −10 > −20.

Но правильно ли его использовать?


Примеры

А. Альтернатива:1. Получить $1М2. С вероятностью 0.5 получить $2М

Б. Вероятности и выигрыши

1/2 1/4 1/8 1/16 1/32 ...2 4 8 16 32 ...


Полезность

Полезность - мера удовлетворенности агента.

Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.


Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:

.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.


Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.

.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.

.Аксиома (Непрерывность)..

......

Если x > y > z, то существует такое число α ∈ (0, 1), что

αx+ (1− α)z > y.

.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.


Теорема об ожидаемой полезности

.Теорема..

......

Если отношение предпочтения удовлетворяет аксиомам (1)-(4), тосуществует такая функция U : X → R, что для любых x, y ∈ ∆(X)

x > y ⇔ EU(x) > EU(y).


План доказательства

1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция

2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит



1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)

3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит



1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают

4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит



1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число

5. Доказываем, что построенная функция нам подходит



1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит


Домашнее задание

1. Пусть X - конечное множество. Придумайте отношение предпочтения ” > ” на∆(X), которое удовлетворяет трем из четырех аксиом в теореме фон Неймана(соответственно, задача содержит 4 пункта).


Антагонистические игры

Бескоалиционная игра (в нормальной форме)

Γ = {N, {Xi}i∈N, {Ki}i∈N}.

Здесь N - конечное множество игроков,Xi, i ∈ N− множество стратегий игрока i ∈ N,Ki :

∏i∈N Xi → R− функция выигрыша игрока i ∈ N,

Конечная антагонистическая игра: |N| = 2,N = {1, 2}, X1,X2 конечны,K1(x1, x2) + K2(x1, x2) = 0(const) для всех x1 ∈ X1, x2 ∈ X2.


Антагонистические игры

Каждая конечная антагонистическая игра с X1 = {1, ...,m}, X2 = {1, ..., n}полностью задается m× n матрицей

A =

a11, ..., a1na21, ..., a2n... ... ...am1, ..., amn

,

где aij = K1(i, j).Поэтому конечные антагонистические игры называются матричными.


Пример

A =

1 2 0 −32 −1 −1 −1−2 0 0 14 1 0 −2


Седловые точки

.Упражнение..

......

Покажите, что для произвольных i, j

maxi

minjaij ≤ min

jmax

iaij

Седловой точкой называется пара (i∗, j∗), для которой выполняется равенство (вточках i∗,j∗ достигаются внешние экстремумы)

maxi

minjaij = min

jmax

iaij


Смешанные стратегииСмешанной стратегией игрока называется вероятностное распределение намножестве его первоначальных, чистых стратегий. В матричной игре смешаннойстратегией игрока 1 является вектор

x =

x1x2...xm

, xi ≥ 0,

m∑i=1

xi = 1,

а смешанной стратегией игрока 2 – вектор

y =

y1y2...yn

, yj ≥ 0,

n∑j=1

yj = 1.

Если игрок 1 применяет смешанную стратегию x, а игрок 2 – смешаннуюстратегию y, то ожидаемый выигрыш игрока 1 равен

A(x, y) = xTAy =m∑i=1

n∑j=1

aijxiyj.


Теорема о минимаксе

.Теорема (Теорема о минимаксе, фон Нейман (1928))..

......maxx

miny

xTAy = miny

maxx

xTAy.


Двойственная задача ЛП

Прямая задача:

Ax ≤ b, x ≥ 0

cTx → max

Двойственная задача:

ATy ≥ c, y ≥ 0

bTy → min


Пример

A =

1 −2 0 −32 −1 1 −1−2 0 0 14 1 0 −2


Вполне смешанные игры

Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной..Утверждение..

......

Если матричная игра вполне смешанная, то m = n, а оптимальныестратегии игроков x∗, y∗ единственные.


Диагональные игры

Диагональные матричные игры:

A =

a11 0 . . . 00 a22 . . . 0

. . . . . . . . . . . .0 0 . . . ann

,

где aii > 0, i = 1, . . . , n.

.Утверждение........Любая диагональная игра является вполне смешанной.


Диагональные игры

Диагональные матричные игры:

A =

a11 0 . . . 00 a22 . . . 0

. . . . . . . . . . . .0 0 . . . ann

,

где aii > 0, i = 1, . . . , n..Утверждение........Любая диагональная игра является вполне смешанной.



2. Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной. Докажите, что еслиматричная игра вполне смешанная, то количества чистых стратегий у игроковсовпадают, а оптимальные стратегии игроков x∗, y∗ единственные.



3. Квадратная матрица a = ∥aij∥ называется кососимметрической, еслиaij = −aji для всех i, j. Матричная игра называется симметричной, если еематрица кососимметрична. Докажите, чтоа. выигрыши игроков при использовании оптимальных стратегий равны нулю.б. множества оптимальных стратегий игроков в симметричной игре совпадают.



4. Игрок 2 прячет предмет в один из n ящиков. Первый игрок пытается найти его,открывая последовательно 2 ящика. Если он обнаружит предмет в ящикеk = 1, ..., n , то его выигрыш равен δk > 0, , в противном случае его выигрышравен нулю. Найти значение игры и оптимальные стратегии игроков.



5. Петя и Вася хотят назначить Ане свидание. Никто из молодых людей не знаетточно, когда она будет дома. Известно, что она с равной вероятностью можетвозвратиться домой в 3, 4 и 5 часов. Каждый может позвонить в один из этихчасов. Дозвонившийся первым назначает свидание. Если оба позвонятодновременно, Аня отдаст предпочтение Пете. Выигрыш каждого из игроков —Пети и Васи — равен 1, если ему удастся назначить свидание, 0, если свиданиене состоится и -1, если Аня идет на свидание с другим.Составить матрицу выигрышей и найти оптимальные стратегии Пети и Васи, т.е.вероятности звонков в 3,4 и 5 часов соответственно.



6. Пусть элементы матрицы размера m× n являются независимыми одинаковораспределенными величинами с плотностью вероятностей f(x). Найтивероятность наличия в матрице седловой точки.



7. Имеется доска размером 3х3. На неглавной диагонали стоят числаa13 = a22 = a31 = 0. Остальные клетки свободны. У игрока 1 имеются фишки счислами 1,2,3. У игрока 2 – фишки с числами -1,-2,-3. По очереди, начиная с ходаигрока 1, игроки ставят свои фишки в свободные клетки. После того как вся досказаполнена, игрок 1 выигрывает число, равное значению игры получившейсяматрицы. Показать, что у игрока 1 есть стратегия, выбирая которую он никогда непроиграет (т.е. его выигрыш будет неотрицательный).


2013 03 17_game_theory_lecture_03

Documents