2013 03 17_game_theory_lecture_03
TRANSCRIPT
Теорема об ожидаемой полезности иантагонистические игры
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 1 / 31
Пример
Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1
3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?
Математическое ожидание равно
90 · 13− 60 · 2
3= −10 > −20.
Но правильно ли его использовать?
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 2 / 31
Пример
Рассмотрим игру, похожую на покер. В данный момент есть две возможности -играть или ”спасовать”. При игре сравниваются карты и в случае выигрыша мыполучаем 90 рублей, в случае проигрыша теряем 60 рублей.Известно, что с вероятностью 1
3 мы выиграем. Альтернатива - пасовать иполучить−20.Стоит ли играть?Математическое ожидание равно
90 · 13− 60 · 2
3= −10 > −20.
Но правильно ли его использовать?
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 2 / 31
Примеры
А. Альтернатива:1. Получить $1М2. С вероятностью 0.5 получить $2М
Б. Вероятности и выигрыши
1/2 1/4 1/8 1/16 1/32 ...2 4 8 16 32 ...
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 3 / 31
Примеры
А. Альтернатива:1. Получить $1М2. С вероятностью 0.5 получить $2М
Б. Вероятности и выигрыши
1/2 1/4 1/8 1/16 1/32 ...2 4 8 16 32 ...
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 3 / 31
Полезность
Полезность - мера удовлетворенности агента.
Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 4 / 31
Полезность
Полезность - мера удовлетворенности агента.
Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 4 / 31
Полезность
Полезность - мера удовлетворенности агента.
Предположение - для каждого агента существует функция полезности и онстремится максимизировать ее мат. ожидание.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 4 / 31
Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:
.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.
.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.
.Аксиома (Непрерывность)..
......
Если x > y > z, то существует такое число α ∈ (0, 1), что
αx+ (1− α)z > y.
.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 5 / 31
Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.
.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.
.Аксиома (Непрерывность)..
......
Если x > y > z, то существует такое число α ∈ (0, 1), что
αx+ (1− α)z > y.
.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 5 / 31
Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.
.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.
.Аксиома (Непрерывность)..
......
Если x > y > z, то существует такое число α ∈ (0, 1), что
αx+ (1− α)z > y.
.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 5 / 31
Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.
.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.
.Аксиома (Непрерывность)..
......
Если x > y > z, то существует такое число α ∈ (0, 1), что
αx+ (1− α)z > y.
.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 5 / 31
Отношение предпочтенияЕсть множество альтернатив X, рассмотрим множество лотерей∆(X).У агента есть отношение предпочтения ” > ” на множестве∆(X). Аксиомы:.Аксиома (Полнота)........Для любых x, y ∈ ∆(X) верно одно из трех: x > y, x < y, x = y.
.Аксиома (Транзитивность)........Если x > y, y > z, то x > z.
.Аксиома (Непрерывность)..
......
Если x > y > z, то существует такое число α ∈ (0, 1), что
αx+ (1− α)z > y.
.Аксиома (Независимость от несущественных альтернатив)........Если x > y, то для любого z верно αx+ (1− α)z > αy+ (1− α)z.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 5 / 31
Теорема об ожидаемой полезности
.Теорема..
......
Если отношение предпочтения удовлетворяет аксиомам (1)-(4), тосуществует такая функция U : X → R, что для любых x, y ∈ ∆(X)
x > y ⇔ EU(x) > EU(y).
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 6 / 31
План доказательства
1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция
2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 7 / 31
План доказательства
1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)
3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 7 / 31
План доказательства
1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают
4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 7 / 31
План доказательства
1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число
5. Доказываем, что построенная функция нам подходит
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 7 / 31
План доказательства
1. Для u < v строим отображение ”интервала” между ними на (0, 1) идоказываем, что оно - биекция2. Доказываем единственность такого отображения с фиксированнымиграницами и аддитивностью с одного края (тут уже границы уже не обязательно 0и 1)3. При наложении функции совпадают4. Определяем функцию в данной точке как значения всех таких функций,которые в данных двух точках принимают значения 0 и 1. Показываем, что этоодно и то же число5. Доказываем, что построенная функция нам подходит
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 7 / 31
Домашнее задание
1. Пусть X - конечное множество. Придумайте отношение предпочтения ” > ” на∆(X), которое удовлетворяет трем из четырех аксиом в теореме фон Неймана(соответственно, задача содержит 4 пункта).
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 8 / 31
Антагонистические игры
Бескоалиционная игра (в нормальной форме)
Γ = {N, {Xi}i∈N, {Ki}i∈N}.
Здесь N - конечное множество игроков,Xi, i ∈ N− множество стратегий игрока i ∈ N,Ki :
∏i∈N Xi → R− функция выигрыша игрока i ∈ N,
Конечная антагонистическая игра: |N| = 2,N = {1, 2}, X1,X2 конечны,K1(x1, x2) + K2(x1, x2) = 0(const) для всех x1 ∈ X1, x2 ∈ X2.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 9 / 31
Антагонистические игры
Бескоалиционная игра (в нормальной форме)
Γ = {N, {Xi}i∈N, {Ki}i∈N}.
Здесь N - конечное множество игроков,Xi, i ∈ N− множество стратегий игрока i ∈ N,Ki :
∏i∈N Xi → R− функция выигрыша игрока i ∈ N,
Конечная антагонистическая игра: |N| = 2,N = {1, 2}, X1,X2 конечны,K1(x1, x2) + K2(x1, x2) = 0(const) для всех x1 ∈ X1, x2 ∈ X2.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 9 / 31
Антагонистические игры
Каждая конечная антагонистическая игра с X1 = {1, ...,m}, X2 = {1, ..., n}полностью задается m× n матрицей
A =
a11, ..., a1na21, ..., a2n... ... ...am1, ..., amn
,
где aij = K1(i, j).Поэтому конечные антагонистические игры называются матричными.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 10 / 31
Пример
A =
1 2 0 −32 −1 −1 −1−2 0 0 14 1 0 −2
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 11 / 31
Седловые точки
.Упражнение..
......
Покажите, что для произвольных i, j
maxi
minjaij ≤ min
jmax
iaij
Седловой точкой называется пара (i∗, j∗), для которой выполняется равенство (вточках i∗,j∗ достигаются внешние экстремумы)
maxi
minjaij = min
jmax
iaij
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 12 / 31
Седловые точки
.Упражнение..
......
Покажите, что для произвольных i, j
maxi
minjaij ≤ min
jmax
iaij
Седловой точкой называется пара (i∗, j∗), для которой выполняется равенство (вточках i∗,j∗ достигаются внешние экстремумы)
maxi
minjaij = min
jmax
iaij
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 12 / 31
Смешанные стратегииСмешанной стратегией игрока называется вероятностное распределение намножестве его первоначальных, чистых стратегий. В матричной игре смешаннойстратегией игрока 1 является вектор
x =
x1x2...xm
, xi ≥ 0,
m∑i=1
xi = 1,
а смешанной стратегией игрока 2 – вектор
y =
y1y2...yn
, yj ≥ 0,
n∑j=1
yj = 1.
Если игрок 1 применяет смешанную стратегию x, а игрок 2 – смешаннуюстратегию y, то ожидаемый выигрыш игрока 1 равен
A(x, y) = xTAy =m∑i=1
n∑j=1
aijxiyj.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 13 / 31
Теорема о минимаксе
.Теорема (Теорема о минимаксе, фон Нейман (1928))..
......maxx
miny
xTAy = miny
maxx
xTAy.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 14 / 31
Двойственная задача ЛП
Прямая задача:
Ax ≤ b, x ≥ 0
cTx → max
Двойственная задача:
ATy ≥ c, y ≥ 0
bTy → min
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 15 / 31
Пример
A =
1 −2 0 −32 −1 1 −1−2 0 0 14 1 0 −2
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 16 / 31
Вполне смешанные игры
Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной..Утверждение..
......
Если матричная игра вполне смешанная, то m = n, а оптимальныестратегии игроков x∗, y∗ единственные.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 17 / 31
Диагональные игры
Диагональные матричные игры:
A =
a11 0 . . . 00 a22 . . . 0
. . . . . . . . . . . .0 0 . . . ann
,
где aii > 0, i = 1, . . . , n.
.Утверждение........Любая диагональная игра является вполне смешанной.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 18 / 31
Диагональные игры
Диагональные матричные игры:
A =
a11 0 . . . 00 a22 . . . 0
. . . . . . . . . . . .0 0 . . . ann
,
где aii > 0, i = 1, . . . , n..Утверждение........Любая диагональная игра является вполне смешанной.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 18 / 31
Домашнее задание
2. Оптимальные стратегии (x∗, y∗) называются вполне смешанными, еслиx∗i > 0, y∗j > 0 для всех i, j. Игра, у которой любые оптимальные стратегииигроков вполне смешанные, называется вполне смешанной. Докажите, что еслиматричная игра вполне смешанная, то количества чистых стратегий у игроковсовпадают, а оптимальные стратегии игроков x∗, y∗ единственные.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 19 / 31
Домашнее задание
3. Квадратная матрица a = ∥aij∥ называется кососимметрической, еслиaij = −aji для всех i, j. Матричная игра называется симметричной, если еематрица кососимметрична. Докажите, чтоа. выигрыши игроков при использовании оптимальных стратегий равны нулю.б. множества оптимальных стратегий игроков в симметричной игре совпадают.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 20 / 31
Домашнее задание
4. Игрок 2 прячет предмет в один из n ящиков. Первый игрок пытается найти его,открывая последовательно 2 ящика. Если он обнаружит предмет в ящикеk = 1, ..., n , то его выигрыш равен δk > 0, , в противном случае его выигрышравен нулю. Найти значение игры и оптимальные стратегии игроков.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 21 / 31
Домашнее задание
5. Петя и Вася хотят назначить Ане свидание. Никто из молодых людей не знаетточно, когда она будет дома. Известно, что она с равной вероятностью можетвозвратиться домой в 3, 4 и 5 часов. Каждый может позвонить в один из этихчасов. Дозвонившийся первым назначает свидание. Если оба позвонятодновременно, Аня отдаст предпочтение Пете. Выигрыш каждого из игроков —Пети и Васи — равен 1, если ему удастся назначить свидание, 0, если свиданиене состоится и -1, если Аня идет на свидание с другим.Составить матрицу выигрышей и найти оптимальные стратегии Пети и Васи, т.е.вероятности звонков в 3,4 и 5 часов соответственно.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 22 / 31
Домашнее задание
6. Пусть элементы матрицы размера m× n являются независимыми одинаковораспределенными величинами с плотностью вероятностей f(x). Найтивероятность наличия в матрице седловой точки.
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 23 / 31
Домашнее задание
7. Имеется доска размером 3х3. На неглавной диагонали стоят числаa13 = a22 = a31 = 0. Остальные клетки свободны. У игрока 1 имеются фишки счислами 1,2,3. У игрока 2 – фишки с числами -1,-2,-3. По очереди, начиная с ходаигрока 1, игроки ставят свои фишки в свободные клетки. После того как вся досказаполнена, игрок 1 выигрывает число, равное значению игры получившейсяматрицы. Показать, что у игрока 1 есть стратегия, выбирая которую он никогда непроиграет (т.е. его выигрыш будет неотрицательный).
И.В.Кацев (СПб ЭМИ) Полезность и антагонистические игры 2013 24 / 31