Лекция 7 Методы решения матричных игровых задач в логистических системах

 

Цель: Научиться решать матричные игровых задач с помощью геометрического метода, правила доминирования, итерационного метода. Рассмотреть открытую и закрытую модель торгов.

Ключевые слова: нижняя граница выигрыша, верхняя граница выигрыша, доминирующая стратегия, закрытые торги, аукцион.

План лекции:

1. Геометрическая интерпретация решений игр Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image001.gifх 2, 2 х Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image002.gif;

2. Решение игр вида Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image001.gifх n. Правило доминирования;

3. Итерационный метод решения матричных игр;

4. Модель торгов.

 

 

7.1            Геометрическая интерпретация игры 2x2, 2xn, mx2

 

Игры 2x2, 2xn, mx2 можно решать графически. Решение игры с матрицей (2x2) можно найти графически. Для этого на оси абсцисс  отложим отрезок, длина которого равна единице. Левый конец отрезка (точка х=0) соответствует стратегии Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image003.gif, правый - стратегии Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image004.gif. Промежуточные точки х соответствуют некоторым смешанным стратегиям (Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image005.gif), где х1=1-х, х2=х.

Из концов выбранного отрезка восстановим перпендикуляры и будем откладывать на них выигрыш при соответствующих чистых стратегиях. Если игрок В принимает стратегию В1, то выигрыш  при использовании чистых стратегий А1 и А2 будет соответственно а11 и а21. Отложим эти точки на перпендикулярах к оси абсцисс и соединим прямой В1В1. Если игрок А применяет смешанную стратегию, то его выигрышу соответствует некоторая точка  М, лежащая на этой прямой.

Аналогично можно построить прямую В2В2, соответствующую стратегии В2 игрока В.

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image006.gif

Рисунок 7.1

 

Ломанная В1КВ2 – нижняя граница выигрыша, полученного игроком А. Точка К, в которой он максимален, определяет цену игры и ее решение.

Замечание. Можно рассмотреть задачу  минимизации верхней границы выигрыша для игрока В, поменяв местами при решении игроков А и В.

Если игра задана матрицей (2хn), то можно найти ее решение, используя геометрическую интерпретацию. Каждой из n стратегий игрока В соответствует прямая. Построив эти прямые, находят нижнюю границу выигрыша. Точка К,  лежащая на нижней границе, для которой величина выигрыша наибольшая, определяет цену игры и ее решение. При этом определяются активные стратегии игрока В (соответствующие им прямые пересекаются в точке К).

Аналогично может быть решена игра с матрицей (mx2), только в этом случае определяют верхнюю границу выигрыша и на ней находят минимум.

 

 

7.2            Решение игр вида Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image001.gifх n. Правило доминирования

 

На практике весьма важную роль играют приемы предварительного анализа игры, позволяющие уменьшать размеры ее платежной матрицы или еще как-то упрощать эту матрицу не нанося ущерба решению. Рассмотрим некоторые из этих приемов.

Правило доминирования. В целом ряде случаев анализ платежной матрицы обнаруживает, что некоторые чистые стратегии не могут внести никакого вклада в искомые оптимальные смешанные стратегии. Отбрасывание подобных стратегий позволяет заменить первоначальную матрицу на матрицу выигрышей меньших размеров.

Сравнение строк и столбцов матрицы.

Будем говорить, что  i-я строка матрицы А

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image007.gif

не больше j-й строки этой матрицы

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image008.gif

если одновременно выполнены следующие n  неравенств:

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image009.gif

При этом говорят также, что j-я строка доминирует i-ю строку или что стратегия Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image010.gif игрока А доминирует стратегию Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image011.gif.

Замечание. Игрок А поступит разумно, если будет избегать стратегий, которым в матрице игры  отвечают доминируемые строки.

Если в матрице А одна из строк (j-я) доминирует другую строку (i-ю), то число строк в матрице А можно уменьшить путем отбрасывания доминируемой строки (i-й).

Будем говорить, что k-й столбец матрицы А

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image012.gif

не меньше l-го столбца этой матрицы

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image013.gif

если одновременно выполнены следующие m  неравенств:

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image014.gif

 

При этом говорят также, что l-й столбец доминирует k-й столбец  или что стратегия Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image015.gif игрока В доминирует стратегию Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image016.gif.

Замечание. Игрок В поступит разумно, если будет избегать стратегий, которым в матрице игры  отвечают доминируемые столбцы.

Если в матрице А один из столбцов (l-й) доминирует другой столбец (k-й), то число столбцов в матрице А можно уменьшить путем отбрасывания доминируемого столбца (k-го).

Замечание. Оптимальные смешанные стратегии в игре с матрицей, полученной усечением исходной за счет доминируемых строк и столбцов, дадут оптимальное решение в исходной игре: доминируемые чистые стратегии игроков в смешении не участвуют - соответствующие им вероятности следует взять равными нулю.

Основные этапы поиска решения матричной игры.

1.  Этап. Проверка наличия (или отсутствия) равновесия в чистых стратегиях (при наличии равновесной ситуации указываются соответствующие оптимальные стратегии игроков и цена игры).

2. Этап. Поиск доминирующих стратегий (в случае успеха этого поиска - отбрасывание доминируемых строк и столбцов в исходной матрице игры).

3  Этап. Замена игры на ее смешанное расширение и отыскание оптимальных смешанных стратегий и цены игры.

 

 

7.3            Итерационный метод решения матричных игр

 

Итерационный метод – это метод отыскания решения матричной игры (цены игры и оптимальных смешанных стратегий) в известной степени верно отражающий некоторую реальную ситуацию накопления опыта постепенной выработки игроками «хороших» стратегий в результате многих повторений конфликтных ситуаций. Основная идея этого метода заключается в том, чтобы мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой игры, когда каждый из них на опыте прощупывает способ поведения противника и старается отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при возобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на предыдущий выбор противника. Определение решения игры итерационным методом производится в следующей таблице:

 

Таблица 7.1

n

i

B1

. . .

Bm

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image017.gif

k

A1

. . .

Al

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image018.gif

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image019.gif

 

 

 

 

 

 

 

 

 

 

 

 

 

Описание таблицы:

n номер шага (пары последовательных ходов игроков А и В);

iномер стратегии, выбранной игроком А;

B1 – «накопленный» суммарный выигрыш игрока А за первые n шагов при стратегии  В1 игрока В;

Bm – «накопленный» суммарный выигрыш игрока А за первые n шагов при стратегии  Вm игрока В;

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image020.gif- минимальный средний выигрыш игрока А равный минимальному накопленному им выигрышу за первые n шагов, деленному на число этих шагов;

k  - номер стратегии, выбранной игроком В;

A1 - накопленный» суммарный выигрыш игрока А за первые n шагов при стратегии А1;

Al - накопленный» суммарный выигрыш игрока А за первые n шагов при стратегии Аl;

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image018.gif- максимальный средний выигрыш игрока А, равный максимальному накопленному им выигрышу за первые n шагов, деленному на число этих шагов;

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image019.gif - среднее арифметическое минимального среднего выигрыша и максимального среднего выигрыша игрока А.

Цена игры определяется приближенно по окончании любого из шагов. Например, за приближенную цену игры можно взять среднее арифметическое Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image019.gif, полученное на n-м шаге. Смешанные стратегии противников определяются частотами появления чистых стратегий.

Замечание. При увеличении числа шагов все три величины Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image020.gif, Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image018.gifи Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image019.gif будут приближаться к цене игры Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image021.gif, но среднее арифметическое Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image019.gifбудет приближаться к Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image021.gif сравнительно быстрее.

Замечание. Хотя сходимость итераций весьма медленна, тем не менее даже такой небольшой расчет всегда дает возможность находить ориентировочное значение цены игры и доли чистых стратегий.

Замечание. Сравнительно медленную скорость сходимости можно объяснить целым рядом причин. Укажем одну из них, психологически наиболее интересную. Если, к примеру, игрок А уже нашел оптимальную смешанную стратегию, то он не склонен останавливаться на ней – он продолжит попытки выиграть у противника В побольше, особенно если последний еще не достиг оптимальной смешанной стратегии. Тем самым игрок А может невольно ухудшить свое положение.

Замечание. Два основных преимущества описанного метода:

1) итерационный метод прост и одновременно универсален (при его помощи можно легко найти приближенное решение любой матричной игры);

2) объем и сложность вычислений сравнительно слабо растут по мере увеличения числа стратегий игроков (размеров матрицы игры).

 

 

7.4            Модель торгов

 

Наиболее часто встречаются два вида торгов:

· закрытые торги, в которых два или более участников независимо друг от друга предлагают цены (ставки) за тот или иной объект; при этом участник имеет право лишь на одну ставку, а ведущий торги принимает высшую (или низшую) из предложенных;

· открытые торги или аукционы, когда два или более участников подымают цены до тех пор, пока новой надбавки уже не предлагается.

Рассмотрим пример закрытых торгов. Пусть мы (A) и наш конкурент (B) участвуем в закрытых торгах по двум объектам суммарной стоимости C1 + C2.

Мы располагаем свободной суммой S и нам известно, что точно такой же суммой располагает наш конкурент. При этом S < C1 + C2, то есть купить оба объекта без торгов не удастся.

Мы должны назначить свои цены A1, A2 за первый и второй объекты в тайне от конкурента, который предложит за них же свои цены B1, B2. После оглашения цен объект достанется предложившему большую цену, а если они совпали — по жребию. Предположим, что и мы и наш конкурент владеем методом выбора наилучшей стратегии. Так вот —можно доказать, что при равных свободных суммах с нашей и с противоположной стороны существует одна, оптимальная для обеих сторон стратегия назначения цен.

Сущность ее определяется из следующих рассуждений. Если нам удастся купить первый объект, то наш доход составит (C1 − A1) или же, при покупке второго, мы будем иметь доход (C2 − A2). Значит, в среднем мы можем ожидать прибыль

              

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image022.gif

 (7.1)

Таким образом, нам выгоднее всего назначить цены

         

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image023.gif

 (7.2)

      

Если же одна из них по расчету окажется отрицательной — выставим ее нулевой и вложим все деньги в цену за другой объект.

Но и наш конкурент, имея ту же свободную сумму и рассуждая точно так же, назначит за объекты точно такие же цены. Как говорится, боевая ничья! Ну, если конкурент не владеет профессиональными знаниями? Что ж, тем хуже для него — мы будем иметь доход больше, чем конкурент.

Конечно, если стартовые суммы участников торгов неодинаковы, число объектов велико и велико число участников, то задача поиска оптимальной стратегии становится более сложной, но все же имеет аналитическое решение.

Рассмотрим теперь второй вид задачи — об открытых торгах (аукционах). Пусть все те же два объекта (с теми же стоимостями) продаются с аукциона, в котором участвуем мы и наш конкурент.

В отличие от первой задачи свободные суммы различны и составляют SA и SB, причем каждая из них меньше (C1 + C2) и, кроме того, отношение нашей суммы к сумме конкурента более 0,5, но менее 2.

Пусть мы знаем «толщину кошелька» конкурента и, поскольку ищем оптимальную стратегию для себя, нам безразлично — знает ли он то же о наших финансовых возможностях.

Задача наша заключается в том, что мы должны знать — когда надо прекратить подымать цену за первый объект. Эту задачу не решить, если мы не определим цель своего участия в аукционе.

Здесь возможны варианты:

·   мы хотим иметь максимальный доход;

·   мы стремимся минимизировать доход конкурента;

·   мы желаем максимизировать разницу в доходах — свой побольше, а конкурента поменьше.

Наиболее интересен третий вариант ситуации — найти нашу стратегию, обеспечивающую

           

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image024.gif

(7.3)

                                                          

Поскольку объектов всего два, то все решается в процессе торгов за первый объект. Будем рассматривать свой ход в ответ на очередное предложение цены X за этот объект со стороны конкурента.

Мы можем использовать две стратегии поступить двумя способами:

·  стремиться уступить первый объект конкуренту — за наибольшую цену, надеясь купить второй;

·  стремиться купить первый объект — за минимальную цену, уступив конкуренту второй.

Пусть конкурент назначил за первый объект очередную сумму X. Если мы не добавим небольшую сумму (минимальную надбавку Δ), то первый объект достанется конкуренту. При этом у конкурента в запасе останется сумма SB − X. Доход конкурента составит при этом (без учета Δ) DB = C1 − X.

Мы наверняка купим второй объект, если у нас в кармане

SA = (SB − X) + Δ, то есть немного больше, чем осталось у конкурента.

Значит, мы будем иметь доход DA = C2 − (SB − X) и разность доходов в этом случае составит

          

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image025.gif

 (7.4)

                              

Ясно, что эта разность будет положительна только тогда, когда мы уступим первый объект за цену    

         

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image026.gif

 (7.5)

                                         

но никак не меньше.

Будем повышать цену за первый объект до суммы X + Δ с целью купить его.

Наш доход составит при этом DA = C1 − (X + Δ).

Второй объект достанется конкуренту за сумму SA − (X + Δ) + Δ, так как ему придется поднять цену за этот объект до уровня, чуть большего остатка денег у нас.

Доход конкурента составит DB = C2 − (SA − (X + Δ) + Δ), а разность доходов составит (без учета Δ)

 

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image027.gif

(7.6) 

           

Эта разность будет положительна при условии

                             

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image028.gif

 (7.7)

                                          

Мы нашли две «контрольные» суммы для того, чтобы знать — когда надо пользоваться одной из двух доступных нам стратегий — выражения (5) и (7). Среднее этих величин составит:

                  

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image029.gif

 (7.8)

и определяет разумную границу для смены стратегий нашего участия в аукционе с целью одновременно получить доход себе побольше, а конкуренту — поменьше.

Интересно сосчитать свой доход и разность доходов на этой границе.

·  если мы уступили первый объект на этой границе, то по (7.4):

 

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image030.gif

 

·  если же мы купили первый объект на этой границе, то по (7.6)

 

Описание: Описание: F:\Эл Учебник 2\Заготовки на русском\Теория\lec7.files\image031.gif