Сказка про Web 0 60


НазваниеСказка про Web 0 60
страница12/37
ТипСказка
filling-form.ru > бланк резюме > Сказка
1   ...   8   9   10   11   12   13   14   15   ...   37

Теория игр и модели конфликтов


Для описания протекания и анализа исходов сетевых стратегий применимы результаты теории конфликтов и игр.

Историческая справка теории игр


Основоположником теории игр признается Джон Нейман, внесший значительный вклад в математику, квантовую физику, создание атомной бомбы, цифровой ЭВМ и межконтинентальной баллистической ракеты [Рейнгольд]. Выпущенная в 1961 году книга «Кибернетика или управление и связь в животном и машине» признается как положившая начало соответствующему разделу науки управления.

Интересно следующее высказываний ученого по поводу теории игр: «Жизнь состоит из обмана (блефа), уловок, вопрошания себя, какие мысли у другого по поводу того, что я задумал. Как раз на этом и строятся игры в моей теории».

Теория игр складывается на ряде допущений:

  • противоборство игроков;

  • обязательности участия, зависимости победы от итогов предпринимаемых в соответствии с правилами поведения;

  • непременной рациональности действий всех игроков при выборе стратегии, обеспечивающей им максимальный выигрыш вне зависимости от последствий для остальных.

Правила не отражают в полной мере многообразия жизни, однако привлекательны возможностью описывать такие явления, как рынок, гонка вооружений, картельные сговоры, транспортные задачи и многое другое.

Теория игр создавалась в рамках корпорации RAND, которую еще называют «мозговым трестом», где проверенные на благонадежность интеллектуалы размышляли о немыслимом, в частности разрабатывали стратегии термоядерной войны. Поскольку гонка вооружений тесно связана с блефом и контрблефом теории игр, то новое поприще стало привлекательным для разработчиков стратегии ядерной войны.

Таким образом, в 1950 году ученые корпорации Rand создали четыре основополагающие игры в понимании Моргенштерна и фон Неймана:

  • «Игру с трусом (Chicken game);

  • «Тупик» (Deadlook);

  • «Охоту на оленя» (Stag hunt);

  • «Дилемму заключенного» (Prisoners Dilemma).

Игра с трусом широко представлена в фильмах, в которых двое нарушителей закона добиваются помилования и тот, кто первым отступает, проигрывает. Тупик представляет собой бесконечный обман: все игроки отказываются сотрудничать.

«Охоту на оленя» впервые описал Жан-Жак Руссо в 1755 году: «Если охотились на оленя, то каждый понимал, что для этого он обязан оставаться на своем посту; но если вблизи кого-либо из охотников пробегал заяц, то приходилось сомневаться, что этот охотник без зазрения совести пуститься за ним вдогонку и, настигнув добычу, весьма мало будет сокрушаться о том, что таким образом лишил добычи своих товарищей».

Охота на оленя – классический пример задачи обеспечения общественного блага при искушении человека поддаться своекорыстию. Должен ли охотник остаться с товарищами и сделать ставку на менее благоприятный случай доставить крупную добычу всему племени, либо покинуть товарищей и вверить себя более надежному случаю, сулящему его собственной семье зайца?

Четвертая игра, выношенная в стенах RAND Мерилом Флуд и Мелвином Дрешером, привела к междисциплинарному понятию фокальной точки Шеллингера. Игра классически описывается так: «Двое мужчин, обвиненных в совместном нарушении закона, содержаться в полицейском участке раздельно.

Каждому сказано, что:

  1. если один признается, а другой нет, то первый получит награду,

  2. если признаются оба, штраф грозит обоим;

  3. вместе с тем каждый может рассчитывать на то что, если никто их них не признается, оба выйдут сухими из воды.

Математическое представление игры


Математическое представление игры, опираясь на простой пример «Дилеммы Заключенного», может быть сведено в таблицу, где строки и столбцы отображают стратегию каждого из игроков. Пары чисел в ячейках указывают на платежи.




В сотрудничает

В отказывается

А сотрудничает

2,2

0,3

А отказывается

3,0

1,1

В соответствии с исходными посылками исследователей RAND платежи таковы, что награда за обоюдное сотрудничество с полицией, (в общем с случае означающая кооперацию, солидарность учет взаимных интересов, разрешение конфликта, альтруистическое поведение), превышает штраф за обоюдное молчание. Оба же этих платежа превышают платеж игрока за его сотрудничество при молчании другого игрока. Но меньше платежа за молчание одного при сотрудничестве с полицией другого.

Остальные игры оказываются разновидностью данной модели.

Сотрудничество и своекорыстие в сети


Стратегии сотрудничества и своекорыстия изучал в 1979 году политолог Роберт Аксельрод. Описанная выше игра «Дилемма заключенного» дает любопытные закономерности при ее многократном повторении. Хотя игроки не могут сообщать о своих намерениях при совершении текущего хода, история предыдущих решений позволяет оценить намерения другого игрока.

Согласно Аксельроду, именно возможность повторной встречи и создает предпосылки к сотрудничеству. Иначе говоря, сделанный сегодня выбор не только определяет исход данного хода, но и может повлиять и на последующие решения игроков. Будущее способно бросить тень на настоящее и тем самым воздействовать на текущее положение дел. Другое средство – Репутация.

Аксельрод предложил соревнование на ЭВМ по дилемме заключенного среди вычислительных программ, в котором приняли участие 63 программы. Каждая пара программ проводила друг с другом серии по 200 игр. Точное число игр авторам программ не сообщалось. Присланные программы содержали как простые стратегии, так и весьма изощренные, использующие методы прогнозирования и искусственный интеллект. Победителем объявлялась программа, набравшая в турнире больше всего очков.

Каждая программа на каждом своем шаге выбирала сотрудничество или отказ от него, тем самым зарабатывая очки согласно матрице данной игры. Программа могла учитывать предысторию ходов противника. Входные данные матрицы игры Аксельрод брал у представителей теории игр из экономики, социологии, политологии и математики. Он использовал четырнадцать таких наборов входных данных, прогоняя их неоднократно на ЭВМ случайным образом.

К моему удивлению, - писал Аксельрод, - победителем оказалась простая самая простая программа – «Услуга за услугу» (Tit for tat), присланная Анатолием Борисовичем Рапопортом. Стратегия строилась незатейливо: начинать надо с сотрудничества, а затем повторять действия противной стороны на предыдущем шаге». То есть, если противник на первом ходу сотрудничает, следующим ходом программа-стратегия «Услуга за услугу» тоже сотрудничает; если же противник первым ходом отказывается сотрудничать, отказом на следующем ходу отвечает и «Услуга за услугу». Когда же противник от отказа переходит к сотрудничеству, то же самое следующим ходом делает «Услуга за Услугу», как бы прощая его \ TFT-стратегия.

Во втором туре Аксельрод попросил участвовать эволюционных биологов, физиков и специалистов по вычислениям. Создателем программ было разрешено внести коррекции в разработанные программы с учетом результатов первого тура. И вновь победила стратегия «Услуга за услугу».

Был сделан вывод, что качества, присущие стратегии «Услуга за услугу» проявят себя в мире, где допустимы какие угодно стратегии. И если это так, то основанная исключительно на взаимности кооперация представляется весьма возможной.

Попытка определить точные условия, необходимые для поощрения кооперации при всех обстоятельствах привела к эволюционному подходу, то есть представлению о том, как возможно возникновение сотрудничества без центральной власти.

Эволюционный подход порождает три вопроса. Во-первых, каким образом поначалу удается закрепиться потенциально кооперативной стратегии в сугубо некооперативной среде? Во-вторых, какого рода стратегия в состоянии развиться в столь неоднородной среде, состоящей из множества людей, использующих более или менее изощренные стратегии? В-третьих, при каких условиях подобная стратегия, утвердившаяся среди определенного круга лиц, способна противостоять менее кооперативной стратегии?

Проведя модельные эксперименты, Аксельрод получил, по крайнем мере на уровне теории игр, ответ на первый вопрос: внутри множества исключительно некооперативных стратегий кооперативные стратегии возникают из небольших совокупностей людей, решивших сотрудничать, даже если самим кооперативным стратегиям в их взаимоотношениях отведено небольшое место. Такие группы кооператоров быстро набирают очки по сравнению с теми, у кого отсутствует сотрудничество.

Основанные на кооперации стратегии способны выстоять в противостоянии с другими стратегиями, и «возникшие однажды на основе принципа взаимности сотрудничество в состоянии теперь выдержать натиск менее кооперативных стратегий. Тем самым, «шестерни социальной революции обзаводятся храповиком» [Рейнгольд].

Игры преследования – уклонения и их алгоритмы


Оптимальные алгоритмы поведения противоборствующих игроков определяются задачами, которые они перед собой ставят. Если один из игроков пытается вступить в конфликт, а другой пытается уклониться – то возникает ситуация характерная для игр преследования-уклонения [Пономарев].

В данной схеме стороны имеют разные уровни активности: одна сторона более активна (преследователь), а другая менее активна – преследуемый, который озабочен не в достижении максимального выигрыша, а минимального проигрыша. В реальной ситуации конфликта более важным оказывается достижение высокого уровня активности, что равносильно избеганию пассивной участи преследуемого.

Схема конфликта может быть представлена следующим образом. До начала противоборcтва оба игрока имеют равные уровни активности и единую задачу получения выигрыша по критерию «Захвата», или по какому-либо другому критерию. На начальной стадии игроки пытаются перевести игру в выгодное для себя русло. Выгодность понимается в получении первым ранга преследователя. В этом случае противнику достается пассивная роль преследуемого. Получение ранга преследователя во многих случаях означает разрешение игры в свою пользу, или дает большие преимущества.

Таким образом, в реальном конфликте можно выделить этап борьбы за ранг преследователя и этап преследования.

По этой схеме развиваются многие спортивные игры, воздушные сражения. Чем же определяется упорство поединка? Условно это понятие можно назвать силой конфликта.

Энергетически-информационная модель


Перенося подходы игры 2-х автомобилей [Пономарев] на реальное противодействие-конфликт в группе обсуждающих какую-либо тему в социальной сети, можно допустить, что для анализа психологических процессов, в частности, психологической борьбы за статус в группе или приоритет какой-либо идеи (политической, философской) можно говорить о важности для игрока психологической адаптации и маневренности - аналог изменения энергетического уровня в классической игре автомобилей.

Констатировав важность уровня психологической подготовки игрока – участника сетевого обсуждения, для распределения своих ограниченных (пусть и у каждого игрока и по разному) психологических возможностей, следует признать важным информационную компоненту борьбы, то есть обладание первоначальной информацией о позиции игрока, его предыстории – образования, опыта работы, интересов (паспорт в толковании социальных сервисов), результатов предыдущих «стычек» и дискуссий.

Можно ввести, следуя изучаемому первоисточнику, коэффициент полноты информации как отношение энергетических (психологических) затрат на решение основной задачи к суммарному потенциалу.

И таким образом, реальный конфликт сетевого противоборства условно можно разделить на информационное противоборство и энергетическое (психологическое) противоборство.

Закон необходимого разнообразия


На синтаксическом уровне взаимодействие противоборствующих может рассматриваться с позиций известного закона кибернетики – закона необходимого разнообразия, суть которого заключается в том, что для получения ожидаемого результата активный противник, кроме желания выиграть, должен обладать определенным разнообразием ходов [Пономарев].

Пусть R1 - разнообразие ходов игрока P, R2 – разнообразие ходов игрока E, R0 - разнообразие исходов. В логарифмическом виде соотношение, составленное на основе закона необходимого разнообразия, будет иметь вид

ln R0 = ln R1 - ln R2

Отсюда следует, что R0 может быть уменьшено за счет соответствующего увеличения R1 (при условии R2 = const). При ln R1 = ln R2 разнообразие исходов ln R0 = 0, то есть в этом случае существуют объективные предпосылки для решения задачи противоборства с высокой вероятностью.

Иллюстрация данного подхода - обычный конфликт Преподавателя с учебной сопротивляющейся группой. Если ходов в арсенале Преподавателя маловато (недостаточен педагогический опыт) – то у Группы есть шансы загнать Преподавателя в угол.

Термодинамическая модель противоборства


Происходящие в системе противоборства игроков P – E процессы можно охарактеризовать с помощью понятия энтропия, что рассматривалось, в частности в [Пономарев].

Впервые термин был применен Клаузиусом для обозначения меры деградации какой-либо системы. В процессах, происходящих без дополнительного притока энергии извне (изоэнергетические процессы), уменьшение внутренней энергии системы сопровождается пропорциональным увеличением энтропии, и наоборот. Следовательно, энтропия есть мера вероятности физической системы, а ее рост – переход от большего порядка к меньшему. Максимум энтропии достигается при равновесном, наивероятнейшем состоянии системы. Закон возрастания энтропии присущ любой изолированной системе, предоставленной самой себе.

В нашем случае социотехнической сетевой системы имеет место не просто изолированная система, а система с противодействием и взаимообменом, то есть открытая система, для которой полезно порассуждать о возрастании энтропии.

В системах с противоборством можно наблюдать несколько потоков энтропии.

Первый поток характеризует возрастание энтропии как в любой физической системе. Мощность этого потока определяется градиентом естественного увеличения энтропии HE . Элементы противоборства приводят к появлению потока энтропии, мощность которого определяется градиентом искусственного увеличения энтропии HИ. Величина этого градиента может изменяться в довольно широких пределах в зависимости от решаемых задач (в зависимости от целей игры). Однако эти пределы не безграничны, а вполне конечны и определяются информацией (количеством информации) о противоборствующих сторонах. Чем полнее информация у игрока о своем противнике, тем в большей степени он может использовать правило искусственного увеличения энтропии.

А что же препятствует росту энтропии? Препятствует росту энтропии свободная энергия, полученная системой в процессе противоборства. Эта энергия (избыток энергии) образует поток «отрицательной энтропии», мощность которого характеризуется градиентом HO. Появление этого потока равносильно появлению управляющего начала в системе P – E, то есть равносильно введению в систему информации. Чем больше это управляющее начало, тем по более жестким законам действуют противоборствующие стороны, что приводит к возрастанию вероятности достижения цели игры.

Итак, энтропия системы P – E определяется суммой перечисленных выше потоков, то есть

HΣ = HE + HИ + HO

Если HE + HИ > HO то взаимодействие противоборствующих противников быстро распадается, что равносильно ничейному исходу. Если же HE + HИ < HO то система P – E может иметь стационарное состояние, то есть такое состояние, когда отток энтропии во внешнюю среду и приток «отрицательной энтропии» в виде свободной энергии (избытков энергии) компенсируют друг друга. Именно в стационарном состоянии действуют объективные законы, по которым живет и развивается система. Время жизни системы в стационарном состоянии определяется величиной энергии (величиной избытков энергии).

Чем больше эта величина, тем более тесно взаимодействуют противоборствующие стороны друг с другом, тем более вероятно, что сторона, имеющая избыточную энергию, решит противоборство в свою пользу.

В этих рассуждениях избыточная энергия понимается как негэнтропия, которая препятствует распаду системы P – E, то есть удерживает во взаимодействии противоборствующие стороны. Заметим, что необходимым условием существования решения игры является условие HO > 0.

Таким образом, если рассматривать систему как термодинамическую, то только избытки энергии (способность совершить работу по удержанию противников во взаимодействии) является демпфером на пути возрастания энтропии. Именно эти избытки энергии позволяют в условиях лавинообразного нарастания энтропии решать задачу игры с заданной вероятностью.

Если все сказанное имеет право на жизнь, то можно сформулировать один из принципов противоборства: каков бы ни был энергетический запас динамического объекта, имеющего ранг преследователя, со временем он теряется, а это приводит к росту энтропии системы P – E. Поскольку энергетический запас всегда ограничен, то это в конечном счете не может препятствовать росту энтропии в системе. Следовательно, чем больше время игры, тем меньше шансов добиться успеха.

Лингвистический подход


При построении адекватных моделей противоборства нельзя ограничиваться только статистической теорией информации, которая хорошо отражает закономерности сбора, кодирования передачи и приема данных [Пономарев].

Адекватный класс моделей может быть построен с учетом влияния человека, предполагает учитывать смысл (семантику сообщений). С появлением идеи о том, что смысл высказывания человека можно формализовать нечеткими и лингвистическими переменными, которые, в свою очередь, носят характер оценок возможностей, началось обсуждение математической трактовки категории «возможность». Основные идеи изложены в [_ __].
1   ...   8   9   10   11   12   13   14   15   ...   37

Похожие:

Сказка про Web 0 60 iconСказка про Web 0 61

Сказка про Web 0 60 iconСказка про Web 0 64

Сказка про Web 0 60 iconУчебно-методический комплекс дисциплины дс. Ф. 1 Web-графика и web-дизайн...
Целями преподавания дисциплины «Web- графика и web- дизайн» являются: формирование у будущих специалистов общего представления об...

Сказка про Web 0 60 iconРуководство описывает пользовательский интерфейс лрм сэд нрд (web-доступ),...
Настоящее Руководство пользователя локального рабочего места Системы электронного документооборота (лрм сэд) нрд (web-доступ), далее...

Сказка про Web 0 60 iconРуководство описывает пользовательский интерфейс web-кабинета Депозитария/Клиринговой...
Системы электронного документооборота (лрм сэд) нрд (web-кабинет Депозитария/Клиринговой организации), далее – Руководство, предназначено...

Сказка про Web 0 60 iconГ. Нягань «Д/с №2 «Сказка»
«Сказка», регулирует деятельность по назначению и выплате компенсации и сроки обращения за компенсацией. Руководитель дошкольного...

Сказка про Web 0 60 iconСказка» от «19» 09 2014 г. №128
Центр развития ребенка – детский сад №13 «Сказка» (далее доу) разработан в целях повышения качества предоставления и доступности...

Сказка про Web 0 60 iconКлассификации промышленной про­дукции. Под промышленной продук­цией...
Промыш­ленную продукцию подразделяют па два класса: 1-й — продукцию, расхо­дуемую при использовании; 2-й — продукцию, расходующую...

Сказка про Web 0 60 iconИнструкция пользователя Работа в web-интерфейсе версия 0 Москва 2012
Для более быстрой работы web-интерфейса желательно использовать следующие браузеры

Сказка про Web 0 60 icon«Разговоры в песочнице, или истории из жизни мам.»: Генезис; Москва; 2009 isbn 978-5-98563-166-1
Про чувства качающих качели. Про переживания сидящих в очереди к педиатру. Про тех, чьи дети еще не ходят в детский сад, и даже вообще...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск