Дилема в’язня ілюструє, як егоїстичні дії призводять до субоптимальних результатів.
Співпраця не завжди є в найкращих інтересах у ситуації дилеми в’язня.
У бізнесі розуміння дилеми в’язня допомагає збалансувати конкуренцію та співпрацю.
Альберт Такер вперше представив дилему в’язня у 1950 році як частину теорії ігор.
Дилема в’язня показує, як індивідуальні рішення впливають на результати групи.
Отримуйте персоналізовані відповіді на основі штучного інтелекту, засновані на понад 27 роках довіреної експертизи.
ЗАДАТИ ПИТАННЯ
Дилема в’язня — це парадокс, сформульований Мерриллом Флудом і Мелвіном Дрешером у 1950 році в корпорації RAND. Пізніше її оформив і назвав канадський математик Альберт Вільям Такер.
Дилема в’язня в основному дає основу для розуміння, як знайти баланс між співпрацею та конкуренцією, і ці концепції іноді можуть бути корисним інструментом для стратегічного прийняття рішень. Тому вона застосовується у різних сферах — від бізнесу, фінансів, економіки і політичних наук до філософії, психології, біології та соціології.
VioletaStoimenova / Getty Images
Пояснення дилеми в’язня
Сценарій дилеми в’язня виглядає так: двох підозрюваних затримали за злочин, і вони перебувають у різних кімнатах у поліцейській дільниці, без можливості спілкуватися між собою. Прокурор окремо повідомляє їм таке:
Якщо ви зізнаєтеся і погоджуєтеся свідчити проти іншого підозрюваного, який не зізнається, обвинувачення проти вас знімуть, ви вийдете на свободу, а інший підозрюваний відбуватиме три роки.
Якщо ви не зізнаєтеся, але інший зізнається, вас засудять і ви відбуватимете три роки, а він вийде на свободу.
Якщо обидва зізнаються, обох засудять до двох років ув’язнення.
Якщо жоден з вас не зізнається, обох звинуватять у меншому правопорушенні і засудять до одного року.
Що мають зробити підозрювані? Це і є суть дилеми в’язня.
Основні принципи дилеми в’язня
Щоб ця парадоксальна ситуація працювала, потрібно кілька базових концепцій:
Мають бути два гравці. Сценарій передбачає двох осіб або суб’єктів, які опиняються у спільній ситуації, наприклад, скоєння злочину або прийняття спільного рішення.
Рішення приймаються одночасно. Обидва гравці роблять свій вибір без знання рішення іншого. Це важливий аспект дилеми, оскільки кожен має діяти, не знаючи рішення іншого.
Має бути комбінація можливих результатів. Таблиця виграшів — це таблиця, яка показує всі можливі комбінації виборів обох гравців і відповідні результати для кожного. Це допомагає візуалізувати наслідки різних рішень.
Можлива взаємна співпраця або зрада. Гравці можуть або співпрацювати (обираючи взаємовигідний результат), або зраджувати один одного (обираючи егоїстичний результат). Напруга виникає через конфлікт між індивідуальними та колективними інтересами.
Кожен гравець має домінантну стратегію. Це стратегія, яка дає найкращий результат для гравця незалежно від дій іншого. Домінантна стратегія часто є раціональним вибором, але при цьому може призводити до субоптимального результату, якщо обидва її обирають.
Гравці вважаються раціональними. Це означає, що вони прагнуть максимізувати свої власні інтереси. Ця передумова є фундаментальною для теорії ігор і моделі раціонального вибору.
Оцінка оптимальних стратегій
Розпочнемо з побудови таблиці виграшів, яка показана нижче. Тут «виграш» — це тривалість ув’язнення (з негативним знаком; чим менше число, тим краще). Терміни «співпрацювати» і «зрадити» означають, що підозрювані або співпрацюють (наприклад, обидва мовчать), або зраджують (один зізнається, інший — ні). Перша цифра в клітинках (a) — це виграш для Підозрюваного А, друга — для Підозрюваного В.
Дилема в’язня — Таблиця виграшів
Підозрюваний В
Співпрацює
Підозрюваний А
Співпрацює
Зраджує
Домінантна стратегія для гравця — це та, що дає йому найкращий результат незалежно від дій іншого. Тут домінантною є стратегія зради (зізнання), оскільки вона мінімізує тривалість ув’язнення для кожного, незалежно від дій іншого. Ось можливі результати:
Якщо А і В співпрацюють і мовчать, обидва отримують один рік — клітинка (a).
Якщо А зізнається, а В ні, А виходить на свободу, а В отримує три роки — клітинка (b).
Якщо обидва зізнаються, обох засуджують до двох років — клітинка (d).
Отже, якщо А зізнається, він або виходить на свободу, або отримує два роки. Якщо не зізнається — або один рік, або три. Аналогічно і В.
Наслідки дилеми в’язня
Дилема в’язня показує, що коли кожен переслідує свої інтереси, результат гірший, ніж якщо б вони співпрацювали. У прикладі вище, співпраця — мовчання обох — призвела б до одного року ув’язнення для кожного. Всі інші варіанти — це від двох до трьох років.
Раціональна людина, яка прагне отримати максимум вигоди для себе, зазвичай обере зраду, а не співпрацю. Якщо обидва зраджують, вважаючи, що інший не зробить того ж, вони опиняються у клітинці (d), отримуючи по два роки. Це — класичний приклад, що індивідуальний інтерес може призвести до гіршого спільного результату.
У випадку з в’язнем, співпраця з іншим підозрюваним дає неминуче покарання у один рік, тоді як зізнання — найкращий варіант, що може закінчитися свободою або двома роками. Але не зізнавшись, можна отримати три роки, якщо інший зрадить. Це створює сильний стимул зраджувати, навіть якщо співпраця дала б кращий результат для обох.
Ця дилема, коли стимул зрадити сильніший, ніж співпрацювати, — поширена у бізнесі та економіці.
Швидкий факт
Альберт Такер вперше представив дилему в’язня у 1950 році студентам-асистентам у Стенфордському університеті як приклад теорії ігор.
Бізнесові застосування дилеми в’язня
Класичний приклад дилеми в’язня у реальному світі — коли два конкуренти борються на ринку. Часто в економіці є два головних гравці. Наприклад, у США — жорстка конкуренція між Coca-Cola (KO) і PepsiCo (PEP) у сегменті газованих напоїв, а також Home Depot (HD) і Lowe’s (LOW) у будівельних матеріалах. Це породило багато кейсів у бізнес-школах. Інші приклади — Starbucks (SBUX) і Tim Horton’s (QSR) у Канаді, Apple (AAPL) і Samsung у мобільному секторі.
Розглянемо випадок Coca-Cola і PepsiCo, припустимо, що перша думає знизити ціну на свій популярний напій. Якщо вона зробить це, Pepsi, ймовірно, змушена буде слідувати, щоб зберегти частку ринку. Це може призвести до зниження прибутків обох компаній.
Зниження ціни однією з компаній може розглядатися як зрада, оскільки порушує неформальну угоду тримати ціни високими і максимізувати прибутки. Якщо Coca-Cola знизить ціну, а Pepsi залишиться на високому рівні, перша зраджує, а друга — співпрацює. У такому випадку Coca-Cola може отримати більшу частку ринку і додатковий прибуток.
Розуміння таблиці виграшів у дилемі в’язня
Припустимо, що додатковий прибуток Coca-Cola і Pepsi становить:
Якщо обидві тримають ціни високими, прибутки кожної з компаній зростають на 500 мільйонів доларів (завдяки зростанню попиту).
Якщо одна знижує ціну (зраджує), а інша — ні, перша отримує 750 мільйонів додаткового прибутку через більший ринок, а друга — без змін.
Якщо обидві знижують ціни, збільшення споживання компенсує зниження ціни, і кожна отримує додатково 250 мільйонів.
Таблиця виграшів виглядає так (числа — додатковий прибуток у сотнях мільйонів доларів):
Coca-Cola vs. PepsiCo — Таблиця виграшів
PepsiCo
Співпрацює
Coca-Cola
Співпрацює
Зраджує
Інші поширені приклади дилеми в’язня — у сферах розробки нових продуктів, технологій або маркетингових витрат компаній.
Наприклад, якщо дві компанії домовилися не збільшувати рекламний бюджет, їхній чистий дохід залишається високим. Але якщо одна з них зрадить і підвищить витрати на рекламу, вона може отримати більший прибуток за рахунок більшого продажу. Якщо ж обидві підвищать витрати, це може призвести до зменшення прибутків через конкуренцію у рекламі.
Економічні застосування дилеми в’язня
Класичний приклад — глухий кут у боргу США між демократами і республіканцями, що виникає час від часу. Припустимо, що вирішення боргової проблеми дає політичні переваги на наступних виборах. Співпраця означає, що обидві сторони працюють для збереження статус-кво щодо зростаючого дефіциту бюджету. Зрада — це відмовитися від цієї угоди і вжити заходів для зменшення дефіциту.
Якщо обидві сторони співпрацюють і підтримують стабільність економіки, вони отримують політичні бали. Але якщо одна сторона намагається вирішити проблему активніше, а інша — ні, перша може отримати більше голосів.
Якщо обидві сторони відмовляться від співпраці і почнуть жорстко боротися, це може спричинити економічний хаос — падіння ринків, зниження кредитного рейтингу, урядову кризу — і призвести до менших політичних вигод для обох.
Як використовувати дилему в’язня
Дилему в’язня можна застосовувати для прийняття рішень у особистому житті, наприклад, при купівлі автомобіля, переговорах щодо зарплати тощо.
Припустимо, ви шукаєте новий автомобіль і заходите до автосалону. Виграш — це нематеріальний, наприклад, задоволення від угоди. Ви хочете отримати найкращу ціну і характеристики, а продавець — максимізувати свою комісію.
Співпраця — це без торгу, ви платите ціну за наклейкою і йдете з новим авто. Зрада — це торг, прагнення знизити ціну, а продавець — підвищити. Якщо оцінювати задоволення за шкалою від 0 до 10, то таблиця виграшів виглядає так:
Покупець авто — Таблиця виграшів
Продавець
Співпрацює
Покупець
Співпрацює
Зраджує
Що нам каже ця таблиця? Якщо ви наполегливо торгуєте і отримуєте значну знижку, ви, ймовірно, будете дуже задоволені угодою, але продавець — ні, через втрату комісії. Навпаки, якщо продавець не знижує ціну, ви можете бути незадоволені, а продавець — задоволений.
Якщо ж ви просто заплатите ціну за наклейкою, задоволення буде нижчим, і продавець, ймовірно, теж не буде цілком задоволений, оскільки ваше бажання платити повну ціну може змусити його задуматися, чи міг він «перевести» вас на дорожчу модель або додати додаткові опції.
Клітинка (d) показує ще нижчий рівень задоволення для обох — довгий торг може закінчитися компромісом. Аналогічно і при переговорах щодо зарплати: не варто погоджуватися на першу пропозицію, якщо ви варті більшого.
Співпраця і перша пропозиція — це легкий вихід у складних умовах, але ви можете втратити частину грошей. Зрада — це переговори за вищу зарплату, що може принести більший дохід. Якщо ж роботодавець не хоче платити більше, ви можете залишитися незадоволеними.
Сподіваємося, що переговори щодо зарплати не стануть конфліктними, і це зменшить рівень вашого і роботодавця задоволення. Таблиця виграшів покупець-продавець легко може бути розширена для показу задоволення шукача роботи і роботодавця.
Економічний приклад дилеми в’язня
Завершимо статтю, розглянувши, як дилема в’язня проявляється в економіці. Приклад — у контексті фіскальної політики урядів під час економічної рецесії. Коли настає криза, кожна країна має вибір: застосовувати стимулюючу фіскальну політику для прискорення зростання. Але ефективність цих заходів залежить від дій інших країн.
Уявімо, що всі країни одночасно застосують стимулюючу політику. Світова економіка отримає додатковий попит і зможе відновитися. Але якщо одна країна вирішить бути більш обережною і зменшити витрати, вона може отримати короткострокову стабільність, але загальний ефект для світу буде негативним.
Ця ситуація — класична дилема в’язня: кожна країна має вирішити, чи співпрацювати, впроваджуючи стимулюючі заходи, або зрадити і діяти по-своєму. Якщо всі співпрацюють, відновлення буде швидшим. Якщо ж одна або кілька зрадять, це може гальмувати глобальне зростання і призвести до погіршення ситуації для всіх.
Що є відповіддю на дилему в’язня?
Правильної відповіді немає. Це парадокс, що показує, як індивідуальні рішення впливають на групові результати.
У простих словах: двоє ув’язнених мають вибір — зізнатися або мовчати, не спілкуючись. Їхні рішення впливають один на одного. Якщо один зізнається, а інший — ні, зізнавач виходить на свободу, а мовчазний отримує довгий термін. Якщо обидва мовчать, отримують короткий. Якщо обидва зізнаються — середній. Теорія ігор прогнозує, що зазвичай люди обирають той варіант, що їм вигідний найбільше.
Найкраща стратегія для дилеми в’язня — це не існує. Вона показує, що діяти в своїх інтересах не завжди веде до найкращого спільного результату.
Основний висновок
Дилема в’язня демонструє, що діяти лише в своїх інтересах не завжди призводить до оптимального результату. Бізнес, уряди і люди не завжди отримують найкращий результат, тому важливо враховувати, як співпраця може вплинути на їхні рішення.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Дилема в'язня: баланс між конкуренцією та співпрацею
Основні висновки
Отримуйте персоналізовані відповіді на основі штучного інтелекту, засновані на понад 27 роках довіреної експертизи.
ЗАДАТИ ПИТАННЯ
Дилема в’язня — це парадокс, сформульований Мерриллом Флудом і Мелвіном Дрешером у 1950 році в корпорації RAND. Пізніше її оформив і назвав канадський математик Альберт Вільям Такер.
Дилема в’язня в основному дає основу для розуміння, як знайти баланс між співпрацею та конкуренцією, і ці концепції іноді можуть бути корисним інструментом для стратегічного прийняття рішень. Тому вона застосовується у різних сферах — від бізнесу, фінансів, економіки і політичних наук до філософії, психології, біології та соціології.
VioletaStoimenova / Getty Images
Пояснення дилеми в’язня
Сценарій дилеми в’язня виглядає так: двох підозрюваних затримали за злочин, і вони перебувають у різних кімнатах у поліцейській дільниці, без можливості спілкуватися між собою. Прокурор окремо повідомляє їм таке:
Що мають зробити підозрювані? Це і є суть дилеми в’язня.
Основні принципи дилеми в’язня
Щоб ця парадоксальна ситуація працювала, потрібно кілька базових концепцій:
Оцінка оптимальних стратегій
Розпочнемо з побудови таблиці виграшів, яка показана нижче. Тут «виграш» — це тривалість ув’язнення (з негативним знаком; чим менше число, тим краще). Терміни «співпрацювати» і «зрадити» означають, що підозрювані або співпрацюють (наприклад, обидва мовчать), або зраджують (один зізнається, інший — ні). Перша цифра в клітинках (a) — це виграш для Підозрюваного А, друга — для Підозрюваного В.
Домінантна стратегія для гравця — це та, що дає йому найкращий результат незалежно від дій іншого. Тут домінантною є стратегія зради (зізнання), оскільки вона мінімізує тривалість ув’язнення для кожного, незалежно від дій іншого. Ось можливі результати:
Отже, якщо А зізнається, він або виходить на свободу, або отримує два роки. Якщо не зізнається — або один рік, або три. Аналогічно і В.
Наслідки дилеми в’язня
Дилема в’язня показує, що коли кожен переслідує свої інтереси, результат гірший, ніж якщо б вони співпрацювали. У прикладі вище, співпраця — мовчання обох — призвела б до одного року ув’язнення для кожного. Всі інші варіанти — це від двох до трьох років.
Раціональна людина, яка прагне отримати максимум вигоди для себе, зазвичай обере зраду, а не співпрацю. Якщо обидва зраджують, вважаючи, що інший не зробить того ж, вони опиняються у клітинці (d), отримуючи по два роки. Це — класичний приклад, що індивідуальний інтерес може призвести до гіршого спільного результату.
У випадку з в’язнем, співпраця з іншим підозрюваним дає неминуче покарання у один рік, тоді як зізнання — найкращий варіант, що може закінчитися свободою або двома роками. Але не зізнавшись, можна отримати три роки, якщо інший зрадить. Це створює сильний стимул зраджувати, навіть якщо співпраця дала б кращий результат для обох.
Ця дилема, коли стимул зрадити сильніший, ніж співпрацювати, — поширена у бізнесі та економіці.
Швидкий факт
Альберт Такер вперше представив дилему в’язня у 1950 році студентам-асистентам у Стенфордському університеті як приклад теорії ігор.
Бізнесові застосування дилеми в’язня
Класичний приклад дилеми в’язня у реальному світі — коли два конкуренти борються на ринку. Часто в економіці є два головних гравці. Наприклад, у США — жорстка конкуренція між Coca-Cola (KO) і PepsiCo (PEP) у сегменті газованих напоїв, а також Home Depot (HD) і Lowe’s (LOW) у будівельних матеріалах. Це породило багато кейсів у бізнес-школах. Інші приклади — Starbucks (SBUX) і Tim Horton’s (QSR) у Канаді, Apple (AAPL) і Samsung у мобільному секторі.
Розглянемо випадок Coca-Cola і PepsiCo, припустимо, що перша думає знизити ціну на свій популярний напій. Якщо вона зробить це, Pepsi, ймовірно, змушена буде слідувати, щоб зберегти частку ринку. Це може призвести до зниження прибутків обох компаній.
Зниження ціни однією з компаній може розглядатися як зрада, оскільки порушує неформальну угоду тримати ціни високими і максимізувати прибутки. Якщо Coca-Cola знизить ціну, а Pepsi залишиться на високому рівні, перша зраджує, а друга — співпрацює. У такому випадку Coca-Cola може отримати більшу частку ринку і додатковий прибуток.
Розуміння таблиці виграшів у дилемі в’язня
Припустимо, що додатковий прибуток Coca-Cola і Pepsi становить:
Таблиця виграшів виглядає так (числа — додатковий прибуток у сотнях мільйонів доларів):
Інші поширені приклади дилеми в’язня — у сферах розробки нових продуктів, технологій або маркетингових витрат компаній.
Наприклад, якщо дві компанії домовилися не збільшувати рекламний бюджет, їхній чистий дохід залишається високим. Але якщо одна з них зрадить і підвищить витрати на рекламу, вона може отримати більший прибуток за рахунок більшого продажу. Якщо ж обидві підвищать витрати, це може призвести до зменшення прибутків через конкуренцію у рекламі.
Економічні застосування дилеми в’язня
Класичний приклад — глухий кут у боргу США між демократами і республіканцями, що виникає час від часу. Припустимо, що вирішення боргової проблеми дає політичні переваги на наступних виборах. Співпраця означає, що обидві сторони працюють для збереження статус-кво щодо зростаючого дефіциту бюджету. Зрада — це відмовитися від цієї угоди і вжити заходів для зменшення дефіциту.
Якщо обидві сторони співпрацюють і підтримують стабільність економіки, вони отримують політичні бали. Але якщо одна сторона намагається вирішити проблему активніше, а інша — ні, перша може отримати більше голосів.
Якщо обидві сторони відмовляться від співпраці і почнуть жорстко боротися, це може спричинити економічний хаос — падіння ринків, зниження кредитного рейтингу, урядову кризу — і призвести до менших політичних вигод для обох.
Як використовувати дилему в’язня
Дилему в’язня можна застосовувати для прийняття рішень у особистому житті, наприклад, при купівлі автомобіля, переговорах щодо зарплати тощо.
Припустимо, ви шукаєте новий автомобіль і заходите до автосалону. Виграш — це нематеріальний, наприклад, задоволення від угоди. Ви хочете отримати найкращу ціну і характеристики, а продавець — максимізувати свою комісію.
Співпраця — це без торгу, ви платите ціну за наклейкою і йдете з новим авто. Зрада — це торг, прагнення знизити ціну, а продавець — підвищити. Якщо оцінювати задоволення за шкалою від 0 до 10, то таблиця виграшів виглядає так:
Що нам каже ця таблиця? Якщо ви наполегливо торгуєте і отримуєте значну знижку, ви, ймовірно, будете дуже задоволені угодою, але продавець — ні, через втрату комісії. Навпаки, якщо продавець не знижує ціну, ви можете бути незадоволені, а продавець — задоволений.
Якщо ж ви просто заплатите ціну за наклейкою, задоволення буде нижчим, і продавець, ймовірно, теж не буде цілком задоволений, оскільки ваше бажання платити повну ціну може змусити його задуматися, чи міг він «перевести» вас на дорожчу модель або додати додаткові опції.
Клітинка (d) показує ще нижчий рівень задоволення для обох — довгий торг може закінчитися компромісом. Аналогічно і при переговорах щодо зарплати: не варто погоджуватися на першу пропозицію, якщо ви варті більшого.
Співпраця і перша пропозиція — це легкий вихід у складних умовах, але ви можете втратити частину грошей. Зрада — це переговори за вищу зарплату, що може принести більший дохід. Якщо ж роботодавець не хоче платити більше, ви можете залишитися незадоволеними.
Сподіваємося, що переговори щодо зарплати не стануть конфліктними, і це зменшить рівень вашого і роботодавця задоволення. Таблиця виграшів покупець-продавець легко може бути розширена для показу задоволення шукача роботи і роботодавця.
Економічний приклад дилеми в’язня
Завершимо статтю, розглянувши, як дилема в’язня проявляється в економіці. Приклад — у контексті фіскальної політики урядів під час економічної рецесії. Коли настає криза, кожна країна має вибір: застосовувати стимулюючу фіскальну політику для прискорення зростання. Але ефективність цих заходів залежить від дій інших країн.
Уявімо, що всі країни одночасно застосують стимулюючу політику. Світова економіка отримає додатковий попит і зможе відновитися. Але якщо одна країна вирішить бути більш обережною і зменшити витрати, вона може отримати короткострокову стабільність, але загальний ефект для світу буде негативним.
Ця ситуація — класична дилема в’язня: кожна країна має вирішити, чи співпрацювати, впроваджуючи стимулюючі заходи, або зрадити і діяти по-своєму. Якщо всі співпрацюють, відновлення буде швидшим. Якщо ж одна або кілька зрадять, це може гальмувати глобальне зростання і призвести до погіршення ситуації для всіх.
Що є відповіддю на дилему в’язня?
Правильної відповіді немає. Це парадокс, що показує, як індивідуальні рішення впливають на групові результати.
У простих словах: двоє ув’язнених мають вибір — зізнатися або мовчати, не спілкуючись. Їхні рішення впливають один на одного. Якщо один зізнається, а інший — ні, зізнавач виходить на свободу, а мовчазний отримує довгий термін. Якщо обидва мовчать, отримують короткий. Якщо обидва зізнаються — середній. Теорія ігор прогнозує, що зазвичай люди обирають той варіант, що їм вигідний найбільше.
Найкраща стратегія для дилеми в’язня — це не існує. Вона показує, що діяти в своїх інтересах не завжди веде до найкращого спільного результату.
Основний висновок
Дилема в’язня демонструє, що діяти лише в своїх інтересах не завжди призводить до оптимального результату. Бізнес, уряди і люди не завжди отримують найкращий результат, тому важливо враховувати, як співпраця може вплинути на їхні рішення.