راه حل بازی متضاد آنلاین. بازی های آنتاگونیستی با استراتژی های مداوم. الف) بدترین وضعیت برای او اتفاق خواهد افتاد

موسسه انرژی مسکو

(دانشگاه فنی)

گزارش آزمایشگاه

در تئوری بازی ها

"برنامه ای برای یافتن استراتژی های بهینه برای یک بازی زوجی با جمع صفر که به صورت ماتریسی ارائه شده است"

توسط دانش آموزان تکمیل شد

گروه A5-01

آشراپوف دلر

آشراپووا اولگا

مفاهیم اساسی نظریه بازی ها

تئوری بازی برای حل و فصل طراحی شده است موقعیت های درگیری ، یعنی شرایطی که در آن منافع دو یا چند طرف که اهداف متفاوتی را دنبال می کنند، با هم برخورد می کنند.

اگر اهداف احزاب مستقیماً متضاد باشد، آنها صحبت می کنند درگیری متضاد .

بازی یک مدل رسمی ساده شده از یک موقعیت درگیری نامیده می شود.

به یک بازی از ابتدا تا انتها می گویند مهمانی . نتیجه بازی است پرداخت (یا برنده ها ).

حزب متشکل از حرکت می کند ، یعنی انتخاب بازیکنان از مجموعه معینی از گزینه های ممکن.

حرکات ممکن است شخصیو تصادفی.حرکت شخصی ، بر خلاف تصادفی ، شامل انتخاب آگاهانه بازیکن از یک گزینه است.

بازی هایی که در آنها حداقل یک حرکت شخصی وجود دارد نامیده می شود استراتژیک .

بازی هایی که در آنها همه حرکات تصادفی هستند نامیده می شوند قمار .

هنگام انجام یک حرکت شخصی در مورد آن نیز صحبت می کنند استراتژی ها بازیکن، یعنی درباره یک قانون یا مجموعه قوانینی که انتخاب بازیکن را تعیین می کند. در عین حال، استراتژی باید جامع باشد، یعنی. انتخاب باید برای هر موقعیت احتمالی در طول بازی مشخص شود.

مشکل تئوری بازی ها- یافتن استراتژی های بهینه برای بازیکنان، به عنوان مثال. استراتژی هایی که حداکثر سود یا حداقل ضرر را برای آنها فراهم می کند.

طبقه بندی مدل های نظری بازی

بازی nافراد معمولاً به عنوان کجا مشخص می شوند
- مجموعه ای از استراتژی های بازیکن i-ام،
- پرداخت برای بازی

مطابق با این نامگذاری، طبقه بندی زیر از مدل های نظری بازی می تواند پیشنهاد شود:

گسسته (راهبردهای چندگانه گسسته)

نهایی

بی پایان

پیوسته (راهبردهای چندگانه مستمر)

بی پایان

nافراد (
)

ائتلاف (تعاونی)

غیر ائتلافی (غیر تعاونی)

2 نفر (جفت)

آنتاگونیست (بازی های حاصل جمع صفر)

(منافع طرفین متضاد است، یعنی از دست دادن یک بازیکن برابر با سود دیگری است)

غیر آنتاگونیستی

با اطلاعات کامل (اگر بازیکنی که حرکت شخصی انجام می دهد، کل پس زمینه بازی یعنی تمام حرکات حریف را بداند)

با اطلاعات ناقص

با مبلغ صفر (کل پرداختی برابر با صفر است)

مجموع غیر صفر

تک حرکتی (قرعه کشی)

چند پاس

نمایش ماتریسی از یک بازی زوج صفر

در این آموزش به بررسی خواهیم پرداخت بازی های متضاد دو نفره ، به صورت ماتریسی ارائه شده است. این بدان معنی است که ما بسیاری از استراتژی های بازیکن اول (بازیکن الف){ الف من }, من = 1,…, مترو انواع استراتژی برای بازیکن دوم (بازیکن ب){ ب j }, j = 1,..., n، و همچنین با توجه به ماتریس الف = || الف ij || بردهای بازیکن اول از آنجایی که ما در مورد یک بازی آنتاگونیستی صحبت می کنیم، فرض بر این است که سود بازیکن اول برابر با از دست دادن بازیکن دوم است. فرض می کنیم که عنصر ماتریس الف ij- بردهای اولین بازیکن زمانی که استراتژی را انتخاب می کند الف منو پاسخ بازیکن دوم به او با یک استراتژی ب j. ما چنین بازی را به عنوان نشان خواهیم داد
، کجا متر - تعداد استراتژی های بازیکن الف،n - تعداد استراتژی های بازیکن دربه طور کلی می توان آن را با جدول زیر نشان داد:

ب 1

ب j

ب n

الف 1

الف من

الف متر

مثال 1

به عنوان یک مثال ساده، بازی را در نظر بگیرید که در آن یک بازی از دو حرکت تشکیل شده است.

حرکت 1: بازیکن الفیکی از اعداد (1 یا 2) را بدون اطلاع حریف از انتخاب خود انتخاب می کند.

حرکت 2: بازیکن دریکی از اعداد (3 یا 4) را انتخاب می کند.

خط پایین: انتخاب بازیکنان الفو درتا کردن اگر مجموع زوج باشد، پس درارزش خود را به بازیکن می پردازد الف، اگر فرد است - برعکس، الفمبلغ را به بازیکن پرداخت می کند در.

این بازی را می توان در قالب ارائه کرد
به شرح زیر:

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

به راحتی می توان دید که این بازی متضاد است، علاوه بر این، یک بازی با اطلاعات ناقص است به بازیکن در،با انجام یک حرکت شخصی، معلوم نیست بازیکن چه انتخابی کرده است الف

همانطور که در بالا ذکر شد، وظیفه تئوری بازی ها یافتن استراتژی های بهینه بازیکنان است، یعنی. استراتژی هایی که حداکثر سود یا حداقل ضرر را برای آنها فراهم می کند. این فرآیند نامیده می شود راه حل بازی .

هنگام حل یک بازی به صورت ماتریسی، باید بازی را برای حضور بررسی کنید نقطه زین . برای این کار دو مقدار وارد می شود:

– برآورد کمتر از قیمت بازی و

- تخمین بالایی از قیمت بازی.

بازیکن اول به احتمال زیاد استراتژی را انتخاب می کند که در آن حداکثر برد را از بین تمام پاسخ های ممکن بازیکن دوم دریافت می کند، و بازیکن دوم، برعکس، استراتژی را انتخاب می کند که ضرر خود را به حداقل می رساند، یعنی. برنده شدن احتمالی اولین

می توان ثابت کرد که α ≤ V ≤ β ، کجا Vقیمت بازی ، یعنی برد احتمالی بازیکن اول.

اگر رابطه برقرار باشد α = β = V، سپس آنها می گویند بازی یک نقطه زین دارد
، و را می توان در استراتژی های خالص حل کرد . به عبارت دیگر، چند استراتژی وجود دارد
، دادن بازیکن الفV.

مثال 2

بیایید به بازی ای که در مثال 1 در نظر گرفتیم برگردیم و آن را برای وجود نقطه زین بررسی کنیم.

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

برای این بازی
= -5,
= 4,
بنابراین نقطه زینی ندارد.

اجازه دهید یک بار دیگر توجه را به این واقعیت جلب کنیم که این بازی یک بازی با اطلاعات ناقص است. در در این موردمن فقط می توانم به بازیکن توصیه کنم الفیک استراتژی انتخاب کنید ، زیرا در این صورت، او می تواند بزرگترین برد را به دست آورد، البته به انتخاب بازیکن دراستراتژی ها .

مثال 3

بیایید از مثال 1 تغییراتی در قوانین بازی ایجاد کنیم. ما بازیکن را ارائه خواهیم کرد دراطلاعات انتخاب بازیکن الفسپس داشته باشید دردو استراتژی اضافی ظاهر می شود:

- یک استراتژی مفید برای الفاگر انتخاب الف - 1،که دردر صورت انتخاب 3 را انتخاب می کند الف - 2،که در 4 را انتخاب می کند؛

- استراتژی که برای آن سودمند نیست الفاگر انتخاب الف - 1،که دردر صورت انتخاب 4 را انتخاب می کند الف - 2،که در 3 را انتخاب می کند.

(گزینه 3)

(گزینه 4)

(گزینه 1)

(گزینه 2)

این بازی با اطلاعات کامل است.

در این مورد
= -5,
= -5,
بنابراین، بازی دارای یک نقطه زینتی است
. این نقطه زینی با دو جفت استراتژی بهینه مطابقت دارد:
و
. قیمت بازی V= -5. بدیهی است که برای الفچنین بازی بی سود است.

مثال های 2 و 3 به خوبی بیانگر قضیه زیر هستند که در تئوری بازی ها ثابت شده است:

قضیه 1

هر بازی آنتاگونیستی زوجی با اطلاعات کامل را می توان در استراتژی های خالص حل کرد.

که قضیه 1 می گوید که هر بازی دو نفره با اطلاعات کامل یک نقطه زینتی دارد و یک جفت استراتژی خالص وجود دارد.
، دادن بازیکن الفبردهای پایدار برابر با قیمت بازی V.

در صورت عدم وجود نقطه زینی، به اصطلاح استراتژی های ترکیبی :، کجا ص من وq j- احتمال انتخاب استراتژی ها الف من و ب jبه ترتیب بازیکن اول و دوم راه حل بازی در این مورد یک جفت استراتژی ترکیبی است
، به حداکثر رساندن انتظار ریاضی از قیمت بازی.

قضیه زیر قضیه 1 را به یک بازی با اطلاعات ناقص تعمیم می دهد:

قضیه 2

هر بازی متضاد جفتی حداقل یک راه حل بهینه دارد، یعنی یک جفت استراتژی مختلط در حالت کلی.
، دادن بازیکن الفبردهای پایدار برابر با قیمت بازی V، و α ≤ V ≤ β .

در حالت خاص، برای یک بازی با نقطه زین، راه حل در استراتژی های مختلط مانند یک جفت بردار به نظر می رسد که در آن یک عنصر برابر با یک و بقیه برابر با صفر است.

رویکرد حل بازی‌های ماتریسی را می‌توان به بازی‌های مجموع صفر تعمیم داد که در آن سود بازیکنان به عنوان یک تابع پیوسته مشخص می‌شود (بازی با مجموع صفر بی‌نهایت).

این بازی به صورت یک بازی دو نفره نمایش داده می شود که در آن بازیکن 1 عددی را انتخاب می کند Xاز بسیاری بازیکن 2 عدد y را از مجموعه 7 انتخاب می کند و پس از آن بازیکنان 1 و 2 به ترتیب برنده می شوند. U(x, y) و -U(x، y).انتخاب یک عدد مشخص توسط یک بازیکن به معنای اعمال استراتژی خالص او مطابق با این عدد است.

در قیاس با بازی های ماتریسی می توان قیمت خالص کمتر یک بازی را نام برد v (=حداکثر حداقل U(x، y)،و قیمت خالص بازی -v 2 =

حداقل حداکثر U(x، y).سپس، بر حسب قیاس، می توانیم فرض کنیم که اگر برای برخی

در *

یا یک بازی بی پایان متضاد از بزرگی Vو v 2وجود دارند و با هم برابرند («من =v 2 =v)،پس چنین بازی راه حلی در استراتژی های خالص دارد، یعنی. استراتژی بهینه بازیکن 1 انتخاب یک عدد است ه و بازیکن 2 - اعداد y 0 e 7، که برای آن شچ ( y 0) -v.

در این مورد vقیمت خالص بازی نامیده می شود و (x°, y 0) نقطه زین یک بازی بی نهایت با مجموع صفر است.

برای بازی های ماتریسی بزرگ v xو v 2همیشه وجود دارند، اما در بازی های آنتاگونیستی بی نهایت ممکن است وجود نداشته باشند، یعنی. یک بازی مجموع صفر بی پایان همیشه قابل حل نیست.

هنگام رسمی کردن یک موقعیت واقعی در قالب یک بازی متضاد بی پایان، معمولاً یک فاصله استراتژیک انتخاب می شود - یک فاصله زمانی که بازیکنان می توانند از آن انتخاب کنند. (X -شماره (استراتژی) انتخاب شده توسط بازیکن 1؛ -

شماره (استراتژی) انتخاب شده توسط بازیکن 2). از نظر فنی، این راه حل را ساده می کند، زیرا با یک تبدیل ساده می توان هر بازه را به یک بازه واحد تبدیل کرد و بالعکس. این بازی نام دارد بازی متضاد در یک مربع واحد.

به عنوان مثال، فرض کنید بازیکن 1 عدد را انتخاب می کند Xاز بسیاری X=، بازیکن 2 عدد y را از مجموعه انتخاب می کند Y=. پس از این، بازیکن 2 مبلغ را به بازیکن 1 می پردازد Shx، y) -2x 2 -y 2.از آنجایی که بازیکن 2 به دنبال به حداقل رساندن پرداخت بازیکن 1 است، حداقل ( 2x2 - y 2) = 2x2- 1، یعنی در این مورد = 1. بازیکن 1 تلاش می کند تا یک تگ ایجاد کند

پرداخت خود را شبیه سازی کنید، بنابراین حداکثر حداقل را تعیین می کند شچ، y) 1 =

xGX y به عنوان مثال

- حداکثر (2x2 - 1) = 2- 1 = 1 که زمانی حاصل می شود X = 1.

بنابراین، قیمت خالص کمتر بازی v x - 1. تمیز کردن بالا

قیمت بازیv 2 =دقیقه - دقیقه (2 - y 2) = 2 - 1 = 1، یعنی. در این

> به عنوان مثالهه تو ای

بازی v l = v 2 =l.بنابراین قیمت خالص بازی v= 1، و نقطه زین (x° = 1؛ y° = 1).

اکنون این را فرض کنیم چی ای-بازه های باز، یعنی بازیکن 1 xeA"=(0; 1)، بازیکن 2 ue 7= (0; 1) را انتخاب می کند. در این مورد، انتخاب به اندازه کافی نزدیک به 1، بازیکن 1 مطمئن خواهد بود که بازدهی کمتر از عددی نزدیک به "=1; با انتخاب y نزدیک به 1، بازیکن 2 اجازه نخواهد داد که بازده بازیکن 1 به میزان قابل توجهی از هزینه خالص بازی بیشتر شود. v= 1.

درجه نزدیکی به قیمت بازی را می توان با عدد مشخص کرد؟>0. بنابراین، در بازی توصیف شده می توان در مورد بهینه بودن استراتژی های ناب صحبت کرد = 1، 0 = 1 به ترتیب بازیکنان 1 و 2 تا یک عدد دلخواه؟>0. نقطه (X"، y E)، که در آن x e e X، y (. eY، در یک بازی مجموع صفر نامتناهی نامیده می شود نقطه تعادل z (s.-نقطه زینی)، اگر برای هر یک از استراتژی های xTiger 1، ue Tiger 2 نابرابری برقرار است شچ، u.) - ? Ш x r , у (.) U(x t ., у) + ?. در این مورد، استراتژی ها x k.و تو نامیده می شوند با استراتژی های بهینه. آیا این استراتژی ها بهینه هستند؟ به این معنا که اگر انحراف از استراتژی بهینه نتواند هیچ سودی برای بازیکن به همراه داشته باشد، انحراف او از استراتژی c-optimal می تواند سود او را بیش از e افزایش دهد.

اگر بازی دارای نقطه زین (c-saddle point) نباشد، یعنی. راه‌حل‌ها را در استراتژی‌های خالص می‌توان جستجو کرد، سپس استراتژی‌های بهینه را می‌توان در میان استراتژی‌های ترکیبی جستجو کرد که به عنوان توابع توزیع احتمال بازیکنان با استفاده از استراتژی‌های خالص مورد استفاده قرار می‌گیرد.

اجازه دهید F(x)تابع توزیع احتمال استفاده از استراتژی های خالص توسط بازیکن 1 است. اگر عدد E استراتژی خالص بازیکن 1 باشد، پس F(x) = P(q که در آن P(q -X)- احتمال اینکه یک استراتژی خالص تصادفی انتخاب شده E تجاوز نکند Xتابع توزیع احتمال استفاده از راهبردهای خالص به روشی مشابه در نظر گرفته شده است. بازیکن 2: Q(y) = P(g.

توابع F(x)و Q(y)نامیده می شوند استراتژی های ترکیبیبه ترتیب بازیکنان 1 و 2. اگر Fx)و Q(y)قابل تمایز هستند، پس مشتقات آنها وجود دارد که به ترتیب با نشان داده می شوند f(x)و q(y)(توابع چگالی توزیع).

به طور کلی، دیفرانسیل تابع توزیع dF(x) این احتمال را بیان می کند که استراتژی با،در بین است x E، به همین ترتیب برای بازیکن 2: dQ(y)یعنی احتمال اینکه استراتژی او p در بازه باشد y g| y+dy.سپس پرداخت بازیکن 1 خواهد بود Shx، y) dF(x)،و پرداخت بازیکن 2 است Shx، y) dQ(y).

میانگین بازده بازیکن 1 با توجه به اینکه بازیکن 2 از استراتژی خالص خود استفاده می کند را می توان با ادغام پرداخت ها روی تمام مقادیر ممکن به دست آورد آن ها در یک بازه واحد:

میانگین پرداخت بازیکن 1، با فرض اینکه هر دو بازیکن از استراتژی های ترکیبی خود استفاده می کنند F(x)و Q(y)برابر خواهد بود

با قیاس با بازی های ماتریسی، استراتژی های ترکیبی بهینه بازیکنان و قیمت بازی تعیین می شود: اگر یک جفت استراتژی مختلط F*(x) و Q*(y)به ترتیب، برای بازیکنان 1 و 2 بهینه هستند، سپس برای هر استراتژی مختلط F(x)و Q(y)روابط زیر معتبر است:

اگر بازیکن 1 از استراتژی خود منحرف شود F*(x)،در این صورت میانگین سود او نمی تواند افزایش یابد، اما می تواند به دلیل اقدامات منطقی بازیکن 2 کاهش یابد. اگر بازیکن 2 از استراتژی ترکیبی خود عقب نشینی کند. Q*(y)،در این صورت میانگین بازده بازیکن 1 ممکن است افزایش یابد، اما کاهش نمی یابد، به دلیل اقدامات منطقی تر بازیکن 1. سود متوسط E(F*، Q*)،دریافت شده توسط بازیکن 1 هنگامی که بازیکنان استراتژی های ترکیبی بهینه را اعمال می کنند، با قیمت بازی مطابقت دارد.

سپس قیمت کف یک بازی مجموع صفر بی نهایت حل شده در استراتژی های ترکیبی را می توان به صورت تعریف کرد v x= چک کردن

دقیقه E(FQ)و قیمت بالای بازی مانند است v 2 =حداقل حداکثر E (F، Q).

Q Q f

اگر چنین استراتژی های ترکیبی وجود داشته باشد F* (x)و س*(y) به ترتیب برای بازیکنان 1 و 2، که قیمت پایین و بالاتر بازی با هم مطابقت دارند، سپس F*(x)و Q*(y)طبیعی است که استراتژی های ترکیبی بهینه بازیکنان مربوطه را، a v=v x = v 2- به قیمت بازی.

بر خلاف بازی های ماتریسی، راه حلی برای یک بازی مجموع صفر بی نهایت برای هر تابع وجود ندارد خس، آه).اما این قضیه ثابت شده است که هر بازی مجموع صفر نامتناهی با تابع پرداخت پیوسته خس، اوه)در مربع واحد یک راه حل دارد (بازیکنان استراتژی های ترکیبی بهینه ای دارند)، اگرچه هیچ روش کلی برای حل بازی های مجموع صفر بی نهایت، از جمله بازی های مداوم وجود ندارد. با این حال، بازی‌های بی‌نهایت متضاد با توابع بازده مستمر محدب و مقعر (به ترتیب نامیده می‌شوند محدبو بازی های مقعر).

اجازه دهید راه‌حل بازی‌هایی با تابع سود محدب را در نظر بگیریم. راه حل بازی هایی با تابع پرداخت مقعر متقارن است.

محدبتابع/متغیر Xدر فاصله زمانی ( الف; ب)تابعی است که برای آن نابرابری برقرار است

کجا Xxو x 2 -هر دو نقطه از بازه (a; ب);

X.1، A.2 > 0 و +X.2= 1.

اگر برای / h * 0 D 2 * 0، نابرابری شدید همیشه برقرار است

سپس تابع/ فراخوانی می شود به شدت محدبدر (a; ب).

یک تابع محدب هندسی، کمانی را نشان می‌دهد که نمودار آن در زیر وتر قرار دارد. از نظر تحلیلی، تحدب یک تابع دوبار متمایز با غیر منفی بودن (و در مورد تحدب شدید، مثبت بودن) مشتق دوم آن مطابقت دارد.

برای توابع مقعر، برای آنها نابرابری /(/4X1 +A.2X2) مخالف است Kf(xi) +)-اگر(x 2) (> با تقعر شدید)، و مشتق دوم / "(x)

ثابت شده است که یک تابع پیوسته و کاملا محدب در یک بازه بسته حداقل مقدار را فقط در یک نقطه از بازه می گیرد. اگر شچ، y) - عملکرد پیوستهپرداخت های بازیکن 1 در مربع واحد و به شدتدر امتداد محدب دربرای هر x، یک استراتژی خالص بهینه منحصر به فرد وجود دارد y=y° e برای بازیکن 2، قیمت بازی با فرمول تعیین می شود

و معنی y 0به عنوان جواب معادله زیر تعریف می شود:

اگر تابع شچ، y) در y کاملا محدب نیست، پس بازیکن 2 تنها استراتژی خالص بهینه را نخواهد داشت.

ویژگی متقارن برای توابع کاملا مقعر نیز صادق است. اگر تابع شچ، y) در هر دو آرگومان پیوسته و در x برای هر y کاملا مقعر است، سپس بازیکن 1 یک استراتژی بهینه منحصر به فرد دارد.

قیمت بازی با فرمول تعیین می شود

و استراتژی خالص بهینه x 0 بازیکن 1 از معادله تعیین می شود

بر اساس این ویژگی های بازی های مجموع صفر نامتناهی با توابع پرداخت محدب یا مقعر، یک طرح کلیراه حل چنین بازی هایی در مربع واحد (x e, y e). ما این طرح را فقط برای بازی های محدب ارائه می دهیم، زیرا برای بازی های مقعر متقارن است.

1. عملکرد را بررسی کنید شچ، y) برای تحدب در y (دومین مشتق جزئی باید بزرگتر یا مساوی 0 باشد).

2. y 0 را از رابطه تعیین کنید v-حداقل حداکثر خس، اوه)به عنوان معنی

که در آن حداقل حداکثر به دست می آید.

3- جواب معادله را بیابید v = U(x, y 0) و از راه حل های آن جفت بسازید Xو x 2،برای که

4. پارامتر را پیدا کنید الفاز معادله


پارامتر الفاستراتژی بهینه بازیکن 1 را تعیین می کند و معنای احتمال انتخاب استراتژی خالص خود را دارد x x.مقدار 1 - a به معنای احتمال انتخاب استراتژی خالص بازیکن 1 است x 2.

اجازه دهید از یک مثال برای نشان دادن استفاده از این طرح برای حل یک بازی از این نوع استفاده کنیم. اجازه دهید تابع پرداخت در یک بازی مجموع صفر نامتناهی بر روی یک مربع واحد داده شود و برابر باشد شچ، ی) = =(x - y) 2 = x 2 - 2 xy ch-y 2.

1. این تابع پیوسته در است Xو و بنابراین این بازی یک راه حل دارد. تابع خس، اوه)به شدت محدب در امتداد چون

بنابراین، بازیکن 2 تنها استراتژی بهینه خالص 0 را دارد.

2. داریم v= حداقل حداکثر (x - y) 2. برای تعیین حداکثر (x 2 - 2xy Ch-y 2)

اجازه دهید مشتقات جزئی اول و دوم تابع پرداخت را با توجه به x به صورت متوالی پیدا کنیم:

بنابراین تابع Uحداقل برای هر y در x=y دارد. این بدان معنی است که با افزایش xy - و حداکثر آن باید در یکی از آنها به دست آید نقاط افراطی x=0 یا x= 1. مقادیر تابع را تعیین کنید Uدر این نقاط:

سپس (x - y) 2 = max (y 2؛ 1 - 2y + y 2) را بررسی کنید. مقایسه "داخلی"

حداکثر در براکت های فرفری، دیدن آن آسان است در 2 > 1 - - 2y+y 2,اگر y >*/ 2 و y 2 1 - 2 y+y 2,اگر y "/ 2. این به وضوح توسط نمودار نشان داده شده است (شکل 2.5).


برنج. 2.5. ماکزیمم های داخلی تابع پرداخت U(x, y) = (x- در) 2

بنابراین، عبارت (x - y) 2اگر به حداکثر خود در x=0 می رسد y > 7 2، و در x= 1 اگر در U 2:

از این رو، v=دقیقه (دقیقه y 2؛ دقیقه (1 - سال) 2). هر یک از

حداقل صبح در رسیده است y=*/ 2 و مقدار Y 4 را می گیرد. بنابراین، قیمت بازی r = Y 4، و استراتژی بهینه بازیکن 2:

3. استراتژی بهینه بازیکن 1 را از معادله تعیین کنید U(x, y 0) = vآن ها برای این بازی (x - Y 2) 2 = Y 4. راه حل این معادله ARE X| = 0، x 2 = 1.

شرایط برای آنها فراهم است


4. اجازه دهید پارامتر a را تعیین کنیم، i.e. احتمال استفاده بازیکن 1 از استراتژی خالص خود X] = 0. اجازه دهید معادله a-1 + (1 - a) (-1) = 0 را ایجاد کنیم که از آن a = Y 2 است. بنابراین، استراتژی بهینه بازیکن 1 این است که استراتژی های خالص 0 و 1 خود را با احتمال انتخاب کند 1 / 2 هر کدام مشکل حل شده است.

مسئله تصمیم گیری در چارچوب رویکرد سیستمی شامل سه جزء اصلی است: سیستم، زیرسیستم کنترل و محیط را متمایز می کند. اکنون به بررسی مشکلات تصمیم گیری می پردازیم که در آن سیستم نه از یک، بلکه تحت تأثیر چندین زیرسیستم کنترلی است که هر کدام اهداف و امکانات عملی خاص خود را دارند. این رویکرد به تصمیم گیری، نظریه بازی نامیده می شود و مدل های ریاضیفعل و انفعالات مربوطه نامیده می شود بازی ها. با توجه به تفاوت در اهداف زیرسیستم های کنترل و همچنین محدودیت های خاص در امکان تبادل اطلاعات بین آنها، این تعاملات ماهیت تضاد دارند. بنابراین، هر بازی یک مدل ریاضی درگیری است. اجازه دهید خودمان را به موردی محدود کنیم که دو زیرسیستم کنترل وجود دارد. اگر اهداف سیستم ها مخالف باشند، تعارض را آنتاگونیستی و مدل ریاضی چنین تعارضی نامیده می شود. بازی متضاد..

در اصطلاح نظری بازی، زیرسیستم کنترل اول نامیده می شود بازیکن 1، زیر سیستم کنترل دوم - بازیکن 2، مجموعه ها

اقدامات جایگزین آنها نامیده می شود مجموعه ای از استراتژی هااین بازیکنان اجازه دهید X- استراتژی های زیادی برای بازیکن 1، Y- بسیاری از استراتژی ها

بازیکن 2. وضعیت سیستم به طور منحصر به فردی با انتخاب اقدامات کنترلی توسط زیرسیستم های 1 و 2، یعنی انتخاب استراتژی ها تعیین می شود.

xXو yY. اجازه دهید اف(x,y) - ارزیابی سودمندی برای بازیکن 1 آن ایالت

سیستمی که وقتی بازیکن 1 استراتژی را انتخاب می کند وارد آن می شود Xو

استراتژی بازیکن 2 در. شماره اف(x,y) نامیده می شود برنده شویدبازیکن 1 در موقعیت ( x,yو تابع اف- عملکرد پرداخت بازیکن 1. بردهای بازیکن

1 به طور همزمان از دست دادن بازیکن 2 است، یعنی ارزشی که بازیکن اول به دنبال افزایش و دومی کاهش آن است. این است

جلوه ای از ماهیت متضاد درگیری: منافع بازیکنان کاملاً متضاد است (آنچه را یکی می برد، دیگری از دست می دهد).

یک بازی متضاد به طور طبیعی توسط سیستم تعریف می شود G=(X، Y، F).

توجه داشته باشید که به طور رسمی بازی حاصل جمع صفر تقریباً به همان روشی که وظیفه تصمیم گیری در شرایط عدم اطمینان تنظیم می شود - اگر

شناسایی زیرسیستم کنترل 2 با محیط. تفاوت اساسی بین زیرسیستم کنترل و محیط در این است

رفتار اولی هدفمند است. اگر هنگام ترسیم یک مدل ریاضی از یک درگیری واقعی، دلیل (یا قصد) داشته باشیم که محیط را به عنوان دشمنی در نظر بگیریم که هدف آن آوردن

حداکثر آسیب را به ما وارد می کند، پس چنین وضعیتی را می توان در قالب یک بازی متضاد نشان داد. به عبارت دیگر، بازی حاصل جمع صفر را می توان به عنوان یک مورد شدید از ZPR در شرایط عدم قطعیت تفسیر کرد.


با برخورد با محیط به عنوان یک دشمن با هدف مشخص می شود. در عین حال باید انواع فرضیه ها را در مورد رفتار محیط محدود کنیم.


موجه ترین در اینجا فرضیه احتیاط شدید است، زمانی که هنگام تصمیم گیری، روی بدترین ها برای خود حساب می کنیم. گزینه ممکناقدامات زیست محیطی

تعریف.اگر Xو Yمتناهی هستند، پس بازی آنتاگونیستی را بازی ماتریسی می نامند. در یک بازی ماتریسی می توانیم این را فرض کنیم X={1,…,n},

Y={1,…,متر) و قرار دهید aij=F(من، ج). بنابراین، بازی ماتریس به طور کامل توسط ماتریس تعیین می شود A=(aij)، من=1,…,n، j=1,…,متر.

مثال 3.1. بازی دو انگشتی

دو نفر به طور همزمان یک یا دو انگشت را نشان می دهند و با شماره 1 یا 2 تماس می گیرند که به نظر گوینده به معنای عدد است.

انگشتان به دیگران نشان داده می شود پس از نمایش انگشتان و نامگذاری اعداد، برنده ها طبق قوانین زیر توزیع می شوند:

اگر هر دو حدس بزنند یا هر دو حدس نزنند که حریف چند انگشت نشان داده است، برد همه صفر است. اگر فقط یکی درست حدس بزند، حریف مقداری پول را به حدس‌زن می‌پردازد تعداد کلنشان داده شده است

این یک بازی ماتریس حاصل جمع صفر است. هر بازیکن چهار استراتژی دارد: 1- نشان دادن 1 انگشت و تماس 1، 2- نشان دادن 1 انگشت و تماس 2، 3-

2 انگشت را نشان دهید و با 1، 4 تماس بگیرید - 2 انگشت را نشان دهید و 2 را فراخوانی کنید. سپس ماتریس پرداخت A=(aij)، i= 1,…, 4، j= 1,…, 4 به صورت زیر تعریف شده است:

a12= 2, a21 = – 2، a13=a42=–3، a24=a31= 3, a34 = – 4، a43= 4,aij= 0 در سایر موارد

مثال 3.2. بازی از نوع دوئل گسسته.

مشکلات نوع دوئل، برای مثال، دعوای بین دو بازیکن را توصیف می کند.

هر کدام از آنها می خواهند اقدامی یکباره انجام دهند (آزاد کردن دسته ای از کالا به بازار، درخواست خرید در حراج) و زمانی را برای این کار انتخاب می کنند. از بازیکنان بخواهید به سمت یکدیگر حرکت کنند nمراحل پس از هر مرحله، بازیکن می تواند شلیک یا شلیک به دشمن را انتخاب کند. هر فرد فقط می تواند یک شات بزند. اعتقاد بر این است که احتمال ضربه زدن به دشمن در صورت پیشروی وجود دارد ک n=5 شکل دارد


به عنوان یک فرض اساسی در تئوری بازی، فرض بر این است که هر بازیکن تلاش می کند تا حداکثر برد ممکن را برای خود تحت هر اقدامی از طرف خود تضمین کند. فرض کنید یک بازی مجموع صفر محدود با ماتریس پرداخت بازیکن اول و بر این اساس، ماتریس بازده بازیکن دوم وجود دارد. اجازه دهید بازیکن 1 باور کند که هر استراتژی که انتخاب کند، بازیکن 2 استراتژی را انتخاب خواهد کرد که سود او را به حداکثر می رساند و در نتیجه بازده بازیکن 1 را به حداقل می رساند.

بنابراین بازیکن 1 انتخاب می کند من

بازیکن 2 همچنین تلاش می کند تا بدون توجه به استراتژی انتخابی حریف، بیشترین برد (یا به طور معادل، کمترین میزان باخت) را تضمین کند. استراتژی بهینه او ستون خواهد بود H 0با کمترین حداکثر پرداخت بنابراین بازیکن 2 انتخاب خواهد کرد jاستراتژی ام، که راه حلی برای مشکل است

در نتیجه، اگر بازیکن 1 از استراتژی انتخاب شده پیروی کند (نامیده می شود استراتژی حداکثر ، بازده او در هر صورت کمتر از مقدار حداکثر (نامیده می شود) خواهد بود "پایین قیمت بازی" ) یعنی

بر این اساس، اگر بازیکن 2 به استراتژی حداقلی خود پایبند باشد، ضرر او از حداکثر مقدار (به نام "قیمت برتر بازی" ) یعنی

در صورتی که قیمت بالای بازی برابر با قیمت پایین باشد، یعنی. = ، هر دو بازیکن پرداخت های تضمین شده و ارزش خود را دریافت می کنند h ij *تماس گرفت به قیمت بازی .

عنصر ماتریس h ijماتریس پرداخت مربوط به استراتژی ها نامیده می شود نقطه زینی ماتریس ن.

اگر هزینه بازی آنتاگونیستی 0 باشد، بازی نامیده می شود منصفانه .

یک بازی را در نظر بگیرید که در آن بازیکن 1 دارای دو استراتژی و بازیکن 2 دارای سه استراتژی است. ماتریس بازده بازیکن 1 به نظر می رسد:

نظر دهید . از آنجایی که ما نمونه ای از یک بازی حاصل جمع صفر را در نظر می گیریم، ماتریس بازده بازیکن 2 خواهد بود. N 2 = -H 1.

بازیکن 1 محاسبه می کند که اگر اولین استراتژی را انتخاب کند (یعنی ردیف اول ماتریس) H 1، سپس حریف استراتژی دوم خود (یعنی ستون دوم) را انتخاب می کند تا بازده برابر با 1 . اگر او استراتژی دوم را انتخاب کند، حریف می تواند استراتژی اول را انتخاب کند، بنابراین بازده برابر خواهد بود -1.

با تجزیه و تحلیل مقادیر به دست آمده: بازیکن 1 به اولین استراتژی خود می پردازد که حداکثر برد تضمین شده برابر با 1 را برای او فراهم می کند.

به همین ترتیب، بازیکن 2 بدترین گزینه های خود را زمانی در نظر می گیرد که حریف استراتژی اول یا دوم را انتخاب می کند، یا زمانی که حریف استراتژی دوم را زمانی که بازیکن 2 ستون سوم را انتخاب می کند، انتخاب می کند. این گزینه ها با حداکثر مقادیر ستون های 2، 1 و 6 مطابقت دارند.



با در نظر گرفتن حداقل مقادیر این حداکثرها، بازیکن 2 به استراتژی دوم خود می پردازد که در آن ضرر او حداقل و برابر است با:

در نتیجه، در این بازی انتخاب های مشترکی از استراتژی ها، آن ها وجود دارد. E

بنابراین، در این بازی منطقی است که انتظار داشته باشیم حریفان به استراتژی های انتخابی خود پایبند باشند. یک بازی متضاد ماتریسی که برای آن - به یک بازی کاملاً مشخص یا بازی که دارای راه حل در استراتژی های محض است گفته می شود.

با این حال، همه بازی‌های آنتاگونیستی ماتریسی به خوبی تعریف نشده‌اند.

بازی هایی که در آنها یک نابرابری شدید وجود دارد، بازی های ناقص تعیین شده (یا بازی هایی که راه حلی در استراتژی های محض ندارند) نامیده می شوند.

بیایید به نمونه ای از این بازی نگاه کنیم:

برای این بازی

در نتیجه، اگر بازیکنان از قوانین پیشنهاد شده در بالا پیروی کنند، بازیکن 1 استراتژی 1 را انتخاب می کند و انتظار دارد بازیکن 2 استراتژی 2 را انتخاب کند، جایی که باخت 2- است، در حالی که بازیکن 2 استراتژی 3 را انتخاب می کند و انتظار دارد بازیکن 1 استراتژی را انتخاب کند. 2 با بازده برابر 4.

با این حال، اگر بازیکن 2 استراتژی سوم خود را انتخاب کند، بازیکن 1 با انتخاب استراتژی دوم به جای استراتژی اول بهتر عمل خواهد کرد. به طور مشابه، اگر بازیکن 1 استراتژی اول را انتخاب کند، بازیکن 2 بهتر است استراتژی دوم را به جای سومین انتخاب کند. ظاهراً در بازی هایی از نوع یواشکی، اصل راه حل در استراتژی های خالص نامناسب می شود.

در موقعیت توصیف شده، برای بازیکنان مهم است که دشمن حدس نزند از چه استراتژی استفاده خواهد کرد. برای اجرای این طرح، بازیکنان باید از استراتژی به اصطلاح ترکیبی استفاده کنند.

اساساً، استراتژی ترکیبی یک بازیکن، طرحی برای انتخاب تصادفی یک استراتژی خالص است. از نظر ریاضی، می توان آن را به عنوان یک توزیع احتمال در مجموعه استراتژی های خالص یک بازیکن معین نشان داد. در نتیجه، بردار که مربوط به احتمال استفاده بازیکن 1 از استراتژی است و استراتژی ترکیبی این بازیکن را مشخص می کند. استراتژی ترکیبی بازیکن 2 نیز به همین ترتیب تعیین می شود .



ما فرض می کنیم که استفاده بازیکنان از استراتژی های ترکیبی خود مستقل است، به طوری که احتمال انتخاب بازیکن 1 آن استراتژی و انتخاب بازیکن 2 برابر است با . در این مورد پرداخت. با جمع بندی و، انتظارات ریاضی برنده های بازیکن 1 را می یابیم:

یا نماد ماتریسی

در مجموعه ای از استراتژی های مختلط، بازیکن 1 که به دنبال دستیابی به بزرگترین برد تضمین شده است، بردار احتمالات را انتخاب می کند تا حداکثر حداقل مقدار بردهای مورد انتظار را به دست آورد. مشکل را حل می کند:

.

به طور مشابه، هدف بازیکن 2 دستیابی به حداقل حداکثر مقادیر باخت خود است، یعنی. او مشکل را حل می کند

.

یک نتیجه اساسی از نظریه بازی ها به اصطلاح قضیه Minimax است که بیان می کند که مسائل فرمول بندی شده بازیکن 1 و بازیکن 2 همیشه راه حلی برای هر ماتریس پرداختی دارند و علاوه بر این، .

در مورد بازی های کاملاً تعریف شده، استراتژی بازیکن 1 نامیده می شود استراتژی ماکسمین ، استراتژی بازیکن 2 - استراتژی حداقل، ارزش - به قیمت بازی ; در موردی که بازی عادلانه نامیده می شود.

نتیجه آشکار قضیه Minimax این است که:

.

به این معنی که هیچ استراتژی بازیکن 1 به او اجازه نمی دهد تا مبلغی بیشتر از قیمت بازی را ببرد اگر بازیکن 2 استراتژی حداقلی خود را اعمال کند و هیچ استراتژی بازیکن 2 به او اجازه نمی دهد مبلغی کمتر از قیمت بازی را از دست بدهد. اگر بازیکن 1 استراتژی حداکثری خود را اعمال کند.

این موضوع در مورد استراتژی های خالص، به عنوان یک مورد خاص از استراتژی های ترکیبی، نیز صادق است. (زیرا استراتژی خالص، استراتژی مورد استفاده با احتمال 1 است): استفاده از هر استراتژی خالص، در صورتی که حریف از استراتژی بهینه خود استفاده کند، به شما اجازه نمی دهد که بیشتر از هزینه بازی برنده شوید (کمتر ببازید).

این واقعیت اغلب برای توسعه الگوریتم های خاص برای حل بازی های ماتریس متضاد استفاده می شود.

با افزایش تعداد استراتژی ها، محاسبه استراتژی های بهینه بسیار دشوارتر می شود. برای یافتن استراتژی های بهینه می توان از چندین رویکرد استفاده کرد.

برای کاهش ابعاد بازی از تسلط سطر و ستون استفاده می شود. معمولاً گفته می شود که ردیف هفتم یک ماتریس بر ردیف هفتم غالب است (یعنی یک ردیف خالص بر دیگری غالب است) اگر برای همه، حداقل یک.

به طور مشابه، اگر برای همه، حداقل یکی، ستون th بر ستون th غالب باشد.

نکته این تعریف این است که استراتژی غالب هرگز بدتر و در برخی موارد بهتر از استراتژی تحت سلطه نیست. از این رو، نتیجه مهم این است که بازیکن نیازی به استفاده از استراتژی تحت سلطه ندارد. این در عمل اجازه می دهد تا تمام سطرها و ستون های غالب را کنار بگذاریم، که باعث کاهش اندازه ماتریس می شود (توجه داشته باشید که این رویکرد می تواند هنگام جستجوی راه حل در استراتژی های خالص نیز استفاده شود).

مثال. بازی با ماتریس زیر را در نظر بگیرید:

← ردیف سوم این ماتریس بر ردیف دوم غالب است

حذف ردیف دوم منجر به یک ماتریس می شود: ستون سوم در این ماتریس بریده شده تحت سلطه دوم است و با حذف ستون دوم:

در نتیجه، اگر بتوان برای بازی حاصل راه‌حلی پیدا کرد، آنگاه می‌توان به راحتی با اختصاص صفر احتمالات به سطرها و ستون‌های حذف شده، برای حل بازی اصلی استفاده کرد.

روش دیگر ساده سازی ماتریس مبتنی بر ویژگی است که بر اساس آن یک تبدیل وابسته به ماتریس بازده (یعنی تبدیل همه عناصر ماتریس طبق قانون، جایی که) راه حل بازی را تغییر نمی دهد. علاوه بر این، قیمت بازی تبدیل شده را می توان با استفاده از همین قانون از قیمت بازی اصلی دریافت کرد: . این بدان معناست که در اصل برای وظیفه بازی، مهم نیست که بردها در چه واحدهایی اندازه گیری می شوند (به روبل یا دلار). همان مقدار بدون تغییر راه حل بازی.

از این ویژگی می‌توان برای ساده‌سازی و شفاف‌تر کردن ماتریس بازده استفاده کرد (استفاده از قیاس با عملیات روی ماتریس - ضرب یک ماتریس در یک عدد ثابت، جمع و تفریق ردیف‌ها، علاوه بر این، این ویژگی اجازه می‌دهد تا هر بازی حاصل جمع صفر ماتریسی ساخته شود. منصفانه است، برای این لازم است که بازی های قیمت را از تمام عناصر ماتریس بازده محاسبه کنیم).

علاوه بر این، می توان از آن استفاده کرد روش گرافیکیبرای حل بازی (و بازی ها به طور کلی یا ).

به عنوان مثال، ماتریس پرداخت به نظر می رسد: .

اجازه دهید بازیکن 1 اولین استراتژی خود را با احتمال و دومی خود را با احتمال انتخاب کند. اگر بازیکن 2 اولین استراتژی خود را انتخاب کند، آنگاه (از ستون اول ماتریس) انتظار برای بازیکن 1 خواهد بود. اگر بازیکن 2 استراتژی دوم خود را انتخاب کند، مطابق با ستون دوم ماتریس: .

هر یک از این معادلات را می توان به صورت گرافیکی با یک پاره خط مستقیم در ناحیه روی نمودار با مختصات و .

مقدمه

موقعیت های درگیری واقعی منجر به انواع مختلفبازی ها بازی‌ها از طرق مختلفی متفاوت هستند: بر اساس تعداد بازیکنان شرکت‌کننده در آنها، تعداد بازیکنان ممکن، تعداد استراتژی‌های ممکن، ماهیت روابط بین بازیکنان، ماهیت بردها، بر اساس نوع بازی‌ها. توابع برنده، با تعداد حرکات، ماهیت ارائه اطلاعات بازیکنان و غیره. d. بیایید انواع بازی ها را بسته به تقسیم بندی آنها در نظر بگیریم:

· با توجه به تعداد استراتژی ها، بازی ها به دو دسته تقسیم می شوند نهایی(هر بازیکن دارای تعداد محدودی از استراتژی های ممکن است) و بی پایان(جایی که حداقل یکی از بازیکنان تعداد نامحدودی استراتژی ممکن دارد).

· با توجه به ماهیت برد، بازی با مجموع صفر(کل سرمایه بازیکنان تغییر نمی کند، اما بسته به نتایج حاصله بین بازیکنان توزیع می شود) و بازی با مجموع غیر صفر.

· با توجه به نوع توابع، بردهای بازی به دو دسته تقسیم می شوند ماتریس (یک بازی محدود دو نفره با مجموع صفر است که در آن پاداش بازیکن داده می شود الفبه شکل ماتریس (یک ردیف از ماتریس با تعداد استراتژی استفاده شده بازیکن مطابقت دارد. در، ستون - تعداد استراتژی استفاده شده توسط بازیکن در; در تقاطع سطر و ستون ماتریس، سود بازیکن است الف، مطابق با استراتژی های اعمال شده است.

برای بازی های ماتریسی ثابت شده است که هر کدام از آنها راه حلی دارند و با کاهش بازی به یک مسئله برنامه نویسی خطی به راحتی می توان آن را پیدا کرد. دوماتریسبازی (این یک بازی متناهی از دو بازیکن با مجموع غیر صفر است که در آن سود هر بازیکن با ماتریس جداگانه برای بازیکن مربوطه داده می شود (در هر ماتریس یک ردیف با استراتژی بازیکن مطابقت دارد. الف، ستون – استراتژی های بازیکن در، در محل تقاطع سطر و ستون در ماتریس اول، سود بازیکن است الف، در ماتریس دوم - بردهای بازیکن در.

تئوری رفتار بهینه بازیکن نیز برای بازی‌های دوماتریکسی ایجاد شده است، اما حل چنین بازی‌هایی از بازی‌های ماتریسی معمولی دشوارتر است. مستمربازی ها ( مستمراین بازی در نظر گرفته می شود که در آن عملکرد بازده هر بازیکن بسته به استراتژی ها مستمر است. ثابت شده است که بازی های این کلاس دارای راه حل هستند، اما هیچ روش عملا قابل قبولی برای یافتن آنها ایجاد نشده است) و غیره.

روش های دیگری برای تقسیم بازی ها نیز امکان پذیر است. حال مستقیماً به موضوع تحقیق یعنی نظریه بازی ها برمی گردیم. ابتدا اجازه دهید این مفهوم را تعریف کنیم.

نظریه بازی - شاخه ای از ریاضیات که مدل های رسمی پذیرش را مطالعه می کند راه حل های بهینهدر شرایط درگیری در این حالت، تعارض به عنوان پدیده‌ای در نظر گرفته می‌شود که در آن طرف‌های مختلف با منافع و فرصت‌های مختلفی درگیر هستند تا اقداماتی را که در اختیار دارند، مطابق با این منافع انتخاب کنند افزایش به عدم قطعیت برعکس، عدم قطعیت در هنگام تصمیم گیری (به عنوان مثال، بر اساس داده های ناکافی) می تواند به عنوان تضاد بین موضوع تصمیم گیرنده و ماهیت تفسیر شود. بنابراین نظریه بازی ها نیز به عنوان نظریه تصمیم گیری بهینه در شرایط عدم قطعیت در نظر گرفته می شود. این به شما امکان می دهد برخی را سیستماتیک کنید جنبه های مهمتصمیم گیری در فناوری، کشاورزی، پزشکی و جامعه شناسی و سایر علوم. احزاب درگیر در یک درگیری، ائتلاف عمل نامیده می شوند. اقدامات در دسترس آنها - با استراتژی های آنها. نتایج احتمالی درگیری - موقعیت ها.

هدف نظریه این است که:

1) رفتار بهینه در بازی.

2) مطالعه خواص رفتار بهینه

3) تعیین شرایطی که در آن استفاده از آن معنادار است (مسائل وجود، منحصر به فرد بودن، و برای بازی های پویا، سؤالات سازگاری اسمی).

4) ساخت روش های عددی برای یافتن رفتار بهینه.

نظریه بازی که برای حل ریاضی مسائل با منشأ اقتصادی و اجتماعی ایجاد شده است، نمی تواند به طور کلی به نظریه های ریاضی کلاسیک ایجاد شده برای حل مسائل فیزیکی و فنی تقلیل یابد. با این حال، طیف گسترده ای از روش های ریاضی کلاسیک به طور گسترده در سؤالات خاص مختلف نظریه بازی ها استفاده می شود.

علاوه بر این، تئوری بازی ها به صورت درونی با تعدادی از رشته های ریاضی مرتبط است. در تئوری بازی ها، مفاهیم نظریه احتمال به صورت سیستماتیک و ماهوی مورد استفاده قرار می گیرد. در زبان تئوری بازی‌ها، اکثر مسائل آمار ریاضی قابل فرمول‌بندی است و از آنجایی که نظریه بازی‌ها با نظریه تصمیم‌گیری مرتبط است، ضروری تلقی می‌شود. جزءدستگاه ریاضی تحقیق در عملیات.

مفهوم ریاضی یک بازی به طور غیرعادی گسترده است. این شامل به اصطلاح بازی های سالن (شامل شطرنج، چکرز، GO، بازی با ورق، دومینو) است، اما همچنین می تواند برای توصیف مدل های یک سیستم اقتصادی با خریداران و فروشندگان متعدد در رقابت با یکدیگر استفاده شود. بدون پرداختن به جزئیات، بازی طرح کلیرا می توان به عنوان وضعیتی تعریف کرد که در آن یک یا چند نفر (بازیکنان) به طور مشترک مجموعه ای از متغیرها را کنترل می کنند و هر بازیکن باید هنگام تصمیم گیری، اقدامات کل گروه را در نظر بگیرد. "پرداخت" که به هر بازیکن می رسد نه تنها توسط اقدامات خود او، بلکه توسط اقدامات سایر اعضای گروه نیز تعیین می شود. برخی از "حرکات" (اقدامات فردی) در طول بازی ممکن است تصادفی باشند. یک مثال واضح، بازی معروف پوکر است: معامله اولیه کارت ها یک حرکت تصادفی است. توالی شرط ها و ضد شرط ها قبل از مقایسه نهایی ترفندها با حرکت های باقی مانده در بازی شکل می گیرد.

نظریه بازی های ریاضی با تجزیه و تحلیل ورزش، کارت و بازی های دیگر آغاز شد. آنها می گویند که کاشف نظریه بازی ها، ریاضیدان برجسته آمریکایی قرن بیستم است. جان فون نویمان در حین تماشای یک بازی پوکر، ایده های تئوری خود را مطرح کرد. نام "نظریه بازی" از اینجا می آید.

بیایید شروع به بررسی این موضوع کنیم تحلیل گذشته نگر توسعه نظریه بازی ها.اجازه دهید تاریخچه و توسعه موضوع نظریه بازی ها را در نظر بگیریم. به طور معمول، یک "درخت خانواده" به عنوان یک درخت در مفهوم نظریه گراف نشان داده می شود که در آن انشعاب از یک "ریشه" منفرد رخ می دهد. شجره نظریه بازی ها کتابی است از جی. فون نویمان و او. مورگنسترن. بنابراین، سیر تاریخی توسعه نظریه بازی ها به عنوان یک رشته ریاضی به طور طبیعی به سه مرحله تقسیم می شود:

مرحله اول- قبل از انتشار مونوگراف J. von Neumann و O. Morgenstern. می توان آن را "پیش تک نگاری" نامید. در این مرحله، بازی همچنان به عنوان یک رقابت خاص عمل می کند که با قوانین آن به صورت معنادار توصیف شده است. فقط در پایان آن، J. von Neumann ایده ای از بازی را به عنوان یک مدل کلی از تعارض انتزاعی توسعه می دهد. نتیجه این مرحله انباشت تعدادی از نتایج ریاضی خاص و حتی اصول فردی نظریه بازی های آینده بود.

مرحله دومخود تک نگاری J. von Neumann و

O. Morgenstern "نظریه بازی و رفتار اقتصادی" (1944)، که ترکیبی از اکثر نتایج به دست آمده قبلی (اما، با استانداردهای ریاضی مدرن، بسیار کمی) است. او اولین کسی بود که یک رویکرد ریاضی به بازی ها (هم به معنای عینی و هم انتزاعی کلمه) را در قالب یک نظریه سیستماتیک ارائه کرد.

در نهایت، در مرحله سومنظریه بازی ها در رویکرد خود به اشیاء مورد مطالعه تفاوت کمی با سایر شاخه های ریاضیات دارد و تا حد زیادی بر اساس قوانین مشترک آنها توسعه می یابد. البته در عین حال، ویژگی های کاربردی عملی آن، اعم از بالفعل و ممکن، تأثیر بسزایی در شکل گیری جهت ها در نظریه بازی ها دارد.

با این حال، حتی نظریه بازی های ریاضی نیز قادر به پیش بینی کامل نتیجه برخی از درگیری ها نیست. شناسایی سه دلیل اصلی برای عدم قطعیت نتیجه بازی (تعارض) به نظر می رسد.

اولاً، اینها بازی هایی هستند که در آنها فرصت واقعی برای مطالعه همه یا حداقل بیشتر انواع رفتار بازی وجود دارد که یکی از آنها صحیح ترین است و منجر به برنده شدن می شود. عدم قطعیت توسط تعداد قابل توجهی از گزینه ها ایجاد می شود، بنابراین همیشه نمی توان کاملاً همه گزینه ها را بررسی کرد (به عنوان مثال، بازی ژاپنی GO، چکرز روسی و بین المللی، برگردان انگلیسی).

ثانیاً تأثیر تصادفی عوامل در بازی توسط بازیکنان غیرقابل پیش بینی است. این عوامل تاثیر تعیین کننده ای در نتیجه بازی دارند و فقط تا حدودی می توانند توسط بازیکنان کنترل و تعیین شوند. نتیجه نهایی بازی فقط تا حدی کوچک و بسیار ناچیز توسط اقدامات خود بازیکنان تعیین می شود. بازی هایی که نتیجه آنها به دلایل تصادفی نامشخص است، قمار نامیده می شود. نتیجه بازی همیشه احتمالی یا حدسی است (رولت، تاس، پرتاب).

ثالثاً، عدم اطمینان ناشی از عدم اطلاع از استراتژی حریف بازی کننده است. ناآگاهی بازیکنان از رفتار حریف اساسی است و بر اساس قوانین بازی تعیین می شود. به این گونه بازی ها، بازی های استراتژیک می گویند.

نظریه بازی ها یکی از بخش های مهم تحقیق در عملیات است و نشان دهنده آن است مبانی نظریمدل‌های ریاضی برای تصمیم‌گیری بهینه در موقعیت‌های تعارض روابط بازار، که ماهیت یک مبارزه رقابتی دارند، که در آن یک طرف مقابل بر دیگری به قیمت ضرر طرف مقابل پیروز می‌شود. همراه با این وضعیت در داخل علم تحقیقات عملیاتی که فراهم می کند توضیحات ریاضیفرمول بندی وظایف مختلف تصمیم گیری، موقعیت های ریسک و عدم قطعیت در نظر گرفته می شود. در شرایط عدم قطعیت، احتمالات شرایط نامعلوم است و راهی برای به دست آوردن اطلاعات آماری اضافی در مورد آنها وجود ندارد. محیط پیرامون حل یک مسئله، که در شرایط خاصی خود را نشان می دهد، «طبیعت» و مدل های ریاضی مربوطه را «بازی با طبیعت» یا «نظریه بازی های آماری» می نامند. هدف اصلی تئوری بازی ها ایجاد توصیه هایی برای رفتار رضایت بخش بازیکنان در یک درگیری است، یعنی شناسایی یک "استراتژی بهینه" برای هر یک از آنها.