Lemke-Xovson algoritmi - Lemke–Howson algorithm

The Lemke-Xovson algoritmi[1] bu algoritm hisoblash a Nash muvozanati a bimatrix o'yini, uning ixtirochilari nomidan, Karlton E. Lemke va J. T. Xovson.U "Nash muvozanatini topish uchun kombinatorial algoritmlar orasida eng yaxshi tanilgan" deb aytiladi.[2]

Tavsif

Algoritmga kirish 2 o'yinchi o'yinidir G.G ikkitasi bilan ifodalanadi m × n mos ravishda 1 va 2-o'yinchilar uchun to'lovlarni o'z ichiga olgan A va B o'yin matritsalari m va n Keyingi barcha to'lovlar ijobiy deb hisoblaymiz. (Qayta tiklash orqali har qanday o'yinni ijobiy to'lovlar bilan strategik jihatdan teng o'yinga aylantirish mumkin.)

G ikkita mos keladi polytopes (deb nomlangan eng yaxshi javob beradigan politoplar) P1 va P2, yilda m o'lchamlari va n mos ravishda o'lchamlari, quyidagicha belgilanadi.

P1 ichida Rm; ruxsat bering {x1,...,xm} koordinatalarini belgilang.P1 bilan belgilanadi m tengsizlik xmen ≥ 0, barchasi uchun men ∈ {1,...,m} va boshqalar n tengsizliklar B1,jx1+ ... + Bm,jxm ≤ 1, hamma uchun j ∈ {1,...,n}.

P2 ichida Rn; ruxsat bering {xm+1,...,xm+n} koordinatalarini belgilang.P2 bilan belgilanadi n tengsizlik xm+men ≥ 0, barchasi uchun men ∈ {1,...,n} va boshqalar m tengsizliklar Amen,1xm+1+ ... + Amen,nxm+n ≤ 1, hamma uchun men ∈ {1,...,m}.

P1 1-o'yinchiga nisbatan normallashtirilmagan ehtimollik taqsimoti to'plamini ifodalaydim sof strategiyalar, masalan, 2-o'yinchining kutilgan to'lovi eng ko'p 1. Birinchisi m cheklovlar ehtimollarni benon-manfiyga, ikkinchisini talab qiladi n cheklovlar har birini talab qiladi n futbolchining sof strategiyalari 2 kutilgan natijani eng ko'p 1.P ga etkazishi kerak2 shunga o'xshash ma'noga ega, o'yinchilarning rollarini orqaga qaytaradi.

Har bir tepalik v P ning1 {1, ..., to'plamidagi yorliqlar to'plami bilan bog'liqm + n} quyidagicha men ∈ {1, ..., m}, tepalik v yorliqni oladi men agar xmen = 0 tepada v.Uchun j ∈ {1, ..., n}, tepalik v yorliqni oladi m + j agar B1,jx1 + ... + Bm,jxm = 1. Buni taxmin qilish P1 noaniq, har bir tepalikka to'g'ri keladi mtomonlari P1 va bor m yorliqlari.P ning tepasi bo'lgan kelib chiqishi1, {1, ..., yorliqlariga egam}.

Har bir tepalik w ning P2 {1, ..., to'plamidagi yorliqlar to'plami bilan bog'liqm + n} quyidagicha j ∈ {1, ..., n}, tepalik w yorliqni oladi m + j agar xm+j = 0 tepadaw.Uchun men ∈ {1, ..., m}, tepalik w yorliqni oladi men agarAmen,1xm+1 + ... + Amen,nxm+n = 1. P deb taxmin qilish2 noaniq, har bir tepalikka to'g'ri keladi nP. tomonlari2 va bor n yorliqlari.P ning tepasi bo'lgan kelib chiqishi2, yorliqlari bor {m + 1, ..., m + n}.

Ikki tepalikni ko'rib chiqing (v,w), v . P.1, w ∈ P2.Bu deymiz (v,w) to'liq yorliqli bilan bog'liq bo'lgan to'plamlar bo'lsa v va wbarcha yorliqlarni o'z ichiga oladi {1, ...,m + n}. E'tibor bering, agar v va w ning kelib chiqishi Rm va Rnnavbati bilan, keyin (v,w) to'liq yorliq bilan yozilgan.v,w) deyarli to'liq etiketlangan (ba'zi bir yo'qolgan yorliqqa nisbatan g) bilan bog'liq bo'lgan to'plamlar v va w{1, ...,m + n} dan boshqa g.Bu holda, u holda bo'ladi takroriy yorliq bu ikkalasi bilan bog'liqv va w.

A pivot ishlashi ba'zi juftlarni olishdan iborat (v,w) va almashtirish v bilan qo'shni somevertex bilan v P.da1, yoki muqobil ravishda almashtirish w bilan qo'shni somevertex bilan w P.da2. Bu ta'sir qiladi (agar shunday bo'lsa)v o'rniga ba'zi bir yorliqlarni almashtirish v Boshqa yorliq bilan.Orniga qo'yilgan yorliq deyiladi tushib ketdi. Ning har qanday yorlig'i berilgan v, bu tegni qo'shni tepalikka o'tish orqali tushirish mumkin v tarkibida ushbu yorliq bilan bog'langan giperplan mavjud emas.

Algoritm to'liq belgilangan juftlikdan boshlanadi (v,w) juftlikdan tashkil topgan. Ixtiyoriy yorliq g bizni deyarli to'liq etiketli juftlikka olib boruvchi pivot operatsiyasi orqali tashlanadi (v,w ′). Deyarli to'liq etiketlangan har qanday juftlik, takrorlangan yorliqning bir yoki boshqa nusxasini tashlab qo'yishga mos keladigan ikkita burilish operatsiyasini qabul qiladi va bu operatsiyalarning har biri deyarli deyarli to'liq etiketlangan juftlikka yoki to'liq etiketli juftlikka olib kelishi mumkin. Oxir oqibat algoritm to'liq nomlangan juftlikni topadi (v*,w*), bu kelib chiqishi emas. (v*,w*) har bir strategiyada bir nechta normallashmagan ehtimollik taqsimotiga to'g'ri keladi men 1-o'yinchining o'zi ushbu o'yinchi 1-ga to'laydi yoki 1-dan kam to'laydi va 0-ehtimollik bilan ushbu o'yinchi o'ynaydi (va shunga o'xshash kuzatuv forplayer 2-ga tegishli). Ushbu qiymatlarni ehtimollik taqsimotiga normalizatsiya qilishda bizda muvozanat muvozanati mavjud (uning futbolchilarga to'lovlari normallashtirish omillarining teskari tomonlari).

Xususiyatlari

Algoritm maksimal darajada topishi mumkin n + m turli xil Nesh muvozanatlari. Dastlab tushirilgan yorliqning har qanday tanlovi oxir-oqibat algoritm tomonidan topiladigan muvozanatni belgilaydi.

Lemke-Xovson algoritmi quyidagilarga teng homotopiya - asoslangan yondashuv. O'zgartirish G o'zboshimchalik bilan toza strategiyani tanlash orqali gva ushbu strategiyaga ega bo'lgan o'yinchiga katta to'lovni berish B uni o'ynash. O'zgartirilgan o'yinda bu strategiya g1 ehtimolligi bilan o'ynaladi va boshqa o'yinchi eng yaxshi javobini o'ynaydi g ehtimollik bilan 1. Undagi o'yinlarning davomiyligini ko'rib chiqing B doimiy ravishda 0 ga tushirildi. Nash muvozanati yo'li o'zgartirilgan o'yinning muvozanatini, muvozanat bilan bog'laydi. G.Toza strategiya g bonus olish uchun tanlangan B dastlab tushirilgan yorliqqa to'g'ri keladi.[3]

Algoritm amalda samarali bo'lsa-da, eng yomon holatda pivot operatsiyalari soni o'yindagi sof strategiyalar soniga nisbatan eksponent bo'lishi kerak.[4]Keyinchalik, bu shunday ekanligi ko'rsatildi PSPACE tugallandi Lemke-Xovson algoritmi yordamida olinadigan har qanday echimni topish.[5]

Adabiyotlar

  1. ^ C. E. Lemke va J. T. Xovson (1964). "Bimatrix o'yinlarining muvozanat nuqtalari". Amaliy matematika bo'yicha SIAM jurnali. 12 (2): 413–423. doi:10.1137/0112033.
  2. ^ Nison, Noam; Roughgarden, Tim; Tardos, Eva; Vazirani, Vijay V. (2007). Algoritmik o'yin nazariyasi (PDF). Kembrij, Buyuk Britaniya: Kembrij universiteti matbuoti. p. 33. ISBN  978-0-521-87282-9. Arxivlandi asl nusxasi (PDF) 2015-02-11.
  3. ^ P. J-J. Herings va R. Peeters (2010). "O'yin nazariyasida muvozanatni hisoblash uchun homopopiya usullari". Iqtisodiy nazariya. 42 (1): 119–156. doi:10.1007 / s00199-009-0441-5.
  4. ^ R. Savani va B. fon Stengel (2006). "Yechilishi qiyin bo'lgan bimatrix o'yinlari". Ekonometrika. 74 (2): 397–429. CiteSeerX  10.1.1.63.1548. doi:10.1111 / j.1468-0262.2006.00667.x.
  5. ^ P.W. Goldberg, C.H. Papadimitriou va R. Savani (2011). Homotopiya usulining murakkabligi, muvozanatni tanlash va Lemke-Xovson echimlari. Proc. 52-FOCS. 67-76 betlar. arXiv:1006.5352. doi:10.1109 / FOCS.2011.26.