Satunnaislukupokeriratkaisu
Säännöt
- Kahdelle pelaajalle annetaan kullekin satunnaisluku tasaisesta jakaumasta väliltä 0-1.
- Pelaaja 1 voi pitää oman numeronsa tai vaihtaa sen uuteen satunnaisnumeroon.
- Pelaaja 2, joka tietää pelaaja 1:n päätöksen, voi myös vaihtaa numeroa tai pysyä alkuperäisessä numerossaan.
- Korkeampi lopullinen numero voittaa.
Kysymykset
- Mikä on optimaalinen strategia kullekin pelaajalle?
- Olettaen, että molemmat pelaajat noudattavat optimaalista strategiaa, mikä on kummankin pelaajan voittotodennäköisyys?
Vastaukset
- Pelaajan 1 tulisi vaihtaa, jos pistemäärä on alle 0,567364, muuten hän jää.
- Jos pelaaja 1 vaihtaa, pelaajan 2 tulisi vaihtaa alle 0,5 pisteellä, muuten jäädä.
- Jos pelaaja 1 jää, pelaaja 2:n tulisi vaihtaa kättä alle 0,660951:llä, muuten jäädä.
- Pelaajan 1 voiton todennäköisyys = 0,494333.
- Todennäköisyys, että pelaaja 2 voittaa = 0,505667.
- Olettaen, että jokainen pelaaja panostaa yhden numeron, pelaajan 1 odotusarvo = -0,011333.
Ratkaisu
On selvää, että jos pelaaja 1 vaihtaa, niin pelaajan 2 pitäisi vaihtaa alle 0,5 pisteellä ja muuten jäädä odottamaan.Muussa tapauksessa pelaajan 1 pitäisi jäädä, jos hänen alkuperäinen numeronsa on tiettyä numeroa suurempi. Kutsutaan tätä numeroa x:ksi.
Jos pelaaja 1 jää, pelaaja 2 voi olettaa, että pelaajalla 1 on kohtuullinen numero. Pelaajan 2 on oltava aggressiivinen yrittääkseen voittaa sen. Hänen strategiansa tulisi olla vaihtaa korttia tietyn numeron, nimeltään y, yläpuolella, jos pelaaja 1 jää.
Tällaisten ongelmien ratkaisemiseksi sinun on ratkaistava nämä indifferenssipisteet x ja y. Teet tämän yhtäpitämällä seisomisen ja vaihtamisen odotusarvot.
Loppuosan tästä ratkaisusta lasken odotusarvon pelaajan 1 näkökulmasta olettaen, että molemmat pelaajat panostavat yhden yksikön kumpikin.
Ratkaistaan ensin x.
Odotusarvo seisomalla = y*(2x-1) - (1-y)
Odotusarvo osumalla = 0,5 * 0 + 0,25 * 0 + 0,25 * -1 = -0,25.
Seuraavaksi aseta nämä odotusarvot yhtä suuriksi toistensa kanssa:
y*(2x-1) - (1-y) = -0,25
2xy - y - 1 + y = -0,25
2xy - 1 = -0,25
2xy = 0,75
xy = 3/8
Seuraavaksi etsitään odotusarvo, jos pelaajalla 2 on y ja hän jää seisomaan pelaajan 1 jäätyä seisomaan:
(yx)/(1 - x) + (1 - y)/(1 - x) * -1 = (x - 2y + 1) / (x - 1)
Seuraavaksi etsitään odotusarvo, jos pelaajalla 2 on y ja hän lyö sen jälkeen, kun pelaaja 1 on jäänyt:
(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1 - x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x
Seuraavaksi aseta nämä odotusarvot yhtä suuriksi toistensa kanssa:
(x-2y+a) / (x-1) = -x
x^2 - 2y + 1 = 0
x^3 - 2xy + x = 0
Korvaa seuraavaksi xy arvolla 3/8.
x^3 + x - 0,75 = 0
4x^3 + 4x - 3 = 0.
Voit tässä vaiheessa käyttää kuutioyhtälön ratkaisijaa saadaksesi x = 0,567364.
Kun tiedät xy = 3/8, voit sijoittaa x:n yllä olevaan arvoon, jolloin saat y = 0,660951.
Sitten vain käydään läpi kaikki tavat, joilla kahdesta neljään numeroa voivat pudota, jotta saadaan kunkin pelaajan voittotodennäköisyys. Tämä voidaan tehdä geometrian tai differentiaali- ja integraalilaskennan avulla. Anteeksi, jos jätän tämän osan lukijan tehtäväksi. Tässä ovat vastaukset:
Pelaajan 1 voiton todennäköisyys = 0,494333.
Todennäköisyys, että pelaaja 2 voittaa = 0,505667.
Olettaen, että jokainen pelaaja panostaa yhden numeron, pelaajan 1 odotusarvo = -0,011333.
Niille teistä, joiden täytyy tietää tarkka vastauksen muoto:
Olkoon z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0,926962
Sitten x = z - 1/(3z) ~ 0,567364
Sitten y = 3/(8x) ~ 0,660951
Tällöin pelaajan 1 odotusarvo = 3x/8 + y(y-1) ~ -0.011333
Kiitos Joe Shipmanille ongelmasta.