Samouczek hazardzisty. Część 2: Anomalie i paradoksy

Część 1: Permutacje i kombinacje

Wielka kumulacja

Przyjrzyjmy się jeszcze raz wzorowi na prawdopodobieństwo k sukcesów w N prób Bernoulliego, gdy prawdopodobieństwo sukcesu wynosi p.

W naszym przykładzie mamy do czynienia z bardzo małym prawdopodobieństwem p ≈ 1/14 000 000, ale za to N jest liczbą bardzo dużą. Przyjęliśmy 1 400 000 jako typową liczbę zakładów biorących udział w pojedynczym losowaniu Lotto. Spróbujmy sprawdzić, co się stanie, jeśli nagle wyjątkowo duża liczba graczy ustawi się w kolejkach do kolektur. Taki wzrost zainteresowania jest charakterystyczny dla wielkich kumulacji, gdy przez pewien czas nikt nie zdobywa głównej wygranej i przeznaczone na nią pule przechodzą na kolejne losowania. Prawdopodobieństwo wygranej p pozostaje stałe i jednakowe dla każdego wyboru 6 różnych elementów z 49 (o ile maszyna losująca działa tak, jak powinna), natomiast rośnie potencjalna wysokość nagrody, a to może zwabić nawet ludzi, którzy nie grają w Lotto regularnie.

Przypuśćmy, że za przyczyną takiego chwilowego wzrostu zainteresowania w losowaniu bierze udział 14 milionów zakładów (odpowiada to mniej więcej połowie liczby dorosłych mieszkańców Polski).1 Prawdopodobieństwo p, jak już wiemy, pozostaje niezmienne, natomiast N jest teraz dziesięciokrotnie wyższe i wynosi 14 000 000. Tak się składa, a właściwie tak dobrałem liczby dla równego rachunku, że p = 1/N (poprzednio było p = 0,1/N). Nasz wzór wygląda teraz tak:

co dla k ⩾ 3 można zapisać:

Jeżeli k jest małe w porównaniu z N (na przykład nie przekracza 10, czyli jest ponad milion razy mniejsze niż N), to drugi występujący tu czynnik, czyli (1 – 1/N)Nk, jest niemal dokładnie równy (1 – 1/N)N (różnicy nie widać nawet na szóstym miejscu po przecinku), czyli prawie nie zależy od k. Wartość tego wyrażenia jest, jak już wiemy z poprzedniego odcinka, bardzo dobrym przybliżeniem następującej liczby:

e–1 = 1/e = 1/2,7182818… = 0,367879…

Przyjrzyjmy się teraz pierwszemu czynnikowi. Ile wynosi on dla kolejnych liczb k = 0, 1, 2, 3…?

Ponieważ N jest liczbą baaardzo dużą w porównaniu z jednością, możemy uznać wartości takie jak 1/N, 3/N, 2/N2 za niemal równe zeru. Wynika stąd, że:

P(0|N) ≈ e–1/0! = 0,367879…
P(1|N) ≈ e–1/1! = 0,367879…
P(2|N) ≈ e–1/2! = 0,183939…
P(3|N) ≈ e–1/3! = 0,061313…

Nietrudno sprawdzić, że ogólnie dla niewielkiego k mamy P(k|N) ≈ e–1/k!, a zatem:

P(4|N) ≈ e–1/4! = 0,015328…
P(5|N) ≈ e–1/5! = 0,003065…
P(6|N) ≈ e–1/6! = 0,000510…

Nie musimy się martwić o pogarszającą się wraz ze wzrostem k dokładność przybliżenia, bo kolejne prawdopodobieństwa i tak maleją bardzo szybko prawie do zera.

Co oznaczają te wyniki? Otóż kiedy liczba prób N jest równa odwrotności prawdopodobieństwa sukcesu p (a przy tym pierwsza z tych liczb jest bardzo duża, a druga bardzo mała), to prawdopodobieństwo wystąpienia zera sukcesów jest równe prawdopodobieństwu dokładnie jednego sukcesu. Każde z nich wynosi ok. 36,8%. Prawdopodobieństwo wystąpienia dokładnie dwóch sukcesów wynosi ok. 18,4%, trzech sukcesów – ok. 6,1%, czterech sukcesów – ok. 1,5%, pięciu – ok. 0,3% itd. W porównaniu z sytuacją, gdy liczba kuponów była równa 1 400 000, wydatnie wzrasta zarówno prawdopodobieństwo, że ktoś w ogóle zdobędzie główną wygraną (63,2%), jak i prawdopodobieństwo, że takich wygranych będzie więcej niż jedna (26,4%). W tym ostatnim przypadku główna wygrana zostaje podzielona pomiędzy dwóch lub więcej graczy.

Nadmiar zwycięzców

Widzimy jednak, że już możliwość jednoczesnego wystąpienia pięciu sukcesów jest mała nawet przy tak wielkiej liczbie grających. Dla każdej kolejnej liczby k maleje ona ok. k razy i dość szybko staje się astronomicznie mała. A jednak zdarzają się sytuacje takie jak 7 listopada tego roku, gdy aż 11 graczy trafiło szóstkę i musiało się podzielić skumulowaną wygraną. Zdarzały się zresztą większe liczby jednoczesnych zwycięzców. Jak to możliwe? Czyżbyśmy gdzieś popełnili gruby błąd w obliczeniach? Może maszyna losująca jest nieuczciwa? A może niektórzy gracze mają zdolności parapsychiczne?

Ostatnią możliwość możemy spokojnie wykluczyć. Gdyby istnieli prawdziwi jasnowidze, nie byłoby na świecie gier losowych, których organizatorzy robią dobry interes na ludzkiej skłonności do hazardu. Przypomnijmy sobie jednak, że obliczając prawdopodobieństwa wygranych, czyniliśmy pewne założenia, które być może rozmijają się z rzeczywistością. Uznaliśmy na przykład, że można modelować grę w Lotto jako proces Bernoulliego. W takim procesie każdy wybór gracza powinien być jednakowo prawdopodobny, a poszczególne próby powinny być od siebie niezależne. Czy tak jest w istocie?

Niekoniecznie, bo ludzie wyjątkowo słabo sprawdzają się w roli generatorów liczb losowych (czy raczej pseudolosowych) i nawet próbując wybierać 6 z 49 liczb „losowo”, mniej lub bardziej świadomie trzymają się jakiegoś schematu. Schemat nie musi być oczywisty, w rodzaju 4–9–16–25–36–49 albo 3–7–13–19–29–37. Na przykład unikanie liczb „okrągłych” albo próby „równomiernego” rozłożenia typowanych liczb na blankiecie to też są pewne schematy mające wpływ na prawdopodobieństwa wyboru.

W przypadku kumulacji nieco ponad połowa graczy (55,6% wg informacji Totalizatora Sportowego) stosuje metodę na chybił trafił (zdając się na propozycje generatora liczb losowych). Pozostali zwykle wolą samodzielnie zakreślać liczby. Wskutek tego ich wybory często układają się w jakiś mniej więcej regularny deseń. Gracz może bowiem wychodzić ze skądinąd słusznego założenia, że np. kombinacja 1–2–3–4–5–6 (często wybierana) ma takie samo prawdopodobieństwo wylosowania jak dowolna inna, powiedzmy 5–10–24–29–41–45. Tyle tylko, że na pomysł wybrania tej pierwszej kombinacji z całą pewnością w każdym losowaniu wpadają tysiące osób. Gdyby przypadkiem maszyna losująca wygenerowała akurat ten ciąg, okazałoby się, że pulę głównej nagrody trzeba podzielić na wielką liczbę niewielkich wypłat.

Ryc. 1.

W przypadku losowania z 7 listopada 11 osób niezależnie od siebie, ale podążając za strategią wyboru na tyle typową, że łatwo ją zrekonstruować, obstawiło sześć liczb jak na ryc. 1. Gracze poszli tu na łatwiznę, zaznaczając wszystkie pola pierwszej kolumny. Było ich pięć, musieli więc wybrać jeszcze jedną liczbę i zrobili to, kierując się umiłowaniem symetrii. Gdyby maszyna przypadkiem wylosowała liczby z ryc. 2, zapewne także każdy, kto je wytypował, musiałby się podzielić nagrodą ze sporym gronem współzwycięzców. Milionowa wygrana przeszłaby im wszystkim koło nosa.

Ryc. 2.

Wśród ok. 14 milionów możliwych kombinacji niewątpliwie istnieją tysiące takich, które ze względów czysto psychologicznych są statystycznie preferowane przez graczy. Zatem różne kombinacje wybierane są ze zróżnicowanym prawdopodobieństwem, co powoduje znaczne odchylenia od prostego modelu Bernoulliego. Nie da się w prosty sposób sformalizować wspomnianych preferencji, aby skorygować wynikające z nich skrzywienie, choć zapewne można badać ich wpływ na statystyki wygranych w symulacjach komputerowych. Sam fakt, że zdarzają się losowania z kilkunastoma „zwycięzcami”, dowodzi istnienia tego rodzaju zaburzeń.

Jeśli już jesteśmy na tyle nierozsądni, że nałogowo gramy w Lotto, to teoria gier powinna nas przynajmniej skłaniać do stosowania takiej strategii, która w przypadku sukcesu minimalizuje prawdopodobieństwo, że musimy się z kimś podzielić najwyższą wygraną. Rozsądne jest zatem obstawianie liczb na chybił trafił, tak aby wybór był nieodróżnialny od „czystej losowości” i dzięki temu maksymalnie niezależny od wyborów innych graczy. Przed chwilą skorzystałem z jednego w wielu dostępnych w internecie generatorów liczb (pseudo)losowych, aby wybrać kombinację niezależną od moich własnych subiektywnych skłonności. Rezultat widać na ryc. 3.

Ryc. 3.

Gdybym jednak zaprezentował mój „losowy” wybór publicznie, mogłoby się zdarzyć, że wiele osób niezależnie od siebie wpadłoby na pomysł skopiowania tej kombinacji („bo skoro autor twierdzi, że opłaca się typować takie liczby”…). Podobny efekt mogą mieć publikowane przez Totalizator Sportowy informacje o tym, jakie liczby najwięcej razy wypadały w dotychczasowych losowaniach albo jakie są najczęściej obstawiane. Rozważmy ekstremalną sytuację z roku 1994, gdy w jednym z losowań szóstkę trafiło jednocześnie aż 80 (słownie: osiemdziesiąt) osób. Zwycięska kombinacja wyglądała tak (kupon miał wtedy inną formę niż dziś):

Ryc. 4.

Nie wydaje się ona „wyróżniona psychologicznie” w żaden sposób. Narzuca się jednak podejrzenie graniczące z pewnością, że zwycięskie trafienia musiały mieć wspólną inspirację, gdyby bowiem spełniały warunki procesu Bernoulliego, prawdopodobieństwo losowej koincydencji byłoby nieodróżnialne od zera. Niestety Totalizator Sportowy nie archiwizował ówcześnie wyników w formie elektronicznej, brak więc potencjalnie istotnej informacji – na przykład o tym, czy zwycięzcy pochodzili z różnych części Polski, czy może grali w tej samej kolekturze. Według wielu doniesień gracze skopiowali jakiś przykład ilustrujący poprawny sposób skreślania typowanych liczb. Po trzydziestu latach trudno jednak zrekonstruować wszystkie okoliczności zaistniałej anomalii, a część powielanych publicznie plotek na ten temat zdążyła się przerodzić w legendę miejską.

Paradoks powtórzonej szóstki

Jeśli w danym losowaniu prawidłowo działająca maszyna wygenerowała szóstkę liczb, to prawdopodobieństwo, że ten sam wynik powtórzy się w kolejnym, jest oczywiście takie samo, jak prawdopodobieństwo trafienia szóstki przez gracza, czyli ok. 1/14 000 000. Przyjmując, że rocznie odbywa się w przybliżeniu 300 losowań, jakie są szanse, że te same liczby zostaną wylosowane ponownie co najmniej jeden raz w ciągu 10 lat, czyli w kolejnych trzech tysiącach losowań? Rachunek jest prosty. Wystarczy od jedności odjąć prawdopodobieństwo, że w 3000 niezależnych prób ani razu nie wystąpi dana kombinacja. W pojedynczym losowaniu prawdopodobieństwo jej niepojawienia się jest równe 1 – 1/14 000 000. Trzeba tę liczbę podnieść do potęgi 3000:2

(1 – 1/14 000 000)3000 = 0,99999992857…3000 = 0,9997857…

Zatem z prawdopodobieństwem 0,9997857… ≈ 99,98% upatrzona szóstka nie powtórzy się w sekwencji 3000 losowań. Natomiast prawdopodobieństwo jej ponownego wystąpienia jest równe 0,0002142… ≈ 0,02%. Jest ono zatem niewielkie. Mówimy jednak o powtórzeniu się pewnej konkretnej, z góry ustalonej kombinacji. A jakie jest prawdopodobieństwo, że w czasie 10 lat jakakolwiek kombinacja zostanie wylosowana dwukrotnie?

Jest to zagadnienie analogiczne do tzw. paradoksu urodzin: Dobieramy losowo grupę ludzi. Jak liczna powinna ona być, żeby z prawdopodobieństwem ponad 50% dwie osoby miały tę samą datę urodzin (dzień, miesiąc)? Okazuje się, że wystarczą 23 osoby. Dla 50 osób prawdopodobieństwo to wzrasta do 97%. Wydaje się to sprzeczne z intuicją, bo przecież dla daty zadanej z góry szansa, że ktokolwiek w grupie 50 osób ma tego dnia urodziny, wynosi ok. 1 – (1 – 1/365)50 = 0,12818…, czyli mniej więcej 12,8%.3 Wrażenie paradoksu znika jednak, gdy uświadomimy sobie, że spośród 50 osób można wybrać C(50, 2) =(50 · 49)/2 = 1225 różnych par, których daty urodzin porównujemy. Innymi słowy, liczba par branych pod uwagę jest ponad trzy razy większa niż liczba dni w roku.

W przypadku losowań Lotto (w okresie 10 lat) bierzemy pod uwagę C(3000, 2) = (3000 · 2999)/2 = 4 498 500 par losowań. Bez znaczącego uszczerbku dla precyzji oszacowania możemy tę liczbę zaokrąglić do 4,5 miliona. W każdej parze prawdopodobieństwo pełnej zgodności szóstek wynosi 1/14 000 000. Zatem prawdopodobieństwo, że wszystkie szóstki są różne, wynosi z zadowalającą dokładnością (1 – 1/14 000 000)4 500 000. Zamiast od razu uruchamiać kalkulator, zauważmy jeszcze (znając już właściwości funkcji ex), że:

(Oczywiście na samym końcu w nagrodę za cierpliwość wolno już użyć kalkulatora). Po odjęciu tej liczby od jedności dostajemy prawdopodobieństwo, że któryś z wyników losowania wystąpi dwa lub więcej razy: 1 – 0,725 = 0,275, czyli 27,5%. Tak jak w przypadku paradoksu urodzin, jest to prawdopodobieństwo znacznie wyższe, niż większość ludzi mogłaby intuicyjnie oczekiwać.

Ponieważ gry typu Lotto oparte na losowaniu 6 liczb zpośród 49 są popularne w wielu krajach poza Polską (m.in. w Niemczech, Hiszpanii, Bułgarii, Grecji czy Kanadzie), można się spodziewać, że na przestrzeni wielu lat już gdzieś musiało dojść do powtórki. I rzeczywiście takie przypadki odnotowano parokrotnie. Najbardziej spektakularnym przykładem powtórzonej szóstki była kombinacja 4–15–23–24–35–43, którą wylosowano dwukrotnie w bułgarskim Toto2 (6/49) – najpierw 6 września 2009 r. (niedziela), a następnie w kolejnym losowaniu, 10 września (czwartek). Przeprowadzone dochodzenie nie wykazało żadnych nieprawidłowości w działaniu maszyny losującej.4 Pikanterii dodaje temu przypadkowi następujący fakt: w pierwszym losowaniu nikt nie wygrał głównej nagrody; w drugim musiało się nią podzielić 18 zwycięzców. I to już na pewno nie był „cud statystyczny”, tylko konsekwencja faktu, że zawsze pewnej liczbie ludzi przyjdzie do głowy, by obstawić szczęśliwą szóstkę z poprzedniego losowania.

Przypisy

  1. Oczywiście jedna osoba może zawrzeć kilka zakładów, więc indywidualnych graczy nie musi być aż tak wielu. ↩︎
  2. Wynika to stąd, że wymnażamy przez siebie prawdopodobieństwa 3000 niezależnych, jednakowo prawdopodobnych zdarzeń. ↩︎
  3. Pomijamy drobne komplikacje, takie jak istnienie lat przestępnych. ↩︎
  4. Wylosowano zresztą różne permutacje tej szóstki, zob. BBC News. Uwaga: cytowane w artykule oszacowanie prawdopodobieństwa powtórki tego typu jest błędne (znacznie zaniżone). ↩︎

Samouczek hazardzisty. Część 1: Permutacje i kombinacje

Część 2: Anomalie i paradoksy

Permutacje, czyli karty w tas

Na ile sposobów można ułożyć w ciąg n różnych elementów? Na pewno było o tym w szkole, ale nie zawadzi odświeżyć sobie pamięć i na rozgrzewkę pogimnastykować mózg. Zaczynamy od pierwszej pozycji ciągu: ponieważ może ją zająć dowolny element, mamy n możliwości jej zapełnienia. Przechodzimy do pozycji drugiej. Jeden element już wykorzystaliśmy, więc liczba możliwych wyborów w tym przypadku jest mniejsza: n–1. Dla trzeciej pozycji będzie ich n–2 i tak dalej. Kiedy zapełnimy już wszystkie pozycje oprócz dwóch, zostają nam dwa elementy, czyli dwie możliwości wyboru dla przedostatniej pozycji. Tu kończy się wybór, bo ostatni element musi zająć ostatnie wolne miejsce.

Liczbę wszystkich możliwych ciągów złożonych z tych samych elementów, ale różniących się kolejnością (zwanych permutacjami)1 otrzymujemy, mnożąc liczby wyborów dla każdej pozycji:

n · (n–1) · (n–2) · … · 2 · 1,

albo (odwracając kolejność mnożenia):

1 · 2 · 3 · … · (n–1) · n.

Jest to zatem iloczyn wszystkich liczb od 1 do n. Nazywany go silnią i oznaczamy skrótowo tak:2

n!

Ponieważ zero elementów można ułożyć tylko na jeden sposób (jako ciąg pusty), przyjmujemy dodatkowo, że 0! = 1. Zauważmy, że dla każdej dodatniej liczby całkowitej n! = (n–1)! · n.

Wartość silni rośnie bardzo szybko wraz ze wzrostem n. Pięć elementów można ułożyć na 1 · 2 · 3 · 4 · 5 = 120 różnych sposobów, ale liczba permutacji dziesięciu elementów wynosi już 10! = 3 628 800 (ponad trzy i pół miliona). Tasując talię zawierającą 52 karty, otrzymujemy jedną z około 80 undecylionów, czyli 80 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 możliwych permutacji.3 Jest to kilkakrotnie więcej niż szacowana liczba atomów w naszej Galaktyce (Drodze Mlecznej). Dużo, ale przyzwyczajajmy się do dużych liczb.

Najważniejsze pytanie kombinatoryki

Zastanówmy się teraz, na ile różnych sposobów można wybrać k elementów ze zbioru n-elementowego. Oznaczmy tę liczbę jako C(n, k). Jest to tak zwana liczba kombinacji bez powtórzeń z n elementów po k, a skrótowo „n po k” lub „n nad k”. Zwróćmy uwagę, że wybór k elementów jest równoważny podzieleniu zbioru na dwa podzbiory zawierające odpowiednio k i nk elementów. Pierwszy z nich można ułożyć w ciąg na k! sposobów, a drugi na (nk)! sposobów. Oba ciągi można ustawić obok siebie i połączyć w jeden, złożony z n elementów. Dla każdego spośród takich podziałów – a jest ich łącznie C(n, k) – istnieje k!(nk)! połączonych ciągów n-elementowych. Ile jest ich w sumie dla wszystkich możliwych podziałów na k i nk elementów? Oczywiście tyle samo, co wszystkich permutacji n elementów, bo każda taka permutacja odpowiada unikatowemu połączeniu pewnej pary permutacji k elementów wybranych i nk pozostałych. Stąd wynika, że

C(n, k) · k!(nk)! = n!

I oto już wiemy, jak obliczyć liczbę możliwych wyborów k spośród n elementów:

C(n, k) = n!/k!(nk)!

Żeby nie mnożyć nawiasów ponad potrzebę, przyjmijmy konwencję, że najpierw wykonujemy mnożenie zapisane bez znaku działania, czyli n!(nk)!, a dopiero potem dzielenie zapisane przy użyciu ukośnika.4

Notacja C(n, k) jest trochę toporna w porównaniu z powszechnie używanym profesjonalnym zapisem „n nad k”:

Zapis ten zwany jest po polsku symbolem Newtona, choć wprowadził go Andreas von Ettingshausen w 1826 r. (99 lat po śmierci sir Isaaca). Będziemy jednak chwilami używać zamiennie także mniej eleganckiej notacji C(n, k) zwłaszcza wówczas, gdy trzeba zapisać wyrażenie matematyczne w jednej linii tekstu.

Co wykombinował Pascal

Liczbę kombinacji z n po k potrafił obliczyć już sławny matematyk indyjski z XII w., Bhāskara II. Natomiast w połowie XVII w. Blaise Pascal poświęcił liczbom C(n, k) rozprawę, pokazując, że układają się one w piękny schemat zwany odtąd trójkątem Pascala. Wygląda on tak:

Trójkąt Pascala.

Wzdłuż dwóch boków trójkąta widnieją same jedynki, a każda liczba wewnątrz trójkąta jest sumą dwóch liczb położonych tuż nad nią (na lewo i na prawo) w poprzednim rzędzie. Rząd oznaczony numerem n zawiera liczby C(n, 0), C(n, 1), C(n, 2) itd. aż do C(n, n–1), C(n, n). Łatwo policzyć, że jest ich łącznie n+1.

Sprawdźmy, czy to działa. Na ile sposobów można wybrać trzy elementy spośród ośmiu?

C(8, 3) = 8!/(3! · 5!)
= 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8/(1 · 2 · 3)(1 · 2 · 3 · 4 · 5)
= 6 · 7 · 8/(2 · 3)
= 7 · 8
= 56.

Jak to w matematyce – wszystko się zgadza: na czwartej pozycji w rzędzie nr 8, odpowiadającej C(8, 3), odnajdujemy liczbę 56.

Trójkąt Pascala można łatwo rozbudowywać, dodając kolejne, coraz dłuższe rzędy. Zarówno sam trójkąt, jak i liczby C(n, k) mają wiele ciekawych właściwości, z których szczególnie ważna jest następująca: wyrażenie a + b podniesione do potęgi n można zapisać w postaci następującej sumy (pamiętając, że a0 = 1, a a1 = a):

Jest to niezwykle użyteczny w zastosowaniach rachunkowych wzór dwumianowy Newtona; liczby C(n, k) nazywane są współczynnikami dwumianowymi. Na pewno każdy pamięta następujący prosty przypadek (dla n = 2):

(a + b)2 = a2 + 2ab + b2,

ale korzystając z kolejnych rzędów trójkąta Pascala, otrzymujemy także na przykład (dla n = 8):

(a + b)8 = a8 + 8a7b + 28a6b2 + 56a5b3 + 70a4b4
+ 56a3b5 + 28a2b6 + 8ab7 + b8.

Na pewno zauważyliście, że trójkąt Pascala jest symetryczny. Każdy rząd czytany od końca wygląda tak samo jak czytany od początku. Nie ma w tym nic dziwnego, bo jak łatwo sprawdzić, C(n, k) = C(n, nk). Przecież wybór k elementów spośród n jest równoważny wyborowi nk elementów „do odrzucenia”. Liczba kombinacji z 8 elementów po 3 jest zatem dokładnie taka sama jak liczba kombinacji z 8 elementów po 5.

Szansa na milion

Uzbrojeni w znajomość permutacji, silni i kombinacji bez powtórzeń możemy teraz zaatakować następujący problem: na ile sposobów można wybrać sześć różnych elementów ze zbioru 49-elementowego? Trudno byłoby rozpisywać trójkąt Pascala aż do rzędu nr 49 (potrzebna byłaby duża kartka papieru i trochę czasu poświęconego na dodawanie coraz dłuższych liczb), ale możemy skorzystać wprost ze znanego już wzoru:

C(49, 6) = 49!/(6! · 43!)

Zauważmy, że 49! = 43! · 44 · 45 · 46 · 47 · 48 · 49, możemy więc uprościć licznik i mianownik ułamka, dzieląc oba z nich przez 43!:

C(49, 6) = 44 · 45 · 46 · 47 · 48 · 49/6!
= 44 · 45 · 46 · 47 · 48 · 49/(1 · 2 · 3 · 4 · 5 · 6).

Kontynuując upraszczanie, dopóki nie pozbędziemy się wszystkich liczb w mianowniku, dostajemy w końcu:

C(49, 6) = 44 · 3 · 46 · 47 · 49 = 13 983 816.

Taka jest właśnie liczba kombinacji bez powtórzeń sześciu elementów wybieranych spośród czterdziestu dziewięciu. Czy te liczby brzmią znajomo? Tak jest! – mówimy o liczbie możliwych wyników losowania Lotto lub Lotto Plus (zasady obu są takie same). Zakładając, że maszyna losująca jest neutralna, czyli każdy wynik jest jednakowo prawdopodobny, stwierdzamy, że szansa na szczęśliwe wylosowanie zwycięskiej szóstki wynosi 1/13 983 816 czyli 0,0000000715…

Blankiet z zakładami Lotto.

Kilka założeń upraszczających

Tu dokonamy drobnego zaokrąglenia: z dokładnością do promila prawdopodobieństwo trafienia szóstki w Lotto wynosi jeden do czternastu milionów. Na ogół uważamy, że prawdopodobieństwo tego rzędu oznacza coś niemożliwego; niemniej jednak ktoś przecież od czasu do czasu trafia szóstkę. Rzecz w tym, że nawet zjawiska bardzo mało prawdopodobne zdarzają się regularnie przy odpowiednio dużej liczbie prób. Jeśli organizator Lotto sprzeda odpowiednio wielką liczbę kuponów, to szansa, że co najmniej jeden z nich okaże się zwycięski, staje się całkiem realna (jak niebawem się przekonamy).

Co tam zresztą Lotto! Fizycy badający zderzenia protonów o wielkiej energii poszukują oddziaływań zachodzących z prawdopodobieństwem rzędu jeden do stu bilionów (na przykład jednoczesnego wygenerowania trzech ciężkich bozonów cechowania, WWW lub WWZ). I nie chodzi tylko o to, żeby taki proces uchwycić raz, ale żeby obserwacje powtórzyły się, zapewniając wysoki poziom istotności statystycznej wyników (co praktycznie wyklucza błąd pomiaru lub interpretacji danych). Właśnie dlatego w Wielkim Zderzaczu Hadronów (LHC) detektory poszukują takich ultrarzadkich (prawie niemożliwych) zjawisk wśród biliardów rejestrowanych zderzeń.

Liczba grających w Lotto i Lotto Plus waha się w szerokich granicach, ale ponieważ nie chodzi nam tu o realistyczne modelowanie prawdziwej gry, tylko o zilustrowanie jej podstaw matematycznych, poczynimy kolejne założenie upraszczające. Przyjmijmy, że w pojedynczym losowaniu bierze udział średnio 1,4 mln zakładów. Tygodniowo odbywa się po sześć losowań. Rocznie jest ich zatem nieco ponad trzysta, czyli grający podejmują ok. 420 mln prób trafienia szóstki. Jeżeli prawdopodobieństwo wygranej wynosi 1/14 000 000, to można się spodziewać przeciętnie 30 takich trafień rocznie. Zgadza się to w granicach rozsądku ze stanem faktycznym.

Wypełnianie kuponów, czyli próby Bernoulliego

Czym jest Lotto (Plus) z matematycznego punktu widzenia? Czymś, co nazywamy uczenie procesem Bernoulliego, czyli ciągiem niezależnych prób Bernoulliego – eksperymentów losowych, w których prawdopodobieństwo sukcesu jest stałe i wynosi p ≈ 1/14 000 000, a prawdopodobieństwo niepowodzenia q = 1 – p ≈ 13 999 999/14 000 000 = 0,99999992857…5 Pojedyncze losowanie to ok. 1 400 000 takich prób. Oznaczmy tę liczbę symbolem N. W naszym przykładzie tak się składa, że p = 0,1/N, a q = 1 – 0,1/N.

Jakie jest prawdopodobieństwo, że nikt nie trafi szóstki? Ponieważ próby są niezależne, wystarczy przemnożyć przez siebie prawdopodobieństwa porażki dla każdej z nich. Wychodzi (1 – 0,1/N)N. Oznaczmy sobie tę wartość symbolem P(0|N), czyli prawdopodobieństwo 0 sukcesów w N próbach.

Tak się składa, że kiedy n dąży do nieskończoności, to wartość wyrażenia (1 + 1/n)n dąży do liczby e, czyli sławnej stałej Eulera. Zapisujemy to tak:

limn → ∞ (1 + 1/n)n = e = 2,71828…

Jest to liczba niewymierna, jedna z najważniejszych stałych w całej matematyce. Oprócz zera i jedności tylko liczba π może się z nią od biedy równać. Wyskakuje ona jak diabełek z pudełka w tak wielu sytuacjach, że nie powinniśmy się dziwić jej pojawieniu się także tutaj. Dla dowolnej liczby rzeczywistej x prawdziwa jest również następująca tożsamość:

limn → ∞ (1 + x/n)n = ex.

Dla dużych wartości n wyrażenie (1 + x/n)n jest niemal dokładnie równe ex, a zgodzimy się chyba, że N = 1 400 000 to liczba duża (choć jak każdej liczbie, daleko jej do prawdziwej nieskończoności). W rozważanym tu przypadku x = –0,1, a zatem prawdopodobieństwo, że w danym losowaniu nikt nie trafi szóstki, wynosi z bardzo dobrą dokładnością e−0,1. Sięgamy po kalkulator i przekonujemy się, że P(0|N) ≈ e−0,1 = 0,904837…

A jakie jest prawdopodobieństwo, że wypadnie dokładnie jedna szóstka? Spójrzmy na cały ciąg prób składających się na jedno losowanie. Jest ich N. Zwycięski zakład można zatem wybrać na N sposobów. Prawdopodobieństwo sukcesu wybranego zakładu wynosi p = 0,1/N, a prawdopodobieństwo jednoczesnej porażki wszyskich N – 1 pozostałych wynosi qN–1 = (1 – 0,1/N)N–1. Możemy więc obliczyć prawdopodobieństwo wystąpienia dokładnie 1 sukcesu w N próbach:

Dla wielkich liczb N i N–1 to „prawie tyle samo”, a więc możemy przyjąć, że P(1|N) ≈ 0,1 e–0,1 = 0,090483… (z dokładnością do szóstego miejsca po przecinku). Warto zwrócić uwagę, że P(0|N) + P(1|N) = 0,995321…, czyli oba prawdopodobieństwa nie sumują się do jedności. Pozostaje niewielka reszta wynosząca 0,004678… ≈ 1/214.

Co to oznacza? Ano, to, że w pojedynczym losowaniu z prawdopodobieństwem ok. 90,5% żaden gracz nie wygra głównej nagrody. Z prawdopodobieństwem ok. 9% zwycięzca będzie dokładnie jeden. Z prawdopodobieństwem ok. 0,5% zdarzą się co najmniej dwa trafienia szóstki. To niby niedużo, ale jeśli rocznie odbywa się ponad 300 losowań, to można oczekiwać, że średnio jeden lub dwa razy w roku w jednym losowaniu wygrają dwa zakłady lub większa ich liczba.

Gramy dalej

Jak obliczyć ogólnie P(k|n), czyli prawdopodobieństwo uzyskania dokładnie k sukcesów w n próbach Bernoulliego? Jeśli się zastanowić, to nie jest to wcale trudne. Dla każdej pojedynczej kombinacji k elementów wybranych spośród n prawdopodobieństwo niezależnego wystąpienia k sukcesów i nk porażek (o prawdopodobieństwach odpowiednio p i q) jest następującym iloczynem:

pkqnk = pk(1 – p)nk.

Takich cząstkowych prawdopodobieństw trzeba zsumować tyle, ile jest kombinacji z n po k, czyli C(n, k). Ostatecznie zatem:

Dla k = 0 mamy C(n, 0) = 1 (dla dowolnego n, patrz trójkąt Pascala), stąd P(0|n) = (1 – p)n. Dla k = 1 mamy C(n, 1) = n!/(n -1)! = n, dlatego P(1|n) = np(1 – p)n–1. Oba wzory właściwie już wyprowadziliśmy powyżej innym sposobem.

A ile wynosi P(2|N), czyli prawdopodobieństwo dwóch trafień szóstki w jednym losowaniu?

C(n, 2) = n!/2!(n–2)! = (n–1)n/2,

a zatem:

W naszym przykładzie p = 0,1/N, czyli p2 = 0,01/N²; zauważmy ponadto, że wyrażenie (1 – 0,1/N)N–2 dla bardzo dużego N nadal wynosi z dużą dokładnością e−0,1 = 0,904837… Uwzględniwszy to wszystko, otrzymamy następującą wartość:

Mówiąc po ludzku, przy przyjętych przez nas założeniach średnio raz na 221 losowań (to jest przynajmniej raz w roku) można się spodziewać dwu głównych wygranych w jednym losowaniu. Suma P(0|N) + P(1|N) + P(2|N) wynosi 0,999845…, czyli nadal jest różna od 1. Pozostaje reszta równa 0,00015465… ≈ 1/6466. Oznacza ona prawdopodobieństwo, że jednocześnie padną co najmniej trzy główne wygrane. Przy naszych założeniach można oczekiwać takiego cudu raz na ok. 20 lat.

Chyba wystarczy tych rachunków jak na jeden wpis. W drugiej części miniserii sprawdzimy, jak zmieniają się szanse trafienia jednej, dwóch lub większej liczby szóstek w zależności od liczby grających. Zastanowimy się także, co sądzić o przypadkach, gdy podejrzanie duża liczba graczy jednocześnie trafia zwycięską kombinację. Czy oznacza to, że ktoś gdzieś dopuścił się nieuczciwości? A może matematyka jest do kitu? Cóż, zobaczymy.

Przypisy

  1. Permutacją nazywamy zarówno operację polegającą na zmianie kolejności elementów uporządkowanych w ciąg, jak i dowolny wynik takiej operacji. ↩︎
  2. Czytaj: „n silnia″. ↩︎
  3. Undecylion to 1066, czyli jedynka i sześćdziesiąt sześć zer. ↩︎
  4. Krótko mówiąc, zapis a/bc traktuję jako równoważny a/(bc), a nie (a/b)c. ↩︎
  5. Wygraną inną niż I stopnia traktujemy dla uproszczenia jako niepowodzenie. A czy poszczególne próby są naprawdę niezależne, zobaczymy w drugim odcinku. ↩︎