Labirynt ewolucji. Część 2: Allele na łasce dryfu

Inne części tego cyklu:
1. Gatunek jako pojęcie nieostre
3. Czy goryl obalił Darwina?
4. Gatunek patchworkowy

Odrobina matematyki (tylko tyle, ile trzeba)

Ponieważ pojęcie losowego dryfu genetycznego będzie przydatne to i ówdzie w dalszych częściach cyklu, warto zrozumieć, na czym polega to zjawisko, pomijane często przy popularnym omawianiu zagadnień ewolucji. Nie da się tego zrobić bez krótkiego wstępu matematycznego. Postaram się, żeby nie był zbyt zawiły. Na szczęście nie wszystkie szczegóły techniczne muszą nas obchodzić (choć oczywiście bardzo obchodzą specjalistów od genetyki populacyjnej).

Wyobraźmy sobie, że mamy populację n bakterii nie różniących się między sobą niczym prócz tego, że jeden z ich genów (A) ma dwa współistniejące warianty (allele): A1 i A2. Przypuśćmy, że żaden z tych wariantów nie daje swoim nosicielkom przewagi ewolucyjnej, czyli że sukces reprodukcyjny pojedynczej bakterii nie zależy od tego, czy posiada ona A1, czy A2. Co pewien czas bakterie ulegają podziałom, ale odnawialne zasoby ich środowiska pozwalają na przeżycie tylko n osobników, toteż z pokolenia na pokolenie część młodych bakterii losowo ginie (z przyczyn niezależnych od ich wyposażenia genetycznego). W pierwszym pokoleniu i osobników posiada wariant A1, a n – i wariant A2. Jest to tzw. model Wrighta−Fishera (nazwany na cześć Amerykanina Sewalla Wrighta i Brytyjczyka Ronalda Fishera, którzy analizowali go niezależnie od siebie około roku 1930).

Jakie jest prawdopodobieństwo, że w drugim pokoleniu liczby te będą wynosiły odpowiednio x i n – x? Ze względu na symetrię sytuacji każda kopia genu A w drugim pokoleniu (a jest ich w sumie n) może z jednakowym prawdopodobieństwem pochodzić od dowolnego osobnika z poprzedniego pokolenia. Sytuację tę opisuje znany zapewne wielu Czytelnikom rozkład dwumianowy, opisującym prawdopodobieństwo x „sukcesów” (i oczywiście n – x „porażek”) w n próbach, z których każda ma prawdopodobieństwo sukcesu p = i/n (bo taka jest względna częstość występowania A1 w poprzednim pokoleniu). Być może pamiętacie wzór (1) na prawdopodobieństwo uzyskania dokładnie x sukcesów, wyprowadzony przez Jacoba Bernoulliego:

  1. P(x) = C(n, x) px (1 – p)n x

gdzie C(n, x) oznacza współczynnik dwumianowy Newtona (równy liczbie sposobów, na jaki można wybrać x elementów ze zbioru n-elementowego):

  1. C(n, x) = n!/(x! (nx)!)

Właściwie powinniśmy we wzorze 1 zapisać P(x) jako P(x|i), bo mówimy o prawdopodobieństwie warunkowym, czyli prawdopodobieństwie, że w danym pokoleniu będzie x kopii wariantu A1, jeżeli w poprzednim pokoleniu było ich i. Przypuśćmy, że n = 20 i że w pierwszym pokoleniu jest tyle samo kopii A1 i A2 (po 10). Jakie jest prawdopodobieństwo, że częstość występowania obu alleli pozostanie identyczna w drugim pokoleniu? Ponieważ p = 10/20 = 0,5, odpowiada to dokładnie prawdopodobieństwu, że w 20 rzutach uczciwie wyważoną monetą monetą wypadnie 10 orłów i 10 reszek:

  1. P(10|10) = C(20, 10) × 0,510 × 0,510 = 0,1762…

Z prawdopodobieństwem ok. 0,5 (pięćdziesięcioprocentowym) x mieści się w zakresie 10 ± 1 (czyli wynosi 9, 10 lub 11). Ale ponieważ mamy do czynienia z procesem losowym (stochastycznym), x może równie dobrze przyjąć jakąś inną wartość całkowitą z przedziału od 0 do 20. Co prawda dla wartości x oddalających się od 10 prawdopodobieństwo P(x|10) dość szybko spada. Nie jest rzeczą absolutnie niemożliwą, żeby wariant A1 z przyczyn czysto losowych znikł z populacji już w drugim pokoleniu, ale prawdopodobieństwo takiego zdarzenia wynosi zaledwie

  1. P(0|10) = C(20, 0) × 0,50 × 0,520 = 1 × 1 × 0,520 = 0,00000095…

czyli około jednej milionowej (aczkolwiek pamiętajmy, że ktoś jednak wygrywa szóstkę w totolotka, gdzie szansa na wygraną jest jeszcze 14 razy mniejsza). Ryc. 1 pokazuje rozkład prawdopodobieństwa dla różnych wartości 0 ≤ x ≤ 20.

Ryc. 1.

Jeżeli początkowa częstość występowania A1 wynosi 10% (czyli dwie bakterie są nosicielkami allelu A1, a pozostałe 18 to nosicielki A2), to rozkład P(x|2) wygląda jak na ryc. 2, a prawdopodobieństwo zniknięcia allelu 2 w drugim pokoleniu jest już o wiele wyższe: wynosi P(0|2), czyli 0,12158…

Ryc. 2.

Utrwal się lub zgiń

Istotne jest to, że mamy do czynienia z procesem, który z przyczyn niezależnych od cech genetycznych bakterii powoduje losowe zmiany częstości występowania alleli z pokolenia na pokolenie. Zauważmy, że rozkład prawdopodobieństwa dla trzeciego pokolenia zależy wyłącznie od tego, jaka była częstość allelu A1 w drugim pokoleniu; rozkład dla czwartego pokolenia zależy od częstości występowania A1 w trzecim pokoleniu i tak dalej. Taki ciąg zdarzeń, w którym prawdopodobieństwo kolejnego zależy tylko od wyniku poprzedniego, nazywamy łańcuchem Markowa. Ten konkretny łańcuch ma dwa stany szczególne (stacjonarne): x = 0 i x = 20. Jeśli populacja bakterii osiągnie którykolwiek z nich, oznacza to, że jeden z alleli uległ utrwaleniu, a drugi został całkowicie wyeliminowany.

Z rachunku prawdopodobieństwa wynika, że dla każdej populacji, w której początkowo istnieją dwa konkurencyjne allele A1 i A2 o tej samej się wartości przystosowawczej, jeden z nich w końcu utrwali się kosztem drugiego. Zanim do tego dojdzie, liczba x błądzi losowo, to wzrastając, to malejąc. Te fluktuacje nazywamy dryfem genetycznym. Oczekiwany czas takiego błądzenia aż do utrwalania się jednego z alleli, mierzony liczbą pokoleń, zależy wprost proporcjonalnie od liczebności populacji, a prawdopodobieństwo, że allel A zostanie ostatecznie utrwalony, jest równe jego początkowej częstości występowania (i oczywiście waha się z pokolenia na pokolenie wraz ze zmianami częstości).1

Bakterie rozmnażają się aseksualnie i mają genomy haploidalne, ale model matematyczny dryfu wygląda bardzo podobnie dla populacji organizmów diploidalnych (posiadających po dwa komplety chromosomów i po parze większości genów), losowo łączących się w pary i mogących reprezentować typ heterozygotyczny (A1A2) lub homozygotyczny (A1A1) lub (A2A2). Tu także, jeśli kombinacje A1A2, A1A1, A2A2 mają tę samą wartość przystosowawczą, dryf losowy jest jedyną przyczyną zmian częstości występowania A1 i A2 w populacji i prędzej czy później (w czasie, którego średnia długość zależy od wielkości populacji) musi doprowadzić do utrwalenia się układu A1A1 lub A2A2.

Wszechobecność dryfu

Dryf losowy kłóci się nieco z naszą intuicją. Biologom, jak sądzę, wydawało się z początku, że jeśli A1 i A2 występują jednocześnie w populacji, a dobór nie faworyzuje żadnego z nich (ani żadnej kombinacji diploidalnej), to ewolucja będzie polegała na małych wahaniach w górę i dół wokół „punktu równowagi”. Tymczasem żadnej równowagi tu nie ma. Każdy stan współistnienia konkurencyjnych alleli jest chwilowy i niestabilny. A ponieważ u wielu organizmów znaczna część genomu (u człowieka ok. 90%) jest niewidzialna dla doboru naturalnego, większość innowacji genetycznych (mutacji) jest ostatecznie utrwalana lub eliminowana nie przez dobór, ale przez dryf losowy, czyli ślepy traf.

Powszechne istnienie dryfu jest nieuniknioną konsekwencją faktu, że realne populacje mają skończoną liczebność. Im mniejsza populacja, tym skuteczniej działa dryf i tym większą rolę odgrywa w stosunku do wcześniej odkrytego i szerzej znanego mechanizmu utrwalania innowacji, jakim jest dobór naturalny. Ale nawet w wielkich populacjach dryf nie znika, staje się tylko mniej widoczny. Nie znika również wtedy, gdy działa dobór, czyli allele lub ich kombinacje różnią się korzyścią, jaką dają swoim nosicielom. Jeśli A1 ma przewagę przystosowawczą nad A2, to w populacji „nieskończonej” częstość A1 będzie gładko i systematycznie rosła z pokolenia na pokolenie, dążąc do 100%. Jeśli jednak populacja jest niewielka, na wzrost częstości A1 nałożą się losowe fluktuacje spowodowane przez dryf – zakłócenia o amplitudzie tym większej, im mniejsza jest populacja. Zamiast gładkiej krzywej otrzymujemy jej mocno zygzakowate przybliżenie, jak gdyby wytyczoną ścieżką szedł pijak, zataczając się na prawo i lewo. Może się zdarzyć, że w pewnym momencie pechowo duża fluktuacja wyeliminuje allel korzystny i utrwali niekorzystny (ze szkodą dla zdrowia populacji).

Zjawisko to rzuca się w oczy, kiedy mała grupa założycielska daje początek nowej populacji podczas ewolucyjnych „wąskich gardeł” wskutek wymarcia większości gatunku lub po przypadkowej migracji do nowej ojczyzny. Wówczas przez wiele pokoleń pula populacyjna pozostaje mała, przez co dryf działa silnie w stosunku do liczebności osobników i dobór naturalny nie nadąża z eliminacją szkodliwych alleli genów (co w dużej populacji robiłby bez trudu). Istnieje wtedy duże ryzyko losowego wyeliminowania korzystnych alleli lub ich korzystnych kombinacji.

W każdej skończonej populacji losy alleli zależą jednocześnie od doboru, czyli komponentu nielosowego, narzucającego kierunek zmianom częstości występowania alleli (zależnie od ich wartości przystosowawczej) i od dryfu, czyli komponentu czysto losowego (przypadkowych fluktuacji). Ponieważ można oszacować efekty działania dryfu, tempo utrwalania się innowacji znacząco szybsze lub wolniejsze od oczekiwanego wskazuje na działania doboru (czyli nacisku selekcyjnego), faworyzującego korzystne kombinacje alleli kosztem niekorzystnych − tym efektywniej, im większy zysk (mierzony sukcesem reprodukcyjnym) dają allele korzystne.

Mogłoby się zdawać, że kiedy wyeliminujemy dobór naturalny, ewolucja powinna się zatrzymać. Nic bardziej mylnego: dryf jest matematyczną koniecznością. W przypadku osłabienia doboru allele nadal ewoluują, tyle że neutralnie (wyłącznie pod wpływem dryfu) albo prawie neutralnie (kiedy dobór jest na tyle słaby, że ma nikły wpływ na ich utrwalanie bądź eliminację). Ewolucja traci wyraźny kierunek − przestaje mieć charakter przystosowawczy – ale bynajmniej nie ustaje. Dryf bywa także czynnikiem konstruktywnym: kiedy osłabia efektywność doboru, pozwala ewolucji wypróbowywać nowe kombinacje genetyczne, które w innych okolicznościach byłyby szybko usuwane jako nieoptymalne. Może to umożliwiać organizmom i ich genomom ucieczkę z pułapki „lokalnego optimum adaptacyjnego”, tak jak cząstka subatomowa może dzięki zasadzie nieoznaczoności przeniknąć przez barierę potencjału.

Małe symulacje poglądowe

Ryc. 3.

Ryc. 3 pokazuje dwie symulacje ewolucji pary alleli (A1, A2) w populacjach organizmów diploidalnych. Ich początkowa częstość występowania w populacji jest identyczna Na każdym z dwóch wykresów widzimy symulowane losy dziesięciu różnych populacji próbnych śledzone na przestrzeni 400 pokoleń (w przypadku ludzi oznaczałoby to ok. 12 tys. lat) i gładką linię odpowiadającą historii wyidealizowanej „populacji nieskończonej”, w której działanie dryfu dążyłoby do zera. Wykresy pokazują częstość występowania A1, ale oczywiście częśtości A1 i A2 dopełniają się do 100%. Przyjmijmy, że żaden z alleli nie ma wpływu na sukces reprodukcyjny, co oznacza, że różnica niędzy nimi nie jest widoczna dla doboru naturalnego. Jednak działanie dryfu powoduje, że każda z populacji próbnych zaczyna „błądzić” losowo. Ich historie, z początku przebiegające podobnie, z czasem zaczynają się rozjeżdżać. Znamy statystycznie oczekiwane tempo tego procesu, ale każdy przebieg zależy od serii przypadków, więc nie możemy z góry przewidzieć, w której populacji ostatecznie utrwaleniu ulegnie A1, a w której A2. Wiemy tylko, że na początku (pierwsze pokolenie) oba wyniki miały jednakowe szanse.

Na pierwszym wykresie populacje liczą po 10000 osobników. Widać, że po 400 pokoleniach obu allelom jeszcze daleko do utrwalenia, ale np. w populacji nr 3 udział allelu A1 wynosi 70%, co oznacza, że w danej chwili prawdopodobieństwo jego ostatecznego utrwalenia wynosi 0,7 (aczkolwiek z prawdopodobieństwem 0,3 możliwe jest też odwrócenie tendencji i zniknięcie A1 z populacji). Na drugim wykresie populacje liczą po 500 osobników. Dryf działa tu znacznie intensywniej i trajektorie dziesięciu populacji niemal od razu zaczynają się zachowywać jak pijane. Po 291 pokoleniach populacja nr 5 traci allel A1 (utrwaleniu ulega A2). W 395 pokoleniu w populacji nr 3 – odwrotnie – znika A2, a utrwala się A1. Pozostałe populacje „nadal walczą”, ale widać, że losy niektórych z nich z dużym prawdopodobieństwem już niebawem się rozstrzygną.

Ryc. 4.

Ryc. 4 także pokazuje symulacje ewolucji pary alleli (A1, A2) w populacjach organizmów diploidalnych. Tu jednak A1 jest allelem zapewniającym wyższy sukces reprodukcyjny. Jeśli dostosowanie układu A1A1 wynosi 1, to przyjmijmy, że układ A1A2 ma dostosowanie minimalnie obniżone (np. 0,98), a para A2A2 wyraźniej niższe (np. 0,95). Wbrew pozorom, takie „nieznaczne” różnice wystarczą, żeby dobór działał dość silnie i w ciągu kilkuset pokoleń doprowadził do utrwalenia się korzystnej cechy w dowolnie dużej populacji. Tu także mamy po dziesięć symulacji dla różnych populacji próbnych tej samej wielkości (plus gładki przebieg odpowiadający „populacji nieskończonej”). Tym razem każdym przypadku początkowa częstość występowania A1 wynosi 10%. Pierwszy wykres pokazuje historie populacji liczących 10000 osobników; drugi – 1000 osobników; trzeci – 200 osobników. Podobnie jak poprzednio, śledzimy je przez 400 pokoleń.2

Jak widać, populacje o liczebności 10000 zachowują się całkowicie przewidywalnie. Wszyskie ewoluują niemal w identyczny sposób (odchyłki od „przypadku nieskończonego” są minimalne). O ich losie decyduje dobór, nie dryf. Po 400 pokoleniach gra jest praktycznie zakończona: wariant A2 jest albo całkowicie wyeliminowany, albo skrajnie rzadki i bez szans na dłuższe przetrwanie. Trajektorie populacji o liczebności 1000 wyraźnie rozjeżdżają się pod wpływem dryfu, ale mimo wszystko docierają do celu. Po 400 pokoleniach w 9 populacjach próbnych mamy już wyłącznie allel A1, a tylko w jednej jego częstość wynosi 96,25%. Natomiast populacje o liczebności 200 przestają być przewidywalne. W ośmiu przypadkach utrwala się A1, w jednym gra jeszcze trwa, choć jest bliska rozstrzygnięcia (częstość A1 w populacji nr 4 wynosi 88%), ale w jednej populacji (nr 6) po 202 pokoleniach utrwala się mniej korzystny wariant A2, a allel A1 zostaje wyeliminowany wskutek kaprysów dryfu. Innymi słowy, przewaga adaptacyjna A1 nie gwarantuje mu przeżycia.

Uwaga, malaria!

Na ogół dobór naturalny ze zrozumiałych przyczyn faworyzuje jeden allel kosztem drugiego. Są jednak wyjątki od tej reguły. Czasem heterozygotyczność (posiadanie pary niejednakowych alleli A1A2) daje lepsze dostosowanie niż którykolwiek przypadek homozygotyczny (układ A1A1 lub A2A2). Klasycznym przypadkiem u ludzi jest punktowa mutacja w genie HBB kodującym podjednostkę β hemoglobiny. Nosiciele dwu kopii zmutowanego genu zapadają na anemię sierpowatą. Nosiciele jednej kopii normalnej i jednej zmutowanej (nazwijmy je tu dla ułatwienia A1 i A2) nie mają klinicznych objawów choroby, natomiast uzyskują odporność na zakażenie zarodźcem malarii. Zatem na terenach, gdzie od tysięcy lat stale występuje malaria, korzystnie jest być heterozygotą. Można z grubsza oszacować, że jeśli dostosowanie A1A2 wynosi 1, to dostosowanie A1A1 (dwie kopie niezmutowane) wynosi 0,8, a dostosowanie A2A2 w warunkach pierwotnych (brak współczesnej opieki medycznej) spada do zera.

Ryc. 5 pokazuje, co się wówczas dzieje przy założeniu, że początkowo 1% kopii genu w populacji stanowi wariant zmutowany A2. W stosunkowo dużej populacji (10 tys. osobników, jak na pierwszym wykresie) odsetek ten szybko rośnie do 16,66%, a częstość A1 spada z 98% do 83,33% (± nieznaczne fluktuacje). Po mniej więcej 20 pokoleniach dobór znajduje stabilny, optymalny stosunek częstości A1A2 (5 : 1), który zapewnia maksymalne średnie dostosowanie całej populacji. Fakt, że przy takiej proporcji 3% osobników narażonych jest na anemię sierpowatą, skompensowany jest przez fakt, że 28% uzyskuje odporność na malarię. Taki mechanizm doboru, faworyzujący nie eliminację jednego z konkurencyjnych alleli, ale utrzymanie obu wariantów (albo ogólnie: utrwalenie polimorfizmu, czyli stałej obecności więcej niż jednego allelu), nazywamy doborem stabilizującym.

W małej populacji (rzędu 100 osobników, jak na drugim wykresie) mechanizm doboru działa mniej efektywnie. W przypadku tej symulacji widzimy, że trzy populacje próbne dość szybko (po 3, 6 i 15 pokoleniach) tracą wariant A2. Pozostałych siedem zachowuje go przez 100 pokoleń, ale wskutek dryfu częstość występowania A2 fluktuuje w sporym zakresie (6−30%) i nie ma pewności, czy jakieś większe losowe wahnięcia nie spowodują w końcu jego usunięcia z populacji. Mamy zatem sytuację trochę nietypową, bo zazwyczaj dobór przyśpiesza utrwalanie mutacji. Jednak tutaj, gdyby to zależało od doboru, polimorfizm utrzymałby się po wsze czasy. Jednak dryf jest na tyle silny, że może utrwalić A1 wbrew doborowi i wbrew „interesowi ogółu” (można policzyć, że wskutek utraty A2 średnie względne dostosowanie populacji spada z 0,833 do 0,8, czyli o 4%).

Podsumowanie

Publikacje popularnonaukowe zwykle koncentrują się na skutkach działania doboru naturalnego, takich jak widowiskowe adaptacje sprawiające wrażenie, że zostały racjonalnie zaprojektowane. Dryf wspominany jest mimochodem przy omawianiu „efektu założycielskiego” albo negatywnych zjawisk zachodzących w małych populacjach (jako że przeszkadza doborowi naturalnemu w usuwaniu niepożądanych alleli). Można też spotkać się z opinią, że dryf jest istotny tylko w przypadku alleli neutralnych − ani korzystnych, ani szkodliwych. Matematyka mówi co innego. Na przykład prawdopodobieństwo utrwalenia się w dużej populacji nowej mutacji, dzięki której powstaje allel o współczynniku selekcji s (miara względnego dostosowania, dodatnia dla mutacji korzystnych), wynosi dla typowych wartości s − małych w porównaniu z jednością − nieco mniej niż 2s, czyli na ogół znacznie mniej niż 1. Przyczyną jest właśnie dryf, z którym każda mutacja, z początku rzadka, musi się zmierzyć, zanim liczba jej kopii w populacji odpłynie na bezpieczną odległość od zera. A teraz, kiedy już wiemy, na czym polega to ważne, lecz niedoceniane zjawisko, możemy wrócić do głównego wątku. Zapraszam na kolejny odcinek.

Przypisy

  1. Podstawowy model Wrighta−Fishera daje dostatecznie jasne pojęcie, na czym polega dryf, rzadko jednak daje się stosować wprost, zawiera bowiem zbyt wiele idealizacji i uproszczeń. W praktyce trzeba uwzględniać takie fakty jak: istnienie osobników jednopłciowych i ewentualnie nierówną proporcję płci, strategię dobierania się w pary, przystępowanie osobników do rozrodu z niejednakowym prawdopodobieństwem, zmiany wielkości populacji, jej podział na podpopulacje, nakładanie się pokoleń w czasie, migracje, prawdopodobieństwo mutacji przekształcających A1 w A2 lub vice versa, sprzężenie genetyczne (wspólne dziedziczenie lokalizacji DNA leżących blisko siebie na chromosomie) itd. Wszystko to da się modelować matematycznie, ale oczywiście komplikuje model. Do szacowania np. czasu utrwalania mutacji przez dryf używa się pojęcia pojęcia tzw. populacji efektywnej, różnej (zwykle znacznie mniejszej) od rzeczywistej liczby osobników. ↩︎
  2. W realnym świecie izolowana populacja licząca stale ok. 200 osobników byłaby narażona na tak liczne negatywne skutki dryfu i kojarzenia wsobnego, że jej przeżycie przez 400 pokoleń byłoby z góry wątpliwe, ale nie rozważamy tu realnych sytuacji, tylko mocno wyidealizowany model, żeby zrozumieć, jak działa splot doboru i dryfu. ↩︎

Ilustracje

Ilustracja w nagłówku − patrz pierwszy wpis z tego cyklu.
Ryc. 1 i 2 wygenerowane za pomocą aplikacji Binomial Distribution (Matt Bognar, University of Iowa).
Ryc. 3, 4 i 5 wygenerowane za pomocą aplikacji Web PopGen II (Bob Sheehy, Radford University).

Lektura dodatkowa

Udostępnij wpis

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *