Ryby dwudyszne i paradoksy genomiki

My, mięśniopłetwi

Prawdopodobnie około 430 mln lat temu, czyli w środkowym sylurze, od przodka ryb promieniopłetwych (Actinopterygii) oddzieliła się linia ewolucyjna znana jako mięśniopłetwe (Sarcopterygii). Jak sama nazwa wskazuje, wyróżniały się one budową płetw parzystych, które osadzone były na dobrze umięśnionych trzonach kostnych, zopatrzonych w stawy. Zwierzęta te miały też kilka innych cech szczególnych, na przykład zęby pokryte szkliwem złożonym głównie z twardego hydroksyapatytu. I promieniopłetwe, i mięśniopłetwe (tworzące wspólnie grupę ryb kostnych) miały przed sobą wielką przyszłość. Każda z nich obejmuje dziś po ok. 50% gatunków kręgowców (pozostawiając na marginesie ryby chrzęstne oraz minogi i śluzice). Gdyby obie pozostały w środowisku wodnym, musiałyby konkurować z sobą, tak się jednak złożyło, że ogromna większość współczesnych mięśniopłetwych to zwierzęta lądowe.

Mięśniopłetwe dość szybko podzieliły się na kolejne linie rozwojowe. Pierwsza z nich to trzonopłetwe (Actinistia), których największy rozkwit przypadał na wczesny trias. W jurze i kredzie były mniej zróżnicowane, ale za to niektóre gatunki osiągnęły olbrzymie rozmiary (ponad 5 m długości). Niemal wszystkie trzonopłetwe wymarły jednak z końcem mezozoiku. Jakimś cudem do naszych czasów przetrwały podręcznikowe „żywe skamieniałości” – dwa gatunki z rodzaju Latimeria.

Pozostałe mięśniopłetwe już wkrótce – na przełomie syluru i dewonu (420 mln lat temu) – uległy kolejnemu podziałowi na dwudyszne (Dipnoi) i grupę Tetrapodomorpha, której najstarsi przedstawiciele nadal żyli w wodzie: najpierw na płyciznach u wybrzeży morskich i w lagunach, a pod koniec dewonu coraz częściej w wodach słodkich. Ponieważ jednak posiadali płuca i mogli oddychać tlenem atmosferycznym, dzięki umięśnionym płetwom potrafili także wypuszczać się poza macierzysty żywioł i człapać po lądzie. Najstarsze skamieniałe ślady takich wędrówek (390 mln lat temu) odkryto w Zachełmiu w Górach Świętokrzyskich. Nieco młodsze pochodzą z Irlandii i Australii. Te wczesne eksperymenty doprowadziły w końcu do prawdziwego wyjścia na ląd około 375 mln lat temu. Umięśnione płetwy wyewoluowały w prawdziwe kończyny zakończone dłonią lub stopą z palcami. Jako jedyne w owym czasie kręgowce lądowe, Tetrapodomorpha miały dużą swobodę zasiedlania różnych nisz ekologicznych i ochoczo z niej skorzystały. Około 340 mln lat temu, w karbonie, żył ostatni wspólny przodek wszystkich dzisiejszych czworonogów lądowych (Tetrapoda), czyli na przykład człowieka i rzekotki drzewnej.

Nasi nieco zapomniani kuzyni

Ale zostawmy na boku czworonogi i przyjrzyjmy się ich grupie siostrzanej, czyli dwudysznym. W dewonie była to spora grupa kręgowców morskich: kiedy nasi praprzodkowie podejmowali próby wyjścia na ląd, w morzach żyło około stu gatunków bardzo różnorodnych dwudysznych. Podobnie jak tetrapodomorfy, posiadały one (obok skrzeli) płuca – worki powietrzne umożliwiające oddychanie powietrzem, co pomagało im przeżyć w wodzie ubogiej w rozpuszczony tlen. Płuca wywodzą się z tych samych pierwotnych struktur co pęcherze pławne ryb promieniopłetwych, ale mają bardziej skomplikowaną budowę: są podzielone na wielką liczbę mniejszych pęcherzyków w celu zwiększenia powierzchni wymiany gazowej. Dwudyszne bardzo wcześnie wyspecjalizowały się w polowaniu na zwierzęta osłonięte twardymi skorupami lub pancerzami, rozwinęły więc unikatową formę uzębienia w postaci masywnych płytek zębowych do miażdżenia twardego pokarmu, łatwo rozpoznawalnych w zapisie kopalnym.

Ryc. 1.

Niemal wszystkie karbońskie dwudyszne przeniosły się z oceanu do wód słodkich. Jedna z ich linii, klasyfikowana jako rząd Ceratodontiformes, objęła swoim zasięgiem cały superkontynent Pangei. Ich mezozoiczne skamieniałości znane są także z Polski. Większość dwudysznych wyginęła z końcem kredy, niektóre nieco później, w eocenie. Do naszych czasów dożyli przedstawiciele jednej z podgrup Ceratodontiformes, która po rozpadzie Pangei wyodrębniła się na południowym superkontynencie, Gondwanie. W miarę jak sama Gondwana dzieliła się na część wschodnią (Antarktyda, Australia, Nowa Zelandia, Indie i Madagaskar) oraz zachodnią (Afryka i Ameryka Południowa), zamieszkujące ją dwudyszne ewoluowały niezależnie na powstających kontynentach, dając początek odrębnym rodzinom.

Australijskim reliktem tego procesu jest rogoząb (Neoceratodus forsteri) z rzek południowo-wschodniego Queenslandu, ostatni żyjący przedstawiciel rodzaju znanego od kredy. W odróżnieniu od innych dzisiejszych dwudysznych zachował dobrze rozwinięte umięśnione płetwy, duże łuski i w pełni funkcjonalne skrzela, którym towarzyszy pojedyncze płuco. Dla rogozęba ewolucja jakby się zatrzymała: wygląda bardzo podobnie do najstarszych przedstawicieli Ceratodontiformes, a na przykład budową mózgu bardziej przypomina trzonopłetwe niż swoich dwudysznych kuzynów. Nie zapada też w sen letni (estywację), aby w ten sposób przetrwać porę suchą.

Różnice te wynikają stąd, że linia rodowa rogozęba wyodrębniła się w jurze, 150–200 mln lat temu. Wspólni przodkowie pozostałych współczesnych dwudysznych zamieszkiwali Gondwanę Zachodnią aż do jej rozpadu na Afrykę i Amerykę Południową, który nastąpił 100 mln lat temu. Wówczas rozwinęły się dwie kolejne linie, każda reprezentowana dziś przez jeden rodzaj: afrykański prapłetwiec (Protopterus) z czterema żyjącymi gatunkami i południowoamerykański prapłaziec (Lepidosiren) z jednym gatunkiem (L. paradoxa).1 Prapłetwiec i prapłaziec mają wiele cech wspólnych wskazujących na bliskie pokrewieństwo (co potwierdzają badania genetyczne): węgorzowate ciało pokryte drobną łuską, płetwy parzyste zredukowane do wiotkich, nitkowatych wyrostków, parzyste płuca, skrzela uwstecznione i praktycznie niefunkcjonalne u dorosłych osobników oraz zdolność do estywacji, czyli zapadania w sen letni w kokonie z zaschniętego śluzu w komorze wykopanej w błocie.2

Rekordowe genomy

Wszystkie współczesne dwudyszne mają jeszcze jedną cechę szczególną, niewidoczną gołym okiem: ogromne genomy. Genomy te są tak wielkie, że trudno było nawet oszacować ich długość metodami dawniej dostępnymi. Dopiero w 2021 r. udało się w pełni zsekwencjonować i zestawić w całość genom rogozęba. Okazało się, że zawiera on 43 miliardy par zasad (43 Gbp), czyli jest ok. 14 razy większy niż genom człowieka (3 Gbp).3 Wówczas rogoząb został oficjalnym rekordzistą całego królestwa zwierząt (tylko zwierząt, bo genomy roślinne bywają jeszcze większe).4 Nie na długo, gdyż jak pisałem w zeszłym roku, mały skorupiak zwany krylem antarktycznym (Euphausia superba) niebawem zdetronizował rogozęba jako posiadacz genomu złożonego z 48 Gbp.

Nowe odkrycia mieszają jednak stale w takich rankingach. Ten sam zespół, który trzy lata temu zbadał genom rogozęba, powtórzył ten wyczyn z genomami prapłetwca brunatnego (Protopterus annectens) i prapłaźca. Tytuł rekordzisty wrócił do dwudysznych. Prapłetwiec brunatny, jak się okazało, ma genom zawierający 47 Gbp – większy niż rogoząb, choć nie aż tak wielki, żeby pokonać kryla. Jednak prapłaziec naprawdę wymiata: jego genom liczy aż 91 Gbp, czyli trzydziestokrotnie przewyższa objętością genom ludzki i jest niemal dwukrotnie większy niż genom kryla antarktycznego. Podawana często jeszcze większa wartość (133 Gbp) dla prapłetwca abisyńskiego (P. aethiopicus) jest możliwa, ale wynika z oszacowań, które mogą być grubo zawyżone. Nie jest zatem oficjalnym rekordem królestwa zwierząt, dopóki genom tego gatunku nie został w pełni zsekwencjonowany.

Ryc. 2.

Skąd i po co tak wielkie genomy? Nie jest to cecha, która łączyłaby wszystkie mięśniopłetwe. Kręgowce lądowe w zasadzie mają genomy średnich rozmiarów: ludzkie 3 Gbp jest bliskie wartości przeciętnej dla kręgowców. Genom latimerii jest nieco mniejszy od ludzkiego. Wyjątkiem są salamandry, czyli płazy ogoniaste. W tej grupie także mamy do czynienia z przypadkami rozrostu genomów do rzadko spotykanych rozmiarów. Niestety dotąd zbadano szczegółowo tylko niewielką część płazich genomów. Spośród tych, które zsekwencjonowano i zestawiono w całość, niektóre osiągają 32 Gbp (genom aksolotla, Ambystoma mexicanum). Z pewnością górna granica możliwości salamander leży znacznie wyżej i kto wie, czy nie są one godnymi konkurentami dla dwudysznych, ale żeby się przekonać, czy tak rzeczywiście jest, musimy cierpliwie poczekać na wyniki dalszych badań.

Puchnięcie genomów dwudysznych jest starsze niż podział na współcześnie występujące rodzaje. Zaczęło się jeszcze w karbonie (300 mln lat temu) i wyhamowało po około 100 milionach lat, a jego śladem jest widoczny u kopalnych dwudysznych systematyczny wzrost wielkości komórek tkanki kostnej. Następnie – już po oddzieleniu się Ameryki Południowej od Afryki, a prapłaźców od prapłetwców – prapłaźce znowu zaczęły dynamicznie namnażać swoje DNA. Łatwo policzyć, że jeśli w ciągu 100 mln lat odrębnego rozwoju przybyło im około 40 miliardów par zasad, to co 10 milionów lat przybywało go średnio więcej niż cała objętość genomu ludzkiego.

Szalone transpozony

Czasem za wzrost rozmiarów genomu odpowiada poliploidalność, czyli podwojenie całego zestawu chromosomów. Kilka przypadków takiego zwielokrotnienia całego genomu zdarzyło się we wczesnej historii prymitywnych kręgowców, o czym pisałem tutaj. Ale u dwudysznych nie zaszło nic podobnego. Przeciwnie, ich kariotyp, czyli układ chromosomów, jest bardzo zachowawczy i niewiele się zmienił od czasu, kiedy ich przodkowie rozstali się z przodkami czworonogów. Natomiast same chromosomy są olbrzymie: większość z nich przewyższa wielkością genom człowieka.

Tym, co spowodowało ich rozrost, było namnażanie się „samolubnego” DNA, a szczególnie retroranspozonów typu LINE. Aktywny transpozon tego typu (zwany popularnie, choć nieściśle, „skaczącym genem”) przypomina w działaniu wirusy: koduje dwa białka umożliwiające mu tworzenie własnych kopii i wklejanie ich w inne miejsca genomu. Z czasem aktywność transpozonu zanika, bo losowe mutacje prędzej czy później uszkadzają geny potrzebne do autoreplikacji. Ponieważ skutki niekontrolowanego mnożenia się kopii LINE mogą zagrażać stabilności genomu, istnieją na poziomie komórki różne mechanizmy trzymające transpozony w ryzach. Sekwencje typu LINE stanowią ok. 21% genomu człowieka; są to jednak w znakomitej większości (ok. 99,9%) transpozony już nieaktywne lub ich poszatkowane szczątki.

Tymczasem w genomie prapłaźca zidentyfikowano ponad 75 tysięcy niezdegradowanych długich retrotranspozonów LINE, w znacznej części aktywnych. U prapłetwca jest ich mniej, ale towarzyszą im także retrotranspozony SINE, powielające się w nieco inny sposób. U rogozęba (podobnie jak u salamander) dużą rolę odgrywają ponadto tzw. retrotranspozony LTR. Efekt ich aktywności jest w sumie podobny: genom stopniowo zapełnia się powtarzalnymi sekwencjami DNA różnej długości (do kilku tysięcy par zasad). Wypełniają one przestrzenie między genami i introny (niekodujące sekwencje rozdzielające kodujące odcinki genu). Jest to jedna z przyczyn, dla których tak długo nie można było dokonać złożenia w całość sekwencjonowanych genomów dwudysznych: przypominało ono próby odtworzenia układu puzzle’a, w którym większość kawałków nie różni się wyglądem. Przełom nastąpił dopiero po zastosowaniu technik tzw. trzeciej generacji, czyli sekwencjonowania nanoporowego, które umożliwia bezpośrednią identyfikację długich i ultradługich odcinków DNA.

Zidentyfikowane sekwencje powtarzalne różnego typu stanowią 93% genomu prapłaźca, 85% genomu prapłetwca i 81% genomu rogozęba (u człowieka jest to co najmniej 45%, ale według niektórych oszacowań nawet powyżej 60%). Autorzy badania zwracają uwagę na wyjątkowo niski u dwudysznych poziom ekspresji tzw. piRNA (małych, niekodujących cząsteczek RNA o średniej długości 28 nukleotydów) i na zmniejszoną liczbę genów kodujących pewne białka z domeną zwaną „palcem cynkowym”. Jedne i drugie odpowiedzialne są między innymi za wyciszanie aktywnych retrotranspozonów. Osłabienie tych mechanizmów obronnych jest zapewne jedną z przyczyn, które pozwoliły traspozonom szerzyć się w genomach tych gatunków. Mimo wszystko nie doprowadziło to do przemeblowania układu chromosomów ani do innych dramatycznych skutków. Fragmenty genomu szczególnie wrażliwe (na przykład zwarte grupy genów homeotycznych, kontrolujących rozwój morfologiczny organizmu) są nadal chronione przez dobór naturalny przeciwstawiający się wklejaniu wewnątrz nich kopii transpozonów.

Czy te miliony dodatkowych kopii są do czegoś potrzebne swoim nosicielom? Ponieważ ewolucja lubi czasem złożyć coś sensownego z nagromadzonych rupieci, także „oswojone” transpozony mają potencjał użytkowy: bywają przypadkowym źródłem korzystnych innowacji. Jednak większość z nich nie pełni żadnej konkretnej funkcji. Są tolerowane, bo w ewolucyjnym bilansie strat i zysków czyszczenie genomu z niepotrzebnych elementów może nie być dostatecznie opłacalne. Wszystkie trzy rodzaje dwudysznych mają podobną liczbę genów kodujących białka – około 20 tysięcy (mniej więcej tyle samo co człowiek) i zapewne po kilka tysięcy funkcjonalnych genów RNA (też podobnie jak człowiek). Jeśli dodać do tego różne inne typy użytecznych sekwencji niekodującego DNA, to według wszelkiego prawdopodobieństwa dwudyszne mają go – co do rzędu wielkości – podobną ilość jak człowiek. Natomiast u prapłaźca niefunkcjonalne („śmieciowe”) sekwencje DNA zajmują nie 90% (jak u człowieka), ale 99,7% genomu. Popularne wyobrażenie o tym, że natura jest oszczędna i nie znosi bezużytecznego nadmiaru, zupełnie się nie sprawdza w tym przypadku.

Paradoks wartości C, czyli nie tylko długość się liczy

Prapłetwiec brunatny i prapłaziec są bliskimi kuzynami i niewiele się różną budową ciała, fizjologią i trybem życia – dla laika wyglądają ta samo – a jednak ich genomy różnią się wielkością dwukrotnie. Ta dysproporcja (jeszcze bardziej uderzająca np. wśród salamander lub w wielu grupach roślin) nazywana jest paradoksem wartości C (chodzi o jedną z miar wielkości haploidalnego genomu). Okazuje się, że nie ma uchwytnego związku między złożonością czy „zaawansowaniem ewolucyjnym” organizmu a rozmiarami jego genomu.

Niewielka ryba z rodziny rozdymkowatych, kolcobrzuch zielony (Dichotomyctere nigroviridis), żyjąca w słonawych i słonych wodach u wybrzeży Azji Południowo-Wschodniej, ma genom o objętości 340 milionów par zasad (340 Mbp), czyli 9 razy mniejszy niż genom człowieka albo – powiedzmy – myszy domowej (Mus musculus) i prawie 270 razy mniejszy niż genom prapłaźca. Kolcobrzuch ten posiada 23 pary chromosomów (o cztery więcej niż prapłaziec, o trzy więcej niż mysz i tyle samo co człowiek), ale każdy chromosom jest wielokrotnie mniejszy od ludzkich bądź mysich, nie wspominając o prapłaźcowych. A jednak użyteczna zawartość genomu kolcobrzucha jest taka jak zwykle: około dwudziestu tysięcy genów kodujących białka, sporo genów RNA – no i zostaje jeszcze aż nadto miejsca na inne sekwencje DNA użyteczne w mniej oczywisty sposób. Natomiast u kolcobrzucha, podobnie jak u wielu jego krewnych o niewiele większych genomach5, zanikła duża część DNA położonego poza genami i w intronach. Powtarzalne sekwencje pochodzenia transpozonowego stanowią tylko kilka procent ich genomów.6

Ryc. 3.

Ewolucja wielkości genomu to gra dwóch przeciwstawnych tendencji. Z jednej strony mamy drobne, pospolite mutacje zwane indelami (insercje i delecje): wstawiają one lub usuwają krótkie fragmenty DNA lub nawet pojedyncze pary zasad. W porównaniu z insercjami delecje są statystycznie nieco częstsze i obejmują nieco dłuższe sekwencje. Gdyby zatem nie działały inne czynniki, genom kurczyłby się powoli, ale systematycznie. Ta jego część, która ewoluuje neutralnie, bo nie chroni jej dobór naturalny, ulegałaby stopniowej erozji. W końcu pozostałoby z genomu to, co niezbędne do funkcjonowania organizmu: rdzeń złożony z sekwencji, których nie da się bezkarnie pozbyć. Z drugiej strony mamy powielające się aktywne transpozony i rzadkie, ale dramatyczne przypadki podwojenia większych fragmentów chromosomów, regionów obejmujących cały gen lub wiele genów, a nawet całego genomu, jak w przypadku poliploidyzacji. O ile nie prowadzą do śmierci lub bezpłodności, mogą błyskawicznie zwiększyć rozmiary genomu, kompensując jego kurczenie się wsputek losowych delecji. Oczywiście erozja nie ustępuje i zachodzi nadal, ale robi to w żółwim tempie, więc co pewien czas tendencja do wzrostu nadmiarowego DNA wyprzedza tendencję do jego redukcji.

W końcu ustala się jakaś dynamiczna równowaga między dodawaniem DNA (co jest głównie skutkiem działania transpozonów) a jego ubywaniem (głównie wskutek skromnych delecji drążących genom jak woda skałę). Mechanizmy wyciszania transpozonów nie są niezawodne, ale przynajmniej zapobiegają rozdymaniu genomu do nieporęcznych rozmiarów. Dla większości organizmów nadmiar DNA jest niemal obojętny. Typowa wielkość genomów ssaków łożyskowych to 2,5–3,5 Gbp. Znaczna większość tego DNA jest nadmiarowa, ale jego obecność nie wiąże się z kosztem wymagającym radykalnego odchudzania.

Może się jednak zdarzyć, że rozwój danej linii ewolucyjnej idzie w kierunku zmniejszenia rozmiarów komórek i jądra komórkowego; pożądane jest wtedy także „okrojenie” chromosomów. Tak było na przykład w przypadku kręgowców latających (nietoperzy i ptaków, a prawdopodobnie także pterozaurów) w związku z ich wyjątkowo intensywnym metabolizmem stałocieplnym. Pojawia się wtedy presja selekcyjna na usunięcie choćby części zbędnego DNA. Dlatego przeciętna wielkość genomu nietoperzy to ok. 2 Gbp – o jedną trzecią mniej niż u człowieka.7 Genomy ptaków są jeszcze mniejsze (zwykle ok. 1 Gbp) i zawierają tylko 4–10% sekwencji powtarzalnych; ptasie geny mają także skrócone introny. W ewolucji obu grup aktywność transpozonów nigdy nie ustała, ale pod naciskiem doboru naturalnego punkt równowagi między dodawaniem a ujmowaniem DNA przesunął się ku niższym wartościom.

Nie znamy dokładnie przyczyn, dla których rozdymkowate pozbyły się większości śmieciowego DNA, ale nietrudno się domyślić, jak to się stało. Każdy dostatecznie efektywny mechanizm hamujący namnażanie się transpozonów prowadzi z czasem do odchudzenia genomu – wystarczy poczekać kilkadziesiąt milionów lat. I odwrotnie: jeśli pozwalamy transpozonom „iść na całość”, to po kilkudziesięciu milionach lat mamy genom wypchany ich kopiami (w większości nieaktywnymi). Dwudyszne są przeciwieństwem ptaków i nietoperzy: ich metabolizm jest spowolniony, a komórki i jądra komórkowe – bardzo duże. Dożywają od ośmiu (prapłaziec) do kilkudziesięciu, a nawet ponad stu lat (rogoząb), spędzając życie w mulistych rzekach i jeziorach i nigdzie się nie śpiesząc. Do tego prapłetwce i prapłaźce zapadają sezonowo w sen letni, podczas którego tempo przemiany materii spada jeszcze sześćdziesięciokrotnie. Nie podlegają zatem silnemu naciskowi doboru przeciwko samolubnym transpozonom.

Przypisy

  1. Oficjalnie istnieje zatem sześć gatunków współczesnych dwudysznych (cztery w Afryce i po jednym w Australii i Ameryce Południowej), jednak z badań genetycznych wynika, że populacje prapłaźców z dorzeczy Amazonki i Parany rozdzieliły się się kilka milionów lat temu i różnice genetyczne między nimi są podobnego rzędu jak między gatunkami prapłetwców. Mamy zatem prawdopodobnie do czynienia z gatunkami kryptycznymi (nieodróżnialnymi morfologicznie). ↩︎
  2. Nie jest to jednak wyłącznie cecha tej grupy dwudysznych, bo estywacja podobnego typu występowała już u dość pierwotnych Ceratodontiformes z rodzaju Gnathorhiza, który żył od późnego karbonu do wczesnego triasu. Świadczą o tym skamieniałości tych zwierząt, zachowane w wykopanych przez nie norach. ↩︎
  3. Tu i w dalszym ciągu mówimy o genomie haploidalnym, czyli takim, jaki występuje w komórkach płciowych, zawierających jeden komplet chromosomów. ↩︎
  4. Ze wszystkich dotąd zbadanych organizmów największy genom ma Tmesipteris truncata, australijska paproć z rodziny psylotowatych. Zawiera on 160 miliardów par zasad, czyli ok. 50 razy więcej niż genom człowieka. ↩︎
  5. Należy tu szereg gatunków rozdymkowatych, między innymi rozdymka tygrysia (Takifugu rubripes), której genom liczy około 400 Mbp (7,5 raza mniej niż genom ludzki). Dzięki temu kompaktowemu genomowi rozdymka tygrysia zdobyła sławę jako drugi po Homo sapiens gatunek, którego DNA zsekwencjonowano w całości. Bardzo małe genomy (nieco ponad 400 Mbp) mają także najmniejsze znane promieniopłetwe, jednocentymetrowej długości rybki karpiowate z rodzaju Paedocypris. ↩︎
  6. Co ciekawe, u kolcobrzucha znaleziono ponad trzy razy więcej typów transpozonów niż u ludzi, ale mają one średnio po kilka tysięcy kopii, podczas kiedy u ludzi są tych kopii miliony. ↩︎
  7. Nietoperze znane są jako naturalny rezerwuar wirusów, nic więc dziwnego, że w ich genomach można znaleźć wielką liczbę retrowirusów endogennych, natomiast liczba transpozonów jest zredukowana, a szczególnie częste u człowieka retrotranspozony LINE-1 zupełnie zanikły u owocożernych nietoperzy z rodziny rudawkowatych. ↩︎

Opisy ilustracji

Ilustracja w nagłówku. Schemat struktury retrotranspozonu LINE-1. ORF1 i ORF2 to tzw. otwarte ramki odczytu (open reading frames), które mogą ulec translacji na białka. LINE-1 koduje dwa białka umożliwiające mu wklejenie własnej kopii w innej lokalizacji w genomie. Źródło: Michelle Tetreault Carlson 2022, blog Active Motif (fair use).
Ryc. 1. Kopalna ryba dwudyszna Dipterus valenciennesi ze środkowego dewonu (ok. 385 mln lat temu). Skamieniałość i rekonstrukcja wyglądu. Źródło: Orkney Landscapes (licencja CC BY-NC-SA 2.0).
Ryc. 2. Południowoamerykański prapłaziec (Lepidosiren paradoxa), chwilowy rekordzista w kategorii długości genomu w królestwie zwierząt. Źródło: Wikipedia (licencja CC BY-SA 2.5).
Ryc. 3. Kolcobrzuch zielony (Dichotomyctere nigroviridis), kręgowiec o rekordowo małym genomie. Foto: FishWise Professional. Źródło: iNaturalist (licencja CC BY-NC-SA).

Lektura dodatkowa (dla dociekliwych)

Co zawdzięczamy wirusom (5): nie ma tego złego, co by na dobre nie wyszło

Inne wpisy z tej serii:
Co zawdzięczamy wirusom (1): kilka pytań fundamentalnych
Co zawdzięczamy wirusom (2): bakteriofagi, czyli wielopoziomowa gra strategiczna
Co zawdzięczamy wirusom (3): podstępni włamywacze, czyli wirusy w stylu retro
Co zawdzięczamy wirusom (4): dygresja o naszym genomie i ukrytych w nim wirusach
Co zawdzięczamy wirusom (6): nowy obraz ewolucji życia

Wirus odwdzięcza się za gościnę

W drugim odcinku niniejszej serii była mowa o tym, jak bakteriofagi potrafią przynieść korzyść bakterii, w której genomie umieściły swojego uśpionego profaga, powielającego się niezłośliwie w cyklu lizogenicznym. Jedną z korzyści była ochrona przed ponowną infekcją tym samym lub blisko spokrewnionym wirusem. Czy coś podobnego działa także w przypadku retrowirusów atakujących kręgowce? Aczkolwiek nie wchodzi tu w grę mechanizm stosowany przez fagi, wiele badań wskazuje, że produkty ekspresji genów pochodzących od retrowirusów endogennych (ERV) mogą wpływać na układ odpornościowy, a ponadto na różne, nie do końca zbadane sposoby bezpośrednio ograniczać zdolność wirusów egzogennych do infekowania komórek i skutecznego przeprowadzania odwrotnej transkrypcji.

Jeśli endogenizacja zachodzi w warunkach długotrwałej epidemii (kiedy jeden z typów retrowirusa chorobotwórczego może zakażać komórki linii płciowej i instalować swojego prowirusa w ich DNA, po czym łagodnieć wskutek gromadzenia się mutacji), może się zdarzyć, że nosiciele prowirusa uzyskują zwiększoną odporność na zakażenie typem egzogennym. Wydaje się, że coś w tym rodzaju obserwujemy w przypadku retrowirusa KoRV infekującego koale (Phascolarctos cinereus). Wirus ten wywołuje objawy podobne do AIDS u ludzi, choć łagodniejsze: osłabienie układu odpornościowego i w konsekwencji podatność na nowotwory złośliwe i zakażenia oportunistyczne (głównie chlamydiozę).

Ryc. 1.

Jeden z typów KoRV jest zdolny do zakażania bardzo różnorodnych rodzajów komórek, także należących do linii płciowej, i ma w związku z tym skłonność do endogenizacji. Jest to proces ewolucyjny odbywający się na naszych oczach: niektóre populacje koali są w ogóle wolne od KoRV, inne są zakażone praktycznie w 100%. Prowirus w komórkach linii płciowej może ulegać rekombinacji z innymi, dawno zdegradowanymi retrowirusami endogennymi, czego wynikiem są warianty zawierające defekty. Są one wciąż zdolne do namnażania się przez retrotranspozycję i wywoływania szkód, ale mniej zjadliwe niż kompletna forma wyjściowa. Mogą zatem szerzyć się w populacji kosztem nieuszkodzonego wirusa, jednocześnie zapewniając nosicielom zwiększoną odporność na zakażenie egzogennymi krewniakami.1 Dobór może w takiej sytuacji premiować mniejsze zło chroniące przed większym. Niewykluczone, że jest to jeden z częstych scenariuszy skutecznego utrwalania się ERV w genomach gospodarzy.

Pół miliarda lat wyścigu zbrojeń

Kręgowce (Vertebrata) są zaopatrzone w wyjątkowy system odpornościowy, w którym oprócz powszechnej wśród eukariontów odporności nieswoistej (wrodzonej) kluczową rolę odgrywa wysoce zaawansowana odporność swoista (adaptacyjna). System ten, oparty na aktywności limfocytów i komórek prezentujących antygeny, potrafi rozpoznawać olbrzymią liczbę nowych „substancji obcych”, wiązać je za pomocą precyzyjnie dobranych przeciwciał i niszczyć, a także przechowywać pamięć o nowo napotkanych antygenach. Dzieje się to dzięki generowaniu ogromnej zmienności przeciwciał (immunoglobulin) i receptorów limfocytów B i T. Ich geny tworzone są przez składanie (rekombinację) kilku modułów losowo wybranych z puli kilkuset genów obecnych w genomie, a następnie dodatkową modyfikację produktu tego składania. Liczba potencjalnie wytwarzanych przeciwciał jest zatem miliony razy większa niż liczba dziedziczonych genów kodujących przeciwciała. Zauważmy, że ponieważ proces rekombinacji i selektywnego powielania przeciwciał pasujących do antygenów zachodzi w komórkach somatycznych, jakimi są limfocyty, jego wynik nie jest dziedziczony z pokolenia na pokolenie. Każdy osobnik rozwija własną, indywidualną odporność swoistą.

Odporność swoista wyewoluowała najprawdopodobniej w kambrze, ok. 500 mln lat temu. Bezżuchwowce (śluzice i minogi), czyli linie rodowe najdawniej oddzielone od reszty kręgowców, posiadają system alternatywny, który powstał w dużym stopniu niezależnie, choć działa w nieco analogiczny sposób. Zamiast immunoglobulin (białek dopasowywanych do antygenów) rolę przeciwciał odgrywają w nim zmienne receptory limfocytów.

System odporności swoistej pozostałych kręgowców, czyli żuchwowców (Gnathostomata) nie został odziedziczony po dalekich przodkach, ale rozwinął się w stosunkowo krótkim czasie między ostatnim wspólnym przodkiem wszystkich kręgowców a rozejściem się linii ewolucyjnych chrzęstnoszkieletowych i kostnoszkieletowych (u obu grup zasadniczo ten sam system istnieje w rozwiniętej formie).2 Jest to fakt zastanawiający, bo choć rozmaite elementy uczenia się reakcji na antygeny i pamięci immunologicznej występują także u innych organizmów (nie wyłączając prokariontów), różnica jakościowa między tymi rozwiązaniami  prekursorowymi a systemem odporności kręgowców jest uderzająca.

Powstanie tak skutecznej ochrony przed patogenami zbiegło się w czasie z pojawieniem się właściwych retrowirusów (rodzina Retroviridae), które współcześnie atakują wyłącznie kręgowce. Ponieważ retrowirusy są pasożytami wyrafinowanymi, stosującymi pomysłowe strategie w celu uniknięcia rozpoznania i eliminacji przez organizm gospodarza, a przy tym szybko ewoluującymi, można podejrzewać, że z kolei adaptacyjny system odporności swoistej pojawił się jako odpowiedź kręgowców w wyścigu zbrojeń z wirusami.

Kluczowym składnikiem systemu są RAG1 i RAG2, czyli „geny aktywujące rekombinację”, ulegające ekspresji w rozwijających się limfocytach B i T. Kodowane przez nie enzymy (oczywiście nie samodzielnie, ale z pomocą innych białek) regulują proces wycinania, tasowania i łączenia wspomnianych wyżej modułów. Od dość dawna wiadomo, że geny RAG są spokrewnione z genem kodującym transpozazę używaną przez transpozony DNA z grupy nazywanej Transib (transpozaza jest to enzym umożliwiający elementom ruchomym przemieszczanie się w genomie metodą „wytnij i wklej”). Co dziwne, transpozony Transib nie występują u kręgowców, choć można je znaleźć u zwierząt dość blisko z nimi spokrewnionych, np. szkarłupni. W 2016 r. odkryto u lancetnika Branchiostoma belcheri transpozon, który wydaje się „żywą skamieniałością”: w odróżnieniu od swoich krewniaków zawiera odpowiedniki obu genów RAG. Lancetniki nie są kręgowcami, ale należą wraz z nimi do typu strunowców (Chordata). Skoro zatem prekursor kompleksu RAG istniał u prymitywnych strunowców (po czym jego oryginalna forma zanikła w linii rodowej kręgowców), hipoteza zakładająca transpozonowe pochodzenie genów sterujących systemem odporności swoistej stoi na pewniejszym gruncie.

Transpozony DNA tego konkretnego typu trudno nazwać wirusami: ich pochodzenie ginie gdzieś w mrokach wczesnej ewolucji życia na Ziemi i brak dowodów na ich wirusową genealogię; ale są to w każdym razie elementy na ogół „pasożytnicze”, powielające się samolubnie. W tym przypadku jednak ich enzymy zostały wykorzystane przez gospodarza (przodka żuchowców) w nowej funkcji, robiąc zawrotną karierę na jego usługach.

Ssaki, białka osłonki i żyworodność

Często się zdarza, że jakiś produkt ewolucji, ukształtowany pod naciskiem selekcyjnym tak, aby sprawnie pełnić jakieś funkcje biologiczne, okazuje się nagle przydatny w zupełnie nowych zastosowaniach. Zjawisko to nazywamy egzaptacją albo kooptacją. Często prezentowanym przykładem są pióra, które wyewoluowały jako wielofunkcyjna okrywa ciała dinozaurów, ale tylko w jednej z ich linii rodowych – u przodków ptaków – okazały się dodatkowo przydatne jako powierzchnia nośna umożliwiająca aktywny lot. Inny przykład to język, pełniący u czworonogów najrozmaitsze fukcje, a u człowieka zaadaptowany jako jeden z najważniejszych narządów mowy (przy zachowaniu wielu dawnych funkcji). Ponieważ wirusy endogenne przez pewien czas pozostają aktywne jako potencjalne źródło produktów zakodowanych w prowirusie, należy się spodziewać, że od czasu do czasu któryś z tych produktów przyda się gospodarzowi i zostanie przejęty w celu pełnienia nowej funkcji.

Wspominałem w poprzednim wpisie, że jedną z cechą charakterystycznych retrowirusów endogennych (w odróżnieniu od innych retrotranspozonów LTR) jest zachowanie śladów genów zwanych env, kodujących białka, które wchodzą w skład lipidowej osłonki wirusa (zwykle jako glikoproteinowe wypustki/kolce na jego powierzchni). Białka tego typu wiążą się z receptorami błonowymi komórek i umożliwiają fuzję błony komórki i osłonki wirusa. Dzięki tym mechanizmom retrowirus przeprowadza „abordaż” i wtargnięcie do infekowanej komórki, a po zakończeniu cyklu replikacyjnego jego młode wiriony mogą opuścić komórkę.

Białka env mogą zatem stanowić coś w rodzaju „rozpuszczalnika molekularnego”, powodującego fuzję błon komórkowych i kontrolowane (w odróżnieniu od patologicznego) zlewanie się komórek w olbrzymie wielojądrowe syncytia. Z takich syncytiów składa się syncytiotrofoblast, końcowa część łożyska, wnikająca w ścianę macicy.3 Syncytium maksymalizuje powierzchnię wymiany składników odżywczych między matką a zarodkiem/płodem, zarazem stanowiąc barierę dla komórek układu odpornościowego matki. Nie pozostawia bowiem przestrzeni międzykomórkowej, przez które mogłyby się one prześliznąć i zaatakować „obcy” organizm potomka.

Białka biorące udział w tworzeniu synctytiów łożyska, zwane syncytynami, są w prostej linii potomkami białek env „pożyczonych” od retrowirusów i kooptowanych w nowej roli. Wirusy, które ich użyczyły, są od dawien dawna nieaktywne. Moduły prowirusa kodujące białka kapsydu i enzymy umożliwiające odwrotną transkrypcję zostały nieodwracalnie uszkodzone przez liczne mutacje. Natomiast gen env dostał „nowe życie” jako kluczowy element procesu reprodukcyjnego ssaków żyworodnych.

Przygoda ssaków z białkami erv musiała się zacząć już u wspólnych przodków kladu Theria, zanim rozwidliły się linie ewolucyjne łożyskowców (Eutheria) i torbaczy (Metatheria) – czyli zapewne we wczesnej jurze (ok. 190 mln lat temu). Torbacze także tworzą łożysko i także wykorzystują w tym celu białka typu syncytyn.4 Zupełnie niezależnie od ssaków ryby żyworodne (np. piękniczkowate, Poeciliidae) i niektóre jaszczurki (afrykańskie scynki Lubuya ivensii) wykształciły struktury pełniące rolę łożyska i – co już chyba nie powinno dziwić – również zaadaptowały do ich budowy retrowirusowe białka env.

Ryc. 2.

Co ciekawe, uzależniwszy się od pożyczonego białka, ssaki nie zadowoliły się jednorazową egzaptacją genu env, ale co pewien czas (zwykle co kilkadziesiąt milionów lat) wymieniają go na „nowy model”. W różnych liniach rozwojowych łożyskowców następowało pozyskiwanie nowych wariantów erv od retrowirusów endogennych, a także utrata wariantów odziedziczonych po dalszych przodkach. Dwie syncytyny, które ulegają ekspresji u człowieka, są stosunkowo niedawnego pochodzenia. Gen kodujący syncytynę-1 występuje u małp wąskonosych, ale nie szerokonosych, został zatem egzaptowany 30–35 mln lat temu, już po zróżnicowaniu się małp na te dwie grupy. Gen starszej syncytyny-2 występuje u wszystkich małp, choć brak go u wyraków i małpiatek, liczy więc sobie zapewne ok. 40–45 mln lat.

Wirusy a układ nerwowy

Wciąż słabo poznany, ale jak się zdaje, bardzo ważny wkład wirusów w naszą ewolucję zawdzięczamy retrotranspozonom LTR typu TY3-gypsy, czyli prastarym wirusom z rodziny Metaviridae. Pożyczony z ich arsenału gen ARC – a właściwie rodzina genów, której protoplasta pojawił się u wspólnego przodka czworonogów (Tetrapoda) jakieś 350 mln lat temu – ulega ekspresji w komórkach układu nerwowego. ARC zachowuje się podobnie jak wirus: produkuje białko, które z kolei oddziałuje z kodującym je mRNA, obudowując je płaszczem przypominającym kapsyd. Powstające w ten sposób wirusopodobne cząsteczki przekazywane są przez zakończenia synaps, „zakażając” kolejne neurony.

O tym, co dokładnie zachodzi wskutek tej międzykomórkowej wymiany mRNA i jakiego typu informacja jest przekazywana, niewiele jeszcze da się powiedzieć, ale z badań, w których mysi gen ARC poddawano inaktywacji lub wyciszaniu, wynika, że od jego aktywności zależy plastyczność synaps, a pośrednio – organizacja pracy neuronów opraz procesy związane z uczeniem się i pamięcią długotrwałą. Być może nasze zdolności poznawcze, inteligencję i świadomość również w dużym stopniu zawdzięczamy egzaptacji elementów dostarczonych przez wirusy.

Morał

Przykłady wykorzystania elementów genetycznych pochodzenia wirusowego lub transpozonowego przez gospodarzy należących do różnych gałęzi drzewa życia można by długo wyliczać. Wpis na blogu musi zachować rozsądną objętość,  mogłem więc skrótowo zaprezentować tylko kilka z nich. Każdy rok przynosi zaskakujące odkrycia w tej dziedzinie. Nawet ta skromna próbka dowodzi jednak, że to, czym jesteśmy i w jaki sposób przebiegała ewolucja naszych przodków, w znacznym stopniu zależało od działalności wirusów. Tych samych, które infekują nasze komórki i są na ogół sprawcami chorób, często cierpienia i śmierci – a jednak czasem okazują się czynnikiem stymulującym ewolucję albo bezpośrednim źródłem ważnych, a nawet przełomowych innowacji biologicznych.

Faktem jest, że przeważająca większość sekwencji wirusowych i transpozonowych gromadzących się w genomie ulega typowej pseudogenizacji. To, co zostaje poddane „recyklingowi” i wtórnie wykorzystane (egzaptowane geny kodujące białka, sekwencje generujące użyteczne RNA, różnego rodzaju elementy regulatorowe) stanowi w gruncie rzeczy niewielką część pierwotnej zawartości „pasożytniczych” fragmentów DNA (endogennych wirusów, wszelkich retrotranspozonów czy transpozonów DNA) i jeszcze mniejszą część całego genomu. Wirusy nie są z natury ani naszymi wrogami, ani przyjaciółmi, ani narzędziami w ręku jakiejś siły wyższej. Działają bez świadomego celu, tak ukształtowane przez ewolucję, żeby jak najskuteczniej dbać o własny interes. Ale od czasu do czasu wynika z tego znacząca korzyść dla ich „ofiar”, a zatem pamiętajmy, że także z naszego ludzkiego punktu widzenia wirusy nie zasługują na to, żeby postrzegać je stereotypowo jako jednoznaczne zło i zagrożenie.

Przypisy

1) Nie oznacza to, że przyszłość koali rysuje się różowo. Ich populacje są zagrożone z wielu całkiem innych przyczyn (utrata i fragmentacja siedlisk, pożary lasów, konskewencje masowych polowań w przeszłości). Od początku XX w. do naszych czasów liczba koali skurczyła się prawdopodobnie o 99%. W tej sytuacji trwająca epidemia może być gwoździem do trumny gatunku niezależnie od naturalnych procesów endogenizacji wirusa, których zrozumienie jest ważne dla prób opracowania skutecznych szczepionek przeciwko KoRV.
2) Człowiek należy do żuchwowców, a w ich obrębie do kostnoszkieletowych (Osteichthyes). Celowo unikam tu nazwy „ryby kostnoszkieletowe”, bo „ryby” to termin nieformalny, a klad kostnoszkieletowych obejmuje nie tylko ryby. Jedną z grup kostnoszkieletowych są mięśniopłetwe (Sarcopterygia), do których spośród organizmów współczesnych należą trzonopłetwe, dwudyszne i czworonogi (czyli płazy, gady wraz z ptakami i ssaki). Kiedy mówimy o koewolucji kręgowców i wirusów, ważne jest zrozumienie, jak wygląda drzewo rodowe tych pierwszych i gdzie należy w nim szukać rodowodu człowieka.
3) Upraszczam tu skomplikowaną historię ewolucji łożyska, które u ssaków należy do najbardziej zmiennych i najszybciej ewoluujących struktur anatomicznych (co ma związek z egzaptacją białek wirusowych). Powyższy opis dotyczy w każdym razie łożyska człowieka i małp wąskonosych.
4) Wbrew rozpowszechnionym przekonaniom o „prymitywizmie” torbaczy, to biologia rozwojowa łożyskowców jest w większym stopniu odziedziczona po wspólnych przodkach, a reprodukcja torbaczy, z krótką ciążą i długotrwałym „donoszeniem” młodych w torbie lęgowej, jest innowacją tej grupy (i nie stanowi stadium przejściowego między jajorodnością pierwszych ssaków a sposobem reprodukcji łożyskowców). W tym sensie to torbacze są grupą „bardziej zaawansowaną ewolucyjnie”.

Lektura dodatkowa

Ewolucja retrowirusa KoRV w populacji koali: https://www.microbiologyresearch.org/content/journal/jgv/10.1099/jgv.0.001304
Popularne streszczenie: https://www.nottingham.ac.uk/news/koala-genetics
Rekombinacja jako wstęp do „udomowienia” zjadliwego retrowirusa: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6112702/
Ewolucja syncytyn u łożyskowców: https://royalsocietypublishing.org/doi/10.1098/rstb.2012.0507
Torbacze jako ssaki „zaawansowane ewolucyjnie”: https://www.nhm.ac.uk/discover/news/2023/may/marsupials-might-be-the-more-evolved-mammals.html
Jak działa „wirus kognitywny”, czyli gen ARC: https://www.sciencedirect.com/science/article/pii/S0092867417315040
Inne przykłady symbiosy wirusów z gospodarzem: https://journals.asm.org/doi/10.1128/jvi.02974-14.

Opisy ilustracji

Ryc. 1. Koala (Phascolarctos cinereus), torbacz, który niechcący stał się żywym laboratorium endogenizacji retrowirusa zachodzącej w czasie rzeczywistym. Foto: Benjamint444. Źródło: Wikipedia (licencja CC BY-SA 3.0).
Ryc. 2. Uproszczone drzewo rodowe naczelnych pokazujące historię endogenizacji genów envFRD i envW (kodujących syncytynę-2 i syncytynę-1) oraz genów retrowirusowych envV i envR kodujących białka także posiadające część właściwości syncytyn (w tym działanie immunosupresyjne, zmniejszające ryzyko konfliktu immunologicznego). Źródło: Esnault et al. 2013 (licencja CC BY 4.0).

Co zawdzięczamy wirusom (4): dygresja o naszym genomie i ukrytych w nim wirusach

Inne wpisy z tej serii:
Co zawdzięczamy wirusom (1): kilka pytań fundamentalnych
Co zawdzięczamy wirusom (2): bakteriofagi, czyli wielopoziomowa gra strategiczna
Co zawdzięczamy wirusom (3): podstępni włamywacze, czyli wirusy w stylu retro
Co zawdzięczamy wirusom (5): nie ma tego złego, co by na dobre nie wyszło
Co zawdzięczamy wirusom (6): nowy obraz ewolucji życia

Co siedzi w naszym genomie?

Genom Homo sapiens podzielony jest między 46 chromosomów (nie licząc maleńkiego genomu mitochondrialnego). 44 chromosomy (tzw. autosomy) tworzą pary (numerowane od 1 do 22). Ostatnia para (chromosomy płciowe) składa się z dwóch chromosomów X (odziedziczonych po ojcu i matce) u kobiet, natomiast u mężczyzn jest asymetryczna: jeden chromosom X (odziedziczony po matce) i chromosom Y (odziedziczony po ojcu). Ponieważ chromosom Y zawiera tylko 40% ilości DNA występującej w chromosomie X, całkowity (diploidalny) genom męski jest o ok. 1,5% krótszy od żeńskiego. Długość genomu liczymy w parach zasad (stanowiących cegiełki, z których zbudowany jest łańcuch DNA).1 Całkowita długość ludzkiego genomu to średnio ok. 6–6,1 mld par zasad (w zależności od płci). Długość ta nieco się waha w populacji ludzkiej, ale jej osobnicza zmienność nie przekracza dziesiątych części procenta.

Na ogół wyobrażamy sobie, że genom – jak sama nazwa wskazuje – składa się z genów, czyli odcinków DNA, które służą jako podstawa do syntezy jakichś biologicznie funkcjonalnych produktów. Część z nich to geny kodujące białka – najważniejsze składniki życia na Ziemi, pełniące najrozmaitsze funkcje. Pozostałe geny, niekodujące, zawierają sekwencje służące jako wzorce do produkcji cząsteczek RNA o różnej długości. One także wykonują w komórce mnóstwo istotnych zadań. Szczególnie ważne kategorie stanowią cząsteczki RNA wchodzące w skład rybosomów (maszynerii molekularnej służącej do syntezy białek) i działające jako rybozymy (katalizujące reakcje biochemiczne, podobnie jak enzymy białkowe). Niekodujące RNA może także regulować ekspresję genów i wykonywać wiele innych, często słabo poznanych funkcji. Ważne, że RNA jest tu produktem końcowym, a nie pośrednim. Nie jest tworzone po to, aby poddać je translacji, czyli przetłumaczyć na aminokwasową sekwencję białka przy zastosowaniu kodu genetycznego.

Genów kodujących białka mamy około 20 tysięcy2; genów niekodujących  – które o wiele trudniej jest zidentyfikować i policzyć – z pewnością wiele tysięcy. Są to liczby dość typowe dla zwierząt (niekoniecznie kręgowców) i nie świadczą o złożoności ani zaawansowaniu ewolucyjnym organizmu. Jeszcze mniejsze znaczenie ma wielkość genomu, która – w odróżnieniu od względnie stałej liczby genów – może się wahać między różnymi gatunkami zwierząt o całe rzędy wielkości.

Mogłoby się wydawać „na zdrowy rozum”, że natura nie lubi rozrzutności, więc w genomie powinno być tylko to, co naprawdę konieczne. Jest jednak inaczej. U człowieka odcinki genów kodujące sekwencje białek zajmują łącznie ok. 0,9% genomu. Odcinki genów niekodujących, z których powstaje funkcjonalne RNA, stanowią prawdopodobnie ok. 0,6%. Do tego dochodzą sekwencje regulatorowe różnego typu, od których zależy ekspresja genów, a także inne sekwencje DNA o znanej funkcji (centromery, telomery, punkty wyjściowe replikacji itp.). Składają się one na nieco ponad 2% naszego DNA. W sumie uzbierało się na razie ok. 3,5%. Do tego trzeba jednak dodać ok. 5% DNA, którego roli jeszcze nie zbadano w szczegółach, ale mamy dobre powody przypuszczać, że jest funkcjonalne, bo jego sekwencja jest zachowywana przez dobór naturalny (czyli nie jest bez znaczenia dla przeżycia i sukcesu reprodukcyjnego swoich nosicieli). Reasumując, około 8–9% ludzkiego genomu (mniej więcej pół miliarda par zasad) to sekwencje na pewno funkcjonalne.

Większość genów (zarówno kodujących, jak i niekodujących) u człowieka oraz innych eukariontów3 składa się z odcinków zawierających informację o sekwencji produktu genu (eksonów) rozdzielonych „przerywnikami” (intronami), często o wiele dłuższymi niż sąsiadujące z nimi eksony. Po transkrypcji, czyli przepisaniu genu na RNA, części transkryptu odpowiadające intronom zostają wycięte, a eksony są sklejane w jedną całość (proces ten to tzw. splicing). Oczywiście geny rozumiane jako odcinki wstępnie poddawane transkrypcji w celu wyprodukowania białek lub RNA (czyli eksony wraz z intronami) zajmują o wiele więcej miejsca niż same eksony: stanowią ok. 45% genomu. Ale znaczna większość tych 45% jest transkrybowana po to, żeby następnie ulec wycięciu.

Introny nie są bynajmniej z zasady niefunkcjonalne. Mogą zawierać elementy regulujące ekspresję genów; mogą się też w nich mieścić geny niekodujące, produkujące RNA pozyskiwane już po wycięciu intronu, a także inne sekwencje ważne dla organizmu. Zostały one jednak już uwzględnione w podanych wyżej oszacowaniach.

Zauważmy, że DNA kodujące stanowi około jednej dziesiątej DNA funkcjonalnego, toteż w żadnym razie nie można tych pojęć utożsamiać. Reszta DNA nie jest zresztą całkiem niepotrzebna. Może odgrywać choćby rolę wypełniacza lub separatora – np. introny muszą mieć pewną minimalną długość, żeby splicing eksonów przebiegał poprawnie. Niefunkcjonalność dotyczy sekwencji DNA, a nie np. jego objętości.

Dlaczego genom się zaśmieca?

Podczas podziałów komórkowych genom jest powielany (replikowany) w całości. Maszyneria replikacyjna nie wnika w to, które składniki genomu są potrzebne, a które można by było usunąć. Zadanie optymalizowania składu genomu pozostawione jest doborowi naturalnemu. Jeśli podczas kopiowania DNA przekazywanego z pokolenia na pokolenie uszkodzony zostanie jakiś odcinek ważny funkcjonalnie, skutki bywają opłakane dla nosiciela: może szybko umrzeć lub spadną jego szanse na sukces reprodukcyjny. Jeśli modyfikacji ulegnie fragment DNA nie pełniący istotnej funkcji, organizm ani na tym nie straci, ani nie zyska. Takie fragmenty ewoluują neutralnie, powoli gromadząc mutacje wskutek nieuniknionych błędów replikacji. Część z tych mutacji z czasem zostaje wyparta z puli genetycznej gatunku, inne ulegają utrwaleniu, ale decyduje o tym losowy dryf genetyczny, a nie dobór naturalny. Wydawałoby się, że dobór powinien premiować zmiany genetyczne, wskutek których takie niepotrzebne odcinki są usuwane na zawsze z genomu, ponieważ mniejszy genom o tej samej użytecznej zawartości jest mniej kosztowny w utrzymaniu i powielaniu. Jednak koszt metaboliczny zależny od wielkości genomu jest pomijalny w „rachunku za energię” komórki. Tylko w szczególnych, rzadko zachodzących okolicznościach presja na „odchudzanie” genomu jest na tyle silna, żeby przeważyć nad drugą tendencją dobrze widoczną w różnych grupach eukariontów: do powiększania genomu.

Wraki genetyczne

Tu dla porządku zaznaczę, że uszkodzenie funkcjonalnego fragmentu genomu nie zawsze oznacza śmierć lub kłopoty. W innej serii wpisów wspominałem o tym, jak u przodka małp i wyraków mutacje uszkadzające „zepsuły” gen GULO, niezbędny do syntezy kwasu L-askorbinowego (witaminy C). To samo zdarzyło się niezależnie u przodka endemicznych gryzoni południowoamerykańskich (świnek morskich, kapibar, szynszyli itd.). Obie grupy zmuszone są pobierać witaminę C wraz z pokarmem, a mimo to odniosły duży sukces ewolucyjny. Małpy (zwłaszcza człekokształtne) utraciły także większość odziedziczonych po przodkach genów kodujących receptory węchowe.4 Stało się to dlatego, że są bardziej wzrokowcami niż węchowcami, a zatem defekty węchu nie miały w ich życiu istotnego znaczenia. Z tej przyczyny dobór naturalny nie usuwał z populacji „daltonistów zapachowych”. Normalna kolej rzeczy jest taka, że osłabienie nacisku selekcyjnego na utrzymanie funkcjonalności sprzyja gromadzeniu się mutacji, które w końcu mogą nieodwracalnie uszkodzić gen.

Utrata funkcji przez gen GULO miała miejsce ok. 60 mln lat temu, a mimo to resztki tego genu są nadal widoczne (choć pełne luk i poszatkowane przez mutacje). Podobnie ma się rzecz z setkami fragmentów ludzkiego DNA, które kiedyś były genami kodującymi receptory zapachowe. Taki wciąż rozpoznawalny, ale już niezdolny do funkcjonowania gen nazywamy pseudogenem. Liczba znanych ludzkich pseudogenów, które kiedyś kodowały białka, wynosi ok. 14 tys. Liczba pseudogenów, które w przeszłości produkowały niekodujące RNA, nie jest dokładnie znana, bo trudniej je zidentyfikować, ale na pewno sięga tysięcy.

A co do tego mają wirusy?

Jak już wiemy, retrowirusy mogą tworzyć sekwencję DNA, która jest włączana do genomu gospodarza jako prowirus. Jeśli infekcja, której skutkiem jest taka wstawka, zajdzie w komórce linii płciowej, to prowirus może zostać odziedziczony przez potomstwo wraz z DNA rodzicielskim. O ile prowirus nie wyrządza nosicielowi szkody albo przynosi korzyść, która kompensuje ewentualne szkody, może się szerzyć w populacji nie dzięki zakażaniu jej przedstawicieli, ale dzięki dziedziczeniu. Staje się składnikiem puli genetycznej i w sprzyjających okolicznościach może w końcu utrwalić się w całej populacji, często w postaci wielu kopii wklejonych w różnych miejscach genomu.

Dziedziczony prowirus przez pewien czas pozostaje potencjalnie aktywny, tzn. zdolny do wyprodukowania postaci zakażającej (wirionów opuszczających komórkę) lub do tworzenia nowych kopii samego siebie dzięki retrotranspozycji (o której będzie mowa poniżej). Ale po upływie czasu odpowiadającego setkom lub tysiącom pokoleń mutacje w końcu uszkadzają go, odbierając mu tę zdolność. Jak już jednak wiemy, nie oznacza to, że wirusowe DNA znika z genomu gospodarza, choćby nawet nie było do niczego potrzebne. Może w nim trwać po wieczne czasy, a po dziesiątkach milionów lat jest nadal rozpoznawalne – podobnie jak pseudogeny. Ściślej mówiąc, z czasem sam staje się grupką pseudogenów (chyba że jakaś jego część uzyskuje „nowe życie”, o czym będzie mowa w kolejnym odcinku).

Ryc. 1.

Taką utrwaloną pozostałość po infekcji retrowirusowej nazywany retrowirusem endogennym lub w skrócie ERV (endogenous retrovirus). Powstanie ERV i jego utrwalenie się w populacji jest ogólnie zjawiskiem rzadkim, ale w ewolucyjnej skali czasu dochodziło do niego wielokrotnie w każdej linii rodowej kręgowców (innych zwierząt, jak wspominałem w poprzednim wpisie, wirusy z rodziny Retroviridae nie atakują). W genomie Homo sapiens rozpoznawalne retrowirusy endogenne stanowią około 8% jego zawartości. To dość dużo, jeśli zważymy, że funkcjonalnego DNA mamy mniej więcej tyle samo.

Porównując wstawki ERV w genomach różnych kręgowców, stwierdzamy, że w dużym stopniu odzwierciedlają one strukturę niezależnie ustalonych pokrewieństw ewolucyjnych. Gatunki tworzące klad (grupę wywodzącą się od wspólnego przodka i obejmującą wszystkich jego potomków) mają zwykle wiele ERV wyraźnie ortologicznych (reprezentujących te same „gatunki” retrowirusów zajmujące te same lokalizacje w genomie), co świadczy o tym, że odpowiednie prowirusy były obecne u ostatniego wspólnego przodka całej grupy. Z jednej strony oznacza to, że retrowirusy endogenne mogą być wykorzystywane w badaniach filogenetycznych, a z drugiej strony – możemy w ten sposób rekonstruować historię retrowirusów i datować punkty rozchodzenia się ich linii ewolucyjnych. Co prawda przeszkadzają w tym pewne komplikacje. „Klasyczne” retrowirusy mogą zmieniać gospodarzy, przeskakując czasem nawet między odlegle spokrewnionymi gatunkami kręgowców, a nieunikniony rozkład resztek prowirusów w genomie wskutek kumulowania się mutacji powoduje, że rozpoznanie śladów infekcji starszych niż 100 mln lat staje się trudne lub niemożliwe. Te organiczenia daje się jednak obejść, na przykład uwzględniając w analizach dane dotyczące słabiej zbadanych, a za to bardziej swoistych dla konkretnych gospodarzy retrowirusów z podrodziny Spumaretrovirinae (wirusów pienistych), które również pozostawiają ślady w postaci ERV. Badania wskazują, że Retroviridae wyewoluowały najpóżniej w ordowiku (ok. 450 mln lat temu), a być może nawet znacznie wcześniej, i infekowały już wspólnych przodków wszystkich współczesnych kręgowców. Musiały zatem pojawić się najpierw w środowisku morskim, a na ląd wyszły wraz z czworonogami.

Dalsi krewni retrowirusów

Mówiliśmy dotąd o retrowirusach w ścisłym sensie, ale ich prowirusy nie są jedynymi składnikami genomu zdolnymi do powielania się kosztem gospodarza i realizującymi swoje egoistyczne interesy w formie „samolubnego DNA”. Do tej kategorii należą fragmenty genomu samopowielające się za pośrednictwem RNA – tak zwane retrotranspozony.6 Niektóre z nich zaopatrzone są na obu końcach w długie powtórzenia końcowe (long terminal repeats, LTR), podobnie jak prowirusy i pochodzące od nich retrowirusy endogenne. Właściwie różnica między retrotraspozonami LTR a retrowirusami endogennymi polega głównie na tym, że u tych drugich widać pozostałości genów kodujących białka współtworzące otoczkę wirusową, w zasadzie nieobecne u retrotranspozonów LTR. Natomiast jedne i drugie posiadają geny białek potrzebnych do replikacji wewnątrzkomórkowej, m.in. białek strukturalnych tworzących opakowanie genomu RNA (kapsyd) oraz własnej odwrotnej transkryptazy i integrazy. Pozostają na swoim miejscu w genomie, lecz za pomocą kodowanych przez siebie białek mogą produkować wirusopodobne twory umożliwiające transport swojego materiału genetycznego wraz z niezbędnymi enzymami w postaci dwu pojedynczych nici RNA i – po odwrotnej transkrypcji z RNA na DNA przeprowadzonej wewnątrz opakowania – wklejanie własnej kopii do innej lokalizacji w genomie bez opuszczania komórki. Taki sposób namnażania się, charakterystyczny dla retrowirusów i retrotranspozonów, nazywamy retrotranspozycją.

Retrotranspozony LTR zaliczane do rodziny Metaviridae (znane też jako Ty3-gypsy) spotyka się w genomach gatunków należących do wszystkich głównych gałęzi ewolucyjnych eukariontów, a pod względem zestawu, kolejności i sekwencji nukleotydowej występujących w nich genów są tak bliskie Retroviridae, że na podstawie analiz filogenomicznych obie rodziny uważa się za ściśle spokrewnione. Biorąc pod uwagę ich zasięg występowania wśród eukariontów, można sądzić, że Metaviridae wywodzą się od znacznie starszych przodków, a Retroviridae wyewoluowały w ich obrębie, choć przy obecnym stanie wiedzy szczegółowe scenariusze filogenetyczne są trudne do zweryfikowania. W każdym razie jedne i drugie są wirusami z ewolucyjnego punktu widzenia, nawet jeśli uległy całkowitej endogenizacji w DNA gospodarza. To samo dotyczy ich nieco dalszych kuzynów, retrotranspozonów LTR z rodziny Pseudoviridae (znanych jako Ty1-copia).

Ryc. 2.

W genomie ludzkim oprócz ERV szczególnie znaczącą rolę odgrywają jednak inne retrotranspozony – nieposiadające LTR. Są to tzw. długie i krótkie rozproszone elementy jądrowe, LINE i SINE. Ich pochodzenie nie jest jasne. LINE zawierają dwa geny białek, z których jedno wiąże mRNA, a drugie może pełnić funkcje odwrotnej transkryptazy i endonukleazy (rozcinającej łańcuch DNA). Oba białka wraz mRNA tworzą kompleks, który tworzy się w cytoplazmie, przenika do jądra i po dokonaniu odwrotnej transkrypcji wkleja nową kopię LINE do genomu. SINE nie kodują własnej odwrotnej transkryptazy, ale tworzą swoje „wklejane” kopie, korzystając z enzymów innych retrotranspozonów (są więc w zasadzie pasożytami pasożytów genomu). Od czasu do czasu (choć skrajnie rzadko) odwrotna transkryptaza LINE umożliwia genomom wirusów RNA nieposiadających takiego enzymu endogenizację „na gapę”. Badacze ewolucji wirusów znaleźli w genomach wielu linii rodowych ssaków utrwalone ślady dawnych infekcji dokonanych zwłaszcza przez bornawirusy (Bornaviridae), których szczególny cykl replikacji (w obrębie jądra komórkowego) najwyraźniej zwiększa prawdopodobieństwo takich zdarzeń.

Omawianie innych „skaczących genów”, czyli transpozonów DNA, wycinających się z jednego miejsca w genomie i wklejających w innym bez pośrednictwa RNA (a występujących nie tylko u eukariontów, ale także u bakterii i archeowców), nie należy już to tego wątku. Wspomnę tylko, że wszystkie elementy określane jako „transpozony” składają się co najmniej na ok. 45% ludzkiego DNA, a być może dodatkowo spora część pochodzi od transpozonów już nierozpoznawalnych. W stosunku do całej objętości genomu 8% stanowią retrowirusy endogenne, ok. 21% – retrotranspozony LINE (tak wysoki udział jest charakterystyczny dla ssaków oprócz stekowców), 13% – SINE, a 3% – transpozony DNA. W ogromnej większości są to elementy współcześnie nieaktywne – i dobrze, bo jako czynniki mutagenne mogłyby poważnie zakłócać normalne funkcje genomu. Tylko jeden ludzki retrowirus endogenny (HERV-K) uchodzi za potencjalnie zdolny do „wybudzenia się z letargu”, a spośród ok. 850 tys. kopii LINE w naszym genomie tylko 80–100 zachowało zdolność do retrotranspozycji (ich liczba może być różna u różnych ludzi).

W kolejnym odcinku serii będzie mowa o tym, jaką ewentualną korzyść dla swojego nosiciela (oprócz bardziej oczywistych zagrożeń) mogą oferować endogenizowane retrowirusy.

Przypisy

1) W przypadku jednoniciowego RNA lub DNA mówimy o nukleotydach (zawierających pojedyncze zasady) jako ich podstawowych jednostkach strukturalnych i za długość nici przyjmujemy liczbę nukleotydów.
2) Liczba ta dotyczy genomu haploidalnego, na który składa się po jednym z każdej pary chromosomów. Drugi chromosom z każdej pary autosomalnej zawiera w zasadzie te same elementy genetyczne, ale mogą się one nieco różnić (czyli stanowić różne allele – warianty tej samej sekwencji DNA), bo każdy z pary genów pochodzi od innego z rodziców.
3) Introny występują także u prokariontów (bakterii i archeowców) oraz wirusów, ale nie są tak rozpowszechnione ani tak długie jak u eukariontów.
4) W wielu przypadkach eksony stanowiące część jednego genu mogą być łączone w różny sposób, co oznacza, że ten sam gen może kodować różne białka (złożone z tych samych modułów w różnych kombinacjach) lub produkować różne cząsteczki niekodującego RNA. Jest to tzw. splicing alternatywny.
5) Jest to ogromna superrodzina białek. Szczur ma prawie 1300 genów kodujących sprawne  receptory zapachów; człowiek – niecałe 300 (pomijając ponad drugie tyle pseudogenów), co i tak stanowi ok. 1,5% wszystkich naszych genów kodujących białka.
6) Technicznie rzecz biorąc, retrowirusy endogenne także są jedną z kategorii retrotranspozonów.

Lektura dodatkowa

Więcej o retroelementach endogennych w genomie człowieka: https://postepybiochemii.ptbioch.edu.pl/index.php/PB/article/view/272/443
O pochodzeniu retrowirusów: https://www.sciencedirect.com/science/article/pii/S187962571730041X

Opisy ilustracji

Ryc. 1. Schemat replikacji aktywnych retrotraspozonów RTL typów Ty3-gypsy i Ty1-copia (rodziny Metaviridae, Pseudoviridae), bardzo podobny jak u aktywnych endogennych Retroviridae. RNA tworzone na podstawie transpozonowego DNA jest eksportowane do cytoplazmy, tam ulega translacji, po czym nici RNA wraz z potrzebnymi enzymami zamykane są w białkowych kapsydach, tworząc „cząstki wirusopodobne”, wewnątrz których zachodzi traskrypcja odwrotna. Wyprodukowane w ten sposób DNA wraca do jądra i zostaje wplecione w genom gospodarza w nowej lokalizacji. Źródło: Pachulska-Wieczorek et. al. 2016 (licencja: CC-BY 4.0).
Ryc. 2. Barbara McClintock (1902–1992), odkrywczyni ruchomych elementów genetycznych, czyli transpozonów (nagroda Nobla z fizjologii i medycyny 1983, trzydzieści lat po odkryciu, które przez długi czas było ignorowane i zapomniane). Gatunkiem badanym przez przyszłą noblistkę była kukurydza (Zea mays). Genom kukurydzy jest nieco mniejszy niż ludzki, choć zawiera ok. dwa razy więcej genów kodujących białka. Jego wyjątkowo duża część (ok. 84%) składa się z transpozonów, z których 90% to retrotraspozony LTR. Nie popełnimy więc przesady, jeśli stwierdzimy, że trzy czwarte DNA kukurydzy jest pochodzenia wirusowego. Foto: Cristian472735. Źródło: Wikipedia (licencja CC BY-SA 4.0).