Co zawdzięczamy wirusom (6): nowy obraz ewolucji życia

Inne wpisy z tej serii:
Co zawdzięczamy wirusom (1): kilka pytań fundamentalnych
Co zawdzięczamy wirusom (2): bakteriofagi, czyli wielopoziomowa gra strategiczna
Co zawdzięczamy wirusom (3): podstępni włamywacze, czyli wirusy w stylu retro
Co zawdzięczamy wirusom (4): dygresja o naszym genomie i ukrytych w nim wirusach
Co zawdzięczamy wirusom (5): nie ma tego złego, co by na dobre nie wyszło

Jeszcze raz: czym są wirusy?

Badania ostatnich kilkudziesięciu lat, zwłaszcza wskutek postępu, jaki się dokonał  w genetyce i biologii molekularnej, gruntownie zmieniły naszą wiedzę o wirusach (zresztą podobnie jak o organizmach komórkowych). Dość powiedzieć, że o ile pół wieku temu wirusy dzielono umownie na dwie rodziny, dziś klasyfikacja ICTV (Międzynarodowego Komitetu Taksonomii Wirusów) wyróżnia 6 domen, 10 królestw, 72 rzędy i 264 rodziny (nie wspominając o wielu wirusach o niepewnym stanowisku systematycznym), przy czym liczby te rosną dosłownie z miesiąca na miesiąc i jest jasne, że wirusy dotąd zbadane i opisane stanowią tylko ułamek ich rzeczywistej różnorodności.

Badania nad genomiką porównawczą wirusów i nad ich związkami z poszczególnymi grupami organizmów komórkowych rzuciły wreszcie trochę światła na zagadkę pochodzenia wirusów. Opisane w poprzedniej części cyklu innowacje ewolucyjne, które zawdzięczamy wirusom, bledną wobec hipotez, wg których np. DNA i mechanizmy jego replikacji zostały „wynalezione” przez wirusy w czasach, gdy życie komórkowe stawiało pierwsze kroki i było wciąż oparte na RNA jako nośniku informacji.1 Wirusy mogły także odegrać znaczącą rolę w ewolucji eukariontów, uczestnicząc w procesach, które doprowadziły do utworzenia jądra komórkowego. Są to koncepcje spekulatywne, ale traktowane poważnie.

W odróżnieniu od organizmów komórkowych wirusy nie mają uniwersalnego zestawu genów/białek, których homologi (formy sprowadzalne do wspólnego przodka) występowałyby we wszystkich liniach ewolucyjnych. Białka tworzące kapsydy wirusów wyewoluowały niezależnie co najmniej dwa razy, a między różnymi liniami wirusów często zachodziła wymiana poszczególnych modułów genomu, dlatego ich genealogia niekoniecznie układa się w eleganckie drzewo rodowe, ale miejscami przypomina splątany krzak. Znaczna część genów wirusowych nie ma w ogóle odpowiedników wśród organizmów komórkowych. Jeśli wirusy są reliktami świata starszego niż LUCA (ostatni wspólny przodek współczesnych organizmów komórkowych), to mogą przechowywać zakonserwowaną genetycznie informację o wczesnych odgałęzieniach „drzewa życia”, które nie pozostawiły po sobie komórkowych potomków.

Wirusy olbrzymie

Dwadzieścia lat temu (w roku 2003) opisano pierwszego z wirusów-gigantów, zaliczanych obecnie do klasy Megaviricetes. Wraz z dwiema innymi grupami (do których należy np. ASFV, czyli wirus afrykańskiego pomoru świń, oraz cała rodzina wirusów ospy) tworzą one typ Nucleocytoviricota, czyli wirusów olbrzymich w szerszym sensie. Tym gigantem był Mimivirus, pasożytujący na pełzakach Acanthamoeba polyphaga. Kapsyd mimiwirusa ma średnicę ok. 0,5 μm, a wraz z otaczającymi go białkowymi włókienkami – 0,75 μm. Oznacza to, że jest on widoczny pod mikroskopem optycznym. Z tego powodu, choć mimiwirusy obserwowano już we wczesnych latach dziewięćdziesiątych XX w., przez ponad dziesięć lat lat brano je omyłkowo za bakterie.

Mimiwirusy są nie tylko duże, ale i skomplikowane. Mają genomy o długości ponad miliona par zasad, zawierający około tysiąca genów (a nawet ok. 10% DNA „śmieciowego”, co wśród wirusów jest ewenementem). Niektóre z tych genów zawierają introny i są poddawane splicingowi, jak typowe geny eukariontów. Po co wirusowi tak ogromna liczba genów? Oprócz genów normalnie występujących u wirusów (kodujących białka strukturalne i kilka enzymów, bez których wirus nie mógłby się powielać) mimiwirus zawiera też mnóstwo takich, których spodziewano by się wyłącznie u organizmów komórkowych. Kodują one np. swoiste enzymy katalizujące wiązanie poszczególnych aminokwasów z transportowym RNA (syntazy aminoacylo-tRNA), czynniki translacyjne, własną unikatową rodzinę cytochromów P450 (jedną z ich licznych funkcji jest unieszkodliwianie obcych toksyn), białka odpowiedzialne za metabolizm aminokwasów, lipidów i polisacharydów, syntezę nukleotydów czy naprawę DNA. Są tam także geny niekodujące, służące do produkcji tRNA. Funkcja większości genów mimiwirusów pozostaje nieznana i być może jeszcze nas zaskoczy.

Oznacza to, że mimiwirus nie zdaje się na to, co znajdzie u gospodarza, ale włamuje się z całą ciężarówką własnych narzędzi i zakłada fabrykę swoich kopii, funkcjonującą jak organellum komórki żywicielskiej. Ponieważ taką fabrykę mogą wziąć na cel wirofagi (wirusy pasożytujące na wirusach olbrzymich), mimiwirus posiada też zapisane w DNA środki obrony przed wirofagami. Z punktu widzenia koncepcji wirocelu, o której wspominałem na początku tego cyklu, wewnątrzkomórkowe stadium życia mimiwirusa trudno określić inaczej niż jako organizm – i to dość skomplikowany.

Ryc. 1.

Mimivirus wyglądał początkowo na wybryk natury, ale poszukiwania innych wirusów tego typu szybko doprowadziły do podobnych odkryć. Obecnie (1 września 2023 r.) Nucleocytoviricota dzielone są roboczo na 11 rodzin i 54 rodzaje, ale jest oczywiste, że rzeczywista liczba jednostek taksonomicznych w randze rodzin powinna raczej iść w dziesiątki, a rodzajów –  w setki (i dotyczy to wirusów już zaobserwowanych, a nie tych jeszcze nieodkrytych).2 Nie wszyskie są naprawdę olbrzymie, ale rekordziści budzą respekt: mogą mieć kapsydy o długości 1,5 μm (czyli niewiele mniejsze niż komórka bakterii z modelowego gatunku Escherichia coli) albo genomy o długości ok. 2,5 mln par zasad. Zestaw genów odkryty  mimiwirusa nie jest dziwacznym wyjątkiem, ale powszechną cechą wirusów olbrzymich.

O ile początkowo znajdowano gigantyczne wirusy w dość specyficznych środowiskach, obecnie wydaje się, że można na nie natrafić właściwie wszędzie. Wskazują na to badania metagenomowe, identyfikujące ich DNA w rozmaitych środowiskach. Aby potwierdzić ich obecność za pomocą danych morfologicznych, ostatnio zespół mikrobiologów zbadał pod transmisyjnym mikroskopem elektronowym próbki gleby leśnej pobranej z amerykańskiej stacji badań ekologicznych Harvard Forest w stanie Massachussetts, należącej do Uniwersytetu Harvarda. Poszukiwano tworów, które mogłyby być wirionami wirusów olbrzymich. Znaleziono ich setki o najrozmaitszych kształtach, w tym wiele „klasycznych” kapsydów dwudziestościennych, albo pozbawionych dodatków, albo otoczonych włókienkami (jak u mimiwirusa), zaopatrzonych w symetrycznie rozłożone wypustki lub rurkowate ogonki (jak u rodzaju Tupanvirus). Niektóre mają kształt owalny (jak u rodzajów Pandoravirus czy Pithovirus). Sam wygląd nie stanowi niezbitego dowodu, że mamy do czynienia z wirusami, potrzebne są zatem dalsze badania, ale właściwie trudno sobie wyobrazić, czym innym mogłyby być te wirusopodobne cząstki.3

Ryc. 2.

Wirusy olbrzymie z rzędu Algavirales występują szczególnie obficie w środowiskach wodnych, gdzie infekują planktoniczne eukarionty należące do rozmaitych gałęzi drzewa życia. Jednym z nich jest Chlorovirus, którego liczne gatunki pasożytują na jednokomórkowych zielenicach. Jest go tyle, że dla niektórych orzęsków (np. pantofelków, czyli Paramecium) stanowi istotny składnik pokarmowy. Orzęski z rodzaju Halteria są jedynymi znanymi eukariontami, które potrafią przeżyć na diecie złożonej z samych chlorowirusów. W warunkach laboratoryjnych jeden osobnik halterii konsumuje od 10 tys. do miliona wirusów dziennie. Szacuje się, że w niewielkim stawie populacja halterii pożera 1014–1016 (od stu bilionów do stu bilardów) wirusów olbrzymich na dobę, przy czym sama stanowi pokarm dla zooplanktonu. Ten łańcuch pokarmowy  ma zauważalny wpływ na obieg węgla, azotu i fosforu w tym ekosystemie.

Epilog  z morałem

Wirusy nie mają własnego stadium komórkowego, choć można powiedzieć, że są „porywaczami ciał”, uprowadzającymi i wykorzystującymi do własnych celów fenotypy organizmów komórkowych. Nie produkują rybosomów (które są wspólnym dziedzictwem wszystkich potonków LUCA), a zatem nie syntetyzują białek samodzielnie. Do przenoszenia swojego materiału genetycznego używają kapsydów, których białka tworzy gospodarz na podstawie specyfikacji dostarczonej przez wirusa. Czasem pożyczają geny gospodarza, ale częściej same są źródłem innowacji genetycznych i przenoszą do świata organizmów komórkowych geny i białka wcześniej w nim nieznane. Gdziekolwiek występuje życie komórkowe, tam można znaleźć także wirusy, nie ma więc przed nimi ucieczki. Na szczęście jest to naturalny stan rzeczy od około czterech miliardów lat, więc poza epizodami drastycznego naruszenia równowagi wirus–gospodarz koegzystujemy sobie dość harmonijnie.

Tradycyjne wyobrażenie o wirusach jako prymitywnych „czynnikach zakaźnych, których nie zatrzymują porcelanowe sączki bakteryjne”, należących bardziej do świata chemii niż biologii4, jest dziś kompletnie anachroniczne. Wirusy są tak ważnymi uczestnikami życia na Ziemi i jego ewolucji, że akademickie pytanie, czy same wirusy są żywe, w ogóle przestaje mieć znaczenie. I to także zawdzięczamy wirusom: zrozumienie, że definicja życia jest nieostra i że na jego ewolucję trzeba patrzeć z szerokiej perspektywy, w której historia wirusów nie jest przypisem, ale jednym z centralnych rozdziałów.

Przypisy

1) Wirusy mogą oczywiście używać zarówno RNA, jak i DNA w wersji jednoniciowej lub dwuniciowej, ale odwrotna transkrypcja, czyli przepisywanie informacji genetycznej z RNA na  DNA jest specjalnością retrowirusów (w szerokim sensie).
2) Patrz https://ictv.global/taxonomy (domena Varidnaviria, królestwo Bamfordvirae, typ Nucleocytoviricota).
3) Artykuł opisujący te obserwacja dostępny jest w postaci preprintu dopiero oczekującego na recenzje i publikacje: https://www.biorxiv.org/content/10.1101/2023.06.30.546935v1.full
4) Wendell M. Stanley otrzymał w roku 1946 r. nagrodę Nobla nie z „fizjologii i medycyny”, ale z chemii za „wyizolowanie wirusa mozaiki tytoniu w czystej formie krystalicznej”.

Lektura dodatkowa

Embarras de richesse, czyli problemy z klasyfikacją wirusów i potrzeba reformy: https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3001922
Czego dowiadujemy się o ewolucji od wirusów: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3755228/
Wirusy olbrzymie: https://www.sciencenews.org/article/meet-giants-among-viruses
Wirusy olbrzymie a eukarionty i jądro komórkowe: https://www.sciencedirect.com/science/article/pii/S1369527416300017, https://www.sciencedirect.com/science/article/pii/S0168170220310753
Wirusożerne orzęski: https://www.sciencenews.org/article/first-microbes-eat-virus-virovory-algae

Opisy ilustracji

Ryc. 1. Rekonstrukcja drzewa filogenetycznego wybranych wirusów olbrzymich (Nucleocytoviricota). Według obecnego stanu wiedzy drzewo to jest o wiele większe i bardziej skomplikowane. Jest ono zakorzenione w czasach poprzedzająych pojawienie się ostatniego wspólnego przodka organizmów komórkowych (LUCA). Źródło: Colson et al. 2011 (licencja CC BY 3.0).
Ryc. 2. Niektóre z typów morfologicznych potencjalnych wirionów wirusów olbrzymich z Harvard Forest. Źródło: Fischer et al. 2023 (bioRχiv preprint, licencja CC BY-NC-ND 4.0).

Co zawdzięczamy wirusom (5): nie ma tego złego, co by na dobre nie wyszło

Inne wpisy z tej serii:
Co zawdzięczamy wirusom (1): kilka pytań fundamentalnych
Co zawdzięczamy wirusom (2): bakteriofagi, czyli wielopoziomowa gra strategiczna
Co zawdzięczamy wirusom (3): podstępni włamywacze, czyli wirusy w stylu retro
Co zawdzięczamy wirusom (4): dygresja o naszym genomie i ukrytych w nim wirusach
Co zawdzięczamy wirusom (6): nowy obraz ewolucji życia

Wirus odwdzięcza się za gościnę

W drugim odcinku niniejszej serii była mowa o tym, jak bakteriofagi potrafią przynieść korzyść bakterii, w której genomie umieściły swojego uśpionego profaga, powielającego się niezłośliwie w cyklu lizogenicznym. Jedną z korzyści była ochrona przed ponowną infekcją tym samym lub blisko spokrewnionym wirusem. Czy coś podobnego działa także w przypadku retrowirusów atakujących kręgowce? Aczkolwiek nie wchodzi tu w grę mechanizm stosowany przez fagi, wiele badań wskazuje, że produkty ekspresji genów pochodzących od retrowirusów endogennych (ERV) mogą wpływać na układ odpornościowy, a ponadto na różne, nie do końca zbadane sposoby bezpośrednio ograniczać zdolność wirusów egzogennych do infekowania komórek i skutecznego przeprowadzania odwrotnej transkrypcji.

Jeśli endogenizacja zachodzi w warunkach długotrwałej epidemii (kiedy jeden z typów retrowirusa chorobotwórczego może zakażać komórki linii płciowej i instalować swojego prowirusa w ich DNA, po czym łagodnieć wskutek gromadzenia się mutacji), może się zdarzyć, że nosiciele prowirusa uzyskują zwiększoną odporność na zakażenie typem egzogennym. Wydaje się, że coś w tym rodzaju obserwujemy w przypadku retrowirusa KoRV infekującego koale (Phascolarctos cinereus). Wirus ten wywołuje objawy podobne do AIDS u ludzi, choć łagodniejsze: osłabienie układu odpornościowego i w konsekwencji podatność na nowotwory złośliwe i zakażenia oportunistyczne (głównie chlamydiozę).

Ryc. 1.

Jeden z typów KoRV jest zdolny do zakażania bardzo różnorodnych rodzajów komórek, także należących do linii płciowej, i ma w związku z tym skłonność do endogenizacji. Jest to proces ewolucyjny odbywający się na naszych oczach: niektóre populacje koali są w ogóle wolne od KoRV, inne są zakażone praktycznie w 100%. Prowirus w komórkach linii płciowej może ulegać rekombinacji z innymi, dawno zdegradowanymi retrowirusami endogennymi, czego wynikiem są warianty zawierające defekty. Są one wciąż zdolne do namnażania się przez retrotranspozycję i wywoływania szkód, ale mniej zjadliwe niż kompletna forma wyjściowa. Mogą zatem szerzyć się w populacji kosztem nieuszkodzonego wirusa, jednocześnie zapewniając nosicielom zwiększoną odporność na zakażenie egzogennymi krewniakami.1 Dobór może w takiej sytuacji premiować mniejsze zło chroniące przed większym. Niewykluczone, że jest to jeden z częstych scenariuszy skutecznego utrwalania się ERV w genomach gospodarzy.

Pół miliarda lat wyścigu zbrojeń

Kręgowce (Vertebrata) są zaopatrzone w wyjątkowy system odpornościowy, w którym oprócz powszechnej wśród eukariontów odporności nieswoistej (wrodzonej) kluczową rolę odgrywa wysoce zaawansowana odporność swoista (adaptacyjna). System ten, oparty na aktywności limfocytów i komórek prezentujących antygeny, potrafi rozpoznawać olbrzymią liczbę nowych „substancji obcych”, wiązać je za pomocą precyzyjnie dobranych przeciwciał i niszczyć, a także przechowywać pamięć o nowo napotkanych antygenach. Dzieje się to dzięki generowaniu ogromnej zmienności przeciwciał (immunoglobulin) i receptorów limfocytów B i T. Ich geny tworzone są przez składanie (rekombinację) kilku modułów losowo wybranych z puli kilkuset genów obecnych w genomie, a następnie dodatkową modyfikację produktu tego składania. Liczba potencjalnie wytwarzanych przeciwciał jest zatem miliony razy większa niż liczba dziedziczonych genów kodujących przeciwciała. Zauważmy, że ponieważ proces rekombinacji i selektywnego powielania przeciwciał pasujących do antygenów zachodzi w komórkach somatycznych, jakimi są limfocyty, jego wynik nie jest dziedziczony z pokolenia na pokolenie. Każdy osobnik rozwija własną, indywidualną odporność swoistą.

Odporność swoista wyewoluowała najprawdopodobniej w kambrze, ok. 500 mln lat temu. Bezżuchwowce (śluzice i minogi), czyli linie rodowe najdawniej oddzielone od reszty kręgowców, posiadają system alternatywny, który powstał w dużym stopniu niezależnie, choć działa w nieco analogiczny sposób. Zamiast immunoglobulin (białek dopasowywanych do antygenów) rolę przeciwciał odgrywają w nim zmienne receptory limfocytów.

System odporności swoistej pozostałych kręgowców, czyli żuchwowców (Gnathostomata) nie został odziedziczony po dalekich przodkach, ale rozwinął się w stosunkowo krótkim czasie między ostatnim wspólnym przodkiem wszystkich kręgowców a rozejściem się linii ewolucyjnych chrzęstnoszkieletowych i kostnoszkieletowych (u obu grup zasadniczo ten sam system istnieje w rozwiniętej formie).2 Jest to fakt zastanawiający, bo choć rozmaite elementy uczenia się reakcji na antygeny i pamięci immunologicznej występują także u innych organizmów (nie wyłączając prokariontów), różnica jakościowa między tymi rozwiązaniami  prekursorowymi a systemem odporności kręgowców jest uderzająca.

Powstanie tak skutecznej ochrony przed patogenami zbiegło się w czasie z pojawieniem się właściwych retrowirusów (rodzina Retroviridae), które współcześnie atakują wyłącznie kręgowce. Ponieważ retrowirusy są pasożytami wyrafinowanymi, stosującymi pomysłowe strategie w celu uniknięcia rozpoznania i eliminacji przez organizm gospodarza, a przy tym szybko ewoluującymi, można podejrzewać, że z kolei adaptacyjny system odporności swoistej pojawił się jako odpowiedź kręgowców w wyścigu zbrojeń z wirusami.

Kluczowym składnikiem systemu są RAG1 i RAG2, czyli „geny aktywujące rekombinację”, ulegające ekspresji w rozwijających się limfocytach B i T. Kodowane przez nie enzymy (oczywiście nie samodzielnie, ale z pomocą innych białek) regulują proces wycinania, tasowania i łączenia wspomnianych wyżej modułów. Od dość dawna wiadomo, że geny RAG są spokrewnione z genem kodującym transpozazę używaną przez transpozony DNA z grupy nazywanej Transib (transpozaza jest to enzym umożliwiający elementom ruchomym przemieszczanie się w genomie metodą „wytnij i wklej”). Co dziwne, transpozony Transib nie występują u kręgowców, choć można je znaleźć u zwierząt dość blisko z nimi spokrewnionych, np. szkarłupni. W 2016 r. odkryto u lancetnika Branchiostoma belcheri transpozon, który wydaje się „żywą skamieniałością”: w odróżnieniu od swoich krewniaków zawiera odpowiedniki obu genów RAG. Lancetniki nie są kręgowcami, ale należą wraz z nimi do typu strunowców (Chordata). Skoro zatem prekursor kompleksu RAG istniał u prymitywnych strunowców (po czym jego oryginalna forma zanikła w linii rodowej kręgowców), hipoteza zakładająca transpozonowe pochodzenie genów sterujących systemem odporności swoistej stoi na pewniejszym gruncie.

Transpozony DNA tego konkretnego typu trudno nazwać wirusami: ich pochodzenie ginie gdzieś w mrokach wczesnej ewolucji życia na Ziemi i brak dowodów na ich wirusową genealogię; ale są to w każdym razie elementy na ogół „pasożytnicze”, powielające się samolubnie. W tym przypadku jednak ich enzymy zostały wykorzystane przez gospodarza (przodka żuchowców) w nowej funkcji, robiąc zawrotną karierę na jego usługach.

Ssaki, białka osłonki i żyworodność

Często się zdarza, że jakiś produkt ewolucji, ukształtowany pod naciskiem selekcyjnym tak, aby sprawnie pełnić jakieś funkcje biologiczne, okazuje się nagle przydatny w zupełnie nowych zastosowaniach. Zjawisko to nazywamy egzaptacją albo kooptacją. Często prezentowanym przykładem są pióra, które wyewoluowały jako wielofunkcyjna okrywa ciała dinozaurów, ale tylko w jednej z ich linii rodowych – u przodków ptaków – okazały się dodatkowo przydatne jako powierzchnia nośna umożliwiająca aktywny lot. Inny przykład to język, pełniący u czworonogów najrozmaitsze fukcje, a u człowieka zaadaptowany jako jeden z najważniejszych narządów mowy (przy zachowaniu wielu dawnych funkcji). Ponieważ wirusy endogenne przez pewien czas pozostają aktywne jako potencjalne źródło produktów zakodowanych w prowirusie, należy się spodziewać, że od czasu do czasu któryś z tych produktów przyda się gospodarzowi i zostanie przejęty w celu pełnienia nowej funkcji.

Wspominałem w poprzednim wpisie, że jedną z cechą charakterystycznych retrowirusów endogennych (w odróżnieniu od innych retrotranspozonów LTR) jest zachowanie śladów genów zwanych env, kodujących białka, które wchodzą w skład lipidowej osłonki wirusa (zwykle jako glikoproteinowe wypustki/kolce na jego powierzchni). Białka tego typu wiążą się z receptorami błonowymi komórek i umożliwiają fuzję błony komórki i osłonki wirusa. Dzięki tym mechanizmom retrowirus przeprowadza „abordaż” i wtargnięcie do infekowanej komórki, a po zakończeniu cyklu replikacyjnego jego młode wiriony mogą opuścić komórkę.

Białka env mogą zatem stanowić coś w rodzaju „rozpuszczalnika molekularnego”, powodującego fuzję błon komórkowych i kontrolowane (w odróżnieniu od patologicznego) zlewanie się komórek w olbrzymie wielojądrowe syncytia. Z takich syncytiów składa się syncytiotrofoblast, końcowa część łożyska, wnikająca w ścianę macicy.3 Syncytium maksymalizuje powierzchnię wymiany składników odżywczych między matką a zarodkiem/płodem, zarazem stanowiąc barierę dla komórek układu odpornościowego matki. Nie pozostawia bowiem przestrzeni międzykomórkowej, przez które mogłyby się one prześliznąć i zaatakować „obcy” organizm potomka.

Białka biorące udział w tworzeniu synctytiów łożyska, zwane syncytynami, są w prostej linii potomkami białek env „pożyczonych” od retrowirusów i kooptowanych w nowej roli. Wirusy, które ich użyczyły, są od dawien dawna nieaktywne. Moduły prowirusa kodujące białka kapsydu i enzymy umożliwiające odwrotną transkrypcję zostały nieodwracalnie uszkodzone przez liczne mutacje. Natomiast gen env dostał „nowe życie” jako kluczowy element procesu reprodukcyjnego ssaków żyworodnych.

Przygoda ssaków z białkami erv musiała się zacząć już u wspólnych przodków kladu Theria, zanim rozwidliły się linie ewolucyjne łożyskowców (Eutheria) i torbaczy (Metatheria) – czyli zapewne we wczesnej jurze (ok. 190 mln lat temu). Torbacze także tworzą łożysko i także wykorzystują w tym celu białka typu syncytyn.4 Zupełnie niezależnie od ssaków ryby żyworodne (np. piękniczkowate, Poeciliidae) i niektóre jaszczurki (afrykańskie scynki Lubuya ivensii) wykształciły struktury pełniące rolę łożyska i – co już chyba nie powinno dziwić – również zaadaptowały do ich budowy retrowirusowe białka env.

Ryc. 2.

Co ciekawe, uzależniwszy się od pożyczonego białka, ssaki nie zadowoliły się jednorazową egzaptacją genu env, ale co pewien czas (zwykle co kilkadziesiąt milionów lat) wymieniają go na „nowy model”. W różnych liniach rozwojowych łożyskowców następowało pozyskiwanie nowych wariantów erv od retrowirusów endogennych, a także utrata wariantów odziedziczonych po dalszych przodkach. Dwie syncytyny, które ulegają ekspresji u człowieka, są stosunkowo niedawnego pochodzenia. Gen kodujący syncytynę-1 występuje u małp wąskonosych, ale nie szerokonosych, został zatem egzaptowany 30–35 mln lat temu, już po zróżnicowaniu się małp na te dwie grupy. Gen starszej syncytyny-2 występuje u wszystkich małp, choć brak go u wyraków i małpiatek, liczy więc sobie zapewne ok. 40–45 mln lat.

Wirusy a układ nerwowy

Wciąż słabo poznany, ale jak się zdaje, bardzo ważny wkład wirusów w naszą ewolucję zawdzięczamy retrotranspozonom LTR typu TY3-gypsy, czyli prastarym wirusom z rodziny Metaviridae. Pożyczony z ich arsenału gen ARC – a właściwie rodzina genów, której protoplasta pojawił się u wspólnego przodka czworonogów (Tetrapoda) jakieś 350 mln lat temu – ulega ekspresji w komórkach układu nerwowego. ARC zachowuje się podobnie jak wirus: produkuje białko, które z kolei oddziałuje z kodującym je mRNA, obudowując je płaszczem przypominającym kapsyd. Powstające w ten sposób wirusopodobne cząsteczki przekazywane są przez zakończenia synaps, „zakażając” kolejne neurony.

O tym, co dokładnie zachodzi wskutek tej międzykomórkowej wymiany mRNA i jakiego typu informacja jest przekazywana, niewiele jeszcze da się powiedzieć, ale z badań, w których mysi gen ARC poddawano inaktywacji lub wyciszaniu, wynika, że od jego aktywności zależy plastyczność synaps, a pośrednio – organizacja pracy neuronów opraz procesy związane z uczeniem się i pamięcią długotrwałą. Być może nasze zdolności poznawcze, inteligencję i świadomość również w dużym stopniu zawdzięczamy egzaptacji elementów dostarczonych przez wirusy.

Morał

Przykłady wykorzystania elementów genetycznych pochodzenia wirusowego lub transpozonowego przez gospodarzy należących do różnych gałęzi drzewa życia można by długo wyliczać. Wpis na blogu musi zachować rozsądną objętość,  mogłem więc skrótowo zaprezentować tylko kilka z nich. Każdy rok przynosi zaskakujące odkrycia w tej dziedzinie. Nawet ta skromna próbka dowodzi jednak, że to, czym jesteśmy i w jaki sposób przebiegała ewolucja naszych przodków, w znacznym stopniu zależało od działalności wirusów. Tych samych, które infekują nasze komórki i są na ogół sprawcami chorób, często cierpienia i śmierci – a jednak czasem okazują się czynnikiem stymulującym ewolucję albo bezpośrednim źródłem ważnych, a nawet przełomowych innowacji biologicznych.

Faktem jest, że przeważająca większość sekwencji wirusowych i transpozonowych gromadzących się w genomie ulega typowej pseudogenizacji. To, co zostaje poddane „recyklingowi” i wtórnie wykorzystane (egzaptowane geny kodujące białka, sekwencje generujące użyteczne RNA, różnego rodzaju elementy regulatorowe) stanowi w gruncie rzeczy niewielką część pierwotnej zawartości „pasożytniczych” fragmentów DNA (endogennych wirusów, wszelkich retrotranspozonów czy transpozonów DNA) i jeszcze mniejszą część całego genomu. Wirusy nie są z natury ani naszymi wrogami, ani przyjaciółmi, ani narzędziami w ręku jakiejś siły wyższej. Działają bez świadomego celu, tak ukształtowane przez ewolucję, żeby jak najskuteczniej dbać o własny interes. Ale od czasu do czasu wynika z tego znacząca korzyść dla ich „ofiar”, a zatem pamiętajmy, że także z naszego ludzkiego punktu widzenia wirusy nie zasługują na to, żeby postrzegać je stereotypowo jako jednoznaczne zło i zagrożenie.

Przypisy

1) Nie oznacza to, że przyszłość koali rysuje się różowo. Ich populacje są zagrożone z wielu całkiem innych przyczyn (utrata i fragmentacja siedlisk, pożary lasów, konskewencje masowych polowań w przeszłości). Od początku XX w. do naszych czasów liczba koali skurczyła się prawdopodobnie o 99%. W tej sytuacji trwająca epidemia może być gwoździem do trumny gatunku niezależnie od naturalnych procesów endogenizacji wirusa, których zrozumienie jest ważne dla prób opracowania skutecznych szczepionek przeciwko KoRV.
2) Człowiek należy do żuchwowców, a w ich obrębie do kostnoszkieletowych (Osteichthyes). Celowo unikam tu nazwy „ryby kostnoszkieletowe”, bo „ryby” to termin nieformalny, a klad kostnoszkieletowych obejmuje nie tylko ryby. Jedną z grup kostnoszkieletowych są mięśniopłetwe (Sarcopterygia), do których spośród organizmów współczesnych należą trzonopłetwe, dwudyszne i czworonogi (czyli płazy, gady wraz z ptakami i ssaki). Kiedy mówimy o koewolucji kręgowców i wirusów, ważne jest zrozumienie, jak wygląda drzewo rodowe tych pierwszych i gdzie należy w nim szukać rodowodu człowieka.
3) Upraszczam tu skomplikowaną historię ewolucji łożyska, które u ssaków należy do najbardziej zmiennych i najszybciej ewoluujących struktur anatomicznych (co ma związek z egzaptacją białek wirusowych). Powyższy opis dotyczy w każdym razie łożyska człowieka i małp wąskonosych.
4) Wbrew rozpowszechnionym przekonaniom o „prymitywizmie” torbaczy, to biologia rozwojowa łożyskowców jest w większym stopniu odziedziczona po wspólnych przodkach, a reprodukcja torbaczy, z krótką ciążą i długotrwałym „donoszeniem” młodych w torbie lęgowej, jest innowacją tej grupy (i nie stanowi stadium przejściowego między jajorodnością pierwszych ssaków a sposobem reprodukcji łożyskowców). W tym sensie to torbacze są grupą „bardziej zaawansowaną ewolucyjnie”.

Lektura dodatkowa

Ewolucja retrowirusa KoRV w populacji koali: https://www.microbiologyresearch.org/content/journal/jgv/10.1099/jgv.0.001304
Popularne streszczenie: https://www.nottingham.ac.uk/news/koala-genetics
Rekombinacja jako wstęp do „udomowienia” zjadliwego retrowirusa: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6112702/
Ewolucja syncytyn u łożyskowców: https://royalsocietypublishing.org/doi/10.1098/rstb.2012.0507
Torbacze jako ssaki „zaawansowane ewolucyjnie”: https://www.nhm.ac.uk/discover/news/2023/may/marsupials-might-be-the-more-evolved-mammals.html
Jak działa „wirus kognitywny”, czyli gen ARC: https://www.sciencedirect.com/science/article/pii/S0092867417315040
Inne przykłady symbiosy wirusów z gospodarzem: https://journals.asm.org/doi/10.1128/jvi.02974-14.

Opisy ilustracji

Ryc. 1. Koala (Phascolarctos cinereus), torbacz, który niechcący stał się żywym laboratorium endogenizacji retrowirusa zachodzącej w czasie rzeczywistym. Foto: Benjamint444. Źródło: Wikipedia (licencja CC BY-SA 3.0).
Ryc. 2. Uproszczone drzewo rodowe naczelnych pokazujące historię endogenizacji genów envFRD i envW (kodujących syncytynę-2 i syncytynę-1) oraz genów retrowirusowych envV i envR kodujących białka także posiadające część właściwości syncytyn (w tym działanie immunosupresyjne, zmniejszające ryzyko konfliktu immunologicznego). Źródło: Esnault et al. 2013 (licencja CC BY 4.0).

Co zawdzięczamy wirusom (4): dygresja o naszym genomie i ukrytych w nim wirusach

Inne wpisy z tej serii:
Co zawdzięczamy wirusom (1): kilka pytań fundamentalnych
Co zawdzięczamy wirusom (2): bakteriofagi, czyli wielopoziomowa gra strategiczna
Co zawdzięczamy wirusom (3): podstępni włamywacze, czyli wirusy w stylu retro
Co zawdzięczamy wirusom (5): nie ma tego złego, co by na dobre nie wyszło
Co zawdzięczamy wirusom (6): nowy obraz ewolucji życia

Co siedzi w naszym genomie?

Genom Homo sapiens podzielony jest między 46 chromosomów (nie licząc maleńkiego genomu mitochondrialnego). 44 chromosomy (tzw. autosomy) tworzą pary (numerowane od 1 do 22). Ostatnia para (chromosomy płciowe) składa się z dwóch chromosomów X (odziedziczonych po ojcu i matce) u kobiet, natomiast u mężczyzn jest asymetryczna: jeden chromosom X (odziedziczony po matce) i chromosom Y (odziedziczony po ojcu). Ponieważ chromosom Y zawiera tylko 40% ilości DNA występującej w chromosomie X, całkowity (diploidalny) genom męski jest o ok. 1,5% krótszy od żeńskiego. Długość genomu liczymy w parach zasad (stanowiących cegiełki, z których zbudowany jest łańcuch DNA).1 Całkowita długość ludzkiego genomu to średnio ok. 6–6,1 mld par zasad (w zależności od płci). Długość ta nieco się waha w populacji ludzkiej, ale jej osobnicza zmienność nie przekracza dziesiątych części procenta.

Na ogół wyobrażamy sobie, że genom – jak sama nazwa wskazuje – składa się z genów, czyli odcinków DNA, które służą jako podstawa do syntezy jakichś biologicznie funkcjonalnych produktów. Część z nich to geny kodujące białka – najważniejsze składniki życia na Ziemi, pełniące najrozmaitsze funkcje. Pozostałe geny, niekodujące, zawierają sekwencje służące jako wzorce do produkcji cząsteczek RNA o różnej długości. One także wykonują w komórce mnóstwo istotnych zadań. Szczególnie ważne kategorie stanowią cząsteczki RNA wchodzące w skład rybosomów (maszynerii molekularnej służącej do syntezy białek) i działające jako rybozymy (katalizujące reakcje biochemiczne, podobnie jak enzymy białkowe). Niekodujące RNA może także regulować ekspresję genów i wykonywać wiele innych, często słabo poznanych funkcji. Ważne, że RNA jest tu produktem końcowym, a nie pośrednim. Nie jest tworzone po to, aby poddać je translacji, czyli przetłumaczyć na aminokwasową sekwencję białka przy zastosowaniu kodu genetycznego.

Genów kodujących białka mamy około 20 tysięcy2; genów niekodujących  – które o wiele trudniej jest zidentyfikować i policzyć – z pewnością wiele tysięcy. Są to liczby dość typowe dla zwierząt (niekoniecznie kręgowców) i nie świadczą o złożoności ani zaawansowaniu ewolucyjnym organizmu. Jeszcze mniejsze znaczenie ma wielkość genomu, która – w odróżnieniu od względnie stałej liczby genów – może się wahać między różnymi gatunkami zwierząt o całe rzędy wielkości.

Mogłoby się wydawać „na zdrowy rozum”, że natura nie lubi rozrzutności, więc w genomie powinno być tylko to, co naprawdę konieczne. Jest jednak inaczej. U człowieka odcinki genów kodujące sekwencje białek zajmują łącznie ok. 0,9% genomu. Odcinki genów niekodujących, z których powstaje funkcjonalne RNA, stanowią prawdopodobnie ok. 0,6%. Do tego dochodzą sekwencje regulatorowe różnego typu, od których zależy ekspresja genów, a także inne sekwencje DNA o znanej funkcji (centromery, telomery, punkty wyjściowe replikacji itp.). Składają się one na nieco ponad 2% naszego DNA. W sumie uzbierało się na razie ok. 3,5%. Do tego trzeba jednak dodać ok. 5% DNA, którego roli jeszcze nie zbadano w szczegółach, ale mamy dobre powody przypuszczać, że jest funkcjonalne, bo jego sekwencja jest zachowywana przez dobór naturalny (czyli nie jest bez znaczenia dla przeżycia i sukcesu reprodukcyjnego swoich nosicieli). Reasumując, około 8–9% ludzkiego genomu (mniej więcej pół miliarda par zasad) to sekwencje na pewno funkcjonalne.

Większość genów (zarówno kodujących, jak i niekodujących) u człowieka oraz innych eukariontów3 składa się z odcinków zawierających informację o sekwencji produktu genu (eksonów) rozdzielonych „przerywnikami” (intronami), często o wiele dłuższymi niż sąsiadujące z nimi eksony. Po transkrypcji, czyli przepisaniu genu na RNA, części transkryptu odpowiadające intronom zostają wycięte, a eksony są sklejane w jedną całość (proces ten to tzw. splicing). Oczywiście geny rozumiane jako odcinki wstępnie poddawane transkrypcji w celu wyprodukowania białek lub RNA (czyli eksony wraz z intronami) zajmują o wiele więcej miejsca niż same eksony: stanowią ok. 45% genomu. Ale znaczna większość tych 45% jest transkrybowana po to, żeby następnie ulec wycięciu.

Introny nie są bynajmniej z zasady niefunkcjonalne. Mogą zawierać elementy regulujące ekspresję genów; mogą się też w nich mieścić geny niekodujące, produkujące RNA pozyskiwane już po wycięciu intronu, a także inne sekwencje ważne dla organizmu. Zostały one jednak już uwzględnione w podanych wyżej oszacowaniach.

Zauważmy, że DNA kodujące stanowi około jednej dziesiątej DNA funkcjonalnego, toteż w żadnym razie nie można tych pojęć utożsamiać. Reszta DNA nie jest zresztą całkiem niepotrzebna. Może odgrywać choćby rolę wypełniacza lub separatora – np. introny muszą mieć pewną minimalną długość, żeby splicing eksonów przebiegał poprawnie. Niefunkcjonalność dotyczy sekwencji DNA, a nie np. jego objętości.

Dlaczego genom się zaśmieca?

Podczas podziałów komórkowych genom jest powielany (replikowany) w całości. Maszyneria replikacyjna nie wnika w to, które składniki genomu są potrzebne, a które można by było usunąć. Zadanie optymalizowania składu genomu pozostawione jest doborowi naturalnemu. Jeśli podczas kopiowania DNA przekazywanego z pokolenia na pokolenie uszkodzony zostanie jakiś odcinek ważny funkcjonalnie, skutki bywają opłakane dla nosiciela: może szybko umrzeć lub spadną jego szanse na sukces reprodukcyjny. Jeśli modyfikacji ulegnie fragment DNA nie pełniący istotnej funkcji, organizm ani na tym nie straci, ani nie zyska. Takie fragmenty ewoluują neutralnie, powoli gromadząc mutacje wskutek nieuniknionych błędów replikacji. Część z tych mutacji z czasem zostaje wyparta z puli genetycznej gatunku, inne ulegają utrwaleniu, ale decyduje o tym losowy dryf genetyczny, a nie dobór naturalny. Wydawałoby się, że dobór powinien premiować zmiany genetyczne, wskutek których takie niepotrzebne odcinki są usuwane na zawsze z genomu, ponieważ mniejszy genom o tej samej użytecznej zawartości jest mniej kosztowny w utrzymaniu i powielaniu. Jednak koszt metaboliczny zależny od wielkości genomu jest pomijalny w „rachunku za energię” komórki. Tylko w szczególnych, rzadko zachodzących okolicznościach presja na „odchudzanie” genomu jest na tyle silna, żeby przeważyć nad drugą tendencją dobrze widoczną w różnych grupach eukariontów: do powiększania genomu.

Wraki genetyczne

Tu dla porządku zaznaczę, że uszkodzenie funkcjonalnego fragmentu genomu nie zawsze oznacza śmierć lub kłopoty. W innej serii wpisów wspominałem o tym, jak u przodka małp i wyraków mutacje uszkadzające „zepsuły” gen GULO, niezbędny do syntezy kwasu L-askorbinowego (witaminy C). To samo zdarzyło się niezależnie u przodka endemicznych gryzoni południowoamerykańskich (świnek morskich, kapibar, szynszyli itd.). Obie grupy zmuszone są pobierać witaminę C wraz z pokarmem, a mimo to odniosły duży sukces ewolucyjny. Małpy (zwłaszcza człekokształtne) utraciły także większość odziedziczonych po przodkach genów kodujących receptory węchowe.4 Stało się to dlatego, że są bardziej wzrokowcami niż węchowcami, a zatem defekty węchu nie miały w ich życiu istotnego znaczenia. Z tej przyczyny dobór naturalny nie usuwał z populacji „daltonistów zapachowych”. Normalna kolej rzeczy jest taka, że osłabienie nacisku selekcyjnego na utrzymanie funkcjonalności sprzyja gromadzeniu się mutacji, które w końcu mogą nieodwracalnie uszkodzić gen.

Utrata funkcji przez gen GULO miała miejsce ok. 60 mln lat temu, a mimo to resztki tego genu są nadal widoczne (choć pełne luk i poszatkowane przez mutacje). Podobnie ma się rzecz z setkami fragmentów ludzkiego DNA, które kiedyś były genami kodującymi receptory zapachowe. Taki wciąż rozpoznawalny, ale już niezdolny do funkcjonowania gen nazywamy pseudogenem. Liczba znanych ludzkich pseudogenów, które kiedyś kodowały białka, wynosi ok. 14 tys. Liczba pseudogenów, które w przeszłości produkowały niekodujące RNA, nie jest dokładnie znana, bo trudniej je zidentyfikować, ale na pewno sięga tysięcy.

A co do tego mają wirusy?

Jak już wiemy, retrowirusy mogą tworzyć sekwencję DNA, która jest włączana do genomu gospodarza jako prowirus. Jeśli infekcja, której skutkiem jest taka wstawka, zajdzie w komórce linii płciowej, to prowirus może zostać odziedziczony przez potomstwo wraz z DNA rodzicielskim. O ile prowirus nie wyrządza nosicielowi szkody albo przynosi korzyść, która kompensuje ewentualne szkody, może się szerzyć w populacji nie dzięki zakażaniu jej przedstawicieli, ale dzięki dziedziczeniu. Staje się składnikiem puli genetycznej i w sprzyjających okolicznościach może w końcu utrwalić się w całej populacji, często w postaci wielu kopii wklejonych w różnych miejscach genomu.

Dziedziczony prowirus przez pewien czas pozostaje potencjalnie aktywny, tzn. zdolny do wyprodukowania postaci zakażającej (wirionów opuszczających komórkę) lub do tworzenia nowych kopii samego siebie dzięki retrotranspozycji (o której będzie mowa poniżej). Ale po upływie czasu odpowiadającego setkom lub tysiącom pokoleń mutacje w końcu uszkadzają go, odbierając mu tę zdolność. Jak już jednak wiemy, nie oznacza to, że wirusowe DNA znika z genomu gospodarza, choćby nawet nie było do niczego potrzebne. Może w nim trwać po wieczne czasy, a po dziesiątkach milionów lat jest nadal rozpoznawalne – podobnie jak pseudogeny. Ściślej mówiąc, z czasem sam staje się grupką pseudogenów (chyba że jakaś jego część uzyskuje „nowe życie”, o czym będzie mowa w kolejnym odcinku).

Ryc. 1.

Taką utrwaloną pozostałość po infekcji retrowirusowej nazywany retrowirusem endogennym lub w skrócie ERV (endogenous retrovirus). Powstanie ERV i jego utrwalenie się w populacji jest ogólnie zjawiskiem rzadkim, ale w ewolucyjnej skali czasu dochodziło do niego wielokrotnie w każdej linii rodowej kręgowców (innych zwierząt, jak wspominałem w poprzednim wpisie, wirusy z rodziny Retroviridae nie atakują). W genomie Homo sapiens rozpoznawalne retrowirusy endogenne stanowią około 8% jego zawartości. To dość dużo, jeśli zważymy, że funkcjonalnego DNA mamy mniej więcej tyle samo.

Porównując wstawki ERV w genomach różnych kręgowców, stwierdzamy, że w dużym stopniu odzwierciedlają one strukturę niezależnie ustalonych pokrewieństw ewolucyjnych. Gatunki tworzące klad (grupę wywodzącą się od wspólnego przodka i obejmującą wszystkich jego potomków) mają zwykle wiele ERV wyraźnie ortologicznych (reprezentujących te same „gatunki” retrowirusów zajmujące te same lokalizacje w genomie), co świadczy o tym, że odpowiednie prowirusy były obecne u ostatniego wspólnego przodka całej grupy. Z jednej strony oznacza to, że retrowirusy endogenne mogą być wykorzystywane w badaniach filogenetycznych, a z drugiej strony – możemy w ten sposób rekonstruować historię retrowirusów i datować punkty rozchodzenia się ich linii ewolucyjnych. Co prawda przeszkadzają w tym pewne komplikacje. „Klasyczne” retrowirusy mogą zmieniać gospodarzy, przeskakując czasem nawet między odlegle spokrewnionymi gatunkami kręgowców, a nieunikniony rozkład resztek prowirusów w genomie wskutek kumulowania się mutacji powoduje, że rozpoznanie śladów infekcji starszych niż 100 mln lat staje się trudne lub niemożliwe. Te organiczenia daje się jednak obejść, na przykład uwzględniając w analizach dane dotyczące słabiej zbadanych, a za to bardziej swoistych dla konkretnych gospodarzy retrowirusów z podrodziny Spumaretrovirinae (wirusów pienistych), które również pozostawiają ślady w postaci ERV. Badania wskazują, że Retroviridae wyewoluowały najpóżniej w ordowiku (ok. 450 mln lat temu), a być może nawet znacznie wcześniej, i infekowały już wspólnych przodków wszystkich współczesnych kręgowców. Musiały zatem pojawić się najpierw w środowisku morskim, a na ląd wyszły wraz z czworonogami.

Dalsi krewni retrowirusów

Mówiliśmy dotąd o retrowirusach w ścisłym sensie, ale ich prowirusy nie są jedynymi składnikami genomu zdolnymi do powielania się kosztem gospodarza i realizującymi swoje egoistyczne interesy w formie „samolubnego DNA”. Do tej kategorii należą fragmenty genomu samopowielające się za pośrednictwem RNA – tak zwane retrotranspozony.6 Niektóre z nich zaopatrzone są na obu końcach w długie powtórzenia końcowe (long terminal repeats, LTR), podobnie jak prowirusy i pochodzące od nich retrowirusy endogenne. Właściwie różnica między retrotraspozonami LTR a retrowirusami endogennymi polega głównie na tym, że u tych drugich widać pozostałości genów kodujących białka współtworzące otoczkę wirusową, w zasadzie nieobecne u retrotranspozonów LTR. Natomiast jedne i drugie posiadają geny białek potrzebnych do replikacji wewnątrzkomórkowej, m.in. białek strukturalnych tworzących opakowanie genomu RNA (kapsyd) oraz własnej odwrotnej transkryptazy i integrazy. Pozostają na swoim miejscu w genomie, lecz za pomocą kodowanych przez siebie białek mogą produkować wirusopodobne twory umożliwiające transport swojego materiału genetycznego wraz z niezbędnymi enzymami w postaci dwu pojedynczych nici RNA i – po odwrotnej transkrypcji z RNA na DNA przeprowadzonej wewnątrz opakowania – wklejanie własnej kopii do innej lokalizacji w genomie bez opuszczania komórki. Taki sposób namnażania się, charakterystyczny dla retrowirusów i retrotranspozonów, nazywamy retrotranspozycją.

Retrotranspozony LTR zaliczane do rodziny Metaviridae (znane też jako Ty3-gypsy) spotyka się w genomach gatunków należących do wszystkich głównych gałęzi ewolucyjnych eukariontów, a pod względem zestawu, kolejności i sekwencji nukleotydowej występujących w nich genów są tak bliskie Retroviridae, że na podstawie analiz filogenomicznych obie rodziny uważa się za ściśle spokrewnione. Biorąc pod uwagę ich zasięg występowania wśród eukariontów, można sądzić, że Metaviridae wywodzą się od znacznie starszych przodków, a Retroviridae wyewoluowały w ich obrębie, choć przy obecnym stanie wiedzy szczegółowe scenariusze filogenetyczne są trudne do zweryfikowania. W każdym razie jedne i drugie są wirusami z ewolucyjnego punktu widzenia, nawet jeśli uległy całkowitej endogenizacji w DNA gospodarza. To samo dotyczy ich nieco dalszych kuzynów, retrotranspozonów LTR z rodziny Pseudoviridae (znanych jako Ty1-copia).

Ryc. 2.

W genomie ludzkim oprócz ERV szczególnie znaczącą rolę odgrywają jednak inne retrotranspozony – nieposiadające LTR. Są to tzw. długie i krótkie rozproszone elementy jądrowe, LINE i SINE. Ich pochodzenie nie jest jasne. LINE zawierają dwa geny białek, z których jedno wiąże mRNA, a drugie może pełnić funkcje odwrotnej transkryptazy i endonukleazy (rozcinającej łańcuch DNA). Oba białka wraz mRNA tworzą kompleks, który tworzy się w cytoplazmie, przenika do jądra i po dokonaniu odwrotnej transkrypcji wkleja nową kopię LINE do genomu. SINE nie kodują własnej odwrotnej transkryptazy, ale tworzą swoje „wklejane” kopie, korzystając z enzymów innych retrotranspozonów (są więc w zasadzie pasożytami pasożytów genomu). Od czasu do czasu (choć skrajnie rzadko) odwrotna transkryptaza LINE umożliwia genomom wirusów RNA nieposiadających takiego enzymu endogenizację „na gapę”. Badacze ewolucji wirusów znaleźli w genomach wielu linii rodowych ssaków utrwalone ślady dawnych infekcji dokonanych zwłaszcza przez bornawirusy (Bornaviridae), których szczególny cykl replikacji (w obrębie jądra komórkowego) najwyraźniej zwiększa prawdopodobieństwo takich zdarzeń.

Omawianie innych „skaczących genów”, czyli transpozonów DNA, wycinających się z jednego miejsca w genomie i wklejających w innym bez pośrednictwa RNA (a występujących nie tylko u eukariontów, ale także u bakterii i archeowców), nie należy już to tego wątku. Wspomnę tylko, że wszystkie elementy określane jako „transpozony” składają się co najmniej na ok. 45% ludzkiego DNA, a być może dodatkowo spora część pochodzi od transpozonów już nierozpoznawalnych. W stosunku do całej objętości genomu 8% stanowią retrowirusy endogenne, ok. 21% – retrotranspozony LINE (tak wysoki udział jest charakterystyczny dla ssaków oprócz stekowców), 13% – SINE, a 3% – transpozony DNA. W ogromnej większości są to elementy współcześnie nieaktywne – i dobrze, bo jako czynniki mutagenne mogłyby poważnie zakłócać normalne funkcje genomu. Tylko jeden ludzki retrowirus endogenny (HERV-K) uchodzi za potencjalnie zdolny do „wybudzenia się z letargu”, a spośród ok. 850 tys. kopii LINE w naszym genomie tylko 80–100 zachowało zdolność do retrotranspozycji (ich liczba może być różna u różnych ludzi).

W kolejnym odcinku serii będzie mowa o tym, jaką ewentualną korzyść dla swojego nosiciela (oprócz bardziej oczywistych zagrożeń) mogą oferować endogenizowane retrowirusy.

Przypisy

1) W przypadku jednoniciowego RNA lub DNA mówimy o nukleotydach (zawierających pojedyncze zasady) jako ich podstawowych jednostkach strukturalnych i za długość nici przyjmujemy liczbę nukleotydów.
2) Liczba ta dotyczy genomu haploidalnego, na który składa się po jednym z każdej pary chromosomów. Drugi chromosom z każdej pary autosomalnej zawiera w zasadzie te same elementy genetyczne, ale mogą się one nieco różnić (czyli stanowić różne allele – warianty tej samej sekwencji DNA), bo każdy z pary genów pochodzi od innego z rodziców.
3) Introny występują także u prokariontów (bakterii i archeowców) oraz wirusów, ale nie są tak rozpowszechnione ani tak długie jak u eukariontów.
4) W wielu przypadkach te same eksony mogą być łączone w różnej kolejności, co oznacza, że ten sam gen może kodować różne białka (złożone z tych samych modułów w różnych kombinacjach) lub produkować różne cząsteczki niekodującego RNA. Jest to tzw. splicing alternatywny.
5) Jest to ogromna superrodzina białek. Szczur ma prawie 1300 genów kodujących sprawne  receptory zapachów; człowiek – niecałe 300 (pomijając ponad drugie tyle pseudogenów), co i tak stanowi ok. 1,5% wszystkich naszych genów kodujących białka.
6) Technicznie rzecz biorąc, retrowirusy endogenne także są jedną z kategorii retrotranspozonów.

Lektura dodatkowa

Więcej o retroelementach endogennych w genomie człowieka: https://postepybiochemii.ptbioch.edu.pl/index.php/PB/article/view/272/443
O pochodzeniu retrowirusów: https://www.sciencedirect.com/science/article/pii/S187962571730041X

Opisy ilustracji

Ryc. 1. Schemat replikacji aktywnych retrotraspozonów RTL typów Ty3-gypsy i Ty1-copia (rodziny Metaviridae, Pseudoviridae), bardzo podobny jak u aktywnych endogennych Retroviridae. RNA tworzone na podstawie transpozonowego DNA jest eksportowane do cytoplazmy, tam ulega translacji, po czym nici RNA wraz z potrzebnymi enzymami zamykane są w białkowych kapsydach, tworząc „cząstki wirusopodobne”, wewnątrz których zachodzi traskrypcja odwrotna. Wyprodukowane w ten sposób DNA wraca do jądra i zostaje wplecione w genom gospodarza w nowej lokalizacji. Źródło: Pachulska-Wieczorek et. al. 2016 (licencja: CC-BY 4.0).
Ryc. 2. Barbara McClintock (1902–1992), odkrywczyni ruchomych elementów genetycznych, czyli transpozonów (nagroda Nobla z fizjologii i medycyny 1983, trzydzieści lat po odkryciu, które przez długi czas było ignorowane i zapomniane). Gatunkiem badanym przez przyszłą noblistkę była kukurydza (Zea mays). Genom kukurydzy jest nieco mniejszy niż ludzki, choć zawiera ok. dwa razy więcej genów kodujących białka. Jego wyjątkowo duża część (ok. 84%) składa się z transpozonów, z których 90% to retrotraspozony LTR. Nie popełnimy więc przesady, jeśli stwierdzimy, że trzy czwarte DNA kukurydzy jest pochodzenia wirusowego. Foto: Cristian472735. Źródło: Wikipedia (licencja CC BY-SA 4.0).