Tytyna jak sprężyna
Oficjalnie największym znanym białkiem jest tytyna, pełniąca niesłychanie ważną rolę molekularnej „sprężynki” odpowiadającej za kurczliwość mięśni poprzecznie prążkowanych u kręgowców. Bez tytyny nie ruszylibyśmy ręką ani nogą i nie biłoby nasze serce. U innych zwierząt występują białka pokrewne i pełniące podobne funkcje, ale akurat u kręgowców tytyna rozciągnęła się wyjątkowo: jej molekuła ma ponad 1 μm (mikrometr) długości. Gen TTN, kodujący tytynę u człowieka, jest oczywiście odpowiednio olbrzymi. Składa się z rekordowej liczby 363 eksonów, czyli odcinków DNA kodującego, poprzedzielanych niekodującymi intronami. Po przepisaniu genu na RNA, czyli transkrypcji, introny zostają wycięte, a eksony sklejone w jedną całość. Proces ten nazywamy splicingiem; jego wynikiem jest nić informacyjnego RNA (mRNA) zawierająca pełny kod białka, które ma zostać zsyntetyzowane w procesie translacji.
Transkrypty niektórych genów mogą być składane w różny sposób, tworząc matryce do tworzenia różnych białek. Takie zjawisko nazywamy splicingiem alternatywnym. Może on polegać na pominięciu niektórych eksonów (to najczęstsza forma splicingu alternatywnego u zwierząt) albo na pozostawieniu któregoś z intronów. W ten sposób jeden gen może potencjalnie kodować wiele białek. Z właściwym splicingiem alternatywnym mamy do czynienia wtedy, kiedy wszystkie jego produkty są funkcjonalne. Trzeba go odróżnić od błędów splicingu, gdy wskutek niewłaściwego złożenia mRNA powstaje białko niefunkcjonalne lub wręcz upośledzające metabolizm komórki, przed czym oczywiście organizm stara się bronić.
Tytyna składa się z dwustu kilkudziesięciu liniowo uszeregowanych domen, czyli niezależnie formowanych modułów funkcjonalnych. Niemal wszystkie z nich należą do dwóch typów – immunoglobuliny lub fibronektyny. Każdy z tych dwóch rodzajów występuje w liczbie ponad stu kopii. Tytyna wyewoluowała dzięki licznym duplikacjom (podwojeniom) pradawnego genu kodującego pierwotnie krótki ciąg domen. Większość domen nadal kodowana jest przez jeden ekson. Fakt ten sprzyja współistnieniu wielu wariantów tytyny powstających dzięki splicingowi alternatywnemu. Tworzone są one w sposób kontrolowany (czyli nie omyłkowo) i różnią się głównie długością – zależną od tego, które eksony i w jakiej liczbie są pomijane – i mechaniczną elastycznością, dlatego znajdują zastosowanie w różnych typach mięśni. Forma „kanoniczna” (podstawowa) ludzkiej tytyny zawiera 34 350 aminokwasów. Jej odpowiedniki u innych gatunków ssaków, na przykład u myszy, mogą być nawet nieco dłuższe. Gen TTN koduje jeszcze więcej, bo ponad 38 tys. aminokwasów, ale w każdym ze znanych wariantów białka część sekwencji kodujących zostaje pominięta.
Tytyna jest zatem białkiem niezwykle długim, ale dość monotonnym – sekwencją naprzemiennie ułożonych, powtarzalnych modułów. Jej systematyczna nazwa chemiczna w języku angielskim ma prawie 190 tysięcy liter i potrzeba kilku godzin, żeby ją w całości odczytać na głos, nie jest to jednak lektura szczególnie fascynująca (a nazwa tytyna jest poręczniejsza). Ludzki gen TTN (eksony wraz z intronami) zajmuje odcinek o długości ponad 300 tysięcy par zasad na chromosomie 2. W każdym razie Księga Rekordów Guinnessa odnotowuje tytynę jako największe znane białko. Czy słusznie?
To zależy, jak interpretujemy słowo znane. Tytyna jest rekordzistką, jeśli chodzi o białka szczegółowo zbadane, figurujące w specjalistycznych bazach danych. Ale wiemy też, że z prawdopodobieństwem graniczącym z pewnością istnieją białka jeszcze większe.
Mikroorganizmy i supergeny
O dziwo, na ich trop wpadli badacze zajmujący się jednymi z najmniejszych bakterii. Już wcześniej zauważono, że w kilku grupach bakterii, a także u niektórych archeowców (o tym, czym są archeowce, pisałem tutaj i tutaj) występują geny kodujące białka praktycznie równie wielkie jak tytyna. Na przykład jeden z genów bakterii Chlorobium chlorochromatii (należącej do typu Chlorobiota, czyli zielonych bakterii siarkowych) koduje białko złożone z 36 806 aminokwasów. Wydaje się jednak, że wielkie geny występują szczególnie często u bakterii z grupy nazwanej Omnitrophota. Dokładniej mówiąc, jest to typ Ca. (Candidatus) Omnitrophota. Tak oznacza się proponowane jednostki taksonomiczne dobrze scharakteryzowane, ale obejmujące bakterie niezbadane szczegółowo, bo niedające się wyizolować i hodować w laboratorium. Określa się je często jako „ciemną materię” mikroświata. Wiemy, że jest jej mnóstwo, znamy wyrywkowo niektórych jej przedstawicieli, ale ogólnie jest to nadal terra incognita – teren przyszłych odkryć.
O Omnitrophota wiadomo dość dużo z badań metagenomowych (czyli z analiz materiału genetycznego wyodrębnianego z różnych nisz ekologicznych), ale dopiero niedawno udało się podejrzeć niektóre z nich pod mikroskopem i utrzymać w warunkach laboratoryjnych. Z tego, co wiemy, jest to grupa różnorodna i bogata w gatunki, występująca praktycznie wszędzie w niezbyt zasolonych środowiskach beztlenowych: w wodach hydrotermalnych gejzerów i kraterów wulkanicznych, w glebie wokół korzeni roślin, w wodach gruntowych, w mulistych osadach, bagnach, ściekach, a nawet w jeziorach ukrytych pod lodami Antarktydy. Okazy, które udało się zaobserwować bezpośrednio, mają wielkość 200–300 nm (0,2–0,3 μm), czyli są niezwykle miniaturowe nawet jak na bakterie. Zarówno z tych obserwacji, jak i z analizy ich genów, wynika, że są to bakterie drapieżne lub pasożytnicze, atakujące inne bakterie i archeowce, a być może nawiązujące z nimi również stosunki symbiotyczne.
Bakteria z tej grupy, Ca. Velamenicoccus archaeovorus, kiedy występuje w towarzystwie archeowca Methanosaeta sp. (jednego z najbardziej rozpowszechnionych mikroorganizmów naszej planety), wydziela wyjątkowo duże białko, złożone z 39 678 aminokwasów i zawierające kilkaset domen. Prawdopodobnie wiąże się ono ze ścianą komórkową ofiary, trawi ją i otwiera bakterii dostęp do cytoplazmy. Gen tego białka stanowi ok. 6% całego genomu V. archaeovorus.
Co kryje ciemna materia
Być może właśnie padł kolejny rekord. Badacze z Uniwersytetu Kalifornijskiego w Berkeley, przeglądając genomy Omnitrophota w poszukiwaniu olbrzymich genów, trafili na gen kodujący sekwencję 85 804 aminokwasów. Tak szokująco wielkie białko byłoby ponad dwa razy większe od dotychczasowych rekordzistów, w tym tytyny. Jaką funkcję może pełnić? Nie znaleziono samego białka ani jego fragmentów, tylko odpowiadające mu kodujące DNA. Co można z niego wywnioskować?
Dysponujemy obecnie narzędziem sztucznej inteligencji, rozwijanym i doskonalonym przez Google DeepMind – AlphaFold. Jest to program korzystający z samouczących się sieci neuronowych, przewidujący trójwymiarową strukturę białka na podstawie jego sekwencji aminokwasowej. Niestety AlphaFold, imponująco skuteczny w przypadku białek niewielkich albo średniej wielkości, radzi sobie tym gorzej, im dłuższą sekwencję musi zanalizować. Dla białek złożonych z kilkudziesięciu tysięcy aminokwasów nie dałby w ogóle sensownych wyników. Dlatego zastosowano pomysłową sztuczkę: podzielono gen na odcinki o długości około 1000 par zasad, częściowo nakładające się na siebie, zrekonstruowano odpowiadające im fragmenty białka za pomocą AlphaFold, po czym spróbowano złożyć je w spójną całość. Powstał obraz białka o wielu domenach, które mogłyby wiązać się ze ścianą komórkową, zawierającego także fragmenty bardziej zagadkowe, jak osobliwa struktura przypominającą rurkę, utworzona przez symetrycznie skręcone helisy białka.
Być może jest to kolejne olbrzymie białko używane przez nanobakterie jako broń myśliwska, nie wiemy jednak na pewno, czy produktem genu jest pojedyncza molekuła. Być może już w trakcie translacji syntetyzowana sekwencja jest cięta na kilka białek pełniących różne funkcje. Ani domniemane białko, ani produkująca je bakteria nie zostały na razie zaobserwowane bezpośrednio, odkrycie wymaga więc potwierdzenia innymi metodami. Wyniki zostały upublicznione w repozytorium bioRχiv, ale oczekują jeszcze na recenzje i publikację w ostatecznej formie. Trzeba więc zachować ostrożną rezerwę, ale jednocześnie podkreślić, że białka zbudowane z ponad 30 tysięcy aminokwasów to w świecie bakterii nic niezwykłego. Prawdziwych rekordzistów trzeba więc zapewne szukać właśnie tam.
Lektura uzupełniająca
Tytyna, największe ludzkie białko: https://pdb101.rcsb.org/motm/185.
Forma, funkcje i filogeneza tytyny: Linstedt & Nishikawa 2017.
Co wiemy o Ca. Omnitrophota: Seymour et al. 2023.
Wstępne doniesienie o genie-gigancie: Jacob West-Roberts et al. 2023.
Omówienie na łamach Nature: https://www.nature.com/articles/d41586-023-03937-z.
Opisy ilustracji
Ryc 1. Model (JSmol) fragmentu cząsteczki tytyny: sześć domen białkowych (spośród 244) połączonych ruchomymi „zawiasami″. Źródło: Protein Data Bank (domena publiczna).
Ryc 2. Tytyna (kolor żółty) tworząca z kilkoma innymi białkami sarkomery (jednostki funkcjonalne mięśnia poprzecznie prążkowanego), pokazane w fazie rozkurczu i skurczu. Źródło: David Goodsell 2015/Protein Data Bank (domena publiczna).
Ryc. 3. Gorące źródło Obsidian Pool w Parku Narodowym Yellowstone (Wyoming, USA), w którym po raz pierwszy odkryto DNA bakterii z proponowanego typu Omnitrophota (obok nadzwyczajnej różnorodności archeowców). Foto: Bob Lindstrom 1997. Źródło: Wikipedia (domena publiczna).
Ryc 4. Archeowiec Methanosaeta sp. (podłużne komórki tworzące włókniste kolonie, A) atakowany przez Ca. Velamenicoccus archaeovorus (małe okrągłe komórki, D). Niektóre komórki archeowca (B, C) są uszkodzone i martwe. Foto: Erhard Rhiel and Jens Harder/Institute of Chemistry and Biology of the Sea and Max Planck Institute for Marine Microbiology. Źródło: Predatory Bacteria (fair use).