Pozostałe części cyklu
Część 1: Zaproszenie
Część 3: Spółgłoski sprzed tysięcy lat
Część 4. Gra samogłosek i zadziwiający sukces pewnej hipotezy [w przygotowaniu]
Część 5: Rdzenie i słowa [w przygotowaniu]
August Schleicher rysuje drzewa
Zanim jeszcze powstała koncepcja rodziny indoeuropejskiej, było jasne dla badaczy, że niektóre języki tworzą wyraźne grupy połączone bliskim pokrewieństwem (na przykład języki słowiańskie, germańskie czy celtyckie). Kiedy August Schleicher rysował pierwsze wersje drzewa rodowego języków europejskich (wprowadzając do językoznawstwa historycznego myślenie filogenetyczne), węzły, z których rozchodziły się gałęzie, odpowiadały ostatniemu wspólnemu przodkowi każdej z tych grup. Ale u Schleichera nie wygląda to tak, że z pierwszego węzła (język praindoeuropejski) wyodrębniają się od razu języki prasłowiański, pragermański, praceltycki itd., a z pragermańskiego bezpośrednio niemiecki, angielski czy szwedzki. Schleicher zdawał sobie sprawę, że filogeneza to proces zachodzący etapami i generujący różnorodność dzięki wielokrotnie powtarzającym się podziałom – patrz ilustracja w nagłówku. Dlatego w jego drzewie rodowym na przykład z węzła pragermańskiego wyrastają trzy gałęzie: gocka (wymarła), zachodniogermańska i skandynawska1; z kolei przodek języków zachodniogermańskich daje początek gałęzi wysokoniemieckiej i gałęzi „języków Morza Północnego”, z której pączkują fryzyjski, dolnoniemiecki, niderlandzki i angielski (także pogrupowane według stopnia pokrewieństwa). Podobne podgrupy, zorganizowane hierarchicznie, wyróżnił wśród języków słowiańskich.
Na początku drugiej połowy XIX w. rozumiano też, że niektóre spośród dużych gałęzi języków indoeuropejskich można połączyć w większe „konary”. Na przykład języki indoaryjskie (wywodzące się ze staroindyjskiego) i irańskie są z sobą wyraźnie spokrewnione. Fakt ten jest tym bardziej oczywisty, im starszych przedstawicieli obu grup porównujemy (na przykład sanskryt po stronie indyjskiej i język staroperski lub awestyjski po stronie irańskiej). Podobne cechy fonetyczne, zbieżności gramatyczne i wspólne słownictwo niewystępujące w innych grupach pozwalają nam mówić o grupie indoirańskiej i rekonstruować na tej podstawie język praindoirański.2 Już u Schleichera (jednego z pionierów badań nad językiem litewskim) występuje też grupa bałtosłowiańska. Jej spójność genealogiczna jest powszechnie przyjmowana również w naszych czasach: według naszej najlepszej wiedzy istniał etap bałtosłowiańskiej wspólnoty językowej, czego widoczną konsekwencją jest duża liczba identycznych zmian dźwiękowych, innowacji gramatycznych i słownictwa specyficznego dla Bałtów i Słowian. Nieco mniej oczywistym przykładem bliższego pokrewieństwa jest proponowana przez Schleichera grupa italoceltycka. W tym przypadku w późniejszych czasach przytaczano argument za i przeciw, ale z dzisiejszego punktu można powiedzieć, że dokładne analizy porównawcze potwierdzają intuicję Schleichera. Większość współczesnych indoeuropeistów akceptuje języki italoceltyckie jako poprawnie zdefiniowaną jednostkę taksonomiczną.
Schleicher był także zdania, że języki bałtosłowiańskie i germańskie tworzą większą grupę „słowiańsko-germańską” i że albański jest bliski greckiemu. O ormiańskim nie miał nic szczególnego do powiedzenia, bo uważano go wówczas za trochę nietypowy język z grupy irańskiej. Dopiero w 1875 r. Heinrich Hübschmann wykazał, że ormiański nie ma bliskich krewnych i stanowi osobną, wcześnie wyodrębnioną gałąź języków indoeuropejskich. U Schleichera grupa grecko-albańska łączyła się z italoceltycką, a obie razem – z indoirańską. Te propozycje zestarzały się gorzej niż te, o których była mowa w poprzednim akapicie, ale nie ma w tym nic złego. Pamiętajmy, że uprawianie nauki polega na formułowaniu i sprawdzaniu hipotez i cierpliwym posuwaniu się naprzód metodą prób i błędów, a nie na odgadywaniu prawd ostatecznych.
Języki jak ssaki, czyli analogie interdyscyplinarne
Języki anatolijskie poznano dopiero w XX w. Co do ich pozycji, panuje ogólna zgoda, że po pierwsze stanowią jedną, genealogicznie zwartą gałąź, a po drugie – są grupą siostrzaną względem wszystkich pozostałych języków indoeuropejskich. Druga późno poznana grupa to języki tocharskie. Tutaj zdania są nieco bardziej podzielone, ale gdyby zaprosić indoeuropeistów do głosowania nad hipotezą, że języki tocharskie są drugą po anatolijskich grupą „bazalną”, czyli znowu siostrzaną względem pozostałych, to pogląd ten wygrałby znaczną większością głosów. Oczywiście nie w taki sposób rozstrzyga się spory naukowe; mam tylko na myśli, że w różnych analizach filogenetycznych języki tocharskie sytuują się w takiej pozycji wystarczająco konsekwentnie.
Gdyby porównać drzewo rodowe języków indoeuropejskich do jakiegoś przykładu z biologii, np. filogenezy ssaków, to języki anatolijskie odpowiadałyby stekowcom, tocharskie – torbaczom, a pozostałe – łożyskowcom.3 Analogię tę można posunąć dalej. Drzewo rodowe łożyskowców rozwidla się w kilkanaście głównych gałęzi, którym przypisano rangę rzędów (gryzonie, nietoperze, naczelne, parzystokopytne itd.). I podobnie jak językoznawcy, biolodzy zajmujący się ssakami borykali się z problemem wzajemnego pokrewieństwa tych gałęzi. Tradycyjnie wyróżniane rzędy w zasadzie utrzymały swój status, kiedy zastosowano do klasyfikacji najnowsze metody ustalania pokrewieństwa (zwłasza analizę genomów), ale wciąż trwają dyskusje dotyczące ich wzajemnych relacji rodzinnych. W ciągu ostatnich dwudziestu–trzydziestu lat udało się wreszcie pogrupować rzędy łożyskowców w trzy podstawowe klady, ale nadal nie ma pełnej zgody co do szczegółów ich wewnętrznej systematyki.
Przyczyna jest podobna jak w przypadku języków indoeuropejskich. Rzędy wyróżniają się wyraźnie, bo każdy z nich ma za sobą długą osobną historię i wspólnego przodka, w którego linii rodowej nagromadziło się przez miliony lat wiele unikatowych innowacji. Natomiast rozwidlenia, które doprowadziły do powstania dzisiejszych rzędów, następowały szybko jedne po drugich, szczególnie po globalnej katastrofie sprzed 66 mln lat. Ocalałe ssaki opanowały wiele opustoszałych nisz ekologicznych i ich ewolucja przybrała charakter wielkiej radiacji przystosowawczej. Czynniki komplikujące, które utrudniają stosowanie modelu drzewa rodowego (hybrydyzacja, niekompletne sortowanie linii rodowych), dodatkowo zatarły ślady tych wczesnych podziałów.
Wielki wybuch języków indoeuropejskich
Podobna była dynamika ewolucyjna rodziny indoeuropejskiej. Należy ona do największych znanych rodzin językowych, co świadczy o tym, że przeszła w swojej historii stadium gwałtownej ekspansji, którego skutkiem był rozpad wspólnoty językowej na wiele lokalnych linii rozwojowych. Stało się to już po odłączeniu się języków anatolijskich, których zasięg pozostał ograniczony do Azji Mniejszej. Przyczyny tego „wielkiego wybuchu” nie są jasne. Przypisuje się je zmianom cywilizacyjnym na przełomie chalkolitu i wczesnej epoki brązu; mobilności związanej z rozwojem transportu kołowego i gospodarki opartej w dużym stopniu na pasterstwie i hodowli bydła; zapaści demograficznej pierwotnych (nieindoeuropejskich) społeczeństw rolniczych Europy na przykład wskutek epidemii; ukształtowaniu się elity społecznej kultywującej etos „wojownika-herosa” (co sprzyjało agresywnym podbojom nowych obszarów), a także udomowieniu koni i wykorzystaniu ich jako zwierząt pociągowych, wierzchowych i bojowych. Zapewne, jak to zwykle bywa, ekspansja indoeuropejska spowodowana była przez kumulację kilku różnych czynników. Podziały migrujących populacji i różnicowanie się używanych przez nie języków następowały na tyle szybko, że między jednym a drugim podziałem nie było zbyt wiele czasu, żeby nagromadziły się innowacje pozwalające po tysiącach lat zrekonstruować topologię drzewa rodowego.
Tak jak w biologii, dowodem na bliższe pokrewieństwo są właśnie innowacje odziedziczone po wspólnym przodku i niewystępujące w innych liniach rodowych. W językoznawstwie największą wagę przypisuje się innowacjom fonetycznym (zmianom dźwiękowym). Aby jednak miały wartość dowodową, muszą spełniać pewne warunki. Po pierwsze, powinny być nietrywialne, czyli reprezentować typ procesów zachodzących na tyle rzadko, że prawdopodobieństwo ich wielokrotnego niezależnego wystąpienia w różnych językach jest niewielkie. Po drugie, jeżeli można odtworzyć ich kolejność w czasie, to powinna ona być taka sama w porównywanych językach. Mile widziane są zatem zmiany rzadkie, osobliwe i występujące w określonej sekwencji. Zwykle nie brak ich w ogólnie uznanych kladach językowych (i właśnie dlatego są one ogólnie uznane). Na przykład w językach germańskich odkryto stopniowo cały kompleks uporządkowanych chronologicznie zmian spółgłoskowych, znanych jako prawa Grimma, Vernera i Klugego – unikatowy jak odcisk palca. Zmiany te zaszły tylko raz w historii języka pragermańskiego, a ich ślady zostały odziedziczone przez wszystkie języki potomne. Inne możliwości są po prostu skrajnie nieprawdopodobne.
Jeśli jakaś linia rozwojowa istniała krótko, zanim uległa rozszczepieniu, to mogło się zdarzyć, że nie zdążyły w niej nagromadzić mało prawdopodobne zmiany fonetyczne. Warto więc także zwrócić uwagę na wspólne innowacje morfologiczne, czyli niespotykane gdzie indziej cechy fleksji (odmiany gramatycznej wyrazów) lub schematy słowotwórcze. Mniejszą wartość dowodową ma wspólne słownictwo, ponieważ ze wszystkich elementów struktury języka słowa są najbardziej podatne na zapożyczanie. Żeby użyć innowacji słownikowych jako argumentu na rzecz pokrewieństwa, trzeba wykluczyć zapożyczenia.4
Ilu autorów, tyle drzew
Do rekonstrukcji drzewa rodowego języków używa się od pewnego czasu algorytmów filogenetycznych naśladujących te, które opracowano na potrzeby biologii ewolucyjnej. Wyniki są interesujące, ale nie przyniosły rozstrzygnięcia kwestii spornych. Fakt, że konsekwentnie potwierdzają poprawność podziału na tradycyjnie wyróżniane gałęzie (oraz spójność genetyczną grup indoirańskiej, bałtosłowiańskiej, a zwykle też italoceltyckiej) jest krzepiący, ale trudno go nazwać sensacyjnym. Jak to zwykle bywa z algorytmami, diabeł tkwi w szczegółach – takich jak poprawny dobór danych. Tu filogenetyka językoznawcza wciąż ma kłopoty, o czym świadczy duży rozrzut wyników (patrz ryc. 2). Każda nowo opublikowana analiza (oczywiście korzystająca z big data i zaawansowanych algorytmów) jest promowana jako przełom lub wielki krok naprzód, ale dopóki nie zacznie się wyłaniać coś w rodzaju zbieżności rezultatów, wskazana jest rezerwa.
Tutaj mogę się podzielić własną opinią – prywatną i subiektywną, a zatem także zasługującą na sceptycyzm. Podobnie jak zdecydowana większość indoeuropeistów, przyjmuję bez zastrzeżeń „bazalny” status języków anatolijskich jako grupy siostrzanej względem całej reszty rodziny indoeuropejskiej. Przyjmuję także, wzorem większości, że kolejny podział doprowadził do oddzielenia się języków tocharskich od przodka „grupy koronnej”, obejmującej wszystkie współcześnie używane języki indoeuropejskie (i tożsamej z rodziną indoeuropejską w rozumieniu dziewiętnastowiecznym). Tu kończy się konsensus, a pojawia się pytanie, co było dalej.
Uważam, że grupę koronną można podzielić na trzy mniejsze grupy. Na pierwszą – nazwijmy ją „zachodnią” – składają się języki germańskie i italoceltyckie. Druga to grupa „wschodnia”, której rdzeń stanowią języki indoirańskie i bałtosłowiańskie; z dużym wahaniem skłonny jestem sądzić, że pozycję satelitarną – siostrzaną względem jednych i drugich łącznie – zajmuje język ormiański. Do trzeciej grupy, „bałkańskiej”, należą języki grecki i albański. Podgrupy druga i trzecia wydają się bliżej spokrewnione z sobą nawzajem niż z podgrupą zachodnią.
Od razu zastrzegam, że istnieje tu duża rozbieżność zdań, a także wyników produkowanych przez algorytmy. Języki germańskie bywają, jak u Schleichera, łączone z bałtosłowiańskimi5, a nawet z albańskim. Ormiański i albański mają tak wiele cech nietypowych, że wykazują niepokojącą tendencję do skakania po całym drzewie rodowym. Od początku XX w. utrwalił się tradycyjny pogląd o pokrewieństwie grecko-ormiańskim, jednak nowsze analizy podważyły wiele z proponowanych wspólnych innowacji tych języków. Krótko mówiąc, na tym poziomie klasyfikacji panuje wciąż galimatias, z którego wyłaniają się dobrze znane, niekontrowersyjne gałęzie.
Języki fragmentaryczne, czyli ciemna materia rodziny indoeuropejskie
Warto jeszcze wspomnieć o językach udokumentowanych historycznie i niewątpliwie indoeuropejskich, ale o niepewnym stanowisku systematycznym. Luzytański (Portugalia, zachodnia Hiszpania) i wenetyjski (północno-wschodnie Włochy), oba wymarłe na początku naszej ery, wydają się związane genealogicznie z grupą italoceltycką (być może bliżej z językami italskimi niż celtyckimi). Frygijski, udokumentowany na przestrzeni ponad tysiąca lat w środkowej Azji Mniejszej i wymarły około V w. n.e., był niewątpliwie blisko spokrewniony z greckim. Jeszcze bliższym kuzynem greki był starożytny macedoński (nie mylić ze współczesnym językiem słowiańskim znanym po tą samą nazwą). Może nawet stanowił część kontinuum bardzo zróżnicowanych dialektów starogreckich (o odkryciu i odcyfrowaniu najstarszego z nich, mykeńskiego, pisałem przy innej okazji). Z południowo-wschodnich Włoch (Apulia) znamy używany do II w. p.n.e. język mesapijski, prawdopodobnie importowany z Bałkanów i być może bliski albańskiemu (patrz wpis o starożytnej Italii). O innych językach ludów regionu bałkańskiego (Ilirów, Daków, Getów czy Traków) wiemy bardzo niewiele. Ze względu na rozmieszczenie geograficzne można prowizorycznie podejrzewać ich pokrewieństwo z greckim i albańskim, ale ze względu na ubóstwo danych jest to zgadywanie pozbawione solidnej podstawy. O skomplikowanej sytuacji językowej tej części Europy w czasach starożytnych była już mowa w innym wpisie.
Wspomniane języki i mówiące nimi ludy znamy przynajmniej z nazwy, ze wzmianek w źródłach starożytnych, z nielicznych inskrypcji albo z cytatów w dawnych glosariuszach. Nie sposób powiedzieć, ile języków indoeuropejskich znikło bezpotomnie, nie zostawiając po sobie tego rodzaju „skamieniałości“, choćby dlatego, że wymarły, zanim pojawiła się możliwość utrwalenia ich w formie pisanej. Ich ślady mogły zachować się np. w najstarszej warstwie nazw geograficznych albo w formie zapożyczeń w językach udokumentowanych. Nie bardzo jednak wiadomo, jak je analizować, żeby nie narazić się na zarzut uprawiania niesprawdzalnej spekulacji.
Uwagi końcowe
Podobnie jak w biologii, także w językoznawstwie model drzewa rodowego ma swoje ograniczenia. Kontakty między językami prowadzą do wtórnych upodobnień, które mogą być trudne do odróżnienia od zbieżności wynikających z pokrewieństwa. Języki danego regionu mogą się wymieniać słownictwem – czasem na skalę masową; ale cechy składniowe, morfologiczne i fonetyczne też mogą przenikać z jednego języka do drugiego tym łatwiej, im bardziej rozpowszechniona jest dwu- lub wielojęzyczność.
W przypadku języków blisko spokrewnionych i w dużym stopniu wciąż wzajemnie zrozumiałych dla swoich użytkowników pojawia się pytanie (w ogólnym przypadku nierozstrzygalne), czy naprawdę mamy już do czynienia z osobnymi jednostkami taksonomicznymi, czy z różnymi odmianami tego samego języka. Wobec nieistnienia efektywnej bariery komunikacyjnej lokalnie powstające innowacje szerzą się bez trudu w sieci dialektów (lub języków „w trakcie powstawania”) nie drogą przekazu z pokolenia na pokolenie, ale przez naśladowanie sąsiadów. Z tego względu klasyfikacja języków bardzo sobie bliskich i zróżnicowanych dialektalnie nie daje się wtłoczyć w prosty schemat drzewa rodowego.6
Języki odznaczają się wewnętrzną zmiennością, a w przypadku ich podziału na języki potomne współistniejące warianty mogą być dziedziczone przez linie potomne i zanikać lub utrwalać się w nich niezależnie, tworząc złudzenie wspólnych innowacji. Jest to zjawisko analogiczne do znanego z biologii niekompletnego sortowania linii rodowych. Każda cecha wariantywna może mieć własne drzewo rodowe tylko częściowo pokrywające się z drzewem rodowym języków.
Wybaczcie zatem językoznawcom historycznym, że nie zawsze potrafią udzielić jednoznacznej odpowiedzi na szczegółowe pytania dotyczące stosunków pokrewieństwa między językami danej rodziny. Gałęzie drzewa rodowego nie mają ostrych konturów. Czasem, zamiast rozdzielać się elegancko na osobne linie rodowe, tworzą pogmatwany krzak, w którym gałązki mogą się splatać i łączyć na powrót. Model drzewa i oparta na nim klasyfikacja stanowią uproszczoną, choć użyteczną idealizację skomplikowanej rzeczywistości. Na dobrą sprawę analiza kladystyczna (której wynikiem jest diagram w postaci drzewa) nie ma zastosowania do całości systemu języka, tylko do tej jego części, która ma homologiczne odpowiedniki w innych językach. Nie można zrozumieć w pełni ewolucji języka, jeśli skupiamy się tylko na elementach dziedziczonych od niepamiętnych czasów w postaci historycznego pakietu, traktując zapożyczenia i wpływy zewnętrzne jako kłopotliwą, ale w sumie mało istotną komplikację.
W kolejnym odcinku skupimy się na rekonstrukcji języka praindoeuropejskiego, zaczynając od jego systemu dźwiękowego. Innymi słowy, mowa będzie o tym, jak brzmiał język nigdy nie zapisany ani nie nagrany, a jednak dostępny dzięki śladom, jakie pozostawił w językach potomnych. Sam fakt, że możemy o tym dyskutować, jest znacznym osiągnięciem intelektualnym.
Przypisy
- Współcześnie dzielimy języki germańskie na grupę wschodnią (której jedynym udokumentowanym przedstawicielem jest wymarły język gocki) i północnozachodnią. Ta druga dzieli się na języki zachodniogermańskie i północnogermańskie (skandynawskie). ↩︎
- Oprócz języków irańskich i indoaryjskich należą do niej także języki nurystańskie – mała grupa reliktowych języków z rejonu Hindukuszu na pograniczu Afganistanu i Pakistanu. ↩︎
- Analogia ta abstrahuje od faktu, że języki anatolijskie i tocharskie wymarły, a stekowce i torbacze żyją nadal. ↩︎
- Słownictwo „podstawowe“ (o dużej częstości użycia, reprezentujące rozpowszechniony zespół znaczeń, bez których w ogóle trudno by się było porozumieć) jest z natury bardziej konserwatywne i odporniejsze na zastępowanie przez zapożyczenia. Odgrywa też szczególną rolę w stosowaniu metody porównawczej. ↩︎
- Moim zdaniem nie wynika to z rzeczywistego pokrewieństwa, tylko z długotrwałego sąsiedztwa tych języków w Europie Północnej, czego skutkiem była wtórna konwergencja. ↩︎
- Podobne problemy występują w biologii, czego skutkiem jest nieostra definicja pojęcia „gatunku“. ↩︎
Opisy ilustracji
Ilustracja w nagłówku. Jedno z drzew Schleichera, zamieszczone w jego książce z roku 1863, Die Darwinsche Theorie und die Sprachwissenschaft (Teoria Darwina a nauka o języku); wydawca: Hermann Böhlau, Weimar (domena publiczna).
Ryc. 1. August Schleicher (1821–1868), pionier filogenetyki językowej. Rycina z czeskiego tygodnika kulturalnego Světozar (22 stycznia 1869), towarzysząca artykułowi wspomnieniowemu o zmarłym miesiąc wcześniej językoznawcy. Źródło: Archiwum czasopism Instytutu Literatury Czeskiej (Czeska Akademia Nauk), domena publiczna.
Ryc. 2. Przykłady drzew filogenetycznych języków indoeuropejskich generowanych przy wykorzystaniu technik algorytmicznych. Zaadaptowane ze wstępu Thomasa Olandera do książki The Indo-European family: a phylogenetic perspective, red. Olander 2022, Cambridge University Press, ryc. 1.2, 1.3 (licencja CC-BY-NC-ND 4.0). Widać tu charakterystyczne problemy rekonstrukcji: niektóre zgrupowania gałęzi są stabilne (języki bałtosłowiańskie, indoirańskie i italoceltyckie), a języki anatolijskie i tocharskie konsekwentnie zajmują pozycję bazalną. Co do tego panuje zgoda. Poza tym jednak brak powtarzających się elementów wspólnych oprócz skądinąd wątpliwego pokrewieństwa grecko-ormiańskiego.
Ryc. 3. Najdłuższa ze znanych dotąd inskrypcji w języku trackim, zapisana alfabetem greckim na złotym pierścieniu z Ezerowa (Bułgaria), datowanym na V w. p.n.e. Podjęto wiele prób jej zinterpretowania, ale trudno je uznać za przekonujące. Być może niedawno odkryte graffiti trackie ze świątyni Apollina w Zone (północno-wschodnia Grecja, VI–IV w. p.n.e.) po odpowiednim opracowaniu rzucą wreszcie więcej światła na strukturę języka trackiego i jego miejsce w rodzinie indoeuropejskiej. Foto: Nikołaj Genow. Źródło: Bulgariana (fair use).