Rozmówki indoeuropejskie. Część 3: Spółgłoski sprzed tysięcy lat

Pozostałe części cyklu
Część 1: Zaproszenie
Część 2: Konary, gałęzie i gałązki drzewa rodowego
Część 4: Gra samogłosek i zadziwiający sukces pewnej hipotezy
Część 5: Rdzenie i słowa
Część 6: Ach, te końcówki!
Część 7: Paleontologia językowa

Zmiany dźwiękowe, czyli ruch głównie jednostronny

Zmiany dźwiękowe zachodzą przez cały czas w językach, które znamy; możemy je obserwować i badać bezpośrednio, dlatego wiemy, że duża część z nich to zmiany częste i „naturalne”. Oznacza to, że z przyczyn zależnych od tego, jak artykułujemy i postrzegamy dźwięki, mają one tendencję do zachodzenia w określonym kierunku i do asymetrii (zmiana A > B jest bardziej prawdopodobna niż B > A). Na przykład często się zdarza, że spółgłoski tylnojęzykowe, takie jak [k], ulegają palatalizacji (przesunięciu artykulacyjnemu ku przodowi), jeśli występuje po nich samogłoska przednia: [ke] > [tɕe] ze spółgłoską zwartoszczelinową (wymawiane jak polskie cie). Zmiana odwrotna jest mało prawdopodobna, natomiast uprzednienie spółgłoski często posuwa się dalej, może więc dać wynik typu [tʃe] lub [tse]. Spółgłoska zwartoszczelinowa może następnie utracić komponent zwarty, możliwa jest zatem dalsza ewolucja w stronę [ʃe], [se] itp. Wiemy więc, że [ke] może w naturalny sposób zmienić się w [tʃe] albo [se], ale nie widziano jeszcze, żeby [se] zmieniło się w [ke].

Jeśli zatem porównamy pokrewne słowa w grupie języków pochodzących od wspólnego przodka, to z ich wymowy często można bez wielkiego trudu wydedukować, jaka musiała być forma pierwotna, zakładając, że setki i tysiące lat temu procesy fonetyczne przebiegały podobnie jak obecnie (a nie ma powodu sądzić, że było inaczej, bo ani anatomia i fizjologia ludzka, ani prawa fizyki nie zmieniły się w tym czasie). W języku włoskim słowo oznaczające liczbę 100 brzmi cento /tʃɛnto/, po francusku cent /sɑ̃/, po hiszpańsku ciento /θjento/ lub /sjento/ (zależnie od dialektu), po portugalsku /sẽtu/, a w języku sardyńskim /kentu/. Widzimy, że choć brak palatalizacji w sardyńskim jest wyjątkiem wśród dzisiejszych języków romańskich, to właśnie ta forma musi być bardzo konserwatywna, bo wszystkie pozostałe spółgłoski początkowe w romańskich refleksach liczebnika ‘100’ mogą pochodzić od pierwotnego *k, ale nie na odwrót.1

Jest to początek rozumowania, które prowadzi nas do wniosku, że praromańska wymowa ‘100’ brzmiała w przybliżeniu *kentu. Ale język praromański to przecież po prostu łacina, aczkolwiek prowincjonalna, ludowa i potoczna – niekoniecznie taka sama, jakiej używali wykształceni literaci i elita rzymska. W łacinie klasycznej słowo ‘100’ pisane było centum, a realizowane jako /kentum/ – fonetycznie [kɛntʊ̃], jeśli zależy nam na aż takiej precyzji. Świadczy o tym nie tylko rozwój tego wyrazu w językach romańskich, ale także informacje z pierwszej ręki: zachowane uwagi gramatyków rzymskich opisujących własny język.2

Jak rozpracowano wymowę praindoeuropejską

Analizy porównawczej tego typu nie możemy bezpośrednio zweryfikować w przypadku języków, których wspólny przodek nie zachował się w formie pisanej, ale samo rozumowanie jest na tyle dobrze sprawdzone, że otrzymane w ten sposób rekonstrukcje możemy traktować z dużą dozą ufności. Pionierskie próby Jacoba Grimma czy Augusta Schleichera do końca XIX w. rozwinęły się w szczegółową „mapę drogową”. Dla większości gałęzi składających się na rodzinę indoeuropejską zrekonstruowano niemal kompletne sekwencje zmian, jakie zaszły między ostatnim wspólnym przodkiem ich wszystkich (językiem praindoeuropejskim) a przodkami poszczególnych grup oraz między ostatnim wspólnym przodkiem każdej grupy a językami współczesnymi. Odkrycia XX w. w połączeniu z pogłębioną wiedzą na temat mechanizmów zmian językowych pozwoliły na uzupełnienia i korekty.3 W przypadku języków „trudnych”, jak albański i ormiański, których izolowany charakter i ograniczona dokumentacja utrudnia odtworzenie łańcuchów zmian, wiele szczegółów pozostaje do dziś niepewnych, ale świadectwo pozostałych języków pozwala sięgnąć aż do czasów ostatniego wspólnego przodka rodziny i odtworzyć jego system dźwiękowy.

Czasem jest to łatwe. Na przykład, jeśli skupimy się na nagłosie wyrazu – a jest to pozycja, w której spółgłoski najrzadziej ulegają zmianom – to okazuje się, że istnieje duża klasa słów pokrewnych, które w każdej grupie języków indoeuropejskich zaczynają się na /m/. Jest to po prostu w tej pozycji spółgłoska bardzo stabilna, odporna na zmiany. Nie ma powodu wątpić, że w tej klasie słów już język praindoeuropejski miał początkowe *m.4 Spółgłoska /t/ jest nieco bardziej zmienna. Tam, gdzie niemal wszystkie grupy języków języki indoeuropejskie mają początkowe /t/, język ormiański i grupa germańska wyłamują się z jednomyślności. Ormiański ma przydechowe /th/ (tradycyjnie transliterowane jako ), a z porównania języków germańskich wynika, że pragermańskim odpowiednikiem /t/ było *þ, wymawiane /θ/.5 Najoszczędniej jest przyjąć, że w praindoeuropejskim istniała głoska *t, która w większości linii potomnych zachowała się bez większych zmian, a tylko w pojedynczych przypadkach przybrała silny przydech lub zmieniła artykulację na szczelinową. Germańska zmiana *t > *þ jest zresztą częścią bardziej ogólnego procesu znanego jako prawo Grimma.

Ryc. 1.

Dziwactwa i niespodzianki

Kiedy już rozpracowano zmiany częste i naturalne, czyli gdy większa część puzzle’a została ułożona, można było zidentyfikować inne odpowiedniości, dziwne lub wręcz unikatowe, ale regularne i „pasujące do układanki”. Na przykład praindoeuropejskie *s w pozycji początkowej przed akcentowaną samogłoską pojawia się w albańskim jako gj /ɟ/ (wymawiane jak polskie „miękkie g” w giąć); zjawisko to nie powtarza się nigdzie indziej w rodzinie indoeuropejskiej. Praindoeuropejskie *kw (wymawiane z zaokrągleniem warg) przed samogłoskami przednimi rozwinęło się w greckie /t/, poza tym w /p/, ale w niektórych kontekstach straciło zaokrąglenie i stało się zwykłym /k/.6 Jedną ze zmian najbardziej kuriozalnych jest rozwój nagłosowego *dw w języku ormiańskim: *dw > erk. Na przykład polskiemu dwa, łacińskiemu duo czy staroindyjskiemu dvā odpowiada klasyczne ormiańskie erku (patrz ryc. 1).

Gdybyśmy wcześniej nie dopasowali do siebie innych kawałków układanki, trudno byłoby uwierzyć, że tak może wyglądać regularna odpowiedniość. Jest ona jednak poparta przez kilka innych solidnych przykładów, a jak mawiał Sherlock Holmes: „Gdy wyeliminujesz niemożliwe, to, co pozostanie, jakkolwiek nieprawdopodobne, musi być prawdą”. Oczywiście rozwój *dw > erk nie nastąpił w jednym kroku. Ten uproszczony zapis pokazuje stan początkowy i końcowy, pomijając stadia pośrednie. Co się działo pomiędzy nimi – to problem znany w literaturze przedmiotu jako „wielka zagadka ormiańska”.

Model standardowy: spółgłoski

Ale pomińmy problemy szczegółówe (których jest legion) i przyjrzyjmy się głoskom praindoeuropejskim zrekonstruowanym według modelu uznawanego obecnie za standardowy. Zacznijmy od systemu spółgłosek, pokazanego na ryc. 2. Wiele z nich to głoski występujące powszechnie, ale system praindoeuropejski miał swoje dziwactwa. Zresztą który język ich nie ma? Wystarczy wspomnieć barokowe bogactwo głosek szczelinowych i zwartoszczelinowych, dzięki którym język polski jest zmorą fonetyczną dla cudzoziemców pragnących się go nauczyć. W poniższej tabeli spółgłoski uporządkowane są według miejsca artykulacji (kolumny) i mechanizmu artykulacji (wiersze).

Ryc. 2.

Trzy szeregi, w tym jeden niezwykły

Pierwsze trzy wiersze tabeli zajmują spółgłoski zwarte. Osobliwością, na którą warto zwrócić uwagę, jest to, że tworzą one aż trzy szeregi różniące się fonacją, czyli aktywnością strun głosowych. Pierwszy szereg to zwykłe spółgłoski bezdźwięczne (np. *p). Drugi – to ich odpowiedniki dźwięczne (np. *b). Na razie nic niezwykłego. Ale istniał jeszcze trzeci szereg, reprezentowany przez *bh. Dodatkowy symbol (podniesione h) oznacza przydech, czyli energiczny wyrzut wydychanego powietrza towarzyszący rozwarciu narządów artykulacji. Podobne trzy szeregi istniały np. w klasycznej grece: /p, b, ph/, ale tam szereg przydechowy był bezdźwięczny, co zdarza się o wiele częściej. Spółgłoski łączące dźwięczność z przydechowością są bardzo rzadkie, ale można je spotkać np. w języku staroindyjskim i w wielu wywodzących się z niego współczesnych językach Indii, takich jak hindi. System indyjski obejmuje nawet aż cztery szeregi: /p, ph, b, bh/.7

Ze świecą szukać języka, w którym przydechowe byłyby tylko spółgłoski dźwięczne. Język praindoeuropejski był pod tym względem unikatem. Z fonetycznego punktu widzenia przydech bezdźwięczny [ph] jest czymś innym niż przydech dźwięczny [bh]. Pierwszy polega na tym, że w chwili rozwarcia fałdy głosowe krtani pozostają szeroko rozsunięte i powietrze wypływa jeszcze przez chwilę bez przeszkód, zanim fałdy przyjmą pozycję umożliwiającą wprawienie ich w wibracje (co wymaga zamknięcia szczeliny między nimi). W drugim przypadku trzeba jakoś pogodzić przydech z dźwięcznością (czyli jak gdyby wodę z ogniem). Można to zrobić na kilka sposobów (dających podobny efekt akustyczny), np. zbliżając fałdy głosowe na części ich długości, pozostawiając jednak w pozostałej części szczelinę (tak jest w języku hindi), albo zbliżając je do siebie niekompletnie, tak że wibrują „na pół gwizdka”, jak przy teatralnym szepcie. Głoski artykułowane w ten sposób nazywamy „dyszącymi” (po angielsku breathy-voiced).

Trudno mieć pewność, co dokładnie działo się z krtanią ludzi mówiący po praindoeuropejsku. Wiemy jednak, że w wielu językach (m.in. w bałtosłowiańskich, irańskich czy celtyckich) spółgłoski trzeciego szeregu straciły swoją dyszącą wymowę i utożsamiły się ze zwykłymi dźwięcznymi. W greckim uległy ubezdźwięcznieniu (np. *bh > /ph/). W językach indoaryjskich zachowały się jako bh (być może wymawiane nieco inaczej niż w prajęzyku, ale też dyszące). W języku praitalskim stały się szczelinowe: dawne *bh zmieniło się w *β (wymawiane jak hiszpańskie b) w środku wyrazu, a w nagłosie ubezdźwięczniło się, dając *f. W łacinie śródgłosowe *β ostatecznie „stwardniało”, zmieniając się w /b/, ale nagłosowe /f/ pozostało szczelinowe, jak w wyrazie frāter, spokrewnionym z polskim brat albo angielskim brother. W językach germańskich zgodnie z prawem Grimma ze spółgłosek dyszących powstały dźwięczne szczelinowe, które następnie w niektórych pozycjach przekształciły się w zwarte dźwięczne, w tym przypadku /b/.8

Krótko mówiąc, rozwój trzeciego szeregu wskazuje na tendencję do zaniku dźwięczności przy zachowaniu przydechu, do wzmocnienia dźwięczności połączonego z utratą „efektów specjalnych” albo do wymowy szczelinowej. Tego właśnie należałoby oczekiwać, jeśli trzeci szereg miał wymowę dyszącą, fonetycznie półdźwięczną. W językach indoaryjskich, które wykształciły dodatkowo głoski par excellence przydechowe typu /ph/, odziedziczone głoski typu /bh/ zostały zinterpretowane jako ich dźwięczne odpowiedniki.

Gdzie się podziało *b?

Inną osobliwością systemu spółgłosek praindoeuropejskich jest fakt nietypowej częstości występowania spółgłosek zwartych wargowych. Zarówno *p, jak i *bh występowały w bardzo wielu słowach, także w słownictwie podstawowym, natomiast *b było skrajnie rzadkie, a tam, gdzie da się je zrekonstruować, jest nieraz tylko wariantem *p udźwięcznionym przez upodobnienie do następującej po nim głoski dźwięcznej. Można nawet wątpić, czy w ogóle istniało jako odrębny fonem. Jak to możliwe, skoro bardziej skomplikowana artykulacja *bh była tak częsta? Jedna z hipotez głosi, że standardowa rekonstrukcja trzech szeregów jako /p, b, bh/ jest błędna i że w szczególności drugi szereg był czymś innym, niż się wydaje. Mogły to być np. spółgłoski glotalizowane – ejektywne lub „zgrzytliwe”, którym towarzyszyło zwarcie krtaniowe lub podobnego typu aktywność fałdów głosowych.

Z przyczyn fizycznych, które wyjaśniałem, omawiając języki Majów, w systemach zawierających spółgłoski tego typu może występować luka – brak spółgłoski wargowej. Ta hipoteza (tzw. „teoria glotalna”) jest pod niektórymi względami atrakcyjna, ale nie wyparła interpretacji standardowej. Można też rozważać możliwość kompromisową, że glotalizacja była cechą tych spółgłosek w zamierzchłych czasach pra-praindoeuropejskich, ale że w języku praindoeuropejskim zastąpiła ją zwykła dźwięczność. Taki scenariusz tłumaczyłby nieobecność *b (i kilka innych dziwnych zachowań spółgłosek drugiego szeregu), ale nie wymagałby modyfikacji modelu standardowego, który mimo wszystko dobrze wyjaśnia drogi rozwoju spółgłosek w późniejszym okresie.

„K“ w trzech smakach i języki satemowe

Następna ciekawa cecha zrekonstruowanego systemu to występowanie trzech odmian spółgłosek tylnojęzykowych: palatalnych, czyli „miękkich” (typu *, co oznacza wymowę uprzednioną, [kj]), zwykłych welarnych o artykulacji zdecydowanie cofniętej (typu *k) i labializowanych, czyli wymawianych z zaokrągleniem warg (typu *kw). System ten był historycznie mało stabilny. Kontrast między wszystkimi trzema odmianami zachował się szczątkowo w kilku językach (m.in. w albańskim), przeważnie jednak któraś z nich znikała. Jedną z możliwości było utożsamienie * z *k (poprzez utratę palatalizacji), podczas gdy *kw zachowywało swoją odrębność i ślady zaokrąglenia. Druga możliwość polegała na tym, że *kw traciło zaokrąglenie i utożsamiało się z *k, natomiast * nie tylko zachowywało swoją odrębność, ale jeszcze ją podkreślało, przesuwając swoje miejsce artykulacji coraz bardziej ku przodowi. W rezultacie przestawało być tylnojęzykowe, zmieniając się w spółgłoskę zwartoszczelinową lub szczelinową artykułowaną za pomocą środkowej lub przedniej części języka.

Oznaczmy sobie ten wynik zmiękczenia jako *ć (wymowa polskiej litery ć idealnie tu pasuje). Zmiana *, *k, *kw > *ć, *k, *k zaszła w językach indoirańskich i bałtosłowiańskich, a także w języku ormiańskim. Część badaczy uważa, że niezależnie. Moim zdaniem była to raczej wspólna innowacja języka będącego przodkiem tych trzech gałęzi. Równolegle zmieniły się dwa pozostałe szeregi zwartych: *ǵ, *g, *gw > *, *g, *g oraz *ǵh, *gh, *gwh > *h, *gh, *gh. Późniejszy rozwój *ć, *, *h przebiegał już różnie w poszczególnych liniach potomnych. Refleksami praindoeuropejskiego * są ormiańskie s, staroindyjskie ś [ɕ], prairańskie *c [ts] (a następnie awestyjskie s i staroperskie θ), litewskie š [ʃ], łotewskie s i słowiańskie s. Języki, w których zaszła ta zmiana, są określane zbiorowo nazwą satemowych.9 Urobiono ją od awestyjskiego liczebnika satəm ‘100’, który pochodzi od praindoeuropejskiego *ḱm̥tom i ilustruje losy początkowej spółgłoski (patrz też sanskryckie śatam, litewskie šimtas czy polskie sto). W łacinie, która nie należała do języków satemowych, początkowe * utożsamiło się z *k, dając centum /kentum/, słowo wspomniane już wyżej.

Tu ktoś czujny mógłby mi przerwać: Chwileczkę! Przecież język francuski ma w tym słowie /s/, hiszpański /θ/ lub /s/, a włoski /tʃ/. Czy w takim razie nie powinniśmy zaliczyć języków romańskich do grupy satemowej? Nie, ponieważ w ich przypadku zmiękczenie jest wtórne. Zmiana ta zaszła późno, około V w. n.e. (omijając język sardyński), i była uwarunkowana otoczeniem fonetycznym (wpływ samogłoski przedniej). Tymczasem „satemowe” *, *ǵ, *ǵh nie były wariantami pozycyjnymi spółgłosek welarnych, lecz niezależnymi fonemami, i ulegały zmianie niezależnie od kontekstu – także przed samogłoską tylną lub spółgłoską. A zatem fakt, że i polski, i francuski mają liczebnik ‘100’ zaczynający się od /s/ (sto, cent), jest wynikiem konwergencji (niezależnej zmiany w tym samym kierunku), a nie homologii (wspólnej innowacji odziedziczonej po wspólnym przodku).

Spółgłoski laryngalne i cała reszta

Ostatnia grupa głosek wymagająca specjalnego omówienia to tzw. spółgłoski laryngalne.10 Wśród indoeuropeistów istnieje dziś niemal pełna zgoda, że istniały trzy fonemy praindoeuropejskie tego typu. Wszystkie były spółgłoskami tylnymi, artykułowanymi gdzieś między krtanią a podniebieniem miękkim – co do tego badacze są zgodni. Ponieważ jednak nie jesteśmy na sto procent pewni szczegółów artykulacyjnych, dla świętego spokoju oznaczamy je symbolem h i numerkiem (indeksem): *h1, *h2, *h3. Najczęściej przyjmuje się, że *h1 było szczelinową spółgłoską krtaniową /h/, czyli głoską wymawianą tak samo jak angielskie /h/ w hat lub house.11 Według mniej popularnej hipotezy konkurencyjnej *h1 mogło być zwarciem krtaniowym /ʔ/. Tak czy owak było spółgłoską krtaniową, czyli właściwie pozbawioną miejsca artykulacji, fonologicznie słabą, z silną skłonnością do zaniku w językach potomnych. Pozostałe dwie spółgłoski były szczelinowe i „gardłowe” (w luźnym sensie, obejmującym różne możliwe artykulację). Niektóre dane wskazują na dźwięczność *h3, stąd podejrzenie, że *h2, *h3 tworzyły parę dźwięczna : bezdźwięczna. Ich wpływ na sąsiednie głoski sugeruje, że były to spółgłoski albo faryngalne, czyli /ħ, ʕ/ (spotykane np. w arabskim), albo języczkowe (uwularne), czyli [χ, ʁ] (wymawiane podobnie do standardowego francuskiego r).12 Przyjrzyjmy się dobrze trzem laryngalnym i zapamiętajmy je, bo odegrają one jeszcze ważną rolę w naszych rozmówkach.

Oprócz laryngalnych praindoeuropejski posiadał tylko jedną spółgłoskę szczelinową, *s, pospolicie spotykaną w językach świata. Jak to zwykle bywa, gdy system jest ubogi w głoski tej kategorii, *s zapewne miało dość szeroki zakres możliwych realizacji dopasowujących się do otoczenia fonetycznego. Przed dźwięcznymi spółgłoskami zwartymi ulegało udźwięcznieniu i było realizowane jako [z], ale był to tylko alofon (wariant pozycyjny) /s/, a nie osobny fonem. Cała reszta spółgłosek, umieszczona w wierszach 6–8 tabeli, to głoski bardzo pospolite i nienastręczające problemów. Są to wszystko sonoranty, czyli spółgłoski z natury dźwięczne: nosowe, płynne (boczne lub rotyczne) i półsamogłoski. Cechami akustycznymi przypominają one samogłoski i brały udział w praindoeuropejskiej „grze samogłosek”. Czym jednak była ta gra i jakie były jej zasady, dowiemy się w kolejnym odcinku.

Przypisy

  1. Gwiazdka, zwana fachowo asteryskiem, oznacza rekonstrukcję. ↩︎
  2. Nie mylić z dzisiejszą szkolną wymową łaciny, która wywodzi się z tradycji średniowiecznej i renesansowej, ale nie jest wierną rekonstrukcją autentycznej wymowy starożytnych Rzymian. ↩︎
  3. Najważniejsze z tych odkryć to odczytanie języków anatolijskich i tocharskich oraz pisma linearnego B, w którym zapisano najstarsze teksty greckie. ↩︎
  4. Zasada oszczędnego rozumowania, zwana „brzytwą Ockhama“, zaleca, żeby nie przyjmować wyjaśnień skomplikowanych, dopóki wyjaśnienie najprostsze dostatecznie dobrze tłumaczy fakty. ↩︎
  5. Spółgłoskę tę zachowały języki angielski i islandzki; miały ją także gocki i staronordyjski. W większości współczesnych języków germańskich /θ/ uległo dalszym zmianom, przekształcając się w /d/ jak w niemieckim czy niderlandzkim, lub w /t/ jak w duńskim, szwedzkim czy norweskim (przypadkiem powracając do punktu wyjścia). Wiemy, że to /t/ nie może być zachowaną wymową pierwotną, ponieważ dobrze udokumentowany staronordyjski – przodek dzisiejszych języków skandynawskich – niewątpliwie miał szczelinowe /θ/. ↩︎
  6. Wyjątkiem był archaiczny dialekt mykeński z II tysiąclecia p.n.e., w którym zachowała się pierwotna wymowa /kw/. ↩︎
  7. Drugi z tych szeregów jest innowacją indoirańską lub indoaryjską, nieznaną językowi praindoeuropejskiemu. ↩︎
  8. Dla uproszczenia w rekonstrukcjach pragermańskich piszemy często *b, *d, *g, *gw, jednak warto pamiętać, że rzeczywista wymowa tych głosek była szczelinowa: [β, ð, ɣ, ɣw], o czym świadczą ich dalsze losy w grupie germańskiej. ↩︎
  9. W albańskim * zmieniło się w th /θ/, a *ǵ, *ǵh dały dh /ð/. Przypomina to rozwój satemowy, ale albański zachował częściowo kontrast między *k a *kw. ↩︎
  10. Nazwa ta przylgnęła do nich na mocy tradycji, warto jednak wiedzieć, że przymiotnik „laryngalny“ odnosi się do krtani (larynx), a tylko jedna z tych spółgłosek była rzeczywiście krtaniowa. Nie ma jednak potrzeby kłócić się o konwencjonalne etykietki. ↩︎
  11. Nie mylić z polskim ch, które jest spółgłoską welarną [x]: podczas jej wymowy tylna część języka zbliża się do podniebienia miękkiego. ↩︎
  12. Francuskie r jest dźwięczne w lettre ′list, litera’, a dźwięczne w roi ′król’ – fonetycznie [lɛtχ] i [ʁwa]. Jeśli kogoś interesują szczegóły artykulacyjne, ich omówienie można znaleźć tutaj. ↩︎

Opisy ilustracji

Ilustracja w nagłówku. Klasyczny alfabet ormiański (36 liter), inspirowany pismem greckim, ale wybitnie oryginalny, opracowany na początku V w. n.e. przez Mesropa Masztoca (po ormiańsku Mesrop Maštoc’ z przydechowym [tsh] na końcu). Język ormiański ewoluował przez bardzo długi czas jako osobna linia rozwojowa języków indoeuropejski i słynie z zagadkowych, trudnych do zrekonstruowania zmian dźwiękowych nagromadzonych w tym czasie. Domena publiczna.
Ryc. 1. Piękna infografika Ryana Starkey, pokazująca refleksy praindoeuropejskiego liczebnika '2′ w językach potomnych. Źródło: Starkey Comics (fair use).
Ryc. 2. System praindoeuropejskich fonemów spółgłoskowych. Autor: Piotr Gąsiorowski (CC BY-SA 3.0).

Rozmówki indoeuropejskie. Część 2: Konary, gałęzie i gałązki drzewa rodowego

Pozostałe części cyklu
Część 1: Zaproszenie
Część 3: Spółgłoski sprzed tysięcy lat
Część 4: Gra samogłosek i zadziwiający sukces pewnej hipotezy
Część 5: Rdzenie i słowa
Część 6: Ach, te końcówki!
Część 7: Paleontologia językowa

August Schleicher rysuje drzewa

Zanim jeszcze powstała koncepcja rodziny indoeuropejskiej, było jasne dla badaczy, że niektóre języki tworzą wyraźne grupy połączone bliskim pokrewieństwem (na przykład języki słowiańskie, germańskie czy celtyckie). Kiedy August Schleicher rysował pierwsze wersje drzewa rodowego języków europejskich (wprowadzając do językoznawstwa historycznego myślenie filogenetyczne), węzły, z których rozchodziły się gałęzie, odpowiadały ostatniemu wspólnemu przodkowi każdej z tych grup. Ale u Schleichera nie wygląda to tak, że z pierwszego węzła (język praindoeuropejski) wyodrębniają się od razu języki prasłowiański, pragermański, praceltycki itd., a z pragermańskiego bezpośrednio niemiecki, angielski czy szwedzki. Schleicher zdawał sobie sprawę, że filogeneza to proces zachodzący etapami i generujący różnorodność dzięki wielokrotnie powtarzającym się podziałom – patrz ilustracja w nagłówku. Dlatego w jego drzewie rodowym na przykład z węzła pragermańskiego wyrastają trzy gałęzie: gocka (wymarła), zachodniogermańska i skandynawska1; z kolei przodek języków zachodniogermańskich daje początek gałęzi wysokoniemieckiej i gałęzi „języków Morza Północnego”, z której pączkują fryzyjski, dolnoniemiecki, niderlandzki i angielski (także pogrupowane według stopnia pokrewieństwa). Podobne podgrupy, zorganizowane hierarchicznie, wyróżnił wśród języków słowiańskich.

Ryc. 1.

Na początku drugiej połowy XIX w. rozumiano też, że niektóre spośród dużych gałęzi języków indoeuropejskich można połączyć w większe „konary”. Na przykład języki indoaryjskie (wywodzące się ze staroindyjskiego) i irańskie są z sobą wyraźnie spokrewnione. Fakt ten jest tym bardziej oczywisty, im starszych przedstawicieli obu grup porównujemy (na przykład sanskryt po stronie indyjskiej i język staroperski lub awestyjski po stronie irańskiej). Podobne cechy fonetyczne, zbieżności gramatyczne i wspólne słownictwo niewystępujące w innych grupach pozwalają nam mówić o grupie indoirańskiej i rekonstruować na tej podstawie język praindoirański.2 Już u Schleichera (jednego z pionierów badań nad językiem litewskim) występuje też grupa bałtosłowiańska. Jej spójność genealogiczna jest powszechnie przyjmowana również w naszych czasach: według naszej najlepszej wiedzy istniał etap bałtosłowiańskiej wspólnoty językowej, czego widoczną konsekwencją jest duża liczba identycznych zmian dźwiękowych, innowacji gramatycznych i słownictwa specyficznego dla Bałtów i Słowian. Nieco mniej oczywistym przykładem bliższego pokrewieństwa jest proponowana przez Schleichera grupa italoceltycka. W tym przypadku w późniejszych czasach przytaczano argument za i przeciw, ale z dzisiejszego punktu można powiedzieć, że dokładne analizy porównawcze potwierdzają intuicję Schleichera. Większość współczesnych indoeuropeistów akceptuje języki italoceltyckie jako poprawnie zdefiniowaną jednostkę taksonomiczną.

Schleicher był także zdania, że języki bałtosłowiańskie i germańskie tworzą większą grupę „słowiańsko-germańską” i że albański jest bliski greckiemu. O ormiańskim nie miał nic szczególnego do powiedzenia, bo uważano go wówczas za trochę nietypowy język z grupy irańskiej. Dopiero w 1875 r. Heinrich Hübschmann wykazał, że ormiański nie ma bliskich krewnych i stanowi osobną, wcześnie wyodrębnioną gałąź języków indoeuropejskich. U Schleichera grupa grecko-albańska łączyła się z italoceltycką, a obie razem – z indoirańską. Te propozycje zestarzały się gorzej niż te, o których była mowa w poprzednim akapicie, ale nie ma w tym nic złego. Pamiętajmy, że uprawianie nauki polega na formułowaniu i sprawdzaniu hipotez i cierpliwym posuwaniu się naprzód metodą prób i błędów, a nie na odgadywaniu prawd ostatecznych.

Języki jak ssaki, czyli analogie interdyscyplinarne

Języki anatolijskie poznano dopiero w XX w. Co do ich pozycji, panuje ogólna zgoda, że po pierwsze stanowią jedną, genealogicznie zwartą gałąź, a po drugie – są grupą siostrzaną względem wszystkich pozostałych języków indoeuropejskich. Druga późno poznana grupa to języki tocharskie. Tutaj zdania są nieco bardziej podzielone, ale gdyby zaprosić indoeuropeistów do głosowania nad hipotezą, że języki tocharskie są drugą po anatolijskich grupą „bazalną”, czyli znowu siostrzaną względem pozostałych, to pogląd ten wygrałby znaczną większością głosów. Oczywiście nie w taki sposób rozstrzyga się spory naukowe; mam tylko na myśli, że w różnych analizach filogenetycznych języki tocharskie sytuują się w takiej pozycji wystarczająco konsekwentnie.

Gdyby porównać drzewo rodowe języków indoeuropejskich do jakiegoś przykładu z biologii, np. filogenezy ssaków, to języki anatolijskie odpowiadałyby stekowcom, tocharskie – torbaczom, a pozostałe – łożyskowcom.3 Analogię tę można posunąć dalej. Drzewo rodowe łożyskowców rozwidla się w kilkanaście głównych gałęzi, którym przypisano rangę rzędów (gryzonie, nietoperze, naczelne, parzystokopytne itd.). I podobnie jak językoznawcy, biolodzy zajmujący się ssakami borykali się z problemem wzajemnego pokrewieństwa tych gałęzi. Tradycyjnie wyróżniane rzędy w zasadzie utrzymały swój status, kiedy zastosowano do klasyfikacji najnowsze metody ustalania pokrewieństwa (zwłasza analizę genomów), ale wciąż trwają dyskusje dotyczące ich wzajemnych relacji rodzinnych. W ciągu ostatnich dwudziestu–trzydziestu lat udało się wreszcie pogrupować rzędy łożyskowców w trzy podstawowe klady, ale nadal nie ma pełnej zgody co do szczegółów ich wewnętrznej systematyki.

Przyczyna jest podobna jak w przypadku języków indoeuropejskich. Rzędy wyróżniają się wyraźnie, bo każdy z nich ma za sobą długą osobną historię i wspólnego przodka, w którego linii rodowej nagromadziło się przez miliony lat wiele unikatowych innowacji. Natomiast rozwidlenia, które doprowadziły do powstania dzisiejszych rzędów, następowały szybko jedne po drugich, szczególnie po globalnej katastrofie sprzed 66 mln lat. Ocalałe ssaki opanowały wiele opustoszałych nisz ekologicznych i ich ewolucja przybrała charakter wielkiej radiacji przystosowawczej. Czynniki komplikujące, które utrudniają stosowanie modelu drzewa rodowego (hybrydyzacja, niekompletne sortowanie linii rodowych), dodatkowo zatarły ślady tych wczesnych podziałów.

Wielki wybuch języków indoeuropejskich

Podobna była dynamika ewolucyjna rodziny indoeuropejskiej. Należy ona do największych znanych rodzin językowych, co świadczy o tym, że przeszła w swojej historii stadium gwałtownej ekspansji, którego skutkiem był rozpad wspólnoty językowej na wiele lokalnych linii rozwojowych. Stało się to już po odłączeniu się języków anatolijskich, których zasięg pozostał ograniczony do Azji Mniejszej. Przyczyny tego „wielkiego wybuchu” nie są jasne. Przypisuje się je zmianom cywilizacyjnym na przełomie chalkolitu i wczesnej epoki brązu; mobilności związanej z rozwojem transportu kołowego i gospodarki opartej w dużym stopniu na pasterstwie i hodowli bydła; zapaści demograficznej pierwotnych (nieindoeuropejskich) społeczeństw rolniczych Europy na przykład wskutek epidemii; ukształtowaniu się elity społecznej kultywującej etos „wojownika-herosa” (co sprzyjało agresywnym podbojom nowych obszarów), a także udomowieniu koni i wykorzystaniu ich jako zwierząt pociągowych, wierzchowych i bojowych. Zapewne, jak to zwykle bywa, ekspansja indoeuropejska spowodowana była przez kumulację kilku różnych czynników. Podziały migrujących populacji i różnicowanie się używanych przez nie języków następowały na tyle szybko, że między jednym a drugim podziałem nie było zbyt wiele czasu, żeby nagromadziły się innowacje pozwalające po tysiącach lat zrekonstruować topologię drzewa rodowego.

Tak jak w biologii, dowodem na bliższe pokrewieństwo są właśnie innowacje odziedziczone po wspólnym przodku i niewystępujące w innych liniach rodowych. W językoznawstwie największą wagę przypisuje się innowacjom fonetycznym (zmianom dźwiękowym). Aby jednak miały wartość dowodową, muszą spełniać pewne warunki. Po pierwsze, powinny być nietrywialne, czyli reprezentować typ procesów zachodzących na tyle rzadko, że prawdopodobieństwo ich wielokrotnego niezależnego wystąpienia w różnych językach jest niewielkie. Po drugie, jeżeli można odtworzyć ich kolejność w czasie, to powinna ona być taka sama w porównywanych językach. Mile widziane są zatem zmiany rzadkie, osobliwe i występujące w określonej sekwencji. Zwykle nie brak ich w ogólnie uznanych kladach językowych (i właśnie dlatego są one ogólnie uznane). Na przykład w językach germańskich odkryto stopniowo cały kompleks uporządkowanych chronologicznie zmian spółgłoskowych, znanych jako prawa Grimma, Vernera i Klugego – unikatowy jak odcisk palca. Zmiany te zaszły tylko raz w historii języka pragermańskiego, a ich ślady zostały odziedziczone przez wszystkie języki potomne. Inne możliwości są po prostu skrajnie nieprawdopodobne.

Jeśli jakaś linia rozwojowa istniała krótko, zanim uległa rozszczepieniu, to mogło się zdarzyć, że nie zdążyły w niej nagromadzić mało prawdopodobne zmiany fonetyczne. Warto więc także zwrócić uwagę na wspólne innowacje morfologiczne, czyli niespotykane gdzie indziej cechy fleksji (odmiany gramatycznej wyrazów) lub schematy słowotwórcze. Mniejszą wartość dowodową ma wspólne słownictwo, ponieważ ze wszystkich elementów struktury języka słowa są najbardziej podatne na zapożyczanie. Żeby użyć innowacji słownikowych jako argumentu na rzecz pokrewieństwa, trzeba wykluczyć zapożyczenia.4

Ilu autorów, tyle drzew

Do rekonstrukcji drzewa rodowego języków używa się od pewnego czasu algorytmów filogenetycznych naśladujących te, które opracowano na potrzeby biologii ewolucyjnej. Wyniki są interesujące, ale nie przyniosły rozstrzygnięcia kwestii spornych. Fakt, że konsekwentnie potwierdzają poprawność podziału na tradycyjnie wyróżniane gałęzie (oraz spójność genetyczną grup indoirańskiej, bałtosłowiańskiej, a zwykle też italoceltyckiej) jest krzepiący, ale trudno go nazwać sensacyjnym. Jak to zwykle bywa z algorytmami, diabeł tkwi w szczegółach – takich jak poprawny dobór danych. Tu filogenetyka językoznawcza wciąż ma kłopoty, o czym świadczy duży rozrzut wyników (patrz ryc. 2). Każda nowo opublikowana analiza (oczywiście korzystająca z big data i zaawansowanych algorytmów) jest promowana jako przełom lub wielki krok naprzód, ale dopóki nie zacznie się wyłaniać coś w rodzaju zbieżności rezultatów, wskazana jest rezerwa.

Ryc. 2.

Tutaj mogę się podzielić własną opinią – prywatną i subiektywną, a zatem także zasługującą na sceptycyzm. Podobnie jak zdecydowana większość indoeuropeistów, przyjmuję bez zastrzeżeń „bazalny” status języków anatolijskich jako grupy siostrzanej względem całej reszty rodziny indoeuropejskiej. Przyjmuję także, wzorem większości, że kolejny podział doprowadził do oddzielenia się języków tocharskich od przodka „grupy koronnej”, obejmującej wszystkie współcześnie używane języki indoeuropejskie (i tożsamej z rodziną indoeuropejską w rozumieniu dziewiętnastowiecznym). Tu kończy się konsensus, a pojawia się pytanie, co było dalej.

Uważam, że grupę koronną można podzielić na trzy mniejsze grupy. Na pierwszą – nazwijmy ją „zachodnią” – składają się języki germańskie i italoceltyckie. Druga to grupa „wschodnia”, której rdzeń stanowią języki indoirańskie i bałtosłowiańskie; z dużym wahaniem skłonny jestem sądzić, że pozycję satelitarną – siostrzaną względem jednych i drugich łącznie – zajmuje język ormiański. Do trzeciej grupy, „bałkańskiej”, należą języki grecki i albański. Podgrupy druga i trzecia wydają się bliżej spokrewnione z sobą nawzajem niż z podgrupą zachodnią.

Od razu zastrzegam, że istnieje tu duża rozbieżność zdań, a także wyników produkowanych przez algorytmy. Języki germańskie bywają, jak u Schleichera, łączone z bałtosłowiańskimi5, a nawet z albańskim. Ormiański i albański mają tak wiele cech nietypowych, że wykazują niepokojącą tendencję do skakania po całym drzewie rodowym. Od początku XX w. utrwalił się tradycyjny pogląd o pokrewieństwie grecko-ormiańskim, jednak nowsze analizy podważyły wiele z proponowanych wspólnych innowacji tych języków. Krótko mówiąc, na tym poziomie klasyfikacji panuje wciąż galimatias, z którego wyłaniają się dobrze znane, niekontrowersyjne gałęzie.

Języki fragmentaryczne, czyli ciemna materia rodziny indoeuropejskie

Warto jeszcze wspomnieć o językach udokumentowanych historycznie i niewątpliwie indoeuropejskich, ale o niepewnym stanowisku systematycznym. Luzytański (Portugalia, zachodnia Hiszpania) i wenetyjski (północno-wschodnie Włochy), oba wymarłe na początku naszej ery, wydają się związane genealogicznie z grupą italoceltycką (być może bliżej z językami italskimi niż celtyckimi). Frygijski, udokumentowany na przestrzeni ponad tysiąca lat w środkowej Azji Mniejszej i wymarły około V w. n.e., był niewątpliwie blisko spokrewniony z greckim. Jeszcze bliższym kuzynem greki był starożytny macedoński (nie mylić ze współczesnym językiem słowiańskim znanym po tą samą nazwą). Może nawet stanowił część kontinuum bardzo zróżnicowanych dialektów starogreckich (o odkryciu i odcyfrowaniu najstarszego z nich, mykeńskiego, pisałem przy innej okazji). Z południowo-wschodnich Włoch (Apulia) znamy używany do II w. p.n.e. język mesapijski, prawdopodobnie importowany z Bałkanów i być może bliski albańskiemu (patrz wpis o starożytnej Italii). O innych językach ludów regionu bałkańskiego (Ilirów, Daków, Getów czy Traków) wiemy bardzo niewiele. Ze względu na rozmieszczenie geograficzne można prowizorycznie podejrzewać ich pokrewieństwo z greckim i albańskim, ale ze względu na ubóstwo danych jest to zgadywanie pozbawione solidnej podstawy. O skomplikowanej sytuacji językowej tej części Europy w czasach starożytnych była już mowa w innym wpisie.

Ryc. 3.

Wspomniane języki i mówiące nimi ludy znamy przynajmniej z nazwy, ze wzmianek w źródłach starożytnych, z nielicznych inskrypcji albo z cytatów w dawnych glosariuszach. Nie sposób powiedzieć, ile języków indoeuropejskich znikło bezpotomnie, nie zostawiając po sobie tego rodzaju „skamieniałości“, choćby dlatego, że wymarły, zanim pojawiła się możliwość utrwalenia ich w formie pisanej. Ich ślady mogły zachować się np. w najstarszej warstwie nazw geograficznych albo w formie zapożyczeń w językach udokumentowanych. Nie bardzo jednak wiadomo, jak je analizować, żeby nie narazić się na zarzut uprawiania niesprawdzalnej spekulacji.

Uwagi końcowe

Podobnie jak w biologii, także w językoznawstwie model drzewa rodowego ma swoje ograniczenia. Kontakty między językami prowadzą do wtórnych upodobnień, które mogą być trudne do odróżnienia od zbieżności wynikających z pokrewieństwa. Języki danego regionu mogą się wymieniać słownictwem – czasem na skalę masową; ale cechy składniowe, morfologiczne i fonetyczne też mogą przenikać z jednego języka do drugiego tym łatwiej, im bardziej rozpowszechniona jest dwu- lub wielojęzyczność.

W przypadku języków blisko spokrewnionych i w dużym stopniu wciąż wzajemnie zrozumiałych dla swoich użytkowników pojawia się pytanie (w ogólnym przypadku nierozstrzygalne), czy naprawdę mamy już do czynienia z osobnymi jednostkami taksonomicznymi, czy z różnymi odmianami tego samego języka. Wobec nieistnienia efektywnej bariery komunikacyjnej lokalnie powstające innowacje szerzą się bez trudu w sieci dialektów (lub języków „w trakcie powstawania”) nie drogą przekazu z pokolenia na pokolenie, ale przez naśladowanie sąsiadów. Z tego względu klasyfikacja języków bardzo sobie bliskich i zróżnicowanych dialektalnie nie daje się wtłoczyć w prosty schemat drzewa rodowego.6

Języki odznaczają się wewnętrzną zmiennością, a w przypadku ich podziału na języki potomne współistniejące warianty mogą być dziedziczone przez linie potomne i zanikać lub utrwalać się w nich niezależnie, tworząc złudzenie wspólnych innowacji. Jest to zjawisko analogiczne do znanego z biologii niekompletnego sortowania linii rodowych. Każda cecha wariantywna może mieć własne drzewo rodowe tylko częściowo pokrywające się z drzewem rodowym języków.

Wybaczcie zatem językoznawcom historycznym, że nie zawsze potrafią udzielić jednoznacznej odpowiedzi na szczegółowe pytania dotyczące stosunków pokrewieństwa między językami danej rodziny. Gałęzie drzewa rodowego nie mają ostrych konturów. Czasem, zamiast rozdzielać się elegancko na osobne linie rodowe, tworzą pogmatwany krzak, w którym gałązki mogą się splatać i łączyć na powrót. Model drzewa i oparta na nim klasyfikacja stanowią uproszczoną, choć użyteczną idealizację skomplikowanej rzeczywistości. Na dobrą sprawę analiza kladystyczna (której wynikiem jest diagram w postaci drzewa) nie ma zastosowania do całości systemu języka, tylko do tej jego części, która ma homologiczne odpowiedniki w innych językach. Nie można zrozumieć w pełni ewolucji języka, jeśli skupiamy się tylko na elementach dziedziczonych od niepamiętnych czasów w postaci historycznego pakietu, traktując zapożyczenia i wpływy zewnętrzne jako kłopotliwą, ale w sumie mało istotną komplikację.

W kolejnym odcinku skupimy się na rekonstrukcji języka praindoeuropejskiego, zaczynając od jego systemu dźwiękowego. Innymi słowy, mowa będzie o tym, jak brzmiał język nigdy nie zapisany ani nie nagrany, a jednak dostępny dzięki śladom, jakie pozostawił w językach potomnych. Sam fakt, że możemy o tym dyskutować, jest znacznym osiągnięciem intelektualnym.

Przypisy

  1. Współcześnie dzielimy języki germańskie na grupę wschodnią (której jedynym udokumentowanym przedstawicielem jest wymarły język gocki) i północnozachodnią. Ta druga dzieli się na języki zachodniogermańskie i północnogermańskie (skandynawskie). ↩︎
  2. Oprócz języków irańskich i indoaryjskich należą do niej także języki nurystańskie – mała grupa reliktowych języków z rejonu Hindukuszu na pograniczu Afganistanu i Pakistanu. ↩︎
  3. Analogia ta abstrahuje od faktu, że języki anatolijskie i tocharskie wymarły, a stekowce i torbacze żyją nadal. ↩︎
  4. Słownictwo „podstawowe“ (o dużej częstości użycia, reprezentujące rozpowszechniony zespół znaczeń, bez których w ogóle trudno by się było porozumieć) jest z natury bardziej konserwatywne i odporniejsze na zastępowanie przez zapożyczenia. Odgrywa też szczególną rolę w stosowaniu metody porównawczej. ↩︎
  5. Moim zdaniem nie wynika to z rzeczywistego pokrewieństwa, tylko z długotrwałego sąsiedztwa tych języków w Europie Północnej, czego skutkiem była wtórna konwergencja. ↩︎
  6. Podobne problemy występują w biologii, czego skutkiem jest nieostra definicja pojęcia „gatunku“. ↩︎

Opisy ilustracji

Ilustracja w nagłówku. Jedno z drzew Schleichera, zamieszczone w jego książce z roku 1863, Die Darwinsche Theorie und die Sprachwissenschaft (Teoria Darwina a nauka o języku); wydawca: Hermann Böhlau, Weimar (domena publiczna).
Ryc. 1. August Schleicher (1821–1868), pionier filogenetyki językowej. Rycina z czeskiego tygodnika kulturalnego Světozar (22 stycznia 1869), towarzysząca artykułowi wspomnieniowemu o zmarłym miesiąc wcześniej językoznawcy. Źródło: Archiwum czasopism Instytutu Literatury Czeskiej (Czeska Akademia Nauk), domena publiczna.
Ryc. 2. Przykłady drzew filogenetycznych języków indoeuropejskich generowanych przy wykorzystaniu technik algorytmicznych. Zaadaptowane ze wstępu Thomasa Olandera do książki The Indo-European family: a phylogenetic perspective, red. Olander 2022, Cambridge University Press, ryc. 1.2, 1.3 (licencja CC-BY-NC-ND 4.0). Widać tu charakterystyczne problemy rekonstrukcji: niektóre zgrupowania gałęzi są stabilne (języki bałtosłowiańskie, indoirańskie i italoceltyckie), a języki anatolijskie i tocharskie konsekwentnie zajmują pozycję bazalną. Co do tego panuje zgoda. Poza tym jednak brak powtarzających się elementów wspólnych oprócz skądinąd wątpliwego pokrewieństwa grecko-ormiańskiego.
Ryc. 3. Najdłuższa ze znanych dotąd inskrypcji w języku trackim, zapisana alfabetem greckim na złotym pierścieniu z Ezerowa (Bułgaria), datowanym na V w. p.n.e. Podjęto wiele prób jej zinterpretowania, ale trudno je uznać za przekonujące. Być może niedawno odkryte graffiti trackie ze świątyni Apollina w Zone (północno-wschodnia Grecja, VI–IV w. p.n.e.) po odpowiednim opracowaniu rzucą wreszcie więcej światła na strukturę języka trackiego i jego miejsce w rodzinie indoeuropejskiej. Foto: Nikołaj Genow. Źródło: Bulgariana (fair use).

Rozmówki indoeuropejskie. Część 1: Zaproszenie

Pozostałe części cyklu
Część 2: Konary, gałęzie i gałązki drzewa rodowego
Część 3: Spółgłoski sprzed tysięcy lat
Część 4: Gra samogłosek i zadziwiający sukces pewnej hipotezy
Część 5: Rdzenie i słowa
Część 6: Ach, te końcówki!
Część 7: Paleontologia językowa

Od wieży Babel do odkrycia zaginionych kuzynów

Od niepamiętnych czasów zdawano sobie sprawę, że języki zmieniają się z upływem czasu i że niektóre z nich mogą pochodzić od wspólnego przodka. Czasem nawet można było całkiem konkretnie wskazać tego przodka. Na przykład udokumentowana historia języków romańskich sięgała czasów, kiedy uważano je za potoczne odmiany lokalne łaciny. Było zatem „na zdrowy rozum” mniej więcej oczywiste, że język łaciński był przodkiem całej grupy romańskiej (czyli języków takich jak włoski, francuski, hiszpański itd.). Podobnie starożytni i średniowieczni językoznawcy indyjscy wiedzieli, że używane w ich czasach języki indoaryjskie wywodziły się ze wspólnego źródła – języka staroindyjskiego, zachowanego w przekazywanej ustnie od pradawnych czasów literaturze wedyjskiej i sanskryckiej. Także Słowianie byli świadomi pokrewieństwa swoich języków ze względu na ich podobieństwo i wysoki poziom wzajemnej zrozumiałości, choć w tym przypadku wspólny przodek całej grupy nie był historycznie poświadczony.

Ta świadomość dotyczyła języków spokrewnionych na tyle blisko, że zbieżności gramatyczne i słownikowe między nimi rzucały się w oczy. Nie próbowano natomiast doszukiwać się pokrewieństwa między językami tak bardzo odległymi od siebie w czasie lub przestrzeni jak np. starożytna greka, język walijski, litewski czy perski. Nie istniała metodologia, dzięki której w ogóle dałoby się wykazać takie pokrewieństwo, choćby je nawet podejrzewano. Aż do XVII w. wielu europejskich intelektualistów zadowalało się całkiem dosłowną interpretacją biblijnego mitu o wieży Babel. Dominował pogląd, że przed opisanym w Księdze Rodzaju „pomieszaniem języków” cała ludzkość od czasów Adama i Ewy mówiła po hebrajsku; a na czym polegało „pomieszanie”, nikt się głębiej nie zastanawiał.1

Ryc. 1.

W XVIII w. Europa wyjrzała poza swój zaścianek. Zaczęto się poważnie interesować językami kilku kontynentów i zdano sobie sprawę z ich różnorodności. A kiedy już wiedziano, jak bardzo języki świata potrafią być niepodobne do dobrze znanych języków europejskich, kilku szczególnie bystrych badaczy uderzył fakt, że niektóre z nich nie są mimo wszystko aż tak egzotyczne, jak można by się było spodziewać. W roku 1786 sir William Jones, brytyjski prawnik i filolog, który służył jako sędzia w Kolkacie (Kalkucie) i wykorzystał tę okazję, aby studiować literaturę wedyjską i zdobyć kwalifikacje sanskrytologa, wysunął hipotezę, że sanskryt (klasyczny język Indii), podobnie jak kilka innych języków orientalnych, jest historycznie spokrewniony z greką, łaciną i wieloma innymi językami Europy. Wskazywały na to podobieństwa słownictwa i struktury gramatycznej trudne do wyjaśnienia w inny sposób.

Początki naukowej rekonstrukcji

Tak narodziła się koncepcja indoeuropejskiej rodziny językowej, rozwijana następnie przez cały XIX w. Jej postępy były możliwe dzięki systematycznemu stosowaniu metody porównawczej, zapoczątkowanej przez takich uczonych jak Rasmus Rask, Jacob Grimm czy Hermann Grassmann. Dzięki temu ocena pokrewieństwa przestała się opierać na mglistej intuicji, a zaczęła polegać na identyfikowaniu regularnych odpowiedniości między badanymi językami. Odpowiedniości takie świadczą o różnicowaniu się języków pokrewnych wskutek zachodzenia i kumulowania się zmian językowych, które można formalnie zdefiniować i ustalić ich względną chronologię (kolejność zachodzenia). A odwracając proces analityczny, można się pokusić o próbę „cofnięcia się w czasie”, czyli rekonstrukcji wspólnego przodka (w tym przypadku języka praindoeuropejskiego) na podstawie porównania jego potomków.

Pierwszą taką próbę podjął w 1861 r. August Schleicher, zainspirowany lekturą dopiero co opublikowanego dzieła Darwina O pochodzeniu gatunków. Pod wpływem Darwina Schleicher przyjął, że historię rodzin językowych można przedstawić w postaci filogenezy – drzewa rodowego, wyprowadzającego wszystkich przedstawicieli rodziny od ostatniego wspólnego przodka. A to oznacza, że każde rozgałęzienie drzewa oznacza istnienie w przeszłości jakiegoś prajęzyka pośredniego między przodkiem całej rodziny a językami współczesnymi. Na przykład języki germańskie nie wywodzą się bezpośrednio z języka praindoeuropejskiego, ale miały późniejszego wspólnego przodka – język pragermański, odpowiadający w strukturze drzewa rodowego miejscu, w którym rozeszły się ich drogi.

Metoda porównawcza, opierająca się na założeniu, że zmiany fonetyczne są w dużym stopniu regularne, osiągnęła wysoki poziom wyrafinowania w ostatniej ćwierci XIX w. Zidentyfikowano już wówczas wszystkie języki współczesne należące do rodziny indoeuropejskiej, a także ustalono, które języki do niej nie należą. Im więcej regularnych odpowiedniości udało się ustalić, tym łatwiej było odkrywać kolejne. Powstała wtedy spójna rekonstrukcja praindoeuropejskiego systemu językowego, która przez kilkadziesiąt lat była uważana za kanoniczną.2

Językoznawcom indoeuropejskim pomagał fakt, że wiele języków należących do badanej przez nich rodziny ma historię znakomicie udokumentowaną przez „skamieniałości” w postaci dawnych tekstów. Teksty te liczyły sobie setki, a w niektórych przypadkach ponad dwa tysiące, a nawet około trzech tysięcy lat. To rzadki luksus, bo większość spośród setek zidentyfikowanych dotąd rodzin językowych ma albo bardzo młode tradycje literackie, albo znana jest wyłącznie z dokumentacji współczesnej. Oczywiście to, co zachowało się w postaci zabytków, nie musi być rekonstruowane. Jednak ostatni wspólny przodek rodziny, zwany umownie językiem indoeuropejskim, był używany przed wynalezieniem pisma i możemy do niego dotrzeć tylko w jeden sposób: odtwarzając zmiany, jakie doprowadziły do powstania języków udokumentowanych, i podążając tą drogą wstecz, do wspólnego źródła. Według podobnego schematu postępują także inne nauki odtwarzające przeszłość, na przykład kosmologia albo biologia ewolucyjna.

Teorie i hipotezy

Każdy proces rekonstrukcji obciążony jest ograniczeniami metodologicznymi i nieuniknioną niepewnością. Dlatego rekonstruowany prajęzyk – niezależnie od tego, że jego istnienie jest właściwie matematyczną koniecznością – jest modelem teoretycznym, a nie zjawiskiem dającym się bezpośrednio obserwować. Wszystko, co o nim wiemy, to wnioski wynikające z rozumowania na podstawie dostępnych danych. Rekonstrukcja nie jest faktem, ale hipotezą roboczą, którą w przyszłości możemy zmodyfikować lub odrzucić, jeśli zmuszą nas do tego nowe dane lub nowe analizy. Tak zresztą bywało w przeszłości. Zaawansowane rekonstrukcje indoeuropejskie z lat siedemdziesiątych XIX w. różniły się istotnie od prób Schleichera, wcześniejszych o kilkanaście lat, a w XX w. same zostały zastąpione przez nowsze koncepcje wynikające z postępu badań. Nie powinno to nikogo dziwić, bo obraz świata prezentowany przez fizyków, chemików czy biologów również zmieniał się radykalnie w tym samym czasie. Tak po prostu działa nauka.

Jak zobaczymy, rekonstrukcja porównawcza pozwala nam odtworzyć tylko część systemu języka – głównie słownictwo, a wraz z nim fonetykę i morfologię (reguły słowotwórcze i schematy odmiany). Co jednak istotne, możemy prześledzić zmiany struktury i znaczenia słów krok po kroku od najdawniejszego wspólnego źródła przez pośrednie „prajęzyki” aż do czasów historycznych i współczesności (biorąc pod uwagę także przypadki „transferu poziomego”, czyli zapożyczania słownictwa z jednego języka do drugiego). Dzięki temu etymologia – dział językoznawstwa zajmujący się pochodzeniem słów i badaniem ich rozwoju – ma solidne podstawy formalne i nie opiera się (jak to bywało w przeszłości) na grze skojarzeń inspirowanej podobieństwem brzmienia.

Uwaga na nieporozumienia

Nazwa „języki indoeuropejskie” (wprowadzona w 1813 r. przez Thomasa Younga, fizyka i językoznawcę3) może wprowadzać w błąd, podobnie jak termin alternatywny „języki indogermańskie”, preferowany w niemieckiej tradycji językoznawczej. Laik może odnieść błędnie wrażenie, że istnieje rodzina, na którą składają się języki Europy i Indii. Tak oczywiście nie jest, bo część języków „europejskich” w sensie geograficznym nie jest indoeuropejska w sensie genealogicznym (np. język baskijski, fiński czy tatarski należą do różnych innych rodzin językowych). Także wiele języków subkontynentu indyjskiego zalicza się do innych rodzin (np. drawidyjskiej lub austroazjatyckiej). Z kolei należące do rodziny indoeuropejskiej języki irańskie występują od Turcji po zachodnie krańce Chin, a język ormiański – na Wyżynie Armeńskiej, czyli po azjatyckiej stronie Kaukazu. Nazwa rodziny miała oznaczać tylko tyle, że jej historyczny zasięg obejmował obszar od Europy po Indie (nie wykluczając istnienia na tym obszarze wielu innych języków).

Kiedy powstawała „klasyczna” rekonstrukcja wspólnego przodka języków indoeuropejskich, czyli pod koniec XIX w., wiadomo już było, że całą rodzinę można podzielić na mniejsze grupy, z których każda także miała własnego wspólnego przodka. Były to języki indyjskie, irańskie, germańskie, słowiańskie, bałtyjskie, celtyckie, italskie (współcześnie reprezentowane przez języki romańskie) oraz kilka języków niedających się zaliczyć do żadnej z tych większych grup: grecki, albański i ormiański. Termin „rodzina indoeuropejska” oznaczał ostatniego wspólnego przodka wszystkich wymienionych języków (czyli hipotetyczny język praindoeuropejski) oraz wszystkie języki, które się z niego wywodzą w drodze rozwoju historycznego. Według terminologii zapożyczonej od biologów, ale używanej też w językoznawstwie, rodzina indoueropejska była poprawnie zdefiniowanym kladem.

Wiek XX przyniósł jednak nowe odkrycia. W roku 1915 okazało się, że odkryte kilka lat wcześniej w Anatolii teksty klinowe z II tysiąclecia p.n.e. (oraz dwa listy dyplomatyczne z egipskiego archiwum królewskiego w Amarnie) zapisano w języku wykazującym niewątpliwe cechy indoeuropejskie. Był to język hetycki – pierwszy z kilku znanych obecnie języków wymarłej grupy anatolijskiej. Mniej więcej w tym samym czasie zidentyfikowano kolejną wymarłą grupę: dwa języki tocharskie, używane w Kotlinie Kaszgarskiej (zachodnie Chiny) od V do X w. n.e. Drzewo rodowe języków indoeuropejskich powiększyło się o całe dwie gałęzie, co wymagało ponownego przyjrzenia się rekonstrukcji prajęzyka w świetle nowych danych.

Ryc. 2.

I tu pojawia się kolejny problem terminologiczny. Stosunki pokrewieństwa języków anatolijskich i tocharskich oraz wcześniej zidentyfikowanych grup indoeuropejskich nie były z początku jasne, dziś jednak uważa się powszechnie, że grupa anatolijska jest siostrzana względem całej reszty rodziny, czyli że pierwszy podział u podstawy drzewa rodowego dał początek dwóm językom, Jeden był wspólnym przodkiem języków anatolijskich, a drugi – wspólnym przodkiem wszystkich pozostałych grup. Stanowisko języków tocharskich jest bardziej dyskusyjne, ale przeważa pogląd, że ich przodek oddzielił się w następnej kolejności od reszty rodziny (czyli od przodka wszystkich grup znanych w XIX w).

Zatem prajęzyk rekonstruowany około roku 1890, bez uwzględnienia materiału odkrytego w XX w., nie był przodkiem języków anatolijskich ani tocharskich. W zasadzie powinniśmy wymyślić jakieś nowe nazwy dla powiększonej rodziny i jej przodka, rezerwując przymiotnik „indoeuropejski” dla „kladu koronnego” czyli najmniejszego kladu, który zawiera wszystkie języki współczesne. Jednak nazwy w rodzaju „rodzina indohetycka” lub „indoanatolijska” nie przyjęły się szeroko. Zamiast tego rozszerzono znaczenie nazwy „rodzina indoeuropejska”, obejmując nią także nowo odkryte grupy. Oznacza to jednak, że język praindoeuropejski w rozumieniu badaczy z końca XIX w. nie był tym samym językiem, który rekonstruujemy obecnie pod tą nazwą.

Kilka rzeczy, o których warto pamiętać

Rekonstrukcja jest tylko wygenerowanym naukowo cieniem rzeczywistego języka, który był faktycznym przodkiem rodziny. Wiemy o tym języku całkiem sporo, ale na podstawie samych danych językowych nie można by go było nawet zlokalizować w czasie i przestrzeni. Znamy jednak rozmieszczenie geograficzne poszczególnych grup języków indoeuropejskich w czasach historycznych.4 Łącząc tę wiedzę z danymi archeologicznymi, a także genetycznymi (dostarczającymi informacji o prehistorycznych migracjach), można podejmować próby zidentyfikowania obszaru, na którym mówiono po praindoeuropejsku. Interpretacja tak różnorodnych danych nie jest oczywista ani łatwa. Dominuje pogląd, że źródłem ekspansji języków indoeuropejskich był Step Pontyjski rozciągający się na północ od Morza Czarnego, Kaukazu i Morza Kaspijskiego i że praindoeuropejska wspólnota językowa istniała mniej więcej 7–6 tys. lat temu, w okresie chalkolitu (epoki miedzi).5

Zanim przyjrzymy się bliżej językowi praindoeuropejskiemu, warto poczynić kilka zastrzeżeń. Wiemy już z grubsza, czym ten prajęzyk jest. A czym nie jest? Po pierwsze – nie jest niczym nadzwyczajnym. Język polski (wraz z całą grupą słowiańską) należy do rodziny indoeuropejskiej, więc praindoeuropejski interesuje nas jako część naszej własnej prehistorii językowej. Stanowi część odpowiedzi na pytanie „skąd przybywamy”. Ale każda rodzina językowa jest sprowadzalna do własnego wspólnego przodka, a rodzin takich są na Ziemi dosłownie setki.6 Z przyczyn kulturowych badacze języków indoeuropejskich byli w bardzo korzystnej sytuacji, ułatwiającej rekonstrukcję porównawczą. Dlatego rekonstrukcja ta jest bardzo rozbudowana i precyzyjna, co w przypadku wielu innych rodzin nie jest możliwe. Nie oznacza to, że język praindoeuropejski był jakoś szczególnie wyrafinowany w porównaniu z innymi prajęzykami. Po prostu wiemy o nim szczególnie dużo.

Po drugie – praindoeuropejski był używany kilka tysięcy lat temu, a chronologia języka jako ludzkiego systemu porozumiewania się mierzona jest setkami tysięcy lat. Języki używane w czasach, gdy istniała wspólnota praindoeuropejska, nie były ani „prymitywne”, ani „doskonałe”. W ewolucji języka nie ma konsekwentnego dążenia do większej ani mniejszej komplikacji. Języki neolitycznej czy chalkolitycznej Europy były systemami tego samego typu co dzisiejsze. To, co wyłania się z rekonstrukcji, jest językiem mającym – jak każdy – pewne cechy rzadkie lub nawet unikatowe, ale co do zasady równie „zwykłym” jak języki współczesne. Nie używali go jaskiniowcy odziani w skóry, tylko rolnicy i pasterze, którzy potrafili liczyć co najmniej do stu, wytwarzali ceramikę, opanowali podstawy metalurgii miedzi i dość wcześnie w swojej historii nauczyli się budować wozy na kołach.

Po trzecie – język praindoeuropejski nie zmaterializował się cudem z niczego. Musiał mieć swoją jeszcze głębszą pre-prehistorię (równie starą jak inne języki), tyle tylko, że rekonstrukcja ma ograniczenia wynikające z materiału, jakim dysponujemy. Moglibyśmy się bardziej cofnąć w czasie, gdybyśmy znali jakieś inne języki pokrewne poza tymi, które już zidentyfikowano. Niestety odziedziczone cechy słownictwa i struktury morfologicznej języka z biegiem czasu stają się coraz trudniej rozpoznawalne (ulegają „erozji“). Jest możliwe, a nawet wysoce prawdopodobne, że niektóre inne rodziny językowe naszej części świata są jakoś spokrewnione z indoeuropejską. Ale jeśli ich wspólny przodek istniał kilkanaście lub kilkadziesiąt tysięcy lat temu, jego rekonstrukcja może wykraczać poza możliwości metody porównawczej, a nie znamy innej wiarygodnej procedury ustalania pokrewieństwa. O rekonstrukcji języków używanych w jeszcze dawniejszych czasach nie możemy na razie marzyć.

W następnym odcinku obejrzymy sobie bardziej szczegółowo drzewo rodowe języków indoeuropejskich, o którym na razie wiemy tyle, że zawiera około tuzina gałęzi. Jak się przekonamy, niektóre z tych gałęzi są bliżej spokrewnione z sobą nawzajem niż z innymi gałęźmi. Jest to zatem faktycznie drzewo rodowe dzielące się stopniowo na linie potomne, a nie wiązka linii rozbiegających się z jednego punktu i od tej chwili ewoluujących samodzielnie. Zobaczymy też, że (tak jak w biologii) model drzewa rodowego nie uwzględnia wielu zjawisk bardzo istotnych dla rozwoju języków, nie należy go zatem traktować jako pełnego obrazu ich historii.

Przypisy

  1. Istniały także „teorie“ jeszcze bardziej ekscentryczne. W XVI w. niderlandzki uczony Jan Gerartsen zwany Becanusem przedstawił i uzasadnił hipotezę, że pierwotnym językiem ludzkości był dialekt brabancki używany w okolicach Antwerpii. Becanus zaproponował nawet brabanckie etymologie imion Adama i Ewy. ↩︎
  2. Najpełniejszą, wręcz pomnikową prezentacją tego systemu było kilkutomowe dzieło Karla Brugmanna i Bertholda Delbrücka Grundriß der vergleichenden Grammatik der indogermanischen Sprachen (Zarys gramatyki porównawczej języków indogermańskich [indoeuropejskich]), którego dwa wydania ukazały się w latach 1886–1916. ↩︎
  3. Ze względu na rozległość swoich zainteresowań (od falowej teorii światła i modułu Younga po wkład w odczytanie pisma egipskiego) Thomas Young jest jedną z postaci określanych przez biografów jako „ostatni człowiek, który wiedział wszystko“. ↩︎
  4. Oczywiście dzisiejszy zasięg języków indoeuropejskich ukształtował się wskutek niedawnych podbojów, kolonizacji i asymilacji językowej, z których nic nie wynika, jeśli chodzi o rekonstrukcję zasięgu prehistorycznego. ↩︎
  5. Główną hipotezą konkurencyjną jest koncepcja anatolijska, uważająca Azję Mniejszą za praojczyznę języków indoeuropejskich i łącząca ich ekspansję z szerzeniem się rolnictwa neolitycznego. Zakłada ona znacznie głębszą chronologię (ok. 9 tys. lat); spopularyzował ją archeolog brytyjski Colin Renfrew, jednak językoznawcy uważają ją na ogół za kontrowersyjną. Rozwiązaniem kompromisowym (geograficznie i chronologicznie) między hipotezą stepową a anatolijską jest model ekspansji zaproponowany ostatnio w artykule Heggarty et al. 2023, lokujący praojczyznę indoeuropejską na południe od Kaukazu (choć nie w samej Anatolii) ok. 8 tys. lat temu (schyłek neolitu). Umiejscowienie źródła ekspansji indoeuropejskiej z pewnością jeszcze przez długi czas pozostanie kwestią sporną. ↩︎
  6. Mniej więcej równolegle z rodziną indoeuropejską odkryto inne przykłady rodzin językowych: języki semickie (obecnie traktowane jako jedna z gałęzi większej rodziny afroazjatyckiej) i języki ugrofińskie (obecnie stanowiące część większej rodziny uralskiej). W 1770 r. János Sajnovics wykazał pokrewieństwo języków węgierskiego i sámi (lapońskiego), a w 1799 r. Sámuel Gyarmathi dodał do tej liczby języki fiński, estoński i kilka kolejnych. ↩︎

Ilustracje

Ilustracja w nagłówku. W 1868 r. August Schleicher napisał w zrekonstruowanym języku praindoeuropejskim kilkuzdaniowe opowiadanie „Owca i konie“. Od tej pory powstało wiele wersji tego tekstu, ilustrujących zmiany, jakie zachodziły w rekonstrukcji. Pokazana tutaj wersja współczesna (bardzo różna od oryginalnej próby Schleichera) jest autorstwa Andrew M. Byrda, indoeuropeisty z Uniwersytetu Kentucky. Oczywiście takie rekonstrukcje należy traktować z lekkim przymrużeniem oka. Książka służąca za tło to Lexikon der indogermanischen Verben (LIV, czyli Leksykon czasowników indoeuropejskich) pod redakcją Helmuta Rixa, Martina Kümmela et al. (wyd. II, 2001).
Ryc. 1. Wieża Babel Pietera Bruegla Starszego (1563). Źródło: Wikipedia (domena publiczna).
Ryc. 2. Ruiny starożytnego miasta Hattusas (Boğazkale, Turcja), podbitego przez Hetytów ok. 1700 r. p.n.e., a w różnych okresach II tysiąclecia p.n.e. funkcjonującego jako stolica ich państwa. Na przełomie XIX i XX w., a zwłaszcza poczynając od roku 1906, archeolodzy odkryli tam tysiące tabliczek z tekstami hetyckimi, co umożliwiło odczytanie tego języka, a następnie innych języków anatolijskich. Foto: Carole Raddato 2016. Źródło: Wikipedia (licencja CC BY-SA 2.0).