Najłatwiejsze dźwięki świata (3): RRRrrr, czyli ukryta różnorodność warkotów

Pozostałe wpisy z tej serii

Najłatwiejsze dźwięki świata (1): podstawy teoretyczne
Najłatwiejsze dźwięki świata (2): dziury w systemie

Spółgłoski, które nigdzie nie pasują

Spójrzmy sobie na klasyfikację spółgłosek, stosując metodę stopniowej eliminacji. Spółgłoskami „najbardziej spółgłoskowymi”, czyli maksymalnie różniącymi się akustycznie od samogłosek, są tak zwane obstruenty (od łacińskiego obstruō ‘blokuję, staję na przeszkodzie’). Nazwa wzięła się stąd, że przy ich wymawianiu następuje silne zbliżenie narządów mowy. Powietrze nie może wypływać swobodnie. Jego strumień albo zostaje całkowicie zablokowany, albo musi się przeciskać przez wąską szczelinę ze słyszalnym szumem, szelestem lub sykiem wskutek powstających przy tym turbulencji. W ten sposób powstają ustne spółgłoski zwarte (takie jak [t]), szczelinowe (takie jak [s]) i zwartoszczelinowe (takie jak [ts], czyli polskie c). Punkt, w którym przepływ powietrza zostaje zablokowany lub maksymalnie utrudniony, nazywamy miejscem artykulacji. Obstruentom towarzyszą często różne rodzaje fonacji (czyli aktywności głośni i fałdów głosowych) i inne „efekty specjalne”, mogą one zatem być, bezdźwięczne, dźwięczne, przydechowe, dyszące, zgrzytliwe itd., a czasem sam mechanizm wytwarzania strumienia powietrza ulega modyfikacjom (jak w przypadku spółgłosek iniektywnych, ejektywnych i mlasków). Kontrast bezdźwięczna : dźwięczna (jak w przypadku [t], [s], [ts] : [d], [z], [dz]) jest szczególnie „łatwy” z punktu widzenia wysiłku artykulacyjnego i szczególnie rozpowszechniny w językach świata.

Skoro już wiemy, czym są obstruenty, odłóżmy je na bok i skupmy się na pozostałych spółgłoskach. Nazywamy je zbiorowo spółgłoskami sonornymi (z łacińskiego sonōrus ‘dźwięczny, głośny, donośny’). Przypominają one samogłoski pod tym względem, że choć przepływ powietrza przy ich artykulacji nie jest całkiem swobodny, to przynajmniej zachodzi bez turbulencji. Jednak ich energia akustyczna jest niższa niż samogłosek (są po prostu z natury cichsze), a aktywność narządów mowy zmienia ich charakterystykę rezonansową (rozkład amplitudy składowych dźwięku w zależności od częstotliwości, czyli widmo akustyczne) na tyle, że bez trudu odróżniamy je od samogłosek po „barwie” – oczywiście słuchowej, nie wizualnej. Spółgłoski sonorne najczęściej występują jako głoski dźwięczne, choć spotykamy też ich warianty ubezdźwięcznione (a także dyszące, zgrzytliwe i inne). Te warianty są jednak na tyle rzadkie i nietypowe (językoznawca powiedziałby „nacechowane”), że dźwięczność można uznać za stan domyślny tej klasy dźwięków mowy. Spółgłoski sonorne wraz z samogłoskami (czyli wszystkie dźwięki mowy niebędące obstruentami) nazywa się zbiorowo sonorantami (lub rezonantami).

Ale mieliśmy eliminować, więc eliminujmy. Spośród sonorantów odłóżmy na bok samogłoski i półsamogłoski (czyli dźwięki takie jak [j], [w]), czyli głoski artykulacyjnie otwarte, zostawiające powietrzu pełną swobodę przepływu. Co nam zostało? Na przykład spółgłoski nosowe zwarte (o których była mowa w poprzednim wpisie). Wymawiając je, blokujemy przepływ powietrza przez usta, ale otwieramy mu drogę ucieczki przez nos. Znamy je już jako dobrze zdefiniowaną klasę, więc odkładamy je na bok. Czy zostało coś jeszcze? Tak, spółgłoski sonorne boczne, które powstają, gdy blokujemy przepływ powietrza wzdłuż osi ustnego szlaku artykulacyjnego, ale zostawiamy drogę ucieczki po bokach języka. O spółgłoskach bocznych była już mowa kilkakrotnie (np. tutaj i tutaj). Ich reprezentantką w języku polskim jest [l]. A zatem odkładamy na bok także spółgłoski boczne i sprawdzamy, czy jeszcze coś grzechoce w pudle ze spółgłoskami. I rzeczywiście – coś grzechoce, a nawet powarkuje.

Jak to często bywa w różnych klasyfikacjach, kiedy wyrzucimy wszystko, co da się scharakteryzować pozytywnie jako klasy bytów posiadających pewne wspólne cechy, pozostaje luźna zbieranina, dla której trudno taką cechę podać. Pozostałych spółgłosek nie łączy właściwie nic poza tym, że nie są obstruentami (tzn. nie utrudniają ucieczki powietrza), nie są samogłoskami ani odpowiadającymi im półsamogłoskami, nie są nosowe ani boczne. Artykułowane są (podobnie jak samogłoski) w taki sposób, że powietrze może sobie płynąć środkiem jamy ustnej. A jeśli następuje w nim jakaś przerwa, to jest ona tak krótka, że „nie liczy się” jako utrudnienie przepływu, choć powoduje zauważalny efekt akustyczny (czym przypomina fluktuacje kwantowe w fizyce). Są to spółgłoski rotyczne, czyli „typu R”.

Porażka fonetyków i szansa dla ewolucji

Jeden z klasycznych podręczników fonetyki ogólnej (Ladefoged–Maddieson 1996: 215) stwierdza, że tym, co łączy te dźwięki, jest fakt, iż wiele języków używa do ich zapisu łacińskiej litery R, r lub greckiej Ρ, ρ (rhō), a międzynarodowy alfabet fonetyczny (IPA) przeważnie oznacza je za pomocą znaku r, ewentualnie innych znaków stanowiących przekształcenie graficzne liter R lub r – np. ɾ, ɹ, ɽ, ɻ, ʀ, ʁ. Jest to otwarte przyznanie się do niemożności zdefiniowania spółgłosek rotycznych jako naturalnej klasy dźwięków w kategoriach czysto fonetycznych. Nie są one wyraźnie scharakteryzowane względem innych spółgłosek poza tym, że odczuwamy je jako pozostające poza podziałem na „porządne” klasy.

Dzięki temu głoski rotyczne mają pewien ciekawy potencjał ewolucyjny. Jeśli jakiś język ma fonem typu R, czyli taki, który nie jest ani zwarty, ani szczelinowy, ani nosowy, ani boczny, ani samogłoskowy, to właściwie nie ma wielkiego znaczenia, której z potencjalnych realizacji fonetycznych użyjemy, o ile nie posiada ona żadnej z tych cech. Fonologiczne bazy danych informują nas, że fonem /r/ występuje w świecie często, ale niekoniecznie informują nas, jaka dokładnie jest jego typowa wymowa w danym języku. Mamy tu do czynienie z ukrytą wariantywnością, czyli różnorodnością fonetyczną maskowaną przez fakt, że językoznawcy dla wygody chętnie identyfikują fonem rotyczny za pomocą jakiegoś prostego symbolu, najczęściej /r/. Rzeczywista wymowa może bardzo odbiegać od „prototypu”. W systemie IPA symbol r zdefiniowany jest jako przedniojęzykowa spółgłoska wibrująca (ang. trill), ale fonem oznaczany /r/ wcale nie musi być wymawiany jako [r].

Na przykład słowniki wymowy języka angielskiego zwykle transkrybują początkową spółgłoskę słowa red jako /r/, choć wymowa wibrująca spotykana jest tylko w niektórych dialektach (głównie w konserwatywnej odmianie szkockiego angielskiego, a i to niezbyt często), a jedna z najbardziej typowych realizacji angielskiego /r/ (zwłaszcza w wymowie północnoamerykańskiej), tzw. bunched R, nie jest nawet przedniojęzykowa.1 Typowe brytyjskie /r/ realizowane jest jako [ɹ], spółgłoska zbliżeniowa zadziąsłowa, odpowiadająca co do miejsca artykulacji polskiemu ż (IPA [ʐ]), tyle że bardziej otwarta (sonorna), a zatem wymawiana nieszczelinowo.2 Jednak w Londynie i wokół niego /r/ jest często realizowane jako spółgłoska zbliżeniowa [ʋ] wargowo-zębowa (otwarty odpowiednik szczelinowego [v]). Ogółem w rozmaitych odmianach języka angielskiego można się doliczyć co najmniej ośmiu różnych typów wymowy /r/, traktowanych jako dialektalne realizacje tego samego fonemu (nie licząc allofonów, czyli modyfikacji wymowy w szczególnych kontekstach fonetycznych). Wiele wskazuje na to, że porównywalna różnorodność istniała już w języku staroangielskim (Gąsiorowski 2006).

Ryc. 1.

Ponieważ dźwięki typu R nie mają wspólnej cechy rozpoznawczej, dzieci uczące się języka nie zawsze wyczuwają, w jaką konkretną realizację powinny „celować” artykulacyjnie, i w ich wymowie może się utrwalić któraś z realizacji odbiegających od ideału. Dopóki są to przypadki sporadyczne, normatywiści traktują je jako idiosynkrazje lub „wady wymowy”, ale po przekroczeniu pewnego progu statystycznego mogą one dać początek nowej tendencji (jak wspomniany wyżej wariant londyński). Z punktu widzenia ewolucji języka głoski rotyczne, ze względu na swoją fundamentalną nieokreśloność, łatwo mutują na wiele różnych sposobów. Można powiedzieć, że wariantywność fonetyczna jest ich cechą naturalną. Angielski nie jest tu bynajmniej wyjątkiem. Niemieckie czy francuskie /r/ także ma wymowę bardzo zmienną (i rzadko jest realizowane jako [r] w rozumieniu IPA).

Warczenie klasyczne

Wspomniałem, że za „prototypową” realizację głosek oznaczanych fonemicznie jako [r] uznaje się wymowę przedniojęzykową wibrującą. Co to oznacza? Czubek języka, rozluźniony, zbliża się do górnego dziąsła. Przepływ powietrza między językiem a sklepieniem jamy ustnej powoduje (zgodnie z zasadą Bernoulliego) spadek ciśnienia, którego skutkiem jest przyciągnięcie czubka języka do dziąsła. Wówczas jednak ciśnienie znowu wzrasta, toteż zetknąwszy się z dziąsłem na ok. 25 ms, czubek języka znów się od niego oddala. Ciśnienie dzięki temu spada i cały cykl może się powtórzyć kilkakrotnie (notabene na tej samej zasadzie generowane są drgania fałdów głosowych przy wymowie głosek dźwięcznych). Ja sam po nabraniu bardzo głębokiego wdechu i przy solidnym wysiłku przepony jestem w stanie przeciągnąć artykulację [r] przez 15 s, co oznacza mniej więcej 300 cykli wibracji, ale oczywiście [r] jako dźwięk mowy realizowane jest znacznie krócej. Przeważnie (o ile nie mówimy wolno i dobitnie) czubek języka uderza o dziąsło 2–3 razy (co zajmuje 0,1–0,15 s), ale też często się zdarza, że to, co w intencji mówiącego miało być wibracją, zostaje zredukowane do jednego „stuknięcia”. Mamy wówczas do czynienia z tzw. spółgłoską uderzeniową (ang. flap lub tap). IPA używa na jej oznaczenie symbolu ɾ.

W niektórych językach (np. w baskijskim, hiszpańskim, albańskim i ormiańskim) wibrujące /r/ i uderzeniowe /ɾ/ kontrastują z sobą przynajmniej w niektórych pozycjach, są więc traktowane jako różne fonemy. W walijskim z kolei dźwięczne /r/ (wymawiane jako [r], [ɾ] lub [ɹ]) kontrastuje z bezdźwięcznym /r̥/ (zapisywanym w ortografii walijskiej jako rh). Wreszcie w kilku językach słowiańskich (m.in. w rosyjskim) zwykłe /r/ kontrastuje z „miękkim” (palatalizowanym) /rʲ/.

Wibracje alternatywne

Wibrować może nie tylko czubek języka. Jeśli chcemy wyrazić, że jest nam zimno, albo że odczuwamy zgrozę, wydajemy z siebie dźwięk brrr. Możemy to zrobić w szczególny sposób, wprawiając w wibracje nie czubek języka, ale wargi. Powstaje w ten sposób spółgłoska wibrująca dwuwargowa [ʙ]. Istnieje na Ziemi zaledwie kilka języków, które wykorzystują ją jako dźwięk mowy – fonem lub regularnie używany allofon. O wiele częściej spotykamy spółgłoskę wibrującą języczkową [ʀ]. Języczek jest to umięśniony wyrostek na brzegu podniebienia miękkiego, służący głównie jako zawór odcinający lub otwierający przepływ powietrza szlakiem nosowym. Może on stykać się z tylną częścią języka, biorąc bierny udział w artykulacji spółgłosek języczkowych – zwartych, szczelinowych lub nosowych – występujących w wielu językach; narządem aktywnym jest wówczas język. Jednak dzięki zasadzie Bernoulliego języczek może także odegrać rolę aktywną, wibrując i uderzając o tył języka.

W języku polskim dominuje wymowa /r/ jako [r] (kilka uderzeń czubka języka o dziąsło) lub [ɾ] (jedno uderzenie). W gruncie rzeczy chodzi jednak o to, żeby wymówić spółgłoskę dostatecznie różniącą się akustycznie od /l/, /j/, /w/, /ʐ/. Wibracja nie jest niezbędnym składnikiem /r/, tylko jednym ze sposobów na nadanie tej spółgłosce wyrazistości fonetycznej. Jeśli język zbliży się do dziąsła, ale mówiącemu nie uda się go wprawić w drgania, skutkiem może być głoska podobna do brytyjskiego zbliżeniowego [ɹ]. Jeśli ktoś używa takiej niekompletnej artykulacji sporadycznie, słuchacz nawet nie zauważy różnicy, bo miejsce artykulacji nie ulega zmianie. Brakuje tylko słyszalnego efektu stuknięcia języka o dziąsło (trwającego czterdziestą część sekundy). Czasem trudności z wymową /r/ mogą mieć podłoże fizjologiczne (np. lekki niedowład przedniej części języka lub krótkie wędzidełko) i wówczas ktoś, kto nie daje rady wymówić [r], używa [ɹ] jako substytutu łatwiejszego w realizacji. Gdy robi to stale, różnica oczywiście staje się zauważalna, choć nie powoduje problemów komunikacyjnych, bo takie /r/ jest nadal dostatecznie odróżnialne od innych fonemów.

A co się stanie, jeśli dziecko uczące się polskiego słyszy wibracje towarzyszące /r/ i próbuje je naśladować, ale nie wie, jak osiągnąć właściwy efekt, toteż eksperymentuje na chybił-trafił? Najczęściej w końcu wpada na właściwy pomysł, ale może też pójść inną drogą, na przykład odkrywając, że wibracje można realizować za pomocą języczka. Zdradzę tu sekret osobisty: moje własne /r/, kiedy mówię po polsku swobodnie, nie kontrolując się świadomie, realizowane jest jako wibrujące [ʀ] (często zredukowane do pojedynczego uderzenia). Takie [ʀ] utrwaliło mi się we wczesnym dzieciństwie. Zapewne byłem wtedy zadowolony, że udało mi się osiągnąć „dorosły” efekt wibracji, i nie zdawałem sobie sprawy, że moje /r/ brzmi nieco odmiennie od „głównego nurtu” wymowy.

Kiedy po latach zainteresowałem się fonetyką, nauczyłem się wymawiać wszelkie możliwe spółgłoski rotyczne, ale nie zmieniłem utrwalonego zwyczaju i nie „poprawiłem” swojego [ʀ] na [r]. Mogę to zrobić bez trudu w mowie kontrolowanej (np. deklamując lub śpiewając), ale ponieważ języczkowe [ʀ] spełnia swoją funkcję równie skutecznie, nigdy nie odczuwałem potrzeby wyrzeczenia się tej fonetycznej cechy szczególnej. O ile jest to faktycznie [ʀ] wibrująco-uderzeniowe, odmienność akustyczna od [r] nie jest wielka i nie przeszkadza w porozumiewaniu się, co sprawia, że jest to wymowa co prawda nienormatywna, ale w dużym stopniu społecznie akceptowana. Używa jej wielu Polaków, w tym osób publicznych (dobrze znanym przykładem jest Donald Tusk).

Wiele osób sądzi, że takie [ʀ] jest „niemieckie” lub „francuskie”. Nie jest to zgodne z prawdą, bo choć w obu językach dominuje /r/ języczkowe, jest to z reguły spółgłoska zbliżeniowa lub szczelinowa, oznaczana symbolem IPA ʁ (do którego można byłoby dodać po kilka znaków diakrytycznych dla wyrażenia niuansów artykulacji, ale chyba czytelnicy będą mi wdzięczni, jeśli tego nie zrobię). Takie [ʁ] znacznie bardziej odbiega akustycznie od typowego polskiego [r], toteż bardziej „rzuca się w uszy”. Trzeba zaznaczyć, że i niemieckie, i francuskie /r/ mają wiele odmian regionalnych. W Austrii czy Bawarii często słychać przedniojęzykowe [r] lub [ɹ]. Wibrujące lub uderzeniowe [r] ~ [ɾ] można dotąd spotkać w wiejskich dialektach południowej Francji, jest to jednak wymowa wypierana przez standardowe [ʁ]. W portugalskim, jak w hiszpańskim, istnieje „mocne” i „słabe” R, przy czym pierwsze z nich jest zazwyczaj języczkowe (wymawiane w europejskim portugalskim jako [ʀ] lub [ʁ]), a drugie – dziąsłowe (uderzeniowe [ɾ]).

Wibrujące [ʀ] istnieje w języku francuskim, ale raczej jako wariant regionalny, niestandardowy. Do jego słynnych użytkowniczek należała Édith Piaf, co słychać nie tylko w słowach piosenek takich jak „Non, je ne regrette rien” lub „Milord”, ale także w jej mówionym francuskim (np. w zachowanych nagraniach wywiadów). Dla kontrastu – inna sławna piosenkarka francuska, Mireille Mathieu, używa typowego francuskiego [ʁ] w zwykłej mowie, i tylko śpiewając, przełącza się w tryb wibracyjny i wymawia [ʀ] podobnie jak Édith Piaf. Nie wiem, w jakim stopniu jest to świadomy hołd dla wielkiej poprzedniczki, a w jakim – przejaw skłonności śpiewaków do używania wariantu wyrazistszego fonetycznie, ale dobitnie artykułowane [ʀ] łatwo usłyszeć np. w zalinkowanym poniżej wykonaniu „Marsylianki”.

Ryc. 2.

Jeszcze inne warkoty

Ponieważ w następnym odcinku ważną rolę będzie odgrywał język czeski, warto wspomnieć o tym, że spółgłoski sonorne (w tym rotyczne), ze względu na swój stosunkowo otwarty sposób wymowy, łatwo przejmują funkcję ośrodka sylaby, jeśli w ich sąsiedztwie zabraknie samogłoski. Język czeski, obok spółgłoskowego [r] ~ [ɾ] (wymawianego podobnie jak w języku polskim) ma także [r̩] sylabiczne w wyrazach takich jak prst ‘palec’ albo trh ‘targ’. W języku polskim słowo krtań jest traktowane jako jednosylabowe, a dla ułatwienia jego wymowy /r/ zwykle ulega asymilacji ubezdźwięczniającej: [kr̥taɲ] (kółko pod r oznacza wymowę bezdźwięczną). W czeskim jest inaczej: dobrze znany Krecik z czeskich kreskówek to dwusylabowy krtek z akcentem na sylabie początkowej, czyli [ˈkr̩tɛk]. Ten ssak z rzędu owadożerów występuje także w piosence Jaromira Nohavicy „Metro pro krtky” (patrz link poniżej).3

W językach naszego kręgu geograficznego fonem typu R występuje zawsze, czasem samotnie, czasem w towarzystwie jakiegoś bliskiego kuzyna. Jak jednak widzieliśmy, stosowanie jednolitej transkrypcji powoduje, że wariantywność fonetyczna staje się niewidoczna. Baza PHOIBLE oznacza angielskie R jako /ɹ/, francuskie i niemieckie R jako /ʀ/ lub /ʁ/ (bo każdy z tych języków reprezentowany jest w bazie przez więcej niż jeden system), duńskie R jako /ʁ/ lub /r/, a portugalskie „mocne” R jako /ʁ/, ale mimo tej pozornej staranności za każdym razem wybór symbolu jest dość arbitralny i niekoniecznie zgodny z rzeczywiście dominującą wymową. A mówimy o językach starannie zbadanych i znakomicie udokumentowanych. Łatwo sobie wyobrazić, że w przypadku wielu języków słabiej poznanych wybór symbolu używanego w transkrypcji jest jeszcze bardziej dowolny i wątpliwy.

Widzieliśmy dość liczne przykłady języków europejskich, w których mamy po dwa fonemy rotyczne. W niektórych regionach świata rozróżnianie kilku „spółgłosek typu R” jest normą. W rdzennych językach Australii zwykle istnieje kontrast między dziąsłowym /r/ (wymawianym jak w języku polskim) a zadziąsłowym /ɻ/ (wymawianym bez wibracji jako retrofleksyjna spółgłoska zbliżeniowa). W języku tamilskim (rodzina drawidyjska), używanym w indyjskim stanie Tamil Nadu i w Sri Lance, mamy trzy fonemy typu R: uderzeniowe /ɾ/, wibrujące /r/ i retrofleksyjne zbliżeniowe /ɻ/.

Naturalna niestabilność i zmienność spółgłosek rotycznych, wynikająca z łączącej je fonetycznej „neutralności”, sprawia że są one częstym punktem tranzytowym między różnymi klasami spółgłosek w historycznym rozwoju języków. Tracąc wyraziste cechy, łatwo się przekształcić w „coś w rodzaju R”, a z kolei spółgłoska rotyczna może uzyskać jakąć cechę przenoszącą ją np. do świata obstruentów. W następnym odcinku serii przyjrzymy się bliżej jednemu z takich procesów. Przekształcił on głoskę pospolitą w coś dziwnego i wręcz unikatowego. Zobaczymy, że droga od dźwięków najłatwiejszych do najtrudniejszych bywa krótka.

Przypisy

1) Ta popularna odmiana /r/ realizowana jest przez przez zbliżenie tylnej części masy języka (przybierającego kształt zaokrąglony, z wybrzuszoną powierzchnią) do podniebienia miękkiego). Towarzyszy mu zwykle faryngalizacja (zwężenie prześwitu gardzieli) i zaokrąglenie warg. IPA nie ma wygodnego symbolu dla tego dźwięku (bo kombinacje znaków diakrytycznych typu [ɣ̞ˤʵʷ] trudno uznać za wygodne). Gdyby to ode mnie zależało, użyłbym znaku ȝ. Ale amerykańskie /r/ może też mieć wymowę zadziąsłową (jako [ɹ] lub silniej cofnięte, retrofleksyjne [ɻ]).
2) Zapamiętajmy to podobieństwo [ɹ] do [ʐ], bo przyda się nam jeszcze przy wyjaśnianiu niektórych procesów historycznych zmian językowych.
3) Czeski ma także sylabiczne [l̩], np. w słowie vlk ‘wilk’. Pełny zestaw sylabicznych spółgłosek sonornych występował w języku praindoeuropejskim. Podobnie jak w czeskim, mogły one występować nawet w sylabach akcentowanych. W tradycyjnej notacji używanej przez indoeuropeistów symbolem sylabiczności jest nie pionowa kreska, ale kółko pod literą (nie mylić z oznaczeniem bezdźwięczności w IPA): *, *, *, *, jak w rekonstrukcji praindoeuropejskiej *ḱr̥dés ‘serce’ (dopełniacz) albo *wĺ̥kʷos ‘wilk’. Angielskie spółgłoski sonorne mogą się stawać sylabiczne w zasadzie tylko w sylabach nieakcentowanych (seven, bottle), aczkolwiek amerykańską samogłoskę rotacyzowaną [ɝ] (jak w słowie bird) można traktować jako akcentowane sylabiczne /r/.

Opisy ilustracji

Ryc. 1: Różne warianty artykulacji /r/ w amerykańskim angielskim (przedniojęzykowe, w tym retrofleksyjne, i tylnojęzykowe). Mimo bardzo różnych układów języka efekt akustyczny jest tak podobny, że produkowane w ten sposób dźwięki są niemal nierozróżnialne słuchowo. Źródło: Tiede 2007, zob. też Tiede et al. 2010 (fair use).
Ryc. 2: Piosenki z tej płyty brzmiałyby o wiele mniej dRRRapieżnie ze standardową francuską wymową [ʁ].

Literatura

Patrz też

Mireille Mathieu śpiewa „MaRRRsyliankę”.

Prvá, druhá, třetí, čtvrtá,
na zahradě krtek vrtá.
Drápy má jak vývrtky,
vrtá metro pro krtky.

Najłatwiejsze dźwięki świata (2): dziury w systemie

Pozostałe wpisy z tej serii

Najłatwiejsze dźwięki świata (1): podstawy teoretyczne
Najłatwiejsze dźwięki świata (3): RRRrrr, czyli ukryta różnorodność warkotów

Nie możemy nie oddychać. O ile nie mamy jakichś kłopotów zdrowotnych, na ogół oddychamy spokojnie przez nos, zwierając wargi. Podniebienie miękkie jest rozluźnione, opuszczone i nie przeszkadza w przepływie powietrza przez nosową część traktu głosowego. Język nie musi nic robić: spoczywa sobie spokojnie na dnie jamy ustnej. Jeżeli teraz więzadła głosowe w krtani przyjmą pozycję, która sprawia, że wydychane powietrz wprawia fałdy głosowe w drgania, wymówimy dwuwargową spółgłoskę nosową [m]. Jest to jedna z najbardziej naturalnych artykulacji, jakie można sobie wyobrazić. Na jednym wydechu możemy bez większego wysiłku kontynuować wymawianie [mːːːː] przez ok. 10 sekund. Kiedy niemowlę jest głodne, sygnalizuje chęć przyssania się do matczynego sutka, zwierając i rozwierając wargi. Na całym świecie [m] jest jedną z kilku głosek najszybciej przyswajanych przez dzieci. Mandaryńskie māma, suahili mama, keczua mama i polskie mama nieprzypadkowo mają to samo znaczenie. Czy można sobie w ogóle wyobrazić język, w którym nie ma fonemu typu /m/?

Nie tylko można, ale nawet trzeba, skoro (jak wspominałem w poprzednim wpisie), choć [m] jest głoską najczęściej występującą w językach świata, tylko 96% (a nie 100%) systemów fonologicznych uwzględnionych w bazie PHOIBLE zawiera fonem /m/. Jeśli ekstrapolować ten odsetek na wszystkie języki na Ziemi, to można się spodziewać braku /m/ w 250–280 systemach. Nie oznacza to koniecznie, że te języki nie posiadają głoski [m], bo może ona być wariantem pozycyjnym (allofonem) jakiegoś innego fonemu. Na przykład istnieją języki, które nie mają spółgłoskowych fonemów nosowych (takich jak /m/, /n/, /ŋ/), ale mają samogłoski nosowe kontrastujące z ustnymi (np. /ã/ : /a/). W niektórych z nich spółgłoski dźwięczne zwarte (/b/, /d/, /ɡ/) ulegają unosowieniu przez samogłoskami nosowymi, czyli np. sekwencje fonemów /bã/, /dã/, /ɡã/ są realizowane w wymowie jako [mã], [nã], [ŋã]. Ta nosowość, jako przewidywalna i niekontrastywna, nie jest traktowana jako cecha fonologiczna spółgłoski, tylko jako wynik mechanicznego upodobnienia spółgłoski dźwięcznej do samogłoski. Dlatego takie języki traktowane są jako nieposiadające fonemu /m/ (ani też /n/ lub /ŋ/).

W języku pirahã (w brazylijskiej Amazonii) – słynnym m.in. z tego, że ma jeden z najmniejszych systemów fonologicznych – także nie ma spółgłoskowych fonemów nosowych, ale na początku wyrazu po pauzie fonemy /b/, /ɡ/ są realizowane fonetycznie jako [m], [n]. Trudno powiedzieć, jakie jest pochodzenie tych allofonów (bo prawie nic nie wiadomo o historii ludu Pirahã i jego języka), ale w każdym razie nie wynika z upodobnienia. A zatem nosowość w pirahã istnieje, tyle że nie jako cecha dystynktywna (charakterystyczna dla danego fonemu i odpowiedzialna za kontrasty między fonemami).

Są języki, w których brak /m/ nie jest skutkiem ogólniejszego braku spółgłoskowych fonemów nosowych, tylko innej, równie dziwnej luki systemowej: braku spółgłosek wargowych. Języki te nie mają fonemów /p/, /b/, /m/ ani innych spółgłosek artykułowanych za pomocą warg (jak /f/ i /v/), choć mogą mieć fonemy realizowane jako głoski, którym towarzyszy zaokrąglenie warg, np. /w/ (wymawiane jak w angielskim water). Z jakiegoś względu języki tego typu spotykamy – o ile wiadomo – wyłącznie Ameryce Północnej. W dwu rodzinach językowych, irokeskiej i na-dene, brak spółgłosek dwuwargowych jest cechą odziedziczoną po prajęzyku – wspólnym przodku każdej z tych grup.1

Na przykład irokeski język mohawk nie używa spółgłosek dwuwargowych w słownictwie pochodzenia rodzimego, choć zapożyczył pewną liczbę słów angielskich i francuskich, które je zawierają. We wczesnym okresie kontaktów z Europejczykami Mohawkowie zastępowali /m/, /b/ i /v/ języka źródłowego przez /w/ (np. imię Monique zostało zaadaptowane jako Wanik), a cudzoziemskie /p/ przez swoje /k/ (np. Paul, PierreKol, Kel). W miarę oswajania się z językami europejskimi rozszerzyli swój zasób fonemów o /m/ i /p/ (np. mátsis ‘zapałki’ ⇐ ang. matches), ale spółgłoski te używane są tylko w słowach wyraźnie odczuwanych jako obce (zapożyczone). Może się wydać dziwne, że Mohawkowie określani są nazwą etniczną zaczynającą się na /m/, jest to jednak tzw. egzonim, czyli nazwa nadana z zewnątrz, w tym przypadku pochodząca z jednego z języków z rodziny algonkińskiej. Sami Mohawkowie nazywają siebie Kanien’kehá:ka (co mniej więcej oznacza ‘lud z kraju krzemienia’).

Ryc. 1.

Czasem języki, które pierwotnie nie miały fonemu /m/, uzyskują go nie dzięki zapożyczeniom ze źródeł zewnętrznych, ale w wyniku rodzimych (wewnątrzjęzykowych) procesów zmian fonetycznych. Na przykład w języku czirokeskim (również z rodziny irokeskiej) spółgłoska [w] zmieniła się w [m] w środku wyrazu, jeśli następowała po niej samogłoska nosowa. W ten sposób z prairokeskiego *awẽɁ ‘woda’ powstało czirokeskie ama (nosowość „przeniosła się” z samogłoski na spółgłoskę). Takich słów jest co prawda zaledwie kilkanaście; o wiele więcej jest czirokeskich zapożyczeń z angielskiego zawierających /m/ pochodzenia obcego. Jednak ich przyswojenie z pewnością było łatwiejsze dzięki temu, że fonem /m/ już wcześniej pojawił się w słowach rodzimych, jakkolwiek nielicznych.

W Europie brak współcześnie języków nieposiadających /m/, ale prawdopodobnie spółgłoska ta nie występowała w języku prabaskijskim, z którego rozwinął się współczesny baskijski. Dawne *b zmieniło się w [m] przed samogłoską, po której następowało *n. Na przykład prabaskijskie *bini ‘język’ > baskijskie mihi. Jak widać, spółgłoska *n, która warunkowała tę zmianę, sama następnie uległa zanikowi, a miejsce po niej zajęło krtaniowe [h] (wstawione dla uniknięcia zbiegu samogłosek). Pouczające jest przyjrzenie się szczegółom tego procesu. Stadium pośrednim było *mĩh̃ĩ (nosowość usuniętego *n „rozlała się” na sąsiednie głoski, a to z kolei spowodowało asymilacyjną zmianę [b] w [m]).1 Wskutek zniknięcia pierwotnego czynnika warunkującego unosowienie początkowa głoska wyrazu usamodzielniła się jako fonem /m/ (nosowość stała się jej własną cechą identyfikacyjną). Innym źródłem współczesnego baskijskiego /m/ jest dawna grupa spółgłoskowa *nb, która rozwijała się następująco: *nb > *mb > *mm > m (*unbe ‘dziecko’ > ume).

Zmiany fonetyczne są najczęściej „naturalne” (motywowane dążeniem do zmniejszenia wysiłku artykulacyjnego czyli do ułatwienia wymowy połączeń głosek), ale z drugiej strony język służy do przekazywania zakodowanej informacji, a zatem uproszczenia fonetyczne bywają kompensowane w taki sposób, aby kontrasty umożliwiające rozróżnianie znaczeń nie zanikały całkowicie, tylko ulegały „przekodowaniu”: mogą zostać przeniesione na inne głoski lub wyrażone za pomocą innych cech fonologicznych. Między wygodą mówiącego a wygodą słuchacza – czyli między dążeniem do łatwej wymowy a zrozumiałością komunikatu – utrzymuje się dynamiczna równowaga. Głoski łatwe w wymowie łatwiej powstają, niż znikają, toteż występują pospolicie. Głoski trudne, ale naładowane informacją (bo będące nośnikami dużego pakietu cech rozpoznawczych) powstają rzadziej i mają mniejsze zasięgi występowania, ale często stają się nieusuwalne (przynajmniej w krótkim czasie) ze względu na swoją rolę w systemie.

Ryc. 2.

Nie istnieje fonem (zdefiniowany jako kompleks konkretnych cech fonologicznych), który by występował we wszystkich językach świata. Zdarzają się również luki systemowe obejmująca całe klasy fonemów (posiadających wspólną cechę). Niemal wszystkie rdzenne języki Australii pozbawione są spółgłosek szczelinowych lub zwartoszczelinowych, z których bogactwa słynie np. język polski. Języki na-dene, takie jak tlingit, pozbawione są na ogół głosek wargowych (podobnie jak irokeskie), ale dla innych miejsc artykulacji rozwinęły bogactwo spółgłosek zwartych, szczelinowych i zwartoszczelinowych (łącznie zwanych obstruentami), które zawstydziłoby Polaków. Tlingit ma obstruenty  bezdźwięczne zwykłe, przydechowe lub ejektywne, lateralne i labializowane (wymawiane z zaokrągleniem warg), ale brak im odpowiedników dźwięcznych. Luki systemowe często wykazują koncentrację geograficzną (niezależnie od pokrewieństwa języków zdefiniowanego jako pochodzenie od wspólnego przodka). Podobnie „wyspowy” charakter ma także występowanie rzadkich typów głosek (była o tym mowa przy okazji omawiania mlasków). Języki sąsiadujące z sobą przed długi czas mogą ulegać pod tym względem konwergencji wskutek mieszania się populacji i rozpowszechnionej wielojęzyczności.2

Czy przodkowie ludów irokeskich od zarania dziejów nie używali głosek wargowych? Czy Baskowie wywodzą się z populacji, która była dziedzicznie niezdolna do wymawiania /m/ (choć używała /b/)? Na pewno nie, skoro np. Mohawkowie w końcu przyswoili sobie zapożyczenia zawierające „zakazaną” klasę głosek, a w baskijskim rozwinęło się /m/ wskutek asymilacji, bez obcego wpływu. Irokezi potrafią zaciskać wargi tak samo, jak wszyscy inni ludzie na Ziemi. Prairokeski i prabaskijski to po prostu rzadkie przykłady języków, w których ewolucji doszło do mało prawdopodobnego, ale możliwego zbiegu okoliczności. Jakieś zamierzchłe zmiany fonetyczne, których nie jesteśmy w stanie dokładnie poznać (bo zaszły w okresie dawniejszym niż zasięg rekonstrukcji porównawczej) wyeliminowały niektóre głoski, które statystycznie należą do „żelaznego repertuaru” języków świata. Nawet głoska bardzo stabilna i łatwa w wymowie, która normalnie byłaby przekazywana z pokolenia na pokolenie przez tysiące lat w niezmiennej formie, ma prawo od czasu do czasu ulec dziwnej i nietypowej zmianie.

Przypisy

1) Język pra-na-dene mógł mieć *m, ale nie jest to oczywiste. W wielu współczesnych językach tej rodziny fonemy /m/ i /p/ występują, ale zwykle są bardzo rzadkie (dotyczy to zwłaszcza /p/) albo ograniczone do zapożyczeń. W niedawno wymarłym języku ejak spółgłoska [m] w słowach rodzimych była używana jako allofon /w/ przed samogłoskami nosowymi. Język tlingit – stanowiący „bazalną” gałąź rodziny na-dene, nie ma żadnych fonemów wargowych, nawet /m/.
2) Silnie unosowiona wymowa [mĩh̃ĩ], zarówno w tym słowie, jak i w innych formach o podobnej strukturze i historii, zachowała się w dialekcie suletyńskim współczesnego języka baskijskiego (na terenie Francji).
3) Można się zastanawiać, czy zjawiska takie jak złożone tony w językach Azji Południowo-Wschodniej, brak spółgłosek szczelinowych w Australii, występowanie mlasków w Afryce Południowej albo ogromnie rozbudowanych systemów spółgłoskowych na Kaukazie – o ile utrzymywały się regionalnie przez tysiące lat – nie zostały „zasymilowane genetycznie”, tzn. czy nie pojawiła się presja selekcyjna na doskonalenie dziedzicznie uwarunkowanych biologicznych predyspozycji do posługiwania się językami danego typu. Dostrzeżono korelację między występowaniem pewnych alleli (stosunkowo późnego pochodzenia) genów związanych z rozwojem mózgu a brakiem tonalności (tak jakby to „głuchota tonalna” była zjawiskiem wtórnym i raczej młodym w skali historii gatunku), natomiast nie stwierdzono uchwytnej zależności między genetyką południowoafrykańskich populacji posługujących się językami bantu a użyciem mlasków.

Opisy ilustracji

Ryc. 1: Louis Levi Oakes (1925–2019), Kanadyjczyk, jeden z siedemnastu Mohawków, którzy w czasie II wojny światowej służyli w armii USA jako tzw. code talkers: przekazywali komunikaty kodowane w prosty sposób, ale używając własnego języka, całkowicie niezrozumiałego dla przeciwnika. Kilka innych rdzennych ludów północnoamerykańskich (np. Nawaho czy Komancze) było wykorzystywanych w ten sposób na różnych frontach. Używane przez nich kody nigdy nie zostały złamane. Foto: Pierre Belleregarde. Źródło: Twitter (fair use).
Ryc. 2: Widok Mount Giles w Górach MacDonnella (Australia) – dzieło wybitnego australijskiego malarza Alberta Namatjiry (1902–1969) z ludu Aranda (przedstawiające rodzinne strony autora). Język aranda (kompleks kilku dość różnorodnych dialektów) ma duży zasób fonemów spółgłoskowych. Wykorzystuje sześć miejsc artykulacji, odróżnia spółgłoski zwarte od nosowych i zwarto-nosowych, ma po kilka fonemów typu L i R, ale w ogóle nie używa spółgłosek szczelinowych ani zwartoszczelinowych (czyli takich jak polskie s /s/ lub c /ts/). Żródło: Wikiart (fair use).

Patrz też

Rozmowa w języku mohawk. Warto zwrócić uwagę na aktywność warg obu rozmawiających. Przy wymowie /w/ i samogłosek zaokrąglonych wargi są wysuwane lub zaokrąglane, ale ulegają całkowitemu zwarciu dopiero w chwili, gdy mówiący kończy wypowiedź.

Najłatwiejsze dźwięki świata (1): podstawy teoretyczne

Pozostałe wpisy z tej serii

Najłatwiejsze dźwięki świata (2): dziury w systemie
Najłatwiejsze dźwięki świata (3): RRRrrr, czyli ukryta różnorodność warkotów

Jakiś czas temu poświęciłem serię wpisów dźwiękom mowy, które z punktu widzenia użytkowników głównych języków europejskich wydają się rzadkie, trudne lub osobliwe (od walijskiego ll [ɬ] po mlaski południowoafrykańskie). Kiedy przyjrzeć im się z bliska, okazują się nie takie znowu straszne. Można opanować ich wymowę, zwłaszcza jeśli rozumiemy, jak działają nasze narządy mowy, i potrafimy świadomie ich używać. Oprócz odrobiny wiedzy fachowej może to wymagać ćwiczeń, czyli odpowiedniej gimnastyki artykulacyjnej, a także przełamania odruchowych nawyków narzucanych przez języki, którymi już się posługujemy.

A czy są dźwięki mowy, które są łatwe dla każdego? Kiedy się przyjrzymy odpowiednio dużej próbce języków świata, zauważymy, że wśród głosek, które w każdym z nich mają status fonemów (czyli elementów, które mogą różnicować znaczenie wyrazów), pewne dźwięki powtarzają się częściej niż inne. Co prawda trzeba uważać ze stwierdzeniami typu „fonem /t/ występuje w języku polskim, angielskim i mandaryńskim”, bo to, co umownie zapisujemy jako /t/, może funkcjonować rozmaicie w zależności od tego, jak wygląda cały system fonologiczny danego języka. W odróżnieniu od głosek (które są konkretnymi dźwiękami mowy o określonej artykulacji i określonych cechach akustycznych), fonem to pojęcie abstrakcyjne, odnoszące się do całego zbioru głosek, które w systemie danego języka uważane są za warianty „tej samej” jednostki mowy. Używana powszechnie konwencja zaleca zapisywanie fonemów przy użyciu ukośników: /t/, a ich fonetycznej realizacji przy użyciu nawiasów kwadratowych: [t].

Polskie /t/ kontrastuje przede wszystkim z /d/, a różnica między nimi polega głównie na tym, że /t/ jest realizowane bezdźwięcznie, a /d/ dźwięcznie (towarzyszy mu wibracja fałdów głosowych). Angielski również ma parę /t/ : /d/, ale różnią się one w mniejszym stopniu dźwięcznością, a w większym – siłą artykulacji. Mięśnie narządów mowy są bardziej napięte przy wymawianiu /t/. W pozycji na początku akcentowanej sylaby skutkiem tej energicznej artykulacji jest wyraźnie słyszalny przydech: [tʰ], nieobecny w języku polskim albo np. francuskim czy hiszpańskim. Dzieje się tak dlatego, że większe napięcie mięśni aparatu mowy powoduje wzrost ciśnienia powietrza zgromadzonego w jamie ustnej i uwalnianego w fazie rozwarcia spółgłoski.

Z kolei w języku mandaryńskim różnica między [t] a [tʰ] ma znaczenie fonemiczne. Fonem /t/ (zapisywany d w oficjalnym chińskim systemie transkrypcji zromanizowanej, zwanym pinyin) jest wymawiany bez przydechu. Często ma wymowę przynajmniej częściowo udźwięcznioną, jednak cecha dźwięczności lub bezdźwięczności nie ma w jego przypadku znaczenia. Ważny jest tylko brak przydechu, odróżniający go od przydechowego /tʰ/ (oznaczanego t w zapisie pinyin).

Międzynarodowy alfabet fonetyczny (IPA) używa skończonej liczby znaków, podczas gdy dźwięki, jakie może wyartykułować człowiek, tworzą kontinuum bez wyraźnych granic między „sąsiednimi” dźwiękami. W dodatku, ponieważ dysponujemy wieloma ruchomymi narządami mowy, które mogą działać niezależnie od siebie, jest to kontinuum wielowymiarowe. Dlatego transkrypcja, jakiej używamy, jest z konieczności zawsze przybliżona i uproszczona. Nadmiar znaków diakrytycznych modyfikujących interpretację podstawowych symboli IPA raczej by przeszkadzał, niż pomagał w praktycznych zastosowaniach, wobec czego używamy ich oszczędnie. Zwykle symbol [t] oznacza dość ogólnikowo spółgłoskę przedniojęzykową zwartą, nienosową i bezdźwięczną, a uzupełniamy go o szczegóły tylko wtedy, gdy jest to konieczne. A zatem transkrybując fonemicznie (brytyjskie) angielskie top jako /ˈtɒp/, a polskie top jako /ˈtɔp/, abstrahujemy od faktu, że w pierwszym przypadku /t/ jest realizowane jako [tʰ] i wymaga większego nakładu energii artykulacyjnej. Fakt ten jest bowiem przewidywalny jako reguła realizacji obowiązująca w danym kontekście w systemie wymowy angielskiej.

Ryc. 1.

Różnica między typowymi realizacjami polskiego /t/ i angielskiego /t/ dotyczy również miejsca artykulacji i położenia języka. Polskie /t/ jest na ogół zębowo-dziąsłowe (co w razie potrzeby można zapisać precyzyjniej jako [t̪]) i jest wymawiane laminalnie (przednia część górnej powierzchni języka dotyka jednocześnie dziąsła i nasady górnych zębów). Angielskie /t/ jest na ogół dziąsłowe i apikalne (czubek języka dotyka dziąsła).1 Każde z nich ma wiele wariantów (tzw. allofonów) zależnych od kontekstu lub indywidualnych wahań wymowy, toteż różnicę między nimi należy zatem rozumieć raczej w kategoriach statystycznych. Warto zauważyć, że angielskie /t/ miewa allofony zupełnie nieznane w języku polskim: na przykład w niektórych pozycjach może być zastępowane przez zwarcie krtaniowe [ʔ], zupełnie tracąc charakter przedniojęzykowy.

Nie popełnimy jednak wielkiej nieścisłości, jeśli „w pierwszym przybliżeniu” uznamy laminalne zębowo-dziąsłowe [t̪] (nienapięte i bez przydechu) za najbardziej typową, „domyślną” realizację polskiego /t/, a apikalne dziąsłowe [tʰ] (napięte i przydechowe) za najbardziej reprezentatywną realizację angielskiego /t/ przynajmniej na początku wyrazu – pamiętając jednak o tym, że nie są to realizacje jedyne. W każdym razie różnica artykulacyjna między angielskim a polskim /t/ przekłada się na wyraźnie słyszalną różnicę akustyczną, więc ktoś, kto chce opanować wymowę języka obcego na poziomie zbliżonym do kompetencji rodzimych użytkowników, powinien zwracać uwagę na takie niuanse.

Jeśli stwierdzimy, że znaczna część języków świata używa fonemu /t/, to mamy na myśli, że występuje w nich przynajmniej jeden fonem, którego główna realizacja to spółgłoska przedniojęzykowa zwarta, nienosowa i bezdźwięczna. Czy jest ona napięta, czy towarzyszy jej przydech, czy jest całkowicie bezdźwięczna, czy artykułujemy ją bliżej zębów, czy bliżej tylnej krawędzi łuku dziąsłowego, czy język jest ułożony płasko, czy z uniesionym czubkiem – to już są drugorzędne szczegóły swoiste dla danego języka.2

Wydaje się „intuicyjnie oczywiste”, że fonem typu /t/ występuje w większości języków świata, i rzeczywiście tak jest. Największa istniejąca obecnie publicznie dostępna baza systemów fonologicznych, PHOIBLE (Phonetics Information Base and Lexicon) zawiera dane dla ponad 3 tys. języków.3 Co prawda reprezentatywność statystyczna takich baz i jakość zawartych w nich informacji zawsze budzi pewne zastrzeżenia (w większości przypadków ich twórcy zmuszeni są polegać na pojedynczych źródłach, bo większość języków jest słabo poznana i udokumentowana), ale w końcu nie chodzi nam tutaj o ścisłe dane ilościowe, tylko o ogólne zorientownie się w sytuacji. Baza PHOIBLE rozróżnia [t̪] od [t], ignorując fakt, że w większości języków ten kontrast nie ma znaczenia. Głoska [t] występuje jako fonem w 68% języków uwzględnionych w bazie (między innymi w angielskim), a [t̪] w 23% (między innymi w polskim). Nie można jednak po prostu zsumować punktów procentowych, bo istnieją języki, w których /t/ i /t̪/ są odrębnymi fonemami. Zatem rzeczywisty odsetek języków wykorzystujących co najmniej jeden fonem typu /t/ mieści się gdzieś między 70 a 90% (zapewne bliżej drugiej niż pierwszej wartości).

Według PHOIBLE spółgłoską najczęściej wykorzystywaną jako fonem jest /m/ (96% języków), a najczęstszą samogłoską jest /i/ (92%). W ogóle szczególnie często spotykamy fonemy spółgłoskowe takie jak /p/, /t/, /k/, /m/, /n/, /j/, /w/, a wśród samogłosek szczególnie popularne są /i/, /u/, /a/. To dźwięki łatwe w realizacji, bo nie wymagają żadnych wygibasów artykulacyjnych takich jak te, które opisywałem, omawiając spółgłoski ejektywne i iniektywne albo mlaski. Podstawowe artykulacje zwarte [p], [t], [k] polegają na tym, że strumień powietrza wypływający z płuc i pokonujący trakt głosowy zostaje na chwilę całkowicie zablokowany przez zwarcie obu warg lub przedniej albo tylnej części języka ze sklepieniem jamy ustnej. Są to wszystko elementarnie proste ruchy artykulacyjne: ludzka zdolność do ich sprawnego wykonywania utrwaliła się, zanim przodkowie Homo sapiens, neandertalczyków i denisowian rozstali się i poszli każdy w swoją stronę.

Jednak jeśli mimo zwarcia narządów mowy pozwalamy powietrzu wypływać przez jamę nosową, podtrzymanie wibracji fałdów głosowych nie napotyka trudności, stąd częste występowanie fonemów nosowych /m/, /n/. Natomiast tylnojęzykowa spółgłoska nosowa [ŋ] wywołuje drobną komplikację: żeby ją wymówić, musimy zewrzeć tył języka z podniebieniem miękkim. Jednak podniebienie miękkie samo jest umięśnione, ruchome i służy jako klapka otwierająca lub zamykająca odnogę nosową traktu artykulacyjnego – w tym drugim przypadku jest uniesione i przyciśnięte do tylnej ściany gardła. Trzeba je opuścić, żeby umożliwić powietrzu ucieczkę przez nos. Skoordynowanie tych dwóch czynności nie jest trudne, ale wiąże się z dodatkowym drobnym wysiłkiem. To wystarcza, żeby samodzielny fonem /ŋ/ występował rzadziej niż /m/ lub /n/ (w ich przypadku podniebienie miękkie służy tylko jako zawór, nie jako uczestnik zwarcia).

Co do samogłosek (dźwięków otwartych, przy których wymawianiu powietrze bez oporu przepływa przez ustną część traktu głosowego, a fałdy głosowe swobodnie wibrują), to o ich barwie decyduje rezonans akustyczny zależny od położenia masy języka. Jeśli język leży niemal płasko, oddalony od sklepienia jamy ustnej, to efektem akustycznym jest samogłoska typu [a]. Jeśli środek języka (czyli przednia część jego głównej masy) unosi się i zbliża do podniebienia twardego na tyle, na ile nie zakłóca to przepływu powietrza, to otrzymujemy samogłoskę typu [i]. Jeśli natomiast tył języka zbliża się do podniebienia miękkiego, otrzymujemy [u]. Samogłosce tej towarzyszy zwykle zaokrąglenie warg, co powoduje zmaksymalizowanie kontrastu akustycznego (i percepcyjnego) między przednim [i] a tylnym [u].

Ryc. 2.

Realizacje samogłosek, jakie jest w stanie wyartykułować Homo sapiens, mieszczą się w obszarze, którego skrajnyme punkty wyznaczają są [i], [u], [a] – samogłoski maksymalnie od siebie oddalone akustycznie. Inne samogłoski (takie jak [e], [o] czy [ə]) zajmują pozycje pośrednie. Nic dziwnego, że fonemy typu /i/, /u/, /a/ spotykamy częściej niż samogłoski mieszczące się gdzieś między nimi lub wymagające artykulacyjnych „efektów specjalnych”: im większy kontrast, tym mniejsze prawdopodobieństwo, że słuchacz źle zrozumie intencje mówiącego. Spółgłoski zbliżeniowe [j], [w] (zwane też półsamogłoskami) to spółgłoskowe odpowiedniki [i], [u]. Przy ich wymowie najwyższy punkt języka zbliża się do sklepienia jamy ustnej tak, że przepływ powietrza staje się wyraźnie ograniczony, ale jeszcze nie turbulentny (nie słychać aperiodycznego szumu charakteryzującego głoski szczelinowe).

Nieco dalej (ale wciąż wysoko) w rankingu prostoty fonetycznej i łatwości realizacji spotykamy fonemy typu /s/ (najpospoliciej występującą „syczącą” spółgłoskę szczelinową) oraz tzw. spółgłoski płynne: /l/ lub /r/. O spółgłoskach bocznych (do których należy [l]) była już mowa tutaj i tutaj; o spółgłoskach rotycznych („typu R”) jeszcze porozmawiamy. I to właściwie wszystko, jeśli chodzi o głoski, które nie powinny sprawiać większych kłopotów nikomu na tej planecie. Nie jest ich wiele, ale każda występuje w tysiącach języków.

Skąd się biorą głoski trudne w wymowie, o złożonej artykulacji i zasięgu ograniczonym do – powiedzmy – 5% języków albo w ogóle spotykane w jednym czy dwóch językach spośród około siedmiu tysięcy? Czemu ludzie zadają sobie trud, żeby ich używać? O tym także będziemy jeszcze dyskutować przy okazji omawiania konkretnych przykładów. Jednak kolejny wpis będzie poświęcony innemu zagadnieniu: istnieniu języków, w których nie występują dźwięki najłatwiejsze.

Przypisy

1) W razie konieczności IPA pozwala zapisać apikalność w następujący sposób: [t̺]. Dziąsłowe miejsce artykulacji uznawane jest za domyślne w przypadku spółgłosek przedniojęzykowych, dlatego nie oznacza się go za pomocą znaków diakrytycznych. Laminalność można zapisać tak: [t̻]. Jak jednak wspomniałem, tak szczegółowych oznaczeń używamy tylko wtedy, gdy jest to absolutnie konieczne, czyli skrajnie rzadko.
2) I w polskim, i w brytyjskim angielskim zębowe [t̪] i dziąsłowe [t] traktowane są jako warianty jednego fonemu. Jednak np. w wielu rdzennych językach Australii zębowe /t̪/ i dziąsłowe /t/, a także zadziąsłowe (retrofleksyjne) /ʈ/ są różnymi fonemami i trzeba je precyzyjnie rozróżniać, bo decydują o znaczeniu wyrazów. Natomiast w tychże językach nie ma znaczenia ani kontrast dźwięczności, ani przydech. Wymowa /t/ może się wahać między bezdźwięczną a dźwięczną, ale jest to stale ten sam fonem.
3) Albo raczej systemów językowych, bo niektóre języki są reprezentowane w bazie przez więcej niż jeden system. Nie jest to jednak istotne dla naszych rozważań.

Opisy ilustracji

Ryc. 1: Artykulacja dziąsłowego [t] (jak w języku angielskim): czubek języka i jego przednia krawędź zwierają się z dziąsłem, zamykając przepływ powietrza. Nie może ono także wydostać się przez nos, bo podniebienie miękkie jest uniesione i cofnięte, stykając się z tylną ścianą gardła. Więzadła głosowe w krtani są rozsunięte i powietrze może swobodnie przepływać między fałdami głosowymi, nie powodując ich drgania. Autor: Tavin. Źródło: Wikipedia (licencja CC BY_SA 4.0).
Ryc. 2: Trójkąt samogłoskowy. Często przestrzeń samogłosek przedstawiana jest w formie alternatywnej jako trapez o wąskiej podstawie (jej wierzchołki wyznaczają samogłoski najbardziej otwarte, [a] i [ɑ]. Trójkąt w bardziej realistyczny sposób oddaje cechy akustyczne samogłosek (formanty F1 i F2 ich widma częstotliwościowego), trapez łatwiej powiązać z cechami artykulacyjnymi (położenie języka). Autor: Kwamikagami. Źródło: Wikipedia (licencja CC BY-SA 3.0).

Patrz też

Interaktywna tablica znaków IPA z nagraniami wymowy poszczególnych głosek: https://www.ipachart.com/
Częstość występowania poszczególnych głosek w systemach fonologicznych uwzględnionych w bazie PHOIBLE: https://phoible.org/parameters (Moran, Steven & McCloy, Daniel & Wright, Richard (eds.) 2014. PHOIBLE Online. Leipzig: Max Planck Institute for Evolutionary Anthropology. http://phoible.org).