Pogodzeni w znaczeniu (Jak coś zrozumieć po polsku cz. 2)

Dawno temu, w poprzednim odcinku, napoczęliśmy problem nauczenia komputera rozpoznawania polskich wyrazów w ich poszczególnych odmianach. Wyciągając dzieła napoleońskiego oficera opracowaliśmy „algorytm”, który czasami ma szansę spróbować ugryźć to zadanie. Czasami. Ma szansę. To za mało.

Musimy poszerzyć nasze teoretyczne zaplecze: zrozumieć, czemu rdzenie zmieniają swoje formy zewnętrzne i jak w ogóle opisać tę zmienność. Spróbuję zacząć od życiowego przykładu. (To znaczy spróbuję, żeby był życiowy).

Powiedzmy, że masz w domu na ścianie reprodukcję któregoś z nieprzystojnych aktów Degasa. Znienacka ma was odwiedzić sroga, pyskata babcia, która nie pochwala takich rzeczy.

Rzecz jasna mógłbyś (mogłabyś) samemu odwrócić obrazek na drugą stronę, gdzie przezornie zapewne wymalowane są treści patriotyczno-religijne. Ale rzeczą ludzką jest rozmawiać i wyręczać się innymi, więc zamiast tego zlecasz operację któremuś z domowników.

  1. Jeżeli nie masz zbyt wielu lat i akurat masz pod ręką rodzeństwo, być może zawołasz: „ej, odwróć panienkę na ścianie, babcia idzie”.
  2. Jeżeli rozmawiasz z rodzicem, albo sam(a) nim jesteś, użyjesz raczej wypowiedzi w rodzaju „odwróć prędko obrazek, a ja polecę nastawić wodę na herbatę”.
  3. Jeżeli sprawy potoczyły się zbyt szybko i zasiedliście już przy rodzinnym stole z nestorką twojego przesławnego rodu, możesz spróbować dawać znaki na migi osobie wychodzącej do łazienki. A nuż sprawę zdołacie jeszcze dyskretnie załatwić…

Owych sposobów, by wyrazić to samo z grubsza żądanie, znaleźlibyśmy na pewno więcej. I nieistotne dla nas, dlaczego dokładnie występują owe różnice: ważny jest najogólniejszy fakt, że okoliczności – takie jak to, z kim w tej chwili przebywamy – dyktują sposób wyrażenia jednej właściwie rzeczy.

Otóż podobne zjawisko występuje na znacznie, znacznie niższym poziomie języka, gdzie wszystko rozgrywa się między głoskami. Gdy mamy na przykład przysłówek gęsto i jego stopień wyższy gęściej, oba wyrazy można podzielić na dwa morfemy (dwie cząstki znaczące): gęst|o, gęść|ej. Morfemyo i –ej mówią tyle, że te słowa to przysłówki w stopniu równym i wyższym. Cząstki gęst- i gęść- są zaś w zasadzie tym samym – odsyłają pod ten sam adres w naszej pamięci przechowującej znaczenia słów – a jednak na powierzchni występuje różnica. A „zawiniają” okoliczności: w przypadku gęściej rolę srogiej babci odgrywa głoska e, której obecność wymusza na t zmiękczenie w ć, co z kolei zmusza s do przejścia w miękkie ś. Podobnych przypadków z miękczącym e można w naszym języku pokazać mnóstwo, i to najbanalniejszych: lepszy – lepiej, Kuba Kubie, łysy łysieć…

Tego rodzaju odmiany (alternacje) fonemów przechodzą w historii podobną drogę od stanu, w którym wydają nam się konieczne dla naturalnej, niewymuszonej wymowy języka, do stanu, w którym są już zupełnie umowne. Dużo uwagi tym sprawom poświęcił Jan Baudouin de Courtenay w Próbie teorji alternacyj fonetycznych (rok 1894 – idziemy jak widać naprzód w czasie od Mrozińskiego, który nas zajmował ostatnio). Żywe i „naturalne” (w odczuciu mówiących) alternacje natychmiast stosujemy także do nowych wyrazów. Sami z siebie wiemy, że w wegańskie burgery jedzą hipsterzy, a znacznie rzadziej hipstery, a muchę znajdujemy w kebabie, a nie np. w kebabe. Według Baudouina de Courtenay wszystkie alternacje zaczynały jako takie fonetyczne oczywistości”*. Po drugiej stronie znajdują się alternacje morfemów i fonemów na tyle nieumotywowane (w poczuciu użytkowników), że przestają mieć dostrzegalny sens. Kto na przykład jest w stanie wyprowadzić słowo dozorca z czasownika dozierać (czyli „doglądać”)**?

Tyle o losach zmienności; pytanie, gdzie jednak znaleźć jakąś stałość, jako punkt zaczepienia dla algorytmu. Póki co możemy dla każdego rdzenia wskazywać różne, choć określone postacie: powiedzmy, dla słowa lig|a lig (liga) oraz lidz (lidze). Pozostając przy tym wybralibyśmy podejście słownikowe: wyposażyli komputer w wielki zasób rdzeni i końcówek (380 megabajtów tabelek odmiany, jakimi posługuje się program Morfeusz), i pozostawili go z niezdolnością analizy nowonapotkanych słów.

Z drugiej strony, próbując wrócić do teorii Mrozińskiego, moglibyśmy wyjaśniać zmienność za pomocą twierdzeń o miękkości, typu: g przed końcówką fleksyjną może przyjmować swoje miękkie formy dz i ż, podobnie jak w rzeczownikach ulga (uldze, ulżyć) czy trwoga (trwodze, strwożony).

Lecz nietrudno zauważyć, że rdzeń liż, który też powinien należeć do ligi, jest zajęty przez zupełnie inne słowo – lizać (lizało, liże).

Ktoś mógłby zaoponować, że w istocie sytuacja kształtuje się tutaj regularnie – w rzeczownikach żeńskich g rzeczywiście wymienia się na dz, ale na ż nie zawsze i najwyżej w wyrazach pochodnych. To nawet słuszna uwaga, jednak owe „wyrazy pochodne” także są powtórzeniami – o co chodziło w tej serii wpisów od początku – oraz dzielą z czasownikami tę samą unikalną część znaczącą. W wyrazach trzeba wydzielić część „słownikową” (przypadkową) i „gramatyczną” (regularną), o czym kiedyś pisał ogólniej Leonard Bloomfield***. Nie sposób odgadnąć, co oznacza rdzeń noś-, jeżeli nikt nas wcześniej o tym nie poinformował – ponieważ jest on przypadkowy, nie wynika z niczego (pomijamy ewentualną historię tego rdzenia). Ale kiedy już poznamy to znaczenie, słowa w rodzaju niosła, nieśli, nosiwoda, nosidło, nośność będą intuicyjnie logiczne w swym znaczeniu i budowie, jeżeli tylko jesteśmy osłuchani z językiem polskim.

Morfemy, a wśród nich rdzenie, zachowują się nieco jak zwierzęta terytorialne. Pewna część możliwych kombinacji fonemów jest kontrolowana przez jakiś rdzeń/znaczenie (te, które odbieramy jako znaczące cokolwiek, w odróżnieniu od wszystkich murkwi, i gwajdolnic, i pięśliwych wrucetów, jakie znajdujemy w sci-fi). Jeśli język mamy łatwo rozumieć, przypisanie kombinacji jednemu znaczeniu powinno odcinać pozostałe. I chociaż istnieją wieloznaczne wyjątki, to tylko potwierdzają one regułę, że słowa zazwyczaj bohatersko unikają kolizji. Polecam uwadze slalom, jakie wykonują w swej odmianie czasowniki wiedzieć i wieść (w znaczeniu wodzić). Spójrzmy: wiedzą i wiodą, wiedziemy i wiemy, ale!… wiedzieliśmy i wiedliśmy. Problem pojawia znowu przy zmianie części mowy, gdzie wieść ― brzmiące jak bezokolicznik ― może także oznaczać wiedzę rozchodzącą się wśród ludzi. (Jednak rzeczownik od czasownika odróżnia funkcja w zdaniu, przez co zwykle można rozpoznać odpowiednie znaczenie).

Aby uprościć zapis „terytorium” zajmowanego przez dany rdzeń, stosowane jest pojęcie morfonemu – pewna abstrakcja zbudowana nad fonemem. Wracając do przykładu ligi, nadalibyśmy jej rdzeniowi formę ligo, gdzie go może w żywej mowie przyjąć postać g albo dz. W przypadku ulgi rdzeń zostałby sprowadzony do formy ulg1, przy założeniu, że g1 potrafi być g albo dz, albo ż. Morfonem można więc opisać jako miejsce, gdzie fonemy zlewają się znaczeniowo. W takim razie owo zjawisko występuje po ul, kiedy odnajdujemy tuż za nim g, dz bądź ż. Identycznie po trwo. Stąd możemy pisać ulg1 i trwog1.

Widać teraz, że na poziomie fonologii, czy też już morfonologii, morfonem jest tym, co mamy na myśli, a fonem sposobem, w jaki to wyrażamy zależnie od okoliczności (zob. początek tego tekstu). Fundamentalne spostrzeżenie Mrozińskiego dotyczy szczególnego przypadku, kiedy to fonem „funkcjonalnie twardy” i „miękki” są manifestacją jednego morfonemu – i rzeczywiście w polskim często napotykamy taką sytuację.

Mając do dyspozycji pojęcie morfonemu, możemy sformułować nasze początkowe pytanie o orientację komputera w polskich słowach w nieco śliślejszy sposób. Chcemy wiedzieć, jak mając do dyspozycji zapis tekstu, dojść do jego formy złożonej wyłącznie z morfonemów – to znaczy zapisu, gdzie rdzenie wyrazów powinny uzyskać jedną postać. Ten problem stawiano już w nauce. Wprawdzie chyba częściej pytano o drogę powrotną: od morfonemów do postaci powierzchniowej języka. Łatwo zauważyć, że pierwszy punkt widzenia jest właściwy temu, kto słucha lub czyta, a drugi – temu, kto mówi lub pisze. Aby zobaczyć przykład podejścia do tej kwestii, w następnym odcinku sięgniemy najpewniej do niewielkiej czerwonej książeczki – książeczki pełnej grozy (chociaż być może spróbujemy się uspokajać grafami!).


* Z wyjątkiem tych, które przejęliśmy z języków obcych (w pewnym sensie, bo w ramach tego obcego języka miały własną historię). Na przykład przejścia fonemów takie jak te w parach emitować – emisja, cedować – cesja oddają alternacje łacińskie. W języku polskim akurat te fonemy się nie „wymieniają”, chociaż bardzo ciekawy jest przypadek wiedzie – wieść.

** O ile nie wyczytał tego np. w Krystyna Kowalik, Struktura morfonologiczna współczesnej polszczyzny, Kraków 1997, s. 166.

*** Language, New York 1933, s. 274 (do tego fragmentu nawiązuje Chomsky w Aspects of the Theory of Syntax).

Dziękuję Ilonie i Magdzie za przejrzenie pierwszej wersji tego wpisu (która, szczerze mówiąc, trafiła w końcu do kosza).

 

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *