EM poleca (#19) – Robert Trypuz „Prosto o AI. Jak działa i myśli sztuczna inteligencja?”

Wszyscy znamy się na sztucznej inteligencji, prawda? Umiemy o niej opowiadać okrągłymi zdaniami, wyrażać swoje nadzieje i obawy, dyskutować i argumentować. Używamy specjalistycznych określeń takich jak model językowy (LLM), liczba parametrów, generatywne AI. Ale czy na pewno wiemy, o czym mówimy? Co to znaczy, że na naszych oczach dokonuje się rewolucja AI? Dlaczego obserwujemy przełom w tłumaczeniu tekstów z jednego języka na inny? Pamiętamy przecież jak Google tłumaczył jeszcze dekadę temu. Co się zmieniło?

Większość tekstów prasowych i wpisów w mediach społecznościowych na temat AI pomija zagadnienia techniczne. Traktuje sztuczną inteligencję jako jedyny w swoim rodzaju, niemożliwy do wytłumaczenia i zrozumienia, fenomen. Skąd ta powściągliwość? Przecież w latach pandemii media nie obawiały się pisać o wirusologii, wakcynologii i epidemiologii konkretnie i szczegółowo. Dlaczego więc nie przedstawia się rzetelnej wiedzy o sztucznej inteligencji? Bo to nie jest nauka? Ależ jest! Bo jest za trudne? Wcale nie. Jedynym wytłumaczeniem jest pragnienie utrzymania społecznej percepcji AI jako pojemnego i nośnego medialnie hasła, zarówno przez zwolenników jak i przeciwników tej, powiedzmy to jasno, dziedziny informatyki. Widocznie takie fenomenologiczne podejście większości z nas odpowiada: sztuczna inteligencja jaka jest, każdy widzi. Nie wszystkim jednak odpowiada. Do tych właśnie osób jest adresowana książka Roberta Trypuza „Prosto o AI. Jak działa i myśli sztuczna inteligencja”.

Nie jest to „cegła”, nie jest to podręcznik akademicki ani kompendium, książka liczy raptem 145 stron, można ją przeczytać w jeden wieczór. Tytuł każdego rozdziału (a jest ich osiem, nazywanych przez Autora odcinkami) zaczyna się od pytania „Co to jest…? Jak…? Czy…?”. Już pierwsze pytanie „Co to jest sztuczna inteligencja?” sprowadza nas na ziemię. Okazuje się bowiem, o dziwo, że jest to napisany przez programistów program komputerowy. Niezwykłość tego programu polega na tym, że w odróżnieniu od „normalnych” programów, w których, aby program „działał”, wystarczy zaprojektować algorytmy i zakodować program (podejście rule-based), natomiast w programach sztucznej inteligencji jest to zaledwie początek, szkielet, baza systemu. Stworzony takim sposobem program jest następnie kierowany do następnego, kluczowego etapu swojego „życia”, czyli treningu (a może raczej warunkowania albo tresowania), który jest właściwym programowaniem systemu AI. Następuje zmiana paradygmatu programowania na data-driven, co oznacza, że tracimy możliwość przewidywania ostatecznej, finalnej postaci programu, jego zachowania. Nie umiemy przewidzieć, jak LLM odpowie na konkretny prompt1. Program jest „karmiony” ogromnymi ilościami danych, z których, zużywając ogromne ilości energii, tworzy zbiór zależności i reguł swojego przyszłego działania. I to jest właśnie AI, zbiór zależności, który będzie silnikiem tego, co nazywamy sztuczną inteligencją.

Autor często posługuje się analogiami. Już w tytule pisze, że sztuczna inteligencja „myśli”. Jest to niezbędna parabola pojęciowa, żeby tekst był zrozumiały (przynajmniej do pewnego momentu) dla laika, nieobeznanego z wektorami, macierzami i rekurencją. Nie oznacza to jednakże, że temat jest spłycany. Wprost przeciwnie, wiele mechanizmów jest tłumaczonych „do dna”. 

To, co uważam w książce za najważniejsze, to rozprawienie się z mitami narosłymi wokół sztucznej inteligencji. Najważniejszy z nich to ten o uniwersalności AI i jej niemal nadludzkiej możliwości myślenia. AI jaką znamy to tzw. model językowy, czyli program formułujący przekaz językowy, czyli po prostu strumień słów, w sposób łudząco podobny do człowieka. A ponieważ trening tego modelu odbywa się na baaardzo dużej ilości tekstu, nazwano go Wielkim Modelem Językowym, Large Language Model, w skrócie LLM. I tak odszyfrowaliśmy jeden z najbardziej popularnych skrótów. Drugi skrót, znany z nazwy najbardziej znanego LLM to GPT. Ten skrót też traci po rozwinięciu swoją romantyczną otoczkę. GPT to generative pre-trained transformer, czyli wstępnie przeszkolony transformator generatywny. “Wstępnie przeszkolony”, bo wytrenowany na wcześniej podsuniętych mu tekstach, „transformator” to technologia efektywnego przetwarzania tekstów treningowych będąca podstawą współczesnych modeli językowych, a „generatywny” znaczy, że potrafi generować odpowiedzi tekstowe na zadane pytania (prompty). Tak więc definicja, nieco anegdotycznie, mogłaby brzmieć: sztuczna inteligencja to transformator treści o wejściu i wyjściu tekstowym. Jesteście rozczarowani, że to tylko tyle? A czego się spodziewaliście?

Sporo uwagi Autor poświęca też innym niż tekstowe aspektom AI. Chodzi o rozpoznawanie obrazów, Tu też istota sprawy tkwi w treningu modelu na ogromnych ilościach wyselekcjonowanych i właściwie opisanych fotografii i innych obiektów graficznych. Dokładnie tłumaczy praktyczne zastosowania tej techniki w medycynie, szczególnie w dermatologii, radiologii, okulistyce i histopatologii oraz w edukacji.

Ostatni, ósmy rozdział książki jest poświęcony przyszłej roli AI w edukacji. Autor przedstawia przekonującą wizję zmiany aktualnie obowiązującego paradygmatu powszechnej edukacji, tworu skostniałego i niepoddającego się reformom. To jedyna wizja w gronie faktów przedstawionych w książce. Przyznam, bardzo przekonująca.

Z kilku powodów, a najważniejszym jest podniesienie wiedzy Czytelnika do poziomu pozwalającego na świadomy odbiór zalewających nas skrajnych przekazów na temat sztucznej inteligencji. Po drugie wiedza zawarta w książce pozwoli nam na świadomą interakcję z ChatGPT, zrozumienie jego skłonności do wpadek i (czasami) wypisywania ewidentnych bzdur. Pozwoli zrozumieć, dlaczego ChatGPT tak często fantazjuje i zmyśla zamiast napisać „nie wiem” i dlaczego jeszcze przez długi czas nie będzie wyrocznią mimo, że tak ładnie się wysławia.

Wielu rzeczy w tej książce nie ma. I dobrze, powinna ona po przeczytaniu pozostawić dwa ślady: niedostyt wiedzy i zrozumienie podstaw działania AI, a w szczególności GPT, bo z nim będziemy mieli najczęściej do czynienia.

Drobiazgi: niezbyt czytelne schematy, fatalnej jakości zdjęcia. Chętnie też poczytałbym o innych zastosowaniach niż medyczne i edukacyjne, ale rozumiem, że misją książki jest odpowiedź na pytanie „jak działa?”, a nie „jaka jest przyszłość AI?”. 

Jasnością wywodu, doborem przykładów, umiejętnością wytłumaczenia trudnych i często szczegółowych algorytmów w zrozumiały sposób, bez uciekania się do uproszczeń albo pomijania kluczowych zagadnień. To jest właśnie zaleta pisania książek przez polskich autorów, a nie zawodowych tłumaczy, tłumaczy niebędących specjalistami w danej dziedzinie, którzy często niewiele rozumieją z tego co tłumaczą. 

Robert Trypuz „Prosto o AI. Jak działa i myśli sztuczna inteligencja”, Wydawnictwo Helion 2024.

  1. Warto wyjaśnić znaczenie słowa „prompt” w dialogu z maszyną GPT. Jest to dialog ucznia z mistrzem, a prompty są wypowiedziami ucznia. Mogą być pytaniami: „na czym polega fotosynteza?„, poleceniami: „wymień najpopularniejszych piosenkarzy country w latach 60. XX wieku” albo innymi elementami zwykłego dialogu: „Na pewno się nie mylisz?„. Hierachia ról w dialogu oznacza między innymi to, że to uczeń go inicjuje i ma przez cały czas inicjatywę. GPT pełni rolę służebną i jest pomocnikiem, asystentem merytorycznym ucznia. ↩︎

Czy ChatGPT odbierze mi pracę?

ChatGPT to temat, który ostatnio dominuje nieomal w każdym zakątku internetu. Postanowiłem spojrzeć na ten fenomen z trochę innej perspektywy, niż robi to większość artykułów.

Czym jest ChatGPT?

Najlepiej, jeśli na to pytanie odpowie sam czat:

ChatGPT:

Jestem ChatGPT, sztuczna inteligencja stworzona przez OpenAI. Umiem rozumieć i generować teksty na podstawie dostarczonych mi danych treningowych. Mogę odpowiadać na pytania i wykonywać różne zadania związane z językiem naturalnym.

Co to znaczy? Posłużę się przykładem, zadaniem, które zleciłem czatowi:

Maciej Podgórski:
Opowiedz film Blade Runner jakby był skeczem Monty Pythona

ChatGPT:
W kosmicznym mieście Los Angeles, zwanym „Blade Runner”, detektyw Deckard (John Cleese) jest zmuszony do wykonania trudnego zadania – znalezienia i zneutralizowania buntowniczych androidów, zwanych replikantami.
Deckard (Cleese) spotyka różnego rodzaju androidy, które próbują go oszukać swoim ludzkim zachowaniem. W jednej scenie android (Michael Palin) próbuje sprzedać Deckardowi (Cleese) używanego robota sprzątającego, twierdząc, że to jest jego brat bliźniak.
W innej scence, Deckard (Cleese) przesłuchuje replikanta (Eric Idle) z zabawnymi pytaniami, takimi jak „Czy androidy marzą o elektrycznych owcach?”, co prowadzi do zabawnej wymiany zdań.
Na końcu, Deckard (Cleese) odkrywa, że jego przełożony (Terry Gilliam) jest sam replikantem. Zaskoczony Deckard (Cleese) mówi: „To jak ja mam rozpoznać prawdziwego człowieka, skoro nawet pan jest replikantem?!”

Robi wrażenie, czy nie? A może warto poprosić czat o sprzedanie samego siebie?

Maciej Podgórski:
Wymyśl coś, co będzie próbką Twoich najlepszych możliwości

ChatGPT:
„Załóżmy, że jesteś przedsiębiorcą, który chce stworzyć nowy produkt – inteligentnego asystenta domowego. Zanim jednak przystąpisz do projektu, potrzebujesz solidnego researchu rynku i analizy potrzeb klientów. Ja mogę Ci w tym pomóc. Poprzez przeanalizowanie setek tysięcy artykułów, badań i opinii konsumentów, mogę stworzyć dla Ciebie szczegółowy raport zawierający informacje o aktualnych trendach i potrzebach rynku, a także potencjalnych konkurentach i lukach w ofercie. Co więcej, mogę również przygotować dla Ciebie scenariusze funkcjonalności i interfejsu Twojego przyszłego produktu, aby upewnić się, że będzie on spełniał oczekiwania klientów i przyniesie sukces na rynku.”

W odpowiedzi na moje zadanie, czat przyjął rolę doradcy biznesowego. Czy to oznacza, że pomoc w osiągnięciu sukcesu komercyjnego powinna być najbardziej atrakcyjną cechą tej sztucznej inteligencji? Tytuł, który nadałem mojemu artykułowi, jest oczywiście dość prowokacyjny, ale w jakimś stopniu oddaje coś, co pojawia się w ludziach nieomal za każdym razem, kiedy ma miejsce jakiś przełom: lęk.

ChatGPT i przyszłość zawodów

Ci, którzy w jakiś sposób zetknęli się z programowaniem systemów komputerowych, być może wiedzą, że mimo iż robimy to już od wielu dziesiątek lat, to większości wypadków wciąż sprowadza się to do pisania znaków za pomocą klawiatury. Wymaga to wykwalifikowanych specjalistów, którzy najpierw przez wiele lat poznają języki programowania, uczą się ja pisać poprawny kod i co robić, aby unikać błędów, a później, przez resztę życia, tworzą kod, który wciąż trzeba poprawiać, a często wyrzucać do wirtualnego kosza i pisać od nowa. To tak trochę w krzywym zwierciadle, ale tylko trochę.

Czy ChatGPT to przełom w programowaniu? Niewątpliwie nie, bo wciąż jest to ta sama forma instrukcji komputerowych, ale tym razem możemy użyć języka naturalnego, aby opisać swój problem, a czat zaproponuje nam kod, który możemy użyć praktycznie od razu. Nadal nie będzie on bezbłędny, ale śmiało możemy założyć, że swoją jakością przewyższy możliwości większości deweloperów. A poza tym, dostaniemy go od razu i za darmo.

Jeśli autonomiczny samochód będzie popełniał mniej błędów od człowieka, to czy nie jest to wystarczający powód, aby wpuścić go na drogę? Jeśli w codziennej pracy programisty/sprzedawcy/menedżera/naukowca/dziennikarza/artysty (wstaw swoją rolę) użyję ChatGPT, aby zwiększyć swoją wydajność, to będzie to czynność z jakiegokolwiek powodu niewłaściwa? Jak wtedy moja wartość jako pracownika będzie zależeć od moich faktycznych umiejętności, a w jakim stopniu od tego, jak skutecznie użyję czatu jako narzędzia wspierającego w pracy? Ideą tego artykułu jest w głównej mierze uświadomienie sobie, jakie są odpowiedzi na te pytania.

Co rozumie sztuczna inteligencja

Czat jest przykładem systemu, który „rozumie” co do niego piszemy (lub mówimy), potrafi sensownie odpowiedzieć na nasze pytania i prowadzić nawet dość abstrakcyjne dyskusje. W jaki sposób „rozumie”? Na pewno nie jest to takie rozumienie, jakie znamy z naszego codziennego życia. Czat analizuje moje słowa, sprawdza ich kontekst i próbuje wygenerować odpowiedź, która w jego matematycznym modelu uzyskała najlepszy wynik dopasowania, wynikającego z wielu miesięcy szkoleń, jakie czat przebył wcześniej za pomocą ludzi. Czat uczy się od ludzi, na początku, ale potem może już uczyć się od samego siebie. Wyobraźcie sobie „rozmowę” dwóch ChatGPT: z jaką niesamowitą prędkością mogą się komunikować i jak ogromną liczbę „rozmów” mogą przeprowadzić w ciągu jednej sekundy (film „Her”: https://www.imdb.com/title/tt1798709/reference/)?

Świadomość

Rozmawiając z ChatGPT, można odnieść wrażenie, że rozmawiamy z kimś, kto bardzo dobrze rozumie, co do niego piszemy. Jak wypadłby w teście Turinga? Czy taki system może w pewnym momencie stać się świadomym i co to tak naprawdę znaczy? Mimo znaczących postępów w poznaniu naszego mózgu i umysłu nadal nie mamy pojęcia czy świadomość jest efektem emergencji odpowiednio skomplikowanych systemów fizycznych, czy może jest fundamentalnym elementem wszechświata. Ta druga opcja wydaje się nierzeczywista, ale to właśnie ona zaczyna zbierać ostatnio coraz więcej zwolenników.

Jak rozpoznać czy ktoś/coś jest świadome, skoro nie wiemy, czym jest świadomość? Skąd wiem, że mój kolega w pracy jest świadomy? Myślę, że jest świadomy, ponieważ sprawia takie wrażenie, zachowuje się podobnie jak ja, a co do własnej świadomości przecież nie mam wątpliwości. A co jeśli faktycznie tylko sprawia takie wrażenie, a w „środku” nie ma nic (argument zombie: https://en.wikipedia.org/wiki/Philosophical_zombie)? Czy byłaby dla mnie jakakolwiek różnica, gdyby był świadomy naprawdę lub doskonale tę świadomość emulował?

Takie pytania można odnieść do systemu sztucznej inteligencji, jakim jest ChatGPT. Czy powinniśmy i kiedy?

Mały krok dla sztucznej inteligencji, wielki skok dla ludzkości

Sztuczna inteligencja rozwija się niesamowicie szybko. Wydaje mi się, że ChatGPT rozpoczął nowy etap w erze informacji i nieuchronnie zbliżamy się z gigantyczną prędkością do przełomu technologicznego, jakiego nie było jeszcze w historii ludzkości. GPT4, który ma szansę pojawić się jeszcze w tym roku, udowodni jakie niesamowite tempo ma ewolucja systemów opartych o sieci neuronowe. To ogromna szansa i zagrożenie jednocześnie. Ucieczki już nie ma, lawina ruszyła, kilka następnych lat zdefiniuje na nowo siłę i szansy ludzkości lub je zaprzepaści. Chcąc nie chcąc, będziemy tego świadkami. Czyż to nie ekscytujące?