Liczby nie całkiem urojone – historia w trzech aktach. Akt III: Świat zespolony

Pozostałe akty i wpisy na pokrewne tematy

Liczby nie całkiem urojone – historia w trzech aktach. Akt I: Początki
Liczby nie całkiem urojone – historia w trzech aktach. Akt II: Wchodzi Euler
Patrz też: Nielegalne operacje, czyli wiele hałasu o zero

Po opisanych w akcie II odkryciach Eulera stało się jasne, że nie tylko można, ale warto badać pozornie skomplikowane funkcje o argumentach urojonych i zespolonych. Czy na przykład wyrażenie cos ix ma sens, gdy x jest liczbą rzeczywistą? Owszem, ma. Co więcej, jak łatwo sprawdzić, podstawiając ix zamiast x w rozwinięciu funkcji cosinus w szereg Maclaurina, wartość cos ix jest rzeczywista!

  • cos ix = 1 − (ix2 ∕ 2!) +  (ix4 ∕ 4!) − (ix6 ∕ 6!) + … = 1 + (x2 ∕ 2!) +  (x4 ∕ 4!) + (x6 ∕ 6!) + …

Mało, że otrzymujemy funkcję o wartościach rzeczywistych, to jest ona równa funkcji zwanej cosinusem hiperbolicznym: cosh x = ½ (ex + e−x). Nietrudno też dowieść, że cosh ix = cos x. Oznacza to możliwość przechodzenia w tę i z powrotem między światami funkcji trygonometrycznych a wykładniczych dzięki sekretnym tunelom przebitym przy użyciu liczb urojonych. Możliwość ta jest bardzo atrakcyjna, bo działania na funkcjach wykładniczych bywają o wiele łatwiejsze niż na trygonometrycznych. A kiedy raz już wpuścimy liczby zespolone do teorii funkcji i zaczniemy badać funkcje, których argumenty, współczynniki i wartości są liczbami zespolonymi, okazują się one tak użyteczne, że nie sposób się bez nich obyć. Zwykła analiza matematyczna staje się analizą zespoloną.

W roku 1799 duńsko-norweski matematyk Caspar Wessel zaproponował wyjątkowo użyteczny sposób wizualizacji liczb zespolonych. Na płaszczyźnie wykreślamy układ współrzędnych, w którym jedna oś reprezentuje część rzeczywistą, a druga część urojoną liczby zespolonej. Te dwie współrzędne określają punkt na płaszczyźnie, który utożsamiamy z liczbą zespoloną. Właściwie zamiast pisać z = x + iy moglibyśmy reprezentować liczbę zespoloną w postaci pary współrzędnych: z = [x, y]. Jest jeszcze inny sposób określenia położenia punktu na płaszczyźnie: można podać jego odległość od środka układu współrzędnych, √(x2 + y2) (jest to tak zwana wartość bezwzględna liczby zespolonej, zapisywana jako |z|) oraz kąt φ, jaki tworzy z osią X linia łącząca punkt [x, y] ze środkiem układu współrzędnych. Łatwo zauważyć, że sin φ = y ∕ |z|, a cos φ = x ∕ |z| (to wynika z geometrycznej interpretacji tych funkcji). A zatem:

  • x = |z| cos φ, y = |z| sin φ,
  • z = x + iy = |z| (cos φ + i sin φ) = |z| e  (patrz wzór Eulera).

Wartość bezwzględna wyrażenia cos φ + i sin φ wynosi zawsze 1, bo cos2 φ + sin2 φ = 1 dla każdego φ. Czyli wartość zespolona wyrażenia e (liczba e podniesiona do dowolnej potęgi urojonej) przedstawiona na płaszczyźnie zespolonej zawsze leży na okręgu o promieniu 1, którego środkiem jest punkt przecięcia się osi współrzędnych. Podnieść e do potęgi urojonej to to samo, co wykonać wzdłuż tego okręgu obrót o kąt φ wokół środka układu, startując od osi X i poruszając się odwrotnie do ruchu wskazówek zegara.

Wartości funkcji e na okręgu jednostkowym płaszczyzny zespolonej. Skróty Re (real) i Im (imaginary) oznaczają część rzeczywistą i urojoną liczby zespolonej. Źródło: Wikimedia (licencja CC BY-SA 3.0).

Kiedy mnożymy przez siebie dwie liczby zespolone, możemy uzyskać wynik, mnożąc przez siebie ich wartości bezwzględne i dodając odpowiadające im kąty. Jeśli obie wartości bezwzględne wynoszą 1, to mnożenie polega tylko na składaniu obrotów (dodawaniu kątów). Jeśli liczba z1 jest wyrażona wzorem cos φ1 + i sin φ1, a liczba z2 wzorem cos φ2 + i sin φ2, to ich iloczyn z1z2 jest równy cos (φ1 + φ2) + i sin (φ1 + φ2). Podniesienie jakiejkolwiek liczby postaci e do potęgi k oznacza pomnożenie jej przez samą siebie k razy, czyli wykonanie k obrotów o kąt φ (albo, co na jedno wychodzi, jednego obrotu o kąt ) po okręgu jednostkowym. W taki to sposób możemy przekształcenia geometryczne (obroty) zakodować za pomocą prostych działań wykonywanych na liczbach.

Stąd niedaleko do spostrzeżenia, że np. wszystkie rozwiązania zespolone równania zn = 1 (tak zwane „pierwiastki z jedynki”) rozłożone są na okręgu o promieniu 1 jako wierzchołki n-kąta foremnego. Jest ich n, a jedno z nich jest równe 1. Opisuje je równanie zk = e2πi (kn), gdzie k = 0, 1, …, n − 1. Na przykład pierwiastkami czwartego stopnia z jedynki są liczby 1, i, −1, −i, tworzące wierzchołki kwadratu. Każda z nich podniesiona do potęgi czwartej daje w wyniku 1, a dwie z nich są rzeczywiste. Pierwiastkami trzeciego stopnia z jedynki są liczby 1, −½ + i (√3) ∕ 2 oraz −½ − i (√3) ∕ 2, tworzące wierzchołki trójkąta równobocznego. Tylko pierwsza z nich jest rzeczywista, ale wszystkie spełniają równanie z3 = 1.

Siedemnaście liczb zespolonych – pierwiastków siedemnastego stopnia z jedynki, czyli rozwiązań równania z17 = 1. Wygenerowane za pomocą aplikacji Roots of Unity, GeoGebra (licencja CC BY-SA). Dygresja: Carl Friedrich Gauss w wieku 19 lat udowodnił, że siedemnastokąt foremny można skonstruować za pomocą cyrkla i linijki.

Jest to bardzo szczególny przypadek tzw. podstawowego twierdzenia algebry, które mówi, że każdy wielomian n-tego stopnia o współczynnikach zespolonych ma n pierwiastków (z których niektóre mogą być sobie równe, czyli tworzyć łącznie pierwiastek wielokrotny). Sformułujmy to inaczej: każdy taki wielomian można przedstawić w postaci c(z z1)(z − z2) … (zzn), gdzie liczby c, z1, z2, …, zn są zespolone. Jednym z ojców tego twierdzenia był „książę matematyków” Carl Friedrich Gauss (1777–1855), który w roku 1799 poświęcił jego udowodnieniu swoją pracę doktorską. W świecie liczb zespolonych nie ma zatem nierozwiązywalnych równań wielomianowych (czyli wielomianów nieposiadających ani jednego pierwiastka), podczas gdy w dziedzinie rzeczywistej często się to zdarza.

Ten fakt okazuje się ważny w teorii równań różniczkowych n-tego stopnia, które rozwiązuje się za pomocą tzw. wielomanów charakterystycznych (także n-tego stopnia). W zależności od tego, czy pierwiastki wielomianu charakterystycznego są rzeczywiste, urojone czy zespolone, jednokrotne czy wielokrotne, w rozwiązaniu równania pojawiają się kombinacje liniowe funkcji wykładniczych o podstawie ujemnej lub dodatniej, sinusów, cosinusów, iloczynów funkcji wykładniczej z kombinacjami sinusów i cosinusów, a także iloczynów potęg xk z którąkolwiek z wymienionych funkcji. W zjawiskach naturalnych opisywanych przez typowe równania różniczkowe (gdzie zmienną jest np. czas) takie właśnie funkcje odgrywają dominującą rolę. Reprezentują one wykładniczy wzrost lub zanikanie jakiejś wielkości fizycznej, ruch falowy, oscylacje zwykłe, wzmacniane, tłumione itp.

Liczby zespolone, płaszczyzna zespolona i równanie Eulera zwykle widnieją gdzieś w tle, gdy mowa o równaniach falowych (umożliwiają bowiem operowanie liczbami, które wyrażają jednocześnie amplitudę i fazę), grupach obrotów, drganiach lub sygnałach okresowych. Mają zastosowanie w teorii obwodów elektrycznych prądu zmiennego (impedancja zespolona pozwala w jednolity sposób traktować rezystancję opornika, pojemność kondensatora i indukcyjność cewki, co znakomicie ułatwia obliczenia), w elektrodynamice, elektronice, teorii sterowania, akustyce, informatyce, a zwłaszcza w fizyce kwantowej: zachowanie układów kwantowych opisywane jest przez wartości funkcji falowej dla danych wielkości, czyli tak zwane amplitudy prawdopodobieństwa, będące z natury, a nie na mocy konwencji ułatwiających rachunki, liczbami zespolonymi. W tym przypadku liczby zespolone wprowadzamy nie dla wygody, ale z konieczności.

Carl Friedrich Gauss, jeden z uczonych, którzy przyczynili się do rozwoju analizy zespolonej (płaszczyzna zespolona bywa nazywana płaszczyzną Gaussa, choć to nie on ją wymyślił), początkowo z pewnym oporem wewnętrznym podchodził do używania liczb zespolonych w dowodach matematycznych. Zwlekał nawet z publikacją niektórych własnych prac na ten temat, obawiał się bowiem, że przypięta przez Kartezjusza łatka „urojona” może przeszkadzać w akceptacji wyników. W roku 1831 zauważył z goryczą, że nie należało przyjmować dla żadnej kategorii liczb określeń, które wywołują skojarzenia negatywne. Na płaszczyźnie zespolonej oś, na której leży i, jest prostopadła do osi liczb rzeczywistych. Gdyby wobec tego mówić np. o „jednostce bocznej” (laterale Einheit), zamiast o „jednostce urojonej” (imaginäre Einheit), to nikt by się nie krzywił na jej używanie. Niestety rozsądne propozycje terminologiczne Gaussa nie przyjęły się i na liczbach urojonych dotąd ciąży klątwa Kartezjusza.

Nie zmienia to faktu, że liczby zespolone są ciekawymi obiektami matematycznymi, jedną z fundamentalych kategorii matematyki współczesnej, a w wielu zastosowaniach bardzo ułatwiają opis matematyczny rzeczywistego świata. Bywają wręcz niezastąpione, bo nie wydaje się, żeby można je było wyeliminować np. z równania Schrödingera. Dlatego chyba lepiej się pogodzić z tym, że żyjemy w świecie zespolonym, i spróbować zrozumieć, co to właściwie oznacza.

Liczby nie całkiem urojone – historia w trzech aktach. Akt II: Wchodzi Euler

Pozostałe akty i wpisy na pokrewne tematy

Liczby nie całkiem urojone – historia w trzech aktach. Akt I: Początki
Liczby nie całkiem urojone – historia w trzech aktach. Akt III: Świat zespolony
Patrz też: Nielegalne operacje, czyli wiele hałasu o zero

Zanim na scenę wkroczył Leonhard Euler (1707–1783), kilku innych matematyków przygotowało potrzebne rekwizyty. Pod koniec XVII w. zaczęto eksperymentować z przybliżaniem funkcji rzeczywistych za pomocą wielomianów, których kolejne wyrazy zależały od wartości kolejnych pochodnych funkcji w jakimś wybranym punkcie x0.* Zaczynamy od pochodnej „zerowej”, czyli samej funkcji, o której mowa, następnie uwzględniamy jej pierwszą pochodną, potem drugą pochodną (czyli pochodną pochodnej) itd. Ogólnie k-ty wyraz wielomianu dla funkcji f(x) ma dość prostą postać f(k)(xx0)kk!, gdzie f(k) jest k-tą pochodną funkcji f.** Dziś nazywamy to rozwijaniem funkcji w szereg potęgowy Taylora (lub Maclaurina, jeśli wybranym punktem jest x0 = 0), jednak ani Brooka Taylora, ani Colina Maclaurina, których nazwiska uwieczniono w ten sposób, nie było jeszcze na świecie, gdy Isaac Newton znalazł kilka takich rozwinięć – między innymi dla funkcji trygonometrycznych sin x i cos x. Można je przedstawić w postaci następujących „sum nieskończonych” (zbieżnych do faktycznej wartości sin x lub cos x dla każdej liczby rzeczywistej, ponieważ reszta pozostająca po uwzględnieniu n początkowych wyrazów szeregu maleje do zera gdy n dąży do nieskończoności).***

  • sin x = x − (x3 ∕ 3!) +  (x5 ∕ 5!) − (x7 ∕ 7!) + …
  • cos x = 1 − (x2 ∕ 2!) +  (x4 ∕ 4!) − (x6 ∕ 6!) + …

Rozwinięcia funkcji sinus i cosinus wyglądają nieskomplikowanie z następującego powodu: pochodną sin x jest cos x, pochodną cos x jest −sin x, pochodną −sin x jest −cos x, a pochodną −cos x jest sin x. Tutaj kółko się zamyka i kolejne pochodne kręcą się w tym samym cyklu. Łatwo sprawdzić że dla x0 = 0 wartości kolejnych pochodnych sin x (poczynając od zerowej) tworzą ciąg okresowy (0, −1, 0, 1, 0, −1, 0, 1, …); podobnie jest z wartościami kolejnych pochodnych cosinusa: (1, 0, −1, 0, 1, 0, −1, 0, …). Dlatego w rozwinięciu sin x w szereg Maclaurina nie występują wyrazy zawierające potęgi parzyste zmiennej x (znikają one po pomnożeniu przez 0), a wyrazy zawierające potęgi nieparzyste pojawiają się naprzemiennie ze znakami plus i minus. Podobnie wygląda rozwinięcie cos x, z tą różnicą, że tutaj występują wyłącznie potęgi parzyste, a nieparzyste znikają jako równe zeru.

Metoda, za której pomocą Newton otrzymał powyższe rozwinięcia (oraz kilka innych), była dość żmudna. Ponieważ matematycy brytyjscy intensywnie korespondowali między sobą, o wynikach Newtona dowiedział się w 1670 r. James Gregory, profesor Uniwersytetu w St Andrews w Szkocji, z listu swojego angielskiego kolegi Johna Collinsa. Gregory dla własnej prywatnej satysfakcji opracował ogólną metodę przedstawiania funkcji za pomocą szeregów tego typu, ale nie opublikował jej, był bowiem przekonany, że jest ona już znana Newtonowi. Sam Newton później także zbliżył się do sformułowania ogólnej teorii funkcji rozwijalnych w szeregi potęgowe, ale pozostawił ją w końcu niekompletną i nieopublikowaną. Dlatego zasługa przedstawienia jej światu przypadła w roku 1715 Brookowi Taylorowi.

Leonhard Euler, obywatel Szwajcarii, miał osiem lat, gdy metoda Taylora ujrzała światło dzienne, ale już pięć lat później podjął studia na Uniwersytecie w Bazylei, jednocześnie pobierając lekcje matematyki u Johanna Bernoulliego. Bernoulli cieszył się zasłużoną reputacją największego matematyka szwajcarskiego. Dzielił ją wcześniej ze swoim bratem Jacobem, który zmarł w 1705 r. Euler przerósł swojego mistrza. W 1726 r. jako dziewiętnastolatek zdobył stopień doktora i rozpoczął zawrotną karierę, stając się jednym z najpłodniejszych naukowo uczonych wszech czasów i reformatorem matematyki. Sam zainicjował kilka jej działów, uporządkował notację formalną (czyli powszechnie zrozumiały, uniwersalny język matematyki); sformalizował też wiele użytecznych pojęć, jak choćby funkcje i sposób ich oznaczania. Jeśli dziś piszemy f(x), to używamy zapisu Eulera.

Do ulubionych funkcji Eulera należała f(x) = ex, czyli odkryta przez niego samego funkcja eksponencjalna (szczególny przypadek funkcji potęgowej). Jest to w rzeczy samej, między nami mówiąc, jedna z najważniejszych funkcji w całym królestwie matematyki, a także wszelkich nauk, którym matematyka dostarcza narzędzi. Jej podstawę, liczbę niewymierną e = 2,7182818…, odkrył w zasadzie Jacob Bernoulli, ale to Euler zbadał gruntownie jej właściwości; on też oznaczył ją literą e, dlatego przylgnęła do niej nazwa „stałej Eulera”.

Funkcja ex ma tę interesującą właściwość, że jest w każdym punkcie swoją własną pochodną, a zatem wartości wszystkich jej pochodnych (zerowej, pierwszej, drugiej, trzeciej itd.) w punkcie x0 = 0 wynoszą tyle samo: e0 = 1. Z tej przyczyny jej rozwinięcie w szereg Maclaurina jest jeszcze prostsze niż w przypadku funkcji trygonometrycznych:

  • ex = (x0 ∕ 0!) + (x1 ∕ 1!) +  (x22!) + (x3 ∕ 3!) + (x4 ∕ 4!) + …

albo jeszcze prościej:

  • ex = 1 + x + (x2 ∕ 2!) + (x3 ∕ 3!) + (x4 ∕ 4!) + …

Warto dodać, że jest to rozwinięcie zbieżne dla wszystkich liczb rzeczywistych. Dla niedużych x jest szybko zbieżne, czyli daje bardzo dobre przybliżenie poszukiwanej wartości już po uwzględnieniu stosunkowo niewielkiej liczby składników sumy niekończonej. Sama liczba e jest oczywiście wartością ex dla x = 1, toteż można ją wyrazić w postaci następującej sumy:

  • e = 1 + 1 + (1 ∕ 2!) + (1 ∕ 3!) + (1 ∕ 4!) + (1 ∕ 5!) + (1 ∕ 6!) + (1 ∕ 7!) + (1 ∕ 8!) + (1 ∕ 9!) + …

Uwzględniając tylko te dziesięć wyrazów szeregu otrzymujemy e ≈ 2,7182815 …; przybliżenie to różni się od dokładnej wartości liczby e dopiero na siódmym miejscu po przecinku.

Przyglądając się rozwinięciu funkcji eksponencjalnej i funkcji trygonometrycznych, Euler zwrócił uwagę, że występują w nich te same składniki postaci xkk!, tyle że z różnymi znakami: w ex występują same plusy, a w funkcjach sin x i cos x na zmianę plusy i minusy; ponadto zaś w rozwinięciach sinusa i cosinusa brak co drugiego składnika. Gdyby tak połączyć sinus z cosinusem i coś zrobić z tymi minusami, być może ujawniłby się jakiś ciekawy związek między funkcjami pochodzącymi pozornie z całkiem różnych parafii.

Trzy funkcje, którym przyjrzał się Euler (tu oczywiście i argumenty, i wartości są liczbami rzeczywistymi).

Zauważmy, że liczba i podnoszona do kolejnych potęg (zaczynając od zerowej) daje nam następujący ciąg wartości: (1, i, −1, −i, 1, i, −1, −i, 1, …) i tak dalej w kółko. Występują tu na przemian liczby rzeczywiste i urojone, przy czym jedne i drugie na przemian przybierają przeciwne znaki. Ten schemat jest dziwnie znajomy: coś podobnego działo się przecież z sinusem i cosinusem rozwiniętymi w szeregi potęgowe! Może więc naprzemienność znaków da się wymusić przez wprowadzenie wartości urojonej do wykładnika funkcji? Co prawda nikt wcześniej nie próbował podnosić czegokolwiek do potęgi urojonej, ale mamy przecież elegancki wzór na ex, który działa dla wszystkich liczb rzeczywistych x. Czy zadziała także dla liczb urojonych postaci ix? Co szkodzi sprawdzić? A więc sprawdźmy:

  • eix = 1 + ix + (i2x2 ∕ 2!) + (i3x3 ∕ 3!) + (i4x4 ∕ 4!) + (i5x5 ∕ 5!) + (i6x6 ∕ 6!) + (i7x7 ∕ 7!) +…

czyli – pamiętając, jakie są kolejne potęgi i:

  • eix = 1 + ix − (x2 ∕ 2!) − i (x3 ∕ 3!) + (x4 ∕ 4!) + i (x5 ∕ 5!) − (x6 ∕ 6!) − i (x7 ∕ 7!) +…

Posegregujmy teraz osobno wyrazy rzeczywiste i urojone, rozbijając szereg na dwa podszeregi:

  • eix = [1 − (x2 ∕ 2!) + (x4 ∕ 4!) − (x6 ∕ 6!) + …] + i [1 − (x3 ∕ 3!) + (x5 ∕ 5!) − (x7 ∕ 7!) + …].

I cóż nam się wyłoniło w nawiasach kwadratowych? W pierwszym z nich widzimy jak na dłoni rozwinięcie w szereg potęgowy funkcji cos x, a w drugim sin x. O każdym z tych rozwinięć wiemy, że zachowuje się przyzwoicie, czyli jest zbieżne dla każdej rzeczywistej wartości x. A skoro tak, to funkcja eksponencjalna ma dobrze określoną wartość zespoloną dla każdej liczby urojonej ix, a wartość ta wynosi…

  • eix = cos x + i sin x  [wzór Eulera].

Stąd wynika także, że dla każdej liczby zespolonej postaci z = a + bi

  • ez = ea + bi = ea (cos b + i sin b).

Teraz nie tylko potrafimy podnosić liczby rzeczywiste do potęgi zespolonej, ale na dokładkę odkryliśmy (tzn. Euler odkrył w latach czterdziestych XVIII w.) głęboki związek między funkcjami wykładniczymi a trygonometrycznymi, w którym kluczową rolę odgrywają liczby zespolone. Funkcje cos x i sin x są ni mniej, ni więcej, tylko – odpowiednio – częścią rzeczywistą i częścią urojoną wartości zespolonej eix.

Wzór Eulera uchodzi słusznie za jeden z najbardziej satysfakcjonujących estetycznie wzorów matematyki. Mimo swojej pozornej abstrakcyjności jest niesłychanie przydatny także w fizyce i jej zastosowaniach inżynierskich, niekoniecznie bezpośrednio, ale poprzez liczne wynikające z niego konsekwencje. Wrażenie, jakie robi, można wzmocnić za pomocą następującej efektownej sztuczki magicznej. Niech x będzie równe π = 3,14159265… Jest to, jak pamiętamy, miara kąta półpełnego. Jak uczy trygonometria, cos π = −1, sin π = 0. Ze wzoru Eulera wynika więc natychmiast, że

  • e = −1,

czyli

  • e + 1 = 0  [tożsamość Eulera].

Występują w tej tożsamości dwie najważniejsze liczby całkowite, 0 i 1, jednostka urojona i, dwie najbardziej fundamentalne liczby niewymierne, e i π, trzy podstawowe działania (dodawanie, mnożenie i potęgowanie) oraz szczególnie ważna relacja matematyczna (równość), a wszystko to splecione w sposób tak zwięzły, zaskakujący i nieoczywisty, że wydaje się wręcz mistyczny. Jest to jednak prosta konsekwencja czegoś głębszego i ważniejszego, czyli ogólniejszego wzoru Eulera. To w nim są „zaszyte” tajemne związki między odległymi działami matematyki.

O tym, co wynikło z tych osiągnięć, i o tym, jak reprezentujemy liczby zespolone w sposób przystępny dla wyobraźni laika, opowie akt III.

Przypisy

*) Zakładam, że Czytelnik wie, co to jest pochodna, ale jeśli ktoś nie pamięta, tu można sobie odświeżyć wspomnienia ze szkoły: https://www.medianauka.pl/pochodna-funkcji.

**) Mam nadzieję, że wszyscy znają ze szkoły symbol silni: n! = 1 × 2 × 3 … × n; dodatkowo zakładamy, że 0! = 1, więc dla każdej dodatniej liczby całkowitej n! = (n − 1)! × n.

***) Pamiętajmy, że argument x nie jest tu wyrażony w stopniach, ale (jak przystało w poważnej matematyce) w jednostkach miary łukowej: przyjmujemy zatem, że miarą kąta prostego jest ½π, kąta półpełnego π, a pełnego 2π.