29.01.2021

„»Zapisz moje słowa« – tworzyć jak Cezar” – felieton


Skrócona wersja poniższego felietonu autorstwa prof. Ryszarda Tadeusiewicza została opublikowana w Dzienniku Polskim oraz Gazecie Krakowskiej 29.1.2021 r.

W dzisiejszym felietonie połączę moje dwie fascynacje: klasyczną literaturą i automatycznym rozpoznawaniem mowy.

Chociaż jestem inżynierem, to początki mojej edukacji były humanistyczne. Ukończyłem I LO w Myślenicach w klasie prowadzonej przez hrabinę Helenę Konopkową (herbu Nowina), która uczyła nas łaciny. Początki były trudne, ale w starszych klasach, znając już język, rozsmakowałem się w dziełach starożytnych autorów. Szczególnie podobały mi się pamiętniki Juliusza Cezara „Commentarii de bello Gallico” – opisy 9 lat trwającej wojny, w czasie której legiony Cezara podbiły obszary dzisiejszej Francji, Anglii, Belgii, Szwajcarii i kawałek Niemiec. Można powiedzieć, że Cezar tworzył Unię Europejską ponad dwa tysiące lat temu!

Ale tworzył także godne podziwu dzieła literackie. Czytałem je naprawdę z zapartym tchem! Zachwycały mnie lapidarne i precyzyjne relacje z poszczególnych kampanii wojskowych, ale także opisy ludów zamieszkujących zdobywane ziemie ze słynnym pierwszym opisaniem nieznanych w Rzymie terenów na północ od Alp zaczynającym się od słów: „Gallia est omnis divisa in partes tres...” (Galia składa się z trzech części...).

Nie byłem pierwszym ani jedynym, który się tym zachwycał: Cytat ten przytaczał Julian Tuwim w wierszu Nad Cezarem i śpiewał go Jacek Kaczmarski (ten od profetycznej pieśni o murach, które runą).

Obok zachwytu nad formą i treścią tych utworów (pamiętniki o wojnie gallickiej spisał Cezar w siedmiu księgach) zadziwiało mnie to, jak i kiedy on to pisał. Przecież dowodził w bitwach, zakładał obozy wojskowe, planował kampanie, odbywał narady ze swoimi oficerami... I co, potem spisywał swoje refleksje gdy wszyscy jego żołnierze spali zmordowani śmiertelnym bojem?

Tymczasem z mimochodem wzmiankowanych uwag historyków wyłonił się bardzo ciekawy obraz. Otóż Cezarowi wszędzie towarzyszył niewolnik z tabliczką woskową. Gdy Cezarowi przyszła do głowy jakaś trafna sentencja – nawet podczas bitwy albo w środku nocy – wypowiadał swoją myśl i dodawał: zapisz moje słowa. W spokojniejszym czasie porządkował i redagował te swoje uwagi i relacje, ale ich wartość opierała się głównie na tym, że były to spisywane „na gorąco” myśli, słowa, zdania i całe akapity. Dlatego po ponad dwóch tysiącach lat dzieło to głęboko porusza swoim autentyzmem.

Mamy XXI wiek. Wprawdzie nie toczymy (na szczęście!) wojen, ale tempo życia jest takie, że nie starcza czasu na spokojną refleksję. A czasem by się przydało coś zapisać, utrwalić, przekazać innym, pozostawić po sobie...

Wiele osób pisze więc na FB, Twitterze, różnych blogach – ale każdy, kto tego spróbował, wie jak dużo wysiłku i czasu to wymaga. Nieraz przychodzi nam do głowy jakaś fajna myśl, ale nie ma możliwości jej zapisania, zaś gdy w wolnej chwili próbujemy do niej powrócić – okazuje się, że gdzieś uleciała, wypłowiała, zmalała... A taka była świetna, gdy nam przyszła do głowy!

Gdyby tak mieć pod ręką niewolnika zapisującego, któremu nawet w biegu można by było rzucić:

- Zapisz moje słowa!

i już kolejna perła naszego dowcipu byłaby utrwalona. A tak – to zginie znowu w niepamięci...

Niekoniecznie!

Niewolnika wprawdzie dzisiaj kupić się nie da – ale mogą nam służyć techniczne narzędzia, które wcielają się w rolę nowoczesnych niewolników i robią dla nas niezliczone rzeczy. Wśród nich są systemy automatycznego rozpoznawania mowy. Niektóre z nich służą głównie do tego, żeby zamieniać mowę na tekst pisany – i o nich chcę dziś opowiedzieć. Wspomniałem wyżej, że to także moja fascynacja, więc dodam tylko, że automatycznego rozpoznawania mowy dotyczyła moja praca magisterska (1971), doktorska (1975) i habilitacyjna (1978). Potem napisałem pierwszą w Polsce książkę na ten temat (1988), zbudowałem system do głosowego sterowania pracą robota przemysłowego (1990)  i ... zaniechałem dalszych prac, bo zmęczyłem się już tym tematem. Niestety w PRL nie było możliwości powielania rozwiązania technicznego powstałego w następstwie prac naukowych w formie rynkowego produktu, więc zacząłem się zajmować innymi zagadnieniami naukowymi, związanymi z rozpoznawaniem obrazów, bo na nie było zapotrzebowanie przemysłu.

Ale sympatia do automatycznego rozpoznawania mowy pozostała, chociaż obecnie w miejsce pionierskich (kiedyś) rozwiązań, będących wynikiem oryginalnych polskich prac naukowych i konstrukcyjnych (bo próby adaptacji rozwiązań tworzonych w latach 70. i 80. dla innych języków okazały się nieskuteczne) – można użyć gotowych i sprawdzonych rozwiązań firmowych. Kilka z nich mogę przykładowo wskazać, chociaż oferta rynkowa jest znacznie bogatsza.

Do konwersji tekstu mówionego na tekst pisany służyć może cenione na świecie narzędzie, jakim jest program IBM Watson Speech. Niestety chwilowo nie radzi on sobie z zapisywaniem tekstów mówionych w języku polskim. Natomiast do pakietu Microsoft Office można już pobrać (za darmo!) program Dictate, który pozwala na głosowe sterowanie pracą komputera, ale także na rejestrowanie w formie tekstu całych wypowiedzi. Co więcej Dictate może także tłumaczyć z jednego języka na drugi w ramach 20 języków, wśród których jest także język polski. Inna duża firma, Google, wypuściła program VoiceNote II który współpracując z przeglądarką Google Chrome dokonuje także konwersji mowy na tekst. Przez niektórych użytkowników polecany jest SkryBot domowy, szybki jest Dictation Pro, wygodny (ale drogi!) MagicScribe. Dyktowanie tekstu, który potem dostępny jest w formie pisanej, jest także jedną z usług, jakie może świadczyć system Google, a w nim narzędzie Google Docs.

Warto wypróbować – by tworzyć swoje teksty jak Gajusz Juliusz Cezar!

 

Wykaz wszystkich publikacji popularnonaukowych prof. Tadeusiewicza wraz z odnośnikami do ich pełnych wersji