Skip to main content

Web Content Display Web Content Display

Wybory 2024

Web Content Display Web Content Display

Sukcesy edytorstwa cyfrowego WP UJ w ramach PF DHLab

Sukcesy edytorstwa cyfrowego WP UJ w ramach PF DHLab

 

Automatyczne rozpoznawanie szwabachy w aplikacji Transkribus

 

Grupa studentek edytorstwa pod opieką dr Joanny Hałaczkiewicz wytrenowała model AI do rozpoznawania polskojęzycznych tekstów drukowanych szwabachą. Za materiał szkoleniowy posłużyły im transliteracje tekstu Scipione Amatiego Historia del regno di Voxu del Giapone. Dzieło przetłumaczone przez Jakuba Śliwskiego jako Posłowie iapońscy do Pawła V biskupa rzymskiego, narod y droga ich ukazało się w 1616 roku w drukarni Franciszka Cezarego w Krakowie.

Studentki w ramach kursu z tworzenia edycji cyfrowych miały do dyspozycji transliteracje przygotowane uprzednio na ćwiczeniach z tekstologii z dr hab. Magdaleną Komorowską. Materiał w formie plików tekstowych został scalony, przejrzany i skorygowany, tak aby wiernie odpowiadał podstawie edycji zamieszczonej w bibliotece cyfrowej Polona. Następnie stworzono layout złożony z pól tekstowych i linii bazowych, do których przyporządkowano tekst.

Model, który udało się wytrenować, osiągnął niski CER (Character Error Rate) – 1%, co oznacza, że bardzo dobrze nadaje się on do generowania transliteracji tekstów drukowanych szwabachą. Pod nazwą „The Polish Schwabacher” został udostępniony wszystkim użytkownikom Transkribusa i można z niego skorzystać po zalogowaniu się do aplikacji. Jest to trzeci model przeznaczony do języka polskiego, zaraz po wielojęzycznym Transkribus Print M1 (CER 2,20%) oraz uniwersalnym Transkribus Polish M2 (CER 4,10%) – rozpoznającym pismo odręczne.

Zespół:

dr Joanna Hałaczkiewicz (PF Digital Humanities Lab, Katedra Edytorstwa i Nauk Pomocniczych WP UJ), Anna Grzybczyk, Karolina Kapuścińska, Agata Lech, Gabriela Paszkowska, Aleksandra Sobańska, Agnieszka Tkacz, Olga Zatońska

 

Badania wykonano przy wsparciu finansowym Priorytetowych Obszarów Badawczych: POB Heritage oraz POB DigiWorld w ramach Programu Strategicznego Inicjatywa Doskonałości w Uniwersytecie Jagiellońskim.