Data publikacji : 2025-12-29

Dialogiczne teksty dawne – od digitalizacji źródeł historycznych do operatywnego korpusu

Abstrakt

Artykuł ma na celu ukazanie specyfiki dawnych tekstów dialogowych w kontekście ich digitalizacji i możliwości wykorzystania w korpusach. Przedstawia etapy tworzenia Korpusu Dawnych Polskich Tekstów Dramatycznych (1772–1939). W pracy zwrócono uwagę na różnice między starszymi i nowszymi wydaniami tych samych tekstów. Wskazano na niedostatki technik OCR podczas sczytywania tekstów dialogicznych, w tym m.in. brak możliwości automatycznego oddzielenia didaskaliów od tekstu głównego. Przedstawiono także szczegóły związane z przygotowaniem danych do prawidłowej pracy narzędzi cyfrowych. Zgromadzone teksty wymagały m.in. rozpisania nazw postaci biorących udział w scenie i usunięcia kropek kończących zdania w didaskaliach. W efekcie przedstawionych zabiegów wyodrębniono przeszukiwalną część materiału językowego oraz obudowę tekstu o funkcji strukturalnej. W wyniku dalszych prac teksty zanotowano konkretnymi wartościami trzech wyznaczników socjolingwistycznych (płeć, wiek i status społeczny postaci). Zastosowane rozwiązania mogą być cenne dla autorów innych korpusów i narzędzi cyfrowych wykorzystujących teksty tzw. zapisanej mówioności.

Słowa kluczowe:

narzędzia cyfrowe, korpus językowy, polski dramat dawny, teksty dialogiczne, anotacja socjolingwistyczna, open science



Szczegóły

Bibliografia

Statystyki

Autorzy

Pobierz pliki

pdf

Wskaźniki altmetryczne


Cited by / Share


Roczniki Humanistyczne · ISSN 0035-7707 | eISSN 2544-5200 | DOI: 10.18290/rh
© Towarzystwo Naukowe KUL & Katolicki Uniwersytet Lubelski Jana Pawła II – Wydział Nauk Humanistycznych


Artykuły w czasopiśmie dostępne są na licencji Creative Commons Uznanie autorstwa – Użycie niekomercyjne – Bez utworów zależnych 4.0 Międzynarodowe (CC BY-NC-ND 4.0)