Stylometrická analýza církevněslovanských textů české provenience
| Autoři | |
|---|---|
| Rok publikování | 2023 |
| Druh | Článek v odborném periodiku |
| Časopis / Zdroj | SLAVIA : časopis pro slovanskou filologii |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | https://www.slu.cas.cz/cs/slavia |
| Doi | https://doi.org/10.58377/slav.2023.5.06 |
| Klíčová slova | cluster analysis; Czech Church Slavonic; lexical diversity; stylometric analysis; token length |
| Popis | Příspěvek představuje pilotní studii stylistické analýzy českých církevněslovanských textů. Cílem studie je měření podobností/rozdílů mezi texty na základě vybraných kvantitativních charakteristik. Konkrétně je použita průměrná délka tokenu (ATL), klouzavý průměrný poměr typů a tokenů (MATTR) a textové vzdálenosti určené normalizovanými frekvencemi nejfrekventovanějších slov (MFW). Pro analýzu byl použit korpus dvanácti církevněslovanských literárních spisů připisovaných (s různou pravděpodobností) českým autorům v 10. a 11. století. Navíc byly přidány další dva textové prameny (Codex Suprasliensis a Život svatého Metoděje), aby bylo možné porovnat výsledky a získat komplexnější pohled na vztahy mezi texty. Výsledky ukazují věrohodnost aplikace metod na tomto specifickém vzorku textů. |