Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

Authors

OSOLSOBĚ Klára ŽIŽKOVÁ Hana

Year of publication 2022
Type Appeared in Conference without Proceedings
MU Faculty or unit

Faculty of Arts

Citation
Description Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu Novamorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji SYN v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů vebálních substantiv od variant jednoho slovesného kmene, které lze interpretovat jako tvary synonymní / variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.
Related projects:

You are running an old browser version. We recommend updating your browser to its latest version.