Homonymie mezi oikonymy a antroponymy zakončenými na -slav jako problém automatické morfologické analýzy

Autoři

OSOLSOBĚ Klára ŽIŽKOVÁ Hana

Rok publikování 2020
Druh Vyžádané přednášky
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
Popis Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jednou z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku upozorníme na morfosyntaktické rozdíly českých antroponym končících na -slav (typ Miroslav, maskulinum) a českých oikonym se stejným zakončením (typ Miroslav, femininum) a českých antroponym končících na -slava (typ Miroslava, femininum), protože jeho formy jsou homonymní s oběma: mužskými antroponymy a ženskými oikonymy). Analýza dat z korpusu SYN v8 ukazuje, že homonymie slovního tvaru významně ovlivňuje výsledky automatické morfologické analýzy. Zdokumentujeme chyby v pokrytí slovníku automatického analyzátoru a především chyby v morfologickém značení a navrhneme řešení pro částečné vylepšení automatické desambiguace daného typu vlastních jmen.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.