HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY

Autoři

OSOLSOBĚ Klára ŽIŽKOVÁ Hana

Rok publikování 2020
Druh Článek v odborném periodiku
Časopis / Zdroj Acta onomastica
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www
Klíčová slova anthroponym; oikonym; ending in -slav/-slava; corpus; tagging; disambiguation
Popis Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.