Nová automatická morfologická analýza češtiny

Autoři

OSOLSOBĚ Klára HLAVÁČOVÁ Jaroslava PETKEVIČ Vladimír ŠIMANDL Josef SVÁŠEK Martin

Rok publikování 2017
Druh Článek v odborném periodiku
Časopis / Zdroj Naše řeč
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www http://nase-rec.ujc.cas.cz/archiv.php?art=8465
Obor Jazykověda
Klíčová slova automatic morphological analysis; lemmatisation; natural language processing; part-of-speech tagging; tagset
Popis Cílem příspěvku je představit projekt inovace popisu české morfologie pro nástroje automatické morfologické analýzy, zejména změny v pojetí tagsetu. Více než dvacet let je automatická morfologická analýza součástí mnoha nástrojů počítačového zpracování přirozeného jazyka (natural language processing, NLP). Její výsledky užívá lingvistická veřejnost zejména při práci s velkými jazykovými korpusy. Od roku 2012 běží grantový projekt, v jehož rámci se připravují inovace automatické morfologické analýzy češtiny. Ty jsou zaměřeny především na odstranění nedostatků, s nimiž se dosavadní praxe potýká, a zhodnocují zkušenosti, které bylo možné získat pouze na základě praxe.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.