Punctuation Detection with Full Syntactic Parsing

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Název česky Detekce interpunkce pomocí hloubkové syntaktické analýzy
Autoři

JAKUBÍČEK Miloš HORÁK Aleš

Rok publikování 2010
Druh Článek v odborném periodiku
Časopis / Zdroj Research in Computing Science, Special issue: Natural Language Processing and its Applications
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://www.cicling.org/2010/Vol46.pdf
Obor Informatika
Klíčová slova punctuation; grammar checking; parsing; syntactic analysis
Popis Správné užívání interpunkčních znamének podléhá v mnoha jazycích, včetně češtiny, složitým pravidlům. Ačkoliv tato pravidla vycházejí z morfologie, syntaxe i sémantiky, současné aplikace pro detekci a korekci interpunkce se omezují na jednoduché pravidlové systémy. V tomto článku představujeme způsob založený na využití syntaktického analyzátoru (parseru) pro češtinu jménem synt. Tento parser používá při analýze strukturu typu chart, ze které lze dále získat různé druhy výstupů. Implementovaná technika detekce interpunkce využívá výstupu ve formě jednoznačných syntaktických struktur (jmenných a slovesných frází, jednoduchých, mj. vztažných, či obecně vložených vět). Tato funkcionalita umožňuje získání syntaktických struktur relevantních pro vkládání interpunkce. Závěrem jsou demonstrovány experimenty prokazující, že tato technika je použitelná pro pokrytí většiny syntaktických fenoménů souvisejících s detekcí interpunkce.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.