Automatic Structuring of Written Texts

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Název česky Automatické strukturování psaných textů
Autoři

VEBER Marek HORÁK Aleš JULINEK Rostislav SMRŽ Pavel

Rok publikování 1999
Druh Článek ve sborníku
Konference Proceedings of 2nd International Conference on Text, Speech, and Dialogue (TSD 1999)
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www http://nlp.fi.muni.cz/publications/tsd1999_mara_hales_julinek_smrz/
Obor Využití počítačů, robotika a její aplikace
Klíčová slova text structure
Popis This paper deals with automatic structuring and sentence boundary labelling in natural language texts. We describe the implemented structure tagging algorithm and heuristic rules that are used for automatic or semiautomatic labelling. Inside the detected sentence the algorithm performs a decomposition to clauses and then marks the parts of text which do not form a sentence, i.e. headings, signatures, tables and other structured data. We also pay attention to the processing of matched symbols in the text, especially to the analysis of direct speech notation.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.