Semantics of Token Positions in Sentences

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Autoři

BAISA Vít

Rok publikování 2019
Druh Článek ve sborníku
Konference Slavonic Natural Language Processing in the 21st Century
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Klíčová slova token position; histogram; clustering; semantics; corpus linguistics; distributional semantics
Popis This paper analyses absolute positions of Czech and English words in sentences. It shows that even this simple statistics provides some insight into semantics of the words. When the absolute position distribu- tions are represented as matrices and clustered the resulting hierarchy reveals semantic relations between the words.

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.