Pattern Recognition-based Statistically Enhanced MT (PRESEMT)

Informace

Projekt nespadá pod Filozofickou fakultu, ale pod Fakultu informatiky. Oficiální stránka projektu je na webu muni.cz.

Logo poskytovatele
Kód projektu
248307
Období řešení
1/2010 - 12/2012
Investor / Programový rámec / typ projektu
Evropská unie
Fakulta / Pracoviště MU
Fakulta informatiky
Spolupracující organizace
Institute for Language and Speech Processing
Gesellschaft zurFörderung angewandter Informatik
Norwegian University of Science and Technology
National Technical University of Athens
Lexical Computing Ltd.

This proposal describes PRESEMT, a flexible and adaptable MT system, based on a language-independent method, whose principles ensure easy portability to new language pairs. This method attempts to overcome well-known problems of other MT approaches, e.g. bilingual corpora compilation or creation of new rules per language pair. PRESEMT will address the issue of effectively managing multilingual content and is expected to suggest a language-independent machine-learning-based methodology. The key aspects of PRESEMT involve syntactic phrase-based modelling, pattern recognition approaches (such as extended clustering or neural networks) or game theory techniques towards the development of a language-independent analysis, evolutionary algorithms for system optimisation. It is intended to be of a hybrid nature, combining linguistic processing with the positive aspects of corpus-based approaches, such as SMT and EBMT.

Publikace

Počet publikací: 14


Předchozí 1 2 Další

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.