RapCor, Francophone Rap Songs Text Corpus

Název česky RapCor, frankofonní korpus textů rapových písní
Autoři

PODHORNÁ-POLICKÁ Alena

Rok publikování 2020
Druh Článek ve sborníku
Konference Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2020
Fakulta / Pracoviště MU

Filozofická fakulta

Citace
www online version
Klíčová slova French; text processing; rap music; hip hop; lyrics; substandard; neology; written orality; corpus building
Přiložené soubory
Popis Článek představuje rapový korpus RapCor, což je specifický textový korpus pro francouzštinu, založený na textech frankofonních rapových písní z posledních tří desetiletí, kdy se rap stal jedním z nejpopulárnějších hudebních žánrů. Ve shrnutí více než desetiletého budování rapového korpusu jsou představeny hlavní motivace, metody zpracování textu, rozhodovací procesy při anotaci, ale i dosažené úspěchy a problematická témata. Publikovaná část korpusu pro mezioborový výzkum je dostupná skrze korpusový manažer Sketch Engine, kde je označena jako RapCor 1288 (skládá se totiž z 1288 textů, 709 057 slov, frankofonních raperů). Lze jej využít především k detekci a pozorování difúze takzvaných „identitárních neologismů“, tj. výrazů vycházejících z komunikace mezi vrstevníky, motivovaných hledáním příslušnosti ke skupině, hravostí a expresivitou. Jazyk rapu je také cenným zdrojem pro zkoumání metafor a resemantizovaných výrazů. Hlavním cílem tohoto jazykového korpusu převážně substandardní francouzštiny je možnost pozorování fonemických a sémantických inovací a trendů v moderní francouzštině.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.