Performance analysis and autotuning setup of the cuFFT library

Varování

Publikace nespadá pod Filozofickou fakultu, ale pod Ústav výpočetní techniky. Oficiální stránka publikace je na webu muni.cz.

Název česky Analýza výkonu a autotuning nastavení knihovny cuFFT
Autoři

STŘELÁK David FILIPOVIČ Jiří

Rok publikování 2018
Druh Článek ve sborníku
Konference ACM International Conference Proceeding Series
Fakulta / Pracoviště MU

Ústav výpočetní techniky

Citace
www https://dl.acm.org/citation.cfm?id=3295817
Doi http://dx.doi.org/10.1145/3295816.3295817
Klíčová slova cuFFT; GPU; autotuning; performance analysis; cuFFTAdvisor
Popis Rychlá Fourierova transformace (FFT) má mnoho aplikací. Často je jedním z výpočetně nejnáročnějších kernelů, proto bylo investováno mnoho úsilí do tuningu jejího výkonu na mnoha hardwareových zařízeních. FFT knihovny mají nicméně mnoho možných nastavení a není vždy jasné, jaké z nich použít pro optimální výkon. V praxi můžeme nastavení FFT knihovny často měnit, například můžeme doplnit či oříznout vstupní data. Většina současných prací se překvapivě zaměřuje na otázku jak implementovat rychlou FFT s daným nastavením, ale nevěnuje pozornost otázce jaké nastavení umožní nejrychlejší výpočet. V tomto článku se zaměřujeme na populární knihovnu pro FFT na GPU akcelerátorech -- cuFFT. Analyzujeme chování a výkon cuFFT knihovny s ohledem na velikost vstupu a nastavení plánu. Představujeme také nový nástroj, cuFFTAdvisor, který navrhuje a pomocí autotuningu vyhledává nejlepší nastavení knihovny s danými omezeními na velikost vstupu a nastavení plánu. Experimentálně dokazujeme, že náš nástroj je schopen nabídnout odlišné nastavení transformace, které vede v průměru k 6x zrychlení při použití rychlé heuristiky a 6.9x zrychlení při použití autotuningu.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.