Navigace

Fakultní služby


Univerzitní služby

 
Akce dokumentů

Digitalizace publikací FF

spravuje: Vendula HromádkováPoslední změna: Čtvrtek 08.03.2012 08:26

Informace o postupu digitalizace publikací FF

Cíle digitalizace

FF MU hodlá postupně zveřejnit v elektronické formě všechny publikace, které vydala od svého vzniku. Tato produkce zahrnuje:

  • všechny řady Sborníku prací brněnské univerzity (SPFFBU) od jejich vzniku, viz schéma všech řad SPFFBU
  • na ně navazující odborné časopisy (obvykle od r. 2009 nebo 2010)
  • monografickou edici Spisy FF, v níž vycházely monografie, některé sborníky z konferencí ap.
    Edice Spisy Filozofické fakulty Masarykovy univerzity je první ediční řadou, která vznikla na FF. Vycházely v ní především monografické publikace jednotlivých kateder a ústavů FF. Jako první spis v této edici vyšla v r. 1923 publikace od R. Urbánka Jednota bratrská a vyšší vzdělání až do doby Blahoslavovy : příspěvek k 400. výročí narozenin Blahoslavových
    V rámci této edice bylo vydáno také několik prvních čísel seriálů Brno Studies in English, Brünner Beiträge zur Germanistik und Nordistik a Études romanes de Brno (předtím, než byly založeny jejich řady v rámci novější seriálové edice Sborník prací Filozofické fakulty brněnské univerzity); a dále také několik tematických sborníků či sborníků z konferencí (např. Otázky divadla a filmu, Teorie verše, Otázky slovanské syntaxe aj.). Do současné doby v této edici vyšlo zatím 400 publikací.
  • další monografické publikace, edice, periodika, sborníky z konferencí aj.

 

V první fázi proběhla digitalizace SPFFBU (zahájeno 2009, viz níže), v druhé fázi byla zdigitalizována edice Spisy FF MU (léto/podzim 2010), pokračujeme dalšími monografickými publikacemi (byly zdigitalizovány monografie vydané Vydavatelstvím MU v letech 1993-2009), dalšími časopisy FF (např. Opera Slavica), edicemi (např. Litteraria humanitas), sborníky z akcí (např. Colloquia musicologica Brunensia) aj. Současně probíhají práce na pořízení úplného soupisu vydaných publikací.

 

Realizační tým tvoří za FF koordinátorka Mgr. Vendula Hromádková, Mgr. Zdeňka Mácková, Martin Svora, Mgr. Ing. Jiří Rambousek, za Ústav výpočetní techniky MU RNDr. Miroslav Bartošek a tým spolupracovníků. Projekt zastřešuje doc. PhDr. Jana Chamonikolasová, Ph.D., proděkanka pro ediční činnost a IT.

Rutinní zpracování je možné díky pomoci několikačlenného studentského týmu.

Samostatnou akci tvoří digitalizace fotografií z historie FF; nejde o vlastní produkci, ale o dokumenty důležité pro historii fakulty. Těžiště práce zde spočívá v popisu historických fotografií. Ten bude podle možností zjišťován od pamětníků, které realizační tým v brzké době osloví.

Digitalizace SPFFBU a odborných časopisů

 

Ze zchůzky l digitalizaci SPFFBU 21. ledna 2010

Ze schůzky k digitalizaci SPFFBU 21. ledna 2010


Digitalizace všech sborníkových řad byla zahájena r. 2009. Výstupy budou zveřejněny v digitální knihovně založené na systému DSpace.

Poznámka: CIT spustil rutinní provoz systému Open Journal Systems (OJS) pro správu on-line časopisů. Je možné využít jej jak pro čistě elektronické tituly, tak i pro administrativu a redakci stávajících časopisů či pro zveřejnění jejich elektronické verze.
Předpokládá se, že konečná verze tištěné produkce se bude i nadále přenášet do knihovny v DSpace, aby byla přístupná na jednom místě. Podrobnosti se budou upřesňovat podle toho, nakolik a jak bude OJS využíván.

 

Časový průběh

Zkušební provoz byl zahájen na jaře 2009, rutinní zpracování v květnu 2009.

Digitalizace má tyto fáze:

  • vlastní digitalizaci (u časopisů a sborníků rozdělení po článcích, převod skenováním do digitální obrazové podoby, uložení ve formátu pdf, nahrání souborů do metadatového editoru, OCR, automatické úpravy skenů)
  • pořízení metadat – vytváření strukturálních, administrativních a popisných metadat v metadatovém editoru pro různé typy dokumentů a kolekcí; popis každého dokumentu a jeho částí, např. článků (autor, název, další bibliografické údaje); použitý systém umožní pozdější doplnění dalších metadat, jako jsou abstrakt, klíčová slova apod.; zde je prostor pro iniciativu pracovišť či redaktorů jednotlivých řad
  • zveřejnění v systému DSpace: řešení grafického rozhraní pro potřeby FF, hromadný import dat do systému DSpace

Technologie

Skenování (vlastní digitalizace): dokumentový skener s podavačem volných listů; plochý skener pro skenování z předloh, které nelze získat k rozřezání.

OCR (optické rozpoznání znaků) se provádí hromadně systémem na bázi OCR SW FineReader. V daném objemu nelze provádět opravy textů (k tomu viz níže Typy dokumentů a formát vystavení).

Popis článků (tvorba metadat): editor metadat vyvinutý na ÚVT MU a provozovaný na fakultním serveru Oktavo

Zveřejnění: počítá se se systémem DSpace (bezplatně šiřitelný systém vyvinutý na MIT) instalovaným a udržovaným na ÚVT MU. DSpace má všechny vlastnosti moderní digitální knihovny, pro jejich využití je však nutný podrobný popis po jednotlivých článcích. Ten je nejpomalejší částí zpracování. Navíc bylo přijato rozhodnutí, že se budou samostatně popisovat i drobné příspěvky, typicky recenze. Dokončení akce to sice zdrží, využitelnost dat pro budoucnost bude ale mnohem větší.

DSpace umožní nahlížet data buď po kompletních číslech (zobrazí se seznam článků, jak byly v daném čísle řazeny), nebo vyhledávat podle autorů, názvů, klíčových slov apod.

Podobně jako fakultní web, i zde jsou všechna řešení (s výjimkou metadatového editoru vyvinutého na MU) postavena na bezplatné otevřené platformě (DSpace, OJS).

Obr.1 Schéma celého procesu (zpracoval dr. M. Bartošek)

Workflow

[Po kliknutí se schéma zobrazí v plné velikosti.]

Typy dokumentů a formát vystavení

Proces musí počítat se třemi typy dokumentů:

Typ 1: Starší čísla (cca do roku 2002-4) – k dispozici byl jen tištěný exemplář:

Články budou zobrazeny v pdf formátu tak, že zobrazovat se bude naskenovaný obraz, přitom ale bude možno v textu vyhledávat nebo pomocí myši zkopírovat část textu k citaci apod. ( "dvojvrstvé pdf" typu "text pod obrazem"). Nevýhodou tohoto způsobu je, že naskenovaný obraz textu je na pohled "kostrbatější", než by byla počítačová sazba. Převažuje ale výhoda, že formát zaručuje plnou a zřejmou shodu s tištěnou verzí sborníku a do zobrazeného textu nemůže vnést chyby (protože jde o obraz tištěné strany).

"Schovaný pod obrazem stránky" bude přitom k dispozici rozpoznaný elektronický text, který lze kopírovat nebo v něm vyhledávat. Ten však bude jen výsledkem skenování bez oprav; jeho chybovost závisí na povaze a kvalitě skenovaného textu. Na to, že je nutno jej chápat jen jako orientační a pomocný, bude v popisu služby upozorněno.

Provádět ruční korektury všech rozpoznaných textů by – při počtu stran přesahujícím 150 000 – nebylo rentabilní a v projektech tohoto typu to není obvyklé.

Typ 2: Mezidobí mezi 1 a 3 – elektronická verze z DTP sazby se zachovala, ale nezaručuje plnou shodu s vytištěnou verzí.

Zde se rozhoduje individuálně podle situace, často je nejvhodnější zpracovat jako typ 1, tedy skenováním z tištěné verze.

Typ 3: Nejnovější doba – DTP pracoviště fakulty má zachovánu elektronickou verzi plně shodnou s tištěnou.

Odpadá skenování a pdf bude zobrazeno přímo jako elektronický text, což je úspornější, hezčí na pohled a elektronický text neobsahuje žádné chyby (pokud nebyly i v tisku). Nutné je jen rozdělení čísla na články a pořízení metadat.

Dosud realizované kroky

V rámci přípravy a realizace digitalizace proběhly následující kroky:

  • výběr a nákup skeneru (HP Scanjet 7800)

  • zkušební skenování řady klasických studií, stanovení vhodného rozlišené a formátu vystavování 

  • nákup a instalace serveru Oktavo (Dell PE R200)

  • instalace a testování editoru metadat (vytvořena zvláštní instalace s upraveným metadatovým popisem pro potřeby FF)

  • zřízení skenovací místnosti pro studentské vědecké síly (v sousedství studovny D01)

  • oslovení výkonných redaktorů jednotlivých vědeckých časopisů FF (dřívějších sborníkových řad) a s jejich pomocí dohledání všech vydaných čísel; převzetí již dříve naskenovaných čísel a doplnění jejich metadat

  • přesný popis sborníkových řad a jejich návaznosti a přehled jednotlivých ročníků a čísel

  • stanovení jednotné struktury metadatového záznamu

  • speciální problémy: cizojazyčné texty, transliterace; vícejazyčné články; různé typy stránkování...

  • popis recenzí: byla zvolena pracnější varianta popisu jednotlivých recenzích (původně měl blok recenzí v každém čísle tvořit vždy jednu popisovanou jednotku)

  • naskenování všech svazků SPPFBU

  • získání e-verzí nových čísel sborníků a navazujících časopisů

  • postupně se zpracovávají metadatové popisy

  • ve spolupráci s ÚVT se ladí podoba rozhraní pro veřejné vystavení sborníků/časopisů

  • nákup knižního skeneru Plustek OpticBook 4600

  • zdigitalizována edice Spisy FF (396 svazků)

  • digitalizace publikací vydaných Vydavatelstvím MU v letech 1993-2009 (mimo skripta)

  • digitalizace dalších periodik FF

  • slučování duplicitních záznamů publikací v knihovním systému Aleph, probíhá průběžně (systémový knihovník MU)

  • revize bibliografických záznamů Spisů FF v knihovním katalogu (ÚK FF)

  • příprava a stažení bibliografických záznamů Spisů FF ze systému Aleph

  • práce na soupisu autorů a publikací FF - probíhá průběžně

  • čištění autoritní báze v metadatovém editoru

  • digitalizované publikace změřeny a rozměry zadány do metadatového editoru (slouží pro úpravy PDF souborů)

  • vyvinuty a upraveny nástroje pro automatické úpravy naskenovaných souborů

 


Osobní nástroje