Připravit, pozor, start: Chceme podat nový projekt
Projekty a projektové financování jsou aspekty, které posouvají vědu a výzkum kupředu. Úkolem data stewarda je najít průnik mezi potřebami týmu a podmínkami projektů, a díky tomu podpořit jeho úspěšné získání.
V rámci správy výzkumných dat se můžete setkat s různými požadavky grantových agentur, které často obsahují i Data Management plány (DMP). Pro snadnější orientaci v jejich požadavcích se můžete podívat do tabulky, která shrnuje nároky na DMP dle jednotlivých projektů a poskytovatelů financí.
Máme projekt: Výzvy, které vás čekají
Jednou z nich je Data Management Plan, díky kterému je možné předejít spoustě potencionálních problémů později v projektu. Naštěstí existuje několik nástrojů, které vás tvorbou DMP provedou. Můžete využít například Data Stewardship Wizard, případně můžete vyzkoušet DMPOnline nebo jakoukoliv obecnou šablonu DMP.
V průběhu projektu budete také řešit otázku dlouhodobého uložení výzkumných dat, které v projektu vzniknou. Se správným výběrem vám může pomoci databáze repozitářů re3data. Nejlépe data ukládejte do oborových repozitářů, které by měly být uzpůsobeny pro váš specifický typ dat. Pokud vhodný oborový repozitář nenajdete, zvažte využití institucionálního repozitáře vaší instituce. A pokud ani ten není k dispozici, lze využít i obecné repozitáře jako je český Data Repo (spuštěn v pilotní verzi) nebo mezinárodní platforma Zenodo.
S výběrem repozitáře narazíte na metadatové a další standardy. S těmi vám pomůže FAIRsharing. Díky bohatým metadatům, standardizovanému názvosloví a jasné struktuře dat zajistíte to, že vašim datům budou rozumět kolegové po celém světě.
Po spuštění projektu se o slovo začnou hlásit první data. Ty potřebujeme někam ukládat a případně zpracovávat. S tím vám pomohou služby e-INFRA CZ (zde participují organizace CESNET, IT4Innovation a CERIT-SC), speciálně pro citlivá data existuje řešení Sensitive Cloud. Pokud plánujete zpracování velkých dat, je nutné se dopředu zamyslet, jak velké výpočetní zdroje budete potřebovat. Škála služeb e-INFRA je široká a některé služby jsou dostupné výzkumníkům, studentům a akademickým pracovníkům zdarma. Některé (např. výpočty na velkokapacitním počítači IT4I) vyžadují žádost o projekt a tento proces schválení může trvat.
Hlásí se o slovo oborové specifikace?
Modifikujte si svůj toolkit podle svých oborových potřeb. V závislosti na vaší oborové specifikaci vám mohou pomoci různé typy nástrojů. Pro zpracování a čištěné dat je častou volbou jazyk R nebo Python. Pokud na to váš počítač nemá dostatečné kapacity, můžete využít v MetaCentrum Grid PBS nebo Jupyter Notebook, nebo můžete například využít open source nástroj OpenRefine. Dále se vám mohou hodit například:
- Laboratorní deníky (ELN)
ELN je digitální nástroj pro systematické zaznamenávání, organizaci a sdílení výzkumných poznámek, experimentů a dat v rámci vědecké práce. - Soubor nástrojů pro humanitní obory
Pokud působíte v humanitních oborech, zde naleznete výčet nástrojů, které vám mohou být ve vaší práci prospěšné. - Práce s obrazovými daty z mikroskopů
Komunita zabývající se mikroskopy, daty z mikroskopů a zpracováním vědeckých obrazových dat vyvinula set nástrojů a návodů, která jsou představena například v článcích publikovaných v Nature Methods (2021) a Nature Methods (2023). Mimo nástroje na nastavování metadat jsou součástí i checklisty pro publikování obrazových dat, obrázků/vizualizací a softwaru/skriptů pro zpracování dat. Část toho je shrnuta v tomto Jupyter Booku. - Další open source nástroje a tipy
Další tipy a návody v open source prostředí pak najdete například na Galaxy Community Hub nebo WorkflowHub.

Blížíme se k cíli: Máme data k publikování
Projekt byl zdárně dokončen, výzkumné výstupy publikované a nyní je čas vzniklá data zabalit, opatřit bohatými metadaty a dlouhodobě uložit pro případné další využití a referenci. Z toho důvodu je nutné se vrátit k vašemu již dříve vybranému repozitáři, který využijete pro nahrání a dlouhodobému uložení vašich dat. Díky možnosti volby licencí si také můžeme nastavit, kdo vaše data uvidí a za jakých podmínek je může použít. Nyní jsou vaše data v bezpečí a měla by být v souladu s FAIR principy. Poslední kontrolu můžete provést tady.
Tři tipy za závěr:
- Pokud hledáte další prostředí open science, vyzkoušejte osf.io.
- Pro stručný přehled nástrojů si pak uložte stránku služeb na našem webu eosc.cz.
- Pokud vás nebo někoho z vašeho týmu trápí otázky ohledně právních aspektů či publikování, obraťte se na vaše open science metodiky. Ti vám pomůžou najít správnou cestu v dalších otázkách. Klíčové hráče vám pomůžeme najít v druhém dílu našeho seriálu.
Stavte svůj toolkit podle 7 fází životního cyklu dat
Můžete zkusit jiný přístup a sestavit si svůj toolkit podle životního cyklu výzkumných dat. Tento přístup vám umožní zaměřit se na konkrétní potřeby dat v jednotlivých etapách – od plánování až po jejich znovuvyužití.
- Plánování
Víte, jakým způsobem budete s vašimi daty pracovat během projektu a po něm? Jak zajistíte, že data budou reprodukovatelná? V této fázi odpovídáte na tyto a další otázky. - Sběr
U sběru dat se podívejte na kontrolu kvality dat, právní a etické požadavky, které je potřeba dodržovat. - Zpracování
Při zpracovávání dat musíte dbát na jejich zabezpečení. Při zpracování je nutné k datům doložit správnou dokumentaci, vhodně data organizovat, přiřazovat jim strukturu a celkově o ně pečovat. - Analýza
Monitoring a kontrola tu hraje klíčovou roli. - Uchování
Rozhodnutí, kam a jak uložit data jsou nejdůležitější výzvou v této fázi životního cyklu dat. Při výběru repozitáře je dobré se zaměřit na to, zda uložiště/repozitář splňuje veškeré nároky na uložení a sdílení dat. - Sdílení
U sdílení dat je nutné nastavit správný přístup k datům. Při zveřejňování pak nezapomeňte zkontrolovat, zda jsou data v souladu s FAIR principy. Následně probíhá přidělení PID a licence. - Znovuvyužití
Znovuvyužití dat lze zajistit jejich správnou dostupností, kvalitními metadatovými popisy a dalšími kroky uvedenými v životním cyklu dat. Díky tomu může věda neustále postupovat vpřed.

Sledujte náš seriál
Nezmeškejte další díl našeho seriálu Strážci dat: Mise FAIR – sledujte nás na sociálních sítích a buďte mezi prvními, kdo se dozví o zveřejnění dalšího dílu.