#5 Nástroje, které zkrotí datový vesmír:
Toolkit superhrdiny

Sestavte si vlastní toolkit, díky kterému budete krotit datový vesmír na vaší instituci nebo ve vašem projektu, ať už jste univerzitní, oborový nebo týmový data steward. Na následujících řádcích najdete pár příkladů a tipů na místa, kde hledat vhodné nástroje a služby.

Připravit, pozor, start: Chceme podat nový projekt

Projekty a projektové financování jsou aspekty, které posouvají vědu a výzkum kupředu. Úkolem data stewarda je najít průnik mezi potřebami týmu a podmínkami projektů, a díky tomu podpořit jeho úspěšné získání.

V rámci správy výzkumných dat se můžete setkat s různými požadavky grantových agentur, které často obsahují i Data Management plány (DMP). Pro snadnější orientaci v jejich požadavcích se můžete podívat do tabulky, která shrnuje nároky na DMP dle jednotlivých projektů a poskytovatelů financí.

Máme projekt: Výzvy, které vás čekají

Jednou z nich je Data Management Plan, díky kterému je možné předejít spoustě potencionálních problémů později v projektu. Naštěstí existuje několik nástrojů, které vás tvorbou DMP provedou. Můžete využít například Data Stewardship Wizard, případně můžete vyzkoušet DMPOnline nebo jakoukoliv obecnou šablonu DMP.

V průběhu projektu budete také řešit otázku dlouhodobého uložení výzkumných dat, které v projektu vzniknou. Se správným výběrem vám může pomoci databáze repozitářů re3data. Nejlépe data ukládejte do oborových repozitářů, které by měly být uzpůsobeny pro váš specifický typ dat. Pokud vhodný oborový repozitář nenajdete, zvažte využití institucionálního repozitáře vaší instituce. A pokud ani ten není k dispozici, lze využít i obecné repozitáře jako je český Data Repo (spuštěn v pilotní verzi) nebo mezinárodní platforma Zenodo.

S výběrem repozitáře narazíte na metadatové a další standardy. S těmi vám pomůže FAIRsharing. Díky bohatým metadatům, standardizovanému názvosloví a jasné struktuře dat zajistíte to, že vašim datům budou rozumět kolegové po celém světě.

Po spuštění projektu se o slovo začnou hlásit první data. Ty potřebujeme někam ukládat a případně zpracovávat. S tím vám pomohou služby e-INFRA CZ (zde participují organizace CESNET, IT4InnovationCERIT-SC), speciálně pro citlivá data existuje řešení Sensitive Cloud. Pokud plánujete zpracování velkých dat, je nutné se dopředu zamyslet, jak velké výpočetní zdroje budete potřebovat. Škála služeb e-INFRA je široká a některé služby jsou dostupné výzkumníkům, studentům a akademickým pracovníkům zdarma. Některé (např. výpočty na velkokapacitním počítači IT4I) vyžadují žádost o projekt a tento proces schválení může trvat.

Hlásí se o slovo oborové specifikace?

Modifikujte si svůj toolkit podle svých oborových potřeb. V závislosti na vaší oborové specifikaci vám mohou pomoci různé typy nástrojů. Pro zpracování a čištěné dat je častou volbou jazyk R nebo Python. Pokud na to váš počítač nemá dostatečné kapacity, můžete využít v MetaCentrum Grid PBS nebo Jupyter Notebook, nebo můžete například využít open source nástroj OpenRefine. Dále se vám mohou hodit například:

  • Laboratorní deníky (ELN)
    ELN je digitální nástroj pro systematické zaznamenávání, organizaci a sdílení výzkumných poznámek, experimentů a dat v rámci vědecké práce.
  • Soubor nástrojů pro humanitní obory
    Pokud působíte v humanitních oborech, zde naleznete výčet nástrojů, které vám mohou být ve vaší práci prospěšné.
  • Práce s obrazovými daty z mikroskopů
    Komunita zabývající se mikroskopy, daty z mikroskopů a zpracováním vědeckých obrazových dat vyvinula set nástrojů a návodů, která jsou představena například v článcích publikovaných v Nature Methods (2021)Nature Methods (2023).​ Mimo nástroje na nastavování metadat jsou součástí i checklisty pro publikování obrazových dat, obrázků/vizualizací a softwaru/skriptů pro zpracování dat. Část toho je shrnuta v tomto Jupyter Booku.
  • Další open source nástroje a tipy
    Další tipy a návody v open source prostředí pak najdete například na Galaxy Community Hub nebo WorkflowHub.
Růžová postavička s černým kloboukem ukazuje na obrazovku s různými ikonami a texty, které symbolizují různé digitální nástroje a data.

Blížíme se k cíli: Máme data k publikování

Projekt byl zdárně dokončen, výzkumné výstupy publikované a nyní je čas vzniklá data zabalit, opatřit bohatými metadaty a dlouhodobě uložit pro případné další využití a referenci. Z toho důvodu je nutné se vrátit k vašemu již dříve vybranému repozitáři, který využijete pro nahrání a dlouhodobému uložení vašich dat. Díky možnosti volby licencí si také můžeme nastavit, kdo vaše data uvidí a za jakých podmínek je může použít. Nyní jsou vaše data v bezpečí a měla by být v souladu s FAIR principy. Poslední kontrolu můžete provést tady.

Tři tipy za závěr: 

  1. Pokud hledáte další prostředí open science, vyzkoušejte osf.io.
  2. Pro stručný přehled nástrojů si pak uložte stránku služeb na našem webu eosc.cz.
  3. Pokud vás nebo někoho z vašeho týmu trápí otázky ohledně právních aspektů či publikování, obraťte se na vaše open science metodiky. Ti vám pomůžou najít správnou cestu v dalších otázkách. Klíčové hráče vám pomůžeme najít v druhém dílu našeho seriálu.

Stavte svůj toolkit podle 7 fází životního cyklu dat

Můžete zkusit jiný přístup a sestavit si svůj toolkit podle životního cyklu výzkumných dat. Tento přístup vám umožní zaměřit se na konkrétní potřeby dat v jednotlivých etapách – od plánování až po jejich znovuvyužití.

  1. Plánování
    Víte, jakým způsobem budete s vašimi daty pracovat během projektu a po něm? Jak zajistíte, že data budou reprodukovatelná? V této fázi odpovídáte na tyto a další otázky.
  2. Sběr
    U sběru dat se podívejte na kontrolu kvality dat, právní a etické požadavky, které je potřeba dodržovat.
  3. Zpracování
    Při zpracovávání dat musíte dbát na jejich zabezpečení. Při zpracování je nutné k datům doložit správnou dokumentaci, vhodně data organizovat, přiřazovat jim strukturu a celkově o ně pečovat.
  4. Analýza
    Monitoring a kontrola tu hraje klíčovou roli.
  5. Uchování
    Rozhodnutí, kam a jak uložit data jsou nejdůležitější výzvou v této fázi životního cyklu dat. Při výběru repozitáře je dobré se zaměřit na to, zda uložiště/repozitář splňuje veškeré nároky na uložení a sdílení dat.
  6. Sdílení
    U sdílení dat je nutné nastavit správný přístup k datům. Při zveřejňování pak nezapomeňte zkontrolovat, zda jsou data v souladu s FAIR principy. Následně probíhá přidělení PID a licence.
  7. Znovuvyužití
    Znovuvyužití dat lze zajistit jejich správnou dostupností, kvalitními metadatovými popisy a dalšími kroky uvedenými v životním cyklu dat. Díky tomu může věda neustále postupovat vpřed.
Diagram znázorňující životní cyklus dat v modrém kruhu s ikonami a texty v češtině, zahrnující fáze jako plánování, sběr, zpracování, analýza, uchování, sdílení a znovuvyužití.

Sledujte náš seriál

Nezmeškejte další díl našeho seriálu Strážci dat: Mise FAIR – sledujte nás na sociálních sítích a buďte mezi prvními, kdo se dozví o zveřejnění dalšího dílu.

LinkedIn X (Twitter)

 #1 Cesta data stewarda: Kdo je datový superhrdina?

#1 Cesta data stewarda: Kdo je datový superhrdina?

První díl seriálu vás provede světem data stewardů – klíčových hráčů moderního výzkumu. Objevíte, co vlastně role data stewarda obnáší, jak podporuje vědecké týmy i to, jak se jím můžete stát.

 #2 Data steward očima vědce: Hledáme klíčového hráče

#2 Data steward očima vědce: Hledáme klíčového hráče

Druhý díl seriálu vám ukáže, proč jsou data stewardi v dynamickém prostředí moderní vědy nepostradatelnými spojenci, kteří pomáhají výzkumníkům soustředit se na to nejdůležitější – samotný vědecký objev!

#3 Skrytí strážci dat: Kde je hledat?

#3 Skrytí strážci dat: Kde je hledat?

Třetí díl seriálu vás zavede do míst, kde můžete najít svého data stewarda, a poradí, jak efektivně hledat nebo vytvořit pozici, která vám pomůže dosáhnout vědeckých cílů na vaší instituci.

#4 Odstartuj svou cestu data stewarda: Školení na míru  

#4 Odstartuj svou cestu data stewarda: Školení na míru

Ve čtvrté epizodě se podíváme na různé možnosti vzdělávání, připomeneme manuál pro začínající data stewardy a zaměříme se na to, jak vytvořit podporující prostředí pro jejich práci.

 #5 Nástroje, které zkrotí datový vesmír: Toolkit superhrdiny

#5 Nástroje, které zkrotí datový vesmír: Toolkit superhrdiny

Sestavte si vlastní toolkit, díky kterému budete krotit datový vesmír na vaší instituci nebo ve vašem projektu, ať už jste univerzitní, oborový nebo týmový data steward. Na následujících řádcích najdete pár příkladů a tipů na místa, kde hledat vhodné nástroje a služby.

#6 Komunita data stewardů: Sdílejte a spolupracujte!

#6 Komunita data stewardů: Sdílejte a spolupracujte!

Přidejte se k rostoucí komunitě data stewardů, která mění způsob, jakým spravujeme vědecká data.

Předchozí Následující

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.