V roce 2025 si vědci konečně sáhnou na to, na čem jsme předchozí dva roky pracovali, těší se Jiří Marek a Martin Dvořák z iniciativy EOSC CZ

Česko je blízko uložení prvních dat do Národní datové infrastruktury. Zatímco loni se o úložištích pro strukturovaná data, neboli repozitářích, mluvilo, teď už fyzicky vznikají a brzy budou připravená propojit vědecké komunity napříč Českou republikou. Rok 2024 se v tomto ohledu podle vedoucího Sekretariátu EOSC CZ Jiřího Marka povedl. Souhlasí s tím i datový analytik Martin Dvořák, který jeho výroky dokládá konkrétními čísly.

21. 1. 2025 Lucie Skřičková Martina Čelišová

Bez popisku

Úspěchy roku 2024

Co považujete za největší úspěch roku 2024?

Martin
Že vše funguje, jak bylo plánováno. Projekt IPs EOSC-CZ vytvořil a dále vytváří zázemí, na které Národní repozitářová platforma (NRP) navazuje jako infrastruktura pro ukládání strukturovaných dat. Projekt IPs CARDS do toho vytváří zázemí zejména pro perzistentní identifikátory a metadatovou podporu a chystá se projekt do výzvy OP JAK: Open Science II (OS II). Tento systém do sebe postupně zapadá. Radost mi také dělá aktivní přístup vědecké komunity, která se účastní školení, přispívá podněty a pomáhá formovat ekosystém pro správu dat.

Jirka
Rok 2024 přinesl zásadní posun – projekt NRP získal právní akt a posunul se do fáze realizace, tzn. cca další stovka lidí napříč ČR na EOSC CZ intenzivně pracuje. Téma správy výzkumných dat se pevně etablovalo ve vědeckém prostředí. Např. Grantová agentura ČR (GA ČR) jako další národní poskytovatel zahrnula tuto problematiku do svých výzev, odkazuje na EOSC CZ a plánuje využít i nově vzniklou mapu data stewardů. Ta má podpořit identifikaci a zapojení data stewardů na jednotlivých institucích. 




„Rok 2024 přinesl zásadní posun – projekt NRP získal právní akt a posunul se do fáze realizace, tzn. cca další stovka lidí napříč ČR na EOSC CZ intenzivně pracuje.“

Dá se tedy říct, že výsledky roku 2024 nakonec předčily vaše očekávání?

Jirka
Celé téma je stále poměrně nové, často je nutné přijít s inovativním řešením a nový je i tým, který iniciativu rozvíjí. Takže to, že jsme dokázali zvládnout všechno, co jsme chtěli, je obrovský úspěch. A ten nám vytváří stavební kámen pro rok 2025, kdy už si na to, co budujeme, budou moct vědečtí pracovníci napříč republikou „sáhnout“.

Martin
Já bych to doložil několika čísly. Naší cílovou skupinou je 228 výzkumných organizací, které v ČR evidujeme (dle § 33a zákona č. 130/2002 Sb. o podpoře výzkumu, experimentálního vývoje a inovací).Ty tvoří zejména veřejné vysoké školy, výzkumné ústavy AV ČR, resortní výzkumné organizace, fakultní nemocnice, muzea, galerie apod. Do jednotlivých projektů a jejich přípravy (EOSC-CZ, NRP, CARDS, OS II) je přímo zapojeno již 20 těchto výzkumných institucí, kteří ekosystém pro správu výzkumných dat vytváří.

Když se budeme bavit o členech v pracovních skupinách EOSC CZ, kterých je téměř 500, tak ti jsou spojeni s 70 výzkumnými institucemi! Takže už aktivně komunikujeme a zapojujeme skoro třetinu výzkumných institucí, což je docela dobré!

Zapojení vědecké komunity

Bylo těžké vědecké komunity aktivovat a týmy propojit?

Martin
Na začátku asi ano, ale lidé v pracovních skupinách by logicky měli mít zájem participovat, jednak z hlediska získání aktuálních informací, tak i z hlediska možností ovlivnit směřování iniciativy (projekty, doporučení apod.). Když se budeme bavit o počtech v meziročním srovnání, tak je nárůst členů v PS téměř 100 %. Pracovní skupiny jsou totiž jádrem a hlavním odborným tahounem iniciativy a projektů. Např. PS Metadata měla ke konci roku 2023 70 členů a o rok později má 140, což klade vyšší nároky na řízení a koordinaci, možná i efektivitu z hlediska dodávaných výstupů. Takže budeme muset vymyslet i formu dalšího řízení skupin. Nelze si dát jako cíl, že chceme mít v pracovních skupinách co nejvíce lidí, může to být totiž kontraproduktivní. Chceme mít kvalitní a aktivní členy, kteří přispívají a tvoří prostředí společně.

Jirka
Design je takový, že pracovní skupiny by měly být dlouhotrvající a nezávislé na projektech. A k tomu stoprocentnímu nárůstu – byli jsme před Vánoci v Rakousku na jejich celoročním setkání rakouského EOSCu a tam vyloženě padla otázka: "Jak jste to udělali, že se vám podařilo číslo zdvojnásobit?" Tak za prvé, je tam faktor možnosti zapojit se do připravovaných projektů, a druhá věc je i určité štěstí, kdy toto téma začíná víc a víc rezonovat nejen v českém akademickém prostředí, ale už s daty pracují třeba i prestižní časopisy jako je Nature. Díky tomu se vědecká komunita přirozeně posouvá směrem k intenzivnější správě výzkumných dat.

K tomu přispívá i úsilí tajemníků pracovních skupin, kteří aktivně vyhledávali odborníky v této oblasti po celé republice a motivovali je k zapojení do rozvoje této iniciativy.

Bez popisku





„Když se budeme bavit o počtech v meziročním srovnání, tak je nárůst členů v PS téměř 100 %. Pracovní skupiny jsou totiž jádrem a hlavním odborným tahounem iniciativy a projektů.“


Jakým způsobem jste oslovovali lidi, se kterými jste chtěli spolupracovat? Šlo vždy o osobní kontakt?

Jirka
Z části. Když jsme vytvářeli systém pracovních skupin, začali jsme výzvou k zapojení všech, kdo mají zájem o téma výzkumných dat. Posléze jsme i lidi přímo oslovovali. Postupně jsme zjišťovali, že běžné komunikační kanály nestačí a pro zapojení výzkumníků z dalších českých institucí potřebujeme i osobní kontakt, proto jsme spustili aktivitu EOSC CZ Networking. Při představování konceptů jako Open Science, FAIR Data a správy výzkumných dat jsme kladli otázky: "Máte data stewardy? Nemáte? Potřebujete poradit? Potřebujete školení?"

Martin
V rámci EOSC CZ Networkingu navazujeme hlubší spolupráci s výzkumnými institucemi a vysokými školami přímo na místě. Nejsme jen virtuální platforma, kde si vše musíte dohledat online – aktivně komunikujeme s vědci a celou komunitou osobně. V roce 2024 jsme navštívili univerzity v Olomouci, Liberci, Českých Budějovice a ve Zlíně, a i v roce 2025 plánujeme pokračování těchto setkání. Akce jsou určeny jak pro vědce, tak i pro data stewardy, knihovníky a Open Science metodiky. Často se účastní i zástupci vedení univerzit. To vytváří živou diskusi o místních podmínkách a možnostech správy výzkumných dat, které poté národní řešení vhodně doplňuje.

Jirka
Je opravdu důležité, že na setkání s námi přišli vědci a často i prorektoři, kteří se o iniciativu zajímali a dávali nám podněty, co změnit, a to v oblasti otevřené vědy donedávna nebývalo.


Takže není třeba je přemlouvat?

Jirka
Často už se sami zajímají a chtějí vědět, co to znamená. Snažíme se vysvětlovat, že to, co iniciativa EOSC CZ buduje, budou moct využívat všichni. Takže se nás už ptají: "Dobře, bude to tedy fungovat, ale jak to využijeme my na univerzitě? A to už je oslí můstek k data stewardům, kteří jsou takovými našimi spojkami na různé instituce."








„Nejsme jen virtuální platforma, kde si vše musíte dohledat online – aktivně komunikujeme s vědci a celou komunitou osobně. V roce 2024 jsme navštívili univerzity v Olomouci, Liberci, Českých Budějovice a ve Zlíně, a i v roce 2025 plánujeme pokračování těchto setkání.“

Očekávání pro rok 2025

Jak hodnotíte dopad vašich aktivit z roku 2024 a jaké kroky plánujete dál?

Jirka
V roce 2024 jsme efektivně využili dostupné nástroje k posílení dopadu našich aktivit na vědeckou komunitu. Nyní jsme připraveni na další krok – v roce 2025 umožníme vědcům skutečně využít výsledky práce iniciativy a projektů z uplynulých dvou let.


Dá se tedy říct, že cílem pro rok 2025 je implementace nástrojů pro ukládání dat? A plánujete spuštění už letos?

Jirka
Ano, v druhé polovině tohoto roku. Vše bylo zatím primárně o individuálních vědcích a všech, co měli zájem. Teď se dostáváme do praktické části, a to, jak se správa dat promítne do života institucí a výzkumných oborů jako celků. Mít národní infrastrukturu s možností udělat si repozitáře, do kterých si konkrétní vědec uloží svoje data a bude vědět, jak je popisovat a jak s tím vším pracovat, to je velká věc. A právě to je cílem projektu NRP. V NRP je i další vzdělávací aktivita iniciativy EOSC CZ na principu „Train the Trainers“, tedy vytvoření metodických materiálů a podpory pro osoby pracující na institucích, které poté mohou výzkumníkům pomoci se správou výzkumných dat. Toto vše je také napojeno na Školicí centrum. Všechno je to provázané.

Martin
Celkově jsme už zrealizovali přes dvacet školení, která mají různou návštěvnost, od 20 zájemců na fyzických workshopech po 200 účastníků v onlinu. Čili ten zásah v osloveném publiku je významný. Z hlediska témat pokrýváme jak správu FAIR dat nebo metadata, tak i právní aspekty, otevřená data ve veřejné správě, citizen science, metadata a další. A tohle lidi zjevně zajímá a tento obsah vyhledávají. Účastní se lidé nejenom z akademické obce, ale i zástupci z řad veřejné správy nebo soukromých komerčních podniků. Zatím máme školení převážně v češtině a díky tomu tam chodí hodně zájemců i ze Slovenska. Tam taky mají svůj EOSC a rozvíjí ho. Je skvělé, že díky tomu, že nemáme jazykovou bariéru, můžeme spolupracovat s kolegy i v této oblasti. (pozn. data o školicích aktivitách jsou k dispozici na zde)



„Celkově jsme už zrealizovali přes dvacet školení, která mají různou návštěvnost, od 20 zájemců na fyzických workshopech po 200 účastníků v onlinu.“

Podpora data stewardů

Aktivně podporujete roli data stewarda v české vědecké komunitě, jaké konkrétní kroky podnikáte k jejímu rozvoji?

Martin
Naši komunikátoři ve spolupráci s UX týmem na webu EOSC CZ vytvořili nové stránky, které představují roli data stewarda a možnosti, které tato pozice nabízí. Spouští kampaň zaměřenou na identifikaci data stewardů – vybízíme ty, kteří tuto roli zastávají nebo se jí cítí být součástí ve svých institucích, výzkumných či projektových týmech, aby se přihlásili na mapu data stewardů. Rádi bychom prostřednictvím této interaktivní mapy celé vědecké komunitě řekli, že tady existuje nějaký data steward a vy jako vědečtí pracovníci ho můžete oslovit a poradit se v rámci tématu správy výzkumných dat. Už teď je tam přes 50 data stewardů a přitom to začalo běžet těsně před Vánoci! Data steward nám zde o sobě může prozradit informace jako: oficiální název jeho pozice, v jakém oboru působí, kontakt na něj, může tam mít fotku nebo prozradit, jakou část svého úvazku agendě data stewarda věnuje. To jsou obrovsky cenné údaje, které budeme posléze vyhodnocovat. Obecně je hezké vidět, že ta komunita se nějak zhmotňuje, a to i přesto, že tyto pozice jsou často v rámci institucí neznámé nebo nové.

Jirka
My se tou kampaní snažíme etablovat tyto nové typy pozic. Někde už tyto pozice mají, využívají je a snaží se svoje know-how šířit dál a propojovat další výzkumné týmy napříč republikou. Data stewardů je více druhů, od datového manažera na celé instituci až po ty, kteří jsou velice úzce propojeni s jedním výzkumným týmem. Reflektuje to potřebu oborů. Některé jsou datově náročnější už nyní, některé se do toho teprve dostávají. Mapa by měla fungovat tak, že pokud jsem vědec třeba z Olomouce, vůbec nevím, že se něco děje s daty, a najednou se dozvím, že existuje nějaký EOSC a mapa data stewardů, tak si vyhledám toho svého na svojí instituci a spojím se s ním. Někteří se zaměřují na obecnou podporu, jiní se více specializují, ale často o sobě ví navzájem a když tak vědce správně nasměrují.






„Data stewardů je více druhů, od datového manažera na celé instituci až po ty, kteří jsou velice úzce propojeni s jedním výzkumným týmem. Reflektuje to potřebu oborů. Některé jsou datově náročnější už nyní, některé se do toho teprve dostávají.“

Datové repozitáře a jejich funkce

Můžeme se nyní podívat přímo na téma datových repozitářů? Jaké možnosti aktuálně nabízejí?

Martin
Existuje pilotní národní datový (catch all) repozitář, kde je nahraných v testovacím režimu asi 50 datových sad. Člověk minimálně dostane představu, jaké funkcionality toto uložiště pro strukturovaná data má a jak data mohou vypadat.

Data leží na infrastruktuře v repozitářích a nad ní je metadatový vyhledávač. Takže můžete vyhledat podle tématu, oboru, filtru, názvu nebo autora. Určitě bych netvrdil, že to už je ono, ale rámcovou představu to splňuje. Je zde již možnost vyzkoušet i autorizační a autentizační bránu (AAI) pro přístup k datům. Portfolio nabízených služeb bude v celé Národní datové infrastruktuře mnohem širší.

Jirka
Snažíme se vytvořit prostředí, které vědcům usnadní práci s daty. Využití repozitáře NDI například v budoucnu umožní výrazně zjednodušit správu dat, a to díky možnosti částečné automatizace přípravy Data Management Plánů (DMP) na základě již uložených informací. Národní řešení, které budujeme napříč republikou, zajišťuje efektivitu a jednotnost oproti individuálním přístupům na jednotlivých institucích. Zaměřujeme se na rozvoj lidských zdrojů, etablování data stewardů, budování moderní infrastruktury, včetně repozitářů, a na propojení všech klíčových aspektů. Klíčovým základem NDI je projekt NRP, který odstartoval v roce 2024, a na něj nyní navazuje projekt Open Science II.






„Existuje pilotní národní datový (catch all) repozitář, kde je nahraných v testovacím režimu asi 50 datových sad. Člověk minimálně dostane představu, jaké funkcionality toto uložiště pro strukturovaná data má a jak data mohou vypadat.“

Co přineslo podzimní Sympozium v Berlíně pro rozvoj EOSC a jak se na tom podílí Česko?

Jirka
Na evropské úrovni vstoupil EOSC do tzv. „operational“ fáze, což znamená, že vědci v nejbližší době budou moci konečně nahrávat data, pracovat s výpočty a využívat je v rámci federované infrastruktury. Příkladem, jak by to mohlo celé fungovat je tzv. EOSC EU Node, první z řady „uzlů“ této federované infrastruktury. Do budoucna by tak mělo být díky federovanému přístupu možné např. využití špičkový nástroj pro analýzu žab z jihu Francie, nemusíme jej vytvářet znovu – můžeme jej sdílet a využít. To vše v rámci celé Evropy. Česko se nyní do této fáze rovněž zapojuje. Nejenže držíme krok, ale díky koncentrovanému úsilí iniciativy EOSC CZ a získání financí z projektů přispíváme k budování této infrastruktury. To není v ostatních členských státech obvyklé.

Martin
Doplnil bych, že CESNET jako jedna z institucí národní e-infrastruktury e-INFRA CZ, která se podílí na budování EOSC CZ, je zapojena i do vývoje na evropské úrovni, což nám umožňuje se přímo podílet na směřování i „evropského EOSCu“. Máme tak možnost jako ČR pomoci s tím, jak bude evropská infrastruktura ve finále vypadat. A jedna z hezkých věcí je, že si v zahraničí všimli i naší mapy data stewardů a možná by to mohl být vzor pro celou Evropu.


Takže dokážeme inspirovat. A asi toho bude víc?

Martin
Autorizační a autentizační infrastruktura (AAI) je určitě něčím, čím můžeme v Evropě zaujmout.

Jirka
Jsme také jeden ze států, který se podílí na vývoji data management plánovacích nástrojů, konkrétně nástroj Data Stewardship Wizard, které jsou uznávány např. i programem Horizon Europe.

Výhled do budoucna

Co je výzvou pro následující rok?

Jirka
Chtěl bych, aby se naše pozice v rámci evropského EOSC ještě více upevnila. Už tam jsme, ale rád bych, aby naše zapojení bylo ještě hlubší. Dále bych si přál, aby měli vědci možnost ukládat strukturovaná data a aktivně s nimi pracovat v NRP. Doufám také, že všechny související komponenty Národní datové infrastruktury se začnou vzájemně propoojovat, bude to vidět a aktivity již čtyř národních projektů se vhodně začnou doplňovat.


A co nějaká čísla do budoucna?

Martin
ČR působí podle ČSÚ 39 tisíc lidí, kteří jsou nazvaní jako výzkumní pracovníci ve vládním a vysokoškolském sektoru. Když si dáme dohromady čísla o pracovních skupinách, o lidech, co nám chodí na školení, o těch, co pobírají náš newsletter až po ty, co sledují videa na YouTube od Školicího centra nebo co sledují sociální sítě, tak aktivně komunikujeme se zhruba tisícovkou, celkový zásah pak máme na 3 až 4 tisíce vědeckých pracovníků. Takže informace o FAIR datech, o Open Science a EOSC komunikujeme ke zhruba 5 procentům vědců. Určitě tyhle informace nedostaneme ke všem. Někteří jsou vůči otevřené vědě obecně rezervovaní nebo tyto myšlenky nezastávají. Ale myslím si, že s tím, jak budeme více a více nabízet služby v rámci Národní datové infrastruktuře a obecně možnost spravovat si svá data v zabezpečeném prostředí, tak máme potenciál jít v příštím roce skrz oslovení komunity až na 10, 15, možná i 20 procent. To by znamenalo aktivně promlouvat už k 10 tisícům vědeckým pracovníků v Česku.

Jirka
To, že jsou někteří rezervovaní a nechtějí to, hodně reflektuje jednotlivé obory a to, jak jsou obory datově připraveny. Takže ne že by to někteří nechtěli, ale třeba nevědí, že by to měli dělat anebo to v tom oboru zatím není relevantní. Ale to není věc pro příští rok, to bude trvat minimálně do roku 2028.


Tedy na závěr, jak podle vás bude věda ideálně v nejbližším budoucnu vypadat?

Jirka
Cílem je, aby správa dat pro vědce nebyla "něco, co je nebaví, něco co je obtěžuje". Cílem je, aby sami chtěli strukturovaně data ukládat a viděli potenciál v opakovaném využití svých dat, ať už veřejně tak třeba jen mezi kolegy z laboratoře nebo výzkumného týmu. Cílem digitalizace české vědy skrze správu výzkumných dat je umožnit skutečnou práci s daty, jejich opakované využití a z toho plynoucí znalostní i ekonomické přínosy. Rádi bychom, aby data nebyla využívána pouze akademickou sférou, ale také firmami pro jejich vlastní výzkum, čímž by vznikala nová spolupráce. Samozřejmě vše za podmínek, které si určí vědec samotný, jak už jsme se mohli dočíst v předchozím rozhovoru s hlavním manažerem projektu IPs EOSC-CZ Matejem Antolem.

Na jedné straně potřebujeme vědce, kteří provádějí základní výzkum, budují projekty, spolupráce a publikace, tedy to, co je pro vědeckou komunitu zásadní. Na druhé straně však vytváříme systém, který umožní efektivní využití těchto dat, podpoří inovace a zlepší fungování v České republice. Automatizace procesů pak přispívá k usnadnění každodenní práce vědců i dalších uživatelů.

Martin
V budoucnu nám bude hrát do karet jedna legislativní novinka, a to je Zákon o správě dat a řízeném přístupu k datům.

Rádi bychom vědce, IT specialisty, knihovníky, analytiky a další profese přesvědčili o tom, že je pro ně ta infrastruktura dobrá a že je mnohem bezpečnější, než když si data uloží na svém lokálním disku. K datům se dostane pouze ten, kdo na ně má oprávněný přístup, což zaručuje bezpečnost a dlouhodobou udržitelnost, kterou lokální disky nikdy neposkytnou. Data budou uložena ve třech kopiích – pokud dojde k selhání jednoho místa, zůstávají bezpečně uložena na dalších dvou, což je obrovský benefit. Celé to povede k vyšší reprodukovatelnosti výzkumu, protože vědci budou moci data znovu využít a stavět na nich, což dále posiluje kvalitu vědecké práce.

A kdyby Vám informace z tohoto článku nestačily, tak ještě více toho, co se napříč iniciativou EOSC CZ událo v roce 2024, se budete moci dozvědět v tzv. Evaluační zpráva iniciativy EOSC CZ, která vyjde v lednu 2025 a o které Vás budeme informovat v únorovém Newsletteru.


Mgr. Ing. Jiří Marek


působí jako vedoucí sekretariátu EOSC-CZ, kde zajišťuje implementaci European Open Science Cloud v České republice, a současně zastává pozici Open Science Managera na Masarykově univerzitě. Je jedním z iniciátorů Brněnské Open Source deklarace, která usiluje o vytvoření Národního Open Source Program Office pro veřejný sektor a akademii. Vzdělání má v oboru chemie se specializací na vodíkové technologie a v ICT právu se zaměřením na Open Access, Open Agenda a autorské právo.

Mgr. Martin Dvořák


je datovým analytikem působícím na Sekretariátu EOSC CZ na MU. Vystudoval geografii na PřF MU. Po studiu se věnoval otevřeným datům na datovém oddělení města Brna, kde vedl platformu data. Brno a rovněž v týmu Hlavního architekta e-Governmentu na Ministerstvu vnitra. Věnuje se datovým vizualizacím, reportování, automatizaci dat a monitoringu iniciativy EOSC CZ.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.