Tereza Motalová
pracuje jako metodička výzkumu a správy dat na UPOL. Zároveň působí jako datová manažerka ve dvou výzkumných projektech. Kurz na data stewarda ve Vídni úspěšně absolvovala v akademickém roce 2023/24.
Foto: UPOL
Nakládání s daty je velmi individuální, v každém oboru to půjde jinak, ale vždycky to musí dávat smysl, shodují se data stewardi Tereza Motalová a Martin Schätz.
Data steward - pro většinu lidí možná povolání, pod kterým si těžko představí něco konkrétního. Jenže v posledních letech se právě péče o data stává velkým trendem a taky nutností. Je to totiž zásadní prvek v Národní repozitářové platformě. Tam se zatím pilotně ukládají a řízeně zveřejňují výzkumná data – zjednodušeně proto, aby vědci zbytečně nezkoumali to, na co už přišli jiní, a naopak mohli na již udělanou práci navázat. A jak se stát data stewardem? Vhodné je přihlásit se na kurz. Jeden z nejuznávanějších pořádá univerzita ve Vídni od roku 2022. Od té doby jím prošly desítky zájemců z celého světa, mezi nimi i Tereza Motalová z Univerzity Palackého v Olomouci. A jinými, tentokrát českými kurzy zaměřenými na data stewardship si zase prošel Martin Schätz z VŠCHT v Praze. Společně se snažili shrnout vše, co o této profesi vědí, a taky popsali svoji cestu k práci data stewardů. O tom, že je celá problematika ukládání a sdílení výzkumných dat na samém počátku, svědčí i to, že i oni sami byli zvědaví na to, jakou zkušenost má ten druhý.
Martin
Nad touto otázkou jsem se zamýšlel, protože jsem kurzů zaregistroval víc a i já sám jsem se více kurzů účastnil. Pro mě ten nejvýznamnější v Evropě je skutečně asi ten, který pořádá Vídeň. Je to dvousemestrální kurz, který stojí 3000 EUR. Ten jsem ale já neabsolvoval.
Tereza
Ten jsem absolvovala já.
Martin
To jsem si myslel, že se takhle hezky doplníme! To, co jsem absolvoval já, nebyl přímo kurz zaměřený na data stewarda, ale Data Stewardship kurz vytvořený v rámci DocEnhance grantu. Ten má více za cíl vzdělávat vědce na začátku kariéry tak, aby zvládli základní úkony spojené s ukládáním dat. Na věci kolem data stewardshipu jsem se ptal tak vehementně, že mi na univerzitě řekli: "My nevíme, tady je kurz, přihlas se." A pak jsem se zase ptal tolik, že mi řekli: "Ty toho víš víc než my, pojď tam rovnou učit." Takže jsem první kurz v roce 2021 absolvoval zároveň jako vyučující pro tvorbu data management plánu a zároveň i jako student. Na VŠCHT letos bude čtvrtý nebo pátý ročník, teď se bude rozjíždět, a naše data stewardy bereme právě z tohoto kurzu. První rok to absolvují, druhý se zúčastní jako vyučující a pak si je ještě doškolíme v praktické části. Ale není to tak, jak ve Vídni, kde člověk dostane po absolvování kurzu certifikát. Je to tak?
Tereza
Je to tak, ano.
Martin
Oficiální papír, to se mi líbí. A další kurz, o kterém vím a ze kterého mám velkou radost, je náš český Data steward kurz pod Filosofickou fakultou UK. Ten beru jako velmi přínosný pro naše prostředí a doufám, že bude dál pokračovat. A sám jsem ještě absolvoval kurz Train the trainer (FAIRsFAIR), kde nás učili, jak školit a jak přemýšlet o vytvoření tréninku pro data stewardy. To bylo v roce 2021 a bylo to tehdy zadarmo. V Evropě byl totiž tehdy obrovský boom. Ale mám pocit, že tenhle kurz je stále k dispozici zadarmo na moodle platformě velkého evropského EOSC.
Tereza
Co se týče mojí cesty, tak ta byla poměrně divoká. V rámci projektu, který běžel u nás na Univerzitě Palackého, najednou začala vznikat potřeba navazujících projektů. To znamená psaní projektových přihlášek a žádostí s tím, že jsme chtěli cílit na výzkumný a inovační program Horizon Europe. Tím jsme otevřeli velkou, v uvozovkách, Pandořinu skříňku s názvem Open Science a Research Data Management. Moje cesta tak byla od administrátora projektu po datového manažera, nebo spíš lépe řečeno Open Science koordinátora. Materiálů a kurzů v té době a ještě i dnes je stále velké množství. Jenže je složité vyznat se v tom, co se pro koho hodí. Mně osobně tu chybělo něco, co by bylo zaměřené na data stewarda tak, jak se o té pozici obecně mluví. Pamatuju si, že jsem narazila na ten kurz ve Vídni, ale odradila mě cena. Aha! Tak to asi nebude pro mě průchozí. Už tehdy to bylo kolem 3000 EUR. V mém případě to ale naštěstí pokračovalo tak, že informaci o tomto kurzu později obnovil Matyáš Hiřman, který se ho účastnil za Karlovu univerzitu. A já shodou okolností byla hned ve dvou projektech od Horizon Europe, díky kterým přišla i možnost financování kurzu. Tím, že jsem měla na starosti správu dat a stále mám, mohla jsem se kurzu zúčastnit.
„A další kurz, o kterém vím a ze kterého mám velkou radost, je náš český Data steward kurz pod Filosofickou fakultou UK. Ten beru jako velmi přínosný pro naše prostředí a doufám, že bude dál pokračovat.“
Tereza
Každý rok mají vyhlášené období, během kterého je možné se přihlásit, a pak si vybírají, koho na ten kurz vezmou. Já jsem jej absolvovala v akademickém roce 2023/24. Kurz je založený na pěti základních modulech, představujících různé oblasti, které by každý data steward měl znát. První modul se zaměřuje na základy Open Science a Research Data Management, naťukává ta nejzákladnější témata. Druhý modul představuje základy IT a Data Science, kde se představují základy databází, programování, verzování nebo unix shellu. Z mého pohledu byl nejzásadnější modul třetí, který je zaměřený na FAIR data v průběhu jejich životního cyklu, od plánování, organizování dat, jejich zpracování, dokumentování, přes ukládání a dlouhodobé uchování, i to, jak se o data mám starat z hlediska bezpečnosti, osobních údajů až po jejich publikování nebo případně jejich znovupoužití včetně právních aspektů. Součástí byly zároveň podmoduly, které se zaměřily na společenské vědy, humanitní vědy, technické vědy a přírodní vědy, takže takové nakouknutí, jak to může fungovat v různých oborech. Předposlední modul byl zaměřený na vzdělávání, servis a podporu, které data steward poskytuje výzkumníkům. A posledním modulem je projekt. Finišujete ten kurz tím, že si zvolíte vlastní téma, zvolíte si supervizora, domluvíte se a výstupem má být třeba koncept nějakého kurzu. Současně o svém projektu píšete report. Co se týče hodnocení, není to tak, že byste za každým modulem procházeli testem, ale většina modulů je postavena na takzvaných assignmentech, kdy dostanete úkol nebo konkrétní zadání, které máte do určitého termínu odevzdat. Je tam škála určitých bodů, které můžete získat, a na základě bodů z assignmentů i projektu se generuje celková známka a získáváte certifikát. V rámci evropského prostoru to bude jediný certifikovaný kurz, který je aktuálně k dispozici.
„Kurz je založený na pěti základních modulech, představujících různé oblasti, které by každý data steward měl znát.“
Tereza
Kurz je na dva semestry. První modul běží týden ve Vídni, kdy tam opravdu fyzicky jste a seznamujete se s prostředím i s ostatními účastníky, aby to nebylo úplně anonymní. Další moduly pak běží online vždy dva dny v měsíci. Vycházelo to na čtvrtek a pátek.
Martin
DocEnhance kurz nejde tolik do hloubky, ale to, čím člověk prochází, je podobné. Je rozdělený na tři části, první část je samostudium, kdy se student seznamuje s FAIR principy, co to je Open Science nebo jak publikovat data. Z každé části absolvuje malý kvíz. Na závěr prvního modulu dělá online zkoušku a dostane oficiální potvrzení o tom, že znalostmi prošel. Druhý modul už je praktický. Účastníci dostanou za úkol třeba sestavit Data Management plán na bázi svého výzkumu a zjistit, proč publikovat nebo nepublikovat data, řeší licencování nebo archivaci. Třetí modul je zaměřený na komerční sektor. Oslovíme nějaké firmy a ty nám ukážou, jak pracují s daty, k čemu jim to může být. Absolvent kurzu pak má širší představu o tom, v čem je správa dat relevantní. Je to mnohem rychlejší, za semestr se dají všechny tři moduly v pohodě stihnout. Absolvent kurzu ale není hotový data steward. Spíš je to někdo, kdo má o trochu hlubší zkušenost se správnou dat a Open Science a má představu o nárocích ve svém specifickém vědním oboru. A vždy se zaměřením spíše na ten obor, ve kterém se aktuálně pohybuje.
Tereza
Kurz jsem absolvovala v rámci své pozice. Na výuce ve Vídni jsem byla v rámci pracovní cesty a online výuka běžela v rámci pracovní doby. Čas navíc jsem pak potřebovala hlavně na zpracovávání assignmentů a projektu. Ne vždy to šlo zkombinovat s pracovními povinnostmi, takže na to nějaké večery a víkendy padly.
Martin
Data stewardship kurz je koncipovaný tak, že by jej člověk měl zvládat vedle něčeho jiného. Ale záleží i na znalostech. Mně první modul zabral tři odpoledne, ale pro někoho jiného to mohly být klidně dva týdny. Co se týče modulu dva, tak ten má šest částí a zabral mi tak tři hodiny času týdně.
Tereza
Ještě upřesním, že u těch assignmentů to určitě nebyl jen jeden úkol za jeden modul. Modul se skládal z pěti až šestnácti podmodulů a i assignmentů bylo několik. Některé jednodušší, jiné složitější. Právě třetí modul byl složený z šestnácti částí a bylo potřeba odevzdat pět assignmentů, takže to dalo celkem zabrat.
„Data stewardship kurz je koncipovaný tak, že by jej člověk měl zvládat vedle něčeho jiného. Ale záleží i na znalostech.“
Tereza
Vídeň začala v první polovině října a výuka běžela až do června včetně odevzdání assignmentů. Deadline pro odevzdání projektu byl třetí týden v červenci. V září přišla zpráva, že jsme obdrželi známku za projekt a že mi certifikát bude poslaný začátkem října. Takže ano, dá se říct, že u vídeňského kurzu to trvá rok.
Martin
Kdybych měl odhadnout, jak dlouho by mi trvalo dostat se do té pozice jako z kurzu ve Vídni, ale bez kurzu ve Vídni, tak bych to viděl na zhruba rok a půl. Ostatní kurzy jsou zaměřené trošku jinak, takže je potřeba nasbírat ještě i praktické zkušenosti.
Martin
Pro data stewarda, který působí pro celou instituci, je nejlepší cestou absolvovat kurz ve Vídni. Potřebuje mít přehled o více oborech a vlastně o všem, co se na univerzitě dělá. Kdežto ten druhý kurz, kterému můžeme říkat Úvod do data stewardshipu, tím, že je zaměřený specificky na to, co dělá vědec, tak se bude více hodit pro fakultního a týmového data stewarda. Ale toho fakultního ještě budeme muset trochu dovzdělat.
Tereza
Vidím to podobně. Kurz z Vídně bych doporučila někomu, kdo vyloženě chce pracovat na téhle pozici. Může sedět jak na centrále, tak i na fakultě. U mě to bylo komplikovanější. Ale i přesto, že jsem na kurz šla z pozice data manažera dvou výzkumných projektů, přišlo mi to pro mou práci vhodné. Mně osobně pomohl kurz se v tomto oboru trochu víc usadit a tím, jak šla moje cesta celkem organicky a divoce, tak jsem s tímto kurzem konečně nabyla určité jistoty, že jdu směrem, který je správný.
Martin
Já vidím jako strašně důležité, že je ve Vídni i ta část poskytování služeb. Jenom se naučit, jak se v této pozici chovat a co nabízet, je u této práce zásadní, a to ten můj kurz nenabízí.
„Pro data stewarda, který působí pro celou instituci, je nejlepší cestou absolvovat kurz ve Vídni. Potřebuje mít přehled o více oborech a vlastně o všem, co se na univerzitě dělá.“
Martin
V téhle chvíli je tak obrovský nedostatek kurzů, že všichni, co zjistili, že něco takového potřebují, se snaží do kurzů dostat. Kdo by měl jen okrajový zájem, tak bude asi hodně ubit všemi, co kurz opravdu potřebují. Ale vidím pozitivně, že se to posouvá, otevírají se nové kurzy, existuje komunita data stewardů, kterou založil Matyáš Hiřman z UK, posouvá se to dopředu.
Tereza
Kdybych měla shrnout skladbu svých spolužáků, tak většinou všichni nějak řešili na své instituci správu výzkumných dat. Někdo byl přímo z data steward kanceláře či ze sítě data stewardů, která funguje právě například ve Vídni. Tam je koordinátor, který má pod sebou síť fakultních data stewardů, a někteří z nich se v tomto kurzu také školí. Někdo byl zase z Open Science týmů, někdo z podpory výzkumu obecně. Ale vesměs to byli lidé, kteří mají správu dat spojenou se svojí současnou pracovní pozicí. A byli z celého světa, i z USA a Japonska.
„Pro data stewarda, který působí pro celou instituci, je nejlepší cestou absolvovat kurz ve Vídni. Potřebuje mít přehled o více oborech a vlastně o všem, co se na univerzitě dělá.“
Martin
To je pořád hodně živá otázka. Určitě jsme ještě v roce 2021 neměli řečeno, co to vlastně data steward u nás v ČR je a co by měl dělat. Jeho role a to, co je od něj potřeba, asi bylo víceméně jasné, ale pozice jako taková ještě nebyla ukotvená. Všechno se začalo ujasňovat až díky vzniku EOSCu a díky tomu, že bylo potřeba se nějakým způsobem zorganizovat. Asi se ani neodvážím tipovat, kolik data stewardů by bylo potřeba. Ale každá instituce nebo vysoká škola by měla mít někoho, na koho se vědci můžou obrátit a kdo je schopný je nasměrovat správným směrem. To by mělo být takové minimum. Optimální by bylo, ale to se nejspíš stane až za mnoho a mnoho let, že každá výzkumná skupina bude mít týmového data stewarda, který bude vzdělaný a bude vědět, co a jak.
„Každá instituce nebo vysoká škola by měla mít někoho, na koho se vědci můžou obrátit a kdo je schopný je nasměrovat správným směrem.“
Martin
Na VŠCHT máme institucionálního data stewarda a pak máme čtyři fakultní. Nejsou ještě zaměření na specifickou fakultu, ale jsou. Co se týče Univerzity Karlovy, tam funguje pod knihovnou Open Science Centrum, kde působí Matyáš Hiřman a Dagmar Hanzlíková. Ty vnímám jako velmi zkušené lidi, kteří mají schopnost univerzitu někam směrovat. Na fakultách se to postupně rozrůstá. Vím, že nově má Přírodovědecká fakulta svého data stewarda, První lékařská fakulta po někom kouká. Určitě se to bude rozšiřovat, protože přichází nový Open Science grant, který bude tyto pozice podporovat.
Tereza
U nás je to tak, že kdybychom se měli zaměřit vyloženě na oficiální pozici univerzitního data stewarda, tak máme čistou nulu. Co máme, je metodik správy výzkumných dat na úseku vědy a výzkumu na rektorátu. To jsem já. A také máme Open Science koordinátora na knihovně. Co se týče fakultních data stewardů, tak toho má u nás pouze vysokoškolský ústav CATRIN. Výzkumné týmy ale s daty nějak nakládají, nejsme úplně ve vzduchoprázdnu. Tam, kde je to potřeba, jsou lidé, kteří tuto pozici vykonávají, aniž by si říkali data stewardi. A pak u nás běží projekty, které tuto pozici už mají. Obecně existuje několik modelů, jak to může na institucích v budoucnu vypadat. Existovat může například centralizovaný univerzitní servis, který výzkumníkům v případě správy výzkumných dat poskytují různé týmy. Tak to mají třeba naši projektoví partneři v Helsinkách. Nebo může existovat centrální tým pro Open Science a správu výzkumných dat jako třeba na UK. Nebo propojená síť data stewardů jako ve Vídni. Záleží, jak moc do toho chce která instituce šlápnout a jak se k tomu postaví. Určitě je to teď jedno z nejžhavějších témat a cílem je, aby správa výzkumných dat byla součástí běžné praxe. Já to ale vidím stále spíše jako týmovou práci, protože data steward není samospásný.
Martin
Mnohdy člověk musí strašně čarovat s tím, kolik má peněz na tu pozici a jestli peníze přijdou z grantu nebo jestli je univerzita schopná finance vyčlenit. Na VŠCHT dáme dohromady jeden celý úvazek s tím, že je dělený mezi více lidí. A u jediného grantu mnohdy peníze nevycházejí tak, aby se tomu data steward věnoval tolik, kolik je potřeba. Je to něco, s čím si musíme do budoucna hrát a nějak to nastavit. Část práce může být dotovaná z grantu, část třeba zaštítí fakultní data stewardi.
„Určitě je to teď jedno z nejžhavějších témat a cílem je, aby správa výzkumných dat byla součástí běžné praxe. Já to ale vidím stále spíše jako týmovou práci, protože data steward není samospásný.“
Martin
Je to strašně nárazové. Je období, kdy se neděje vůbec nic, a pak je období, kdy kontrolujeme obrovské množství data management plánu, nebo je třeba udělat školení, protože vyšla nová grantová výzva. Špatně se to odhaduje. Mám výhodu, že jsem časově flexibilní a můžu říct, že se teď budu tři dny v kuse třeba věnovat jenom data management plánu, protože se blíží deadline. Přiznejme si to, vědci nejsou úplně nejorganizovanější lidi a rádi dělají všechno na poslední chvíli. A taky záleží na tom, jak moc je potřeba vzdělávat. Čím víc budeme vzdělávat, tím líp. V Open Science se pořád všechno vyvíjí, ale plno věcí, které my si stanovujeme, že bychom rádi, aby fungovaly, tak možná budou fungovat za deset, dvacet let
Tereza
Tak tak.
„V Open Science se pořád všechno vyvíjí, ale plno věcí, které my si stanovujeme, že bychom rádi, aby fungovaly, tak možná budou fungovat za deset, dvacet let.“
Martin
Kdoví. Nejsem si jistý. Záleží i na nadšení vědců a jak my jim to zvládneme podat. Teď to vidím tak, že jsme Evropskou unií tlačení, že musíme. A protože musíme, nemáme úplně prostor ukazovat motivaci, proč bych to jako vědec měl chtít, co mi to přinese. Je to víc o tom, že teď musím udělat tenhle papír a mám papír, a to je všechno.
Tereza
Je to tak, je tady pár nadšenců, kteří v tom frčí a je jim jedno, jestli se to jmenuje Open Science nebo Responsible Science, je to zkrátka součástí jejich téměř denní praxe. Pak je tady skupina lidí, kteří nemají úplně přehled o tom, co se děje, protože v jejich oboru ta potřeba taková zatím není. A potom jsou lidi, kteří se s tou potřebou setkají často přes poskytovatele financí. Tam se to začalo hodně zaměřovat na Data Management plán, což je v uvozovkách jeden dokument a ten je často vnímám jako další byrokracie a další zátěž. Jako vědec už řešíte spoustu věcí a teď přijde zase tohle. Vysvětlit, že to má smysl, trvá. To není tak, že si uklidíte byt a vidíte výsledek. Je to dlouhodobější. Benefity přicházejí pomaleji. Někdo vám řekne: Ušetříte čas. Oukej, ale já přece musím dělat ten plán a ten mi ten čas naopak bere. Takže najít motivaci, aby to nebylo vnímáno jako, pardon, opruz, potrvá. Ve výsledku je to ve změně nastavení mysli. Jak řekl Martin, tohle bude opravdu dlouhodobé.
Tereza
Asi bych to nenazvala problémem, ale spíš výzvou. Už když se řeknou „data“, tak každý o nich může mít jinou představu. Můžeme nad nimi vést spoustu diskusí a na konci dne zjistíme, že každý jimi myslíme něco úplně jiného. Takže najít společný jazyk, vysvětlit si pojmy. Dalším takovým příkladem je i pojem otevřená věda, který se často objevuje společně se správou výzkumných dat. Ale sama otevřenost a otevírání je jen výseč celého procesu správy, protože než data můžeme otevřít, předchází tomu spousta věcí. Někohootevřenost navíc děsí. Já o otevřenosti mluvím jako o škále od úplně otevřených po úplně zavřená data s otevřeným metadatovým záznamem. Ne všechna data lze otevřít pro legitimní důvody, a to je v pořádku. Možná právě i tohle trošku komplikuje komunikaci mezi různými skupinami. A ruku na srdce, když přijde nový data steward a řekne: "Jo, děláte to dobře, ale můžete to dělat i líp", tak já bych asi taky nebyla úplně nadšená. Navíc pochopit celý kontext, proč se to děje, na to určitě nestačí odsedět si jednu přednášku. Jak říká Dagmar Hanzlíková z UK: "To není revoluce, to je evoluce, a ta prostě trvá"
Martin
V konečné fázi sám ten vědec nejlíp ví, co za data má a jak by se s nimi mělo nakládat. A pro nás je ta výzva, jak mu nejlíp říct, jaké jsou možnosti a co mu to může přinést. A aspoň mně se ne vždycky daří tohle vykomunikovat tak nadšeně, jak bych si přál. Takže tu výzvu vidím taky přesně v tomhle.
Tereza
Já jsem ještě nepřišla na způsob, jak o otevřené vědě mluvit zajímavě nebo dokonce zábavně. Vždycky jen vidím, jak nálada poklesne, když se tohle téma otevře :)
„V konečné fázi sám ten vědec nejlíp ví, co za data má a jak by se s nimi mělo nakládat. A pro nás je ta výzva, jak mu nejlíp říct, jaké jsou možnosti a co mu to může přinést. A aspoň mně se ne vždycky daří tohle vykomunikovat tak nadšeně, jak bych si přál. Takže tu výzvu vidím taky přesně v tomhle.“
Martin
Není od věci být opatrný, je naprosto v pořádku všechno hodně zvážit. Možná by pomohlo zdůraznit, že je vše hodně individuální obor od oboru. Třeba v medicíně se s tím mnohdy z etického hlediska nedá dělat nic. Jinde naopak může být člověk hodně otevřený a dokonce požádat i publikum, aby přispělo svými daty nebo podněty. Není tu plošné pravidlo, které musí všichni dodržovat stejně, ale jde o nastavení procesu pro každý projekt tak, aby to dávalo smysl a k něčemu to bylo.
Tereza
Jedna věc je o tom určitě mluvit. Představte si cestu vědce, který po nějaké době získá Horizon Europe a najednou se na něj navalí všechna ta pravidla, co má dělat. Ne že by měl všechna data ve špatném stavu, ale najednou je nad ním aparát, který mu určitým způsobem definuje jeho cestu. Takže důležité je o tom mluvit a vědět proč. Protože to není, a teď pardon za to slovo, nějaká buzerace seshora, ale jsou za tím reálné důvody, proč se to děje, proč je to například povinnou součástí. A druhá důležitá věc je podpora. Když se například podmínky poskytovatelů nebo politiky na různých úrovních změní, je potřeba vědcům pomoct. Není možné, aby vědec dělal svůj výzkum a k tomu byl ještě expertem na všechno, co se správou výzkumných dat souvisí.
„Druhá důležitá věc je podpora. Když se například podmínky poskytovatelů nebo politiky na různých úrovních změní, je potřeba vědcům pomoct. Není možné, aby vědec dělal svůj výzkum a k tomu byl ještě expertem na všechno, co se správou výzkumných dat souvisí.“
Martin
Za mě je důležitá komunikace, ale spíše ve smyslu otevřenosti. Pokud má motivaci a chce, je to mnohem důležitější než jakékoliv další předpoklady. Samozřejmě pomůže, pokud byl v minulosti součástí nějakého projektu nebo týmu. Data stewardi, které znám, přicházejí z různých pozic. Já jsem výzkumník, někdy je to knihovník, a všichni jsou úspěšní. Možná stačí i jen otevřenost a zájem.
Tereza
Já to doplním ještě o dvě myšlenky. Kdybychom se bavili o osobnosti toho člověka, tak musí mít i určitou formu vnímavosti a empatie. Může být extra nadšený, což je skvělé, ale tím taky může vědce spíš vyděsit. Nesmí takzvaně tlačit na pilu. Změna nebude přes noc, bavíme se v řádu let. A za druhé záleží na tom, kde ve struktuře instituce data steward působí. Když to zobecním, tak čím blíže je centrále, tím rozmanitější background může mít. Může být z knihovny, z výzkumu, může to být klidně i doktorand nebo někdo krátce po doktorátu. Ale čím blíž je výzkumnému týmu, tím větší a bližší by měl mít znalost daného týmu a oboru. Tam už totiž pomáhá prakticky a těm lidem pak rozumí mnohem víc.
Tereza
Tak tak.
Martin
Čím blíž je pozici týmu, tím víc pracuje s daty. A čím je výš, tím spíš nastavuje, jak by se to optimálně mělo dít.
Tereza
Součástí práce jsou i konzultace nebo vzdělávání.
Martin
A tam je ta empatie velmi důležitá, protože jako vědci jsme tvrdohlaví a neradi připouštíme, že něco neděláme tak, jak bychom měli. Někdy člověk musí mít trpělivost.
„Čím blíž je pozici týmu, tím víc pracuje s daty. A čím je výš, tím spíš nastavuje, jak by se to optimálně mělo dít.“
Martin
Ano, někde může být už vědec normami a pravidly nucený, jak s daty nakládat, tak s nimi nakládá. Třeba přijdu na mikroskop, vygeneruju obrázek a už ho musím někam uložit a nějak ho pojmenovat. Takže někde už to vědci dělají a ani třeba neví, že to dělají. A někde je to úplně naopak a nikdo tomu vědci ještě neřekl, že pokud pojmenovává “data 1”, “data 2”, “data 3”, tak s tím za rok bude mít třeba problém.
Martin
Možná se můžeme nejprve shodnout na úkonech, které musí plnit, a z toho pak můžeme přiblížit, jak bude ten jeho průměrný den vypadat. Pro data stewarda na institucionální úrovni bude důležité nastavovat a konzultovat pravidla a normy pro celou instituci. Takže se bude muset sejít s vedoucím IT oddělení, s etickou komisí, a to budou nárazové úkony, které bude pravidelně aktualizovat. Velkou součástí pracovní náplně budou konzultace, dokázal bych si představit, že to může zabrat 40 až 50 % času. Čím bude na nižší pozici, tím víc bude přibývat praktická práce s daty. U institucionálního si dokážu představit, že bude kontrolovat, jestli jsou ta data správně publikovaná, jestli je data set přiložený k článku a obráceně.
Tereza
Určitě ještě monitoring potřeb. Data steward musí vědět, co kde chybí, jaké jsou potřeby a ty postupně podle priorit řešit. Tím, že jsme ještě na začátku, tak je klíčové i sebevzdělávání. Znát trendy. Znát zdroje, které je třeba třídit. Nemůžete dát vědcům padesát příruček, to vás sežerou zaživa. Musíte si to sami probrat. A samozřejmě vzdělávání ostatních. Ono jen připravit kvalitní kurz pro ostatní zabere hodně času.
Martin
Je pravda, že jsem zapomněl na svoji oblíbenou aktivitu, a to je právě zjišťování potřeb! Nám se z hlediska plánování kurzů osvědčilo něco, co jsem přebral ze zahraničí. Říkáme tomu snídaně s data stewardy. Jednou za čas uděláme kafe a pozveme lidi, aby v rámci volného sdílení napekli sušenky, přinesli cokoliv, a třeba během hodiny se bavíme o čemkoliv, na co narazili, s čím by potřebovali pomoct. Vždycky z toho vznikne nějaké téma, které příště rozebereme a nabídneme řešení. Zjistil jsem, že vědět, co lidi reálně potřebují, je pro mě jedna z nejdůležitějších věcí.
Tereza
A ještě je potřeba dát o sobě vědět. Je hezké, že máte institucionálního data stewarda, ale když o něm nikdo neví, je to k ničemu.
„Zjistil jsem, že vědět, co lidi reálně potřebují, je pro mě jedna z nejdůležitějších věcí.
A ještě je potřeba dát o sobě vědět. Je hezké, že máte institucionálního data stewarda, ale když o něm nikdo neví, je to k ničemu.“
Martin
Dopodrobna ji prozkoumanou nemám, obecně o sobě ale tušíme. Když se potřebuju na něco zeptat, většinou tam odpověď dostanu. Teď bylo poprvé i fyzické setkání komunity a my jsme tam vlastně ani jeden nebyli. O to byl tak obrovský zájem, tak rychle se to zaplnilo, že to jen podtrhuje to, jak je to důležitá aktivita.
Tereza
Komunita funguje převážně virtuálně, ale jsou tu právě i tyto doprovodné aktivity. Taky neznám všechny, ale mám o členech povědomí, protože s nimi občas něco řeším.
Martin
Já osobně se setkávám spíše s ukládáním dat v soukromém sektoru.
Tereza
Měníme se v data driven society, data jsou důležitá. Tahle problematika se rozpíná i za hranice univerzit a výzkumných institutů. Taky očekávám spolupráci v soukromém sektoru. Hezkým příkladem ale může být i projekt, který běží u nás na UPOL a který spolupracuje s městem Olomouc a Olomouckým krajem. Řeší dobrou praxi, jak nakládat s daty a jaká data otevírat. Takže už teď se zapojuje i veřejný sektor.
„Měníme se v data driven society, data jsou důležitá. Tahle problematika se rozpíná i za hranice univerzit a výzkumných institutů.“
Tereza
To je hlavní myšlenka otevřené vědy. Jít napříč sektory, nezůstávat jen na půdě univerzitního prostředí. Rozhodně spolupráce, ale s malou červenou vlaječkou - neotevírat za každou cenu všechna data. Sdílet, ale zodpovědně.
Martin
Z hlediska vědy je to velká motivace, jak se rychleji posouvat dál. Já dělám Data Science, a když chci vyvíjet nějaký algoritmus nebo postup lepšího vyhodnocení, tak to bez těch dat neudělám. Můžu mít sebelepší nápady, ale pokud nebudu mít přístup k datům otevřeně, musím složitě hledat, kdo by se mnou chtěl spolupracovat a data mi půjčil, abych vůbec mohl se svojí prací začít. Takhle můžu kouknout do repozitáře a když tam budou data dobře popsaná, mám k nim hned přístup. Stejně tak můžu porovnávat s ostatními, jak dobrý v té tvorbě jsem. A to samé může udělat v budoucnu komerční sektor.
Tereza
Ještě k té otevřenosti - samotná data nemusí být vždy otevřená. Ale už to, že jsou uložená v repozitáři a prostřednictvím metadat dohledatelná, a já vím, že existují a že můžu kontaktovat konkrétního člověka, požádat o ně, a například za splnění určitých podmínek k nim získat přístup, má smysl. Jsou různé cesty, jak data sdílet.
Martin
Když se teď postavím do pozice toho vědce, který nad tím tráví čas, energii a zažívá všechny ty útrapy, než data nasbírá, tak určitě budu chtít někde ukázat, že jsem to udělal. I když dám do repozitáře ta data zavřená, tak někde bude existovat záznam o tom, že jsem opravdu na tomto pracoval a něco jsem vytvořil.
Martin
Přesně tak.
pracuje jako metodička výzkumu a správy dat na UPOL. Zároveň působí jako datová manažerka ve dvou výzkumných projektech. Kurz na data stewarda ve Vídni úspěšně absolvovala v akademickém roce 2023/24.
Foto: UPOL
pracuje jako institucionální data steward a výzkumník v oboru Data Science na VŠCHT v Praze. Tam zároveň probíhá i DocEnahnce Data Stewardship kurz, který Martin absolvoval společně s kurzem FAIRsFAIR Train The Trainer v roce 2021. Svoje zkušenosti využívá i v rámci Národní Technické Knihovny a Open Access mikroskopické core facility Přírodovědecké fakulty UK.
Foto: Aleš Balda, VŠCHT
V maďarské metropoli proběhlo ve dnech 2. až 4. října European Big Data Value Forum 2024. Jedná se o hlavní událost evropské komunity pro výzkum a inovace v oblasti velkých dat a umělé inteligence, kterou již tradičně připravuje organizace Big Data Value Association. Na letošním ročníku konference nechyběli ani zástupci iniciativy EOSC v České republice, kteří se s vámi podělí o své dojmy.
Podívejte se na pohled začínající data stewardky, Kateřiny Zvoníkové, která se zúčastnila zářijového setkání komunity data stewardů v prostorách Karolina na Univerzitě Karlově. Setkání přineslo příležitost pro výměnu zkušeností a nové inspirace v oblasti správy dat. Zjistěte, co ji na tomto setkání překvapilo a proč je nadšená z budoucích příležitostí pro rozvoj datové podpory!