Pokud by byla data k dispozici, aby mohli výzkumníci navázat tam, kde jiní přestali, byla by to určitě správná cesta, říká Roman Čampula

Roman Čampula pracuje v Centru dopravního výzkumu jako vedoucí oblasti analýz dopravního chování a modelování dopravy, a zpracovává dopravní data. Iniciativu EOSC CZ vítá a dokáže si představit, že by každý výzkum končil uložením dat do velké národní databáze. V open science vidí budoucnost a přiznává, že s otevřenými daty pracuje minimálně v týmu svých kolegů už teď.

17. 6. 2024 Martina Čelišová

foto Martina Čelišová

Pracujete jako vedoucí oblasti analýz dopravního chování a modelování dopravy. Co je konkrétně náplní vaší práce a jak jste se k ní dostal?

Na CDV pracuju deset let, nastoupil jsem sem hned po škole jako programátor. Nejdřív jsem dělal spíš ve výzkumu a zpracovával jsem jak data od kolegů, co dělali průzkum na silnicích, tak třeba data z mýtných bran z českých dálnic, aby ministerstvo vědělo, odkud, kam a kolik lidí jezdí. Věnoval jsem se i dopravnímu modelování, což je taková specialita, kterou v Česku moc lidí nedělá. Teď dělám vedoucího naší desetičlenné oblasti a tam už se jedná i o plánování práce, přípravu rozpočtů nebo o spolupráci s městy.


Vaše data a obecně vaše práce se hodně promítá do fungování většinové společnosti, je to tak?

Přestože pracujeme ve výzkumné organizaci, tak se hodně snažíme náš výzkum přenést do praxe pro česká a slovenská města. Zpracováváme plány udržitelné městské mobility, což jsou strategické dokumenty, které musí mít každé město nad čtyřicet tisíc obyvatel, aby mohlo čerpat evropské a národní dotace. Ukazují, jak by mělo město po dopravní stránce fungovat v následujících až třiceti letech, jaké druhy dopravy by mělo podporovat, jak omezovat automobilovou dopravu, jak řešit parkování nebo cyklistiku.


Obrací se města na vás nebo je oslovujete vy?

Máme síť desítek měst, se kterými spolupracujeme, a ta iniciativa jde především od nich. Pokud potřebují z běžné křižovatky udělat světelnou, tak se nás zeptají, kolik jí projíždí aut, kolik přes ni chodí chodců a zda to místo vůbec splňuje normy pro světelnou křižovatku. My jim to místo změříme a vyhodnotíme.


Jak jsou pak vaše výsledky a výzkumná data přístupná v rámci CDV a jak mimo CDV?

Záleží na každém výzkumníkovi. S mými kolegy máme zavedený systém, že vše, co vytvoříme a sesbíráme, je uloženo na jednom místě, v nějaké pokud možno standardizované formě. A toto je stoprocentně dostupné našemu týmu a k dispozici ve chvíli, kdy třeba začneme spolupracovat s dalším městem. Ostatní lidé z CDV se můžou na data taky podívat, musí už ale vědět, že nějaká taková data existují. Občas narážíme na problém, že se někdo nedozví, že jsme udělali nějaký průzkum, a má pak ambici si ho udělat znovu.

Mimo CDV bych to pak rozdělil na dvě oblasti. U výzkumných projektů sesbíraná data většinou přístupná jsou, protože jde o dotační projekty za veřejné peníze, takže bývají zveřejněné závěrečné zprávy nebo má projekt svůj web. U komerčních projektů už výsledky veřejně dostupné nejsou, práva k nim totiž přechází na objednatele a my se s ním musíme domluvit, pokud je chceme použít jinde.




„Občas narážíme na problém, že se někdo nedozví, že jsme udělali nějaký průzkum, a má pak ambici si ho udělat znovu.“

Máte někoho, kdo se o ta data stará?

Máme několik oblastí dopravy a každá ta oblast si to reguluje podle svého. Já se svým týmem se snažíme mít jedno sdílené datové úložiště, kde jsou data v strukturované podobě uložena na sdílených discích. Kromě toho tam jsou i metadata, kde je popsáno, o jaká data jde, v jaké jsou struktuře, z jakého roku, z jakého města nebo území, jaká je jejich podrobnost, jestli je potřeba je aktualizovat, kdo se o ně stará, jak jsou uložena a v jakých verzích. Ale není to pravidlo na CDV, je to záležitost spíš mých kolegů a mého nejbližšího okolí, abychom se mohli ke svým datům kdykoliv vrátit.


Využíváte data zvenčí, třeba ze zahraničí?

Spíš než bychom využívali ze zahraničí nějaká číselná data, tak využíváme různé metodologie dat a metodiky zpracované v Rakousku nebo Německu. Zpravidla se nám hodí právě k plánům udržitelné mobility, což je průzkum o tom, kam lidé cestují, za jakým účelem a jak často. Inspirace ze zahraničí od nejbližších sousedů tu tedy je, ale data třeba o počtu cest se sem ze zahraničí ani přenést nedají.


Dokážete si představit, že byste data poskytli univerzitám? Už vás o data někdo někdy požádal?

Stává se to. Ne moc často, ale stává. Většinou poskytujeme data z našeho největšího průzkumu, do kterého bylo zapojeno deset tisíc českých domácností, a u všech členů domácností se zjišťovalo, jakým způsobem cestují. Výsledky jsou zveřejněné zdarma na stránkách projektu, takže si je může kdokoliv stáhnout. Jsou to tisíce řádků dat v Excelu. Je tam spousta parametrů, takže laické veřejnosti nemusí být tento výzkumný projekt úplně srozumitelný. Obrací se na nás proto spíš univerzity nebo města s tím, že chtějí pomoct s vysvětlením dat. V tomto jim pomáháme.


„Inspirace ze zahraničí od nejbližších sousedů tu tedy je, ale data třeba o počtu cest se sem ze zahraničí ani přenést nedají.“

To je zrovna moc hezký příklad toho, čemu se říká open data, otevřená data. Říkají vám něco pojmy jako open science nebo open access?

My bychom byli moc rádi, kdyby se výsledky a data, která my sesbíráme a zpracujeme, dala uložit tak, aby se pak dala využít dál. Kdybychom je nemuseli využívat jenom my, ale i někdo jiný, bylo by to krásné. Softwary, které vyrobíme, se snažíme publikovat zdarma nebo s otevřeným zdrojovým kódem, aby na naší práci mohl někdo pokračovat dál. Ne vždy to jde kvůli licenčním nebo komerčním důvodům, ale u výzkumné části lze všechny výstupy bez problémů někde sdílet a uložit na veřejné místo. Přestože to teď úplně neděláme, nevidím problém v tom, abychom to dělali do budoucna, kdyby nás k tomu někdo motivoval.


Vidíte v tom i nějaká negativa?

Asi je potřeba opravdu dobře popsat, jak ta data vznikla. Jakou metodou byla sebrána, jak byla zpracována, za jakým účelem a co z nich plyne. Často tento popis chybí. Někdy narazíme na datový soubor, který vypadá zajímavě, ale není tam žádný background. Tedy za jakým účelem a jak dlouho byla data sbírána, jaký tam byl vzorek populace, jak přesně se pak data vyhodnotila nebo jak se pracovalo s tím, když třeba někdo neodpověděl. Když tohle povědomí chybí, velmi těžko se na to potom navazuje. Ideální by proto bylo, pokud by data obsahovala i co nejvíce podrobnou zprávu o tom, jak vznikla.


 

 

„Softwary, které vyrobíme, se snažíme publikovat zdarma nebo s otevřeným zdrojovým kódem, aby na naší práci mohl někdo pokračovat dál.“

Vzniká národní datový repozitář, dokážete si představit, že byste byli jeho součástí a přispívali do něj?

Určitě. Pokud by nám někdo řekl, v jaké formě tam mají být ta data uložena, my bychom je do té formy převedli a uložili je. Mohla by je využít ostatní města, která by se tak mohla inspirovat mezi sebou. My bychom jako výzkumná organizace mohli využít zase data, která sesbíral někdo jiný v jiném městě, kde my jsme nepracovali. Z různých porovnání by mohla vyplynout zajímavá soutěž mezi městy třeba v tom, jak se daří motivovat automobilisty, aby přesedlali na jiný druh dopravy. Zdá se mi, že nikde není moc zveřejněno, jak to v českých městech je. Města si zpracují projekty pro sebe, ale nikdo jiný už se k těm výsledkům nedostane. Kdyby ne jen data, ale i výsledky analýz byly někde dostupné, nemuselo by se vždycky začínat od začátku, ale mohlo by se rovnou navazovat. Občas totiž vidíme, že se nějaká práce dělá vícekrát, přitom by to nebylo nutné. Při fungování dopravy je samozřejmě celá řada odlišností, ale existují věci, které jsou podobné, a ty se zjišťují pořád dokola znova a znova. Veřejné prostředky se znovu a znovu vynakládají na to, aby konkrétní analýza byla kompletní, protože není možné data získat z jednoho zdroje.

Právě proto vznikl zmiňovaný celonárodní průzkum dopravního chování. Jsou to veřejná data, na která mohou jednotliví zpracovatelé navazovat, ať už jsou ze soukromé nebo z výzkumné sféry nebo z veřejné správy. A je to dobrá cesta i v případě publikační činnosti ve vědeckých časopisech. Sám jsem na to několikrát narazil. Měli jsme tady diskusi o tom, zda zaplatit open access, protože zpracovatel musí často zaplatit za to, aby byl článek k dispozici zdarma. Přitom když já jako výzkumník něco vymyslím, tak to chci publikovat tomu nejširšímu spektru čtenářů, a třeba i do zahraničí. A když za moje výstupy musí někdo platit třeba formou předplatného toho časopisu, tak to poměrně omezuje dosah. A já sám se k řadě výzkumných aktivit nebo článků nedostanu, protože někdo rozhodl, že zrovna tento časopis nebudeme předplácet. Pokud toho co nejvíce bude dostupné v otevřené formě, bude to fajn.


 

 

„Veřejné prostředky se znovu a znovu vynakládají na to, aby konkrétní analýza byla kompletní, protože není možné data získat z jednoho zdroje.“

EOSC se snaží vědcům pomoct s ukládáním dat. Je podle Vás potřeba, aby měli vědci a výzkumníci tento servis?

Obecně je mi tahle iniciativa velmi sympatická, a pokud by v tomto směru byla nějaká osvěta, bylo by to jedině dobře. Pokud by nám někdo dal srozumitelné instrukce o tom, že existuje nějaký veřejný datový repozitář a za jakých podmínek tam můžeme data ukládat, určitě bychom to brali jako součást svojí vědecké práce. Každý projekt by jednoduše končil tím, že se naše výstupy někam uloží a tam budou sloužit pro další výzkumníky. To by se mi moc líbilo.


Ing. Roman Čampula


pracuje v Centru dopravního výzkumu jako vedoucí oblasti analýz dopravního chování a modelování dopravy, a zpracovává dopravní data. Iniciativu EOSC CZ vítá a dokáže si představit, že by každý výzkum končil uložením dat do velké národní databáze. V open science vidí budoucnost a přiznává, že s otevřenými daty pracuje minimálně v týmu svých kolegů už teď.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.