Zpracování velkých dat na superpočítačích
-
4. dubna 2025
10:00 – 12:00 - online
Anotace: Tento kurz se zaměří na systémy pro řízení workflows pro zpracování dat a jejich propojení se superpočítači. Představíme základy používání superpočítačů a různé přístupy k jejich používání. Bude představena platforma LEXIS jako rozhraní pro spouštění komplexních úloh s automatickým přenosem dat bez nutnosti používání terminálových nástrojů. V rámci této ukázky se účastnici rovněž seznámí s různými přístupy přenášení a ukládání dat na superpočítačových infrastrukturách. Účastníci si vyzkouší práci s workflows v rámci LEXIS a také ukázku nástroje Apache Airflow pro pokročilejší úlohy.
Přínos pro účastníky
- Rozhraní pro snadný přístup ke zpracování dat na superpočítači
- Práci s grafickým rozhraním platformy LEXIS
- Představení grafického rozhraní nástroje Apache Airflow
- Problematika přenosu dat a přístupu k výsledkům analýzy na superpočítačích
Úroveň: začátečník, středně-pokročilý, pokročilý
Jazyk: čeština
Předpoklady: Zájem o zpracování velkých dat na superpočítači
Lektor: Ing. Martin Golasowski, Ph.D.
Ze školení bude k dispozici záznam ke zhlédnutí.
Ing. Martin Golasowski, Ph.D.
Martin Golasowski, Ph.D., je vedoucím výzkumným pracovníkem v laboratoři pokročilé analýzy dat a simulací v Národním superpočítačovém centru IT4Innovations v České republice. Jeho výzkumné zájmy se týkají distribuované správy, přenosu a analýzy dat pomocí komplexních výpočetních pipelines na HPC i v cloudu. Je zodpovědný za technický vývoj platformy LEXIS, která poskytuje správu dat a orchestraci pracovních postupů jako službu. V současné době se podílí na několika mezinárodních výzkumných projektech, včetně EXA4MIND a OpenWebSearch.eu. Podílel se na výzkumných projektech H2020 nebo EuroHPC, jako jsou IO-SEA, LEXIS nebo ANTAREX, a přispěl více než 20 publikacemi.
Sdílení události