Zpracování velkých dat na superpočítačích

Anotace: Tento kurz se zaměří na systémy pro řízení workflows pro zpracování dat a jejich propojení se superpočítači. Představíme základy používání superpočítačů a různé přístupy k jejich používání. Bude představena platforma LEXIS jako rozhraní pro spouštění komplexních úloh s automatickým přenosem dat bez nutnosti používání terminálových nástrojů. V rámci této ukázky se účastnici rovněž seznámí s různými přístupy přenášení a ukládání dat na superpočítačových infrastrukturách. Účastníci si vyzkouší práci s workflows v rámci LEXIS a také ukázku nástroje Apache Airflow pro pokročilejší úlohy.

Přínos pro účastníky 

  • Rozhraní pro snadný přístup ke zpracování dat na superpočítači
  • Práci s grafickým rozhraním platformy LEXIS
  • Představení grafického rozhraní nástroje Apache Airflow
  • Problematika přenosu dat a přístupu k výsledkům analýzy na superpočítačích

Úroveň: začátečník, středně-pokročilý, pokročilý

Jazyk: čeština

Předpoklady: Zájem o zpracování velkých dat na superpočítači

Lektor: Ing. Martin Golasowski, Ph.D.

Ze školení bude k dispozici záznam ke zhlédnutí.

Registrace

Ing. Martin Golasowski, Ph.D.

Martin Golasowski, Ph.D., je vedoucím výzkumným pracovníkem v laboratoři pokročilé analýzy dat a simulací v Národním superpočítačovém centru IT4Innovations v České republice. Jeho výzkumné zájmy se týkají distribuované správy, přenosu a analýzy dat pomocí komplexních výpočetních pipelines na HPC i v cloudu. Je zodpovědný za technický vývoj platformy LEXIS, která poskytuje správu dat a orchestraci pracovních postupů jako službu. V současné době se podílí na několika mezinárodních výzkumných projektech, včetně EXA4MIND a OpenWebSearch.eu. Podílel se na výzkumných projektech H2020 nebo EuroHPC, jako jsou IO-SEA, LEXIS nebo ANTAREX, a přispěl více než 20 publikacemi.

Sdílení události

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.