Ezt az egynapos workshopot azoknak ajánljuk, akik szeretnének megismerkedni a streaming adatfeldolgozás alapjaival.
A tanfolyam röviden ismerteti a batch és streaming technológiák különbségeit, majd streaming feladatokat oldunk meg közösen Spark, Flink és Kafka segítségével.
Rövid bevezető előadás után gyakorlati feladatok keretében fogunk végigmenni a tematikán, a hallgatók aktív részvételére számítunk. A minimum memória igény 4GB RAM, a fejlesztéshez git, maven, java és IntelliJ IDEA szükségesek. Biztosítunk egy VirtualBox imaget ezekkel a szoftverekkel, így a részvételhez szükséges vagy a VirtualBox vagy a fenti eszközök telepítése. Utóbbi pontos leírása itt található:
http://dataartisans.github.io/flink-training/devSetup/handsOn.html
Alapszintű Java programozói ismeretek és középfokú angol tudás elvárás. A tanfolyamon résztvevőknek szüksége van megfelelő számítógépre a gyakorlati feladatok elvégzéséhez.
Balassi Márton
Solutions Architect (Cloudera)
Márton vezette a Flink Streaming API első verzióját implementáló csapatot az MTA SZTAKI-ban, számos streaming üzleti megoldás tervezésében és kivitelezésében vett részt. Jelenleg a Clouderánál támogatja Hadoop technológiák és üzleti megoldások bevezetését. Rendszeres előadója a témában a Hadoop Summit, ApacheCon Big Data, Flink Forward konferenciáknak és vonatkozó meetupoknak. Társszerzőivel egy streaming könyvön dolgozik.