English

Streaming adatfeldolgozás workshop

ÁTTEKINTÉS

Ezt az egynapos workshopot azoknak ajánljuk, akik szeretnének megismerkedni a streaming adatfeldolgozás alapjaival.

A tanfolyam röviden ismerteti a batch és streaming technológiák különbségeit, majd streaming feladatokat oldunk meg közösen Spark, Flink és Kafka segítségével.

TEMATIKA

  • Streaming rendszerek
  • Batch és streaming összehasonlítása
  • Streaming adatforrások (Kafka)
  • Feldolgozó réteg (Spark, Flink)
  • Feladatmegoldás
  • Ablakozó operátorok
  • Állapotkezelés

LEBONYOLÍTÁS

Rövid bevezető előadás után gyakorlati feladatok keretében fogunk végigmenni a tematikán, a hallgatók aktív részvételére számítunk. A minimum memória igény 4GB RAM, a fejlesztéshez git, maven, java és IntelliJ IDEA szükségesek. Biztosítunk egy VirtualBox imaget ezekkel a szoftverekkel, így a részvételhez szükséges vagy a VirtualBox vagy a fenti eszközök telepítése. Utóbbi pontos leírása itt található:
http://dataartisans.github.io/flink-training/devSetup/handsOn.html

ELŐFELTÉTELEK

Alapszintű Java programozói ismeretek és középfokú angol tudás elvárás. A tanfolyamon résztvevőknek szüksége van megfelelő számítógépre a gyakorlati feladatok elvégzéséhez.

A KÉPZÉS OKTATÓJA

Balassi Márton
Solutions Architect (Cloudera)

Márton vezette a Flink Streaming API első verzióját implementáló csapatot az MTA SZTAKI-ban, számos streaming üzleti megoldás tervezésében és kivitelezésében vett részt. Jelenleg a Clouderánál támogatja Hadoop technológiák és üzleti megoldások bevezetését. Rendszeres előadója a témában a Hadoop Summit, ApacheCon Big Data, Flink Forward konferenciáknak és vonatkozó meetupoknak. Társszerzőivel egy streaming könyvön dolgozik.