látogató számláló
HU | ENG

Bevezetés a Big Data technológiákba

Áttekintés

A képzés áttekintést ad a legfontosabb Big Data eszközökről és technológiákról, valamint bemutatja a piac legfontosabb szereplőit és a Big Data hazai helyzetét is.

 

Kinek szól?

Ezt a képzést azoknak ajánljuk, akik szeretnének betekintést nyerni a Big Data világába és megismerkedni az olyan legfontosabb technológiákkal, mint a Hadoop, a Spark, a népszerű SQL-on-Big Data megoldások (például Hive, Impala, Kudu),  valamint a streaming adatfeldolgozó eszközökkel (Kafka, Flink, Nifi). A tanfolyam segít annak megértésében, hogy a sokféle eszköz milyen előnyökkel és hátrányokkal rendelkezik, és mikor melyiket érdemes alkalmazni.

A részvételhez általános informatikai ismeretek szükségesek, némi jártasság a DW és BI területén hasznos.

 

Tematika

Bevezetés

  • Mitől Big Data a Big Data?
  • Technológiai és üzleti hajtóerők a Big Data alkalmazások mögött
  • A fő kihívások:  rugalmasság, skálázhatóság, megfizethetőség
  • Tipikus alkalmazási területek
  • Fontosabb Big Data technológiák összefoglalása

A Hadoop ökoszisztéma

  • A Hadoop működése
  • A HDFS és a MapReduce közelről
  • Gyakran használt Hadoop modulok
  • SQL motorok big data környezetben

Apache Spark

  • Az Apache Spark alapjai
  • Belső felépítés és működés
  • Programozás különböző nyelveken
  • Kapcsolódó szolgáltatások

Data Lake építése

  • A Data Lake bemutatása
  • A legfontosabb technikai jellemzők
  • Adattárházak és Data Lake összevetése: melyik mire jó?

Streaming platformok

  • A gyorsan érkező adatok fontossága
  • Technikai elvárások egy modern streaming platformnál
  • Legfontosabb szereplők
  • Big Data szállítói körkép

Data Science eszközök

  • Open source Data Science nyelvek
  • DS platformok áttekintése

Piaci körkép

  • Fontosabb Big Data szállító cégek
  • A Big Data helyzete Magyarországon