Áttekintés
A kétszer félnapos workshop során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési (pandas) és általánosan használt gépi tanulási (scikit-learn) könyvtárai segítségével fogjuk előkészíteni a beolvasott adatokat, majd gépi tanuló algoritmusok segítségével kiaknázni az adatokban rejlő értékeket.
Manapság minden adatokkal kapcsolatos témában megkerülhetetlen a mesterséges intelligencia. Tanfolyamunk során az MI-t körülvevő misztikumot oszlatjuk el a legfontosabb gépi tanuló algoritmusok érthető bemutatásával, egy-egy működő példa felépítésével, majd egy kiválasztott probléma közös megoldásával.
Kinek szól?
Ezt a tanfolyamot azoknak javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési feladatokkal, érdeklődnek a mesterséges intelligencia iránt és szeretnék megismerni a Python nyelv ezt támogató eszközeit.
Előfeltételek
Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.
Oktató
A képzés oktatója Oltyán Gábor, a PwC Magyarország Chief Data Scientist beosztású vezetője. Az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.
Tematika
Bevezetés a Pythonba
- Mi is az és miért éppen a Python?
- Ismerkedés a Python alapokkal
- A fontosabb adatelemzési könyvtárak: pandas és barátai
Adatelemzés egyszerűen
- Adatok betöltése forrásállományokból (XLS, CSV)
- Az adatok feltérképezése, adatszerkezet vizsgálata
- Az adatok lekérdezése, sorok és oszlopok szűrése
- Számított mezők készítése
- Adatok csoportosítása és rendezése
- Vizuális adatelemzés, egyszerű grafikonok készítése
- Adatok mentése
Bevezetés a Data Science-be
- Mi az a Data Science és mi az a gépi tanulás?
- Legfontosabb gépi tanulási módszerek
- Data Science projektek felépítése, megoldások fejlesztése
Adatok előkészítése
- Hiányzó és kiugró értékek kezelése
- Duplikátumok kiszűrése
- Tanuló és teszt minták
Mesterséges Intelligencia algoritmusok
- Regressziós problémák megoldása
- Klasszifikáció vagy osztályozás
- Csoportosítás szegmentáció segítségével
- Modellek teljesítményének mérése, kiértékelése