Labdarúgó fogadási szokások optimalizálása gépi tanulás segítségével

Elmentve itt :
Bibliográfiai részletek
Szerző: Kóti Marcell
További közreműködők: Hidelmayer Csicsman József
Hoffmann Zoltán
Dokumentumtípus: Diplomadolgozat
Kulcsszavak:adatelemzés - adatbányászat
gépi tanulás
labdarúgás
Sportfogadás
szerencsejáték
Online Access:http://dolgozattar.uni-bge.hu/40733
Leíró adatok
Kivonat:A dolgozat elsődleges célja a sportfogadások és a gépi tanulás kapcsolatának a vizsgálata felhasználói szempontból, azaz, a gépi tanuló algoritmusok megértésével, majd azok segítségével szeretné a fogadó életét a sportfogadások terén megkönnyíteni. Ehhez először alapvető fogalmakat tisztáz a sportfogadásról és szerencsejátékról, és egy felszínes képet fest a fogadás világának eddigi történelméről. Utána egy kérdőív segítségével felméri, hogy manapság Magyarországon milyenek a fogadási szokások, ezzel alapot kapva ahhoz, hogy mik is azok az elvek, amik később javításra, esetleg cserére szorulnak. Bemutatja az eszközöket, amiket a későbbi kísérletekben használni fog, modell és környezet oldalról egyaránt. Modellként elmélyed a döntési fa (véletlenszerű erdő) és a neurális hálózatok működésében, eszközként pedig röviden taglalja a Python programnyelvet és annak alapvető könyvtárait, illetve ebben az ebben a környezetben megtalálható modellépítési lehetőségeket, továbbá röviden bemutat egy másik felhasznált eszközt, a node-alapokra épülő Microsoft Machine Learning Studio-t. Ezek után áttér a dolgozat nagyrészét képező, problémát bemutató mintafeladatra. Először az ehhez felhasznált adatokat, táblát mutatja be részletesen, majd egy alapvető statisztikai elemzést is végrehajt rajtuk. Ezeket a statisztikai elemzéseket és a már korábban lefektetett szokásokat felhasználva elvégzi az első szűkítését az adatoknak, majd a szűkített adathalmaz(ok)on is egy egyszerű, ám de sokkal relevánsabb statisztikai elemzést hajt végre. Végezetül egy újabb szűkítést eszközöl, az előző elemzés és a Machine Learning Studio által kínált adatbányászati lehetőségek eredményeinek összegzésével. Az adathalmazon több szűkítést már nem végez el, a kísérlet hátralévő részében csak ezzel foglalkozik. Először egy mély statisztikai elemzésnek veti alá az adattáblát, szabályosságok és érdekességek után kutatva, majd következhet a gépi tanuló algoritmusok/modellek építése, ami nagyrészt a Python fejlesztői környezetén belül történik, így a dolgozatban a kód egyes fontosabb részletei is szerepelnek. A dolgozat nem csak a modellek által kínált jóslatokat, hanem a papírforma fogadások szabályát is vizsgálja. A modellek építése, és tanulásuk rövid kiértékelése után jöhetnek a predikciók. Alapvetően a modellek 9 év adatain tanulnak, és az ezt követő 1 év adatain tesztelnek, így a következő elemzés az utóbbi 1 év predikcióit érinti. A dolgozat a modellek egyenként, párokban, majd összegezve is elemzi, végül összesíti azok működését és hatékonyságát. Kis mértékben külön álló kísérletként elvégez több kísérletet a Machine Learning Studio keretein belül is, jobb eredmények után kutatva, mint a programkódban megépített és paraméterezett modellek esetében. Végezetül többféle optimalizálási lehetőséget is vizsgál, majd azokat összevetve eléri az ehhez az adathalmazhoz, ezekkel az eszközökkel elérhető legjobb eredményt.