Machine Learning algoritmusok módszertana és alkalmazása valós adatok környezetében

Saved in:
Bibliographic Details
Main Author: Torma Viktor
Other Authors: Hidelmayer Csicsman József
Lengyel-Wang Zita
Format: Thesis
Kulcsszavak:adatelemzés - adatbányászat
Chatbot
machine learning
Python
virtuális asszisztens
Online Access:http://dolgozattar.uni-bge.hu/42214

MARC

LEADER 00000nta a2200000 i 4500
001 dolg42214
005 20221111081545.0
008 221111suuuu hu om 000 hun d
040 |a BGE Dolgozattár Repozitórium  |b hun 
041 |a hu 
100 1 |a Torma Viktor 
245 1 0 |a Machine Learning algoritmusok módszertana és alkalmazása valós adatok környezetében  |c Torma Viktor  |h [elektronikus dokumentum] 
520 3 |a A modernkori adatelemzésben többféle Machine Learning algoritmust használnak az adattudósok, hogy adathalmazukon regressziót vagy klasszifikációt használva predikciót tudjanak véghez vinni a változók segítségével. Szakdolgozatomban megvizsgálom egy valós üzleti környezetben működő társalgási mesterséges intelligenciai program (chatbot) adatait különböző Machine Learning algoritmusokkal karöltve, hogy pontosabb látképet kapjak az adatok minőségéről és állapotáról. Erre azért van szükség, hogy a jövőben könnyedén tudjunk olyan fejlesztéseket implementálni a chatbot programjába, amiket az adatok eredményeinek köszönhetően tudunk véghez vinni. Ilyen fejlesztés például a program továbbtanulása vagy a rendelkezésére álló adatbázis bővítése.   A felhasznált algoritmusok a klasszifikációt fogják eredményezni, ahol az adatokat különböző osztályokba fogja besorolni egy tanuló adatmodell segítségével, példának okáért azt fogja eldönteni, hogy az adatrekord releváns vagy sem a mi felhasználási területünkön. Az algoritmusok használata előtt viszont adathalmazunkat elő kell készíteni az elemzéshez, azaz adattisztítást kell elvégezni rajta, hogy kikerüljön minden felesleges rekord az adatsorunkból és hogy minden adategységünk egységes legyen, mindezt azért, hogy az elemzésünk pontos legyen. Ezután meghatározzuk, hogy az elemzésünkhöz milyen módszertant kell használnunk, hogy a kívánt eredményt érjük el, például a változóink alapján regressziót vagy klasszifikációt kell végeznünk, milyen algoritmusokat érdemes használni a feladat elvégzéséhez. Ha elvégeztük a szükséges előkészületeket, adatsoromra ráillesztem az algoritmusokat, hogy predikciót végezzenek el rajta.  Megvizsgálom, hogy melyek az előnyei ás hátrányai ennek a technológiának, milyen funkciói és tulajdonságai vannak, mennyire lehet paraméterezni, hogy a saját adathalmazunknak megfelelően tudjunk vele dolgozni, milyen gépi erőforrásokat igényel és hogy milyen eredményeket érünk el a felhasznált algoritmusok között.  Végezetül feltérképezzük a valódi környezetben lévő implementálást is, ennek körülményeit, valamint említésképpen megvizsgáljuk a jövőbeli fejlesztési lehetőségeket, ezeknek előnyeit és erőforrás igényeit. A kutatásom során a Naive Bayes, a Gradient Boosting és a klaszterezés módszertanait fogom felhasználni a kívánt eredmények eléréséhez. 
695 |a adatelemzés - adatbányászat 
695 |a Chatbot 
695 |a machine learning 
695 |a Python 
695 |a virtuális asszisztens 
700 1 |a Hidelmayer Csicsman József  |e ths 
700 1 |a Lengyel-Wang Zita  |e ths 
856 4 0 |u http://dolgozattar.uni-bge.hu/42214/1/Szakdolgozat_v%C3%A9gleges.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/42214/2/BA_O_Torma_Viktor.pdf  |z Dokumentum-elérés