képfelismerési technikák összehasonlítása mély tanulási és a hagyományos módszerek között

Saved in:
Bibliographic Details
Main Author: Sipos Gergely
Other Authors: Kovács Dr. Endre
Kovács Tibor
Format: Thesis
Kulcsszavak:képfeldolgozás
klasszifikáció
Konvolúció
mesterséges intelligencia
neurális hálózatok
Online Access:http://dolgozattar.uni-bge.hu/54580

MARC

LEADER 00000nta a2200000 i 4500
001 dolg54580
005 20240628102952.0
008 240628suuuu hu om 000 hun d
040 |a BGE Dolgozattár Repozitórium  |b hun 
041 |a hu 
100 1 |a Sipos Gergely 
245 1 0 |a képfelismerési technikák összehasonlítása mély tanulási és a hagyományos módszerek között  |c Sipos Gergely  |h [elektronikus dokumentum] 
520 3 |a A szakdolgozat a mesterséges intelligencia (AI) és a mély tanulás (deep learning) területének fejlődését és alkalmazásait vizsgálja a képfeldolgozás kontextusában. Kiemelten foglalkozik a konvolúciós neurális hálózatok (CNN) és a hagyományos gépi tanulási algoritmusok, mint a k-legközelebbi szomszéd (kNN) és a támogató vektor gépek (SVM) erősségeivel és gyengeségeivel a képosztályozás területén. A szakdolgozat részletesen elemez egy specifikus adathalmazt, a 'Stanford Dogs'-t, amely 20,580 képet tartalmaz 120 kutyafajtáról. A dolgozat a neurális hálózatok fejlődését és hatékonyságát vizsgálja a képosztályozás kontextusában, összehasonlítva a LeNet-5, AlexNet, VGGNet, GoogLeNet, ResNet és Xception modelleket. Ezek a modellek egy világos irányt mutatnak a mélyebb és összetettebb architektúrák felé, az előző modellek fejlesztéseire és hiányosságaira építve. Az eredmények egyértelműen azt mutatják, hogy az újabb architektúrák, mint a ResNet és az Xception, pontosság és hatékonyság tekintetében felülmúlják a hagyományos gépi tanulási modelleket, valamint a korábbi konvolúciós modelleket. A dolgozat kritikai elemzése rávilágít arra, hogy a neurális hálózatok architektúrájában nincsenek univerzális megoldások, mivel minden modell egyedi erősségeket és gyengeségeket mutat, amelyek különböző típusú képosztályozási feladatokhoz alkalmassá teszik őket. Például a VGGNet egyszerűsége és mélysége miatt nagy teljesítményű a képek összetett jellemzőinek megragadására, de számításigényes is, míg a GoogLeNet és az Xception a mélység szerint szeparálható konvolúciós rétegekkel egyensúlyt teremt a számítási hatékonyság és a teljesítmény között. A ResNet jelentős előrelépést jelentett a reziduális kapcsolatok bevezetésével, amely lehetővé tette a sokkal mélyebb hálózatok tanítását, az Xception pedig továbbfejlesztett a reziduális kapcsolatokra építve. Összefoglalva, a szakdolgozat mélyrehatóan vizsgálja a különböző neurális hálózati architektúrák fejlődését és hatékonyságát a képosztályozás területén, a tervezési elveket, működési mechanizmusokat és alkalmazási kontextusokat bemutatva. Az architektúrák fejlődése a mélytanulás területén jelentős technológiai előrelépéseket mutat, kiemelve a neurális hálózatok mélységének és komplexitásának fontosságát a képfelismerési lehetőségek javítása szempontjából. 
695 |a képfeldolgozás 
695 |a klasszifikáció 
695 |a Konvolúció 
695 |a mesterséges intelligencia 
695 |a neurális hálózatok 
700 1 |a Kovács Dr. Endre  |e ths 
700 1 |a Kovács Tibor  |e ths 
856 4 0 |u http://dolgozattar.uni-bge.hu/54580/1/Sipos_Gergely_BQE6I1.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/54580/2/Nyilatkozat-szakdolgozat-nyilvanossa_sipos_gergely_AVDH.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/54580/3/BA_O_Sipos_Gergely.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/54580/4/Sipos_Gergely.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/54580/5/BA_B_Sipos_Gergely_ertekeles.pdf  |z Dokumentum-elérés