A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise

Elmentve itt :
Bibliográfiai részletek
Szerző: Szabó Nóra
További közreműködők: Fábián Gábor
Kovács Dr Endre
Dokumentumtípus: Diplomadolgozat
Kulcsszavak:ábrák
Budapest
ingatlanpiac
Python
regresszió analízis
vizuális modellezés
Online Access:http://dolgozattar.uni-bge.hu/38167

MARC

LEADER 00000nta a2200000 i 4500
001 dolg38167
005 20211105131016.0
008 211105suuuu hu om 000 hun d
040 |a BGE Dolgozattár Repozitórium  |b hun 
041 |a hu 
100 1 |a Szabó Nóra 
245 1 2 |a A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise  |c Szabó Nóra  |h [elektronikus dokumentum] 
520 3 |a Dolgozatom egyik fő célja volt, hogy összefogó képet alkossak Budapest ingatlan piacáról adatvizualizáció segítségével, ami alapján mindenki számára könnyen és gyorsan értelmezhető lesz, hogy a lakásárakat milyen tényezők befolyásolják. Másrészről pedig célom volt, hogy a regresszióanalízis eszköztárát felhasználva becslést végezhessek a budapesti lakásárakra vonatkozóan, ami az adatbázis folyamatos frissítésével bármikor segíthet számunkra jóslást végezni. A kutatásom első részében a web scrapinget, azaz webes adatgyűjtést végeztem az ingatlan.com oldalról, amihez a Selenium web automatizáló eszközét választottam. A programmal a jövőben további adatokat tudok gyűjteni, ami alapján már időszakos elemzéseket is el tudok majd végezni. A szakdolgozat 3. fejezetében a Tableau program közül a Tableau Prep szoftver használata kapott jelentőséget, amivel az adattisztítást és az adattranszformálást végeztem. Az adattisztítás során az volt a célom, hogy a hibás, helytelenül formázott, duplikált vagy hiányos adatokat kijavítsam, az adattranszformálás tekintetében pedig az adatok egyik formátumból a másikba történő átalakítása. Az adatelőkészítés során a Tableau Prep-pel megvalósítható volt az, hogy a hosszú kódsorok helyett egérkattintásokkal alakítsam át az adataimat, ezzel rengeteg időt megspórolva. Ezt követően el tudtam kezdeni feltérképezni Budapest ingatlanpiacát a Tableau Desktop segítségével. A Tableau Desktop számos vizualizációt kínál és emellett útmutatást ad az egyes vizualizációk használatához, és az alkalmazás során egyértelműen bizonyította, hogy méltón az egyik legjobb BI eszköz ma a piacon. Egyértelműen kiderült a vizualizációból, hogy Buda-Pest viszonylatban a budai kerületek jóval felkapottabbak, és ehhez mérten drágábbak is átlagosan, bár az átlagárak közül a versenyt az 5. kerület tartja. Az árakban a pesti kerületekben az 5. kerületen kívül 6., 7. és 13. kerület vezet, azonban utóbbi kerület az, ami összességében a legjobban fejlődő kerület Budapesten, ezért is számos újépítésű lakás kerül meghirdetésre. Abban a kérdés körben, hogy panelt vagy téglát érdemes inkább vásárolni, nehéz egyértelmű választ adni. Az adatokból megállapítható volt, hogy a panel lakások ára alacsonyabb a tégla építésű lakásokhoz képest, azonban ha hosszú távon akar valaki elköteleződni egy ingatlanban, akkor a rezsi árakat figyelembe véve jobb választás a tégla, nem beszélve azok értékállóságáról. Viszont, ha valaki kizárólag befektetés céljából tervez használt lakást venni, annak jobban megérheti panel lakást venni. Hisz be kell látni, bár sokan előítélettel vannak a panel lakásokkal szemben, azok még jó ideig Budapest arculatát fogják képezni, és remélhetőleg a panel program jóvoltából annak megítélése javul nem csak energia-megtakarítást eredményező korszerűsítések, hanem a külső rekonstrukció miatt is. Az utolsó részben pedig sikerült több olyan modell megalkotni, amivel becslést lehet végezni a budapesti lakásárakra vonatkozóan és ezek közül kerestem a legjobbat. Az alapmodell felépítése során lineáris regressziós modell alkottam meg, kiértékelése után igyekeztem tovább javítani a modellt. Ehhez először a Lasso regressziós modellt választottam, ami azonban kifejezetten jobb eredményt nem hozott. Végül a legjobb választást a Gradient Boosting regressziós modell eredményezte a statisztikai mutatókat megfigyelve. Összefoglalva elmondható, hogy a szakdolgozatom elérte célját. A vizualizációs eszközökkel gyors információ átadás vált lehetővé, amelyhez a Tableau szoftver nagy segítségemre volt. A modell alkotás fázisában pedig sikerült a Gradient Boosting regressziós modellel javítani a mutatókat, a lineáris és a Lasso regressziós modellhez képest. 
695 |a ábrák 
695 |a Budapest 
695 |a ingatlanpiac 
695 |a Python 
695 |a regresszió analízis 
695 |a vizuális modellezés 
700 1 |a Fábián Gábor  |e ths 
700 1 |a Kovács Dr Endre  |e ths 
856 4 0 |u http://dolgozattar.uni-bge.hu/38167/1/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_gazdas%C3%A1ginformatikus_%C3%BCzleti%20adatelemz%C5%91.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/38167/2/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_mell%C3%A9kletek.zip  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/38167/3/Szab%C3%B3%20N%C3%B3ra_G8Y2VL_temavazlat-es-osszefoglalas.pdf  |z Dokumentum-elérés