A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise
Elmentve itt :
Szerző: | |
---|---|
További közreműködők: | |
Dokumentumtípus: | Diplomadolgozat |
Kulcsszavak: | ábrák Budapest ingatlanpiac Python regresszió analízis vizuális modellezés |
Online Access: | http://dolgozattar.uni-bge.hu/38167 |
MARC
LEADER | 00000nta a2200000 i 4500 | ||
---|---|---|---|
001 | dolg38167 | ||
005 | 20211105131016.0 | ||
008 | 211105suuuu hu om 000 hun d | ||
040 | |a BGE Dolgozattár Repozitórium |b hun | ||
041 | |a hu | ||
100 | 1 | |a Szabó Nóra | |
245 | 1 | 2 | |a A budapesti ingatlanpiac adatvizualizációja és regresszió-analízise |c Szabó Nóra |h [elektronikus dokumentum] |
520 | 3 | |a Dolgozatom egyik fő célja volt, hogy összefogó képet alkossak Budapest ingatlan piacáról adatvizualizáció segítségével, ami alapján mindenki számára könnyen és gyorsan értelmezhető lesz, hogy a lakásárakat milyen tényezők befolyásolják. Másrészről pedig célom volt, hogy a regresszióanalízis eszköztárát felhasználva becslést végezhessek a budapesti lakásárakra vonatkozóan, ami az adatbázis folyamatos frissítésével bármikor segíthet számunkra jóslást végezni. A kutatásom első részében a web scrapinget, azaz webes adatgyűjtést végeztem az ingatlan.com oldalról, amihez a Selenium web automatizáló eszközét választottam. A programmal a jövőben további adatokat tudok gyűjteni, ami alapján már időszakos elemzéseket is el tudok majd végezni. A szakdolgozat 3. fejezetében a Tableau program közül a Tableau Prep szoftver használata kapott jelentőséget, amivel az adattisztítást és az adattranszformálást végeztem. Az adattisztítás során az volt a célom, hogy a hibás, helytelenül formázott, duplikált vagy hiányos adatokat kijavítsam, az adattranszformálás tekintetében pedig az adatok egyik formátumból a másikba történő átalakítása. Az adatelőkészítés során a Tableau Prep-pel megvalósítható volt az, hogy a hosszú kódsorok helyett egérkattintásokkal alakítsam át az adataimat, ezzel rengeteg időt megspórolva. Ezt követően el tudtam kezdeni feltérképezni Budapest ingatlanpiacát a Tableau Desktop segítségével. A Tableau Desktop számos vizualizációt kínál és emellett útmutatást ad az egyes vizualizációk használatához, és az alkalmazás során egyértelműen bizonyította, hogy méltón az egyik legjobb BI eszköz ma a piacon. Egyértelműen kiderült a vizualizációból, hogy Buda-Pest viszonylatban a budai kerületek jóval felkapottabbak, és ehhez mérten drágábbak is átlagosan, bár az átlagárak közül a versenyt az 5. kerület tartja. Az árakban a pesti kerületekben az 5. kerületen kívül 6., 7. és 13. kerület vezet, azonban utóbbi kerület az, ami összességében a legjobban fejlődő kerület Budapesten, ezért is számos újépítésű lakás kerül meghirdetésre. Abban a kérdés körben, hogy panelt vagy téglát érdemes inkább vásárolni, nehéz egyértelmű választ adni. Az adatokból megállapítható volt, hogy a panel lakások ára alacsonyabb a tégla építésű lakásokhoz képest, azonban ha hosszú távon akar valaki elköteleződni egy ingatlanban, akkor a rezsi árakat figyelembe véve jobb választás a tégla, nem beszélve azok értékállóságáról. Viszont, ha valaki kizárólag befektetés céljából tervez használt lakást venni, annak jobban megérheti panel lakást venni. Hisz be kell látni, bár sokan előítélettel vannak a panel lakásokkal szemben, azok még jó ideig Budapest arculatát fogják képezni, és remélhetőleg a panel program jóvoltából annak megítélése javul nem csak energia-megtakarítást eredményező korszerűsítések, hanem a külső rekonstrukció miatt is. Az utolsó részben pedig sikerült több olyan modell megalkotni, amivel becslést lehet végezni a budapesti lakásárakra vonatkozóan és ezek közül kerestem a legjobbat. Az alapmodell felépítése során lineáris regressziós modell alkottam meg, kiértékelése után igyekeztem tovább javítani a modellt. Ehhez először a Lasso regressziós modellt választottam, ami azonban kifejezetten jobb eredményt nem hozott. Végül a legjobb választást a Gradient Boosting regressziós modell eredményezte a statisztikai mutatókat megfigyelve. Összefoglalva elmondható, hogy a szakdolgozatom elérte célját. A vizualizációs eszközökkel gyors információ átadás vált lehetővé, amelyhez a Tableau szoftver nagy segítségemre volt. A modell alkotás fázisában pedig sikerült a Gradient Boosting regressziós modellel javítani a mutatókat, a lineáris és a Lasso regressziós modellhez képest. | |
695 | |a ábrák | ||
695 | |a Budapest | ||
695 | |a ingatlanpiac | ||
695 | |a Python | ||
695 | |a regresszió analízis | ||
695 | |a vizuális modellezés | ||
700 | 1 | |a Fábián Gábor |e ths | |
700 | 1 | |a Kovács Dr Endre |e ths | |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/1/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_gazdas%C3%A1ginformatikus_%C3%BCzleti%20adatelemz%C5%91.pdf |z Dokumentum-elérés |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/2/Szab%C3%B3N%C3%B3ra_G8Y2VL_szakdolgozat_mell%C3%A9kletek.zip |z Dokumentum-elérés |
856 | 4 | 0 | |u http://dolgozattar.uni-bge.hu/38167/3/Szab%C3%B3%20N%C3%B3ra_G8Y2VL_temavazlat-es-osszefoglalas.pdf |z Dokumentum-elérés |