Természetes nyelvfeldolgozás mesterséges intelligencia segítségével

Elmentve itt :
Bibliográfiai részletek
Szerző: Székely Evelin Adrienn
További közreműködők: Balázs-Papp Ildikó
Kaderják Gyula
Dokumentumtípus: Diplomadolgozat
Kulcsszavak:adatbázis
Google BERT modell
IBM Watson Language Translator
mesterséges intelligencia
PostgreSQL
SQL
természetes nyelvfeldolgozás
webalkalmazás
Online Access:http://dolgozattar.uni-bge.hu/40704

MARC

LEADER 00000nta a2200000 i 4500
001 dolg40704
005 20221003083913.0
008 221003suuuu hu om 000 hun d
040 |a BGE Dolgozattár Repozitórium  |b hun 
041 |a hu 
100 1 |a Székely Evelin Adrienn 
245 1 0 |a Természetes nyelvfeldolgozás mesterséges intelligencia segítségével  |c Székely Evelin Adrienn  |h [elektronikus dokumentum] 
520 3 |a Napjainkban minden vállalat sajátos és komplex adatbázis struktúrával rendelkezik, amiben egy hozzáértőnek is fejtörést okoz eligazodni. A legtöbben az adatbázisok, valamint azok sémái és táblái között sem látják az összefüggéseket, illetve az adatbázisban fellelhető kódneveket sem tudják megfejteni. IT tudásnak minősíthető, ha valaki képes alapszintű adatbázis lekérdezések írására és így képes hozzáférni a számára szükséges információhoz. Emiatt a vállalatok egyrésze egy külön erre a feladatra specializálódott reporting csapatot tart fenn. Az ő feladatuk a beérkező kérések alapján minden adatbázis lekérdezés előállítása, akkor is, ha azok akár triviálisan egyszerűek. Emiatt a többi dolgozót sem hibáztathatjuk, aki nem IT területen dolgozik nem is szükséges, hogy rendelkezzen az ehhez megfelelő adatbázis ismeretekkel. Azonban láthatjuk, hogy a vállalat számára plusz költséggel jár külön erre a célra fenntartani egy egész csapatot, akik más területeken is hasznos informatikai tudással rendelkeznek.  Erre a problémára próbálunk megoldást keresni az IBM Hungary International Shared Service Centre Kft.-nél a Ticket2SQL projekttel, melynek célja, hogy mesterséges intelligencia segítségével képesek legyünk a dolgozók anyanyelvéről lefordítani a beérkező kéréseket SQL-re. A frontend viszonylag hamar elkészült, ugyanis egy fordítóprogram nem igényel túlzottan sok vizuális funkciót. A designhoz pedig igyekeztünk követni az IBM Carbon Design System stíluselemeit.  Ezzel párhuzamosan dolgoztunk a backenden is, illetve a modell mögé helyezésén. A cég profilját tekintve kézenfekvő választásnak tűnt az IBM Watson Language Translatorrel próbálkozni elsősorban. Ám ez a kísérlet sajnos kudarcba fulladt, ugyanis az API nem enged teljesen az elejéről létrehozni egy nyelvet és feltrainelni rá a mesterséges intelligenciát, hanem egy meglévő nyelvet lehet átalakítani. Későn döbbentünk rá, hogy ez inkább egy adott mikrokörnyezetnek a kifejezéstárára képes megtanítani a modellt, és nem egy teljesen új fordítási formára. Emiatt, sajnos akármennyi kérdés-válasz párt adtunk a modellnek tanulás céljára, csupán azt volt képes SQL-re fordítani, amit szó szerint megkapott a trainelés során, minden más kérdést a modell alapnyelvére - spanyolra – fordított. A következő évben újult erővel futottunk neki egy új megoldás keresésének, így jött képbe a Google saját készítésű BERT modellje.  Így pedig a szükséges források összerendezése után késznek mondhattuk az MVP-nket, ugyanis, ha egy dolgozó szeretné a fordítóprogramot egy másik adatbázisra is használni, csupán a szükséges forrásfájlokat kell megadnia nekünk, és mi rövid idő alatt fel tudjuk trainelni a modellt egy másik adatbázisra is. 
695 |a adatbázis 
695 |a Google BERT modell 
695 |a IBM Watson Language Translator 
695 |a mesterséges intelligencia 
695 |a PostgreSQL 
695 |a SQL 
695 |a természetes nyelvfeldolgozás 
695 |a webalkalmazás 
700 1 |a Balázs-Papp Ildikó  |e ths 
700 1 |a Kaderják Gyula  |e ths 
856 4 0 |u http://dolgozattar.uni-bge.hu/40704/1/Sz%C3%A9kely_Evelin_Adrienn_C84L3R_Szakdolgozat.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/40704/2/Sz%C3%A9kely_Evelin_Adrienn_C84L3R_Titkos%C3%ADt%C3%A1si_k%C3%A9relem.pdf  |z Dokumentum-elérés 
856 4 0 |u http://dolgozattar.uni-bge.hu/40704/3/BA_O_Sz%C3%A9kely_Evelin_Adrienn_C84L3R_T%C3%A9mav%C3%A1zlat_%C3%A9s_%C3%96sszefoglal%C3%B3.pdf  |z Dokumentum-elérés