Euskal Herriko Unibertsitateko (EHU) HiTZ zentroak metodo berri bat aurkitu du elkarrizketak izateko gai den euskarazko chatbot bat sortzeko.
EHUk asteazken honetan ohar baten bidez jakinarazi duenez, ChatGPT bezalako txatboten erabilera etengabe hazten ari da eta haien gaitasunak etengabe handitzen ari dira: testuak laburtzea, edozein gairi buruzko galderei erantzutea, ideiak sortzea, programatzea, dokumentuak sortzea edo testuak itzultzea.
Programa horiek antzeko errendimendua eskaintzen dute gehien hitz egiten diren hizkuntzetan, nahiz eta hain hedatuak ez dauden beste hizkuntza batzuetan, hala nola euskaran, kalitatea ez da hain ona izaten, sarean iraulitako testuen bolumena askoz txikiagoa baita.
Izan ere, Interneten mila aldiz dokumentu gehiago daude ingelesez euskaraz baino, eta ehun aldiz gehiago gaztelaniaz euskaraz baino, zehaztu du iturriak.
Horregatik, hain dokumentu gutxirekin ingelesaren pareko emaitzak lor daitezkeen zehaztea inkognita bat da komunitate zientifikoan.
Aurrerapauso handia
Eneko Agirre EHUko HiTZ ikerketa zentroko zuzendariaren arabera, ikerketa berria "aurrerapauso handia da baiezko erantzunaren bidean, nahiz eta ezjakintasunak oraindik ere badauden".
Artikulu zientifiko berri batean, HiTZko kideek metodo berri bat aurkeztu dute elkarrizketak izateko gai den euskarazko chatbot bat sortzeko. Abiapuntua Metak garatutako hizkuntza-eredu eleanitz eta irekia da, Llama izenekoa.
Ohiko bidea Llama hartzea izango litzateke, euskarazko testu eta adibideekin elikatzea, eta horrek eskulan eta lan garesti handia eskatzen du, orain arte enpresa handiek bakarrik har dezaketena.
Metodo berritzailea
Lan hori saihesteko hainbat bide probatu dituzte HiTZeko kideek, eta, uste zenaren kontra, metodo berritzaile eta eraginkorra aurkitu dute kalitatezko chatbot bat euskarara egokitzeko, eskuzko lanik gabe.
Egindako esperimentu eta garapenek erakusten dute nahikoa dela Llama chatbot-a euskarazko testuarekin entrenatzea, baina horretarako gakoa da "ahanztura katastrofikoa" (katastrophic forgetting ingelesez) izenez ezagutzen den arazoa ekidingo duten teknikak aplikatzea.
Egindako lanak bide berriak irekitzen ditu; izan ere, batetik, metodoa bera aplika daiteke Llama baino indartsuagoak diren eredu irekietan, eta, bestetik, antzeko testu-bolumena duten beste hizkuntza batzuetan ere aplika daiteke.