Euskal Herriko Unibertsitateko HiTZ zentroak Latxa, euskararako lengoaiaren eredurik handiena garatu du. Eredu hori funtsezkoa izango da "chatbots" bezalako tresnak eraikitzeko, hau da, adimen artifizialean oinarritutako aplikazioak, erantzun automatikoak ematean benetako elkarrizketa simulatzen dutenak.

UPV-EHUk ohar baten bidez jakinarazi duenez, lengoaiaren eredu handi bat, edo LLM ingelesez, adimen artifizialeko eredu mota bat da, eta ikasketa automatikoko teknikak erabiltzen ditu "giza hizkuntza ulertzeko eta sortzeko", datu multzo masiboetatik ateratako ezagutzaren bidez.

Euskarak badu bere hizkuntza eredu handia: Latxa. Helmugako LLaMA ereduetan oinarrituta dago, eta 7 eta 70 mila milioi parametro arteko ereduak biltzen ditu, iturriak adierazi duenez.

LLMek sekulako errendimendua dute baliabide asko dituzten hizkuntzetan, adibidez, ChatGPT edo Bard-s ingelesez, baina ez da horrela gertatzen euskara bezalako hizkuntzetan.

Horrek hizkuntzen arteko arrakala teknologikoa handitzen du baliabide asko eta gutxirekin, tresna digitalei dagokienez behintzat, dio EHUk.

Hori arintzeko, HiTZek, EHUko Hizkuntza Teknologiako Euskal Zentroak, eredu berri hau garatu du, LLMetan oinarritutako euskararekin funtzionatzen duten ikerketa, berrikuntza eta produktuen garapena sustatzeko.

Eneko Agirre HiTZko zuzendariak azaldu duenez, eredu ireki horiek argitaratuko dituzte teknikari adituek produktuak garatzeko edo nahi dituzten aplikazioetara egokitzeko erabil ditzaten.

Gaur egun erabiltzaileen jarraibideei jarraitzeko gai diren ereduekin lan egiten dutela adierazi du, baina aitortu du oraindik ez dagoela argi "posible izango den euskararentzako ereduak eraikitzea publiko orokorrari GPTek gaztelaniaren edo ingelesaren kasuan ematen diotena bezalako kalitatearekin".

"Horixe da, hain zuzen, gure ikerketen helburua. Beraz, hau lehen bertsiotzat har daiteke, ikerketari esker eredu hobeak sortzea baita helburua ", ondorioztatu du Agirrek.