ChatGPT, Doctor Chatbot, Botsify, Ada, Doctor Google, Watson Assistant... Adimen artifizialak (IA) ezagutzaren arlo guztiak bete ditu, medikuntza barne. Giza elkarrizketak simulatzen dituzten programek, chatbots izenekoek, egiten zaien galdera bakoitzari diskurtso ordenatu, logiko eta hizkuntza natural batekin erantzuten diote. Gizaki bat bezala. Eta horrek huts egitea ere esan nahi du.
Izan ere, azken ikerketen arabera, chatbotek akats gehiago egiten dituzte gaztelaniaz kontsultatzen zaienean, ingelesarekin alderatuta. Mediku-gaiei dagokienez, behintzat, adituek nabarmendu dute joera hori arriskutsua dela erabiltzaileentzat, eta, beraz, komeni dela IAren garapenean gehiago sakontzea.
Akats gehiago edo gutxiago hizkuntzaren arabera
Ikerketa horietako berriena Georgiako Teknologia Institutuak egin zuen, Estatu Batuetan. Bertan, ikertzaileek gaixotasunei, prozedura medikoei eta medikamentuei buruzko 2.000 galdera baino gehiago egin zizkieten txatbots ezagunenetako biri: OpenAIren GPT-3.5 eta MedAlpaca. Lehenik ingelesez eta gero gaztelaniara, mandarin txinerara eta hindira itzulita, galderak zehaztasun handiagoz edo txikiagoz erantzun ziren, hizkuntzaren arabera.
Zehazki, GPT-3.5ek akats onartezinak egin zituen galderen % 23an txineraz, % 20an espainieraz eta % 45ean hindieraz, baina soilik % 10ean ingelesez. Bestalde, MedAlpaca are gehiago okertu zen, txineraz, hindieraz eta espainolez erantzun hutsalen edo kontraesankorren % 67 baino gehiagorekin.
"Hizkuntza horietako erantzunetan desberdintasun nabarmenak aurkitu ditugu, eta horrek esan nahi du gaitasun eleanitzak hobetu behar direla", azaldu dute azterlanaren egileek. Orduan, alde handia dago chatbot horien eraginkortasunean ingelesaz bestelako hizkuntzetan.
Hizkuntza baten eta bestearen arteko arrakala
Emaitzak kezkagarriak badira ere, arrakala espero izatekoa da hizkuntza handiko eredu gehienak (LLM) nagusiki ingelesezko datuekin entrenatzen direnean. Hori gertatzen da ingelesezko lineako testu gehiago daudelako beste hizkuntza batzuetakoekin alderatuta, eta, beraz, chatbotak okerrago prestatuta daudelako kasu horietan zehaztasunez ulertu eta erantzuteko.
Entrenamendurik ez izateak edo termino medikoak itzultzeko zailtasunak izateak testuingurua ulertzeko zailtasunak sortzen ditu. Adibidez, MedAlpacak akatsak aurkeztu zituen, hala nola hitzak errepikatzea edo beste hizkuntza batzuetan egindako galderei ingelesez erantzutea. Hala ere, egituraren antzekotasunak eta ingelesaren eta gaztelaniaren arteko sintaxiak erantzun sendoagoak eman zituzten txineraren eta hindiaren kasuan baino, nahiz eta nahikoa ez izan gaztelaniaren akatsak saihesteko.
Hizkuntza-arrakala horretarako irtenbideak
Informazio mediko oker baten erruz erabiltzaileak arriskuan jartzeko aukeraren aurrean, adituak lanean ari dira konponbide eraginkorrak lehenbailehen lortzeko. Estrategia horietako batzuk ingelesetik beste hizkuntza batzuetara itzulitako testu medikoen kopurua handitzea eta hizkuntza bakoitzerako eredu espezifikoen entrenamendua dira.
Horretarako, ezinbestekoa iruditzen zaie planetako hainbat lekutako mediku adituak sartzea, aniztasun horrek hizkuntza-arrakala murrizten eta erantzunen zehaztasuna hobetzen lagunduko lukeelako. "Gure aurkikuntzek azpimarratzen dute behar-beharrezkoa dela eredu horien gaitasun eleanitzak indartzea eta informazio-ekosistema ekitatiboa eta guztiontzako irisgarria eskaintzea", ondorioztatu dute.
Are gehiago, "nahitaezkoa da IAk gaur egun dituen mugak onartzea eta horiei heltzea, ingelesez besteko hizkuntzetan zehaztasunez erantzuteko", eta, horregatik, lehentasuna eman behar zaio herritar gehienentzat baliagarriak diren ereduak sortzeari, bai eta ikuspegi inklusiboagoa eta zehatzagoa lortzeari ere.