"Kostuak jaisten saiatu behar dugu, itzultzaileentzat erremintak sortuz"

  • EHUko Donostiako campusean Sistemen Ingeniaritza eta Automatika Sailean irakasle da. Leioan berriz, Elektrika eta Elektronika Sailean ikerlari. Harrituta dago kazetariak bere tesiari buruz galdetu diolako. Lehen ere hurbildu zaizkio hedabideetatik eta interes hori arraroa egin zaio.
Alicia Perez
"Hogei urte pasa dira eta ez dugu lortu hizkuntza batetik bestera natural eta zuzen itzultzea. Apurka ari gara"Dani Blanco
Kazetaritza independenteak herritarren babesa du arnas
Esan diogu, bere alorra ulertzeko zaila den arren, itzulpengintza automatikoa badela gai interesgarria, hizkuntza gutxituentzat adibidez. Speech and text translation involving basque language: application of stochastic finite-state transducers izeneko tesia egin zuen, zer ikertu duen galdetu diogu: “Makinak itzulpenak egiteko metodo desberdinak ditu. Nik metodo estatistikoa darabilt. Euskaran zentratu naiz, baina berez, estatistikak edozein hizkuntzatik edozein hizkuntzara egitea ahalbidetzen du. Metodo horrek hitzak etiketak edo zenbakiak bailiran tratatzen ditu, lehenengo hitza a hizkuntzan eta bigarren hitza b hizkuntzan. Dena dela, okerrago edo hobeto ibiliko da sistema, hizkuntzek euren artean duten hurbiltasunaren edo urruntasunaren arabera. Estatistikak, euskara eta gaztelaniaren arteko itzulpenetan, azkenean txapuza egiten du, oso-oso hizkuntza desberdinak baitira. Zerbait egiten du, baina gutxi, oraindik bere ahalmena nahiko murritza da.


Estatistikarenaz gain, badira beste metodo batzuk itzulpengintzan, eta nahastu egin ohi dira.


Bai, hori da gaur egungo joera.

Baina estatistika aukeratu duzu.


Bai. Ametzagaiña Taldea itzulpen memoriekin ari zen eta estatistika sartu nahi zuen proiektuan. Eurek lagundu ziguten itzulpen unitateak –izen sintagmak, adibidez– identifikatzen.

Beraz, alde linguistikoa eta estatistikoa nahastu dituzu.


Itzulpen unitateak identifikatu nahi genituen, baina metodo linguistikoen bidez. Metodo estatistikoen bidez esaldiko subjektua, aditza eta bestelako elementuak identifika daitezke. Alabaina, metodo estatistikoek bere logika erabiliz egiten dute zatiketa hori: iruditzen zait honaino dela partiketa. Ondo, baina guk partiketa metodo linguistikoak erabiliz egitea nahi genuen, alegia, unitateak segmentatzea metodo linguistikoen bidez.

Eta horretarako Euskalmeteko eguraldi iragarpenen lagina erabili zenuten.


“Zerua oso hodeitsu egongo da arratsalde partean kostaldean eta mendietan aldiz...”. Horrelako laginak hartu genituen. Alor mugatu baterako aplikazioa da nik landutakoa, eta helburua da aplikazio eremua apurka-apurka handitzea. Baina, hau hasiera baino ez da.

Hori galdetu nahi nizun. Batzuetan badirudi itzulpen automatikoa asmatuta dagoela, hedabideek kontatzeko duten moduagatik, adibidez.


... agerian dago ezetz, bestela denok erabiliko genuke mugikorrean! Ez, ez dago asmatuta.

Nola transmititzen duzue egiten duzuen lana, noraino iritsi zareten azaltzea, adibidez?


Aspalditik ari gara itzulpengintza automatiko estatistikoan. 90eko hamarkadan AEBetan IBMko taldea sortu zen, eta horrek eman zien buelta aurreko metodoei. Hogei urte pasa dira eta ez dugu lortu hizkuntza batetik bestera natural eta zuzen itzultzea. Apurka ari gara uztartzen metodo linguistikoak eta estatistikoak.


Euskararekin bezala beste hizkuntzekin ere berdin aritzen dira lanean?


Azken finean, adimen artifizialeko ezagumenak aplikatzen dira, metodo orokorrak dira aplikatzen direnak problema jakin baterako. Nahiko gatza da gure problema zeren ez da matematika, hizkuntza da, oso aberatsa.


Buelta eman diozu, hizkuntza arazoa dela esan beharrean aberatsa dela diozu.


Erronka da, ea zer ekarri ahal diodan hizkuntzalaritzari nire metodoen bidez.


Itzulpen “perfektua” noiz izango dugun imajinatzen al duzu?


Ez nuke jakingo aurresaten, adibidez, hainbeste urtetan maila ertaineko itzultzailea izango dugu... Google-ek badauka berea, nahiko ona da, baina alor guztietarako aplikagarria al da? Oraindik ez. Hala ere, zientziaren bilakaera oso-oso azkarra da. Garai batean, bospasei urtean inork ez zizun tesia zapaltzen, gaur egun zure gaia urte pare batean zaharkituta geratu da, jende piloa ari da gai horretan.

Jendeak espero du itzultzaile perfektua aurkitzea Interneten, adibidez.


Bai, eta gero bazoaz probatzera eta txarto egiten du, ezta? Biltzarretan-eta aipatzen dena da: zuk zer nahiago duzu, Taiwanetik erositako garbigailuaren eskuliburua taiwanera perfektuan egotea edo euskara xumean? Nik nahiago dut ezagutzen dudan hizkuntzan egotea, akatsen bat badago ere nahiago dut ulertzea, beste hizkuntza batean perfektua izatea baino. Agerian dago itzultzaileen beharra oso handia dela. Kostuak jaisten saiatu behar dugu, itzultzaileei lagunduko dien erremintak sortuz.


Lagungarri beraz.


Euskalmeteko lagina, euskaraz eta gaztelaniaz geneukan, baina publikatzeko ingelesez behar genuen zerbait. Kontratatu genuen itzultzaileak 14.000 esaldi itzultzeko milioi bat pezeta kobratu zigun, ez da asko. Gure sistemak, entrenatuta zegoenean, 1.500 esaldi zuzentzeko segundo batzuk behar izan zituen. Itzultzaileari pasa nizkion esaldiak eta esan nion, “zuk egin duzun lana nireak segundo batzuetan egin du”. Noski, berak bezain ondo ez zuen egin makinak, baina kalitatea begiratzeko esan nion. Harri eta zur geratu zen, “ez dira zuzenak, baina ulergarriak dira” esan zuen. Aitortu beharra dago segundo batzuetan 1.500 esaldi itzultzea ondo dagoela. Gero, itzultzaileari gutxiago kostako zaio esatea ondo ala gaizki dagoen, zerotik itzultzen hastea baino.

Itzulpen automatikoak egiteko corpus bolumen handiak behar dira eta euskarak ez ditu, era berean dauzkagun itzulpen memoriak ez ditugu elkarbanatzen. Ondo ari al naiz?


Nondik aterako ditut laginak? Euskaraz publikatutakoa, doan, erraz eta formatu egokian lortzeko moduan... baldintza larregi dira, zaila da.

Tesirako enpresa batekin jarri zinen harremanetan. Ohikoa da hemen alor akademikoa eta enpresa elkarlanean aritzea?


Nahiko banatuta egoten dira. Unibertsitatean, batzuetan, ez dakigu ebatzitako problemak praktikan zelan jarri. Gero hor dago enpresa mundua gu gure lekuan jartzeko, “horrek ez du ezertarako balio, gaur egungo gizarteak behar duena hau da”. Oso tesi gutxi daude enpresarekin lotuta. Unibertsitatean ahaztu egiten gara gizartearen beharrez, enpresak berriz lurrean kokatuta daude. Gure proiektua sortu zen enpresa batek eskatuta.

Euskara askoz zailagoa da itzulpengintzarako, berezitasun linguistikoak dituelako, ala hori ez da egia eta arazoa corpus falta da.


Batetik, euskara oso bitxia da morfologikoki, atzizkiak jartzen ditu bata bestearen atzetik eta hitzaren esanahia askotxo aldatzen da. Bestetik, sintaxia ere oso bitxia da, gaztelaniaz egiten dena da subjektua, aditza eta osagaiak. Euskaraz ohiko egitura da subjektua, osagaiak eta aditza, eta aditzaren aurretik garrantzitsuena dena. Itzulpengintza egin behar dugunean, bi gauza hartu behar ditugu kontuan: bata, esanahia batetik bestera trasladatzea, eta bestea, gero hitzen orden egokia aukeratzea. Katalanaren eta gaztelaniaren artean ordena nahiko parekoa da, sistemari ez zaio hainbeste kostatzen ordena hori ulertzea, baina sistema estatistikoentzat kristo bat da urrutiko lerrokadurekin lan egitea [euskara eta gaztelania kasu]. Erronka da desberdinak diren hizkuntzen arteko itzulpena egitea.

Euskara eta beste hizkuntza batzuk egongo dira antzeko egoeran, ezta?


Alde horiek kontuan hartuta bai, baina euskarak gainera, baliabide linguistiko gutxi dauka, hiztun gutxi dauka. Baliabide gutxi izanda kalitate bereko gauzak lortzen saiatzea beste erronka bat da.

Alegia, berezitasunetan finlandiera pare da euskara, baina kopuruan finlandierak irabazten dio.


Noski. Orain biltzarretan esaten ari direna da metodo bereziak behar ditugula hizkuntza murriztuak bultzatzeko.
Singapurren egon naiz duela gutxi. Egunkarietan parte batzuk txineraz zeuden eta beste batzuk ingelesez. Itzulpengintza egin nahi baduzu hor ez daukazu corpus paralelorik, alegia, hau honen itzulpena da. Gara egunkariaren kasua bera da.
Erronka da hizkuntza batean zein bestean hurbilpen handia izango duten edukiak aurkitzea.

Azkenak
Dopina

Sentitzen dut, baina kosta egiten zait sinestea. Yeray Alvarez Athleticeko jokalariak analisi batean positibo eman izanak berriro azaleratu du kirolean existitzen den dopinaren inguruko eztabaida. Eliteko kirolean, hobeto esanda; eta horra hor auziaren gakoa. Kirolari... [+]


Gorpu bat aurkitu dute Nagoreko urtegian, Nafarroan

Herritar talde batek bainua hartzen zegoela gorpua aurkitu eta Polizia deitu zuen. Iruñera eraman dute gorpua autopsia egiteko, eta heriotzaren zergatia argitzeko. Gizonak 51 urte zituen.


Ukrainako Indendentzia Egunean, Kievek eta Moskuk 146na preso trukatu dituzte

Arabiar Emirerri Batuen bitartekaritzarekin lortu dute preso trukea gauzatzea. Zelenskik adierazi du Ukrainak "askatasunaren alde" borrokatzen jarraituko duela, herrialdeak independentzia aldarrikatu zuenetik 34 urte bete direnean: "Bakea behar dugu, eta gure... [+]


Israelek Gazako Nasser ospitaleari eraso egin dio, eta gutxienez hemeretzi pertsona hil ditu, tartean lau kazetari

Gazako osasun zentro nagusia bonbardatu du Israelek. Biktimen artean lau kazetari hil daude, Reuters, AP, Al Jazeera eta NBCkoak. 


Imanol (edo futbola gizartearen isla, beste behin)

Futbola herriaren opioa zela zioten batzuk; garrantzitsuak ez diren gauzetan garrantzitsuena dela pentsatzen dute hainbatek; kapitalismo basatienarekin lotzen duenik ere bada… Nire iritziz, gizartearen isla soila da; herritarron gabezia eta arazo askoren isla.

Ez zait... [+]


2025-08-25 | Thomas Barlow
Hizkuntzaren ertzetik erdialdera

Hizkuntzalari ospetsu José Ignacio Hualdek hiru joera nagusi bereizi ditu euskaldun berrien artean, batuarekiko harremanari dagokionez: euskalki biziko herrietan, gazteek etxean euskalkia darabilte eta eskolan batua; gaztelaniaz hitz egiten den hiriguneetan, gehienek batua... [+]


2025-08-25 | Haritz Arabaolaza
Irakasleon figura

Azkenaldian buruari bueltak ematen ari natzaio, hezkuntza publikoaren egoerari. Aurtengo ikasturteko greba garaiak pasa dira eta lan hitzarmen berria sinatu zela denboratxo bat igaro da. Irakasleoi, onerako eta txarrerako, garai hartako odol beroa hoztu zaigula esango nuke. Ez... [+]


2025-08-25 | ARGIA
Euskaltzale independentistak Behorlegiko kanpaldian bildu dira, Nafarroa Behereko EHEk gonbidatuta

Ez diote ezeri muzin egin nahi opor giroan: natura, aisialdia eta gogoeta izango dira ardatz Euskaltzale Independentisten Akanpadan, abuztuaren 25etik 31ra.


Israelek eta Hamasek su-etenerako negoziazioekin jarraitzen dute, Gazan gosetea “larritzen” ari den bitartean

AEBetako Estatu idazkari Marco Rubio astelehenean biltzekoa da Israelgo atzerri ministro Israel Katzekin, su-etenerako akordioez mintzatzeko. IPC Jakien Segurtasunaren Faseen Sailkapen Integratuak agentziak ostiralean kaleratutako txosten batek ohartarazi du Gazan gosete... [+]


Gaskoia irakatsiko dute lehenengo aldiz Samatzeko eta Bidaxuneko eskoletan

Martxan daude okzitanieran jatorria duen hizkuntza berpizteko hainbat ekimen. Ipar Euskal Herrian galzorian dagoen hizkuntza da gaskoia; aurreko mende hasieran galdu zen Hego Euskal Herrian.


Itsas salbamenduak 236 pertsona erreskatatu ditu Kanaria Handitik 429 kilometrora zegoen txalupa batetik

Sahara hegoaldeko gizonak, emakumeak eta adin txikikoak zeuden txalupan. Merkataritza ontzi batek jitoan zebilen txalupa ikusi, soka bat lotu, eta laguntza eskatu zuen.


2025-08-25 | ARGIA
Dani Larrea euskaltzalea hil da, Emun kooperatibaren sortzailea

Gaixoaldi baten ondorioz, 65 urterekin hil da Daniel Larrea Mendizabal. 


Gazte boluntarioak frankismoko memoria berreskuratzen

Azken zortzi urteotan 30 bunker inguru berreskuratu dituzte dozenaka gazte boluntariok; Baztanen, Otsondon, izan da azkena. Ana Ollo kontseilariak bisitatu du auzolandegia eta gazteen ezinbesteko lana txalotu eta eskertu du.


2025-08-25 | Euskal Irratiak
Zigor Akixo
“Euskal Herriari, Miarritzeko herriari eta itsasoari atxikia zitzaion Maite Maniort”

95 urte bete zituela zendu zen Maite Maniort Hennebutte, 2025eko uztailaren 10ean.


Jose Manuel Gorospe zendu da, Euskadiko Filmategiko sortzaileetako bat

Jose Manuel Gorospe Meagas aktore eta kultur ekoizle donostiarra zendu da, 81 urterekin, Madrilen. Bizitza osoa antzerkiarekin eta ikus-entzunezkoen munduarekin era batera edo bestera lotuta pasatu zuen Gorospek, eta, besteak beste, Euskadiko Filmategiaren sortzaileetako bat... [+]


Eguneraketa berriak daude