ARGIA.eus

2020ko abenduaren 02a
Euskara-gaztelania itzultzaile neuronala

Euskaraz gehiago sortzeko baliatuko al dugu?

  • Atzo goizean barrez ari ginen, itzultzaile automatikoak euskarara ekarritako testu tamalgarriak interneten irakurrita. Euskaraz jakin ez eta makinak gaztelaniatik euskarara ondo itzuliko zuelakoan zebiltzan bateren batzuk. Barrez eta haserre, euskararekiko begirune gutxi sumatzen zelako. Gaur seko harrituta gaude tramankuluak asko ikasi duelako eta euskara-gaztelania hizkuntza bikoteko itzulpenak oso balekoak direlako. Hain dira onak, itzultzaile profesionalak ere kezkatuta baitaude.

Onintza Irureta Azkune @oirureta
2020ko martxoaren 01a
Sistemak zenbat eta testu masa handiagoa izan errazago egingo du itzulpen ona.
Sistemak zenbat eta testu masa handiagoa izan errazago egingo du itzulpen ona.

Orotariko Euskal Hiztegiaren hamasei ale, bata bestearen segidan etxeko apalean. Bego Montorio itzultzaileak gogoan du Euskaltzaindiaren ale haiek denak apaletik kendu eta garajera eraman zituen eguna. Jarlekutik altxako zen eta aleetako bati helduko zion begiratu nahi zuen hitzaren lehen letraren arabera. Apala gertu zeukan, erreferentziak bilatzeko liburutegia, berriz, urrunago. Durangon bizita, deitu izan zion Donostiako lagunari Koldo Mitxelena liburutegian halako erreferentzia begiratuko zion galdezka.

Itzultzaile neuronala itzulpenak idazmakinaz egiten zituenarentzat ez da itzulpengintzan eman den jauzirik handiena, are gutxiago iraultza, oraingoz, bederen. “Internet izan zen niretzat benetako iraultza”, esango digu Montoriok. Begirada altxatu eta Uxoa Iñurrietari so egin dio, bestelako bizipenak izango dituelakoan, Montoriok 60 urte baititu eta Iñurrietak 30. Bai, Iñurrietarentzat bere lanbide bizitzako jauzirik handiena izan da. Ez du bestelako aldaketa esanguratsurik ezagutu itzulpengintzan. Iñurrietak itzultzaile jarduna ikerketarekin uztartzen du, eta doktoretza-tesia itzulpen automatikoaren inguruan egin du.

Montorio eta Iñurrieta EIZIE Euskal Itzultzaile, Zuzentzaile eta Interpreteen elkarteko kideak dira. Lehena itzultzaile beteranoa eta bigarrena hasiberria. Elkartean dagoeneko jardunaldiak egin dituzte itzultzaile neuronalak euskara-gaztelania bikote hizkuntzan lortu duen mailaz hitz egiteko. Aitortu dute sektorean kezkatuta daudela, baina ez beldurtuta.

Merkeago lan egiteko eskatzeko arriskua

Iñurrietak eta Montoriok ikusten dute tresna berriak buru-nekea gutxitzeko balio duela lan askotan, baina uste dute lan-baldintzek okerrera egiteko aukerak ere badaudela. Bezeroek arinago eta merkeago aritzeko presioa egin dezakete: makinak lana aurreratuko dizu, beraz, ordu gutxiagoan eta ahalegin gutxiagorekin egingo duzu lan. Montorioren iritziz, oso lan espezializatua da: “Lana hobeto egin dezakegu, eremu batzuetan arinago ere bai, baina lana oso espezializatua da. Nahiz eta itzulpen neuronalaren laguntza izan, prozesu bukaeran pertsona egotea ezinbestekoa da. Profesionalak, testuaren arabera, orain arte eskura izan dituen baliabideak –corpusak, itzulpen-memoriak, bere ezagutza...– eta itzultzaile neuronala uztartuko ditu”. Lan-baldintzez ari garela, Iñurrieta valentziar itzultzaileek kontatutakoarekin gogoratu da. Katalana-gaztelania hizkuntza parearekin lan egiten duten itzultzaileen kobraketa tarifa ez da aldatzen, berdin dio jatorrizkoa hartu eta itzuli duen ala dagoeneko makinak itzulitako testuaren gainean zuzenketak egin dituen. Hizkuntza pare horretan gainera, bien arteko distantzia linguistikoa oso txikia da eta itzultzaile neuronalak oso emaitza onak ematen ditu, euskara-gaztelania bikotean baino hobeak.

Kalitatea gordetzea helburu

Lan-baldintzez gain, mehatxurik garrantzitsuena testuak kalitatea galtzea da. Jendaurrean erakusteko edo beste norbaitek erabiltzeko testuak baldin badira, derrigor profesional batek zuzendu edo moldatu behar ditu. Montoriok eta Iñurrietak hala beharko lukeela diote, baina ez daude batere ziur hala gertatuko den euskara-gaztelania parearekin. Gaztelania-ingelesak eta gaztelania-katalanak, esate baterako, itzultzaile neuronalak elikatzeko testu masa handiak dituzte, eta bigarren hizkuntza parean gainera, oso gertuko hizkuntzak dira. Emaitza hobeak lortzeko berme handiagoa dute.Hala ere, makinek lana egin eta gero pertsonek zuzentzen dituzte testuak.  

Bi itzultzaileek esan digute etorkizunean lanaren parte handi bat postedizioa izango dela. Euskara-gaztelania parean oraindik oso gutxi, baina bestelako hizkuntza pareetan aspalditxotik ari dira itzultzaileak postedizio lanak egiten. Zer da postedizioa? Eman dezagun informatika enpresa handi batek ingelesetik alemanera itzuli nahi dituela hainbat agiri. Bada, lehenbizi etxe barruan, beretzat prestatutako itzulpen neuronalean pasako du testua, eta ondoren itzultzaile profesionalari emango dio testua txukundu dezan. Alegia, profesionalak ez du testua itzuliko, baizik eta makinak itzulitakoa zuzenduko du.

Montorioren eta Iñurrietaren ustez, hizkuntza lautzeko, gure kasuan euskara homogeneizatzeko, arriskua dago. Itzulpen neuronalak bere logikaren araberako itzulpenak egiten ditu eta perfektua ez denez bere erarako akatsak egiten ditu. Itzultzaile profesionalak logika hori ulertzera moldatu beharko du. Bestalde, makinak aurrez eman zaizkion testuak baino ez ditu erabiltzen itzulpenerako eta beretzat aukera onena eta bakarra erakutsiko du. Euskara lautzearen arriskua azaltzeko Montoriok adibide bat eman du: “Proba egin dut. Gaztelaniaz idazten baduzu ‘Uxoa es mi amiga’, euskaraz ‘Uxoa nire laguna da’ itzuliko dizu. Elhuyarren, Vicomtechen eta Eusko Jaurlaritzaren itzultzaile automatikoetan egin dut ariketa eta hiruretan emaitza bera da. Esaldi zuzena da, baina hori bezain zuzena da ‘Uxoa laguna dut’, are egokiagoago kasu batzuetan, eta hori ez dute inoiz proposatu itzultzaile automatikoek”.

Bada kontuan hartzeko beste gauza bat. Gehiena gaztelaniatik euskarara itzultzen da, eta beraz, makinari elikatzeko ematen zaion testu kopuru handiena gaztelaniaz sortua da. Horregatik, gaztelaniaren ordaina eskatu eta euskaraz jaso dugun testu zati hori oso litekeena da euskaraz sortua ez izana. Ez dago bi hizkuntzen arteko orekarik, eta adibidea gogora ekarrita, makinak erdarazko egiturari eutsiko dio.

Bi itzultzaileek zaindu beharreko alorrak aipatu dizkigute, erne ibili beharrekoak, teknologia berriek eskaintzen dituzten abantailak kalterako izan ez daitezen.

Euskaraz gehiago sortuko da?

Itzultzaile automatikoak oso egokiak dira administrazioetako testuak itzultzeko. Gaur egun jakina da eduki horien gehiengoa gaztelaniaz sortzen dela, eta gero euskaratu. Makinak itzulpen lanak erraztuko ditu, beste kontu bat da norabidea aldatu eta euskaraz gehiago sortzeko baliatuko den aukera. Adibide baten berri eman digu Iñurrietak. Orioko Udalak bere webgunean agenda eta albisteak euskaraz baino ez ditu eskaintzen eta irakurlea itzulpen automatikora bideratzen du, gaztelaniaz irakurri nahi badu. Bileretako aktekin beste hainbeste egin daiteke. Euskaraz jaso eta ulertzen ez duen langileak itzulpen automatikoan pasa dezake. Kontrakoa ere gerta daiteke. Administrazioko testuak euskaraz idazten trebatzen ari diren langileek amore eman dezakete eta di-da batean jasoko dute makinak egindako euskarazko itzulpena.
Teknologia jauzi handia. Baliabide esanguratsua itzultzaileentzat. Euskaraz sortutako testu kopuruak gora egiteko aukera aparta. Beste kontu bat da menpekoa den hizkuntzaren alde erabiliko den tramankulua. Goiz da aurreikuspenak egiteko.

 

Zer da itzultzaile neuronala?

Bi adar nagusi ditu. Batetik, sarea, alegia, prozesu matematikoa, eta bestetik, corpusa. Makina gaztelaniazko eta euskarazko testuz elikatuko dute. Sistemak zenbat eta gehiago ikusten duen –testuak, alegia– are gehiago ikasten du. Beraz, testu masa handia edukitzea emaitza onak izateko ezinbesteko elementua da. Jakina, eman zaion testua kaskarra bada sistemak erakutsiko duen emaitza ere kaskarra izango da. Jaten duena botatzen du.

 

Aurrekariak

Eusko Jaurlaritzako Industria Sailak diruz lagunduta, 2016 eta 2017 urteetan Modela ikerketa proiektua egin zuten Ametzagaiña, Elhuyar, ISEA eta  Vicomtech enpresek eta IXA EHUko ikerketa taldeak. Euskara-gaztelania hizkuntza bikoterako itzulpen automatikoan zeuden teknika aurreratuetan ikertzea zen helburu nagusia. Esperimentuetan argi ikusi zuten ordura arte erabilitako sistemetan baino, sare neuronaletan oinarritutako sistemen kalitatea nabarmen hobea zela.
Bide itxaropentsua aurreikusi zuten enpresek eta halaxe izan da. Duela hilabete batzuetatik interneten daude testu zatiak euskaratik eta euskarara oso txukun itzultzen dituzten hiru itzultzaile neuronal.

 

Hiru itzultzaile denon eskura

Elhuyar Fundazioak itzultzailea.eus sistema dauka eta aldiro 100 hitz itzul daitezke.  Vicomtech enpresak batua.eus tramankulua jarri du interneten eta kolpe batean 1.000 hitz itzultzeko aukera dago. Hirugarrena Eusko Jaurlaritzarena da, Vicomtech enpresak garatutakoa: euskadi.eus/itzultzailea. 4.000 hitzeko itzulpena egin daiteke. Itzultzaileok orokorrak dira eta herritar ororen eskura daude. Bai Elhuyar eta bai Vicomtech bezeroentzako sistema berezituak egiten ari dira. Adibidez, Eusko Jaurlaritzak administrazioan erabiltzeko sistema propioa du, Vicomtechek garatua.

 

Zer dator?

Xabier Garcia de Kortazar Vicomtecheko kidea da. Itzultzaileak are hobeak izateko testu asko behar dela azpimarratu du eta euskarazkoak lortzea ez dela batere erraza: “Batzuek altxor moduan gordetzen dituzte eta beste batzuek askatu nahi izanda ere ezin dute, edukiaren anonimotasuna gorde behar dutelako”.

Garcia de Kortazarrek ez du uste itzultzaile orokor bikaina lortzetik hain gertu gaudenik, errazagoa iruditzen zaio bezeroak eskatutakoaren arabera moldatutako itzultzaile berezituak garatzea. Erakunde publikoak gogoan dituela jarri ditu adibideak: Osakidetzari, Justizia Sailari, Ertzaintzari... bakoitzari berea egitea litzateke. Etxetresnak saltzen dituen enpresak gauza bera eska dezake, baita informatika enpresak ere. Enpresa askok dauzkate beste hizkuntzatan haientzako berariaz sortutako itzultzaile neuronalak.

Zer gehiago datorkigu?

Aurki izango ditugun bi aurrerapen teknologiko aipatu dizkigu:

-Berak itzulitako testuan zein zati ondo itzuli dituen eta zein zatitan zalantzak dituen adieraziko du itzulpen automatikoak.

-Corpusa hobetzen saiatuko dira, alegia, sistemari jaten eman zaion testua zuzenduko dute. Adibidez, euskarazko testuei Xuxen pasa dakieke.

Itzulpenarekin zerikusirik ez duten bi berrikuntza ere aipatu dizkigu Garciak: batetik, makina gai izango da testu baten laburpena egiteko, eta bestetik, ulertzeko oso zailak diren testuen bertsio ulerterrazagoak egingo dira. Azken horren bi adibide izan daitezke administrazioko testuak eta sendagaietako erabilera-orriak.


Lanbidea ez da desagertuko

Elhuyar Fundazioak etxean erditu du “munstroa”. Urteak daramatza itzulpen automatikoan lanean. Era berean, itzulpengintza zerbitzua du. Itziar Cortés itzulpengintzarako teknologien arduradunak kontatu digu nola etxeko itzultzaileei itzulpen automatikoaren emaitzak erakusten zizkieten, emaitzarik onena aukeratu zezaten. Lan zaila zuten itzultzaileek, itzulpenak txarrak baitziren. Orain bestelako arretaz aztertzen dituzte makinak egindako itzulpenak: “Esaten dute oso onaren eta oso onaren artean aukeratu behar dutela!”. Txantxetan esaten dute lanik gabe geratuko direla. Itzultzaileen Elkarteko kide Bego Montorio eta Uxoa Iñurrietaren sentsazio antzekoa dute; kezka bai, baina beldurrik ez.

 

Zer itzuliko du?

Batez ere administrazioko testuak itzultzeko da baliagarri. Testuok oso errepikakorrak izaten dira eta emaitza onak lortzeko errazagoa da. Gainera, administrazioak testu masa handiak sortzen ditu. Donostiako Udalean urtebete pasatxo daramate itzulpen neuronala erabiltzen. Beste hainbat administraziotan aztertzen ari dira eta Eusko Jaurlaritzaren Itzultzaile Zerbitzu Ofiziala aurki hasiko da erabiltzen.

Horrezaz gain, bileretako aktak, webguneetako edukiak, salgaien erabilera-orriak, prentsa oharrak... itzultzeko egokia da. Itzultzaile profesionalek sistema ez dute herritar arruntek bezala erabiliko, ez dituzte testu zatiak sartuko interneten publiko dauden hiru tresna horietan. Beste baliabide asko dituzten bezala, haien eguneroko itzulpen-tresnetan txertatuko dute itzultzailea.

Eta nor ari da erabiltzen duela gutxitik edonoren esku jarritako itzultzaileak? Euskaratik gaztelaniarako itzulpenek adierazten dute euskaraz ulertzen ez duen jendea ari dela tresna erabiltzen. Izan liteke sare sozialetan txio bat ulertu ez duelako edo gurasoak seme-alabei etxeko lanak egiten laguntzen ari direlako. Gaztelaniatik euskararako erabilerak ere milaka izan dira.

Ondoko loturetan EIZIE elkartearen webgunean argitaratutako bi artikulu luze dituzue itzulpen automatikoari buruzkoak:

Euskarazko itzulpen automatikoak izan duen ibilbideaz idatzi zuten EHUko Nora Aranberri eta Gorka Labakak: Euskarazko Itzulpen Automatikoa (Atal berezia: Besterena nuen neuregana)

Elhuyarko kide Itziar Cortések eta Saroi Jauregik itzultzaile automatikoak Elhuyarreko itzulpen-zerbitzuan zer eragin izan dituen kontatzen dute: "Itzultzaile automatikoa: mehatxua ala aukera?".
 

 

 

ARGIAn egiten dugun kazetaritza independenteak bultzada merezi duela uste duzu?

Informazio askea lantzen dugu ARGIAn, langileok gara proiektuaren jabeak eta gure informazioen atzean ez duzu sekula multinazionalik, bankurik edo alderdi politikorik topatuko. Gure ustez, burujabetza guztien oinarrian dago informazio burujabetza, ezagutzen dugunaren gainean pentsatzen eta erabakitzen dugu. Horregatik diogu kazetaritza independentea dela demokraziaren oinarrietako bat.

Aldizkaria paperean etxean edo e-postan PDFan jaso nahi duzu? Pozik hartuko zaitugu ARGIAko komunitatean. ARGIAkoa izateko, nahi eta ahal duzun ekarpena egin dezakezu, eta bueltan egoki ikusten duzuna eskatu. Indartu dezagun indartzen gaituena!

Kanal hauetan artxibatua: Itzulpen neuronala  |  Teknologia berriak

Itzulpen neuronala kanaletik interesatuko zaizu...





ASTEKARIA
2020ko martxoaren 01a
Azkenak
EGILEA
Argia buletina
Egunaren laburpena
zure e-postan
Eguneraketa berriak daude