Eli Pociello: “Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adibidez itzulpen automatikoan”

  • Eli Pociello filologoa EHUko IXA taldeko kide izan da zortzi urtez. Bertan Euskal WordNet, euskarazko lehenengo ezagutza base lexikalaren sorreran parte hartu du. Hain zuzen ere, ezagutza base lexikal hori izan da unibertsitatean aurkeztu berri duen bere doktore tesiaren gaia. Oraindik proiektua garatze fasean dago, momentuz izenak eta aditz batzuk soilik landu baitituzte, baina adjektiboak, adberbioak eta aditz guztiak ere gehitu behar dira. Gaur egun Pociello Elhuyarren dago, haren Zientzia eta Teknologia Hiztegia eta Euskal WordNet lotuko dituen proiektu batean lanean.


2008ko ekainaren 05an - 00:00
Azken eguneraketa: 2014-03-25 09:12:02
Eli Pociello

Zer da ezagutza base lexikala?

 

Datu base baten antzekoa da, baina desberdintasuna da hiztegi batean jasotzen den informazioaz gain –hitzen adierak eta adiera horien definizioak eta adibideak– kontzeptuak elkarren artean harremanetan jartzen direla. Adibidez, hatza eskuko zati bat dela esaten zaigu eta eskua aldi berean besoa kontzeptuarekin harremanetan jartzen dela. Azken finean, kontzeptu guztiak euren artean harremanetan jartzen dira hierarkikoki.

 

Euskal WordNet Lengoaia naturalaren prozesamenduan erabiltzea nahi dugu, adierari begira garatzen diren aplikazioetan. Adibidez, itzulpen automatikoan. Sistemak ulertu behar du zer hitz ari den itzultzen eta horretarako hiztegi baten beharra dauka. Agian hitz baten testuinguruan agertzen den beste hitz baten bidez jakin daiteke lehenengoak zer adiera duen eta horretarako erabiltzen dira kontzeptuen arteko erlazioak.

 

Gaur egun zer tresna daude itzulpen automatikoaren alorrean? Zer emaitza ematen dituzte?

 

Fakultatean eta Elhuyarren egon diren proiektu batzuetan euskara, gaztelania, galiziera eta katalanaren arteko itzulpen automatikoarekin egin dugu lan. Euskararen ezaugarriak oso desberdinak dira beste hizkuntzekin alderatuta. Beste hizkuntzen oinarria latinetik etorritakoa izanda, errazagoak dira itzultzen, baina euskararen kasuan, bere ezaugarriengatik, emaitzak ez dira hain onak. Euskararen alde lan gehiago egin behar da. Sistema hobetu behar da. Horretarako proiektu eta diru laguntza gehiago lortu behar dira.

 

IXA taldeak eta Elhuyar Fundazioak, beste batzuekin elkarlanean Open Trad tresna garatu dute. Oraingoz euskararentzat hori dago. Emaitza eskasak ez, baina hobetzeko modukoak dira, lehen aipatutako arrazoiengatik. Hala ere, testu baten ideia ulertzeko balio du.

 

Erabiltzaile arruntak zertarako erabil dezake Euskal WordNet?

 

Beste hiztegiek bezalako informazioa ekartzen du –itzulpen elebidunak– baina horretaz gain, informazio gehiago ere jakin daiteke. Adibidez, jakin ahal dugu pagoa zuhaitz mota bat dela eta zehazki zer zuhaitz mota den. Nik uste lexikografikoek erabilgarri izango dutela. Hori da orain Elhuyarren egotearen beste arrazoia. Hiztegigintzan lan egiten dutenentzat horrelako baliabideak erabiltzea interesgarria izan liteke hiztegiak sortzeko orduan.

 

Beraz, erabiltzaile arruntarentzat baino gehiago, profesionalentzat da erabilgarri.

 

Bai, erabiltzaile arruntek hiztegi bezala erabiliko dute gehiago. Eta horretarako azken finean ezagutzen dituzun baliabidetara jotzen duzu. Gainera, gure datu base lexikala ez badugu interfazeari dagokionez erabilerrazago jartzen, zailagoa da erabiltzaile arruntak berau erabiltzea.

 


Azkenak
2024-03-31 | Julen Azpitarte
Zinearen historiako film-kontzerturik “onena”

Oscar sari andana jaso zuen The Silence of the Lambs (1991) thriller-a zuzendu zuen Jonathan Demme (1944-2017) zinegile estatubatuarrak estreinatu zuen zineak inoiz eman duen kontzerturik onena: 1970eko hamarkadaren erdialdean New Yorken eratutako Talking Heads taldearen Stop... [+]


"Enpresa pribatuen esku utzi da segurtasun publikoaren norabidea"

Ertzaintzaren azken hamarkadako bilakaera teknologikoa aztertu du bere liburu berrian Ahoztar Zelaieta ikerketa kazetari, kriminologo eta ARGIAko kolaboratzaileak. Segurtasunaren industria ikertu eta Ertzaintzarekin duen lotura plazaratu du, La Ertzaintza que viene... [+]


Campi Bisenzioko GKN fabrikan batu dituzte langile borroka eta ekologismoa

2021eko uztailaren 9an jaso zuten kanporatze abisua Campi Bisenzioko GKN lantegiko 422 langileek. Biharamunean berean abiatu zuten fabrikaren okupazioa eta orduz geroztik bertatik dabiltza borrokan, deslokalizazioaren aurkako borroka zena bestelako industria eredu baten aldeko... [+]


Judith Bilelo Biachó
"Erakundeek ez digute lagunduko, guk geure hizkuntzan hitz egitea lortzen ez badugu"

Judith Bilelo Biachó gure artean izan zen iragan udazkenean, Garabideren Aditu programaren karietara. Ekuatore Ginean jaioa (Malabo, Bioko, 1975), bubi etniako kide da, bubiera hiztun eta hizkuntzaren aldeko militantea. Iraganaz bezainbat mintzo da orainaz, geroari... [+]


Eguneraketa berriak daude