"AdiUPek hiru hizkuntzatan egin ditzake bilaketak"

  • Nora Barrosok ez du bizi teknologia garapenerako tresna soiltzat, egindako ororen atzean egiteko modu bat, filosofia bat, dagoela sinesten du. Eta hala azalduko du adiUP: Info7 irratsaioaren albistegietan audio informazio semantikoaren kudeaketa eleaniztuna burutzen duen sistema hitzaldian. Inguruko askoren laguntzarekin egindako tesia du oinarri hitzaldiak.

Zer da adiUP?

Orain ohiko irrati uhinetan badagoen arren, hastapenetan Info7 web irratia zen. Ondorioz, audioak formatu digitalizatuan dituzte eta audioetako bilaketak testu formatukoekin alderatuz ezberdinak dira: hiztunaren edo ahozkotasunaren barnean ezkutaturik daude hitzak eta entzun egin behar dira zer esaten duen jakiteko. adiUPek bilaketak egiten ditu audio horietan.

Nolako bilaketak egiten ditu?

Idatziz eskatzen zaio bilatu nahi dena eta eleaniztuna denez, hiru hizkuntzatan egin ditzake bilaketak: euskaraz, gaztelaniaz eta frantsesez. Hau da Euskal Herriko lehen sistema eleaniztuna, hiru hizkuntza horiek batera lantzen dituena.

Bilaketa zein hizkuntzatan eta zein epe tartetan egin nahi duzun zehazten diozu. Oraindik mugatua da epe hori, Info7k utzitako datu-basearekin eratu genuelako sistema eta oraindik ez dugulako Info7n inplementatu.

Audioen informazioa ere ematen du adiUPek: kategoria (audioak zertaz hitz egiten duen), termino interesgarriak eta iraupena.

Sistemak hitz gako batzuk bilatzen ditu, ez du egiten ahotsaren ezagutza jarraitua, hau da, ni hitz egiten ari banaiz orain, ez ditu bilatzen esaten ditudan hitz guztiak, hitz gakoak bakarrik. Eta horiek mezuaren informazioari lotuta daude.

Nola kudeatzen da informazio semantikoa?

Ontologiak erabili dira, eta ontologia horiek folksonomiatan oinarriturik daude. Folksonomia sailkatze sistema irekia da, erabiltzaileek sortu eta hedatua. Hori da bere ezaugarri indartsuenetako bat: ez dago aditua izan beharrik folksonomia bat sortzeko. Erabiltzaileak kategoria berri bat egin nahiko balu, berak egin lezake, ez luke teknikariaren beharrik. Bilatzailea software bat izan daiteke baina oinarrian egindako lanak, jarrerak eta metodologiak badute garrantzia amaierako emaitzan. AdiUp ez da kutxa itxi bat, euren barne lanari edo kanpoko laguntzari esker hobetu dezaketen tresna da, eta horretan datza filosofiak.

Zailtasunik topatu al duzu adiUP garatzeko orduan?

Horrelako lanabesa sortzeko beharrezkoa den euskarazko corpus nahikorik ez dago. Behar den etiketazio maila oso altua da eta horrek gauzak zailtzen ditu. Gainera, Info7 irrati bat da eta soinu piloa dago atzetik.

Bestalde, garatutako proiektuaren emaitza ikusten da baina horren atzean gauza piloa dago. Euskal Herriko egoera soziokulturala, hizkuntzen elkarbizitza, hartu genuen kontuan adiUP egiteko garaian. Norbaitek gaztelaniazko audioan “Desde Nazio Eztabaidagunea se ha afirmado que…” esan dezake, baina nola ahoskatuko ditu “nazio” eta “eztabaidagune” hitzak? Euskaraz bezala edo beste modu batean? Hori crosslingual efektuaren barne dago. Kasuistika soziokultural hori ere izan dugu kontuan eta, adibidez, transkribatzaile fonetiko eleaniztuna sortu dugu.

Hedapenik izan al dezake adiUP sistemak beste irrati kate batzuetara?

Filosofia, eredu batzuk eta sistemaren bizkarrezurra hor daude. Beste irratiekin moldaketak egin beharko lirateke, sortutako eredu akustikoak baliagarriak diren edo ez ikusi, eta abar.
 


Kanal honetatik interesatuko zaizu: Euskara
2024-03-25 | Leire Artola Arin
Burbuilaren ostean badago zer erein

Irundik Baionara, ezin ezkutatuzkoa izan da 23. Korrikak eragindako harrotasuna. ‘Herri Harro’ leloak zentzua hartu duela ikusi dugu lekuko hartzaileen aurpegietan, eta atzetik euskararen alde oihuka aritu diren korrikalariengan. Bakoitzak bere gorputzetik eta bere... [+]


Inoizko Korrikarik ikusiena izan da

1.700.000 ikustaldi izan ditu EiTBren emanaldiak –Hamaika TBrenak gehitu behar zaizkio–. Pozik agertu dira AEKko arduradunak: “Inoizko Korrikarik erraldoi eta anbiziotsuena lortu dugu, herria harro egoteko modukoa”.


Eguneraketa berriak daude