3.062.850 DOKUMENTU TOPATU DITUT

  • Bilatzaileek ahalegin handia egin arren, nahi ditugun web-orriak aurkitzea ez da erraza izaten. Bilaketa egiteko eskatu eta lortutako web-orri zerrendak oso luzeak izaten dira, asko ez dira gure beharretara egokitzen, batzuk abandonatutakoak dira...
Interneten zerbait aurkitu nahi dugunean bilatzaileak erabiltzera jotzen dugu. Nahi adina bilatzaile ditugu eskueran eta askotan zaila izaten da bata eta bestearen arteko ezaugarriak bereiztea. Bilatzaileak datu-base edo informazio-base erraldoietan oinarritzen dira eta hauek etenik gabe automatikoki elikatzen aritzen dira; oro har, elikatzeko bidea robot bilatzailearena izaten da, hauek web-ean argitaratzen dena automatikoki detektatu, indexatu eta indizeak basera kargatzen dituztelarik. Elikatzeko erabiltzen den beste bideetako bat web-orrien kudeatzaileek, interesgarri deritzoten bilatzaileetan, eskuz alta ematearena izaten da.
Interneten egunero hainbat eta hainbat web-orri berri sortzen da eta beraz web-orrien kopurua etenik gabe hazten ari da. Aldi berean badago hazkunde esponentziala duen beste prozesu bat, hots, web-orrien desagerketarena edo abandonaketarena; web-orria desagertzen denean, gehienetan erreferentzia ez da bilatzaileen datu-baseetan ezabatzen eta ondorioz, erreferentzia horren gainean klik egitean desagerpen-abisua edo errore-mezua azaltzen zaigu; web-orrien abandonaketa da, ezbairik gabe, Interneten gehien hedatu den gaixotasuna eta horren froga erraz topa dezakegu edozein bilaketa egin ondoren aurkitutako orriaren eguneraketa-data ikusiz. Honen harira esan, oso ohikoa izaten dela enpresek edo partikularrek web-orriak diseinatzea, Interneten kokatzea eta ahaztea, hau da, Interneten banago eta egin beharrekoa egin dut pentsatzea. Jokatzeko era honek Internetekiko plan estrategikorik ez izatea erakusten du eta hau askorentzat Internet moda baino ez delako gertatzen da.
Beraz, Interneten informazio-posibilitateak zabaltzen doazen neurrian, lastrea ere handituz doa; horregatik gero eta korapilotsuagoa da buruan dugun kontzeptua zehaztasunez eta kalitatez, nolabait esatearren, lortzea.
Kasurik onenean ere, hau da, lastrea alde batera utzita, milaka edo milioika erreferentzia dituen emaitzarekin topo egitea nahikoa arrunta da. Adibidez, artikulu honen izenburuko zenbakia dugu, hau "cat" hitza Altavista bilatzailean idatzi ondoren ateratako emaitza baita.


NOIZ TOPATUKO DUT BEHAR DUDANA?

Halere, oraindik Interneten nahi duguna aurki dezakegu, gehiago edo gutxiago kostata, baina informazio-bilatzaileak gero eta kezkatuago daude arestian aipatu arazoekin. Zer egin, bada, egoera horren aurrean?
Orrien desagerketaren edo abandonaketaren aurrean robot bilatzaile gero eta ahalmentsuagoak garatzen ari dira. Hauek, orriak desagertzean edo abandonatzean, detektatu eta datu-basean erreferentzia ezabatzeko posibilitatea izan behar dute. Garbiketa-prozesuak etenik gabekoa izan behar du eta nahiz eta ez lortu informazio-basea %100 eguneratuta mantentzea, eskaintzen dena kalitate minimo batekin eskainiko da.
Dena den, arazo larrienak, buruan dugun kontzeptua ahalik eta fidagarritasun gehienez bilatzea, izaten segituko du. Orain arteko bilatzaile gehienek hitzak edota hauen arteko elkarketak erabiltzen dituzte bilaketarako oinarri gisa eta gainera bilaketa, hitza idatzi dugun lengoaian bakarrik burutzen da. Hau da, "etxe" hitza dituzten testuak eskuratu nahi baditugu, ez zaizkigu "maison", "casa" edo "house" dituzten testuak azalduko. Gainera buruan dugun kontzeptuak adierazteko ez da nahikoa hitzen arteko elkarketa hutsa egitea, baizik eta esaldiak, perpausak edo parrafoak dira kontzeptu horiek adierazteko bide naturalena. Adibidez, "New Yorkeko burtsen gorabeherak" azaltzen dituen informazioa bilatzeko ez da nahikoa "New York" eta "burtsa" eta "gorabehera" hitzak elkartzea, baizik eta sistemak nolabait ulertu beharko luke indize ekonomiko zehatz baten bilakaerari buruzko informazioa eskatzen zaiola.
Munduan dauden bilatzaileen oinarri edo justifikazio teknologikoa hizkuntzekin erabat loturik doa eta horrela, teknologian zabalduen dagoen hizkuntza ingelesa denez, berau da bilatzaile gehienen motorra. Motor honek euskararen gisako hizkuntza deribatiboetan neurri batean baino ez du balio, kontuan hartu behar baita ingelesezko hitzek oso forma eratorri gutxi dituztela eta aldiz, euskal hitz bakoitzari nahi adina atzizki erants dakiokeela.
Ildo honetan Euskal Herrian garatzen ari den informazio-teknologiak, euskara euskarri gisa duen neurrian, atzerriko bilatzaileen teknologiarekin desberdintasun nabarmenak ditu. Batez ere, bi dira euskararen ezaugarriak kontuan hartuz bilatzaileak eta hizkuntzaren teknologia oro har, garatzen ari diren ikerketa-taldeak, Ametzagaiña Taldea eta IXA Taldea. Nahiz eta bi taldeok ikerketarako teknologia desberdinak erabili, lortutako bilatzaileek hitzen lema dute oinarritzat, hau da hitzei itxura kendu eta erroa hartzen da bilaketa-tresna gisa.


AMETZAGAIÑA.

Ametzagaiña Taldeak hizkuntzaren ingeniaritzan hasieratik orain arte egindako bideak helburu nagusi bat duela esan daiteke, eta hau, sistema informatikoak esaldiak ulertzea da. Ildo honetan, Kapsula deituriko produktu teknologikoa sortu du eta honek hitzen lematizazio automatikoa egiten duenean, automatikoki jasotzen diren hainbat datu gaur indarrean duten bilaketa-sistemarako beharrezkoak ez badira ere, laster helduko zaion analisi semantikoan garrantzi berezia izango dute. Hortaz, euren tresna eta teknologiak prozesu ebolutibo jarraian kokatu dituzte eta bilatzaileak hasieran oso esaldi sinpleak baino ulertuko ez baditu ere, prozesu geldiezin horretan esaldi gero eta konplexuagoak eta beste hizkuntza batzuetan idatzitakoak ere ulertzen joango da.
Ildo honetan, Kapsularen robot web-bilatzaileak, urte honen bukaerarako baliabide garrantzitsu bat izango du, hots, web-orrietan eskuratutako informazioaren katalogazioa automatikoki egitearena. Lehen unean baliabide hau euskarazko informazioarentzat soilik izango da, baina datorren urtean zehar gure kulturan eragina duten hizkuntzentzat ere inplementatzen hasiko da. Honela Kapsula sisteman oinarritutako bilatzaileek, berme teknologikoa eskainiko die bai sistemetako administratzaileei, baita erabiltzaileei ere; batzuek informazioa lortzeko eta antolatzeko tresnak izango dituzten bitartean, besteek kontsulta gero eta zehatzagoak egiterik izango dute.


IXA TALDEA.

IXA taldeak jorratu eta jorratzen dituen ikerketa-lerro nagusiak hiru arlotan bana daitezke erabilgarritasunari begira: oinarriak, tresnak eta aplikazioak. Lehenari dagokionez, oinarrizko tresna linguistikoak ikertzen dituzte, hala nola, datu-base lexikala, testu-bildumak eta hauek prozesatzeko tresnak. Tresnei dagokienez, aplikazioak egiteko erabiltzen diren tresna orokorrak honakoak dira: lematizatzailea, analizatzaile sintaktikoa, desanbiguatzaile semantikoa eta abar. Ixa taldeak edota beste enpresek erabiltzeko aplikazioak zuzentzaile ortografikoa, estilo zuzentzailea, Web bilatzaileak eta hiztegi adimendunak dira batik bat.
Iñaki Alegria Ixa taldeko kideak adierazi digunez, "unibertsitatean gaudenez lehen bi arloak dira inportanteenak guretzako. Aplikazioak hutsuneak betetzeko edo enpresekin lankidetzan garatzen ditugu. Horrela Xuxen Hizkia eta Uzeirekin lankidetzan garatu da eta Web bilatzailea Plazaguneak garatu du guk garatutako zenbait teknologia integratuz".
Ixa taldeak garatu duen bilatzaileak lematizazio bidez bilatzen du euskarazko testuetan, baina talde kideek zaila ikusten dute beste hizkuntzetarako baliatzea.
Garatzen duten aplikazioetan ezagumendu linguistikoa oso garrantzitsua da eta hori euskararako garatu da. Prestatutako programek, batzuetan, aukera ematen dute beste hizkuntzetan aplikatzeko baina hizkuntza horietarako ezagumendu linguistikoarekin osatu beharko litzateke. Alegriaren ustez, "gure lana baino gurekin aritzen diren enpresen lana dela esango nuke gure teknologia beste hizkuntzetarako baliatzea".


GIZARTERATZEA ETA KOMERTZIALIZAZIOA.

Ixa taldea unibertsitateko irakasleek osatzen dutenez, produktuen gizarteratzea edo komertzializazioa enpresen bidez garatu nahi dute. Beraien ideala da enpresekin elkarlanean aritzea eta enpresen lana litzateke komertzializazioa. Enpresarik ez badago horretan interesaturik taldeak berak merkaturatzen du baina salbuespen gisa. Alegriak dioenez, tresna horiek garatzea garestia izaten da, eta euskararen inguruko merkatu txikiak enpresei ez interesatzea eragiten du, laguntza publikorik ez badago behinik behin.
Euskarak eta euskal gizarteak ingeniaritza linguistikoaren alorrean dituen premia gisa segidakoak irizten ditu Iñaki Alegriak.
Oinarriak eta tresna orokorrak garatzen dituzten neurrian horretan sentitzen dute behar handiena: Erreferentzia-corpus zabal, landu eta publiko bat, analizatzaile morfologiko, sintaktiko eta semantiko orokorrak eta horiek eraiki ahal izateko hainbat lan linguistiko sakon: euskararen sare semantikoa, aditzaren azpikategorizazio osoa... Hori eginda aplikazioak garatzea askoz errazagoa omen da. Aplikazioen munduan erabiltzaileek agintzen dutela dio Alegriak "baina hona hemen datorren urtetan garatu beharko diren batzuk: itzulpenerako laguntzak, terminologia lantzeko tresnak, estilo-zuzentzailea eta euskara ikasteko sistema aditua". Hau guztia testuen gainean, ahotsarekin sartuz gero beste hainbat behar dago eta beste talde batzuk daude horretan lanean.
Ixa taldeak garatu duen Xuxen zuzentzaile ortografikoari dagokionez, hil honetan Euskaltzaindiaren azken arauak jasotzen dituen bertsioa aterako da, azaro-abenduan Mac-erako bertsioa eta 2001eko hasieran Xuxen3 zenbait berrikuntzarekin.


Azkenak
Elikagaiak jasotzeko “diru-txartelak”, familia zaurgarrienentzat Nafarroan

Europako Funts Sozialen ataletik Elikagaien Bankuetara bideratzen zuten urtero dirua eurek bidera zezaten janaria behar gehien duten herritarren artean. Aldaketa iritsi da kudeaketara orain: adin txikikoak dituzten familiei diru-txartelak emanen dizkiete produktuak erosteko. 130... [+]


2024-10-15 | Sustatu
Jabetze Eskola Gasteizen, feminismoaren adibideen ildotik, euskalgintzarako

Gasteizko Izaskun Arrue Kulturguneak (IAK) eta UEUk elkarlanean Euskaldunentzako Jabetze Eskola martxan jarriko dute, euskaldunok ahaldundu, eta ondorioz, jendartea eraldatzeko asmoz. Aurkezpen hitzaldia urriaren 30ean egingo du Garikoitz Goikoetxeak. "Hizkuntzaren... [+]


2024-10-15 | Julen Orbea | Zuzeu
Bizitza oroit dezagun

1944an, Stauffenberg-en agindupean, Hitler bonba batekin hiltzen saiatu ziren, soldadu eta herritar alemaniar batzuen artean prestatutako ekintza baten. Hurrengo hilabeteetan naziek 90 pertsona exekutatu zituzten ekintza haren ondorioz.


Urruña eta Segurako udalek ofizialdu egin dituzte herritarrek sortutako zubiak

Herritarrengandik sortu eta hiru hamarkadaz eraikitako harremanaren ondotik, Hego Lapurdi eta Goierriko bi herri hauen arteko senidetze edo birazkatze ofiziala egin dute igandean Urruñako plazan. 30 urteko mugarri, egun «historikotzat» jo dute Filipe Aramendi... [+]


Mecaner Herriarentzat
“Fabrikaren erosketa publikoa behar dugu”

Stellantis multinazionalak Mecaner lantokia itxi eta 148 behargin kalean utzi ditu Urdulizen (Bizkaia); horren aurrean, "Mecaner Herriarentzat" alternatiba ekosoziala sortu dute hainbat eragilek. LAB sindikatuko Iraide Juaristik eta Jauzi Ekosozialeko Aitor Gallastegik... [+]


Galizieraren egoera larriaz ohartarazi dute, azken datuak ikusita

Ezagutza eta erabilerak, biek, egin dute atzera Galiziako Estatistika Institutuak jakinarazitako azken datuetan. Galera handiagoa da adin tarte gazteenetan. 5 eta 14 urte artekoen herenak adierazi du galiziera gutxi edo batere ez dakiela.


2024-10-14 | Julene Flamarique
Udalatx mendiko gurutzea eraitsi eta... idazki misteriotsu bat utzi dute

Arrasateko Udalak sare sozialetan jakinarazi duenez larunbat goizaldean kendu zuten ezezagunek gurutzea. Bizkaia eta Gipuzkoa arteko mugan zegoen kokaturik, 1.120 metroko garaieran. 1971. urtean jarri zen eta 250 kiloko pisua eta 10 metroko luzera zituen. Oraingoz ez da gurutzea... [+]


Zer esan nahi dute ‘begiratu’, ‘ulertu’ eta ‘pertsona’ hitzek?

Ez da akaso harrotasun seinale nire aurrean dauden pertsonak pertsona izango ez balira bezala begiratzea? Bai, noski baietz. Baina nola espero dugu bestela besteak ulertzea? Ulertu, behatu, begiratu. Besteak ulertu nahi izateak, ez du jarrera harro hau eskatzen? Ni pertsona... [+]


Genozidioaren egunkariak

Urtebete igaro da, diotenez. Ez dut sekula ulertu mendebaldarrok daukagun ohitura harroputz hau: nahiz eta gatazkak ia mende bateko iraunaldia izan, datak nahierara moldatzen ditugu, garrantzia nolanahi oparituz. Azkeneko sasoia ezberdina izan al da beren lurraldean preso... [+]


2024-10-14 | Leire Ibar
Lekeitioko Euskal Zine Bilerak 47. edizioa du aste honetan

47 urte beteko ditu zine jaialdiak, eta urriaren 16tik 21era, solasaldi eta tailerren bidez euskal zinemagintzaren alor ugari landuko dituzte. “Beti berria den zinema” lelopean, aurtengo jaialdiak zine berria eta istorio berriak kontatu nahi dituzten gazteei keinu... [+]


2024-10-14 | Leire Ibar
Gasteizko euskalgintzak egun osoko egitaraua antolatuko du urriaren 19an

“Gasteiz euskararen hiria” ekimena ospatuko dute urtarrilaren 19an Arabako hiriburuan. Euskaraz egingo diren ekintza ezberdinek osatuko dute hamabi orduko egitaraua. "Euskara protagonista izatea" da ekimenaren helburua.


2024-10-14 | iametza
Educamadrid eta MAX: burujabetza teknologikoa Madrilgo hezkuntza sisteman

EducaMadrid software librean oinarritutako hezkuntza plataforma 2002an jarri zen martxan Madrilgo Erkidegoan eta egun milioi bat erabiltzaile inguru ditu. Bertako kide Daniel Estebanek plataformaren aurkezpen praktikoa egingo du urriaren 17an Donostiako San Telmo museoan egingo... [+]


2024-10-14 | ARGIA
40 estatuk “gogor gaitzetsi” dute Israelek NBE-n kasko urdinei eraso egin izana

Azken egunetan gutxienez Nazio Batuen Erakundeko bost kasko urdin zauritu ditu Israelgo armadak, UNIFIL Nazio Batuen Libanorako Indar Behin-Behinekoak duen egoitza nagusiaren kontrako erasoetan, Naqoura herrian. Netanyahuk esan du kasko urdinak “giza ezkutu” gisa... [+]


Eguneraketa berriak daude