ZelaiHandi, euskarazko testuen korpus handi eta (ia) libre bat

  • Orain NLP hizkuntza teknologietako euskal enpresak euskarazko testuen korpus handi bat jarri du sarean, Hizkuntza Eredu Handien (LLM) eta Adimen Artifizialeko ekimenen biltegi nagusia den Hugginf Face baliabidean. ZelaiHandi du izena.

Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

2025eko abuztuaren 18an - 10:34
Kazetaritza independenteak herritarren babesa du arnas

ZelaiHandi bere bigarren bertsioan doa honezkero, eta 660 milioi hitzeko korpus bat da une honetan.

ZelaiHandi euskarazko eredu neuronal handien edo LLMen eraginkortasuna hobetzeko asmoarekin sortu du Oraik, entrenamendu edukien jabetza intelektualaren eskubideak errespetatuz. Llama-eus-8B da horren adibide, eta doitasun handiko elkarrizketa-laguntzaileak, zuzentzaileak eta itzultzaileak garatzen ari gara horren gainean. Euskarazko corpusa zenbat eta handiagoa izan, orduan eta hobea izango da LLMen eta horrelako tresnen eraginkortasuna.

Lizentzia librekoak deitzen die Oraik... baina ez zehazki, ez behintzat berrerabilpen osorako. Zerrendatutako iturrien irudi partzial bat:

Pixkat libretik aldentzen dena, Ekaia delakoa: cc-by-nc-nd da lizentzia hori, eta hortaz, NC edo Non-commercial horrekin ezin da ustiapen komertzialik egin, eta ND edo Non-derivative delakoarekin, lan eratorririk ere ez. Gogora ekar dezagun Creative Commons edukien semaforoa:

Irudian ikusten den bezala, Bizkaiko Batzar Nagusien lizentzia ere pixkat berezia da. Eta baita Gipuzkoako Batzar Nagusiena. Baina tira, oro har, baliabide interesgarria eta balekoa. 


Kanal honetatik interesatuko zaizu: Teknologia burujabetza
Teknologia
Sormenerako suntsipena

Gaztetxo bati lehen mugikor adimentsuak eskaini beharko liokeena zer izan beharko litzatekeen hasi naiz pentsatzen. Nork daki, beharbada ordenagailuetarako Luberri edota Txikilinux sistema eragile libre euskaldunak sortu ziren bezala, mugikorretarako garatu liteke Linage... [+]


2025-07-02 | Sustatu
Herri administrazio europarrak software librerantz (eta AEBen dependentziari muzin)

Hiru adibide azken asteetakoak Europako herri-administrazioak ari direla software librerantz mugitzen. Eta ez bakarrik sendotasun teknikoagatik eta aurrezpen ekonomikoengatik, baita ikusi dutelako AEBetako sistemekin morrontza izatea arazoa izan daitekeela etorkizun hurbilean... [+]


Teknologia
Sabotaje algoritmikoa

Informazio sareetan murgilduta, aktibismo digitalaren inguruan zenbait informaziora heldu naiz. Aktibista digitaletan pentsatzen dudanean, antolaketa moduetan ere pentsatzen dut, denok ez diegu-eta arazoei berdin heltzen. Batzuek aktibismo digitalari komunikazioatik heltzen... [+]


2025-05-27 | Sustatu
Wikikasi, ikas-egoerak landu ikastetxean Wikipediarekin lanean

Ikas-egoera, Wikipediaren arabera, hezkuntzari lotutako ingurune batean egiten den baliabide eta jarduera didaktiko antolatuen bidez egiten den ekimen pedagogikoa da. Eta hain zuzen ere, Euskal Wikilarien Kultur Elkarteak (EWKE), euskarazko Wikipediaren sustatzaileak,... [+]


2025-05-12 | Sustatu
Proiektu deialdia (Euskarabildua): teknologia burujabetza ardatz duten ekimenak

"Teknologia burujabea Euskal Herrian? Zure proiektua ezagutu nahi dugu!": horrela egin du deia Euskarabildua jardunaldiaren antolakuntzak hurrengo ediziorako proposamen eskea eginez. "Azaroan Euskarabildua jardunaldiaren 14. edizioa ospatuko da eta Euskal... [+]


2025-03-19 | Sustatu
EAJ, EH Bildu eta PSE-EE hezkuntzan software libreko plataforma bultzatzearen alde

EAJk, EH Bilduk eta PSE-EEk ekimen bat adostu dute Eusko Legebiltzarrean Hezkuntza Sailari eskatzeko Iradi software libreko hezkuntza plataforma hedatzen jarraitzeko. Zenbait ikastetxetan ezarri da Iradi orain arte. Baliabide partekatuak, komunikazio zerbitzuak (e-posta eta... [+]


“Herri Mugimendua saretu eta eraginkortzeko tresnak eskaini nahi ditu BAMek”

Euskal Herriko bi muturretatik datoz Itziar (Bilbo, 1982) eta Ekaitz (Erriberri, 2002), sortzen ari den Burujabetzaren Aldeko Mugimenduaren berri ematera. Euskal Herrian diren burujabetza prozesu ugariak arloz arlo bultzatu eta indartu nahi ditu BAMek. Lan horretan hasteko,... [+]


Txatbot hoberenaren bila

Azken urteetan, adimen artifizialaren (AA) garapenak hizkuntza gutxituen egoeran eragin nabarmena izan du. Teknologia erraldoiek garatutako eredu nagusiak, hala nola ChatGPT, hizkuntza nagusietan trebatzen dira, eta horrek euskararen moduko hizkuntzak bazterrean uzteko arriskua... [+]


‘Goazen lagunok’: sare sozial toxikoetatik fedibertsora trantsizio kolektiboa

Trumpek AEBetako presidentetza hartuko duen eguna baliatuta, Goazen lagunok lelopean, multinazionalen jabetzako sare sozial "toxikoak" utzi eta fedibertsora trantsizio kolektiboa bultzatzeko kanpaina egiten ari dira eragile ugari. “Internet gizatiarrago batean... [+]


2025-01-15 | Sustatu
Urtarrilak 20: Twitterretik (eta sare toxikoetatik) alde egiteko eguna

Nazioartean ekimen batek baino gehiagok seinalatu du datorren astelehena, 2025eko urtarrilaren 20a, Twitterretik alde egiteko egun gisa. Donald Trumpek ofizialki AEBetako presidentzia hartzeko eguna izango da, eta haren eskutik X/Twitterreko jabea, Elon Musk, Etxe Zurira... [+]


Teknologia
2025ak dakarrena?

2025erako teknologia aurreikuspenen azterketa arina egin dut. Urtero bezala, medioetan 2025ean teknologiak ekarriko duenaz hitz egiterakoan diskurtsoa oso antzekoa da. Teknologiaz idazten dugun askok badugu etorriko denarekiko gehiago jakiteko larritasuna, berria aurreratzeko... [+]


Fedibertsoko edukiak euskarara itzultzeko zerbitzu librea gehitu dute Mastodon.eus-en

Mastodon.eusen euskara da hizkuntza nagusia, baina Fedibertsoa ehunka hizkuntza hitz egiten dituen komunitate global eta bizia da. Horregatik, itzulpenak egiteko Libretranslate tresna librea erabiltzen hasi dira. Horri esker, nazioarteko eragile eta norbanakoek argitaratukoak... [+]


Komunikazio libreago baterantz

Azaroaren 21ean Errenteriako Torrekuan eta Badalaben egon nintzen "Komunikazio libreago baterantz trantsizioan" izeneko jardunaldian.


Teknologia
Hartzea ematea delako

Azken 15 urteetan dugun Internetak hartu duen bilakaera ikusita, duen eredu teknologiko eta negozio ereduari lotuta, gizatasunaren alde txarrenak areagotzeko tresna dela pentsatu dezakegu. Ideia horrekin konforme ez dauden eragileak sortu dira mundu osoan zehar. Honako... [+]


Eguneraketa berriak daude