Segundo Hitz Zentroa "é a familia de modelos abertos" Latxa, que inclúe o "maior modelo lingüístico en eúscaro". Está construída sobre o modelo lingüístico Meta ou Facebook Chama 2 e segue a súa licenza. Chama 2 xa viu excelentes resultados en eúscaro, capaz de realizar unha correcta tradución automática oral en eúscaro a través do produto Seamless M4T. O logo de Latxa é precisamente o que une a Chama e á ovella vasca, aínda que tamén hai unha conexión en nome (como nos pareceu).
Latxa recolle modelos de entre 7 e 70 mil millóns de parámetros. En canto ao conxunto de textos para a construción de modelos, os investigadores vascos han utilizado EusCrawl, un conxunto de textos en eúscaro de 1,72 millóns de documentos e 288 millóns de palabras. EusCrawl extraeuse de 33 webs de contido de calidade, ofrecendo maior calidade que outras técnicas de formación de corpus desde Internet.
De feito, Latxa non se fixo para o público xeral, iso virá máis adiante. Con todo, o tres modelos están dispoñibles na plataforma HuggingFace e poderán ser utilizados polo enxeñeiro experto consultando o “model card”, onde se atopan as instrucións para a información técnica e a iniciación no uso dos modelos.
O desenvolvemento de Latxa foi o resultado dunha iniciativa de investigación, innovación e desenvolvemento, que forma parte do proxecto IKER-GAITIK, apoiado polo Goberno Vasco, en colaboración co programa europeo EuroHpc.
Os modelos lingüísticos actuais teñen un rendemento sorprendente, como o inglés ChatGPT ou o inglés Bard. Con todo, no caso das linguas minoritarias e o eúscaro non. Con estes modelos deu un paso na sesión de Hitz Zentroa para dar a volta á situación, e segundo os seus datos, Latxa responde mellor que outros sistemas ás formulacións en eúscaro.
Máis información, aquí.
En Hugginface: Latxa.
Silicon Valley-ko oligarkia AEBetako gobernura iritsi berritan lehertu da adimen artifizialaren (AA) burbuila. Txip aurreratuen erraldoia den Nvidia-k urtarrilaren amaieran izandako %16,8ko balio galera, egun bakar batean inoiz izan den burtsa balio galerarik handiena da... [+]
Geroz eta ekoizpen gehiagok baliatzen dituzte teknologia berriak, izan plano orokor eta jendetsuak figurante bidez egitea aurrezteko, izan efektu bereziak are azkarrago egiteko. Azken urtean, dena den, Euskal Herriko zine-aretoak gehien bete dituztenetako bi pelikulek adimen... [+]
Diario de Noticias de Álava (DNA) egunkariko langileak sinadura greban daude, eta aspaldi ari dira beren lan baldintza “miserableak” eta horiek kazetaritzaren kalitatean duen eragina salatzen. 2013tik soldatak izoztuta dituzte, eta ordutik erosahalmenaren %30... [+]
«I will overturn, overturn, overturn, it[…]»
Ezequiel 21:27 – King James Version
«Por encima de todos os algoritmos, por baixo de todos os
algoritmos» Xabier Landabidea
Sinto incómodo, incómodo coa actitude case relixiosa da nosa sociedade cara á tecnoloxía, e... [+]
Que debo saber? Con quen debo relacionarme? Onde debo vivir? Con estas responsabilidades, os seres humanos estamos no camiño de vivir a idea dunha boa vida no seo das nosas sociedades. Si non sabemos responder correctamente, por medo a quedarnos nas marxes.
A semana pasada,... [+]
Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]