Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí. Elhuyarren itzultzaile automatikoaren logoa

Latxa: Hitz crea o modelo lingüístico máis grande e libre en eúscaro

  • Hai pouco presentouse o gran modelo de lingua catalá libre chamado Aina Flor, e na noticia da semana pasada diciamos que o director do Centro Vasco Hitz, Eneko Agirre, anunciou que en breve tamén viña en eúscaro. E onte mesmo fíxose público o Centro Hitz: Latxa. LLM é un gran modelo lingüístico, unha superbase de datos na que se basean as iniciativas de intelixencia artificial. Os LLM son a base das versións ChatGPT de OpenAI, por exemplo. Agora temos un destes, en eúscaro (bo, unha chea de modelos de verdade, formado por 3 corpus).
Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

30 de xaneiro de 2024 - 07:30

Segundo Hitz Zentroa "é a familia de modelos abertos" Latxa, que inclúe o "maior modelo lingüístico en eúscaro". Está construída sobre o modelo lingüístico Meta ou Facebook Chama 2 e segue a súa licenza. Chama 2 xa viu excelentes resultados en eúscaro, capaz de realizar unha correcta tradución automática oral en eúscaro a través do produto Seamless M4T. O logo de Latxa é precisamente o que une a Chama e á ovella vasca, aínda que tamén hai unha conexión en nome (como nos pareceu).

Latxa recolle modelos de entre 7 e 70 mil millóns de parámetros. En canto ao conxunto de textos para a construción de modelos, os investigadores vascos han utilizado EusCrawl, un conxunto de textos en eúscaro de 1,72 millóns de documentos e 288 millóns de palabras. EusCrawl extraeuse de 33 webs de contido de calidade, ofrecendo maior calidade que outras técnicas de formación de corpus desde Internet.

De feito, Latxa non se fixo para o público xeral, iso virá máis adiante. Con todo, o tres modelos están dispoñibles na plataforma HuggingFace e poderán ser utilizados polo enxeñeiro experto consultando o “model card”, onde se atopan as instrucións para a información técnica e a iniciación no uso dos modelos.

O desenvolvemento de Latxa foi o resultado dunha iniciativa de investigación, innovación e desenvolvemento, que forma parte do proxecto IKER-GAITIK, apoiado polo Goberno Vasco, en colaboración co programa europeo EuroHpc.

Os modelos lingüísticos actuais teñen un rendemento sorprendente, como o inglés ChatGPT ou o inglés Bard. Con todo, no caso das linguas minoritarias e o eúscaro non. Con estes modelos deu un paso na sesión de Hitz Zentroa para dar a volta á situación, e segundo os seus datos, Latxa responde mellor que outros sistemas ás formulacións en eúscaro.

Máis información, aquí.

En Hugginface: Latxa.


Interésache pola canle: Adimen artifiziala
2025-02-26 | Mikel Zurbano
DeepSeeken astindua

Silicon Valley-ko oligarkia AEBetako gobernura iritsi berritan lehertu da adimen artifizialaren (AA) burbuila. Txip aurreratuen erraldoia den Nvidia-k urtarrilaren amaieran izandako %16,8ko balio galera, egun bakar batean inoiz izan den burtsa balio galerarik handiena da... [+]


Adimen artifizala zineman: legezkoa bai, baina bidezkoa?

Geroz eta ekoizpen gehiagok baliatzen dituzte teknologia berriak, izan plano orokor eta jendetsuak figurante bidez egitea aurrezteko, izan efektu bereziak are azkarrago egiteko. Azken urtean, dena den, Euskal Herriko zine-aretoak gehien bete dituztenetako bi pelikulek adimen... [+]


Diario de Noticias de Álava egunkariko langileen salaketa
“Adimen artifiziala horrela erabiltzea kazetaritzari eta irakurleari iruzur egitea da”

Diario de Noticias de Álava (DNA) egunkariko langileak sinadura greban daude, eta aspaldi ari dira beren lan baldintza “miserableak” eta horiek kazetaritzaren kalitatean duen eragina salatzen. 2013tik soldatak izoztuta dituzte, eta ordutik erosahalmenaren %30... [+]


A favor da sabotaxe algorítmica

«I will overturn, overturn, overturn, it[…]»
Ezequiel 21:27 – King James Version

«Por encima de todos os algoritmos, por baixo de todos os
algoritmos» Xabier Landabidea

Sinto incómodo, incómodo coa actitude case relixiosa da nosa sociedade cara á tecnoloxía, e... [+]


Europa comprométese a investir 200.000 millóns de euros en intelixencia artificial
Os días 10 e 11 de febreiro reuníronse en París un centenar de xefes de Estado xunto a representantes do sector da Intelixencia Artificial, con motivo do cuarto cume sobre a IA. Aínda que se escoitaron as inquietudes e preguntas sobre esta tecnoloxía que se está... [+]

DeepSeek, o novo foso da xeopolítica
DeepSeek dá unha labazada ás grandes empresas tecnolóxicas de Silicon Valley. O novo e barato chatbot chinés de Intelixencia Artificial puxo en dúbida a superioridade de Estados Unidos neste terreo e demostrou que non se necesitan miles de millóns de euros para modelos... [+]

Tecnoloxía
Evolución consciente

Que debo saber? Con quen debo relacionarme? Onde debo vivir? Con estas responsabilidades, os seres humanos estamos no camiño de vivir a idea dunha boa vida no seo das nosas sociedades. Si non sabemos responder correctamente, por medo a quedarnos nas marxes.

A semana pasada,... [+]


2025-02-11 | Sustatu
Se Meta ha pirateado en Libg, por que non?
Debido a un caso xudicial en Estados Unidos, Meta, propietaria de Facebook, ha pirateado masivamente a biblioteca da rede de Libg utilizando os protocolos de BitTorrent. Así, obtiveron polo menos 81.7 terabytes para alimentar os seus sistemas de intelixencia artificial. Para... [+]

2025-01-29 | Sustatu
Deepseek AA sorprendente chinés (e excelente en eúscaro)
Deepsee converteuse nunha noticia para o sistema chinés de intelixencia artificial nos últimos días. Segundo difundiuse, o modelo é moito máis barato en desenvolvemento e consumo, pero deu un salto ao nivel no que chegaron Claude ou ChatGPT. Ademais, repartiuse a licenza... [+]

DeepSee
Envexa chinesa: a guerra comercial chámase intelixencia artificial
ChatGPT xa non é "para tanto". DeepSeek ve a luz da man dunha empresa chinesa, un rival máis vivo, máis alcanzable e máis barato. O mundo púxose a bailar e non expresamente para o ben. A empresa estadounidense Mikrotxips Nvidia perdeu unha importante cantidade de diñeiro no... [+]

2025-01-24 | Sustatu
Noticias de TeknoTrump: Xunto aos oligarcas, a iniciativa Stargate AA e a extensión TikTok
O mandato de Donald Trump comezou a aplicar políticas reaccionarias contra todo o que poida ser woke ou DEI, e tamén a través de medidas tecnolóxicas. Desde o primeiro momento, desde que xurou o cargo, a primeira liña de xigantes tecnolóxicos foi rechamante: especialmente... [+]

Trump anuncia o maior investimento da historia para impulsar a Intelixencia Artificial
O novo presidente de Estados Unidos anunciou un investimento de 500.000 millóns de dólares para o proxecto Stargate da OTAN. No evento participan OpenAI, SoftBank e Oracle.

2025-01-10 | Sustatu
Apple inventa extractos de noticias sen preocuparse
Ampliación do almacén de disparates con Intelixencia Artificial. As creadas polos usuarios correntes poden ser en gran medida insensatas, pero os propias xigantes de Internet están a repetir estas situacións e iso parece máis grave, xa que poden ter un impacto global. Un... [+]

2024-11-08 | Leire Ibar
Máis da metade das empresas farmacéuticas utilizan intelixencia artificial
Desenvolver medicamentos "para acelerar, personalizar tratamentos e optimizar procesos internos. O 33% das empresas utiliza a intelixencia artificial na análise de enfermidades e o 29% no desenvolvemento e fabricación de medicamentos.

Tecnoloxía
Resposta do Creador AA

Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]


Eguneraketa berriak daude