Sociedade Medio ambiente Política Economía Cultura Lingua Feminismo Educación Internacional Opinión

domingo 03 de maio de 2025

Traducido automaticamente do vasco, a tradución pode conter erros. Máis información aquí.

Elhuyarren itzultzaile automatikoaren logoa

Adimen artifiziala

Latxa: Hitz crea o modelo lingüístico máis grande e libre en eúscaro

Hai pouco presentouse o gran modelo de lingua catalá libre chamado Aina Flor, e na noticia da semana pasada diciamos que o director do Centro Vasco Hitz, Eneko Agirre, anunciou que en breve tamén viña en eúscaro. E onte mesmo fíxose público o Centro Hitz: Latxa. LLM é un gran modelo lingüístico, unha superbase de datos na que se basean as iniciativas de intelixencia artificial. Os LLM son a base das versións ChatGPT de OpenAI, por exemplo. Agora temos un destes, en eúscaro (bo, unha chea de modelos de verdade, formado por 3 corpus).

Sustatu

Artikulu hau CC BY-SA 3.0 lizentziari esker ekarri dugu.

30 de xaneiro de 2024 - 07:30

Imprimir

Segundo Hitz Zentroa "é a familia de modelos abertos" Latxa, que inclúe o "maior modelo lingüístico en eúscaro". Está construída sobre o modelo lingüístico Meta ou Facebook Chama 2 e segue a súa licenza. Chama 2 xa viu excelentes resultados en eúscaro, capaz de realizar unha correcta tradución automática oral en eúscaro a través do produto Seamless M4T. O logo de Latxa é precisamente o que une a Chama e á ovella vasca, aínda que tamén hai unha conexión en nome (como nos pareceu).

Latxa recolle modelos de entre 7 e 70 mil millóns de parámetros. En canto ao conxunto de textos para a construción de modelos, os investigadores vascos han utilizado EusCrawl, un conxunto de textos en eúscaro de 1,72 millóns de documentos e 288 millóns de palabras. EusCrawl extraeuse de 33 webs de contido de calidade, ofrecendo maior calidade que outras técnicas de formación de corpus desde Internet.

De feito, Latxa non se fixo para o público xeral, iso virá máis adiante. Con todo, o tres modelos están dispoñibles na plataforma HuggingFace e poderán ser utilizados polo enxeñeiro experto consultando o “model card”, onde se atopan as instrucións para a información técnica e a iniciación no uso dos modelos.

O desenvolvemento de Latxa foi o resultado dunha iniciativa de investigación, innovación e desenvolvemento, que forma parte do proxecto IKER-GAITIK, apoiado polo Goberno Vasco, en colaboración co programa europeo EuroHpc.

Os modelos lingüísticos actuais teñen un rendemento sorprendente, como o inglés ChatGPT ou o inglés Bard. Con todo, no caso das linguas minoritarias e o eúscaro non. Con estes modelos deu un paso na sesión de Hitz Zentroa para dar a volta á situación, e segundo os seus datos, Latxa responde mellor que outros sistemas ás formulacións en eúscaro.

Máis información, aquí.

En Hugginface: Latxa.

Adimen artifiziala Euskara

Máis leídos

Usando Matomo

Efemeridea: Un grupo de soldados lanzou un cura e sete frades do monte Urgull de San Sebastián ao mar

ARGIA

Efemeridea: ETA anuncia a súa disolución

ARGIA

Declaración de Mikel Zuloaga 'Mikelon' da Flotilla da Liberdade desde Malta

Mikel Zuloaga

Vivir do turismo ou vivir con dificultade?

Sukar Horia

"Como son moi literal, gústame entender o que debuxo"

Olaia L. Garaialde

Interésache pola canle: Adimen artifiziala

2025-02-26 | Mikel Zurbano

DeepSeeken astindua

Silicon Valley-ko oligarkia AEBetako gobernura iritsi berritan lehertu da adimen artifizialaren (AA) burbuila. Txip aurreratuen erraldoia den Nvidia-k urtarrilaren amaieran izandako %16,8ko balio galera, egun bakar batean inoiz izan den burtsa balio galerarik handiena da... [+]

2025-02-26 | Gorka Peñagarikano Goikoetxea

Adimen artifizala zineman: legezkoa bai, baina bidezkoa?

Geroz eta ekoizpen gehiagok baliatzen dituzte teknologia berriak, izan plano orokor eta jendetsuak figurante bidez egitea aurrezteko, izan efektu bereziak are azkarrago egiteko. Azken urtean, dena den, Euskal Herriko zine-aretoak gehien bete dituztenetako bi pelikulek adimen... [+]

2025-02-24 | Zigor Olabarria Oleaga

Diario de Noticias de Álava egunkariko langileen salaketa

“Adimen artifiziala horrela erabiltzea kazetaritzari eta irakurleari iruzur egitea da”

Diario de Noticias de Álava (DNA) egunkariko langileak sinadura greban daude, eta aspaldi ari dira beren lan baldintza “miserableak” eta horiek kazetaritzaren kalitatean duen eragina salatzen. 2013tik soldatak izoztuta dituzte, eta ordutik erosahalmenaren %30... [+]

2025-02-18 | Etzi.pm | Beñat Irasuegi Ibarra

A favor da sabotaxe algorítmica

«I will overturn, overturn, overturn, it[…]»
Ezequiel 21:27 – King James Version

«Por encima de todos os algoritmos, por baixo de todos os
algoritmos» Xabier Landabidea

Sinto incómodo, incómodo coa actitude case relixiosa da nosa sociedade cara á tecnoloxía, e... [+]

2025-02-12 | Jenofa Berhokoirigoin

Europa comprométese a investir 200.000 millóns de euros en intelixencia artificial

Os días 10 e 11 de febreiro reuníronse en París un centenar de xefes de Estado xunto a representantes do sector da Intelixencia Artificial, con motivo do cuarto cume sobre a IA. Aínda que se escoitaron as inquietudes e preguntas sobre esta tecnoloxía que se está... [+]

2025-02-12 | Urko Apaolaza Avila

DeepSeek, o novo foso da xeopolítica

DeepSeek dá unha labazada ás grandes empresas tecnolóxicas de Silicon Valley. O novo e barato chatbot chinés de Intelixencia Artificial puxo en dúbida a superioridade de Estados Unidos neste terreo e demostrou que non se necesitan miles de millóns de euros para modelos... [+]

2025-02-12 | Diana Franco Eguren

Tecnoloxía

Evolución consciente

Que debo saber? Con quen debo relacionarme? Onde debo vivir? Con estas responsabilidades, os seres humanos estamos no camiño de vivir a idea dunha boa vida no seo das nosas sociedades. Si non sabemos responder correctamente, por medo a quedarnos nas marxes.

A semana pasada,... [+]

2025-02-11 | Sustatu

Se Meta ha pirateado en Libg, por que non?

Debido a un caso xudicial en Estados Unidos, Meta, propietaria de Facebook, ha pirateado masivamente a biblioteca da rede de Libg utilizando os protocolos de BitTorrent. Así, obtiveron polo menos 81.7 terabytes para alimentar os seus sistemas de intelixencia artificial. Para... [+]

2025-01-29 | Sustatu

Deepseek AA sorprendente chinés (e excelente en eúscaro)

Deepsee converteuse nunha noticia para o sistema chinés de intelixencia artificial nos últimos días. Segundo difundiuse, o modelo é moito máis barato en desenvolvemento e consumo, pero deu un salto ao nivel no que chegaron Claude ou ChatGPT. Ademais, repartiuse a licenza... [+]

2025-01-28 | Gorka Peñagarikano Goikoetxea

DeepSee

Envexa chinesa: a guerra comercial chámase intelixencia artificial

ChatGPT xa non é "para tanto". DeepSeek ve a luz da man dunha empresa chinesa, un rival máis vivo, máis alcanzable e máis barato. O mundo púxose a bailar e non expresamente para o ben. A empresa estadounidense Mikrotxips Nvidia perdeu unha importante cantidade de diñeiro no... [+]

2025-01-24 | Sustatu

Noticias de TeknoTrump: Xunto aos oligarcas, a iniciativa Stargate AA e a extensión TikTok

O mandato de Donald Trump comezou a aplicar políticas reaccionarias contra todo o que poida ser woke ou DEI, e tamén a través de medidas tecnolóxicas. Desde o primeiro momento, desde que xurou o cargo, a primeira liña de xigantes tecnolóxicos foi rechamante: especialmente... [+]

2025-01-22 | Urko Apaolaza Avila

Trump anuncia o maior investimento da historia para impulsar a Intelixencia Artificial

O novo presidente de Estados Unidos anunciou un investimento de 500.000 millóns de dólares para o proxecto Stargate da OTAN. No evento participan OpenAI, SoftBank e Oracle.

2025-01-10 | Sustatu

Apple inventa extractos de noticias sen preocuparse

Ampliación do almacén de disparates con Intelixencia Artificial. As creadas polos usuarios correntes poden ser en gran medida insensatas, pero os propias xigantes de Internet están a repetir estas situacións e iso parece máis grave, xa que poden ter un impacto global. Un... [+]

2024-11-08 | Leire Ibar

Máis da metade das empresas farmacéuticas utilizan intelixencia artificial

Desenvolver medicamentos "para acelerar, personalizar tratamentos e optimizar procesos internos. O 33% das empresas utiliza a intelixencia artificial na análise de enfermidades e o 29% no desenvolvemento e fabricación de medicamentos.

2024-11-06 | Diana Franco Eguren

Tecnoloxía

Resposta do Creador AA

Hai moitos anos o Dr. Coñecín o abuse chatbot, e tamén me dei conta da velocidade coa que as persoas poden engancharse a estas máquinas. Sendo animais sociais, a relación é natural e necesaria, e como di o nome de 'relación', sempre leva unha resposta por parte do outro... [+]

Eguneraketa berriak daude