El centro HiTZ descubre una forma innovadora de crear chatbots en euskera y otras lenguas minorizadas

Hasta ahora, la capacidad de los chatbots para mantener buenas conversaciones dependía de la cantidad de documentos disponibles en Internet de forma abierta en un determinado idioma, pero el nuevo método facilitará enormemente la creación de chatbots comprensibles.

HiTZ zentroak hizkuntza txikiagoentzat txatbotak egiteko modu berria deskubritu du — Nuevo método creado por el centro HiTZ. Imagen: EHU

Euskaraz irakurri: Euskarazko eta beste hizkuntza txikietako txatbotak sortzeko modu berritzailea topatu du EHUko HiTZ zentroak

Agencias | EITB

18/06/2025 - 16:20

Última actualización

18/06/2025 - 16:20

El centro HiTZ de la Universidad del País Vasco ha creado una nueva forma de hacer chatbots capaces de mantener conversaciones en lenguas minorizadas como el euskera, tomando como punto de partida Llama, el modelo lingüístico multilingüe y abierto desarrollado por Meta.

El camino habitual sería alimentar a Llama con textos y ejemplos en euskera, pero ese trabajo manual es muy caro. Según explica Eneko Agirre, director del centro de investigación HiTZ, "hasta ahora solo las grandes empresas han podido asumir" ese trabajo.

Con el objetivo de evitar este trabajo, el centro de investigación ha encontrado un "método innovador y eficiente" para adaptar un chatbot de calidad al euskera. Con el nuevo método, basta con seguir entrenando a Llama con textos en euskera, pero para ello la clave es acertar a aplicar técnicas que hagan frente al denominado "olvido catastrófico".

El trabajo realizado abre nuevos caminos. Por un lado, el propio método se puede aplicar a modelos abiertos más potentes que Llama y, por otro, hacerlo en otras lenguas con un volumen de texto similar al euskera.

De hecho, en inglés hay 1000 veces más de documentos en abierto que en euskera, y en castellano son 100 veces más. Por eso, hasta ahora, la duda ha sido si en las conversaciones iniciadas en lenguas minorizadas se pueden obtener buenos resultados como en las realizadas en inglés o en castellano.

Te puede interesar

¿Para qué sirve y cómo se usa el nuevo botón '+' de la barra de búsquedas de Google?

En el extremo izquierdo de la barra de búsquedas de Google, la lupa ha sido sustituida por el icono '+', que permite seleccionar y adjuntar tanto una imagen como un archivo, de manera que la búsqueda avanzada, asistida por la IA, se lleva a cabo con estos documentos aportados como contexto de base.

(Foto de ARCHIVO)

Dramatización de una búsqueda en ChatGPT, a 18 de noviembre de 2025, en Madrid (España). Cloudflare está investigando un fallo en su red global que ha provocado la caída de varios de sus clientes, entre los que se encuentra la red social X, el 'chatbot' ChatGPT y el videojuego League of Legends.

Eduardo Parra / Europa Press

18 NOVIEMBRE 2025;FALLO;CHAT GPT;CONSULTA;FALLO EN LA RED;

18/11/2025

Cloudflare resuelve la caída masiva que ha provocado problemas de acceso a millones de webs

Este nuevo fallo sigue a otra importante interrupción global que sucedió hace unas semanas y que afectó a numerosos servicios como la red social X, el 'chatbot' ChatGPT o el videojuego League of Legends.

(Foto de ARCHIVO)

FILED - 16 February 2025, Berlin: Guests celebrate during the Berlinale's 10th anniversary party for the streaming service Netflix. Photo: Soeren Stache/dpa

16/2/2025 ONLY FOR USE IN SPAIN

Netflix adquirirá Warner Bros. Discovery por 82 700 millones de dólares

Las dos compañías han alcanzado un acuerdo este viernes, que incluye los estudios de cine y televisión, así como HBO.

MENLO PARK (United States), 18/11/2025.- Cars drive past Meta signage at the company's headquarters campus in Menlo Park, California, USA, 18 November 2025. In a major win for tech giant Meta, US District Court Judge James E. Boasberg ruled Meta did not violate antitrust law in its acquisitions of Instagram and WhatsApp. EFE/EPA/JOHN G. MABANGLO

Meta, condenada a pagar 479 millones a la prensa digital por competencia desleal

El Juzgado de lo Mercantil número 15 de Madrid ha condenado a Meta a indemnizar a 87 editoras integradas en AMI por obtener una ventaja competitiva basada en la infracción del RGPD, mediante publicidad comportamental en Facebook e Instagram.

18:00 - 20:00

Solucionado el fallo en la red de Cloudflare que impedía usar X, ChatGPT y League of Legends

Hacia las 15:42 horas, la empresa ha informado de que daba por resuelto el incidente, cuya causa ha identificado una hora y media antes, aunque no ha dado detalles: "Seguimos monitorizando los errores para garantizar que todos los servicios vuelvan a la normalidad", ha indicado en su página web.

Bruselas abre una investigación a los servicios en la nube de Amazon y Microsoft

Ni Amazon Web Services ni Microsoft Azure tienen al menos 45 millones de usuarios mensuales en la Unión Europea, por lo que, formalmente, no cumplen los requisitos para designarlos como "guardianes de internet", pero el Ejecutivo comunitario quiere saber si, aún así, tienen suficiente cuota de mercado para minar la libre competencia, según ha dicho en un comunicado.

Elon Musk lanza la "Grokipedia", una enciclopedia hecha con IA que ensalza a Trump y en la que Euskadi no existe

La nueva plataforma impulsada por Elon Musk ha generado casi un millón de artículos mediante inteligencia artificial, pero con un fuerte sesgo ideológico. En su versión actual, Grokipedia no incluye el término “Euskadi”, dedica 20.000 palabras a Donald Trump (el equivalente a un libro de 80 páginas) y ofrece visiones parciales sobre Franco, el SIDA o la esclavitud.

¿Vale la pena invertir más por una televisión de ultra alta definición?

La respuesta es no. Investigadores de la Universidad de Cambridge aseguran que el ojo humano tiene un límite de resolución.

Malware en un ordenador.

REMITIDA / HANDOUT por FREEPIK

Fotografía remitida a medios de comunicación exclusivamente para ilustrar la noticia a la que hace referencia la imagen, y citando la procedencia de la imagen en la firma

27/10/2025

Identificada una operación de distribución de 'malware' a gran escala a través de miles de vídeos de YouTube

Los actores maliciosos utilizaban cuentas de YouTube falsas o comprometidas para publicar vídeos basados en 'software' pirateado y 'hackeos' de juegos, como señuelo para atraer a las posibles víctimas. Pedían descargase archivos para conseguir dichos programas, pero realmente contenían 'malware' que infectaba el dispositivo.

Amnistía Internacional denuncia que TikTok “gana dinero con las inseguridades de los adolescentes”

Un informe de la organización alerta de que el algoritmo de la red social expone a los jóvenes a contenidos sobre automutilación y suicidio. AI reclama a la Comisión Europea y al Gobierno francés medidas urgentes para proteger a los menores.