Hoy es noticia
Sanfermines: sexto encierro |

EHU

Guardar
Quitar de mi lista

El centro HiTZ descubre una forma innovadora de crear chatbots en euskera y otras lenguas minorizadas

Hasta ahora, la capacidad de los chatbots para mantener buenas conversaciones dependía de la cantidad de documentos disponibles en Internet de forma abierta en un determinado idioma, pero el nuevo método facilitará enormemente la creación de chatbots comprensibles.

HiTZ zentroak hizkuntza txikiagoentzat txatbotak egiteko modu berria deskubritu du

Nuevo método creado por el centro HiTZ. Imagen: EHU

El centro HiTZ de la Universidad del País Vasco ha creado una nueva forma de hacer chatbots capaces de mantener conversaciones en lenguas minorizadas como el euskera, tomando como punto de partida Llama, el modelo lingüístico multilingüe y abierto desarrollado por Meta.

El camino habitual sería alimentar a Llama con textos y ejemplos en euskera, pero ese trabajo manual es muy caro. Según explica Eneko Agirre, director del centro de investigación HiTZ, "hasta ahora solo las grandes empresas han podido asumir" ese trabajo.

Con el objetivo de evitar este trabajo, el centro de investigación ha encontrado un "método innovador y eficiente" para adaptar un chatbot de calidad al euskera. Con el nuevo método, basta con seguir entrenando a Llama con textos en euskera, pero para ello la clave es acertar a aplicar técnicas que hagan frente al denominado "olvido catastrófico".

El trabajo realizado abre nuevos caminos. Por un lado, el propio método se puede aplicar a modelos abiertos más potentes que Llama y, por otro, hacerlo en otras lenguas con un volumen de texto similar al euskera.

De hecho, en inglés hay 1000 veces más de documentos en abierto que en euskera, y en castellano son 100 veces más. Por eso, hasta ahora, la duda ha sido si en las conversaciones iniciadas en lenguas minorizadas se pueden obtener buenos resultados como en las realizadas en inglés o en castellano.

Más noticias tecnología

Cargar más