El centro HiTZ descubre una forma innovadora de crear chatbots en euskera y otras lenguas minorizadas
Hasta ahora, la capacidad de los chatbots para mantener buenas conversaciones dependía de la cantidad de documentos disponibles en Internet de forma abierta en un determinado idioma, pero el nuevo método facilitará enormemente la creación de chatbots comprensibles.
Nuevo método creado por el centro HiTZ. Imagen: EHU
El centro HiTZ de la Universidad del País Vasco ha creado una nueva forma de hacer chatbots capaces de mantener conversaciones en lenguas minorizadas como el euskera, tomando como punto de partida Llama, el modelo lingüístico multilingüe y abierto desarrollado por Meta.
El camino habitual sería alimentar a Llama con textos y ejemplos en euskera, pero ese trabajo manual es muy caro. Según explica Eneko Agirre, director del centro de investigación HiTZ, "hasta ahora solo las grandes empresas han podido asumir" ese trabajo.
Con el objetivo de evitar este trabajo, el centro de investigación ha encontrado un "método innovador y eficiente" para adaptar un chatbot de calidad al euskera. Con el nuevo método, basta con seguir entrenando a Llama con textos en euskera, pero para ello la clave es acertar a aplicar técnicas que hagan frente al denominado "olvido catastrófico".
El trabajo realizado abre nuevos caminos. Por un lado, el propio método se puede aplicar a modelos abiertos más potentes que Llama y, por otro, hacerlo en otras lenguas con un volumen de texto similar al euskera.
De hecho, en inglés hay 1000 veces más de documentos en abierto que en euskera, y en castellano son 100 veces más. Por eso, hasta ahora, la duda ha sido si en las conversaciones iniciadas en lenguas minorizadas se pueden obtener buenos resultados como en las realizadas en inglés o en castellano.
Te puede interesar
¿Para qué sirve y cómo se usa el nuevo botón '+' de la barra de búsquedas de Google?
En el extremo izquierdo de la barra de búsquedas de Google, la lupa ha sido sustituida por el icono '+', que permite seleccionar y adjuntar tanto una imagen como un archivo, de manera que la búsqueda avanzada, asistida por la IA, se lleva a cabo con estos documentos aportados como contexto de base.
Cloudflare resuelve la caída masiva que ha provocado problemas de acceso a millones de webs
Este nuevo fallo sigue a otra importante interrupción global que sucedió hace unas semanas y que afectó a numerosos servicios como la red social X, el 'chatbot' ChatGPT o el videojuego League of Legends.
Netflix adquirirá Warner Bros. Discovery por 82 700 millones de dólares
Las dos compañías han alcanzado un acuerdo este viernes, que incluye los estudios de cine y televisión, así como HBO.
Meta, condenada a pagar 479 millones a la prensa digital por competencia desleal
El Juzgado de lo Mercantil número 15 de Madrid ha condenado a Meta a indemnizar a 87 editoras integradas en AMI por obtener una ventaja competitiva basada en la infracción del RGPD, mediante publicidad comportamental en Facebook e Instagram.
Solucionado el fallo en la red de Cloudflare que impedía usar X, ChatGPT y League of Legends
Hacia las 15:42 horas, la empresa ha informado de que daba por resuelto el incidente, cuya causa ha identificado una hora y media antes, aunque no ha dado detalles: "Seguimos monitorizando los errores para garantizar que todos los servicios vuelvan a la normalidad", ha indicado en su página web.
Bruselas abre una investigación a los servicios en la nube de Amazon y Microsoft
Ni Amazon Web Services ni Microsoft Azure tienen al menos 45 millones de usuarios mensuales en la Unión Europea, por lo que, formalmente, no cumplen los requisitos para designarlos como "guardianes de internet", pero el Ejecutivo comunitario quiere saber si, aún así, tienen suficiente cuota de mercado para minar la libre competencia, según ha dicho en un comunicado.
Elon Musk lanza la "Grokipedia", una enciclopedia hecha con IA que ensalza a Trump y en la que Euskadi no existe
La nueva plataforma impulsada por Elon Musk ha generado casi un millón de artículos mediante inteligencia artificial, pero con un fuerte sesgo ideológico. En su versión actual, Grokipedia no incluye el término “Euskadi”, dedica 20.000 palabras a Donald Trump (el equivalente a un libro de 80 páginas) y ofrece visiones parciales sobre Franco, el SIDA o la esclavitud.
¿Vale la pena invertir más por una televisión de ultra alta definición?
La respuesta es no. Investigadores de la Universidad de Cambridge aseguran que el ojo humano tiene un límite de resolución.
Identificada una operación de distribución de 'malware' a gran escala a través de miles de vídeos de YouTube
Los actores maliciosos utilizaban cuentas de YouTube falsas o comprometidas para publicar vídeos basados en 'software' pirateado y 'hackeos' de juegos, como señuelo para atraer a las posibles víctimas. Pedían descargase archivos para conseguir dichos programas, pero realmente contenían 'malware' que infectaba el dispositivo.
Amnistía Internacional denuncia que TikTok “gana dinero con las inseguridades de los adolescentes”
Un informe de la organización alerta de que el algoritmo de la red social expone a los jóvenes a contenidos sobre automutilación y suicidio. AI reclama a la Comisión Europea y al Gobierno francés medidas urgentes para proteger a los menores.