HiTZ a trouvé un moyen innovant de créer des chats en basque et dans d'autres petites langues
LeCentre HiTZ de l'Université du Pays Basque a créé une nouvelle façon de faire deschatons capables de dialoguer dans de petites langues comme le basque, à partir du modèle linguistique ouvert multilingue construit par le centre de recherche Metaren, Llama.
La voie habituelle serait d'alimenter la Flamme avec des textes et des exemples en euskara, mais ce travail manuel est très coûteux. "Seules les grandes entreprises ont pu le faire pour le moment", expliqueEneko Agirre, directeur du centre de recherche HiTZ.Dans le but d'éviter ce travail, les membres de HiTZ ont trouvé un « moyen innovant et efficace » d'adapter le txatbot à la langue basque. Avec la nouvelle méthode, il suffit de continuer à s'entraîner aveclamasse textuelle en euskara Llama , mais la clé est de réussir à appliquer des techniques pour faire face au problème appelé « oubli catastrophique ».
Le travail effectué ouvre de nouvelles voies. D'une part, la méthode elle-même peut s'appliquer à des modèles ouverts plus puissants que Llama et, d'autre part, elle peut être réalisée dans d'autres langues ayant un volume de texte similaire.
En effet, en ce qui concerne le nombre de documents sur Internet ouvert, il y a 1000 fois plus de documents en anglais en basque et 100 fois plus de documents en espagnol. C'est pourquoi, jusqu'à présent, on s'est demandé si l'on pouvait obtenir des résultats aussi satisfaisants que ceux en anglais ou en espagnol lors d'entretiens en petites langues avec des chats.