Euskarazko eta beste hizkuntza gutxituetako txatbotak sortzeko modu berritzailea topatu du HiTZ zentroak
Orain arte, txatboten elkarrizketa onak izateko gaitasuna Interneten modu irekian hizkuntza jakin batean idatzita dauden dokumentu kopuruaren araberakoa zen, baina metodo berriak izugarri erraztuko du txatboten jarduna egokiagoa izatea.
HiTZ Hizkuntza Teknologiako Zentroak sortutako metodo berria. Irudia: EHU
Euskal Herriko Unibertsitateko HiTZ Hizkuntza Teknologiako Zentroak euskara eta tankerako hizkuntza gutxituetan elkarrizketak izateko gai diren txatbotak egiteko modu berri bat sortu du, Metaren ikerkuntza zentroak sortutako hizkuntza-eredu ireki eleaniztuna, Llama, abiapuntutzat hartuta.
Ohiko bidea Llama euskarazko testu eta adibideekin elikatzea litzateke, baina oso lan garestia da. “Enpresa handiek soilik egin ahal izan dute oraingoz”, azaldu du Eneko Agirre HiTZ zentroaren zuzendariak.
Lan hori ekiditeko helburuarekin, HiTZeko kideek “bide berritzaile eta efizientea” topatu dute txatbota euskarara egokitzeko. Metodo berriarekin, nahikoa da Llama euskarazko testu-masarekin trebatzen jarraitzea, baina horretarako funtsezkoa da “ahanztura katastrofikoa” deritzan arazoari aurre egiteko teknikak aplikatzen asmatzea.
Egindako lanak bide berriak urratu ditu. Alde batetik, metodoa bera Llama baino indartsuagoak diren eredu irekietan aplika daiteke, eta, bestetik, antzeko testu-bolumena duten beste hizkuntza batzuetan ere egin daiteke.
Internet irekian dagoen dokumentu kopuruari dagokionez, ingelesez euskaraz baino 1.000 aldiz dokumentu gehiago daude, eta gaztelaniaz baino 100 aldiz gehiago. Horregatik, orain arte zalantza izan da txatbotekin hizkuntza gutxituetan mintzatzen ingelesez eta gaztelaniaz egindakoetan adina emaitza onak lor daitezkeen.
Zure interesekoa izan daiteke
Zertarako balio du eta nola erabiltzen da Googleko bilaketa-barraren '+' botoi berria?
Googleko bilaketa-barraren ezkerreko muturrean, '+' ikonoak lupa ordezkatu du. Irudi bat zein fitxategi bat eransteko aukera ematen du, eta, Adimen Artifizialak lagunduta, bilaketa aurreratua egiten du Googlek, irudi nahiz fitxategi horiek testuinguru gisa erabilita.
Cloudflarek konpondu du mundu mailan webgune ugaritan arazoak eragin dituen akatsa
Arazo berri hori duela aste batzuk gertatu zen beste etenaldi global garrantzitsu baten ondoren etorri da. Hainbat zerbitzuri eragin zien, hala nola X sare sozialari, ChatGPT 'chatbot'-ari eta League of Legends bideojokoari.
Netflixek Warner Bros. Discovery eskuratuko du, 82.700 milioi dolarren truke
Bi konpainiek akordio bat lortu dute ostiral honetan, zinema eta telebista estudioak eta HBO barne hartzen dituena.
Prentsa digitalari 479 milioi ordaintzera kondenatu dute Meta, lehia desleialagatik
Madrilgo Merkataritza Arloko 15 zenbakiko Epaitegiak AMIko 87 editoreri kalte-ordaina ematera zigortu du Meta, lehia-abantaila bat lortzeagatik, Facebooken eta Instagramen jokabide-publizitatearen bidez.
X, ChatGPT eta League of Legends berriro martxan dira, Cloudfarek sarean izandako akatsa konpondu ondoren
15:42 zirenean jakinarazi du konpainiak, arazoa konponduta dagoela. Gertatukoaren atzean egon arrazoia ere identifikatu dutela esan dute, baina ez dute zehaztu zer gertatu den. Web orrian honako mezua argitaratu dute: "Akatsak monitorizatzen jarraitzen dugu, zerbitzu guztiak bere onera etor daitezen".
Amazonen eta Microsoften hodeiko zerbitzuen inguruko ikerketa zabaldu du Bruselak
Amazon Web Services eta Microsoft Azure konpainiek ez dituzte betetzen "Interneteko zaindari" izendatzeko baldintzak, ez baitauzkate Europar Batasunean horretarako hilero behar diren 45 milioi erabiltzaile, baina Europar Batasuneko Gobernuak jakin nahi du, hala ere, nahikoa kuota ote duten sektorean lehia askea oztopatzeko.
Elon Muskek Grokipedia kaleratu du, AAz egindako entziklopedia: tresnak Trump goraipatzen du eta haren arabera Euskadi ez da existitzen
Elon Muskek bultzatutako plataforma berriak ia milioi bat artikulu sortu ditu adimen artifizialaren bidez, eta joera ideologiko oso argia islatzen du. Egungo bertsioan, Grokipediak ez du "Euskadi" terminoa barne hartzen, 20.000 hitz eskaintzen dizkio Donald Trumpi (80 orrialdeko liburua egiteko adina) eta Francori, HIESari eta esklabotzari buruzko ikuspegi partzialak ematen ditu.
Merezi al du oso bereizmen handiko telebista bat erostea?
Erantzuna ezezkoa da. Cambridgeko Unibertsitateko ikertzaileek diote giza begiak bereizmen-muga bat duela.
YouTubeko milaka bideoren bidez "malware"a eskala handian banatzeko operazio bat identifikatu dute
Gaizkileek YouTubeko kontu faltsuak edo konprometitutakoak erabiltzen zituzten softwarea pirateatu eta jokoak hackeatzeko bideoak argitaratzeko, balizko biktimak erakartzeko amu gisa. Programa horiek lortzeko fitxategiak deskargatzea eskatzen zuten, baina artxibo horiek, benetan, gailua kutsatzen zuen malwarea zuten.
Amnistia Internazionalak salatu duenez, TikTok "nerabeen autoestimu txikiaz baliatzen da dirua irabazteko"
Erakundearen txosten batek ohartarazi duenez, sare sozialaren algoritmoak automutilazioari eta suizidioari buruzko edukiak helarazten dizkie gazteei. AI erakundeak adingabeak babesteko premiazko neurriak hartu ditzaten eskatu die Europako Batzordeari eta Frantziako Gobernuari.