LA INFRAESTRUCTURA PÚBLICA D’IA EN CASTELLÀ I LLENGÜES COOFICIALS

ALIA és una iniciativa pionera a la Unió Europea que busca proporcionar una infraestructura pública de recursos d’IA, com els models de llenguatge oberts i transparents, per a fomentar l’impuls del castellà i les llengües cooficials -català i valencià, basc i gallec- en el desenvolupament i desplegament de la IA en el món.

hero

L’objectiu és facilitar la creació d’una nova generació de recursos i serveis tecnològics innovadors enriquits amb l’immens patrimoni lingüístic del castellà, parlat per 600 milions de persones al món, i les llengües cooficials.

Es tracta de la primera infraestructura pública europea, oberta i multilingüe que, gràcies a les capacitats úniques de supercomputació del Barcelona Supercomputing Center, reforça la sobirania tecnològica d’Espanya i Europa en el desenvolupament d’una IA transparent, responsable i al servei de les persones.

Aquest projecte està coordinat pel Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), amb l’impuls i lideratge de la Secretaria d’Estat de Digitalització i Intel·ligència Artificial. Així mateix, forma part de l’Estratègia d’Intel·ligència Artificial 2024, posada en marxa pel Govern d’Espanya.

ES TRACTA DE  LA PRIMERA INFRAESTRUCTURA PÚBLICA EUROPEA  QUE, GRÀCIES A LES CAPACITATS ÚNIQUES DE SUPERCOMPUTACIÓ DEL BARCELONA SUPERCOMPUTING CENTER, REFORÇA LA SOBIRANIA TECNOLÒGICA D’ESPANYA I EUROPA EN EL DESENVOLUPAMENT D’UNA IA TRANSPARENT, RESPONSABLE I AL SERVEI DE LES PERSONES.

¿PER QUÈ PÙBLICA I OBERTA?

ALIA COMPTA AMB  FINANÇAMENT 100% PÚBLIC  PER A OFERIR RECURSOS AVANÇATS A L’ADMINISTRACIÓ PÚBLICA, LES UNIVERSITATS I LES EMPRESES, GARANTINT L’ACCÉS UNIVERSAL  EN BENEFICI DE TOTA LA SOCIETAT 

Es tracta d’un projecte obert que es distingeix per la transparència, en línia amb el Reglament d'IA i l’obertura per a impulsar la innovació i l’adopció de les tecnologies, garantint la fiabilitat tecnològica i la inclusió social i econòmica.

La família de models ALIA compten amb la verificació de l’Agència Espanyola de Supervisió de la Intel·ligència Artificial (AESIA) i està alineada amb els estàndards de transparència que estableix el Reglament d'IA.

¿QUI SEN'N POT BENEFICIAR?

ALIA ESTÀ A DISPOSICIÓ DE TOTS I PER AL BENEFICI DE TOTS.

Face
LA SUPERCOMPUTACIÓ PÚBLICA PER A FER AVANÇAR LA IA

L’entrenament i desplegament de la IA generativa requereix d’una enorme capacitat de processament computacional. En el cas de l’entrenament de la família de models ALIA, el processament de varis milers de milions de paraules requereix de l’ús de milers d’hores de MareNostrum 5, un dels superordinadors més potents del món, ubicat i gestionat pel Barcelona Supercomputing Center.

MareNostrum 5 és la cinquena generació de la saga MareNostrum, capaç d’accelerar la ciència i la tecnologia a una velocitat de 314.000 bilions de càlculs per segon. Està finançat pel consorci de supercomputació de la Unió Europea, la EuroHPC Joint Undertaking (EuroHPC JU), Espanya -a través del Ministeri de Ciència, Innovació i Universitats i la Generalitat de Catalunya-, Turquia i Portugal.

ANTECEDENTS

EL PROJECTE ALIA ES VA INICIAR AMB EL PLA DE TECNOLOGIES DEL LLENGUATGE AL 2019. PROJECTES COM AINA, IMPULSAT PER LA GENERALITAT DE CATALUNYA, I ILENIA IMPULSAT PER LA SECRETARIA D’ESTAT DE DIGITALITZACIÓ I INTEL·LIGÈNCIA ARTIFICIAL, HAN ASSENTAT LES BASES PER A LA CONSTRUCCIÓ D’AQUESTA INFRAESTRUCTURA PÚBLICA D’IA. EN L’ESTRATÈGIA NACIONAL D’INTEL·LIGÈNCIA ARTIFICIAL 2024, LA POSADA EN MARXA DEL PROJECTE ALIA ÉS UN DELS PILARS CLAU PER A LA CREACIÓ D’AQUESTA INFRAESTRUCTURA PÚBLICA D’IA EN CASTELLÀ I LLENGÜES COOFICIALS. A MÉS, ALIA ESTÀ ALINEADA AMB EL PROGRAMA DE LA DÈCADA DIGITAL DE LA UNIÓ EUROPEA, QUE GUIA LA TRANSFORMACIÓ DIGITAL D’EUROPA I LA SEVA SOBIRANIA.

ALIA KIT

L'ESPAI DE RESCURSOS LINGÜÍSTICS

ALIA kit és l’espai que dona accés a tots els recursos en castellà i llengües cooficials com els models de llenguatge, els models multimodals (text, veu i imatge), les metodologies, la documentació i els conjunts de dades d’entrenament i avaluació.