LA INFRAESTRUCTURA PÚBLICA DE IA EN CASTELLANO Y LENGUAS COOFICIALES

ALIA es una iniciativa pionera en la Unión Europea que busca proporcionar una infraestructura pública de recursos de IA, como modelos de lenguaje abiertos y transparentes, para fomentar el impulso del castellano y lenguas cooficiales -catalán y valenciano, euskera y gallego- en el desarrollo y despliegue de la IA en el mundo.

hero

El objetivo es facilitar la creación de una nueva generación de recursos y servicios tecnológicos innovadores enriquecidos con el inmenso patrimonio lingüístico del castellano, hablado por 600 millones de personas en el mundo, y las lenguas cooficiales.

Se trata de la primera infraestructura pública europea, abierta y multilingüe que, gracias a las capacidades únicas de supercomputación del Barcelona Supercomputing Center, refuerza la soberanía tecnológica de España y Europa en el desarrollo de una IA transparente, responsable y al servicio de las personas.

Este proyecto está coordinado por el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), con el impulso y liderazgo de la Secretaría de Estado de Digitalización e Inteligencia Artificial. Asimismo, forma parte de la Estrategia de Inteligencia Artificial 2024, puesta en marcha por el Gobierno de España.

SE TRATA DE  LA PRIMERA INFRAESTRUCTURA PÚBLICA EUROPEA, ABIERTA Y MULTILINGÜE  QUE, GRACIAS A LAS CAPACIDADES ÚNICAS EN SUPERCOMPUTACIÓN DEL BARCELONA SUPERCOMPUTING CENTER, REFUERZA LA SOBERANÍA TECNOLÓGICA DE ESPAÑA Y EUROPA EN EL DESARROLLO DE UNA IA TRANSPARENTE, RESPONSABLE Y AL SERVICIO DE LAS PERSONAS.

¿POR QUÉ PÚBLICA Y ABIERTA?

ALIA CUENTA CON  FINANCIACIÓN 100% PÚBLICA  PARA DAR SERVICIO DE INTERÉS PÚBLICO A LA CIUDADANÍA, LA ADMINISTRACIÓN PÚBLICA, LAS UNIVERSIDADES Y LAS EMPRESAS, GARANTIZANDO EL  ACCESO UNIVERSAL  EN BENEFICIO DE TODA LA SOCIEDAD

Se trata de un proyecto abierto que se distingue por la transparencia, en línea con el Reglamento de IA y la apertura para impulsar la innovación y la adopción de las tecnologías, garantizando la fiabilidad tecnológica y la inclusión social y económica.

La familia de modelos ALIA cuenta con la verificación de la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA) y está alineada con los estándares de transparencia que establece el Reglamento de IA.

¿QUIÉN PUEDE BENEFICIARSE?

ALIA ESTÁ A DISPOSICIÓN DE TODOS Y PARA EL BENEFICIO DE TODOS.

Face
LA SUPERCOMPUTACIÓN PÚBLICA PARA HACER AVANZAR LA IA

El entrenamiento y despliegue de la IA generativa requiere de una enorme capacidad de procesamiento computacional. En el caso del entrenamiento de la familia de modelos ALIA, el procesamiento de varios miles de millones de palabras necesita del uso de miles de horas de MareNostrum 5, uno de los superordenadores más potentes del mundo, ubicado y gestionado por el Barcelona Supercomputing Center.

MareNostrum 5 es la quinta generación de la saga MareNostrum, capaz de acelerar la ciencia y la tecnología a una velocidad de 314.000 billones de cálculos por segundo. Está financiado por el consorcio de supercomputación de la Unión Europea, la EuroHPC Joint Undertaking (EuroHPC JU), España -a través del Ministerio de Ciencia, Innovación y Universidades y la Generalitat de Cataluña-, Turquía y Portugal.

ANTECEDENTES

EL PROYECTO ALIA SE INICIÓ CON EL PLAN DE TECNOLOGÍAS DEL LENGUAJE EN 2019. PROYECTOS COMO AINA, IMPULSADO POR LA GENERALITAT DE CATALUÑA, E ILENIA IMPULSADO POR LA SECRETARÍA DE ESTADO DE DIGITALIZACIÓN E INTELIGENCIA ARTIFICIAL, HAN SENTADO LAS BASES PARA LA CONSTRUCCIÓN DE ESTA INFRAESTRUCTURA PÚBLICA DE IA. EN LA ESTRATEGIA NACIONAL DE INTELIGENCIA ARTIFICIAL 2024, LA PUESTA EN MARCHA DEL PROYECTO ALIA ES UNO DE LOS PILARES CLAVE PARA LA CREACIÓN DE ESTA INFRAESTRUCTURA PÚBLICA DE IA EN CASTELLANO Y LENGUAS COOFICIALES. ADEMÁS, ALIA ESTÁ ALINEADA CON EL PROGRAMA DE LA DÉCADA DIGITAL DE LA UNIÓN EUROPEA, QUE GUÍA LA TRANSFORMACIÓN DIGITAL DE EUROPA Y SU SOBERANÍA TECNOLÓGICA.

ALIA KIT

EL ESPACIO DE RECURSOS LINGÜÍSTICOS

ALIA Kit es el espacio que da acceso a todos los recursos en castellano y lenguas cooficiales: los modelos del lenguaje, los modelos multimodales (texto, voz e imagen), las metodologías, la documentación y los conjuntos de datos de entrenamiento y evaluación.