Asociación y Colaboración

Vinculación con el Proyecto LatamGPT CENIA

Asociación estratégica con la iniciativa LatamGPT de CENIA para avanzar en modelos de lenguaje latinoamericanos y fomentar la colaboración regional en investigación de IA.

LatamGPTLLMsIA
English | Español

Características Principales

Visión General

Nos complace anunciar nuestra colaboración con el proyecto LatamGPT, liderado por CENIA (Centro Nacional de Inteligencia Artificial) en Chile. Esta asociación tiene como objetivo fortalecer la investigación en IA de América Latina y contribuir al desarrollo de modelos de lenguaje diseñados específicamente para hispanohablantes y lusohablantes de la región.

LatamGPT representa un esfuerzo crítico para abordar los matices lingüísticos y culturales de América Latina que a menudo están subrepresentados en los sistemas globales de IA. A través de esta colaboración, SIMG aporta experiencia en entrenamiento eficiente de modelos (QLoRA, LoRA) y fine-tuning específico de dominio para apoyar esta importante iniciativa regional.

Objetivos de la Asociación

Nuestra colaboración con CENIA y el proyecto LatamGPT se centra en varias áreas clave:

1. Intercambio de Conocimientos

2. Desarrollo de Modelos

3. Construcción de Comunidad

Aspectos Destacados de la Reunión Inicial

Nuestra primera reunión oficial con investigadores de CENIA se llevó a cabo en octubre de 2024, donde discutimos:

Puntos de Discusión

Conclusiones Clave

Por Qué Importa Esta Asociación

Impacto Regional

América Latina tiene características lingüísticas únicas que difieren del español europeo:

Colaboración Académica

Esta asociación fortalece el ecosistema de investigación en IA de América Latina:

Nuestras Contribuciones

Experiencia Técnica

SIMG aporta varias capacidades clave a la asociación:

1. Métodos de Entrenamiento Eficientes

2. Especialización de Dominio

3. Filosofía de Código Abierto

Actividades Planificadas

Corto plazo (2024-2025)

Mediano plazo (2025-2026)

Visión a Largo Plazo

Cómo Participar

Esta es una colaboración abierta, y damos la bienvenida a la participación de:

Investigadores

Estudiantes

Instituciones

Alineación Técnica

Compatibilidad de Infraestructura

Tanto SIMG como LatamGPT comparten restricciones y prioridades similares:

# Ejemplo: Configuración de fine-tuning eficiente compatible con ambos equipos
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import LoraConfig, get_peft_model

# Cargar modelo base LatamGPT (cuando esté disponible)
model = AutoModelForCausalLM.from_pretrained(
    "cenia/latamgpt-base",
    load_in_4bit=True,  # Uso eficiente de memoria
    device_map="auto"
)

# Aplicar QLoRA para adaptación de dominio
lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)

model = get_peft_model(model, lora_config)
print(f"Parámetros entrenables: {model.num_parameters(only_trainable=True):,}")

Objetivos Compartidos

Métricas de Impacto

Haremos seguimiento al éxito de esta colaboración a través de:

Resultados de Investigación

Participación Comunitaria

Rendimiento del Modelo

Contacto y Actualizaciones

¿Quieres aprender más o participar en esta colaboración?


Mantente atento a las actualizaciones sobre esta emocionante asociación mientras trabajamos juntos para avanzar en la investigación de IA latinoamericana y crear modelos de lenguaje que realmente representen nuestra región!

Recursos

Equipo y Colaboradores

Investigadores

  • Grupo de Investigación SIMG

Con el apoyo de