Galileo: Open-Source Multimodal Model Revolutionizing Earth Observation Analysis

Galileo, modelo multimodal abierto basado en Vision Transformer, integra imágenes ópticas, radar y datos climáticos, logrando alta precisión en teledetección global mediante preentrenamiento auto-supervisado y multiescala. https://tinyurl.com/pud6arzx

M
MIIA
editorial
4 de agosto de 2025·4 min de lectura
Galileo: Open-Source Multimodal Model Revolutionizing Earth Observation Analysis

Galileo es un modelo de base abierto y altamente multimodal diseñado para procesar, analizar y comprender distintos tipos de datos de observación terrestre a gran escala. Este desarrollo cuenta con el apoyo de investigadores de varias instituciones como McGill University, NASA Harvest Ai2, Carleton University, University of British Columbia, Vector Institute y Arizona State University. La idea principal de Galileo es ofrecer una solución unificada y generalista para aplicaciones clave como el mapeo de tierras agrícolas, la respuesta ante desastres y el monitoreo ambiental.

A diferencia de modelos anteriores en teledetección que suelen enfocarse en un solo tipo de dato o escala, Galileo es capaz de combinar múltiples modalidades de sensores y reconocer desde objetos muy pequeños, como embarcaciones de pesca que ocupan apenas 1 o 2 píxeles, hasta características amplias y de cambio lento, como glaciares.

El modelo se basa en una arquitectura Vision Transformer (ViT) adaptada para procesar imágenes ópticas multiespectrales (como Sentinel-2), radar de apertura sintética (Sentinel-1), datos de elevación y pendiente (NASA SRTM), información climática como precipitación y temperatura (ERA5), mapas de uso del suelo, población, luces nocturnas, entre otros.

Una de las fortalezas de Galileo es su flexibilidad para manejar distintos tipos de entrada: divide los datos de teledetección en parches espaciales, momentos temporales y grupos lógicos de canales, lo que le permite trabajar con imágenes, series temporales y datos tabulares estáticos dentro de la misma configuración.

La innovación clave del modelo está en su algoritmo de preentrenamiento auto-supervisado que combina objetivos globales y locales. Los primeros fomentan la percepción de características amplias y lentas, mientras que los segundos afinan la detección de detalles pequeños y cambios rápidos. Esta estrategia dual mejora la capacidad del modelo para representar información a múltiples escalas, haciéndolo robusto y generalizable incluso con pocos datos etiquetados.

Para lograr una gran diversidad semántica y geográfica, el conjunto de datos para preentrenar a Galileo abarca todo el planeta, seleccionando más de 127,000 muestras que combinan nueve tipos diferentes de datos remotos. El entrenamiento se llevó a cabo durante 500 épocas, usando un tamaño de lote efectivo de 512 y aplicando técnicas de aumento de datos como volteo, rotación y variación en el tamaño de parches.

En cuanto a resultados, Galileo sobresale en once conjuntos de datos y quince tareas de clasificación y segmentación, tanto de imágenes como de series temporales, superando modelos especializados en escenarios diversos. Por ejemplo, en EuroSat alcanza una precisión top-1 del 97.7%, superando a otros modelos punteros como CROMA y SatMAE. En clasificación de series temporales en cultivos y en segmentación de desechos marinos logra también resultados líderes.

Además, Galileo mantiene un desempeño sobresaliente incluso en sus versiones más pequeñas, lo cual es crucial para implementaciones con recursos limitados. Estudios internos muestran que eliminar alguna modalidad de entrada reduce el rendimiento, lo que demuestra la importancia de la integración multimodal para una buena generalización.

El código, los pesos del modelo y los datos de preentrenamiento están disponibles de forma abierta, promoviendo la transparencia y facilitando su adopción en la comunidad global de observación terrestre. Galileo ya está siendo utilizado en proyectos importantes, como los de NASA Harvest, para el mapeo mundial de tipos de cultivo, respuestas rápidas a desastres (inundaciones, incendios) y detección de contaminación marina. Su capacidad para funcionar con pocos datos etiquetados lo hace especialmente útil en zonas donde no hay mucha información en el terreno, apoyando la seguridad alimentaria y la adaptación al cambio climático.

En resumen, los avances técnicos y metodológicos de Galileo —la combinación de entradas multimodales, el aprendizaje de características a distintas escalas y el preentrenamiento globalmente diverso— establecen un nuevo estándar en inteligencia artificial para teledetección. Su versatilidad lo convierte en una herramienta práctica para monitorear el medio ambiente y enfrentar desafíos climáticos, brindando mapas y predicciones de alta calidad sin importar la tarea o ubicación geográfica. Además, al ser de código abierto y contar con una comunidad activa, Galileo promete impulsar una nueva ola de innovación en las ciencias del sistema terrestre, dando poder a investigadores y profesionales alrededor del mundo.

fuente original
https://www.marktechpost.com/2025/08/04/nasa-releases-galileo-the-open-source-multimodal-model-advancing-earth-observation-and-remote-sensing/
Prueba MIIA

Agentes de IA para WhatsApp, Instagram y Messenger. Configurados en 10 minutos.

Seguir leyendo

relacionado con #teledetección · #inteligencia artificial · #modelos multimodales
Prueba MIIA gratis →
WhatsApp