El seguimiento de experimentos es una parte clave en los flujos de trabajo actuales de machine learning. Ya sea que estés ajustando hiperparámetros, monitoreando métricas de entrenamiento o colaborando con otros, contar con herramientas flexibles y confiables para registrar tus experimentos es fundamental. Sin embargo, muchas soluciones existentes suelen ser complicadas de configurar, tienen costos de licencia o bloquean tus datos en formatos propietarios, lo que las hace menos accesibles para investigadores individuales o equipos pequeños.
Aquí es donde entra Trackio, una nueva librería de código abierto creada por Hugging Face y Gradio. Trackio es un rastreador liviano, local por defecto y completamente gratuito, diseñado para adaptarse a los ritmos acelerados de la investigación actual y fomentar la colaboración abierta.
¿Qué es Trackio?
Se trata de un paquete en Python pensado como un reemplazo directo para librerías populares como wandb. Trackio es compatible con las principales llamadas de la API de wandb, como wandb.init, wandb.log y wandb.finish. Esto significa que cambiar a Trackio o ejecutar scripts antiguos requiere muy pocos o ningún cambio en el código: simplemente importas Trackio en lugar de wandb y continúas sin interrupciones.
Características principales
- Diseño local primero: por defecto, todos los experimentos se ejecutan y guardan localmente, lo que garantiza privacidad y acceso rápido. Compartir los datos es opcional. - Gratuito y de código abierto: no hay costos ni limitaciones, y funciones como la colaboración y los dashboards online están disponibles para todos sin cargo. - Ligero y extensible: su código está por debajo de las 1,000 líneas de Python, lo que facilita su auditoría, extensión o personalización. - Integración directa con el ecosistema Hugging Face: soporta herramientas como Transformers, Sentence Transformers y Accelerate, para que puedas empezar a registrar métricas con muy poca configuración. - Portabilidad de datos: a diferencia de otros rastreadores, Trackio permite exportar todos los datos fácilmente, facilitando análisis personalizados e integración en pipelines de investigación.
Seguimiento de experimentos, local o compartido
Una ventaja destacada de Trackio es su capacidad para compartir resultados. Puedes visualizar las métricas a través de un panel local basado en Gradio o, simplemente sincronizando con Hugging Face Spaces, poner tu dashboard en línea para compartirlo con colegas o incluso con el público. Los Spaces pueden configurarse como privados o públicos, sin necesidad de autenticaciones complicadas para los que acceden.
Por ejemplo, para abrir tu panel localmente puedes usar el comando en consola:
``` trackio show ```
O desde Python:
```python import trackio trackio.show() ```
Si quieres lanzar el dashboard en Spaces, solo sincroniza tus registros y podrás compartir o insertar el enlace directamente. Además, Trackio realiza respaldos automáticos cada 5 minutos en formato Parquet, para que tus datos no se pierdan aunque el espacio público se reinicie.
Integración sencilla con tu flujo de trabajo de ML
Si usas transformers.Trainer o accelerate, puedes empezar a registrar y visualizar métricas indicando Trackio como logger. Por ejemplo, con Accelerate:
```python from accelerate import Accelerator accelerator = Accelerator(log_with="trackio") accelerator.init_trackers("mi-experimento") # ... accelerator.log({"training_loss": loss}, step=step) ```
Este método sin complicaciones permite que cualquiera que use Transformers, Sentence Transformers o Accelerate pueda comenzar a hacer seguimiento y compartir experimentos sin configuraciones adicionales.
Transparencia, sustentabilidad y control total de tus datos
Trackio no solo se centra en métricas básicas, también impulsa la transparencia en el uso de recursos computacionales. Por ejemplo, puede monitorear el consumo energético de la GPU leyendo datos de nvidia-smi, apoyando el compromiso con la responsabilidad ambiental y la reproducibilidad de Hugging Face.
Además, a diferencia de plataformas cerradas, tus datos siempre estarán accesibles: los registros se almacenan en formatos estándar y los dashboards se crean con herramientas abiertas como Gradio y Hugging Face Datasets, facilitando su análisis o reutilización.
Cómo empezar
Solo necesitas instalarlo con:
``` pip install trackio ```
Y en tu código, cambia la importación a:
```python import trackio as wandb ```
En resumen, Trackio es una herramienta ideal para investigadores individuales y equipos que buscan una solución transparente, libre y sin complicaciones para el seguimiento de experimentos en machine learning. Su enfoque local primero, la facilidad para compartir y la integración con Hugging Face la posicionan como una alternativa sólida y accesible frente a soluciones tradicionales.



