Laboratorio Abre Tu Ciencia
22 de enero de 2026
Nota
En Python el proceso es análogo con snakemake.
Por workflow o flujo de trabajo nos referimos a la serie de pasos para llevar a cabo un análisis de datos.
Pero además:
El paquete targets es una herramienta de pipeline para R enfocada en análisis estadístico y ciencia de datos: coordina una serie de pasos computacionales (llamados targets) y, al igual que otros sistemas de flujo de trabajo, evita recalcular pasos cuyos datos o código no han cambiado, lo que ahorra tiempo y mejora la reproducibilidad de proyectos complejos.
Cada target representa una tarea definida por funciones de R, y la estructura de dependencias entre ellos forma un gráfico acíclico dirigido (DAG) que targets utiliza para decidir qué ejecutar y qué saltarse.
Puedes ver toda la documentación aquí: Manual Repositorio
¿Qué debo volver a correr?, ¿puedo saltarme pasos para ahorrar tiempo?, ¿qué modelos específicos se ven afectados?, ¿tengo que rehacer todo para garantizar reproducibilidad?
La filosofía del paquete impulsa un estilo de programación orientado a funciones dentro de R, promueve reproducibilidad al abstraer archivos como objetos de R y facilita paralelización implícita, lo que permite construir análisis eficientemente, mantenerlos organizados y asegurar que los resultados sean coherentes con el código y los datos actuales
Algunas alternativas:
Principales funciones de trabajo:
Definición del pipeline:
tar_pipeline(): define el pipeline completo como una colección de targets.tar_target(): define un paso del pipeline (un objeto o resultado a producir).tar_option_set(): define opciones globales del pipeline (paquetes, formato, recursos).tar_source(): carga archivos R con funciones o targets auxiliares.Principales funciones de trabajo:
Ejecución y control:
tar_make(): ejecuta el pipeline, corriendo solo lo que está desactualizado.tar_make_clustermq(): ejecuta el pipeline en paralelo usando clustermq.tar_make_future(): ejecuta el pipeline en paralelo usando future.tar_destroy(): borra el estado del pipeline y la cache.tar_prune(): elimina targets obsoletos de la cache.Principales funciones de trabajo:
Inspección y diagnóstico:
tar_visnetwork(): visualiza el DAG del pipeline.tar_glimpse(): muestra un resumen rápido de los targets.tar_progress(): muestra el progreso de ejecución.tar_outdated(): identifica qué targets necesitan re‐ejecutarse.tar_meta(): inspecciona metadatos de los targets.tar_manifest(): lista todos los targets definidos.Principales funciones de trabajo:
Branching (reemplaza loops manuales por paralelización declarativa):
tar_map(): define branching dinámico a partir de una lista o vector.tar_combine(): combina los resultados de múltiples ramas en un solo target.tar_group(): agrupa ramas para control de ejecución.tar_rep(): replica un target múltiples veces (útil para simulaciones).Principales funciones de trabajo:
Reportes y comunicación:
tar_render(): renderiza documentos Quarto/R Markdown como parte del pipeline.tar_quarto(): renderiza documentos Quarto (.qmd) integrados al pipeline.tar_read(): recupera el valor de un target ya calculado.tar_load(): carga targets directamente en el entorno de R.
Vamos a utilizar una muestra aleatoria de los datos del artículo académico:
Nota
Blanco, E., Conejeros, J.D., González-Reyes, Á. et al. Heat beyond percentiles: exploring preterm birth risks in Santiago, Chile (1991–2019). Int Arch Occup Environ Healt 99, 5 (2026). https://doi.org/10.1007/s00420-025-02196-x
Puedes acceder a los códigos de este artículo aquí: Repositorio

jdconejeros@uc.cl | JDConejeros | ATC 2026 | © Hecho en Quarto