Reproducibility es - Radega1993/the-one-scenario-corpus GitHub Wiki
Español | English
Cómo regenerar el análisis desde cero y dónde están los artefactos generados. Ver Quickstart para la lista de comandos.
Ejecutar desde la raíz del repositorio (padre de scenarios/). Orden de fases:
-
Features — Lee todos los
.settingsdel corpus y construye la matriz de features.python3 scenarios/analysis/run_analysis.py --corpus corpus_v1 --phase features
-
Normalize — Normalización z-score (requiere
data/features.csv).python3 scenarios/analysis/run_analysis.py --phase normalize
-
Correlation — Pearson, Spearman, distancia coseno y euclídea, clustering (requiere
data/features_normalized.csv).python3 scenarios/analysis/run_analysis.py --phase correlation
-
Figures — Heatmaps, histogramas, scatter PCA (requiere salidas de correlation).
python3 scenarios/analysis/run_analysis.py --phase figures
-
Output metrics — Construye
output_metrics.csvdesde los reportes del ONE (requiere*_MessageStatsReport.txten el directorio de reportes).Si los reportes están en otra ruta:python3 scenarios/analysis/run_analysis.py --phase output_metrics
--reports-dir /ruta/a/reports -
Outputs — Correlación sobre vectores de salida (requiere
data/output_metrics.csv).python3 scenarios/analysis/run_analysis.py --phase outputs
Un solo comando para los pasos 1–5:
python3 scenarios/analysis/run_analysis.py --corpus corpus_v1 --phase allLuego ejecutar --phase outputs por separado si tienes output_metrics.csv.
Si ya tienes data/features_normalized.csv y las matrices de correlación:
python3 scenarios/analysis/run_analysis.py --phase figuresLas figuras se escriben en scenarios/analysis/figures/ (PNG y PDF).
| Ubicación | Contenido |
|---|---|
| scenarios/analysis/data/ | features.csv, features_normalized.csv, normalization_params.csv, correlation_.csv, distance_.csv, cluster_assignments.csv, output_metrics.csv, *_outputs.csv |
| scenarios/analysis/figures/ | heatmap_.png/.pdf, histogram_.png/.pdf, scatter_*.png/.pdf |
| scenarios/analysis/reports/ | correlation_report.txt, multiple_comparisons_report.txt, clustering_report.txt, scenarios_to_diversify.txt, outputs_correlation_report.txt, observaciones_correlacion.md, plan_radical_scenarios.md |
Los reportes del ONE (p. ej. *_MessageStatsReport.txt) se escriben en el directorio configurado en cada .settings (suele ser reports/ en la raíz del ONE).
- Cada escenario usa una semilla fija cuando está definida (p. ej.
MovementModel.rngSeeden el .settings). Mismo .settings + misma versión del ONE → mismo movimiento y eventos. - Para reproducir la fase output_metrics y outputs, ejecuta los mismos escenarios con la misma compilación del ONE y vuelve a lanzar
output_metricsyoutputs. El pipeline de análisis (features → correlation) es determinista con el mismo corpus y código.
- Quickstart — Todos los comandos
- Running-analysis-pipeline-es
- Generating-figures-es
- Using-corpus-in-the-one-es
- Data-and-artifacts-es
- Instalación — Configuración inicial
- Referencia del pipeline — Fases y artefactos en detalle