Práctica universitaria realizada como parte de la asignatura "Visualización de Datos" del Máster Universitario en Ciencia de Datos de la UOC.
Proyecto público: https://marcusmcfly.github.io/visualization_project_part_2/
Visualización interactiva de la relación entre actividad física (Apple Watch Series 7) y salud mental infantil (cuestionarios SDQ y SNAP-IV), basada en el dataset Movement and Mental Health in Children (Zenodo, 2024).
La justificación y selección del dataset están en docs/part_1.docx (Parte I).
Los datos crudos pesan ~2,73 GB y no pueden servirse desde GitHub Pages, así que el proyecto se separa en:
- ETL offline (Python / notebooks) — lee
datasets/raw/, agrega y exporta JSON ligeros adocs/data/. - Web estática (HTML/CSS/JS) — en
docs/, consume esos JSON con Plotly.js + D3.js. Se publica en GitHub Pages (ramamain, carpeta/docs).
notebooks/ 01_eda · 02_etl_demographic · 03_etl_movement · 04_analysis
src/ etl_utils.py (helpers de lectura y scoring)
docs/ index.html · css/ · js/ · data/*.json ← raíz de GitHub Pages
datasets/raw # 84 CSV — NO versionado (.gitignore)
python -m venv .venv
# Windows: .venv\Scripts\activate
pip install -r requirements.txt- Coloca los CSV del dataset en
datasets/raw/. - Ejecuta los notebooks en orden (
01→04); generandocs/data/*.json. - Sirve la web en local:
y abre http://localhost:8000.
cd docs && python -m http.server 8000
- A · Perfilado psicométrico (SDQ / SNAP-IV)
- B · Fenotipos de movimiento (pasos, sedentarismo, ritmo circadiano)
- C · Relación movimiento ↔ salud mental (correlaciones)
- D · Segmentación de perfiles (clustering)
- E · Dinámica temporal (intradía, laborable vs. finde)
{ID}_T.csv= actividad agregada por hora (delimitador;);{ID}_F.csv= fragmentos (delimitador,).- Falta el ítem
SDQ19y la columnaage→ se tratan como ausentes.
El conjunto de datos original se publica bajo licencia Creative Commons Attribution 4.0 International (CC BY 4.0).
Esto significa que cualquiera es libre de compartir (copiar y redistribuir) y adaptar
(transformar y construir a partir de) los datos, incluso con fines comerciales, siempre que se
atribuya correctamente la autoría, se indique si se han hecho cambios y se enlace a la licencia.
Bajo esta licencia, redistribuir públicamente los datos derivados de este proyecto (los JSON
preagregados en docs/data/) es legítimo siempre que se mantenga la atribución que figura a continuación.
Atribución requerida (CC BY 4.0): W. Lin, “Movement and Mental Health in Children”. Zenodo, v1, diciembre de 2024. DOI: 10.5281/zenodo.14875672 · https://zenodo.org/records/14875672
El propio proyecto (código, notebooks, scripts, sitio web y contenido original) se publica bajo licencia MIT, pero los datos originales y los datos derivados de este dataset siguen sujetos a CC BY 4.0 y requieren la atribución indicada.
Los datos están anonimizados (los participantes se identifican con códigos como H1, W4…,
sin datos personales directos), por lo que su publicación abierta no plantea problemas adicionales
más allá de mantener la atribución exigida por la licencia.