Economía · Econometría · Estadística Aplicada
- 📖 Acerca del Proyecto
- 📁 Estructura del Repositorio
- ⚙️ Componentes del Proceso
- 🔧 Requisitos del Entorno
▶️ Cómo Reproducir los Resultados- 📊 Figuras Incluidas
- 📄 Licencia y Uso de Datos
- 👤 Autor
Este repositorio contiene el procesamiento completo de la Encuesta de Calidad de Vida (ECV) 2024 del DANE y la construcción del Índice de Pobreza Multidimensional (IPM) para Colombia utilizando la metodología de Alkire-Foster.
El proyecto forma parte del trabajo académico en Economía Aplicada de la Universidad Nacional de Colombia y tiene como objetivo:
- Limpiar y estructurar las bases de datos de la ECV 2024
- Construir una base de datos consolidada a nivel de hogares
- Calcular el IPM oficial de Colombia
- Generar análisis descriptivos mediante visualizaciones profesionales
Los datos procesados y las figuras resultantes pueden ser utilizados para análisis econométricos, trabajos de investigación y proyectos de política pública.
Repositorio_Bases_De_Datos/
│
├── Scripts/
│ ├── Limpieza_de_datos.R
│ ├── Construcción_Base_ECV_Personas.R
│ └── Contrucción_base_IPM_Nivel_hogar.R
│
├── Datos_Procesados/
│ ├── hogares_ML.csv
│ └── base_final.csv (IPM calculado)
│
├── Figuras/
│ ├── Piramide_poblaciona_de_colombia.png
│ ├── Indicadores.png
│ ├── Educacion.png
│ ├── Acceso_a_servicIOs_publicos.png
│ ├── Condiciones_del_hogar.png
│ └── Condiciones_ed_hacinamiento_por_zona.png
│
└── README.md
Script: Limpieza_de_datos.R
- Carga de módulos de la ECV 2024
- Depuración y estandarización de variables
- Manejo de valores perdidos y outliers
- Codificación de variables categóricas
Script: Construcción_Base_ECV_Personas.R
- Integración de módulos individuales
- Construcción de variables derivadas (edad, educación, empleo)
- Generación de
hogares_ML.csvpara análisis de Machine Learning
Script: Contrucción_base_IPM_Nivel_hogar.R
-
Implementación de la metodología Alkire-Foster
-
Construcción de las 15 dimensiones del IPM colombiano:
- Logro educativo
- Analfabetismo
- Inasistencia escolar
- Rezago escolar
- Barreras de acceso a servicios de salud
- Sin aseguramiento en salud
- Trabajo infantil
- Desempleo de larga duración
- Empleo informal
- Hacinamiento crítico
- Material inadecuado de pisos
- Material inadecuado de paredes
- Inadecuada eliminación de excretas
- Sin acceso a fuente de agua mejorada
- Sin acceso a energía eléctrica
-
Generación de índices H (incidencia), A (intensidad) y M0 (IPM)
-
Exportación de
base_final.csv
- R versión ≥ 4.0.0
- RStudio (recomendado)
# Manejo de datos
install.packages("tidyverse")
install.packages("dplyr")
install.packages("readr")
install.packages("haven")
# Visualización
install.packages("ggplot2")
install.packages("scales")
install.packages("RColorBrewer")
# Manejo de archivos
install.packages("openxlsx")
install.packages("data.table")git clone https://github.com/jmeza-data/Repositorio_Bases_De_Datos.git
cd Repositorio_Bases_De_DatosDescarga los microdatos oficiales desde el DANE y colócalos en una carpeta Datos_Crudos/.
# 1. Limpieza
source("Scripts/Limpieza_de_datos.R")
# 2. Construcción de base de personas
source("Scripts/Construcción_Base_ECV_Personas.R")
# 3. Cálculo del IPM
source("Scripts/Contrucción_base_IPM_Nivel_hogar.R")- Bases procesadas:
Datos_Procesados/ - Figuras generadas:
Figuras/
A continuación se presentan las principales visualizaciones generadas en el proyecto:
Distribución de la población colombiana por sexo y grupos de edad según la ECV 2024
Panel de control con los principales indicadores del Índice de Pobreza Multidimensional
Análisis de logro educativo, analfabetismo, inasistencia escolar y rezago escolar
Acceso a agua potable, energía eléctrica y saneamiento básico
Calidad de materiales de construcción y condiciones habitacionales
Comparación del hacinamiento crítico entre zonas urbanas y rurales
Nota: Todas las figuras están en formato PNG de alta resolución y listas para uso en presentaciones o documentos académicos.
Los microdatos utilizados provienen de la Encuesta de Calidad de Vida (ECV) 2024 del DANE (Departamento Administrativo Nacional de Estadística de Colombia).
- Fuente oficial: DANE - Encuestas
- Licencia: Uso libre para fines académicos y de investigación con atribución adecuada
El código contenido en este repositorio es de uso académico. Se permite su uso y modificación con la debida atribución al autor.
Meza García, J. S. (2024). Repositorio de Bases de Datos – ECV 2024 & IPM Colombia.
GitHub. https://github.com/jmeza-data/Repositorio_Bases_De_Datos
Jhoan Sebastián Meza García
Estudiante de Economía
Universidad Nacional de Colombia
📧 Contacto: GitHub - jmeza-data
Desarrollado con 📊 y ☕ en Bogotá, Colombia