Análisis de Calidad de Estimación en Modelos 1PL: Comparación entre Máxima Verosimilitud y Enfoque Bayesiano con Prior Informativo

Estudio de simulación sobre la efectividad de priors externos en la estimación de parámetros de dificultad

🔬 Experimento en Progreso
Proyecto de Magíster en matemáticas aplicadas | Universidad de Chile | 2025
Última actualización: 22 de agosto de 2025

Resumen

Este trabajo evalúa empíricamente la efectividad de un modelo bayesiano 1PL que utiliza distribuciones prior para la dificultad del ítem basadas en predicciones externas, comparándolo con el método tradicional de Máxima Verosimilitud (MLE). Se analizan diferentes escenarios variando la calidad del prior (R² = 0.2, 0.5, 0.8) y el tamaño muestral (30%, 50%, 80%, 100% de 1,000 individuos) para determinar las condiciones bajo las cuales el enfoque bayesiano proporciona estimaciones más precisas.

Objetivo de la Investigación

Determinar hasta qué punto un modelo bayesiano 1PL cuya distribución prior para la dificultad del ítem proviene de una predicción externa mejora la precisión de la estimación frente al método tradicional de Máxima Verosimilitud (MLE), considerando diferentes niveles de calidad del prior y tamaños muestrales.

Metodología

Diseño del Experimento

Tipo de estudio: Simulación Monte Carlo

Factores evaluados:

  • Calidad del prior: Tres niveles de correlación entre predicción externa y parámetro verdadero (R² = 0.2, 0.5, 0.8)
  • Tamaño muestral: Cuatro fracciones de la muestra completa (30%, 50%, 80%, 100% de 1,000 individuos)

Variable dependiente: Error cuadrático medio (MSE) de las estimaciones de parámetros

Flujo del Análisis
  1. Simulación de parámetros: Generación de parámetros verdaderos para habilidades (θ) y dificultades (β)
  2. Generación del prior: Creación de distribución prior basada en predicciones externas con diferentes niveles de precisión
  3. Simulación de respuestas: Generación de matrices de respuesta usando el modelo logístico 1PL
  4. Estimación MLE: Implementación del método de máxima verosimilitud tradicional
  5. Estimación Bayesiana: Implementación usando PyMC con prior informativo
  6. Evaluación comparativa: Cálculo de métricas de precisión y análisis estadístico
Herramientas y Tecnologías
  • Python: Lenguaje principal para análisis estadístico y modelado
  • PyMC: Librería de programación probabilística para inferencia bayesiana
  • Kedro: Framework para orquestación de pipelines de datos reproducibles
  • Scikit-learn: Implementación de algoritmos de machine learning y MLE
  • NumPy/SciPy: Computación científica y operaciones matriciales

Visualización del Pipeline de Análisis

Pipeline de análisis visualizado con Kedro-Viz
Figura 1. Pipeline completo del análisis implementado en Kedro. El diagrama muestra el flujo de datos desde la simulación de parámetros hasta la generación de reportes comparativos.

Explorar Pipeline Interactivo

Accede a la visualización interactiva completa del pipeline para explorar dependencias y resultados en detalle.

Ver Pipeline Interactivo

Resultados Preliminares

Impacto del Tamaño Muestral en la Estimación MLE

Los primeros resultados del experimento muestran evidencia clara del deterioro en la precisión de las estimaciones de máxima verosimilitud conforme se reduce el tamaño de la muestra.

Error cuadrático medio vs. porcentaje de muestra
Figura 2. Relación entre el porcentaje de muestra utilizada y el error cuadrático medio (MSE) en las estimaciones MLE. Se observa un incremento sistemático del error conforme disminuye el tamaño muestral.
Coeficiente de determinación vs. porcentaje de muestra
Figura 3. Relación entre el porcentaje de muestra utilizada y el coeficiente de determinación (R²) entre parámetros verdaderos y estimados. La capacidad predictiva del modelo MLE disminuye notablemente con muestras reducidas.
Interpretación Inicial

Los resultados preliminares confirman la hipótesis teórica sobre la degradación del rendimiento de MLE en condiciones de muestra limitada. Estos hallazgos establecen la línea base para evaluar si el enfoque bayesiano con prior informativo puede mitigar estas limitaciones.

Próximos análisis: Comparación directa con resultados bayesianos y evaluación del impacto de la calidad del prior en diferentes escenarios muestrales.

Estado Actual del Proyecto

Componentes Completados

  • ✅ Implementación del pipeline de simulación con Kedro
  • ✅ Módulo de estimación por máxima verosimilitud (MLE)
  • ✅ Módulo de estimación bayesiana con PyMC
  • ✅ Generación de datos sintéticos y submuestreo
  • ✅ Análisis preliminar de resultados MLE
  • ✅ Visualización del pipeline con Kedro-Viz

En Desarrollo

  • 🔄 Implementación completa del modelo bayesiano con PyMC
  • 🔄 Análisis comparativo entre métodos MLE y Bayesiano
  • 🔄 Evaluación del impacto de la calidad del prior
  • 🔄 Generación de reportes estadísticos del experimento completo

Planificado

  • 📋 Análisis de sensibilidad de hiperparámetros
  • 📋 Redacción del informe final

Recursos y Enlaces

Repositorio y Documentación

Repositorio GitHub Pipeline Interactivo