Diagnosis y Validación del Modelo en Diseño de Experimentos

Diagnosis ANOVA

Diseño de Experimentos • Idoneidad del Modelo • USTA

Referencias Bibliográficas

Montgomery, D. C. (2017). Design and Analysis of Experiments (9th ed.). Wiley.
Box, G.E.P. & Cox, D.R. (1964). An analysis of transformations. Journal of the Royal Statistical Society, Series B, 26(2), 211-252.
Scheffé, H. (1959). The Analysis of Variance. Wiley.
Bartlett, M.S. (1937). Properties of sufficiency and statistical tests. Proceedings of the Royal Society of London, Series A, 160, 268-282.
Hartley, H.O. (1950). The maximum F-ratio as a short-cut test for heterogeneity of variance. Biometrika, 37, 308-312.
Cochran, W.G. (1941). The distribution of the largest of a set of estimated variances as a fraction of their total. Annals of Eugenics, 11, 47-52.

Material de Estudio — USTA

Diseño de Experimentos • Diagnosis y Validación del Modelo

Patrón Observado	Interpretación	Acción Recomendada
Fluctuación aleatoria	Independencia satisfecha	Continuar con el análisis
Rachas de signo constante	Posible autocorrelación	Aplicar test de Durbin-Watson
Tendencia creciente/decreciente	Correlación con el tiempo	Revisar aleatorización
Mayor dispersión en un extremo	Varianza no constante	Considerar transformaciones

Grupos (Fertilizantes)
1		2		3		4		5
$y_{1j}$	$e_{1j}$	$y_{2j}$	$e_{2j}$	$y_{3j}$	$e_{3j}$	$y_{4j}$	$e_{4j}$	$y_{5j}$	$e_{5j}$
51	+1	56	−1	48	0	47	0	43	−2
49	−1	60	+3	50	+2	48	+1	43	−2
50	0	56	−1	53	+5	49	+2	46	+1
49	−1	56	−1	44	−4	44	−3	47	+2
51	+1	57	0	45	−3	45	0	—	—
50	0	—	—	—	—	—	—	—	—
$\bar{y}_{1\cdot}=50$	—	$\bar{y}_{2\cdot}=57$	—	$\bar{y}_{3\cdot}=48$	—	$\bar{y}_{4\cdot}=47$	—	$\bar{y}_{5\cdot}=45$	—

Forma del Gráfico	Diagnóstico	Implicación
Nube aleatoria rectangular	Homocedasticidad	Varianza constante ✓
Forma de embudo (abre hacia arriba)	Heterocedasticidad	Varianza creciente con la media
Forma de embudo (abre hacia abajo)	Heterocedasticidad	Varianza decreciente con la media
Mayor dispersión en un nivel específico	Varianza diferencial	Revisar ese tratamiento particular

Característica	Bartlett	Cochran	Hartley
Tamaños muestrales	Iguales o desiguales	Solo iguales	Solo iguales
Distribución del estadístico	$\chi^2$ (aprox.)	Tabulada	Tabulada
Sensibilidad a normalidad	Alta	Alta	Alta
Complejidad cálculo	Media	Baja	Muy baja
Versión con gl pequeños	Box (transformación $F$)	No aplica	No aplica

Relación $\sigma_y$ vs $\mu$	$\alpha$	$\lambda = 1-\alpha$	Transformación	Comentario
$\sigma_y = k\mu^2$	2	$-1$	Recíproca ($1/y$)	Varianza muy heterogénea
$\sigma_y = k\mu^{3/2}$	$3/2$	$-1/2$	Inversa raíz ($1/\sqrt{y}$)	Caso intermedio
$\sigma_y = k\mu$	1	0	Logarítmica $\ln(y)$	Datos log-normal
$\sigma_y = k\sqrt{\mu}$	$1/2$	$1/2$	Raíz cuadrada $\sqrt{y}$	Datos de Poisson
$\sigma_y = k$	0	1	No transformar	Homocedasticidad

Valor de $\lambda$	Transformación	Aplicación típica
$\lambda = 2$	$y^2$	Cuadrado
$\lambda = 1$	$y$ (sin transformar)	Datos ya adecuados
$\lambda = 0.5$	$\sqrt{y}$	Datos de Poisson
$\lambda = 0$	$\ln(y)$	Datos log-normales
$\lambda = -0.5$	$1/\sqrt{y}$	Varianza decreciente
$\lambda = -1$	$1/y$	Varianza muy heterogénea

Método 1	Método 2	Método 3	Método 4
$y$ / $e$	$y$ / $e$	$y$ / $e$	$y$ / $e$
85 / +2	78 / −3	92 / +5	80 / +1
82 / −1	82 / +1	84 / −3	78 / −1
84 / +1	80 / −1	88 / +1	79 / 0
82 / −1	83 / +2	87 / 0	81 / +2
83 / 0	81 / 0	85 / −2	—
$\bar{y}=83$	$\bar{y}=81$	$\bar{y}=87$	$\bar{y}=79.5$

Diagnosis ANOVA

Fundamentos de la Diagnosis del Modelo

Objetivo

1.1 Introducción y Motivación

1.2 Hipótesis Básicas del Modelo ANOVA

Hipótesis sobre los Términos de Error

Notación Estándar

1.3 Proceso Secuencial de Análisis Experimental

Flujo del Proceso de Validación del Modelo

1.4 Los Residuos como Herramienta de Diagnosis

Análisis de Residuos

Objetivo

2.1 Independencia entre los Residuos

Gráfico de Residuos en Función del Tiempo

Interpretación del Gráfico de Residuos vs. Tiempo

2.2 Normalidad de los Residuos

Gráfico Probabilístico Normal (Q-Q Plot)

Construcción del Gráfico Probabilístico Normal

2.3 Detección de Datos Anómalos (Outliers)

Protocolo de Actuación ante Datos Anómalos

2.4 Ejemplo Completo: Análisis de Residuos

Ejemplo 2.1: Diagnosis del Modelo para Experimento de Fertilizantes

Datos y Residuos Observados

Implementación en Python

Interpretación de Resultados

Diagnosis de Heterocedasticidad

Objetivo

3.1 Análisis Gráfico de Residuos para Detección de Heterocedasticidad

Gráfico de Residuos frente a Valores Ajustados

Patrones Típicos en Gráficos de Residuos vs Valores Ajustados

3.2 Test de Bartlett

Hipótesis del Test de Bartlett $$H_0: \sigma^2_1 = \sigma^2_2 = \cdots = \sigma^2_I$$ $$H_1: \sigma^2_i \neq \sigma^2_j \text{ para algún par } (i, j)$$

Transformación de Box

3.3 Test de Cochran

3.4 Test de Hartley

3.5 Ejemplo Completo: Tests de Homocedasticidad

Ejemplo 3.1: Aplicación de Tests de Igualdad de Varianzas

Interpretación de Resultados

3.6 Resumen Comparativo de Tests

Transformaciones de Datos

Objetivo

4.1 Introducción a las Transformaciones

4.2 Transformaciones para Estabilizar la Varianza

Casos Particulares Importantes

Caso a) Varianza proporcional a la media

Caso b) Desviación estándar proporcional a la media

Caso c) Desviación estándar proporcional al cuadrado de la media

Caso General

Resumen de Transformaciones

4.3 Transformaciones de Box-Cox

Correspondencia entre $\lambda$ y Transformaciones

4.4 Transformaciones Normalizadoras

4.5 Ejemplo Completo: Aplicación de Transformaciones

Ejemplo 4.1: Selección de Transformación con Box-Cox

Interpretación de Resultados

4.6 Efectos de la Violación de las Hipótesis del Modelo

Dependencia entre los Términos de Error

Desviación de los Errores de la Normalidad

Heterocedasticidad del Término Error

Ejercicios de Autoevaluación

Objetivo

Análisis de Residuos y Detección de Outliers

Test de Homocedasticidad

Resumen y Referencias

Objetivo

Resumen: Proceso de Diagnosis del Modelo ANOVA

Referencias Bibliográficas

Referencias Bibliográficas

Hipótesis del Test de Bartlett

$$H_0: \sigma^2_1 = \sigma^2_2 = \cdots = \sigma^2_I$$

$$H_1: \sigma^2_i \neq \sigma^2_j \text{ para algún par } (i, j)$$