viernes, 22 de noviembre de 2013

Prueba T

Entendiendo los conceptos:
2 casos: muestras dependientes (grupos relacionados o emparejados) y muestras independientes (con varianzas iguales o diferentes).

http://www.slideshare.net/jab2801/t-de-student-para-dos-muestras-independientes-9249928
http://www.slideshare.net/niko54-sagitario/prueba-t-de-student-para-datos-relacionados

Realizar el estudio estadístico T en Excel


Ejemplos
Datos emparejados o dependientes:
http://reyesestadistica.blogspot.mx/2011/07/prueba-de-hipotesis-para-datos.html
http://www.uam.es/personal_pdi/ciencias/cifus/bioestadistica/ejer44excel.pdf

Datos independientes (con varianzas iguales o diferentes):
Con este artículo vamos a analizar un caso muy frecuente, como es la comparación de medias entre dos muestras independientes. Se considera que dos muestras son independientes cuando no hay una conexión entre la medición de una variable con la medición de la otra.
Para ilustrar este caso, planteamos el siguiente ejemplo (archivo de referencia: datos_ejemplo_inferencia.xls):
Las universidades A y B se preguntan si el nivel formativo en estadística de una y otra universidad es diferente. Para tratar de dar respuesta a esta pregunta, someten a 75 alumnos de cada universidad elegidos al azar a un mismo examen. Las calificaciones de los alumnos de cada universidad pueden verse en las columnas A y B respectivamente de este archivo (enlace).
Supuestos del modelo t de Student para dos muestras independientes.
Nivel de medida de las variables: métricas, es decir, intervalo o razón.
Distribución: normal o aproximadamente normal.
Tipo de diseño: equilibrado o no equilibrado.
Varianzas poblacionales: desconocidas, supuestamente iguales o sin supuesto de igualdad.
Observaciones: aleatorias e independientes.
Hipótesis que se somete a prueba: la diferencia entre las dos medias toma un determinado valor, generalmente cero.
Prueba t para dos muestras suponiendo varianzas iguales
Variable 1
Variable 2
Media
32,76
31,2133333
Varianza
85,6713514
73,2781982
Observaciones
75
75
Varianza agrupada
79,4747748
Diferencia hipotética de las medias
0
Grados de libertad
148
Estadístico t
1,06242359
P(T<=t) una cola
0,14488697
Valor crítico de t (una cola)
1,65521451
P(T<=t) dos colas
0,28977394
Valor crítico de t (dos colas)
1,97612246
________________________________________________
EJERCICIOS PARA LA PRUEBA  t  DE STUDENT
1. Diferencia entre dos medias de poblaciones dependientes
 Un fabricante deseaba comparar la resistencia al desgaste de dos tipos distintos de neumáticos A y B. Para hacer la comparación, se asignó al azar un neumático del tipo A y uno del tipo B a las ruedas posteriores de 20 automóviles.
Los coches recorrieron un número específico de kilómetros y se observó el desgaste de cada neumático.
Automóvil
1
2
3
4
5
6
7
8
9
10
Neumático A
10.6
9.8
12.3
9.7
8.8
10
9.9
9
12.1
8.9
Neumático B
10.2
9.4
11.8
9.1
8.3
10.1
9.2
11.2
11
8.2
Automóvil
11
12
13
14
15
16
17
18
19
20
Neumático A
10.1
11
11.8
9.9
12.2
12.3
10.5
8.8
8.6
9.2
Neumático B
10.1
10
10.3
10.4
11.1
11.3
9.3
8.5
10.3
11
¿ Presentan los datos suficiente evidencia para concluir que hay diferencia en el desgaste promedio de los dos tipos de neumáticos?


2.- Se desea determinar si los promedios de puntos de calificación (PPC) son diferentes para niños y niñas. Se considera que el PPC se distribuye normalmente con varianza idéntica para ambos sexos. Dos muestras independientes de 5 estudiantes cada una proporcionan lo siguiente:
        PPC para niños: 2.9   3.1   2.7   3.3   3.0
        PPC para niñas: 3.6   2.8   3.6   3.2   2.8
a)      Utilizando α = 0.05, pruébese la hipótesis de que el PPC medio para niños es el mismo que el PPC medio para niñas, contra la hipótesis alternativa de que las dos medias son diferentes.
b)      Obténganse los límites de confianza del 95% para la verdadera diferencia entre las dos medias poblacionales.
3.- Se desea determinar si una clase de 16 estudiantes pueden desempeñarse igualmente bien en español que en matemáticas . Las calificaciones de prueba listadas a continuación no son independientes:
  
            Estudiante            Español            Matemáticas
           _________________________________________
                A                          84                       84
                B                          55                       57
                C                          85                       90
                D                          98                       97
                E                           80                      74
                F                           55                      53
               G                           80                      75
               H                           64                      63
               I                             91                      90
               J                            85                       82
               K                          90                        88
               L                           94                        98
               M                          75                        77
               N                          86                         90
               O                          91                         85
               P                           92                         86

a)      Considerando que las calificaciones de prueba se distribuyen normalmente, pruébese la hipótesis de que la puntuación media de la población en español es la misma que en matemáticas contra la hipótesis alternativa de que son diferentes para α = 0.05.

b)      Establézcase el intervalo de confianza del 95 % para la verdadera diferencia.

Tarea Análisis de Varianza


martes, 19 de noviembre de 2013

Análisis de Varianza ANOVA

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos:
En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de hipótesis, la probabilidad de encontrar alguno significativo por azar aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay una probabilidad a. Si se realizan m contrastes independientes, la probabilidad de que, en la hipótesis nula, ningún estadístico supere el valor crítico es (1 - a)m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores de a próximos a 0 es aproximadamente igual a a m. Una primera solución, denominada método de Bonferroni, consiste en bajar el valor de a, usando en su lugar a/m, aunque resulta un método muy conservador.
Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la hipótesis nula es que todas las muestras provienen de la misma población y, sin embargo, para cada comparación, la estimación de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.
El método que resuelve ambos problemas es el anova, aunque es algo más que esto: es un método que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante.

Analizar la siguiente presentación para entender los conceptos de ANOVA
http://www.slideshare.net/estadistica_a/anlisis-de-varianza

En Excel
http://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/notas_anova1_excel.pdf

Ejercicios
http://www.hrc.es/bioest/Anova_4.html
http://dta.utalca.cl/estadistica/ejercicios/interpretar/Metodos/resuelto%20anova.pdf
http://web.uam.es/personal_pdi/ciencias/cifus/biologia/metodos/ME-ejemplos.pdf

Lectura de una aplicación
http://catarina.udlap.mx/u_dl_a/tales/documentos/lii/munoz_l_jj/capitulo5.pdf