Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
408 CAPÍTULO 7 Prueba de hipótesis La sección 7-4 presentó métodos de prueba de aseveraciones acerca de m cuando se conoce s, pero en pocas ocasiones desconocemos el valor de m y conocemos el valor de s. Los métodos de esta sección son mucho más prácticos y realistas por- que suponen que se desconoce s, como generalmente sucede. Los supuestos, el estadístico de prueba, el valor P y los valores críticos se resumen de la siguiente manera. Prueba de aseveraciones acerca de una media poblacional (S desconocida) Supuestos 1. La muestra es una muestra aleatoria simple. 2. Se desconoce el valor de la desviación estándar poblacional s. 3. Se satisfacen una o ambas de las siguientes condiciones: La población se distri- buye de manera normal o n . 30. Estadístico de prueba para aprobar una aseveración acerca de una media (ss desconocida) Valores P y valores críticos: Utilice la tabla A-3 y utilice gl 5 n 2 1 para el nú- mero de grados de libertad. (Véase la figura 7-6 para los procedimientos del cálculo del valor P). t 5 x 2 mx s1n El requisito de una población con distribución normal no es estricto y gene- ralmente podemos considerar que la población se distribuye normalmente después de utilizar datos muestrales que confirmen que no existen datos distantes y cuando el histograma tiene una forma no muy diferente de una distribución normal. Ade- más, utilizamos el criterio simplificado de n . 30 como justificación para tratar la distribución de medias de muestra como una distribución normal, pero el tamaño de muestra mínimo en realidad depende de qué tanto la distribución de la pobla- ción se aparta de una distribución normal. Como desconocemos el valor de s, la estimamos con el valor de la desviación estándar muestral s, aunque esto introduce otra fuente de baja confiabilidad, en especial con muestras pequeñas. Para compen- sar esta baja confiabilidad añadida, calculamos los valores P y los valores críticos empleando una distribución t, en lugar de la distribución normal que se empleó en la sección 7-4, con s conocida. He aquí las propiedades importantes de la distri- bución t de Student: Propiedades importantes de la distribución t de Student 1. La distribución t de Student difiere para tamaños de muestra distintos (consulte la figura 6-5 en la sección 6-4). 2. La distribución t de Student tiene la misma forma general de campana que la distribución normal estándar; su forma más ancha refleja una mayor variabili- dad, lo que se espera cuando se utiliza s para estimar s. Mejores resulta- dos con clases más pequeñas Un experimento realizado en la Universidad Estatal de Nueva York, en Stony Brook, reveló que los estudiantes tenían mejores resulta- dos en clases limitadas a 35 estu- diantes, que en grupos grandes que oscilaban entre 150 y 200 estudiantes. En un curso de cálcu- lo, los porcentajes de fracaso fueron del 19% en los grupos pequeños, en comparación con un 50% en los grupos grandes. Los porcentajes de calificación A fueron del 24% para los grupos pequeños y del 3% para los grupos grandes. Estos resultados sugieren que los estu- diantes se benefician de los grupos reducidos, que permiten una inte- racción más directa entre los alumnos y los maestros. 7-5 Prueba de una aseveración respecto de una media: S desconocida 409 La pena de muerte como correctivo Un argumento utilizado común- mente para sustentar la pena de muerte es que ésta desanima a otros individuos para cometer asesinatos. Jeffrey Grogger, de la Universidad de California, analizó los datos sobre los homicidios diarios en California durante cuatro años, en una época en que las ejecucio- nes eran frecuentes. Entre sus con- clusiones, publicadas en el Journal of the American Statistical Asso- ciation (vol. 85, núm. 410) está lo siguiente: “El análisis realizado de forma consistente indica que estos datos no sustentan la hipótesis de que la ejecución desanima el asesi- nato en el corto plazo”. La pena capital es uno de los temas más importantes de política social, y los esfuerzos de personas como el profesor Grogger ayudan a disipar las ideas erróneas, de modo que tengamos información precisa que nos permita abordar temas como éste. continúa 3. La distribución t de Student tiene una media de t 5 0 (del mismo modo que la distribución normal estándar tiene una media de z 5 0). 4. La desviación estándar de la distribución t de Student varía de acuerdo al ta- maño de la muestra y es mayor que 1 (a diferencia de la distribución normal estándar que tiene s5 1). 5. Conforme aumenta el tamaño de muestra n, la distribución t de Student se acerca más a la distribución normal estándar. Elección de la distribución apropiada Cuando se prueban aseveraciones acerca de medias poblacionales, en ocasiones se aplica la distribución normal, en otras la distribución t de Student y en algunas no se aplica ninguna de las dos, por lo que debemos utilizar métodos no paramétricos o técnicas bootstrap de muestreo. (Los métodos no paramétricos, que no requieren una distribución en particular, se estudian el capítulo 12; la técnica bootstrap de muestreo se describe en el “Proyecto tecnológico” que está al final del capítulo 6.) Revise las páginas 336 y 337, donde la figura 6-6 y la tabla 6-1 resumen las deci- siones a tomarse al elegir entre las distribuciones normal y t de Student. En ellas se observa que cuando se prueban aseveraciones acerca de medias poblacionales, la distribución t de Student se aplica en tales condiciones: Utilice la distribución t de Student cuando se desconozca ss y cuando cualquiera o ambas de las siguientes condiciones se satisfagan: La población se distribuye normalmente o n .. 30. EJEMPLO Temperaturas corporales A un estudiante del propedéu- tico de la carrera de medicina se le pide realizar un proyecto en clase. Intrigado por las temperaturas corporales del conjunto de datos 4 del Apéndice B, planea recolectar su propio conjunto de datos para probar la aseveración de que la temperatura corporal media es menor que 98.6°F, como suele pensarse. Por li- mitación del tiempo impuesto por otros cursos y al deseo de mantener una vida social que vaya más allá de hablar en sueños, se da cuenta de que tiene tiempo para reunir datos únicamente de 12 personas. Después de planear cuidadosa- mente un procedimiento para obtener una muestra aleatoria simple de 12 adul- tos sanos, mide sus temperaturas corporales y obtiene los resultados listados abajo. Utilice un nivel de significancia de 0.05 para probar la aseveración de que estas temperaturas corporales provienen de una población con una media menor que 98.6°F. 98.0 97.5 98.6 98.8 98.0 98.5 98.6 99.4 98.4 98.7 98.6 97.6 SOLUCIÓN Antes de llegar a la prueba de hipótesis, primero exploremos los datos muestrales. No se presentan datos distantes y, con base en un histograma y una gráfica cuantilar normal, podemos suponer que los datos provienen de una población con una distribución normal. Utilizamos los datos muestrales para calcular los siguientes estadísticos: n 5 12, 5 98.39, s 5 0.535. La me- dia muestral de 5 98.39 es menor que 98.6, pero necesitamos determinar si es significativamente menor que 98.6. Procedamos con una prueba de hipótesis formal. Emplearemos el método tradicional de prueba de hipótesis resumido en la figura 7-8. x x 410 CAPÍTULO 7 Prueba de hipótesis Paso 7: Puesto que el estadístico de prueba t 5 21.360 no cae en la región crítica, no rechazamos H0. Paso 1: La aseveración original de que “la temperatura corporal media es me- nor que 98.6°F” se expresa de manera simbólica como m , 98.6. Paso 2: El opuesto de la aseveración original es m $ 98.6. Paso 3: De las dos expresiones simbólicas obtenidas hasta ahora, la expresión m, 98.6 no contiene igualdad, por lo tanto se convierte en la hipóte- sis alternativa H1. La hipótesis nula es el supuesto de que m 5 98.6. H0: m 5 98.6 H1: m , 98.6 (aseveración original) Paso 4: El nivel de significancia es a 5 0.05. Paso 5: En esta prueba de una aseveración acercade la media poblacional, el estadístico más relevante es la media muestral. Para seleccionar la distribución correcta, nos remitimos a la figura 6-6 o a la tabla 6-1. Seleccionamos la distribución t de Student por las siguientes condi- ciones: tenemos una muestra aleatoria simple, desconocemos el valor de s y los datos muestrales parecen provenir de una población con una distribución normal. Paso 6: El estadístico de prueba es El valor crítico de t 5 21.796 se calcula consultando la tabla A-3. Primero localice n 2 1 5 11 grados de libertad en la columna de la izquierda. Como la prueba es de cola izquierda, con a5 0.05, remítase a la columna que indica un área de 0.05 en una cola. El estadístico de prueba y el valor crítico se presentan en la siguiente representación de la pantalla de STATDISK. t 5 x 2 mx s1n 5 98.39 2 98.6 0.535112 5 21.360 7-5 Prueba de una aseveración respecto de una media: S desconocida 411 continúa INTERPRETACIÓN (Remítase a la figura 7-7 para saber cómo redactar la con- clusión final). No existe evidencia suficiente para sustentar la aseveración de que la muestra proviene de una población con una media menor que 98.6°F. Esto no “prueba” que la media sea 98.6°F. De hecho, m bien puede ser menor que 98.6°F, pero los dos valores muestrales no proporcionan una evidencia su- ficientemente fuerte para sustentar esa aseveración. Si utilizáramos las 106 temperaturas corporales incluidas en el conjunto de datos 4 del Apéndice B, encontraríamos que existe evidencia suficiente para sustentar la aseveración de que la temperatura corporal media es menor que 98.6°F, pero los 12 valores muestrales incluidos en este ejemplo no sustentan dicha aseveración. El valor crítico en el ejemplo anterior fue t 5 21.796, pero si se hubiese utili- zado la distribución normal, el valor crítico habría sido z 5 21.645. El valor críti- co de la t de Student se encuentra más cargado a la izquierda, lo que demuestra que con la distribución t de Student la evidencia muestral debe ser más extrema, antes de considerarla significativa. Cálculo de valores P con la distribución t de Student El ejemplo anterior siguió el método tradicional de prueba de hipótesis, pero STATDISK, Minitab, la calculadora TI-83 Plus y muchos artículos de revistas cien- tíficas presentan valores P. Para el ejemplo anterior, STATDISK presenta un valor P de 0.1023, Minitab y Excel presentan un valor P de 0.102 y la calculadora TI-83 Plus muestra un valor P de 0.1022565104. Con un nivel de significancia de 0.05 y un valor P mayor que 0.05, no rechazamos la hipótesis nula, como hicimos al em- plear el método tradicional en el ejemplo anterior. Si no dispone de un programa de cómputo o de una calculadora TI-83 Plus, utilice la tabla A-3 para identificar un rango de valores que contenga el valor P. Recomendamos esta estrategia para el cálculo de valores P, utilizando la distribución t: 1. Utilice un programa de cómputo o una calculadora TI-83 Plus. 2. Si no dispone de la tecnología, consulte la tabla A-3 para identificar un rango de valores P. (Observe el siguiente ejemplo). EJEMPLO Cálculo de valores P Suponiendo que no disponemos de un programa de cómputo o de una calculadora TI-83 Plus, consultamos la tabla A-3 para obtener un rango de valores para el valor P, correspondientes a los re- sultados dados. a. En una prueba de hipótesis de cola izquierda, el tamaño de la muestra es n 5 12 y el estadístico de prueba es t 5 22.007. b. En una prueba de hipótesis de cola derecha, el tamaño de la muestra es n 5 12 y el estadístico de prueba es t 5 1.222. c. En una prueba de hipótesis de dos colas, el tamaño de la muestra es n 5 12 y el estadístico de prueba es t 5 23.456. SOLUCIÓN De la figura 7-6, recuerde que el valor P es el área que se de- termina de la siguiente manera: 412 CAPÍTULO 7 Prueba de hipótesis Tabla A-3 Cálculo de valores P con la tabla A-3 Grados de libertad • • • 11 • • • Área en una cola 0.005 0.01 0.025 0.05 0.10 Área en dos colas 0.01 0.02 0.05 0.10 0.20 3.106 2.718 2.201 1.796 1.363 Para un estadístico de prueba positivo mayor que 3.106: • La prueba de cola dere– cha tiene un valor P menor que 0.005. • La prueba de dos colas tiene un valor P menor que 0.01. Para un estadístico de prueba positivo que esté entre 2.201 y 1.796: • La prueba de cola dere– cha tiene un valor P entre 0.025 y 0.05. • La prueba de dos colas tiene un valor P entre 0.05 y 0.10. Para un estadístico de prueba positivo menor que 1.363: • La prueba de cola dere– cha tiene un valor P mayor que 0.10. • La prueba de dos colas tiene un valor P mayor que 0.20. Nota: Si el estadístico de prueba es negativo elimine el signo negativo cuando... • La prueba de cola izquierda tiene el mismo valor P descrito arriba para una prueba de cola derecha. • La prueba de dos colas tiene el mismo valor P descrito arriba para una prueba de dos colas. • La prueba de cola derecha tiene un valor P mayor que 0.5. Prueba de cola El valor P es el área que se ubica a la izquierda del esta- izquierda: dístico de prueba. Prueba de cola El valor P es el área que se ubica a la derecha del estadís- derecha: tico de prueba. Prueba de dos El valor P es dos veces el área en la cola limitada por el colas: estadístico de prueba. En cada uno de los incisos a, b y c, el tamaño de la muestra es n 5 12, de manera que el número de grados de libertad es gl 5 n 2 1 5 11. Observe la porción de la tabla A-3 que se presenta a continuación, para 11 grados de liber- tad junto con los recuadros que describen los procedimientos para el cálculo de los valores P. a. Se trata de una prueba de cola izquierda, con estadístico de prueba t 5 22.007, por lo que el valor P es el área ubicada a la izquierda de 22.007. Por la simetría de la distribución t, es igual al área ubicada a la derecha de 1 2.007. Observe la siguiente ilustración que muestra que cualquier 7-5 Prueba de una aseveración respecto de una media: S desconocida 413 estadístico de prueba que esté entre 2.201 y 1.796 posee un valor P de cola derecha que se encuentra entre 0.025 y 0.05. Concluimos que 0.025 , va- lor P , 0.05. (El valor P exacto calculado por medio de un programa de cómputo es 0.0350). b. Se trata de una prueba de cola derecha, con estadístico de prueba t 5 1.222, de modo que el valor P es el área ubicada a la derecha de 1.222. Observe la ilustración que indica que cualquier estadístico de prueba menor que 1.363 tiene un valor P de cola derecha que es mayor que 0.10. Concluimos que el valor P es . 0.10. (El valor P exacto calculado con un programa de cóm- puto es 0.124). c. Se trata de una prueba de dos colas, con estadístico de prueba t 5 23.456. El valor P es dos veces el área ubicada la izquierda de –3.456, pero con la simetría de la distribución t, que es igual al doble del área ubicada a la dere- cha de 13.456. Observe la ilustración que indica que cualquier estadístico de prueba mayor que 3.106 tiene un valor P de dos colas que es menor que 0.01. Concluimos que el valor P es , 0.01. (El valor P exacto calculado con un programa de cómputo es 0.00537). Una vez que se ha comprendido el formato de la tabla A-3, no es difícil calcular un rango de números para los valores P. Verifique sus resultados para asegurarse de que siguen los mismos patrones presentados en la tabla A-3. De izquierda a derecha, las áreas se incrementan conforme los valores de t disminuyen. Por ejemplo, en el inciso b, el estadístico de prueba t 5 1.222 es menor que 1.363, de manera que el área de cola derecha es mayor que 0.10. Recuerde, los valores P se calculan con facilidad si se utiliza un programa de cómputo o una calculadora TI-83 Plus. Además, se puede utilizar el método tradicional de prueba de hipótesis en lugar del método del valor P. Método del intervalo de confianza Podemos utilizar un intervalo de con- fianza para probar una aseveración acerca de m, cuando desconocemos s. Para una prueba de hipótesis de dos colas con un nivel de significanciade 0.05, cons- truimos un intervalo de confianza del 95%, pero para una prueba de hipótesis de una cola con un nivel de significancia de 0.05, construimos un intervalo de con- fianza del 90%. (Véase la tabla 7-2). Utilizando los datos muestrales del pri- mer ejemplo de esta sección (n 5 12 y 5 98.39, s 5 0.535), sin conocer s y utilizando un nivel de significancia de 0.05, podemos probar la aseveración de que m , 98.6 por medio del método del intervalo de confianza. Construya este intervalo de confianza del 90%: 98.11 , m , 98.67 (Consulte la sección 6-4). Como el valor supuesto de m 5 98.6 está contenido dentro del intervalo de con- fianza, no podemos rechazar dicho supuesto. Con base en los 12 valores muestrales dados en el ejemplo, no tenemos evidencias suficientes para sustentar la aseveración de que la temperatura corporal media es menor que 98.6°F. Con base en el interva- lo de confianza es probable que el valor verdadero de m esté entre 98.11 y 98.67, incluyendo 98.6. En la sección 7-3 aprendimos que cuando probamos una aseveración acerca de una proporción poblacional, el método tradicional y el método del valor P son equivalentes, pero el método del intervalo de confianza es un poco diferente. Cuando se prueba una aseveración acerca de una media poblacional no existe dicha dife- rencia y los tres métodos son equivalentes. x
Compartir