Logo Studenta

Estadistica - Parte Uno-páginas-95

¡Estudia con miles de materiales!

Vista previa del material en texto

408 CAPÍTULO 7 Prueba de hipótesis
La sección 7-4 presentó métodos de prueba de aseveraciones acerca de m cuando
se conoce s, pero en pocas ocasiones desconocemos el valor de m y conocemos el
valor de s. Los métodos de esta sección son mucho más prácticos y realistas por-
que suponen que se desconoce s, como generalmente sucede. Los supuestos, el
estadístico de prueba, el valor P y los valores críticos se resumen de la siguiente
manera.
Prueba de aseveraciones acerca de una media poblacional
(S desconocida)
Supuestos
1. La muestra es una muestra aleatoria simple.
2. Se desconoce el valor de la desviación estándar poblacional s.
3. Se satisfacen una o ambas de las siguientes condiciones: La población se distri-
buye de manera normal o n . 30.
Estadístico de prueba para aprobar una aseveración acerca de una
media (ss desconocida)
Valores P y valores críticos: Utilice la tabla A-3 y utilice gl 5 n 2 1 para el nú-
mero de grados de libertad. (Véase la figura 7-6 para los procedimientos del cálculo
del valor P).
t 5
x 2 mx
s1n
El requisito de una población con distribución normal no es estricto y gene-
ralmente podemos considerar que la población se distribuye normalmente después
de utilizar datos muestrales que confirmen que no existen datos distantes y cuando
el histograma tiene una forma no muy diferente de una distribución normal. Ade-
más, utilizamos el criterio simplificado de n . 30 como justificación para tratar
la distribución de medias de muestra como una distribución normal, pero el tamaño
de muestra mínimo en realidad depende de qué tanto la distribución de la pobla-
ción se aparta de una distribución normal. Como desconocemos el valor de s, la
estimamos con el valor de la desviación estándar muestral s, aunque esto introduce
otra fuente de baja confiabilidad, en especial con muestras pequeñas. Para compen-
sar esta baja confiabilidad añadida, calculamos los valores P y los valores críticos
empleando una distribución t, en lugar de la distribución normal que se empleó en
la sección 7-4, con s conocida. He aquí las propiedades importantes de la distri-
bución t de Student:
Propiedades importantes de la distribución t de Student
1. La distribución t de Student difiere para tamaños de muestra distintos (consulte
la figura 6-5 en la sección 6-4).
2. La distribución t de Student tiene la misma forma general de campana que la
distribución normal estándar; su forma más ancha refleja una mayor variabili-
dad, lo que se espera cuando se utiliza s para estimar s.
Mejores resulta-
dos con clases
más pequeñas
Un experimento realizado en la
Universidad Estatal de Nueva York,
en Stony Brook, reveló que los
estudiantes tenían mejores resulta-
dos en clases limitadas a 35 estu-
diantes, que en grupos grandes
que oscilaban entre 150 y 200
estudiantes. En un curso de cálcu-
lo, los porcentajes de fracaso fueron
del 19% en los grupos pequeños,
en comparación con un 50% en los
grupos grandes. Los porcentajes
de calificación A fueron del 24%
para los grupos pequeños y del 3%
para los grupos grandes. Estos
resultados sugieren que los estu-
diantes se benefician de los grupos
reducidos, que permiten una inte-
racción más directa entre los
alumnos y los maestros.
7-5 Prueba de una aseveración respecto de una media: S desconocida 409
La pena de
muerte como
correctivo
Un argumento utilizado común-
mente para sustentar la pena de
muerte es que ésta desanima a otros
individuos para cometer asesinatos.
Jeffrey Grogger, de la Universidad
de California, analizó los datos
sobre los homicidios diarios en
California durante cuatro años,
en una época en que las ejecucio-
nes eran frecuentes. Entre sus con-
clusiones, publicadas en el Journal
of the American Statistical Asso-
ciation (vol. 85, núm. 410) está lo
siguiente: “El análisis realizado de
forma consistente indica que estos
datos no sustentan la hipótesis de
que la ejecución desanima el asesi-
nato en el corto plazo”. La pena
capital es uno de los temas más
importantes de política social, y
los esfuerzos de personas como el
profesor Grogger ayudan a disipar
las ideas erróneas, de modo que
tengamos información precisa
que nos permita abordar temas
como éste.
continúa
3. La distribución t de Student tiene una media de t 5 0 (del mismo modo que la
distribución normal estándar tiene una media de z 5 0).
4. La desviación estándar de la distribución t de Student varía de acuerdo al ta-
maño de la muestra y es mayor que 1 (a diferencia de la distribución normal
estándar que tiene s5 1).
5. Conforme aumenta el tamaño de muestra n, la distribución t de Student se
acerca más a la distribución normal estándar.
Elección de la distribución apropiada
Cuando se prueban aseveraciones acerca de medias poblacionales, en ocasiones se
aplica la distribución normal, en otras la distribución t de Student y en algunas no
se aplica ninguna de las dos, por lo que debemos utilizar métodos no paramétricos
o técnicas bootstrap de muestreo. (Los métodos no paramétricos, que no requieren
una distribución en particular, se estudian el capítulo 12; la técnica bootstrap de
muestreo se describe en el “Proyecto tecnológico” que está al final del capítulo 6.)
Revise las páginas 336 y 337, donde la figura 6-6 y la tabla 6-1 resumen las deci-
siones a tomarse al elegir entre las distribuciones normal y t de Student. En ellas
se observa que cuando se prueban aseveraciones acerca de medias poblacionales,
la distribución t de Student se aplica en tales condiciones:
Utilice la distribución t de Student cuando se desconozca ss y cuando
cualquiera o ambas de las siguientes condiciones se satisfagan:
La población se distribuye normalmente o n .. 30.
EJEMPLO Temperaturas corporales A un estudiante del propedéu-
tico de la carrera de medicina se le pide realizar un proyecto en clase. Intrigado
por las temperaturas corporales del conjunto de datos 4 del Apéndice B, planea
recolectar su propio conjunto de datos para probar la aseveración de que la
temperatura corporal media es menor que 98.6°F, como suele pensarse. Por li-
mitación del tiempo impuesto por otros cursos y al deseo de mantener una vida
social que vaya más allá de hablar en sueños, se da cuenta de que tiene tiempo
para reunir datos únicamente de 12 personas. Después de planear cuidadosa-
mente un procedimiento para obtener una muestra aleatoria simple de 12 adul-
tos sanos, mide sus temperaturas corporales y obtiene los resultados listados
abajo. Utilice un nivel de significancia de 0.05 para probar la aseveración de
que estas temperaturas corporales provienen de una población con una media
menor que 98.6°F.
98.0 97.5 98.6 98.8 98.0 98.5 98.6 99.4 98.4 98.7 98.6 97.6
SOLUCIÓN Antes de llegar a la prueba de hipótesis, primero exploremos los
datos muestrales. No se presentan datos distantes y, con base en un histograma
y una gráfica cuantilar normal, podemos suponer que los datos provienen de
una población con una distribución normal. Utilizamos los datos muestrales
para calcular los siguientes estadísticos: n 5 12, 5 98.39, s 5 0.535. La me-
dia muestral de 5 98.39 es menor que 98.6, pero necesitamos determinar si
es significativamente menor que 98.6. Procedamos con una prueba de hipótesis
formal. Emplearemos el método tradicional de prueba de hipótesis resumido
en la figura 7-8.
x
x
410 CAPÍTULO 7 Prueba de hipótesis
Paso 7: Puesto que el estadístico de prueba t 5 21.360 no cae en la región
crítica, no rechazamos H0.
Paso 1: La aseveración original de que “la temperatura corporal media es me-
nor que 98.6°F” se expresa de manera simbólica como m , 98.6.
Paso 2: El opuesto de la aseveración original es m $ 98.6.
Paso 3: De las dos expresiones simbólicas obtenidas hasta ahora, la expresión
m, 98.6 no contiene igualdad, por lo tanto se convierte en la hipóte-
sis alternativa H1. La hipótesis nula es el supuesto de que m 5 98.6.
H0: m 5 98.6
H1: m , 98.6 (aseveración original)
Paso 4: El nivel de significancia es a 5 0.05.
Paso 5: En esta prueba de una aseveración acercade la media poblacional, el
estadístico más relevante es la media muestral. Para seleccionar la
distribución correcta, nos remitimos a la figura 6-6 o a la tabla 6-1.
Seleccionamos la distribución t de Student por las siguientes condi-
ciones: tenemos una muestra aleatoria simple, desconocemos el valor
de s y los datos muestrales parecen provenir de una población con
una distribución normal.
Paso 6: El estadístico de prueba es
El valor crítico de t 5 21.796 se calcula consultando la tabla A-3.
Primero localice n 2 1 5 11 grados de libertad en la columna de la
izquierda. Como la prueba es de cola izquierda, con a5 0.05, remítase
a la columna que indica un área de 0.05 en una cola. El estadístico de
prueba y el valor crítico se presentan en la siguiente representación
de la pantalla de STATDISK.
t 5
x 2 mx
s1n
5
98.39 2 98.6
0.535112
5 21.360
7-5 Prueba de una aseveración respecto de una media: S desconocida 411
continúa
INTERPRETACIÓN (Remítase a la figura 7-7 para saber cómo redactar la con-
clusión final). No existe evidencia suficiente para sustentar la aseveración de
que la muestra proviene de una población con una media menor que 98.6°F.
Esto no “prueba” que la media sea 98.6°F. De hecho, m bien puede ser menor
que 98.6°F, pero los dos valores muestrales no proporcionan una evidencia su-
ficientemente fuerte para sustentar esa aseveración. Si utilizáramos las 106
temperaturas corporales incluidas en el conjunto de datos 4 del Apéndice B,
encontraríamos que existe evidencia suficiente para sustentar la aseveración de
que la temperatura corporal media es menor que 98.6°F, pero los 12 valores
muestrales incluidos en este ejemplo no sustentan dicha aseveración.
El valor crítico en el ejemplo anterior fue t 5 21.796, pero si se hubiese utili-
zado la distribución normal, el valor crítico habría sido z 5 21.645. El valor críti-
co de la t de Student se encuentra más cargado a la izquierda, lo que demuestra que
con la distribución t de Student la evidencia muestral debe ser más extrema, antes
de considerarla significativa.
Cálculo de valores P con la distribución t
de Student
El ejemplo anterior siguió el método tradicional de prueba de hipótesis, pero
STATDISK, Minitab, la calculadora TI-83 Plus y muchos artículos de revistas cien-
tíficas presentan valores P. Para el ejemplo anterior, STATDISK presenta un valor P
de 0.1023, Minitab y Excel presentan un valor P de 0.102 y la calculadora TI-83
Plus muestra un valor P de 0.1022565104. Con un nivel de significancia de 0.05 y
un valor P mayor que 0.05, no rechazamos la hipótesis nula, como hicimos al em-
plear el método tradicional en el ejemplo anterior. Si no dispone de un programa
de cómputo o de una calculadora TI-83 Plus, utilice la tabla A-3 para identificar
un rango de valores que contenga el valor P. Recomendamos esta estrategia para
el cálculo de valores P, utilizando la distribución t:
1. Utilice un programa de cómputo o una calculadora TI-83 Plus.
2. Si no dispone de la tecnología, consulte la tabla A-3 para identificar un rango
de valores P. (Observe el siguiente ejemplo).
EJEMPLO Cálculo de valores P Suponiendo que no disponemos de un
programa de cómputo o de una calculadora TI-83 Plus, consultamos la tabla
A-3 para obtener un rango de valores para el valor P, correspondientes a los re-
sultados dados.
a. En una prueba de hipótesis de cola izquierda, el tamaño de la muestra es
n 5 12 y el estadístico de prueba es t 5 22.007.
b. En una prueba de hipótesis de cola derecha, el tamaño de la muestra es n 5 12
y el estadístico de prueba es t 5 1.222.
c. En una prueba de hipótesis de dos colas, el tamaño de la muestra es n 5 12
y el estadístico de prueba es t 5 23.456.
SOLUCIÓN De la figura 7-6, recuerde que el valor P es el área que se de-
termina de la siguiente manera:
412 CAPÍTULO 7 Prueba de hipótesis
Tabla A-3 Cálculo de valores P con la tabla A-3
Grados de libertad
•
•
•
11
•
•
•
Área en una cola
0.005 0.01 0.025 0.05 0.10
Área en dos colas
0.01 0.02 0.05 0.10 0.20
3.106 2.718 2.201 1.796 1.363
Para un estadístico de 
prueba positivo mayor 
que 3.106:
• La prueba de cola dere– 
 cha tiene un valor P 
 menor que 0.005.
• La prueba de dos colas 
 tiene un valor P menor 
 que 0.01.
Para un estadístico de 
prueba positivo que esté 
entre 2.201 y 1.796:
• La prueba de cola dere– 
 cha tiene un valor P 
 entre 0.025 y 0.05.
• La prueba de dos colas 
 tiene un valor P entre 
 0.05 y 0.10.
Para un estadístico de 
prueba positivo menor 
que 1.363:
• La prueba de cola dere– 
 cha tiene un valor P 
 mayor que 0.10.
• La prueba de dos colas 
 tiene un valor P mayor 
 que 0.20.
Nota: Si el estadístico de prueba es negativo elimine el signo negativo cuando...
 • La prueba de cola izquierda tiene el mismo valor P descrito
 arriba para una prueba de cola derecha.
 • La prueba de dos colas tiene el mismo valor P descrito arriba
 para una prueba de dos colas.
 • La prueba de cola derecha tiene un valor P mayor que 0.5.
Prueba de cola El valor P es el área que se ubica a la izquierda del esta-
izquierda: dístico de prueba.
Prueba de cola El valor P es el área que se ubica a la derecha del estadís-
derecha: tico de prueba.
Prueba de dos El valor P es dos veces el área en la cola limitada por el 
colas: estadístico de prueba.
En cada uno de los incisos a, b y c, el tamaño de la muestra es n 5 12, de
manera que el número de grados de libertad es gl 5 n 2 1 5 11. Observe la
porción de la tabla A-3 que se presenta a continuación, para 11 grados de liber-
tad junto con los recuadros que describen los procedimientos para el cálculo de
los valores P.
a. Se trata de una prueba de cola izquierda, con estadístico de prueba t 5
22.007, por lo que el valor P es el área ubicada a la izquierda de 22.007.
Por la simetría de la distribución t, es igual al área ubicada a la derecha
de 1 2.007. Observe la siguiente ilustración que muestra que cualquier
7-5 Prueba de una aseveración respecto de una media: S desconocida 413
estadístico de prueba que esté entre 2.201 y 1.796 posee un valor P de cola
derecha que se encuentra entre 0.025 y 0.05. Concluimos que 0.025 , va-
lor P , 0.05. (El valor P exacto calculado por medio de un programa de
cómputo es 0.0350).
b. Se trata de una prueba de cola derecha, con estadístico de prueba t 5 1.222,
de modo que el valor P es el área ubicada a la derecha de 1.222. Observe la
ilustración que indica que cualquier estadístico de prueba menor que 1.363
tiene un valor P de cola derecha que es mayor que 0.10. Concluimos que el
valor P es . 0.10. (El valor P exacto calculado con un programa de cóm-
puto es 0.124).
c. Se trata de una prueba de dos colas, con estadístico de prueba t 5 23.456.
El valor P es dos veces el área ubicada la izquierda de –3.456, pero con la
simetría de la distribución t, que es igual al doble del área ubicada a la dere-
cha de 13.456. Observe la ilustración que indica que cualquier estadístico
de prueba mayor que 3.106 tiene un valor P de dos colas que es menor que
0.01. Concluimos que el valor P es , 0.01. (El valor P exacto calculado
con un programa de cómputo es 0.00537).
Una vez que se ha comprendido el formato de la tabla A-3, no es difícil calcular
un rango de números para los valores P. Verifique sus resultados para asegurarse
de que siguen los mismos patrones presentados en la tabla A-3. De izquierda
a derecha, las áreas se incrementan conforme los valores de t disminuyen. Por
ejemplo, en el inciso b, el estadístico de prueba t 5 1.222 es menor que 1.363,
de manera que el área de cola derecha es mayor que 0.10.
Recuerde, los valores P se calculan con facilidad si se utiliza un programa
de cómputo o una calculadora TI-83 Plus. Además, se puede utilizar el método
tradicional de prueba de hipótesis en lugar del método del valor P.
Método del intervalo de confianza Podemos utilizar un intervalo de con-
fianza para probar una aseveración acerca de m, cuando desconocemos s. Para
una prueba de hipótesis de dos colas con un nivel de significanciade 0.05, cons-
truimos un intervalo de confianza del 95%, pero para una prueba de hipótesis de
una cola con un nivel de significancia de 0.05, construimos un intervalo de con-
fianza del 90%. (Véase la tabla 7-2). Utilizando los datos muestrales del pri-
mer ejemplo de esta sección (n 5 12 y 5 98.39, s 5 0.535), sin conocer s y
utilizando un nivel de significancia de 0.05, podemos probar la aseveración de
que m , 98.6 por medio del método del intervalo de confianza. Construya este
intervalo de confianza del 90%: 98.11 , m , 98.67 (Consulte la sección 6-4).
Como el valor supuesto de m 5 98.6 está contenido dentro del intervalo de con-
fianza, no podemos rechazar dicho supuesto. Con base en los 12 valores muestrales
dados en el ejemplo, no tenemos evidencias suficientes para sustentar la aseveración
de que la temperatura corporal media es menor que 98.6°F. Con base en el interva-
lo de confianza es probable que el valor verdadero de m esté entre 98.11 y 98.67,
incluyendo 98.6.
En la sección 7-3 aprendimos que cuando probamos una aseveración acerca
de una proporción poblacional, el método tradicional y el método del valor P son
equivalentes, pero el método del intervalo de confianza es un poco diferente. Cuando
se prueba una aseveración acerca de una media poblacional no existe dicha dife-
rencia y los tres métodos son equivalentes.
x

Continuar navegando