Buscar

TOPICO 2 Introducao aos testes Hipoteses parametricos

Prévia do material em texto

Profa. Débora Spenassato 
E-mail: dspenassato@furg.br 
TESTES DE HIPÓTESES: 
Fundamentos 
O método científico engloba: 
- a observação de um fato; 
- elaboração de uma “pergunta” acerca desse fato, com 
base em uma teoria que precisa ser explicada; 
- formulação de uma hipótese, consistindo em possíveis 
respostas testáveis para esta pergunta. 
http://brasilescola.uol.com.br/biologia/a-metodologia-cientifica.htm 
Um dos problemas a serem resolvidos 
pela inferência estatística é o de testar 
uma hipótese. 
Objetivo: fornecer uma metodologia que nos permita verificar 
se os dados amostrais trazem evidências que apoiem ou não 
uma hipótese formulada sobre o parâmetro populacional. 
 
Testes de Hipóteses 
Este procedimento supõem verdadeira a hipótese em questão 
e verifica se a amostra é “verossímel” nessas condições. 
A partir da amostra da população, deve-se estabelecer uma regra 
de decisão sobre a qual rejeitamos ou não a hipótese testada. 
 
 
A Regra do Evento Raro para a Inferência estatística 
 
Se, sob certa suposição/hipótese (ex. a hipótese de que meninos e 
meninas têm a mesma chance de nascer, p=0,5), a probabilidade de 
um evento particular observado (ex. 879 meninas em 945 
nascimentos) é extremamente pequena, concluímos que a hipótese 
provavelmente não é correta. 
 
Triola (2017) 
Busca-se, com base na amostra, distinguir entre resultados que 
podem facilmente ocorrer por acaso e resultados que são 
altamente improváveis de ocorrer por acaso. 
Explicação: ou o evento raro realmente ocorreu ou a suposição não é 
verdadeira. 
Exemplos de Hipóteses 
a) A implementação de um programa de melhoria da qualidade em 
uma empresa prestadora de serviços melhora a satisfação de 
seus clientes. 
 
b) Uma certa campanha publicitária produz efeito positivo nas 
vendas. 
c) Aumentando a dosagem de cimento, aumenta-se a resistência 
do concreto. 
 
Como verificar estatisticamente a veracidade de uma hipótese? 
Avaliar a porcentagem de reclamações antes e 
depois do programa de melhoria da qualidade. 
Formulação de Hipóteses em termos de Parâmetros 
a) A proporção de reclamações após a realização do programa 
de melhoria da qualidade é menor do que antes da realização 
do programa. 
 
b) A média das vendas depois da campanha publicitária é maior 
do que a média das vendas antes da campanha publicitária. 
 
Essas formulações dependem do problema 
e do planejamento do experimento. 
Para o estudo dos testes de hipóteses, precisamos entender 
seus componentes: 
 
1. Hipótese nula e alternativa; 
2. Tipos de erro; 
3. Nível de significância (α); 
4. Testes de hipóteses unilaterais ou bilaterais; 
5. Valor crítico, região crítica e p-valor; 
6. Estatística de teste. 
1. Hipóteses 
Uma hipótese estatística é uma afirmação sobre os parâmetros de 
uma ou mais populações. 
 
Normalmente são formuladas duas hipóteses: H0 e H1 
 
H0: (hipótese nula) 
• Hipótese considerada verdadeira até que se prove o contrário; 
• Geralmente representa o contrário do que queremos provar; 
• Geralmente é formulada em termos de igualdade entre parâmetros 
(ex.: µ1 = µ2) ou entre um parâmetro e uma constante (ex.: µ = 3). Em 
alguns casos ≤ ou ≥ . 
Exemplos: H0: p = 0,5 H0: µ = 100 H0: σ = 15 
 
 
 
Em um teste estatístico, o teste é planejado para avaliar a força 
da evidência contra a hipótese nula. Logo, esta é a afirmativa 
testada e a decisão do teste será em relação à essa hipótese. 
 
Ex.: Rejeita H0 ou Não rejeita H0 
 
H0: pode ser determinada a partir de experiência passada ou de 
conhecimento do processo, ou mesmo de testes ou 
experimentos prévios. 
 
H1: (ou Ha hipótese alternativa) 
• Hipótese aceita se há evidências suficientes para rejeitar H0; 
• Geralmente é formulada em termos de desigualdade (≠, < ou >); 
• Geralmente corresponde ao que se quer provar. 
 
Exemplos: H1: p > 0,5 H1: µ ≠ 100 H1: σ < 15 
 
 
H1 NÃO INCLUIRÁ O SINAL DE IGUALDADE! 
Exemplo 1 – igualdade entre um parâmetro e uma constante: 
(afirmação) 
A pesquisa Survey of Studies and Attitudes (SSHA) é um teste 
psicológico que mede os hábitos de estudo dos alunos e suas 
reações à escola. Os escores variam de 0 a 200. O escore médio 
para estudantes universitários é de aproximadamente 115 e o desvio 
padrão em torno de 30. Uma professora suspeita que a média para 
alunos mais velhos seja superior a 115. Ela aplica o teste a uma 
amostra aleatória simples de 25 estudantes com idades acima de 30 
anos. Suponha que os escores para essa população seja 
normalmente distribuída com desvio padrão de 30. 
 
H0: μ = 115 
H1: μ > 115 
Um grupo de pesquisadores da área de saúde afirma que o 
medicamento formulado por eles consegue curar uma determinada 
doença em mais de 80 % dos pacientes testados. 
Esta alegação será representada pela hipótese alternativa, pois é uma 
afirmativa de desigualdade. 
 
H0 :p ≤ 0,8 
H1 :p > 0,8 
Exemplo 2: 
(afirmação) 
ou só = 
Exemplos 3 - igualdade entre parâmetros: 
a) H0: p1 = p2 e H1: p1 > p2 
onde: 
•p1 é a proporção de reclamações antes do programa de melhoria da 
qualidade; e 
•p2 é a proporção de reclamações depois do programa de melhoria da 
qualidade. 
 
b) H0: μ1 = μ2 e H1: μ1 < μ2 
onde: 
•μ1 é o valor médio das vendas antes da campanha publicitária; 
•μ2 é o valor médio das vendas depois da campanha publicitária. 
 
 
A decisão de rejeitar H0, ou não, é feita a partir de amostras 
extraídas adequadamente das populações envolvidas. 
 
A aplicação de um teste estatístico (ou teste de significância) 
serve para verificar se os dados fornecem evidência suficiente 
para que possamos aceitar como verdadeira a hipótese 
alternativa (H1), precavendo-nos, com certa segurança, de que 
as diferenças observadas nos dados não são meramente 
casuais. 
Como verificar estatisticamente a veracidade de uma hipótese? 
 
Quando realizamos um teste de hipótese podemos estar 
cometendo dois tipos de erro: 
 2. Tipos de Erros 
Realidade 
(desconhecida) 
Decisão do teste 
Não rejeita H0 Rejeita H0 
H0 é verdadeira 
Decisão correta 
(probab = 1 – α ) 
Erro tipo I 
(probab = α ) 
H0 é falsa 
Erro tipo II 
(probab = β ) 
Decisão correta 
(probab = 1 – β ) 
Poder do teste 
OU sensibilidade 
de um teste 
Iremos trabalhar com o erro do tipo I em que a probabilidade de 
ocorrência é dada pelo nível de significância . 
P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira) = α 
P(erro tipo II) = P(não rejeitar H0 | H0 é falsa) = β 
controlado 
Geralmente é desconhecido 
Relação entre α, β e n 
 
 Para qualquer α fixo, o aumento no tamanho amostral n 
causará um decréscimo em β. 
 
 Para qualquer n fixo, o aumento em α causará um 
decréscimo em β. 
 
 Para diminuir α e β, aumente o tamanho de n. 
 
 
 
Exemplo1: A meteorologia esta marcando a possibilidade de chuva, portanto, 
antes de sairmos de casa precisamos tomar uma decisão, levar ou não o guarda-
chuva. A tabela abaixo apresenta as duas decisões corretas que podemos tomar 
e os dois tipos de erro que podemos estar cometendo: 
 
◦ 3 
 
Se levarmos o guarda-chuva e chover significa que tomamos a decisão correta, 
se não chover, estaremos cometendo um erro do tipo II, o que implica 
carregarmos o guarda-chuva que não iremos usar. 
 
Se não levarmos o guarda-chuva e não chover, também estaremos tomando 
uma decisãocorreta, no entanto, se chover estaremos cometendo um erro do 
tipo I, o que implicaria em um banho de chuva. 
Exemplo 2: 
 
Ho: produto A é cancerígeno; 
H1: produto A não é cancerígeno; 
 
 
P(erro tipo I) = (rejeitar Ho | dado que Ho é verdadeira) 
 
 
 
 
P(erro tipo II) = (não rejeitar Ho| dado que é Ho falsa) 
 
Erro tipo I é o mais importante a ser evitado. 
Uma pessoa é inocente até prova do contrário 
 H0: A pessoa é inocente 
 H1: A pessoa é culpada 
 
 Erro I: A pessoa é condenada, mas ela é inocente. 
 Erro II: A pessoa é absolvida, mas ela é culpada. 
 
 A justiça procura reduzir a possibilidade de ocorrer o erro Tipo I, pois 
entende-se que é mais grave condenar inocentes do que absolver 
criminosos. 
 Para certos sistemas judiciais um  = 0,1 é elevado, optando por 
=0,01, por exemplo. 
Exemplo 3: 
3. Nível de Significância (α ) 
O nível de significância () é a probabilidade de ocorrer um erro do 
tipo I. 
Antes de iniciar o teste, o pesquisador determina o nível de risco 
() que pode ser tolerado. Logo, o erro do tipo I está sob o controle 
do pesquisador. 
Um teste com um nível de significância de 5% significa que temos 
cerca de 5 chances em 100 de rejeitarmos a hipótese nula e ela ser 
verdadeira. 
Os valores mais comuns para o nível de significância são 5%, 10% e 
1%. 
 
 
 
4. Testes Unilaterais e Bilaterais 
 Unilateral à direita: 
 Ho:  = 0 
 H1:  > 0 
 
 Unilateral à esquerda: 
 Ho:  = 0 
 H1:  < 0 
 
 Bilateral: 
 Ho:  = 0 
 H1:   0 0 é um valor da média 
 
 Hipótese alternativa unilateral: afirma-se que um parâmetro é maior do que 
ou menor do que o valor de Ho. 
 Hipótese alternativa bilateral: afirma-se que o parâmetro é diferente do valor 
de Ho (pode ser menor ou maior). 
Exemplo 1 (retomando): 
(afirmação) 
A pesquisa Survey of Studies and Attitudes (SSHA) é um teste 
psicológico que mede os hábitos de estudo dos alunos e suas 
reações à escola. Os escores variam de 0 a 200. O escore médio 
para estudantes universitários é de aproximadamente 115 e o desvio 
padrão em torno de 30. Uma professora suspeita que a média para 
alunos mais velhos seja superior a 115. Ela aplica o teste a uma 
amostra aleatória simples de 25 estudantes com idades acima de 30 
anos. Suponha que os escores para essa população seja 
normalmente distribuída com desvio padrão de 30. Supondo que a 
 , teste a hipótese a um nível de 5% de significância. 
H0: μ = 115 
H1: μ > 115 
6,118X
5. Região crítica e valor crítico 
O valor de α e a distribuição de probabilidade da estatística do teste 
vão ser utilizados para definir a chamada região crítica ou região 
de rejeição. 
 
Nível de 
significância (α) 
0,10 ou 
10% 
0,05 ou 
5% 
0,01 ou 
1% 
0,005 ou 
0,5% 
0,002 ou 
0,2% 
Valores de Zc 
para testes 
unilaterais 
-1,28 ou 
1,28 
-1,64 ou 
1,64 
-2,33 ou 
2,33 
-2,58 ou 
2,58 
-2,88 ou 
2,88 
Valores de Zc 
para testes 
bilaterais 
-1,64 e 
1,64 
-1,96 e 
1,96 
-2,58 e 
2,58 
-2,81 e 
2,81 
-3,08 e 
3,08 
 
 
 
Valores críticos (Zc) em testes de hipótese 
 É o valor calculado a partir da amostra, que será usado na 
tomada de decisão. 
 
 Uma maneira de tomar uma decisão é comparar o valor 
tabelado (Zc) com a estatística do teste (Zcal). 
 
 Por exemplo: teste de hipótese para a média (μ) e a proporção (p). 
 
 
 
xx
cal
sou
)X(
Z
σ
μ
Estatística 
de teste 
6. Estatística de Teste 
Zteste 
Exemplo 1 (retomando): 
(afirmação) 
A pesquisa Survey of Studies and Attitudes (SSHA) é um teste 
psicológico que mede os hábitos de estudo dos alunos e suas 
reações à escola. Os escores variam de 0 a 200. O escore médio 
para estudantes universitários é de aproximadamente 115 e o desvio 
padrão em torno de 30. Uma professora suspeita que a média para 
alunos mais velhos seja superior a 115. Ela aplica o teste a uma 
amostra aleatória simples de 25 estudantes com idades acima de 30 
anos. Suponha que os escores para essa população seja 
normalmente distribuída com desvio padrão de 30. Supondo que a 
 , teste a hipótese a um nível de 5% de significância. 
H0: μ = 115 
H1: μ > 115 
6,118X
58,0
25
30
)1156,118(


calZ
Se o valor da estatística de teste “cair” na região de rejeição, 
decidimos rejeitar H0; caso contrário, decidimos não rejeitar 
H0. 
 
Exemplo: 
Decisão com base na estatística de teste e Região Crítica 
Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos 
alunos e suas reações à escola. 
Decisão: não rejeitar H0 
 
 
 
x
cal
X
Z

)( 

Com base na definição de α, podemos encontrar a regra de 
decisão na amostra, ou seja, achar . Isto é, para quais valores 
de deve-se rejeitar Ho? 
 
CX
84,124
6
)115(
64,1 

 C
X
Teste unilateral e α=5% 
X
Rejeita-se H0 para qualquer valor acima de 124,84. 
P é a probabilidade, calculada supondo H0 verdadeira, da 
estatística de teste acusar um resultado tão (ou mais) distante do 
esperado quanto o resultado ocorrido na amostra. 
É usada para avaliar a probabilidade de o resultado obtido ter 
ocorrido por acaso. 
Portanto, estabelecido o nível de significância (α), temos a 
seguinte regra de decisão de um teste estatístico: 
Valor de P ≤ α → rejeitar H0 
 
Valor de P > α → não rejeitar H0 
Os dados não mostram 
evidência para afirmar H1 
Regra de decisão com base em P-valor 
Os dados são estatisticamente 
significantes no nível α 
 
Se o teste não rejeita H0 (P > α), não temos muito controle do 
erro tipo II, pois a probabilidade β, em geral não é conhecida. 
 
Isso não implica que H0 seja realmente a hipótese 
verdadeira, mas que os dados não estão mostrando 
evidência suficiente para rejeitá-la. 
Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos 
alunos e suas reações à escola. 
H0: μ = 115 
H1: μ > 115 
P-valor: é a probabilidade da estatística de teste 
acusar um resultado tão (ou mais) distante do 
esperado quanto o resultado ocorrido na amostra. 
25
6,118


n
X
58,0calZ
P=0,5-0,219=0,281 
P ≤ α → rejeitar H0 
 
P > α → não rejeitar H0 
Decisão: 
Como P = 0,281 > α=0,05 
 não rejeitar H0 
(Triola, 2012) 
Procedimento para a 
determinação de valores P 
Em resumo, o processo geral consiste no seguinte: 
 
1. Formular a hipótese nula (H0) e a hipótese alternativa (H1); 
2. Escolher a estatística a ser utilizada (Ex. μ, p, correlação...) e 
encontrar a sua distribuição amostral de probabilidade (Dist. 
Normal, t de Student, Qui-quadrado) sob o pressuposto de H0 
ser verdadeira; 
3. Especificar um nível de significância (α); 
4. Determinar a região de rejeição com base no passo 3; 
5. Calcular o valor da estatística de teste com base na amostra; 
6. Decisão: rejeitar H0 ou não rejeitar H0. 
7. Interpretar o resultado. 
(Triola, 2012) 
Interpretação 
Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos 
alunos e suas reações à escola. 
H0: μ = 115 
H1: μ > 115 (afirmação) 25
6,118


n
X
58,0calZDecisão: não rejeitar H0 
Interpretação: Não há evidência suficiente para apoiar a 
afirmativa de que o escore médio no teste é maior do que 
115 para alunos mais velhos. 
Tipos de testes paramétricos 
 
Os testes paramétricos podemser divididos em testes para: 
 Uma amostra 
 Duas amostras independentes 
 Duas amostras emparelhadas (dependentes) 
 Várias amostras (Análise de Variância) 
Referências: 
 
TRIOLA, Mario F. Introdução a estatística. 12. ed. Rio de Janeiro: LTC, 2012. 
BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio 
Cezar. Estatística Para Cursos de Engenharia e Informática. 3 ed. São 
Paulo: Atlas, 2010. 
BRUNI, Adriano L. Estatística Aplicada à Gestão Empresarial. 2.ed. São 
Paulo: Atlas, 2010. 
PINTO, S.S.; SILVA, C. S. Estatística vol. 2. Porto Alegre: a autora, 2013. 
MOORE, D., NOTZ, I., FLINGER, A. A Estatística Básica e sua Prática, 7ª 
edição. LTC, 2017.

Continue navegando