Unidade 7 - Testes de Hipóteses I

Estatistica Basica I

•

UFC

1

0

1

0

Janderson Pedro

20.08.2013

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
Aula 13
Teste de Hipóteses
Parte I
*
amostra
1. Introdução
*
Os testes de hipóteses são realizados para verificar se a estatística estimada a partir da amostra deve ou não ser aceita.
Agora veremos outro tipo de inferência estatística, os testes de hipóteses.
*
 Exemplo:
Um agrônomo deve decidir se realiza ou não correção do pH do solo. Para uma maior produção é necessário que no momento do plantio o pH do solo esteja básico, ou seja, maior que 7,0. 
Para verificar o pH do solo, foram coletadas 50 amostras. A partir destas 50 amostras o agrônomo verificou que o pH médio do solo é de 6,8 com desvio padrão igual a 0,8.
Baseando-se nestas informações amostrais o agrônomo deve fazer a correção do pH do solo?
*
Na prática seria impossível medir o pH de cada m2 da área destinada ao plantio
 O agrônomo deve fazer uma estimativa a partir de uma amostra.
Ao utilizar uma amostra de solo o agrônomo estará lidando com leis de probabilidades e qualquer afirmação a respeito do pH do solo de toda a área reservada para o plantio poderá estar certa ou errada.
*
O teste de hipóteses permite medir as probabilidades (de erro ou acerto) envolvidas na sua tomada de decisão. 
*
Teste de hipótese: é uma regra que permite com base em informações de uma amostra, decidir pela rejeição ou não de uma hipótese
2. Conceitos Básicos
*
 A hipótese nula é a hipótese na qual se especifica o valor do parâmetro da população ou a distribuição a testar. A hipótese nula é denotada por H0. A hipótese nula será verdadeira exceto se for obtida evidência em contrário.
2.1 Hipóteses do teste
*
A hipótese alternativa ou experimental é a hipótese que inclui todos os valores da população não cobertos pela hipótese nula e é denotada por H1. A hipótese alternativa será “verdadeira” se a hipótese nula for rejeitada ou falsa.
*
No exemplo, as hipóteses estatísticas podem ser:
Ho: a propriedade apresenta pH médio do solo () igual a 7,0
HA: a propriedade apresenta pH médio do solo () menor que 7,0
A notação correta seria
Ho:  = 7,0
HA:  < 7,0
*
Não rejeitar a hipótese nula (Ho) quando ela é verdadeira é uma decisão correta. No nosso exemplo significa aceitar que o pH do solo da área para plantio é igual a 7,0 (mesmo que na amostra tenha sido igual a 6,8).
O agrônomo tomará a decisão correta se resolver não fazer a correção do pH do solo.
*
Rejeitar a hipótese nula também pode ser uma decisão correta, no caso, significa fazer a correção do pH do solo porque não há indícios suficientes para aceitar que o pH da área seja igual a 7,0 e sim que o pH é menor que 7,0.
*
Quando devo rejeitar uma hipótese?
Deve-se dispor de um procedimento que mostre claramente quando não rejeitar H0 e, consequentemente, rejeitar H1, ou vice-versa. 
*
3. Procedimento geral para testes de hipóteses
a) Definir a hipótese nula e a hipótese alternativa.
b) Fixar o nível de significância do teste ( ).
 c) Calcular a estatística do teste (t, z, , 2).
 d) Construir a região crítica do teste.
e) Conclusão do teste.
*
As hipóteses do teste devem ser especificadas em termos de parâmetros populacionais, usando  , > ou <.
a) Definir a hipótese nula e a hipótese alternativa.
Por exemplo, pode-se formular a hipótese que o pH do solo da área para plantio é, em média, menor ou igual a 7,0 Formalmente isso é escrito como:
*
Ou ainda, formular a hipótese que o pH do solo da área para plantio é maior que 7,0. Formalmente isso é escrito como:
Ou ainda, formular a hipótese que o pH do solo da área para plantio é diferente de 7,0. Formalmente isso é escrito como:
*
Assim, o aluno deve aprender que 
em todo processo de decisão estatística, além da hipótese nula Ho existe a hipótese alternativa HA. Todo o processo decisório será feito em função de Ho, ou seja, não rejeitar ou rejeitar Ho. 
*
Logo, só rejeitaremos HA somente se a hipótese nula, Ho, não for rejeitada. É convenção colocar na Hipótese nula Ho o sinal de igualdade, embora, via de regra, seja a negação da hipótese alternativa. 
Na prática veremos que os testes já têm as hipóteses formuladas.
*
Na maioria dos casos a hipótese nula Ho coloca-se com o expresso propósito de ser rejeitada, se for rejeitada, pode-se não rejeitar a hipótese alternativa.
 A hipótese alternativa H1 é a definição operacional da hipótese de pesquisa, que é a predição deduzida da teoria que está sendo testada.
*
Exemplo
Ho: 	Em média, a produtividade não se altera com o treinamento. 	(c = s)
H1: 	Em média, a produtividade cresce com	o treinamento.	 		(c > s)
Outras hipóteses alternativas seriam
H1: 	Em média, a produtividade decresce com	o treinamento.	 		(c < s)
H1: 	Em média, a produtividade cresce ou decresce com	o treinamento.	 		(c  s) (Bilateral)
Um método de treinamento é aplicado para aumentar a produtividade dos funcionários de uma empresa.
*
b.1) Tipos de erro
Existem dois tipos de erro ao tomarmos uma decisão em um teste de hipótese. 
O primeiro erro é rejeitar a hipótese nula (Ho) quando ela é verdadeira, chamado de erro de tipo I; no nosso exemplo, significa não fazer a correção do pH quando este seria o procedimento correto.
b) Fixar o nível de significância do teste ( ).
O erro tipo I corresponde ao nível de significância do teste () 
*
A teoria estatística nos possibilita medir todas as probabilidades envolvidas na questão, logo podemos nos prevenir, controlando a probabilidade de cometer o erro mais grave. 
A probabilidade de cometer o erro de tipo I (rejeitar a hipótese nula Ho quando ela é verdadeira) é simbolizada por alfa (), também, conhecida como nível de significância.
 
*
Na prática, os valores usuais de alfa são 
  = 0,01 (1%)
  = 0,05 (5%)
  = 0,10 (10%)
Assim, 
 = nível de significância  erro de tipo I
 
= P (Rejeitar Ho / Ho é verdadeira)
 1 -  = P(aceitar H0 / H0 é verdadeira) 
*
O segundo erro é aceitar a hipótese nula (Ho) quando ela é falsa, chamado de erro de tipo II, no exemplo significa não fazer a correção sendo que o pH do solo é menor que 7,0.
Neste caso o agrônomo estaria correndo um risco de não fazer a correção e ter perdas de produtividade ao final do processo de produção.
*
A probabilidade de cometer o erro de tipo II (aceitar a hipótese nula Ho quando ela é falsa) é simbolizada por beta (), que está relacionado com o poder do teste.
 
= P (Aceitar Ho / Ho é falsa)  erro de tipo II
1 -  = P(rejeitar H0 / H1 é verdadeira) = (poder do teste)
 
 
*
Realidade
Ho falsa
Decisão correta (1- α)
(1 – β)
D
e
c
i
s
ã
o
Tipos de Erros
Erro tipo I
(α)
Decisão correta
Erro tipo II
(β)
Ho verdadeira
*
No exemplo H0 indica que o pH do solo é básico e não é necessário fazer a calagem do solo.
H1 indica que o pH do solo é ácido e é aconselhável fazer a calagem do solo.
*
*
Se p < α => Rejeitar H0, aprova-se H1. Os dados mostram que há evidência estatística suficiente para aprovar H1.
Se p ≥ α => Não rejeitar H0, não se aprova H1. Os dados NÃO mostram evidência estatística suficiente para aprovar H1. 
Cuidado com os casos de fronteira: p  α. 
b.2) Probabilidade de significância ou valor p
É a probabilidade de se cometer um erro ao rejeitar a hipótese nula
*
p ≥ 0,10 => Não existe evidência contra H0
p < 0,10 => Fraca evidência contra H0
p < 0,05 => Evidência significativa contra H0
p < 0,01 => Evidência altamente significativa contra H0
Algumas interpretações para o valor p
*
c) Calcular a estatística do teste (t, z, , 2).
É o valor calculado a partir da amostra, que será usado na tomada de decisão. A decisão do teste de hipótese é tomada após comparar o valor calculado da estatística do teste com o valor da tabela estatística.
*
Existem testes específicos para cada estimativa que se queira validar.
Assim, existe teste para a média, para variância, para a proporção...
Cada teste tem uma estatística própria que pode ser a t, z, , 2 
*
A escolha do teste dependerá de critérios como:
 Número de observações
 Número de amostras
 Tipo de
variáveis
 Relação entre os dados
 Tipo de distribuição
*
c.1) Cálculo das estatísticas z e t
Escolhido o teste é só calcular o valor da estatística.
Em testes de hipóteses para uma média  podem ser usadas as estatísticas z ou t, conforme será ensinado mais adiante. 
Nesse teste essas estatísticas são calculadas por meio das expressões:
*
d) Construção da região crítica do teste.
A região crítica é a região onde Ho é rejeitada. A área da região crítica é igual ao nível de significância (), que estabelece a probabilidade de rejeitar Ho quando ela é verdadeira.
*
Para construir a região crítica do teste o primeiro passo é identificar se este é unilateral ou bilateral.
*
d.1) Testes Unilaterais
Em um teste unilateral, a hipótese alternativa (H1) diz que o parâmetro é maior (unilateral à direita) ou menor (unilateral à esquerda) que o valor estipulado na hipótese nula.
*
No exemplo dado o teste realizado é do tipo unilateral
a hipótese alternativa (H1) diz que o parâmetro é menor (unilateral à esquerda) que o valor estipulado na hipótese nula.
*
d.2) Testes Bilaterais
O teste bilateral é empregado quando se deseja detectar variações no parâmetro, tanto para mais quanto para menos.
A hipótese alternativa (H1) diz que o parâmetro é diferente () do valor estipulado na hipótese nula.
*
Resumindo:
Unilateral à direita:
Ho:  = 7,0
H1::  > 7,0
Unilateral à esquerda: 
Ho: :  = 7,0
H1: :  < 7,0
Bilateral: 
Ho: :  = 7,0
H1::   7,0 


/2
/2
*
Região de rejeição ou região crítica: é aquela em que se rejeita a hipótese nula H0.
Região de aceitação: é aquela em que não se rejeita a hipótese nula H0.
d.3) Região crítica
*
Regra de Decisão: 
	Quando o valor da estatística do teste cair na região crítica, rejeita-se Ho. Ao rejeitar a hipótese nula (Ho) existe uma forte evidência de sua falsidade.
	Ao contrário, quando não rejeitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho. 
*
A decisão torna-se mais simples quando analisada graficamente. No exemplo, um teste bilateral:
Os valores que delimitam a região crítica são obtidos nas tabelas associadas às estatísticas de teste calculadas (tabela z, tabela t de Student, tabela do qui-quadrado, tabela F).
*
d.4) Casos específicos de regiões críticas
 região crítica do teste unilateral à direita
A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância  de 0,05, teste unilateral a direita, distribuição Z, sendo o raciocínio equivalente para a distribuição t
*
 região crítica do teste unilateral à esquerda
A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância  de 0,05, teste unilateral à esquerda ,distribuição Z, sendo o raciocínio equivalente para a distribuição t
*
 região crítica do teste bilateral
A figura abaixo apresenta as regiões de aceitação e rejeição da hipótese nula H0 para o nível de significância  de 0,05, teste bilateral, distribuição Z, sendo o raciocínio equivalente para a distribuição t
*
Deve-se comparar os valores absolutos Zt(z da tabela) e Zc(z calculado).
Se Zt<Zc ou tt<tc o valor observado está fora da área de aceitação da hipótese nula. Nesse caso, deve-se rejeitar a hipótese nula.
*
Aceitar Ho, implica que a hipótese nula não pode ser rejeitada!
Rejeitar Ho implica que temos evidências estatísticas para rejeitá-la com um risco conhecido : .
e) Conclusão do teste
*
4. Classificação dos testes de hipóteses
Testes Paramétricos ou Não Paramétricos
 Distribuição População é Conhecida
 Inferências Relativas a um ou vários Parâmetros
Variáveis quantitativas 
Testes Paramétricos
*
Testes Não Paramétricos
 Distribuição População Normalmente Desconhecida
Geralmente, não envolvem parâmetros
 Não se faz suposição sobre as medidas da variável de interesse
*
5. Principais testes paramétricos
 Teste de hipótese para a média populacional
 Teste de hipótese para a variância populacional
 Teste de hipótese para a proporção populacional
 Teste de hipótese para a comparação entre duas médias
 Teste de hipótese para a comparação entre duas ou mais médias
 Teste de hipótese para a comparação entre duas proporções
*
*