Buscar

Testes não paramétricos

Prévia do material em texto

22/06/2016
1
Testes não paramétricos
Teste Quiquadrado
• Os procedimentos correspondem a três testes 
que utilizam a Distribuição Quiquadrado e se 
relacionam todos com a comparação de 
freqüências, obtidas em amostras, de certas 
categorias, com freqüências esperadas 
baseadas, em cada caso, em hipóteses 
particulares. 
- Teste de Aderência
- Teste de Independência
- Teste de Homogeneidade
22/06/2016
2
Teste de Aderência (Ajuste)
• É um teste não paramétrico que é 
utilizado para verificar se uma variável 
apresenta determinada distribuição de 
probabilidade 
• As hipóteses são:
– H0: os resultados ocorrem com as 
freqüências previstas pelo modelo 
probabilístico. 
– H1: os resultados ocorrem com freqüências 
diferentes das previstas pelo modelo.
Teste de Aderência (Ajuste)
• Sendo observada uma amostra de n
valores da variável em estudo, a variável 
teste é o valor quiquadrado para testar a 
diferença entre padrões obtidos e 
esperados de freqüência:
∑
−
=
esperado
esperadoobservado 22 )(χ
onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente.
22/06/2016
3
Teste de Aderência (Ajuste)
• Obtêm-se crítico da tabela da Distribuição 
do Quiquadrado observando o nível de 
significância α e os graus de liberdade, 
ν = k - m - 1, 
• sendo k = número de categorias dos dados 
• e m = número dos valores de parâmetros 
estimados com base na amostra.
• Regra de decisão: A hipótese Ho é rejeitada 
num nível de significância α se calculado > 
crítico e aceita caso contrário.
2χ
2χ
2χ
Exemplo
• Um engenheiro de computação tem 
desenvolvido um algoritmo para gerar 
números aleatórios inteiros no intervalo 0-
9. Ao executar o algoritmo e gerar 1000 
valores, ele obtém observações com as 
seguintes frequências:
22/06/2016
4
Exemplo
Exemplo
22/06/2016
5
Solução
Teste de Independência
• Envolvem duas variáveis, e o que se testa é a 
hipótese de que as duas variáveis são 
estatisticamente independentes. 
• A independência implica que o conhecimento da 
categoria na qual se classifica uma observação 
com respeito a uma variável não afeta a 
probabilidade de estar em uma das diversas 
categorias das outras variáveis.
• As hipóteses são: 
H0: as duas variáveis são independentes
H1: as duas variáveis não são independentes
22/06/2016
6
Teste de Independência
• Como intervêm duas variáveis, as 
freqüências observadas são colocadas em 
uma Tabela de Contingência. 
• As dimensões de tal tabela são definidas 
pela expressão r x k, onde r indica o 
número de linhas e k indica o número de 
colunas.
Teste de Independência
• A variável teste será:
∑
−
=
esperado
esperadoobservado 22 )(χ
onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente.
onde a freqüência esperada é equivalente à:
n
cr
geraltotal
colunatotallinhatotal
esperado ∑∑==
_
_*_
22/06/2016
7
Teste de Independência
Nota: recomenda-se fazer uma tabela de contingência para frequências 
esperadas 
 
Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α 
proposto, encontramos o valor de χcrítico² na tabela da Distribuição do 
Quiquadrado. 
 
Regra de decisão: 
 
Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² 
 
E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. 
Exemplo
• A tabela seguinte apresenta a reação dos 
estudantes à expansão do programa de 
atletismo do colégio, segundo o nível do 
curso, em que a “divisão inferior” indica 
estudante de primeiro ou segundo ano e 
“divisão superior” indica estudante de 
terceiro ou de ultimo ano.
22/06/2016
8
Exemplo
Testar a hipótese de que o nível do curso e a reação à
expansão do programa de atletismo são variáveis
independentes, utilizando nível de significância de 5%.
Nível do Curso Reação 
Divisão inferior Divisão superior 
Total 
A favor 20 19 39 
Contra 10 16 26 
Total 30 35 65 
Solução
Ho: o nível do curso e a reação à expansão do programa de atletismo são independentes. 
Ha: o nível do curso e a reação à expansão do programa de atletismo não são 
independentes. 
Calculando-se a freqüência esperada através de fe = 
por exemplo: fe = = 18, e assim consecutivamente, constrói-se a tabela da 
freqüência esperada: 
Nível do Curso Reação 
Divisão inferior Divisão superior 
Total 
A favor 18 21 39 
Contra 12 14 26 
Total 30 35 65 
 
22/06/2016
9
Solução
Calcula-se então o valor do quiquadrado: 
χ²calculado = = + + + 
= 1,03 
Sendo o nível de significância α = 5%, e graus de liberdade: ν = (r – 1)(k – 1) 
= (2 – 1)(2 – 1) = 1; obtemos da tabela da Distribuição do Quiquadrado (Apêndice), o 
valor de χ²crítico 
χ²crítico = ( ν = 1; α = 0,05) = 3,84 
Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%, 
aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa 
de atletismo, são independentes. 
Teste de Homogeneidade
• Corresponde ao teste das diferenças entre K 
proporções amostrais.
• O teste quiquadrado pode ser utilizado para 
testar a diferença entre K proporções amostrais, 
utilizando para a análise das freqüências uma 
estrutura tabular de 2 x K. 
• A hipótese nula é a de que não existe diferença 
entre as diversas proporções populacionais (ou, 
que as diferentes proporções amostrais 
poderiam ter sido extraídas, ao acaso, da 
mesma população). 
22/06/2016
10
Teste de Homogeneidade
• Observe as hipóteses:
• H0: pi1 = pi2 = pi3 = ... = pik (sendo pi a 
probabilidade de cada proporção amostral)
• H1: nem todas as probabilidades são iguais
• As informações são contidas na Tabela de 
Contingência. As dimensões de tal tabela são 
definidas pela expressão r x c, onde r indica o 
número de linhas e c indica o numero de 
colunas.
Teste de Homogeneidade
• A variável teste será:
∑
−
=
esperado
esperadoobservado 22 )(χ
onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente.
onde a freqüência esperada é equivalente à:
n
cr
geraltotal
colunatotallinhatotal
esperado ∑∑==
_
_*_
22/06/2016
11
Teste de Homogeneidade
Nota: recomenda-se fazer uma tabela de contingência para frequências 
esperadas 
 
Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α 
proposto, encontramos o valor de χcrítico² na tabela da Distribuição do 
Quiquadrado. 
 
Regra de decisão: 
 
Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² 
 
E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. 
OBS: O total do somatório de todas as linhas da tabela de contingência
é igual ao somatório de todas as colunas.
Exemplo
• Foi realizada uma pesquisa de opinião 
dentre os votantes de 4 municípios para 
comparar as proporções de votantes a 
favor do candidato A para o governo do 
estado. Foi selecionada uma amostra 
aleatória de 300 pessoas em cada 
município, obtendo-se os resultados 
apresentados na tabela a seguir:
22/06/2016
12
Exemplo
 Municípios 
Eleitores 1 2 3 4 Total 
a favor de A 126 103 109 98 436 
outro candidato 174 197 191 202 764 
Total 300 300 300 300 1200 
Considerando os dados da amostra pode-se dizer que há evidência de que a proporção 
de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%, 
é diferente? 
Solução
Hipóteses: Ho: pi1 = pi2 = pi3 = pi4 (sendo pi a proporção de votantes no candidato A em 
cada município) 
Ha: nem todas as cidades tem a mesma proporção de votantes no cadidato A 
Calculando-se a freqüência esperada através de fe = 
por exemplo: fe = = 109, e assim consecutivamente, constrói-sea tabela 
da freqüência esperada: 
 Municípios 
Eleitores 1 2 3 4 Total 
a favor de A 109 109 109 109 436 
outro candidato 191 191 191 191 764 
Total 300 300 300 300 1200 
 
22/06/2016
13
Solução
Calcula-se então o valor do quiquadrado: 
χ²calculado = = + + 
 + + + + 
 + = 6,43 
Sendo o nível de significância proposto α = 5% e os graus de liberdade: 
ν = (r – 1)(k – 1) = (2 – 1)(4 – 1) = 3 
χ²crítico (α = 0,05; ν = 3) = 7,81 
Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de 
significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os 
quatro municípios.

Continue navegando