Baixe o app para aproveitar ainda mais
Prévia do material em texto
22/06/2016 1 Testes não paramétricos Teste Quiquadrado • Os procedimentos correspondem a três testes que utilizam a Distribuição Quiquadrado e se relacionam todos com a comparação de freqüências, obtidas em amostras, de certas categorias, com freqüências esperadas baseadas, em cada caso, em hipóteses particulares. - Teste de Aderência - Teste de Independência - Teste de Homogeneidade 22/06/2016 2 Teste de Aderência (Ajuste) • É um teste não paramétrico que é utilizado para verificar se uma variável apresenta determinada distribuição de probabilidade • As hipóteses são: – H0: os resultados ocorrem com as freqüências previstas pelo modelo probabilístico. – H1: os resultados ocorrem com freqüências diferentes das previstas pelo modelo. Teste de Aderência (Ajuste) • Sendo observada uma amostra de n valores da variável em estudo, a variável teste é o valor quiquadrado para testar a diferença entre padrões obtidos e esperados de freqüência: ∑ − = esperado esperadoobservado 22 )(χ onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. 22/06/2016 3 Teste de Aderência (Ajuste) • Obtêm-se crítico da tabela da Distribuição do Quiquadrado observando o nível de significância α e os graus de liberdade, ν = k - m - 1, • sendo k = número de categorias dos dados • e m = número dos valores de parâmetros estimados com base na amostra. • Regra de decisão: A hipótese Ho é rejeitada num nível de significância α se calculado > crítico e aceita caso contrário. 2χ 2χ 2χ Exemplo • Um engenheiro de computação tem desenvolvido um algoritmo para gerar números aleatórios inteiros no intervalo 0- 9. Ao executar o algoritmo e gerar 1000 valores, ele obtém observações com as seguintes frequências: 22/06/2016 4 Exemplo Exemplo 22/06/2016 5 Solução Teste de Independência • Envolvem duas variáveis, e o que se testa é a hipótese de que as duas variáveis são estatisticamente independentes. • A independência implica que o conhecimento da categoria na qual se classifica uma observação com respeito a uma variável não afeta a probabilidade de estar em uma das diversas categorias das outras variáveis. • As hipóteses são: H0: as duas variáveis são independentes H1: as duas variáveis não são independentes 22/06/2016 6 Teste de Independência • Como intervêm duas variáveis, as freqüências observadas são colocadas em uma Tabela de Contingência. • As dimensões de tal tabela são definidas pela expressão r x k, onde r indica o número de linhas e k indica o número de colunas. Teste de Independência • A variável teste será: ∑ − = esperado esperadoobservado 22 )(χ onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. onde a freqüência esperada é equivalente à: n cr geraltotal colunatotallinhatotal esperado ∑∑== _ _*_ 22/06/2016 7 Teste de Independência Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado. Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. Exemplo • A tabela seguinte apresenta a reação dos estudantes à expansão do programa de atletismo do colégio, segundo o nível do curso, em que a “divisão inferior” indica estudante de primeiro ou segundo ano e “divisão superior” indica estudante de terceiro ou de ultimo ano. 22/06/2016 8 Exemplo Testar a hipótese de que o nível do curso e a reação à expansão do programa de atletismo são variáveis independentes, utilizando nível de significância de 5%. Nível do Curso Reação Divisão inferior Divisão superior Total A favor 20 19 39 Contra 10 16 26 Total 30 35 65 Solução Ho: o nível do curso e a reação à expansão do programa de atletismo são independentes. Ha: o nível do curso e a reação à expansão do programa de atletismo não são independentes. Calculando-se a freqüência esperada através de fe = por exemplo: fe = = 18, e assim consecutivamente, constrói-se a tabela da freqüência esperada: Nível do Curso Reação Divisão inferior Divisão superior Total A favor 18 21 39 Contra 12 14 26 Total 30 35 65 22/06/2016 9 Solução Calcula-se então o valor do quiquadrado: χ²calculado = = + + + = 1,03 Sendo o nível de significância α = 5%, e graus de liberdade: ν = (r – 1)(k – 1) = (2 – 1)(2 – 1) = 1; obtemos da tabela da Distribuição do Quiquadrado (Apêndice), o valor de χ²crítico χ²crítico = ( ν = 1; α = 0,05) = 3,84 Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%, aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa de atletismo, são independentes. Teste de Homogeneidade • Corresponde ao teste das diferenças entre K proporções amostrais. • O teste quiquadrado pode ser utilizado para testar a diferença entre K proporções amostrais, utilizando para a análise das freqüências uma estrutura tabular de 2 x K. • A hipótese nula é a de que não existe diferença entre as diversas proporções populacionais (ou, que as diferentes proporções amostrais poderiam ter sido extraídas, ao acaso, da mesma população). 22/06/2016 10 Teste de Homogeneidade • Observe as hipóteses: • H0: pi1 = pi2 = pi3 = ... = pik (sendo pi a probabilidade de cada proporção amostral) • H1: nem todas as probabilidades são iguais • As informações são contidas na Tabela de Contingência. As dimensões de tal tabela são definidas pela expressão r x c, onde r indica o número de linhas e c indica o numero de colunas. Teste de Homogeneidade • A variável teste será: ∑ − = esperado esperadoobservado 22 )(χ onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. onde a freqüência esperada é equivalente à: n cr geraltotal colunatotallinhatotal esperado ∑∑== _ _*_ 22/06/2016 11 Teste de Homogeneidade Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado. Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. OBS: O total do somatório de todas as linhas da tabela de contingência é igual ao somatório de todas as colunas. Exemplo • Foi realizada uma pesquisa de opinião dentre os votantes de 4 municípios para comparar as proporções de votantes a favor do candidato A para o governo do estado. Foi selecionada uma amostra aleatória de 300 pessoas em cada município, obtendo-se os resultados apresentados na tabela a seguir: 22/06/2016 12 Exemplo Municípios Eleitores 1 2 3 4 Total a favor de A 126 103 109 98 436 outro candidato 174 197 191 202 764 Total 300 300 300 300 1200 Considerando os dados da amostra pode-se dizer que há evidência de que a proporção de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%, é diferente? Solução Hipóteses: Ho: pi1 = pi2 = pi3 = pi4 (sendo pi a proporção de votantes no candidato A em cada município) Ha: nem todas as cidades tem a mesma proporção de votantes no cadidato A Calculando-se a freqüência esperada através de fe = por exemplo: fe = = 109, e assim consecutivamente, constrói-sea tabela da freqüência esperada: Municípios Eleitores 1 2 3 4 Total a favor de A 109 109 109 109 436 outro candidato 191 191 191 191 764 Total 300 300 300 300 1200 22/06/2016 13 Solução Calcula-se então o valor do quiquadrado: χ²calculado = = + + + + + + + = 6,43 Sendo o nível de significância proposto α = 5% e os graus de liberdade: ν = (r – 1)(k – 1) = (2 – 1)(4 – 1) = 3 χ²crítico (α = 0,05; ν = 3) = 7,81 Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os quatro municípios.
Compartilhar