Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Testes Qui-quadrado Teste Qui-quadrado • Os procedimentos correspondem a três testes que utilizam a Distribuição Qui-quadrado e se relacionam todos com a comparação de frequências, obtidas em amostras, de certas categorias, com frequências esperadas baseadas, em cada caso, em hipóteses particulares. - Teste de Aderência - Teste de Independência - Teste de Homogeneidade 2 Teste de Aderência (Ajuste) • É um teste não paramétrico que é utilizado para verificar se uma variável apresenta determinada distribuição de probabilidade • As hipóteses são: – H0: os resultados ocorrem com as freqüências previstas pelo modelo probabilístico. – H1: os resultados ocorrem com freqüências diferentes das previstas pelo modelo. Teste de Aderência (Ajuste) • Sendo observada uma amostra de n valores da variável em estudo, a variável teste é o valor quiquadrado para testar a diferença entre padrões obtidos e esperados de freqüência: esperado esperadoobservado 22 )( onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. 3 Teste de Aderência (Ajuste) • Obtêm-se crítico da tabela da Distribuição do Quiquadrado observando o nível de significância α e os graus de liberdade, ν = k - m - 1, • sendo k = número de categorias dos dados • e m = número dos valores de parâmetros estimados com base na amostra. • Regra de decisão: A hipótese Ho é rejeitada num nível de significância α se calculado > crítico e aceita caso contrário. 2 2 2 Exemplo • Um engenheiro de computação tem desenvolvido um algoritmo para gerar números aleatórios inteiros no intervalo 0- 9. Ao executar o algoritmo e gerar 1000 valores, ele obtém observações com as seguintes frequências: 4 Exemplo Exemplo 5 Solução Teste de Independência • Envolvem duas variáveis, e o que se testa é a hipótese de que as duas variáveis são estatisticamente independentes. • A independência implica que o conhecimento da categoria na qual se classifica uma observação com respeito a uma variável não afeta a probabilidade de estar em uma das diversas categorias das outras variáveis. • As hipóteses são: H0: as duas variáveis são independentes H1: as duas variáveis não são independentes 6 Teste de Independência • Como intervêm duas variáveis, as freqüências observadas são colocadas em uma Tabela de Contingência. • As dimensões de tal tabela são definidas pela expressão r x k, onde r indica o número de linhas e k indica o número de colunas. Teste de Independência • A variável teste será: esperado esperadoobservado 22 )( onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. onde a freqüência esperada é equivalente à: n cr geraltotal colunatotallinhatotal esperado _ _*_ 7 Teste de Independência Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado. Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. Exemplo • A tabela seguinte apresenta a reação dos estudantes à expansão do programa de atletismo do colégio, segundo o nível do curso, em que a “divisão inferior” indica estudante de primeiro ou segundo ano e “divisão superior” indica estudante de terceiro ou de ultimo ano. 8 Exemplo Testar a hipótese de que o nível do curso e a reação à expansão do programa de atletismo são variáveis independentes, utilizando nível de significância de 5%. Nível do Curso Reação Divisão inferior Divisão superior Total A favor 20 19 39 Contra 10 16 26 Total 30 35 65 Solução 9 Solução Teste de Homogeneidade • Corresponde ao teste das diferenças entre K proporções amostrais. • O teste quiquadrado pode ser utilizado para testar a diferença entre K proporções amostrais, utilizando para a análise das freqüências uma estrutura tabular de 2 x K. • A hipótese nula é a de que não existe diferença entre as diversas proporções populacionais (ou, que as diferentes proporções amostrais poderiam ter sido extraídas, ao acaso, da mesma população). 10 Teste de Homogeneidade • Observe as hipóteses: • H0: π1 = π2 = π3 = ... = πk (sendo π a probabilidade de cada proporção amostral) • H1: nem todas as probabilidades são iguais • As informações são contidas na Tabela de Contingência. As dimensões de tal tabela são definidas pela expressão r x c, onde r indica o número de linhas e c indica o numero de colunas. Teste de Homogeneidade • A variável teste será: esperado esperadoobservado 22 )( onde ‘O’ e ‘E’ são as freqüências observadas e esperadas, respectivamente. onde a freqüência esperada é equivalente à: n cr geraltotal colunatotallinhatotal esperado _ _*_ 11 Teste de Homogeneidade Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado. Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² E aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. OBS: O total do somatório de todas as linhas da tabela de contingência é igual ao somatório de todas as colunas. Exemplo • Foi realizada uma pesquisa de opinião dentre os votantes de 4 municípios para comparar as proporções de votantes a favor do candidato A para o governo do estado. Foi selecionada uma amostra aleatória de 300 pessoas em cada município, obtendo-se os resultados apresentados na tabela a seguir: 12 Exemplo Municípios Eleitores 1 2 3 4 Total a favor de A 126 103 109 98 436 outro candidato 174 197 191 202 764 Total 300 300 300 300 1200 Considerando os dados da amostra pode-se dizer que há evidência de que a proporção de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%, é diferente? Solução 13 Solução
Compartilhar