Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Testes de Hipóteses Silvana Ligia Vincenzi Slides preparados a partir do material dos seguintes Professores: Márcio Souza, Armando Mateus Ferreira, Dr. Osvaldo Silva, Filipe Gago da Câmara e 1 Introdução O processo de estimação que generaliza resultados de amostras para diferentes universos. Uma evolução do uso da estimação é apresentada por meio dos testes de hipóteses, que buscam confrontar alegações sobre o todo com resultados obtidos de amostras. TESTE DE HIPÓTESES Trata-se de uma técnica para se fazer a inferência estatística sobre uma população a partir de uma amostra. É uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais. * Paramétricos (calcula as diferenças numéricas exatas entre os resultados); assumem premissas sobre a distribuição de parâmetros da população; * Não paramétricos (apenas consideram se certos resultados são superiores ou inferiores a outros resultados); utilizados quando não se pode supor ou assumir características sobre parâmetros da população de onde a amostra foi extraída. Os testes de hipóteses podem ser: Requisitos para utilização de testes paramétricos Quando se pretende empregar um teste t de Student ou uma análise da variância para fazer comparações entre amostras (testes paramétricos), existe uma lista de requisitos que inclui, entre outros: que a variável tenha sido mensurada num nível mínimo intervalar que a distribuição seja simétrica e mesocurtica a característica estudada (variável) tem distribuição normal numa dada população 5 Opção Sempre que não se pode, honestamente, admitir a simetria e a normalidade de distribuição, ou os dados foram recolhidos num nível de mensuração inferior ao intervalar, devemos recorrer a testes que não incluem a normalidade da distribuição ou nível intervalar de mensuração. Esses testes chamam-se não paramétricos 6 A escolha dos testes Comparação entre duas amostras: Não Pareadas Não normal Normal Nominal Ordinal, intervalar ou razão Teste de Qui-Quadrado (Homogeneidade) Teste Mann-Whitney U, Wald-Wolfowitz Runs Test, Kolmogorov-Smirnov Two-Sample Test Teste t de Student Amostras não pareadas = amostras independentes Normal = testes paramétricos Não normal = testes não paramétricos A escolha dos testes Comparação entre duas amostras: Pareadas Não normal Normal Dicotômica Ordinal, intervalar ou razão Teste de McNemar Teste de Friedman, Sign-Test, Wilcoxon Matched-Pairs Test Teste t de Student Pareado A escolha dos testes Comparação entre três ou mais amostras: Não Pareadas Não normal Normal Nominal Ordinal, intervalar ou razão Teste de Qui-Quadrado (Homogeneidade) ANOVA de Kruskal-Wallis ANOVA c/ Grupos Independentes A escolha dos testes Comparação entre três ou mais amostras: Pareadas Não normal Normal Nominal Ordinal, intervalar ou razão Teste Q de Cochran ANOVA de Friedman ANOVA c/ Medidas Repetidas PRINCIPAIS CONCEITOS HIPÓTESE ESTATÍSTICA É uma suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico. PRINCIPAIS CONCEITOS TIPOS DE HIPÓTESES Designa-se por Ho, chamada hipótese nula, a hipótese estatística a ser testada, e por H1, a hipótese alternativa. A HIPÓTESE NULA É UMA ASSERTIVA DE COMO O MUNDO DEVERIA SER, SE NOSSA SUPOSIÇÃO ESTIVESSE ERRADA. A hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dada por uma desigualdade. Ex: Ho - = 1,65 m H1 - 1,65 m Nível de Significância () O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste. Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira. Os valores mais comuns para o nível de significância são 5%, 10% e 1%. Tipos de erros (PODER DO TESTE) Tipos de erros Exemplo: Uma pessoa é inocente até prova do contrário H0: A pessoa é inocente; H1: A pessoa é culpada; Erro I (): A pessoa é condenada mas é inocente; Erro II (): A pessoa é absolvida mas é culpada; * Um caso de justiça: Tipos de amostras Amostras independentes Exemplo – Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos: 1) Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B. Amostras independentes Material B Material A divisão aleatória Mensuração do grau de desgaste Mensuração do grau de desgaste Amostras pareadas (se g > 2, “em blocos”) 2) Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio. Amostras pareadas (se g > 2, “em blocos”) Mensuração do grau de desgaste B A B A A B B A A B alocação aleatória de A e B em cada par Procedimentos para se efetuar um teste Enunciar as hipóteses Ho e H1 Fixar o limite de erro e identificar a variável do teste Determinar a RA região de aceitação e RC região crítica, pelas tabelas estatísticas Por meio de elementos amostrais, avaliar o valor da variável do teste. Concluir pela aceitação ou rejeição de Ho pela comparação do valor obtido no 4º passo com as regiões críticas e de aceitação fixadas no 3º passo. Quando se utiliza um pacote estatístico (BioEstat, SPSS, Minitab) basta enunciar as hipóteses e decidir o teste com base no valor de p (p valor, sig ou p value) Se p-valor , rejeita-se H0. Se p-valor > , não rejeita-se Ho. Teste para duas amostras: hipóteses Na abordagem bilateral: H0: 1 = 2 e H1: 1 2 onde: 1 é o valor esperado da resposta sob o tratamento 1 e 2 é o valor esperado da resposta sob o tratamento 2. Na abordagem unilateral, a hipótese alternativa é do tipo H1: 1 > 2 ou H1: 1 < 2. Monocaudal para direita ou Unilateral a direita Monocaudal para esquerda ou Unilateral à esquerda Bicaudal ou bilateral Testes Paramétricos Teste para comparação de duas Médias Amostras independentes (não pareadas) Amostras pareadas Distribuição t de Student com (n-1) graus de liberdade ou, Distribuição Normal (n>30) (quando a amostra for grande ou a população tiver distribuição normal, e conhecer o desvio padrão populacional ). Teste para duas médias Independentes Estatística: Quando não conhecemos a variância da população Onde Sc é a variância comum: Com gl=n1+n2 - 2 Teste para duas médias independentes Estatística: Se o desvio padrão populacional for conhecido ou o tamanho da amostra for igual ou maior que 30 Teste t para duas amostras pareadas onde: n é o tamanho da amostra (número de pares); é a média das diferenças observadas; e é o desvio padrão das diferenças observadas. Usa distribuição t de Student com gl = n – 1 graus de liberdade (supondo populações com distribuição normal). Estatística: Exemplo: Teste t para duas amostras pareadas Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para se fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de 10 buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Observamos que em cada ensaio os dois algoritmos são usados em condições idênticas, caracterizando 10 pares de observações. H0: em média, os dois algoritmos são igualmente rápidos e H1: em média, o algoritmo novo é mais rápido do que o algoritmo em uso. 1 é o tempo esperado de resposta do algoritmo novo e 2 é o tempo esperado de resposta do algoritmo antigo. H0: 2 = 1 H1: 1 < 2 Ensaio NOVO X1 ANTIGO x2 d= Diferença 1 22 25 2 21 28 3 28 26 4 30 36 5 33 32 6 33 39 7 26 28 8 24 33 9 31 30 10 22 27 RESOLUÇAO NO CADERNO Exemplo: Amostras não pareadas Desejamos verificar se os catalisadores A e B têm efeitos diferentes no rendimento de uma certa reação química. As hipóteses são: • H0: em média, os dois catalisadores são iguais em termos de rendimento; e • H1: em média, os dois catalisadores são diferentes em termos de rendimento. Catalisador A Catalisador B 45 51 50 62 43 42 53 504155 45 35 43 59 48 45 41 43 49 39 33 No Excel Clique em Ferramentas, Análise de dados: Amostras pareadas – Teste-T duas amostras em par para médias Amostras independentes: Teste – T duas amostras presumindo variâncias equivalentes ou variâncias diferentes depende dos resultados das variâncias. Em ambos basta selecionar os dados e ok. Valores de Z tabelado 0.10 0.05 0.01 0.005 0.002 Unilateral -1.28 ou1.28 -1.645 ou 1.645 -2.33 ou 2.33 -2.58 ou 2.58 -2.88 ou2.88 Bilateral -1.645 e 1.645 -1.96e 1.96 -2.58 e 2.58 -2.81 e 2.81 -3.08 e 3.08 Tem outros como o Teste de Kolmogorov-Smirnov, o Teste de Lilliefors. Exemplo: Normalidade Verifique se os dados provêm de uma população que segue distribuição normal: H0: os dados provêm de uma população que segue distribuição normal; H1: os dados não provêm de uma população que segue distribuição normal. Normalidade - No BioEstat ir em normalidade – Decisão: Segundo o teste Anderson-Darling, o p_valor=0,36>=0,05, não rejeita Ho, logo, os dados provêm de uma distribuição normal, ao nível de 5%. 93,45 94,46 94,93 96,17 96,74 97,07 97,68 97,93 99,1 100,73 103,29 103,83 105,2 Testes de hipóteses NÃO PARAMÉTRICOS As técnicas de estatística não paramétrica são particularmente adaptáveis aos dados das ciências do comportamento. A aplicação dessas técnicas não exige suposições quanto à distribuição da população da qual se tenha retirado amostras para análises. Podem ser aplicadas a dados que se disponham simplesmente em ordem, ou mesmo para estudo de variáveis nominais. Na estatística paramétrica, as variáveis são, na maioria das vezes, intervalares. Exigem poucos cálculos e são aplicáveis para análise de pequenas amostras. Independe dos parâmetros populacionais e amostrais (média, variância, desvio padrão). TIPOS DE TESTE Qui-Quadrado Teste de Wilcoxon Teste de Mann-Whitney Teste de Kruskal-Wallis Duas Amostras Independentes QUI-QUADRADO (2) Testes de Adequação de amostras e Associação entre variáveis Qui-quadrado (2) QUI-QUADRADO (2) Denominado teste de adequação ou ajustamento. Usos Adequação ou Aderência dos dados: frequência observada adequada a uma frequência esperada); Independência ou Associação entre duas variáveis Comportamento de uma variável depende de outra. 2 = Ho: as variáveis são independentes; H1: as variáveis são dependentes; EXEMPLO Dependência entre bairro e escolha do sabor de pasta de dente Dados: Ho: a preferência pelo sabor independe do bairro; H1: a preferência pelo sabor depende do bairro = 5% Sabor Bairros A B C Limão 70 44 86 200 Chocolate 50 30 45 125 Hortelã 10 6 34 50 Menta 20 20 85 125 150 100 250 500 Resultados do Bio Estat Tabela de Contingência = 4 x 3 Qui-Quadrado = 37.867 Graus de liberdade = 6 (p) = < 0.0001 Decisão: Como o valor de p <0,0001 < =0,05, rejeita a hipótese nula, logo a preferência pelo sabor depende do bairro, ao nível de 5%. No Bio Estat Estatísticas – Qui-quadrado – tabela de contingência (L x C) – Seleciona os dados e assinale execute estatística (copia os dados conforme exemplo no excel). Duas amostras independentes – Qui-quadrado (LxC) - Seleciona os dados e assinale execute estatística . Exemplo 2 Um investigador deseja verificar a relação entre os interesses vocacionais e a escolha do currículo, e a taxa de desistência do curso universitário por parte de estudantes bem dotados. Ho: Não há diferenças entre os grupos no que diz respeito à proporção de estudantes que permanecem na faculdade. H1: A percentagem de permanência na faculdade é maior que os estudantes cuja a escolha do currículo foi considerada “positiva”. Decisão: Como o valo de p = 0,0199< = 0,05, rejeita a hipótese nula, logo A percentagem de permanência na faculdade é maior que os estudantes cuja a escolha do currículo foi considerada “positiva, ao nível de 5%. Positivo Negativo Total Afastamento 10 11 21 Permanência 46 13 59 Total 56 24 80 Teste Mann-Whitney-Wilcoxon É usado para testar se das amostras independentes foram retiradas de populações com média iguais. Trata-se de uma interessante alternativa ao teste paramétrico para igualdade de médias, pois o teste não exige considerações sobre a distribuição populacional. Aplicado à variáveis intervalares e ordinais. O teste de Mann-Whitney-Wilcoxon (ou teste M-W-W) é um teste não-paramétrico alternativo ao teste t-Student para comparar as médias de duas amostras independentes. Exemplo: a média de vendas de dois shoppings são diferentes? Exemplo 1 Na disciplina de Estatística Aplicada, onde se encontra inscritos alunos do curso de Matemática (ensino de) e Matemática Informática, registraram-se as seguintes classificações numa das frequências: O que se pode concluir a cerca das médias das ordens das classificações? Mat 10,5 16,5 11 9,8 17,1 1,5 14,8 9,9 9,8 10,3 8,7 Mat/Info 11,4 12,9 10,1 7,9 8,8 12,8 Hipóteses: Ho: Não há diferença entre as médias das ordens das notas dos alunos de matemática (ensino de ) e de Matemática/Informática H1: Há diferenças entre as médias das ordens (teste bilateral). Resultado Amostra 1 Amostra 2 Tamanho da amostra 11 6 Soma dos Postos (Ri) 100.0 53.0 Mediana = 10.00 10.50 U = 32.00 Z(U) = 0.1005 p-valor (unilateral) = 0.4600 p-valor (bilateral) = 0.9199 Bio Estat Decisão: Como p=0.92> 0,05, não rejeita hipótese nula, logo Não há diferença entre as médias das ordens das notas dos alunos de matemática (ensino de ) e de Matemática/Informática. Duas amostras pareadas Teste de Wilcoxon Quando se têm pares de observações e as diferenças têm distribuição normal, usa-se o teste paramétrico t-Student para comparar as médias de duas amostras emparelhadas. Porém, se as diferenças não se distribuem normalmente, pode usar-se o teste de Wilcoxon sobre as diferenças, desde que estas tenham um comportamento contínuo e simétrico. Este teste leva em consideração a magnitude da diferença para cada par. Exemplo: um processo de emagrecimento em teste. Cada par no caso é o mesmo indivíduo com peso antes e depois do processo. Exemplo: Existem diversos métodos de estimação do volume de madeira produzido pelas árvores, nomeadamente modelos de estimação baseados no diâmetro basal e modelos de estimação baseados no diâmetro à altura do peito (dap). Pretende-se comparar um método de estimação baseado no diâmetro basal com outro método baseado no dap. Para tal, os volumes (m3) de madeira dos mesmos 15 pinheiros foram estimados pelos dois métodos: Como exposto, pretendendo testar se as estimativas pelos dois métodos são idênticas então a média das diferenças entre as observações será nula, e o teste de hipóteses é: Z = , Decisão: Como o valor de p= 0,955>= 0,05, não rejeita a hipótese nula, logo não existe diferença nos métodos de estimação basal e dap, ao nível de 5%. Basal 1.06 1.08 1.12 0.98 1.05 0.85 1.06 0.87 1.03 1.1 0.95 0.78 1.23 1.04 0.88 Dap 1.12 0.97 1.15 1.07 0.89 0.98 1.13 0.82 1.15 1.25 0.86 0.83 1.05 0.89 1.02 ResultadosCols. 1 e 2 T = 59 Número de pares = 15 Z = 0.0568 p-valor (unilateral) = 0.4774 p-valor (bilateral) = 0.9547
Compartilhar