Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Prof. Daniel de Christo Estatística Aplicada às Ciências Sociais e Ambientais Aula 5 Organização da Aula 1. Testes de hipóteses 2. Distribuição t e teste t Contextualização Testes de Hipóteses � Inferência = amostra � população � Testes estatísticos: auxílio � Procedimentos básicos 1. Levantamento de dados para responder uma pergunta 2. Transformar a pergunta em uma hipótese Hipóteses � Hipótese alternativa, H1 • Indica diferença nas observações � Hipótese da nulidade, H0 • Indica que não há diferença � Exemplo: • pergunta: antibióticos A e B • H1: A é melhor do que B • H0: A é tão eficaz quanto B Instrumentalização 2 Formulando Hipóteses � Procedimentos básicos 1. Levantamento de dados para responder uma pergunta 2. Transformar a pergunta em uma hipótese: H1 e H0 3. Nível de significância (αααα) • Minimizar a chance de aceitar uma hipótese errada (H1) • Usualmente αααα = 1%, αααα = 5%, αααα = 10% 4. Escolher o teste apropriado • Vários; vantagens e desvantagens 5. Teste = valor numérico • Aceita/rejeita; discutir informação Aplicação Teste de χχχχ2 (Qui Quadrado) 1. χχχχ2 para aderência: verificar se uma distribuição está de acordo com uma teoria 1. Estabelecer o nível de significância 2. Calcular o valor de χχχχ2 χχχχ2 = ΣΣΣΣ (Oi - Ei)2 Ei • Oi: frequência observada • Ei: frequência esperada 3. Comparar o valor calculado • Valor da tabela de χχχχ2 ao nível de significância estabelecido • Graus de liberdade: (número de classes) – 1 � Valor calculado de χχχχ2 ≥≥≥≥ valor da tabela � Rejeita-se H (observado = teoria) � Exemplo clássico: • Gregor Mendel, 1866 • duas características: �proporção 9:3:3:1 �Total: 556 ervilhas 3 Tabela 1: Distribuição das ervilhas em um dos experimentos de Mendel Sementes Frequência observada Frequência esperada Amarela lisa Amarela rugosa Verde lisa Verde rugosa 315 101 118 32 312,75 104,25 104,25 34,75 Total 556 556,00 � Resultados estão de acordo com a teoria postulada? � χχχχ2 para aderência: Mendel, 1866 1. Nível de significância (α) = 5% 2. Calcular o χχχχ2 Sementes (Oi - Ei) 2 Ei Amarela lisa Amarela rugosa Verde lisa Verde rugosa (2,25)2 / 312,75 (-3,25)2 / 104,25 (3,75)2 / 104,25 (-2,75)2 / 34,75 χχχχ2 calculado = ΣΣΣΣ = 0,47 3. Comparar o χχχχ2 calculado = 0,47 α = 5%; G.L. = 4 - 1 = 3 χχχχ2 = 0,47 < 7,82: não rejeita H1 2. χχχχ2 para independência: verificar se duas populações têm a mesma proporção de indivíduos com uma característica 1. Estabelecer o nível de significância 2. Calcular a frequência esperada e o valor de χχχχ2 3. Comparar com a tabela Tabela 2: Recém-nascidos vivos ou natimortos de acordo com o sexo Sexo Condição vivo/natimorto Total Masculino Feminino 1513 37 1451 27 1550 1478 Total 2964 64 3028 FONTE: ARENA, 1977. � Hipótese: a proporção de natimortos é igual em ambos os sexos (H0) Sexo Condição vivo/natimorto Total Masculino Feminino 1513 37 1451 27 1550 1478 Sexo Frequência esperada Total Masculino Feminino 1517,24 32,76 1446,76 31,24 1550 1478 � Cálculo da frequência esperada: regra de 3: 3028 – 64 natimortos 1550 masculinos – x 4 � Conclusão: • χ2 calculado = 1,15 � α = 5% • G.L. = tabelas r x s = (r-1) (s-1)=1 �Valor da tabela χ2 = 3,84 �χ2 = 1,15 < 3,84: não se rejeita a hipótese testada (H0) �A diferença não é suficientemente grande para rejeitar a hipótese: proporção igual em ambos os sexos � Aplicado somente para amostra maior do que 20 elementos � 40 > amostra > 20 elementos, aplicado somente quando todas as frequências esperadas forem > 1 � χχχχ2 aproximado: correção de continuidade • Tabelas 2x2: correção de Yates Limitações do Teste de χχχχ2 Síntese � Hipóteses • H1 e H0; procedimento � Aplicação: teste Qui Quadrado • Aderência • Independência Contextualização Distribuição t e Teste t 5 Distribuição t � 1908, William Sealy Gosset • Pseudônimo “Student” � 1924, redescobertos por Fisher • Enorme importância estatística � Parecida com a curva normal • Mais achatada � Valor de t • (x - µµµµ) / sx Instrumentalização Teste t � Comparação de duas populações • Sexo, raças etc. � Comparação de dois grupos (médias) • Exemplo: recebeu o tratamento ou não � Valor de t ≥ valor da tabela • As médias não são iguais • Existe diferença Teste t para Observações Independentes � Variável com distribuição normal � Comparação de duas médias � Procedimento: 1. estabelecer o α (nível de significância) 2. calcular a média de cada grupo • x1, x2, ... xn Teste t para Observações Pareadas � Estudar o efeito de uma variável utilizando observações pareadas • Pares de gêmeos monozigóticos • Mesmo indivíduo, duas regiões • Mesmo indivíduo, duas observações (antes e após) Aplicação 6 Teste t para Observações Independentes � Variável com distribuição normal � Comparação de duas médias � Procedimento: 1. estabelecer o α (nível de significância) 2. calcular a média de cada grupo • x1, x2, ... xn 3. calcular a variância de cada grupo: • s1 2, s2 2, ... sn 2 4. calcular a variância ponderada s2 = (n1-1) . s1 2 + (n2-1) . s2 2 n1 + n2 - 2 5. calcular o valor de t t = x2 – x1 s2 1 + 1 n1 n2 � Exemplo: • testar os suplementos alimentares A e B �Cobaias = ganho de peso (g) A: 10, 9, 12, 11, 8 xA = 10 B: 17, 13, 15, 14, 16 xB = 15 1. Nível de significância = 5% 2. Média de cada grupo: • xA = 10; xB = 15 3. Calcular a variância de cada grupo � s2A = 2,5; s 2 B = 2,5 4. Calcular a variância ponderada s2 = (5 - 1).2,5 + (5 - 1).2,5 5 + 5 - 2 s2 = 2,5 5. Calcular o valor de t t = √√√√ 2,5 . (1/5 + 1/5) t = 5 6. Comparar com o valor da tabela t • αααα = 5% ou 0,05 • G.L. = (n1 + n2 - 2) • G.L.exemplo = (5 + 5 - 2) = 8 15 - 10 Tabela t 7 �Conclusão: as médias de peso das cobaias submetidas aos suplementos A e B são diferentes � Valor da tabela = 1,86 • t = 5 > 1,86 Teste t � Observações independentes � Somente quando as variâncias das populações são iguais � Como verificar? • s2maior ≤ 4 . s2menor • Populações com variâncias iguais � Variâncias diferentes? • s2maior > 4 . S2menor � teste F Teste t: Variâncias Diferentes � Verificar pelo teste F F = s2maior / s 2 menor • G.L.= nmaior – 1 (numerador) e nmenor – 1 (denominador) � Verificar na tabela de F � Nível de significância = αααα / 2 Tabela com os Valores de F � Valor de F ≥ valor da tabela • As variâncias não são iguais • Existe diferença � Procedimento: 1. estabelecer o α (nível de significância) 2. calcular a média de cada grupo 3. calcular a variância de cada grupo 4. calcular o valor de t 5. calcular o número de G.L. (g) g = [(s21/n1) + (s22/n2)]2 [(s21/n1) 2/(n1-1)] + [(s 2 2/n2) 2/(n2- 1)] • Valor de t ≥ valor da tabela • As médias não são iguais t = x2 – x1 s21 + s 2 2 n1 n2 8 Teste t para Observações Pareadas � Estudar o efeito de uma variável utilizando observações pareadas • Pares de gêmeos monozigóticos • Mesmo indivíduo, duas regiões • Mesmo indivíduo, duas observações (antes e após) � Exemplo: • cobaias/ganho de peso (g)/dieta A(antes): 10, 9, 12, 11, 8 xA = 10 B(depois): 17, 13, 15, 14, 16 xB = 15 � Procedimento: teste t 1. Nível de significância = 5% 2. Diferença entre os n pares • d = xB − xA • d = 7; 4; 3; 3; 8 3. Calcular a média das diferenças � d= ∑ d / n � dexemplo = 5 4. Calcular a variância das diferenças s2 = ∑d2 – (∑d)2 � s2exemplo= 147 – 156,8 = 2,45 4 n n – 1 5. Calcular o valor de t = __d__ √s2/n texemplo = 5 / √2,45 / 5 = 7,14 6. Comparar com o valor da tabela t • αααα = 0,05 � G.L. = (n - 1) • G.L.exemplo = (5 - 1) = 4 Tabela t � t = 7,14 > 2,132 (valor da tabela) � Conclusão: em média, os ganhos de peso das cobaias submetidas à dieta são diferentes Síntese 9 � Distribuição de t � Aplicação do teste t • Observações pareadas •Observações independentes
Compartilhar