Buscar

Aula 05 - Estatística Ambiental

Prévia do material em texto

1
Prof. Daniel de Christo
Estatística Aplicada às 
Ciências Sociais e Ambientais
Aula 5
Organização da Aula
1. Testes de hipóteses
2. Distribuição t e teste t
Contextualização
Testes de Hipóteses
� Inferência = amostra �
população
� Testes estatísticos: auxílio
� Procedimentos básicos
1. Levantamento de dados para 
responder uma pergunta
2. Transformar a pergunta em 
uma hipótese
Hipóteses
� Hipótese alternativa, H1
• Indica diferença nas observações
� Hipótese da nulidade, H0
• Indica que não há diferença
� Exemplo:
• pergunta: antibióticos A e B
• H1: A é melhor do que B
• H0: A é tão eficaz quanto B
Instrumentalização
2
Formulando Hipóteses
� Procedimentos básicos
1. Levantamento de dados para 
responder uma pergunta
2. Transformar a pergunta em 
uma hipótese: H1 e H0
3. Nível de significância (αααα)
• Minimizar a chance de aceitar 
uma hipótese errada (H1)
• Usualmente αααα = 1%, αααα = 5%, 
αααα = 10%
4. Escolher o teste apropriado
• Vários; vantagens e 
desvantagens
5. Teste = valor numérico
• Aceita/rejeita; discutir informação
Aplicação
Teste de χχχχ2 (Qui Quadrado)
1. χχχχ2 para aderência: verificar se 
uma distribuição está de acordo 
com uma teoria
1. Estabelecer o nível de 
significância
2. Calcular o valor de χχχχ2
χχχχ2 = ΣΣΣΣ (Oi - Ei)2
Ei
• Oi: frequência observada
• Ei: frequência esperada
3. Comparar o valor calculado 
• Valor da tabela de χχχχ2 ao nível 
de significância estabelecido
• Graus de liberdade: (número 
de classes) – 1
� Valor calculado de χχχχ2 ≥≥≥≥ valor da 
tabela
� Rejeita-se H (observado = teoria)
� Exemplo clássico:
• Gregor Mendel, 1866
• duas características:
�proporção 9:3:3:1
�Total: 556 ervilhas
3
Tabela 1: Distribuição das ervilhas 
em um dos experimentos de Mendel
Sementes
Frequência
observada
Frequência
esperada
Amarela lisa
Amarela rugosa
Verde lisa
Verde rugosa
315
101
118
32
312,75
104,25
104,25
34,75
Total 556 556,00
� Resultados estão de acordo com a 
teoria postulada?
� χχχχ2 para aderência: Mendel, 1866
1. Nível de significância (α) = 5%
2. Calcular o χχχχ2
Sementes
(Oi - Ei)
2
Ei
Amarela lisa
Amarela rugosa
Verde lisa
Verde rugosa
(2,25)2 / 312,75
(-3,25)2 / 104,25
(3,75)2 / 104,25
(-2,75)2 / 34,75
χχχχ2 calculado = ΣΣΣΣ = 0,47 
3. Comparar o χχχχ2 calculado = 0,47
α = 5%; G.L. = 4 - 1 = 3
χχχχ2 = 0,47 < 7,82: não rejeita H1
2. χχχχ2 para independência:
verificar se duas populações têm 
a mesma proporção de indivíduos 
com uma característica
1. Estabelecer o nível de 
significância
2. Calcular a frequência esperada 
e o valor de χχχχ2
3. Comparar com a tabela
Tabela 2: Recém-nascidos vivos ou 
natimortos de acordo com o sexo
Sexo
Condição
vivo/natimorto
Total
Masculino
Feminino
1513 37
1451 27
1550
1478
Total 2964 64 3028
FONTE: ARENA, 1977.
� Hipótese: a proporção de natimortos 
é igual em ambos os sexos (H0)
Sexo
Condição
vivo/natimorto
Total
Masculino
Feminino
1513 37
1451 27
1550
1478
Sexo
Frequência
esperada
Total
Masculino
Feminino
1517,24 32,76
1446,76 31,24
1550
1478
� Cálculo da frequência esperada: regra 
de 3: 3028 – 64 natimortos
1550 masculinos – x
4
� Conclusão:
• χ2 calculado = 1,15 � α = 5% 
• G.L. = tabelas r x s = (r-1) 
(s-1)=1
�Valor da tabela χ2 = 3,84
�χ2 = 1,15 < 3,84: não se 
rejeita a hipótese testada (H0)
�A diferença não é 
suficientemente grande para 
rejeitar a hipótese: proporção 
igual em ambos os sexos
� Aplicado somente para amostra 
maior do que 20 elementos
� 40 > amostra > 20 elementos, 
aplicado somente quando todas 
as frequências esperadas forem > 1
� χχχχ2 aproximado: correção de 
continuidade
• Tabelas 2x2: correção de Yates
Limitações do Teste de χχχχ2
Síntese
� Hipóteses
• H1 e H0; procedimento
� Aplicação: teste Qui Quadrado
• Aderência
• Independência
Contextualização Distribuição t e Teste t
5
Distribuição t
� 1908, William Sealy Gosset 
• Pseudônimo “Student”
� 1924, redescobertos por Fisher 
• Enorme importância estatística
� Parecida com a curva normal 
• Mais achatada 
� Valor de t
• (x - µµµµ) / sx
Instrumentalização
Teste t
� Comparação de duas populações 
• Sexo, raças etc.
� Comparação de dois grupos 
(médias)
• Exemplo: recebeu o tratamento 
ou não
� Valor de t ≥ valor da tabela
• As médias não são iguais
• Existe diferença
Teste t para Observações
Independentes
� Variável com distribuição normal
� Comparação de duas médias
� Procedimento:
1. estabelecer o α (nível de 
significância)
2. calcular a média de cada grupo
• x1, x2, ... xn
Teste t para Observações
Pareadas
� Estudar o efeito de uma variável 
utilizando observações pareadas
• Pares de gêmeos monozigóticos
• Mesmo indivíduo, duas regiões
• Mesmo indivíduo, duas 
observações (antes e após)
Aplicação
6
Teste t para Observações
Independentes
� Variável com distribuição normal
� Comparação de duas médias
� Procedimento:
1. estabelecer o α (nível de 
significância)
2. calcular a média de cada grupo
• x1, x2, ... xn
3. calcular a variância de cada 
grupo: 
• s1
2, s2
2, ... sn
2
4. calcular a variância ponderada
s2 = (n1-1) . s1
2 + (n2-1) . s2
2 
n1 + n2 - 2 
5. calcular o valor de t
t = x2 – x1
s2 1 + 1
n1 n2
� Exemplo:
• testar os suplementos 
alimentares A e B
�Cobaias = ganho de peso (g)
A: 10, 9, 12, 11, 8 xA = 10
B: 17, 13, 15, 14, 16 xB = 15
1. Nível de significância = 5%
2. Média de cada grupo: 
• xA = 10; xB = 15 
3. Calcular a variância de cada 
grupo � s2A = 2,5; s
2
B = 2,5
4. Calcular a variância
ponderada
s2 = (5 - 1).2,5 + (5 - 1).2,5
5 + 5 - 2
s2 = 2,5
5. Calcular o valor de t
t = 
√√√√ 2,5 . (1/5 + 1/5)
t = 5
6. Comparar com o valor da 
tabela t
• αααα = 5% ou 0,05
• G.L. = (n1 + n2 - 2)
• G.L.exemplo = (5 + 5 - 2) = 8
15 - 10
Tabela t
7
�Conclusão: as médias de 
peso das cobaias submetidas 
aos suplementos A e B são 
diferentes
� Valor da tabela = 1,86
• t = 5 > 1,86 
Teste t
� Observações independentes
� Somente quando as variâncias 
das populações são iguais
� Como verificar?
• s2maior ≤ 4 . s2menor
• Populações com variâncias iguais
� Variâncias diferentes?
• s2maior > 4 . S2menor � teste F
Teste t:
Variâncias Diferentes
� Verificar pelo teste F
F = s2maior / s
2
menor
• G.L.= nmaior – 1 (numerador) 
e nmenor – 1 (denominador) 
� Verificar na tabela de F 
� Nível de significância = αααα / 2
Tabela com os Valores de F
� Valor de F ≥ valor da tabela
• As variâncias não são iguais
• Existe diferença
� Procedimento:
1. estabelecer o α (nível de 
significância)
2. calcular a média de cada grupo
3. calcular a variância de cada 
grupo
4. calcular o valor de t
5. calcular o número de G.L. (g)
g = [(s21/n1) + (s22/n2)]2
[(s21/n1)
2/(n1-1)] + [(s
2
2/n2)
2/(n2-
1)] 
• Valor de t ≥ valor da tabela
• As médias não são iguais
t =
x2 – x1
s21 + s
2
2
n1 n2
8
Teste t para Observações
Pareadas
� Estudar o efeito de uma variável 
utilizando observações pareadas
• Pares de gêmeos monozigóticos
• Mesmo indivíduo, duas regiões
• Mesmo indivíduo, duas 
observações (antes e após)
� Exemplo:
• cobaias/ganho de peso (g)/dieta
A(antes): 10, 9, 12, 11, 8 xA = 10
B(depois): 17, 13, 15, 14, 16 xB = 15
� Procedimento: teste t
1. Nível de significância = 5%
2. Diferença entre os n pares 
• d = xB − xA
• d = 7; 4; 3; 3; 8
3. Calcular a média das diferenças
� d= ∑ d / n � dexemplo = 5
4. Calcular a variância das 
diferenças
s2 = ∑d2 – (∑d)2
� s2exemplo= 147 – 156,8 = 2,45
4
n
n – 1
5. Calcular o valor de t = __d__ 
√s2/n 
texemplo = 5 / √2,45 / 5 = 7,14
6. Comparar com o valor da 
tabela t
• αααα = 0,05 � G.L. = (n - 1)
• G.L.exemplo = (5 - 1) = 4
Tabela t
� t = 7,14 > 2,132 (valor da 
tabela)
� Conclusão: em média, os ganhos 
de peso das cobaias submetidas à
dieta são diferentes
Síntese
9
� Distribuição de t
� Aplicação do teste t
• Observações pareadas
•Observações independentes

Continue navegando