Baixe o app para aproveitar ainda mais
Prévia do material em texto
E. Novaes 1 Universidade Federal de Goiás Escola de Agronomia e Engenharia de Alimentos Engenharia Florestal Disciplina: Estatística e Experimentação Florestal Professor: Evandro Novaes Testes de Hipóteses Estatísticas Capítulo 5 Aula de hoje • Testes de hipóteses esta?s@cas – Importância dos testes de hipóteses nas pesquisas florestais – Definição das hipóteses esta?s@cas – Testes de média • Test t E. Novaes 2 Paralelo entre a inferência esta?s@ta e o método cien?fico • “Método cien?fico lida com os princípios e procedimentos para a busca do conhecimento, envolvendo a análise e formulação de um problema e das hipóteses associadas, a coleta de dados através da observação ou experimentação, o que permi@rá testar as hipóteses formuladas” (Dicionário Merriam-‐Webster). Importância dos testes de hipótese • Em pesquisa florestal frequentemente quer-‐se: – Contrastar populações e/ou tratamentos para responder a diferentes perguntas: • Implantação florestal: quais níveis de fer@lizante, irrigação e espaçamento resultam no maior crescimento volumétrico de madeira? • Melhoramento florestal: qual clone elite possui melhor qualidade da madeira? E. Novaes 3 Importância dos testes de hipótese Produ@vidade de madeira (m3/ha) de um experimento com 3 níveis de adubação nitrogenada e 12 repe@ções para cada tratamento. s Porém, qual é a probabilidade dessas diferenças terem ocorrido devido ao acaso (erros amostrais)? Hipótese • Definição: “é uma formulação provisória, com intenções de ser posteriormente demonstrada... É normalmente seguida de experimentação, que pode levar à verificação ou refutação dessa hipótese.” • Portanto, deve ser testável e possuir alterna*vas (não pode ser verdade absoluta). • Exemplo: tem-‐se dois clones elite de eucalipto. O melhorista que os desenvolveu tem a hipótese de que o clone2, mais novo, possui maior teor de celulose na madeira que o mais an@go (clone1). E. Novaes 4 Hipóteses esta?s@cas • Uma hipótese esta?s@ca é uma afirmação sobre o parâmetro de uma ou mais populações. Geralmente é classificada em hipótese nula ou alterna@va: – Hipótese nula (H0): estabelece a ausência de diferença entre os parâmetros amostrados; ausência de variação sistemá@ca (variação é meramente casual). Essa é a hipótese que será aceita a não ser que os dados ofereçam evidências convincentes do contrário; • Exemplo: os clones 1 e 2 possuem o mesma proporção de celulose; – Hipótese alterna@va (Ha): contradiz a hipótese nula. Geralmente, é aquela que o pesquisador quer confirmar. • Exemplo: o clone 2 possui maior teor de celulose que o clone 1. Testando as hipóteses esta?s@cas • Se houvesse o censo da população, bastaria verificar se há diferenças entre as médias; • Porém, geralmente não se consegue avaliar todos os indivíduos de uma população. – Testes de hipótese são baseados em amostragem (com erros); – As inferências acerca das hipóteses devem ter uma medida de probabilidade de erro associadas (p-‐valor); E. Novaes 5 Tipos de erros • A confiança em se rejeitar uma hipótese está ligada a probabilidade de erro dessa decisão. • Existem dois @pos de erros: – Falsos posi@vos (erro @po I): Rejeita-‐se H0, quando esta é a hipótese verdadeira. A probabilidade desse erro é denominada α (alfa). – Falsos nega@vos (erro @po II): Não rejeita-‐se H0, quando esta é a hipótese falsa. A probabilidade desse erro é denominada β (beta). Conclusão do teste Verdade Não se rejeita H0 Rejeita-se H0 H0 verdadeira Decisão correta Decisão errada: erro tipo I 1-α α H0 falsa Decisão errada: erro tipo II Decisão correta β 1-β (poder do teste) Teste de hipóteses esta?s@cas • Passo-‐a-‐passo 1. Definição das hipóteses Ho e Ha 2. Definição do nível crí@co do teste, baseado na probabilidade aceitável de erro. 3. Escolha do teste esta?s@co adequado, que depende: • Do parâmetro populacional a ser analisado • Do tamanho amostral e distribuição dos dados Amostras E. Novaes 6 Exercício 1 Definição das hipóteses convencional Produ@vidade em m3 de madeira/ha!ano sob as duas tecnologias de adubação. alterna,va 33,42 m3/ha!ano 41,46 m3/ha!ano € µ1 = € µ2 = € H0 : µ1 = µ2 € HA : µ1 ≠ µ2 E. Novaes 7 Escolhendo o nível crí@co do teste • O nível crí@co deve ser escolhido de forma a minimizar os dois @pos de erros (I e II) • Problema: antagonismo dos erros. • Escolha deveria também levar em consideração os custos de erro @po I e II, que são diferentes em cada experimento. • Como geralmente não se conhece a distribuição da hipótese alterna@va, a escolha do nível crí@co é baseada no erro @po I • É comum, em experimentos agronômicos e florestais, u@lizar-‐se um nível crí@co α de 5% a 1%. convencional alterna,va Definição do nível crí@co R.A. – região de não rejeição de Ho R.R. – região de rejeição de Ho α = 0.01 Teste unilateral Teste bilateral Tcrí@co tcrí@co -‐tcrí@co H0: μ0 > μA Ha: μ0< μA H0: μ0 = μA Ha: μ0 ≠ μA E. Novaes 8 Escolha do teste esta?s@co Para inferências acerca de μ Diferença entre médias Magnitude dos erros amostrais 13 cm 18 cm 13 cm 15 cm 13 cm 15 cm 13 cm 15 cm S = 3 cm S = 3 cm S = 3 cm S = 1 cm Escolha do teste esta?s@co Para inferências acerca de μ Diferença entre médias Magnitude dos erros amostrais 13 cm 18 cm 13 cm 15 cm 13 cm 15 cm 13 cm 15 cm S = 3 cm S = 3 cm S = 3 cm S = 1 cm € t = y − µ s2 n gl = n −1 E. Novaes 9 Exercício 1 p-‐valor Assumindo H0 verdadeiro, há uma probabilidade de 0,4569 de se observar uma diferença tão grande como essa de 0,33 numa amostra similar (com esse tamanho e esse desvio padrão). p-‐valor é a probabilidade de se observar diferenças tão extremas como essa (dados), assumindo H0 como verdadeira. E. Novaes 10 Exercício 3 ✓ A média da distribuição das proporções é dada por: ✓ A variância da distribuição das proporções é dada por: Se a variável de interesse for x/n (proporção ou frequência de casos) µ = p σ 2 = p(1− p)n € t = p0 − pAs ˆ p = p0 − pA p0(1− p0) n E. Novaes 11 Testando hipóteses acerca de duas populações Variâncias homogêneas Exercício 7 E. Novaes 12 Testando diferenças entre duas populações • Teste t de Student (William S. Gosset) Pressuposições do teste: amostras são independentes, ob@das de populações com distribuição normal e variância comum. € t = x 1 − x 2 sc 1 n1 + 1 n2 € sc2 = (n1 −1)s12 + (n2 −1)s22 n1 + n2 − 2 € gl = n1 + n2 − 2 Testando hipóteses acerca de duas populações Variâncias heterogêneas E. Novaes 13 Teste F de homogeneidade das variâncias (homocedas@cidade) € H0 : σ12 =σ22 HA : σ12 ≠σ22 Rejeita-‐se H0 se Fcalc > Ftab € Ftabα =0,05 g .l .1 g.l .2 € F = s1(maior ) 2 s2(menor )2 (bilateral) Distribuição F E. Novaes 14 Teste t • Variâncias homogêneas • Variâncias heterogêneas € t = x 1 − x 2 sc 1 n1 + 1 n2 € sc2 = (n1 −1)s12 + (n2 −1)s22 n1 + n2 − 2 € gl = n1 + n2 − 2 € t = y 1 − y 2 s12 n1 + s22 n2 # $ % & ' ( € gl = s12 n1 + s22 n2 " # $ % & ' 2 s12 n1 " # $ % & ' 2 n1 −1 + s22 n2 " # $ % & ' 2 n2 −1 Exercício 6 E. Novaes 15 E se as amostras não forem independentes Dados pareados Exercício 4 E. Novaes 16 Teste t para dados pareados H0: Ha: € d = 0 d ≠ 0 € t = d − 0sd n € gl = n −1
Compartilhar