Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA EXPERIMENTAL Análise de Variância - DIC Prof. Thales Antonio Bueno de Macedo INTRODUÇÃO • A análise de variância (ANOVA) é um dos testes estatísticos mais utilizados para a avaliação de experimentos em todas as áreas do conhecimento. • Esta análise e vários fundamentos estatísticos utilizado hoje em dia, foi desenvolvido por Ronald Fisher. INTRODUÇÃO • Origem da ANOVA: Rothamsted Experimental Station (fundada em 1843) INTRODUÇÃO • Em 1920, Fisher foi contratado para ser o chefe do departamento de estatística, que tinha o objetivo de analisar os dados acumulados de pesquisa desde 1843. • Fisher ficou no cargo durante um longo período, e nesse tempo ele criou vária técnicas e conceitos que se tornaram centrais dentro da estatística. • Em 1923 desenvolveu o método estatístico da verossimilhança, que em 1925 após ser generalizada se tornou o método da análise de variância. INTRODUÇÃO • Centro de pesquisa agrária no Brasil: Empresa Brasileira de Pesquisa Agropecuária (Embrapa), fundada em 1972 Análise de variância • Fisher desenvolveu a técnica denominada análise de variância, que teve grande repercussão na pesquisa científica. Esta técnica consiste na decomposição do número de graus de liberdade e da variância total de um material heterogêneo em partes atribuídas a causas conhecidas e independentes (fatores controlados), e uma porção residual de origem desconhecida e de natureza aleatória (fatores não controlados). • Em outras palavras, a técnica da análise de variância é a que nos permite fazer partições do número de graus de liberdade (denotados por G.L.), e das somas de quadrados (S.Q.), com cada uma das partes nos proporcionando uma estimativa de variância (denominada quadrado médio – Q.M.). Análise de variância - DIC • Para podermos utilizar a metodologia estatística nos resultados de um experimento, é necessário que o mesmo tenha considerado pelo menos os princípios da repetição e da casualização, a fim que possamos obter uma estimativa válida para o erro experimental, que nos permite a aplicação dos testes de significância. • Ao fazer um experimento considerando apenas esses dois princípios, sem utilizar o controle local, temos o delineamento inteiramente casualizado ou inteiramente ao acaso. Neste delineamento (que só deve ser utilizado quando tem certeza absoluta da homogeneidade das condições experimentais), as parcelas que receberão cada um dos tratamentos são distribuídas de for inteiramente casual, por meio de sorteio, para que cada unidade experimental tenha a mesma probabilidade de receber qualquer um dos tratamentos estudados, sem nenhuma restrição no critério de casualização. • Neste delineamento temos apenas duas causa ou fontes de variação: Tratamento (causa conhecida ou fator controlado) e Resíduo ou Erro (causa desconhecida, de natureza aleatória, que reflete o efeito dos fatores não controlados). Quadro de apresentação de dados Exemplo: 5 tratamentos e 5 repetições Tratamentos Repetições Total 1 2 3 4 5 T1 X11 X12 X13 X14 X15 ∑ T1 T2 X21 X22 X23 X24 X25 ∑ T2 T3 X31 X32 X33 X34 X35 ∑ T3 T4 X41 X42 X43 X44 X45 ∑ T4 T5 X51 X52 X53 X54 X55 ∑ T5 Total Cálculo da Análise de Variância (ANOVA) • Graus de Liberdade: é uma medida de possibilidades de combinações ao acaso. Grau de liberdade do tratamento 𝐺𝑙𝑡𝑟𝑎𝑡 𝐺𝑙𝑡𝑟𝑎𝑡 = 𝑡 𝑛° 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑒𝑛𝑡𝑜𝑠 − 1 Grau de liberdade total 𝐺𝑙𝑡𝑜𝑡 𝐺𝑙𝑡𝑜𝑡 = 𝑡 × 𝑟 𝑛° 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠 − 1 Grau de liberdade do resíduo 𝐺𝑙𝑟𝑒𝑠 𝐺𝑙𝑟𝑒𝑠 = 𝐺𝑙𝑡𝑜𝑡 - 𝐺𝑙𝑡𝑟𝑎𝑡 Cálculo da Análise de Variância (ANOVA) • Soma dos quadrados representa uma medida de variação ou desvio da média. É calculada como uma soma dos quadrados das diferenças da média. Soma dos Quadrados de tratamento 𝑆𝑄𝑡𝑟𝑎𝑡 = 𝐴 − 𝐶 Soma dos Quadrados totais 𝑆𝑄𝑡𝑜𝑡 = 𝐵 − 𝐶 Soma dos Quadrados do resíduo 𝑆𝑄𝑟𝑒𝑠 = 𝑆𝑄𝑡𝑜𝑡 − 𝑆𝑄𝑡𝑟𝑎𝑡 C = σ 𝑥 ² 𝑡×𝑟 A = σ 𝑇2 𝑟 B = σ𝑥² Cálculo da Análise de Variância (ANOVA) • Em ANOVA, médias quadradas são usadas para determinar se os fatores (tratamentos) são significantes. A média quadrada do tratamento é obtida dividindo-se a soma dos quadrados do tratamento pelos graus de liberdade. Quadrado Médio do tratamento 𝑄𝑀𝑡𝑟𝑎𝑡 = ൗ 𝑆𝑄𝑡𝑟𝑎𝑡 𝐺𝑙𝑡𝑟𝑎𝑡 Quadrado Médio do resíduo 𝑄𝑀𝑟𝑒𝑠 = ൗ 𝑆𝑄𝑟𝑒𝑠 𝐺𝑙𝑟𝑒𝑠 Teste F • O teste F, obtido por Fisher-Snedecor, tem por finalidade comparar estimativas de variâncias. • Na análise de variância, as estimativas de variâncias são dadas pelos QM’s. Assim, no DIC, teremos duas estimativas de variância: uma devida aos efeitos de tratamento (𝑄𝑀𝑡𝑟𝑎𝑡) e outra devida aos efeitos dos fatores não controlados ao acaso (𝑄𝑀𝑟𝑒𝑠). 𝐹𝑐𝑎𝑙𝑐 = 𝑄𝑀𝑡𝑟𝑎𝑡 𝑄𝑀𝑟𝑒𝑠 Hipóteses • No DIC, temos duas hipóteses (𝐻0 e 𝐻1). 𝐻0 é a hipótese de nulidade, isto é supondo-se que os efeitos de tratamentos são equivalentes, teriam duas estimativas de variâncias (𝑄𝑀𝑡𝑟𝑎𝑡 e 𝑄𝑀𝑟𝑒𝑠) que não se diferem, a não ser por variações amostrais, pois ambas estimam a variação ao acaso. • Calculado o valor de F, busca-se nas tabelas de distribuição de F (geralmente nos níveis de 5% e 1%) os valores críticos ou limites (F tabelado), em função do número de graus de liberdade de tratamentos (𝐺𝑙𝑡𝑟𝑎𝑡 ) – na horizontal, e do número de graus de liberdade do resíduo (𝐺𝑙𝑟𝑒𝑠 ) – na vertical. Hipóteses • O valor crítico de F obtido na tabela indica o valor máximo que a razão de variâncias poderá assumir devido a flutuações amostrais. • Resumidamente, temos: 𝑭𝒄𝒂𝒍𝒄 < 𝑭𝒕𝒂𝒃 𝒂 𝟓% - o teste não é significativo no nível de 5% de probabilidade, portanto aceitamos 𝐻0. 𝑭𝒄𝒂𝒍 ≥ 𝑭𝒕𝒂𝒃 𝒂 𝟓% 𝒆 𝑭𝒄𝒂𝒍𝒄 < 𝑭𝒕𝒂𝒃 𝒂 𝟏% - o teste é significativo no nível de 5% de probabilidade , portanto rejeitamos 𝐻0 com um grau de confiança de 95%. 𝑭𝒄𝒂𝒍 ≥ 𝑭𝒕𝒂𝒃 𝒂 𝟏% - o teste é significativo no nível de 1% de probabilidade , portanto rejeitamos 𝐻0 com um grau de confiança de 99%. Notações de F • Para indicar a significância do teste F, coloca-se o F calculado nas notações: NS – se o teste não for significativo no nível de 5% de probabilidade. Exemplo, F = 2,52𝑁𝑆 *- se o teste for significativo no nível de 5% de probabilidade. Exemplo, F = 4,30* ** - o teste for significativo no nível de 1% de probabilidade. Exemplo, F = 7,25** Continuação da tabela F de Fisher-Snedecor a 5% de probabilidade. Continuação da tabela F de Fisher-Snedecor a 1% de probabilidade. Quadro ANOVA CV GL SQ QM F Tratamentos GL trat. SQ trat. QM trat. F calc Resíduos GL res. SQ res. QM res. F tab 5% Total GL total SQ total XXXX F tab 1% Exemplo Resolvido 01 – Num experimento inteiramente casualizado, de competição da cultivares de mandioca, realizado numa área perfeitamente homogênea quanto as condições experimentais foram utilizados 3 cultivares e 5 repetições. Os cultivares foram: A – IAC 5 B – IAC 7 C- IAC 11 Para proceder à casualização dos tratamentos, foi numerado as parcelas de 01 a 15 e através de sorteio foi definido o esquema de disposição do experimento no campo. A1 A2 A3 A4 A5 B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 07 08 01 14 06 04 13 11 05 03 09 10 02 12 15 Trabalharemos sobre duas hipótese: 𝐻0: Não há diferença entre as produções dos cultivares. 𝐻1: Há diferença entre as produções dos cultivares. A3 20,3 C3 25,8 B5 28,7 B1 20,9 B4 28,3 A5 29,3 A1 38,9 A2 25,4 C1 28,1 C2 27,0 B3 32,3 C4 26,9 B2 26,2 A4 25,7 C5 22,3 1° Passo: Quadro de apresentação de dados Tratamentos Repetições Total 1 2 3 4 5 IAC 5 38,9 25,4 20,3 25,7 29,3 139,6 IAC 7 20,9 26,2 32,3 28,3 28,7 136,4 IAC 11 28,1 27,0 25,8 26,9 22,3 130,1 Total 406,1 A3 20,3 C3 25,8 B5 28,7 B1 20,9 B4 28,3 A5 29,3 A1 38,9 A2 25,4 C1 28,1 C2 27,0 B3 32,3 C4 26,9 B2 26,2 A4 25,7 C5 22,3 2° Passo: Cálculo ANOVA 𝐺𝑙𝑡𝑟𝑎𝑡 = 𝑡 − 1 𝐺𝑙𝑡𝑟𝑎𝑡= 3 − 1 𝐺𝑙𝑡𝑟𝑎𝑡 = 2 𝐺𝑙𝑡𝑜𝑡 = 𝑡 × 𝑟 − 1 𝐺𝑙𝑡𝑜𝑡 = 3 × 5 − 1 𝐺𝑙𝑡𝑜𝑡 = 15 − 1 𝐺𝑙𝑡𝑜𝑡 = 14 𝐺𝑙𝑟𝑒𝑠 = 𝐺𝑙𝑡𝑜𝑡 − 𝐺𝑙𝑡𝑟𝑎𝑡 𝐺𝑙𝑟𝑒𝑠 = 14 − 2 𝐺𝑙𝑟𝑒𝑠 = 12 A = σ 𝑇2 𝑟 A = 139,6 2+ 136,4 2+(130,1)² 5 A = 19 488,16 +18 604,96+16 926,01 5 A = 55 019,13 5 = 11 003,83 C = σ 𝑥 ² 𝑡×𝑟 C = (406,1)² 3×5 C = 164 917,21 15 C = 10 994,48 2° Passo: Cálculo ANOVA 𝑆𝑄𝑡𝑟𝑎𝑡 = 𝐴 − 𝐶 𝑆𝑄𝑡𝑟𝑎𝑡 = 11 003,83 − 10 994,48 𝑆𝑄𝑡𝑟𝑎𝑡 = 9,35 𝑆𝑄𝑡𝑜𝑡 = B - C 𝑆𝑄𝑡𝑜𝑡 = 11 285,71 – 10 994,48 𝑆𝑄𝑡𝑜𝑡 = 291,23 B = σ𝑥² B = 38,9² + 25,4² + 20,3² + 25,7² + 29,3² + 20,9² + 26,2² +32,3² +28,3² +28,7² +28,1² +27² + 25,8² +26,9² + 22,3² B = 11 285,71 C = σ 𝑥 ² 𝑡×𝑟 C = (406,1)² 3×5 C = 164 917,21 15 C = 10 994,48 𝑆𝑄𝑟𝑒𝑠 = 𝑆𝑄𝑡𝑜𝑡 - 𝑆𝑄𝑡𝑟𝑎𝑡 𝑆𝑄𝑟𝑒𝑠 = 291,23 – 9,35 𝑆𝑄𝑟𝑒𝑠 = 281,88 2° Passo: Cálculo ANOVA 𝑄𝑀𝑡𝑟𝑎𝑡 = ൗ 𝑆𝑄𝑡𝑟𝑎𝑡 𝐺𝑙𝑡𝑟𝑎𝑡 𝑄𝑀𝑡𝑟𝑎𝑡 = ൗ 9,35 2 𝑄𝑀𝑡𝑟𝑎𝑡 = 4,675 𝑄𝑀𝑟𝑒𝑠 = ൗ 𝑆𝑄𝑟𝑒𝑠 𝐺𝑙𝑟𝑒𝑠 𝑄𝑀𝑟𝑒𝑠 = ൗ 281,88 12 𝑄𝑀𝑟𝑒𝑠 = 23,49 𝐹𝑐𝑎𝑙𝑐 = 𝑄𝑀𝑡𝑟𝑎𝑡 𝑄𝑀𝑟𝑒𝑠 𝐹𝑐𝑎𝑙𝑐 = 4,675 23,49 𝐹𝑐𝑎𝑙𝑐 = 0,199 𝑁𝑆 3° Passo : Quadro ANOVA CV GL SQ QM F Tratamentos 2 9,35 4,675 𝐹𝑐𝑎𝑙𝑐 = 0,199 𝑁𝑆 Resíduos 12 281,88 23,49 𝐹5% = 3,885 Total 14 291,23 XXXX 𝐹1% = 6,927 𝑭𝒄𝒂𝒍𝒄 < 𝑭𝒕𝒂𝒃 𝒂 𝟓% - o teste não é significativo no nível de 5% de probabilidade, portanto aceitamos 𝐻0 : Não há diferença entre as produções dos cultivares.
Compartilhar