Baixe o app para aproveitar ainda mais
Prévia do material em texto
Planejamento de Experimentos Primeiro Semestre/2016 Exemplo • Um pesquisador pretende comparar 4 cultivares de pêssego quanto ao enraizamento de estacas. • A área experimental disponibilizada para o experimento é um viveiro em condições controladas com capacidade para 20 parcelas. • O pesquisador pode conseguir um máximo de 100 estacas por cultivar. • Na literatura o número de estacas por parcela varia de 8 a 15. Experimento Inteiramente Casualizado • Sem a necessidade de controle local; • Exemplo (Barbin, 2003): • Objetivo: Comparar 4 cultivares de pêssego quanto ao enraizamento de estacas; • Var. Resp.: número de estacas enraizadas por parcela; • Fator em potencial / Trat: 4 cultivares de pêssego. • Fator de perturbação: Não tem, pois a área experimental é um viveiro em condições controladas. • Parcela: 20 estacas. • Área Exp.: Viveiro em condições controladas com capacidade para 20 parcelas. • Cada tratamento foi repetido 5 vezes; • Os tratamentos foram designados às parcelas por meio de sorteio. Experimento Inteiramente Casualizado Croqui da Área Experimental P1 P5 P9 P13 P17 P2 P6 P10 P14 P18 P3 P7 P11 P15 P19 P4 P8 P12 P16 P20 V2 V1 V4 V3 Urna com 5 rep. de cada cartão V2 V4 V1 V1 V3 V3 V4 V2 V3 V4 V1 V2 V3 V4 V1 V2 V1 V3 V4 V2 Em cada parcela serão plantadas 20 estacas provenientes da variedade a ela designada. Passado o tempo necessário será observado o número de estacas enraizadas por parcela. Experimento Inteiramente Casualizado Resultados: Tratamentos Repetições Total 1ª 2ª 3ª 4ª 5ª Var 1 (A) 2 2 1 1 0 6 Var 2 (B) 1 0 0 1 1 3 Var 3 (C) 12 10 14 17 11 64 Var 4 (D) 7 9 15 8 10 49 122 Análise dos Dados • Análise da Variância: • Nem sempre pode ser utilizada; • Só é indicada se o modelo matemático respeitar certas exigências. • Modelo Matemático: • Representação simplificada da realidade; • Na experimentação é a representação da variável resposta levando em consideração os fatores envolvidos no experimento. Exemplo: Variedades de Pêssego ��� = � + �� + ��� Número de estacas, da variedade i (i = 1, ..., 4), fixadas na repetição j (j = 1, ..., 5), Média geral (número médio de estacas fixadas por parcela, independente de tratamento ou repetição) Efeito do tratamento i, ou variedade i. Erro aleatório ligado à variedade i na repetição j. Pressuposições da Análise da Variância (ANOVA) • O modelo deve ser aditivo; • Os erros devem ter distribuição normal; • Os erros devem ser independentes; • Os erros dever ter a mesma variância (Homocedasticidade dos erros). Pressuposições da Análise da Variância (ANOVA) • É comum unir as 3 últimas exigências na seguinte expressão: ��� ~ N I D ( 0 , � � ) Erro Experimental Segue uma distribuição Normal Independentemente Distribuida Média 0 Variância constante �� Verificação das Pressuposições • Geralmente considera-se o modelo como aditivo por hipótese: • Teste de não aditividade de Tukey. • Normalidade dos erros: • Teste de ��; • Teste de Lilliefors; • Teste de Shapiro Wilk; • Teste de Kolmogorov-Smirnov. • Independência dos erros: • Princípio da casualização; • Verificação gráfica. • Homocedasticidade das variâncias: • Teste de Hartley ou da razão máxima (Fmáx); • Teste de Cochran e de Bartlett. Análise de Resíduos • Para aplicar um teste de normalidade dos erros, primeiro, é necessário obter as estimativas dos erros; • Quanto mais simples o modelo matemático e o delineamento experimental, mais simples a obtenção das estimativas dos erros experimentais; • A análise de resíduos permite a verificação da normalidade dos erros, homocedasticidade das variâncias e independência dos erros. Como Obter os resíduos? • Basta conhecer o modelo matemático: • No caso do delineamento inteiramente casualizado, tem-se: • ��� = � + �� + ���, em que i representa o tratamento (de 1 a I) e j as repetições (de 1 a J) • A estimativa da média geral (�� ) é dada por: • �� = � �� , em que � = ∑ ����,� . • As estimativas dos efeitos de tratamento (�̂�) são dadas por: • �̂� = ��� −�� , em que �� = ∑ ���� . • As estimativas dos erros são dadas por: • �̂�� = ��� −�� − �̂�. Exemplo Trat Repetições �� �� � ��� 1ª 2ª 3ª 4ª 5ª Var 1 (A) 2 2 1 1 0 6 1,2 1,2 – 6,1 = -4,9 Var 2 (B) 1 0 0 1 1 3 0,6 0,6 – 6,1 = -5,5 Var 3 (C) 12 10 14 17 11 64 12,8 12,8 – 6,1 = 6,7 Var 4 (D) 7 9 15 8 10 49 9,8 9,8 – 6,1 = 3,7 Total 122 �� = 122 20 = 6,1 Trat Repetições 1ª 2ª 3ª 4ª 5ª Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2 Tabela dos erros: Trat Repetições 1ª 2ª 3ª 4ª 5ª Var 1 (A) 2 2 1 1 0 Var 2 (B) 1 0 0 1 1 Var 3 (C) 12 10 14 17 11 Var 4 (D) 7 9 15 8 10 Tabela dos resultados: �̂�� = ��� − 6,1 − �̂� �̂� = −4,9�̂� = −5,5�̂� = 6,7�̂� = 3,7 Exemplo Exemplo de Teste de Normalidade • Teste de Lilliefors: • Consiste em se obter os valores D = supr|�( �) − �( �)| ou D = supr|�( �) − �( �� )|. • Em que �( �) são as probabilidades da variâvel normal reduzida: • � = ���� , no nosso caso, � = ���, sendo assim � = 0 e � é a estimativa do desvio padrão médio dos erros: � = ��� ̅ = �� = desvios padronizados; �̅ = �̅�; �̅� = ∑ ���� �(���) = ∑ � � � ; • �( �) = ��, em que � é o número de desvios ≤ ���, e � representa o número total de observações, em outras palavras �( �) representa a frequência acumulada dos erros. Exemplo de Teste de Normalidade Trat Repetições 1ª 2ª 3ª 4ª 5ª Total �� � Var 1 (A) 0,64 0,64 0,04 0,04 1,44 2,8 0,7 Total / (5-1) Var 2 (B) 0,16 0,36 0,36 0,16 0,16 1,2 0,3 Var 3 (C) 0,64 7,84 1,44 17,64 3,24 30,8 7,7 Var 4 (D) 7,84 0,64 27,04 3,24 0,04 38,8 9,7 Total 73,6 4,6 Média (�̅�) Total / 16 4,6 Tabela contendo os valores dos erros elevados ao quadrado (����) � � − 1 = 4 5 − 1 = 16 Trat Repetições 1ª 2ª 3ª 4ª 5ª Var 1 (A) 0,373 0,373 -0,093 -0,093 -0,560 Var 2 (B) 0,187 -0,280 -0,280 0,187 0,187 Var 3 (C) -0,373 -1,306 0,560 1,958 -0,839 Var 4 (D) -1,306 -0,373 2,425 -0,839 0,093 Tabela dos desvios padronizados: Trat Repetições 1ª 2ª 3ª 4ª 5ª Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2 Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4 Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8 Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2 Tabela dos erros: �� = ��� �̅ Exemplo Exemplo erros freq �� F(��) S(��) |F(��)-S(��)| |F(��)-S(����)| -2,8 2 -1,3 0,0968 0,10 0,0032 0,0968 -1,8 2 -0,84 0,2005 0,20 0,0005 0,1005 -1,2 1 -0,56 0,2877 0,25 0,0377 0,0877 -0,8 2 -0,37 0,3557 0,35 0,0057 0,1057 -0,6 2 -0,28 0,3897 0,45 0,0603 0,0397 -0,2 2 -0,09 0,4641 0,55 0,0859 0,0141 0,2 1 0,09 0,5359 0,60 0,0641 0,0141 0,4 3 0,19 0,5753 0,75 0,1747 0,0247 0,8 2 0,37 0,6443 0,85 0,2057 0,1057 1,2 1 0,56 0,7123 0,9 0,1877 0,1377 4,2 1 1,96 0,9750 0,95 0,0025 0,0750 5,2 1 2,42 0,9922 1 0,0078 0,0432 Exemplo • Após montada a tabela basta comparar o maior valor das distâncias calculadas com o valor tabelado. • D = supr|�(��) − �(��)| = 0,2057 (Valor observado) • Os valores obtidos pela tabela de Lilliefors com = 20 e = 0,05 ou = 0,01 são: • � ��(� ; , �) = 0,190 e � ��(� ; , ) = 0,231. • Como 0,2057 > 0,190, rejeita-se a hipótese inicial de que os erros sigam uma distribuição normal. Q-Q Plot O Q-Q Plot é um gráfico bastante útil na análise dos resíduos. Se os resíduos se posicionarem de maneira a formar uma reta (aproximada), tem-se evidência de normalidade dos mesmos, se não, tem-se evidênciade falta de normalidade (como é o caso do exemplo dado). Histograma O histograma dos resíduos também é um bom indicador de normalidade dos dados. Se os resíduos forem normais, o seu histograma deve representar uma amostra retirada de uma distribuição normal com média zero. Novamente, o gráfico produzido com os dados do exemplo é um indicativo da falta de normalidade dos resíduos. Verificação das Pressuposições • Já não é indicado aplicar a ANOVA aos dados do experimento de estacas de pessegueiro (não hà normalidade dos erros); • Antes de procurar soluções para esse problema, vamos verificar a homocedasticidade das variâncias (graficamente). • Para testar a Homocedasticidade vamos utilizar o teste de Hartley, ou da razão máxima (��á�) Exemplo de Teste de Homocedasticidade • Para calcular a estatística do teste de Hartley basta conhecer as variâncias dos erros para cada tratamento: • O teste consiste em calcular a razão entre a maio e a menor variância: Trat �� � Var 1 (A) 0,7 Var 2 (B) 0,3 Var 3 (C) 7,7 Var 4 (D) 9,7 4,6 ��á� = ��á� � ����� = 9,7 0,3 = 32,33 ��á�(���) � � = 4 variâncias� = 4 g. l. (por ���)� 20,6 (5%) 49,0(1%) 32,33 > 20,6 Rejeita-se a hipótese inicial de homocedasticidade das variâncias Visualização Gráfica -4 -3 -2 -1 0 1 2 3 4 5 6 0 2 4 6 8 10 12 14 E r r o s P a d r o n i z a d o s Valores Preditos Preditos vs Erros Padronizados Indicativo de uma possível heterogeneidade das variâncias Verificação das Pressuposições • O experimento respeita 2 pressuposições: Aditividade do modelo (por hipótese); Independência dos erros (aleatorização). • Porém duas pressuposições não foram respeitadas: Normalidade dos erros (Lilliefors); Homocedasticidade das variâncias (Hartley). • Os problemas de falta de Homocedasticidade e/ou Normalidade podem ser resolvidos (algumas vezes) com a transformação dos dados. • Qual transformação usar? Transformação de Dados • Mais Comuns: • � + �, com � sendo uma constante positiva, para dados de contagem; • ��� ��� �/100, para dados de percentagem, geralmente para 0 ≤ � ≤ 30% ou 70 ≤ � ≤ 100%; • log (� + �), quando hà proporcionalidade entre médias e desvios padrões. • Box Cox: • log ��� = � ∗ log(�� �) + �; • � = 1 − �� �� . • � ≠ 0 → �∗ = ��; • � = 0 → �∗ = log(�); �� Transformação 0 1 Nenhuma 1 1/2 2 0 log ( ) 3 -1/2 1 � 4 -1 1 � Exemplo de Transformação de Dados Trat Repetições 1ª 2ª 3ª 4ª 5ª total �� � ��� Var 1 (A) 2 2 1 1 0 6 1,2 0,7 Var 2 (B) 1 0 0 1 1 3 0,6 0,3 Var 3 (C) 12 10 14 17 11 64 12,8 7,7 Var 4 (D) 7 9 15 8 10 49 9,8 9,7 Tabela com os dados do experimento, média e variância por tratamento: Trat ���(�� �) ���(���) ��� �� � ∗ ���(���) ���(�� �) � Var 1 (A) 0,079181 -0,1549 -0,01227 0,00627 Var 2 (B) -0,22185 -0,52288 0,116 0,049217 Var 3 (C) 1,10721 0,886491 0,981531 1,225914 Var 4 (D) 0,991226 0,986772 0,978114 0,982529 Total 1,955769 1,195482 2,06338 2,26393 Média 0,488942 0,29887 Tabela de auxílio para o cálculo de b: Alternativas à Transformação • Existem casos em que não é possível encontrar uma transformação que resolva todos os problemas e permita a utilização da técnica da ANOVA. • Nesses casos, recomenda-se: • Análises não paramétricas; ou • Modelos Lineares Generalizados. Transformação dos dados Trat Repetições total mi si2 1ª 2ª 3ª 4ª 5ª Var 1 (A) 1,581 1,581 1,225 1,225 0,707 6,319 1,264 0,128 Var 2 (B) 1,225 0,707 0,707 1,225 1,225 5,088 1,018 0,078 Var 3 (C) 3,536 3,240 3,808 4,183 3,391 18,158 3,632 0,139 Var 4 (D) 2,739 3,082 3,937 2,915 3,240 15,914 3,183 0,214 Total 45,479 A tranformação recomendada foi �, porém, como existem parcelas com observações iguais a zero, recomenda-se a soma de uma constante dentro da raiz, logo a transformação utilizada foi: � + 0,5 ��á� = �, !"�,�#$ = ,#% < �,& Corrigido o problema da heterogeneidade das variâncias Q-Q Plot dos Resíduos – pós transformação dos dados Pode-se notar que os resíduos estão bem mais aproximados da reta após a transformação dos dados, o que indica uma alta possibilidade de não se rejeitar a hipótese da normalidade dos resíduos após a transformação dos dados . Histograma dos Resíduos – pós transformação dos dados Assim como o Q-Q Plot, o histograma dos resíduos encontrados após a transformação dos dados, também indica uma possível normalidade dos mesmos. Gráfico – Dados Transformados -6 -4 -2 0 2 4 6 0 1 2 3 4 E r r o s P a d r o n i z a d o s Valores Preditos Preditos vs Erros Padronizados (Dados Transformados Pressuposições – Dados Transformados • Após a transformação dos dados passamos a respeitar todas as pressuposições do modelo matemático; • Se torna possível a utilização do método da ANOVA na análise dos resultados do experimento. Análise da Variância • Como fazer a Análise da Variância? • Primeiro passo: Definir o esquema da ANOVA Causa da Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Tratamentos I-1 SQTrat QMTrat QMTrat/QMRes Resíduos I(J-1) SQRes QMRes Total IJ-1 SQTotal Somas de Quadrados • As Somas de Quadrados (SQ) são obtidas pelas seguintes expressões: • SQTotal = ∑ �����,� − ∑ ����,� � �� ; • em que ∑ ����,� � �� = ' é denominado correção • SQTrat = � ∑ ��∙�� − � = �∑ ���� − �; • SQRes = SQTotal − SQTrat. Quadrados Médios e Teste F • Os Quadrados Médios (QM) são obtidos pelas seguintes expressões: • QMTrat = ������ ��(����) = ������ � ; • QMRes = ��� � ��(� �) = ��� � (� �) . • O teste F considera a hipótese de nulidade: • os efeitos dos tratamentos não diferem entre si (�� = ��, ∀ � e �); • e a alternativa: • ao menos dois tratamentos diferem entre si (�� ≠ ��, para ao menos um � ≠ �). • A estatística do teste e: � = ������ ����� . Qual o Significado do Teste F • Considere um delineamento inteiramente casualizado fixo (�� e �� fixos e ��� aleatório), tem-se: • E QMRes = �� → QMRes = ���; • E QMTrat = �� + �Φ� → QMTrat = �� � + Φ �, com Φ � = ∑ ��� � � � ; • Logo: � = ���� !"# ∑ ��� � � ��� = 1 + � �� $ ��� . • Ou seja, F se afasta de 1 a medida que ∑ �̂� � � aumenta; como esse valor mede a variação dos efeitos de tratamento, tem-se que valores baixos indicam igualdade entre os tratamentos e valores altos diferenças entre os tratamentos. Teste F • Para saber o quanto o teste F deve se afastar de 1 para ser considerado significativo basta checar a tabela do teste, com �� graus de liberdade de tratamentos (I-1) e �� graus de liberdade dos resíduos I(J-1). • No nosso exemplo: • ���� = 62,87**; • � �� � � = 3�� = 16 → � � �� = 3,24 (5%)� �� = 5,29 (1%); • Como o valor observado é maior do que o tabelado conclui-se que ao menos duas variedades se diferenciam quanto ao estacamento de raizes. Costuma-se indicar que o valor é significativo a um nível de 5% com * e altamente significativo (1%) com **. Exemplo • SQTotal = 1,581� +⋯+ 3,24� − ��,��� � �∗� = 28,5844; • SQTrat = � � 6,319� +⋯+ 15,914� − ��,��� � � = 26,3495; • SQRes = 28,5844 − 26,3495 = 2,2349; Causa da Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Tratamentos 3 26,3495 8,7832 62,87 Resíduos 16 2,2349 0,1397 Total 19 28,5844
Compartilhar