Buscar

aula 2

Prévia do material em texto

Planejamento de 
Experimentos
Primeiro Semestre/2016
Exemplo
• Um pesquisador pretende comparar 4 cultivares de pêssego quanto ao 
enraizamento de estacas.
• A área experimental disponibilizada para o experimento é um viveiro em 
condições controladas com capacidade para 20 parcelas.
• O pesquisador pode conseguir um máximo de 100 estacas por cultivar.
• Na literatura o número de estacas por parcela varia de 8 a 15.
Experimento Inteiramente 
Casualizado
• Sem a necessidade de controle local;
• Exemplo (Barbin, 2003): 
• Objetivo: Comparar 4 cultivares de pêssego quanto ao 
enraizamento de estacas; 
• Var. Resp.: número de estacas enraizadas por parcela;
• Fator em potencial / Trat: 4 cultivares de pêssego.
• Fator de perturbação: Não tem, pois a área experimental é um 
viveiro em condições controladas. 
• Parcela: 20 estacas.
• Área Exp.: Viveiro em condições controladas com capacidade 
para 20 parcelas.
• Cada tratamento foi repetido 5 vezes;
• Os tratamentos foram designados às parcelas por meio de 
sorteio.
Experimento Inteiramente 
Casualizado
Croqui da Área Experimental
P1 P5 P9 P13 P17
P2 P6 P10 P14 P18
P3 P7 P11 P15 P19
P4 P8 P12 P16 P20
V2
V1
V4
V3
Urna com 5 rep. de cada cartão
V2
V4
V1
V1 V3
V3
V4
V2 V3
V4
V1
V2 V3
V4
V1
V2
V1
V3
V4
V2
Em cada parcela serão plantadas 20 
estacas provenientes da variedade a ela 
designada. Passado o tempo necessário 
será observado o número de estacas 
enraizadas por parcela.
Experimento Inteiramente 
Casualizado
Resultados:
Tratamentos
Repetições
Total
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0 6
Var 2 (B) 1 0 0 1 1 3
Var 3 (C) 12 10 14 17 11 64
Var 4 (D) 7 9 15 8 10 49
122
Análise dos Dados
• Análise da Variância:
• Nem sempre pode ser utilizada;
• Só é indicada se o modelo matemático respeitar certas 
exigências.
• Modelo Matemático: 
• Representação simplificada da realidade; 
• Na experimentação é a representação da variável resposta 
levando em consideração os fatores envolvidos no experimento.
Exemplo: Variedades de Pêssego
��� = � + �� + ���
Número de estacas, da variedade i (i = 1, 
..., 4), fixadas na repetição j (j = 1, ..., 5), 
Média geral (número médio de estacas 
fixadas por parcela, independente de 
tratamento ou repetição)
Efeito do tratamento i, ou 
variedade i.
Erro aleatório ligado à 
variedade i na repetição j.
Pressuposições da Análise da 
Variância (ANOVA)
• O modelo deve ser aditivo;
• Os erros devem ter distribuição normal;
• Os erros devem ser independentes;
• Os erros dever ter a mesma variância (Homocedasticidade dos 
erros).
Pressuposições da Análise da 
Variância (ANOVA)
• É comum unir as 3 últimas exigências na seguinte expressão:
���		~		N		I		D	(	0	,	�
� )
Erro Experimental
Segue uma distribuição
Normal
Independentemente
Distribuida
Média 0
Variância constante ��
Verificação das Pressuposições
• Geralmente considera-se o modelo como aditivo por hipótese:
• Teste de não aditividade de Tukey.
• Normalidade dos erros:
• Teste de ��;
• Teste de Lilliefors;
• Teste de Shapiro Wilk;
• Teste de Kolmogorov-Smirnov.
• Independência dos erros:
• Princípio da casualização;
• Verificação gráfica.
• Homocedasticidade das variâncias:
• Teste de Hartley ou da razão máxima (Fmáx);
• Teste de Cochran e de Bartlett.
Análise de Resíduos
• Para aplicar um teste de normalidade dos erros, primeiro, é 
necessário obter as estimativas dos erros;
• Quanto mais simples o modelo matemático e o delineamento 
experimental, mais simples a obtenção das estimativas dos 
erros experimentais;
• A análise de resíduos permite a verificação da normalidade 
dos erros, homocedasticidade das variâncias e independência 
dos erros.
Como Obter os resíduos?
• Basta conhecer o modelo matemático:
• No caso do delineamento inteiramente casualizado, tem-se: 
• ��� = � + 	 �� + ���, em que i representa o tratamento (de 1 a I) e 
j as repetições (de 1 a J) 
• A estimativa da média geral (�� ) é dada por: 
• �� = 	 �
��
, em que � = ∑ ����,� .
• As estimativas dos efeitos de tratamento (�̂�) são dadas por: 
• �̂� = ��� −�� , em que �� = ∑ ���� .
• As estimativas dos erros são dadas por:
• �̂�� = ��� −�� − �̂�.
Exemplo
Trat
Repetições
��
��
�
���
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0 6 1,2 1,2 – 6,1 = -4,9
Var 2 (B) 1 0 0 1 1 3 0,6 0,6 – 6,1 = -5,5
Var 3 (C) 12 10 14 17 11 64 12,8 12,8 – 6,1 = 6,7
Var 4 (D) 7 9 15 8 10 49 9,8 9,8 – 6,1 = 3,7
Total 122
�� = 122
20
= 6,1
Trat
Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2
Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4
Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8
Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2
Tabela dos erros:
Trat
Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 2 2 1 1 0
Var 2 (B) 1 0 0 1 1
Var 3 (C) 12 10 14 17 11
Var 4 (D) 7 9 15 8 10
Tabela dos resultados:
�̂�� = ��� − 6,1 − �̂�
�̂� = −4,9�̂� = −5,5�̂� = 6,7�̂� = 3,7
Exemplo
Exemplo de Teste de Normalidade
• Teste de Lilliefors:
• Consiste em se obter os valores D = supr|�(
�) 	− �(
�)| ou D
= supr|�(
�) 	− �(
��	)|.
• Em que �(	�) são as probabilidades da variâvel normal reduzida: 
• 	� = ����	
 , no nosso caso, 
� = ���, sendo assim 
� = 0 e � é a 
estimativa do desvio padrão médio dos erros: 	� = ���
̅ = 
�� =
desvios padronizados; �̅ = �̅�; �̅� = ∑ ����
�(���)
=
∑ 
�
�
�
;
• �(	�) = ��, em que � é o número de desvios ≤ ���, e � representa o 
número total de observações, em outras palavras �(	�) representa a 
frequência acumulada dos erros. 
Exemplo de Teste de Normalidade
Trat
Repetições
1ª 2ª 3ª 4ª 5ª Total ��
�
Var 1 (A) 0,64 0,64 0,04 0,04 1,44 2,8 0,7 Total / (5-1)
Var 2 (B) 0,16 0,36 0,36 0,16 0,16 1,2 0,3
Var 3 (C) 0,64 7,84 1,44 17,64 3,24 30,8 7,7
Var 4 (D) 7,84 0,64 27,04 3,24 0,04 38,8 9,7
Total 73,6 4,6 Média (�̅�)
Total / 16 4,6
Tabela contendo os valores dos erros elevados ao quadrado (����)
� � − 1 = 4 5 − 1 = 16
Trat
Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,373 0,373 -0,093 -0,093 -0,560
Var 2 (B) 0,187 -0,280 -0,280 0,187 0,187
Var 3 (C) -0,373 -1,306 0,560 1,958 -0,839
Var 4 (D) -1,306 -0,373 2,425 -0,839 0,093
Tabela dos desvios padronizados:
Trat
Repetições
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 0,8 0,8 -0,2 -0,2 -1,2
Var 2 (B) 0,4 -0,6 -0,6 0,4 0,4
Var 3 (C) -0,8 -2,8 1,2 4,2 -1,8
Var 4 (D) -2,8 -0,8 5,2 -1,8 0,2
Tabela dos erros:
�� =
���
�̅
Exemplo
Exemplo
erros freq �� F(��) S(��) |F(��)-S(��)| |F(��)-S(����)|
-2,8 2 -1,3 0,0968 0,10 0,0032 0,0968
-1,8 2 -0,84 0,2005 0,20 0,0005 0,1005
-1,2 1 -0,56 0,2877 0,25 0,0377 0,0877
-0,8 2 -0,37 0,3557 0,35 0,0057 0,1057
-0,6 2 -0,28 0,3897 0,45 0,0603 0,0397
-0,2 2 -0,09 0,4641 0,55 0,0859 0,0141
0,2 1 0,09 0,5359 0,60 0,0641 0,0141
0,4 3 0,19 0,5753 0,75 0,1747 0,0247
0,8 2 0,37 0,6443 0,85 0,2057 0,1057
1,2 1 0,56 0,7123 0,9 0,1877 0,1377
4,2 1 1,96 0,9750 0,95 0,0025 0,0750
5,2 1 2,42 0,9922 1 0,0078 0,0432
Exemplo
• Após montada a tabela basta comparar o maior valor das 
distâncias calculadas com o valor tabelado.
• D = supr|�(��) 	− �(��)| = 0,2057 (Valor observado)
• Os valores obtidos pela tabela de Lilliefors com 	 = 20 e 
 = 0,05 ou 
 = 0,01 são:
• �
��(�
;
,
�) = 0,190 e �
��(�
;
,
	) = 0,231.
• Como 0,2057 > 0,190, rejeita-se a hipótese inicial de que os 
erros sigam uma distribuição normal.
Q-Q Plot
O Q-Q Plot é um gráfico 
bastante útil na análise dos 
resíduos. Se os resíduos se 
posicionarem de maneira a 
formar uma reta 
(aproximada), tem-se 
evidência de normalidade 
dos mesmos, se não, tem-se 
evidênciade falta de 
normalidade (como é o caso 
do exemplo dado).
Histograma
O histograma dos resíduos 
também é um bom indicador 
de normalidade dos dados. Se 
os resíduos forem normais, o 
seu histograma deve 
representar uma amostra 
retirada de uma distribuição 
normal com média zero.
Novamente, o gráfico 
produzido com os dados do 
exemplo é um indicativo da 
falta de normalidade dos 
resíduos.
Verificação das Pressuposições
• Já não é indicado aplicar a ANOVA aos dados do experimento 
de estacas de pessegueiro (não hà normalidade dos erros);
• Antes de procurar soluções para esse problema, vamos 
verificar a homocedasticidade das variâncias (graficamente).
• Para testar a Homocedasticidade vamos utilizar o teste de 
Hartley, ou da razão máxima (��á�)
Exemplo de Teste de 
Homocedasticidade
• Para calcular a estatística do teste de 
Hartley basta conhecer as variâncias dos 
erros para cada tratamento:
• O teste consiste em calcular a razão entre 
a maio e a menor variância:
Trat
��
�
Var 1 (A) 0,7
Var 2 (B) 0,3
Var 3 (C) 7,7
Var 4 (D) 9,7
4,6
��á� = ��á�
�
����� =
9,7
0,3
= 32,33 ��á�(���) � � = 4	variâncias� = 4	g. l. (por	���)�
20,6	(5%)
49,0(1%)
32,33 > 20,6
Rejeita-se a hipótese inicial de 
homocedasticidade das 
variâncias
Visualização Gráfica
-4
-3
-2
-1
0
1
2
3
4
5
6
0 2 4 6 8 10 12 14
E
r
r
o
s
 
P
a
d
r
o
n
i
z
a
d
o
s
Valores Preditos
Preditos vs Erros Padronizados
Indicativo de uma possível heterogeneidade das variâncias
Verificação das Pressuposições
• O experimento respeita 2 pressuposições: Aditividade do 
modelo (por hipótese); Independência dos erros 
(aleatorização).
• Porém duas pressuposições não foram respeitadas: 
Normalidade dos erros (Lilliefors); Homocedasticidade das 
variâncias (Hartley).
• Os problemas de falta de Homocedasticidade e/ou 
Normalidade podem ser resolvidos (algumas vezes) com a 
transformação dos dados.
• Qual transformação usar?
Transformação de Dados
• Mais Comuns: 
• � + �, com � sendo uma constante positiva, para dados de 
contagem; 
• ���	��� �/100, para dados de percentagem, geralmente para 
0 ≤ � ≤ 30% ou 70 ≤ � ≤ 100%; 
• log	(� + �), quando hà proporcionalidade entre médias e desvios 
padrões.
• Box Cox: 
• log ��� = � ∗ log(�� �) + �;
• � = 1 − �� �� .
• � ≠ 0 → �∗ = ��;
• � = 0 → �∗ = log(�);
�� 	 Transformação
0 1 Nenhuma
1 1/2 
2 0 log	(
)
3 -1/2 1
�
4 -1 1 
�
Exemplo de Transformação de 
Dados
Trat
Repetições
1ª 2ª 3ª 4ª 5ª total �� � ���
Var 1 (A) 2 2 1 1 0 6 1,2 0,7
Var 2 (B) 1 0 0 1 1 3 0,6 0,3
Var 3 (C) 12 10 14 17 11 64 12,8 7,7
Var 4 (D) 7 9 15 8 10 49 9,8 9,7
Tabela com os dados do experimento, média e variância por tratamento:
Trat ���(�� �) ���(���) ��� �� � ∗ ���(���) ���(�� �) �
Var 1 (A) 0,079181 -0,1549 -0,01227 0,00627
Var 2 (B) -0,22185 -0,52288 0,116 0,049217
Var 3 (C) 1,10721 0,886491 0,981531 1,225914
Var 4 (D) 0,991226 0,986772 0,978114 0,982529
Total 1,955769 1,195482 2,06338 2,26393
Média 0,488942 0,29887
Tabela de auxílio para o cálculo de b:
Alternativas à Transformação
• Existem casos em que não é possível encontrar uma 
transformação que resolva todos os problemas e permita a 
utilização da técnica da ANOVA.
• Nesses casos, recomenda-se:
• Análises não paramétricas; ou
• Modelos Lineares Generalizados.
Transformação dos dados
Trat
Repetições
total mi si2
1ª 2ª 3ª 4ª 5ª
Var 1 (A) 1,581 1,581 1,225 1,225 0,707 6,319 1,264 0,128
Var 2 (B) 1,225 0,707 0,707 1,225 1,225 5,088 1,018 0,078
Var 3 (C) 3,536 3,240 3,808 4,183 3,391 18,158 3,632 0,139
Var 4 (D) 2,739 3,082 3,937 2,915 3,240 15,914 3,183 0,214
Total 45,479
A tranformação recomendada foi �, porém, como existem parcelas com 
observações iguais a zero, recomenda-se a soma de uma constante dentro 
da raiz, logo a transformação utilizada foi: � + 0,5
��á� = �, !"�,�#$ = ,#% < �,&
Corrigido o problema da 
heterogeneidade das variâncias
Q-Q Plot dos Resíduos – pós 
transformação dos dados
Pode-se notar que os 
resíduos estão bem mais 
aproximados da reta após a 
transformação dos dados, o 
que indica uma alta 
possibilidade de não se 
rejeitar a hipótese da 
normalidade dos resíduos 
após a transformação dos 
dados .
Histograma dos Resíduos – pós 
transformação dos dados
Assim como o Q-Q Plot, o 
histograma dos resíduos 
encontrados após a 
transformação dos dados, 
também indica uma 
possível normalidade dos 
mesmos.
Gráfico – Dados 
Transformados
-6
-4
-2
0
2
4
6
0 1 2 3 4
E
r
r
o
s
 
P
a
d
r
o
n
i
z
a
d
o
s
Valores Preditos
Preditos vs Erros Padronizados (Dados 
Transformados
Pressuposições – Dados 
Transformados
• Após a transformação dos dados passamos a respeitar todas 
as pressuposições do modelo matemático;
• Se torna possível a utilização do método da ANOVA na análise 
dos resultados do experimento.
Análise da Variância
• Como fazer a Análise da Variância?
• Primeiro passo: Definir o esquema da ANOVA
Causa da 
Variação
Graus de 
Liberdade
Soma de 
Quadrados
Quadrado 
Médio
F
Tratamentos I-1 SQTrat QMTrat QMTrat/QMRes
Resíduos I(J-1) SQRes QMRes
Total IJ-1 SQTotal
Somas de Quadrados
• As Somas de Quadrados (SQ) são obtidas pelas seguintes 
expressões:
• SQTotal = ∑ �����,� − ∑ ����,�
�
��
; 
• em que 
∑ ����,�
�
��
= ' é denominado correção
• SQTrat =
	
�
∑ ��∙�� − � = 	�∑ ���� − �;
• SQRes = SQTotal	− SQTrat.
Quadrados Médios e Teste F
• Os Quadrados Médios (QM) são obtidos pelas seguintes 
expressões:
• QMTrat =
������
��(����)
=
������
	
�
;
• QMRes =
���
�
��(�
�)
=
���
�
	(�
�)
.
• O teste F considera a hipótese de nulidade: 
• os efeitos dos tratamentos não diferem entre si (�� = ��, ∀	�	e	�); 
• e a alternativa: 
• ao menos dois tratamentos diferem entre si 
(�� ≠ ��, para	ao	menos	um	�	 ≠ 	�).
• A estatística do teste e: � = ������
�����
.
Qual o Significado do Teste F
• Considere um delineamento inteiramente casualizado fixo 
(��	e	�� fixos e ��� aleatório), tem-se:
• E QMRes = 	 �� → QMRes = 		 ���;
• E QMTrat = 	 �� + �Φ� → QMTrat = 		 ��
� + 	Φ
 �, com 
Φ
 � =
∑ ���
�
�
	
�
;
• Logo: � = 	
����
 
!"#
∑ ���
�
�
���
= 1 + �
�� $
���
.
• Ou seja, F se afasta de 1 a medida que ∑ �̂�
�
� aumenta; como 
esse valor mede a variação dos efeitos de tratamento, tem-se 
que valores baixos indicam igualdade entre os tratamentos e 
valores altos diferenças entre os tratamentos.
Teste F
• Para saber o quanto o teste F deve se afastar de 1 para ser 
considerado significativo basta checar a tabela do teste, com 
�� graus de liberdade de tratamentos (I-1) e �� graus de 
liberdade dos resíduos I(J-1).
• No nosso exemplo:
• ���� = 62,87**;
• �
�� � �	 = 3�� = 16 → �
�
�� = 3,24	(5%)�
�� = 5,29	(1%);
• Como o valor observado é maior do que o tabelado conclui-se 
que ao menos duas variedades se diferenciam quanto ao 
estacamento de raizes. Costuma-se indicar que o valor é 
significativo a um nível de 5% com * e altamente significativo 
(1%) com **.
Exemplo
• SQTotal = 1,581� +⋯+ 3,24� −
��,��� �
�∗�
= 28,5844;
• SQTrat =
�
�
6,319� +⋯+ 15,914� −
��,��� �
� 
= 26,3495;
• SQRes = 28,5844 − 26,3495 = 2,2349;
Causa da 
Variação
Graus de 
Liberdade
Soma de 
Quadrados
Quadrado 
Médio
F
Tratamentos 3 26,3495 8,7832 62,87
Resíduos 16 2,2349 0,1397
Total 19 28,5844

Outros materiais

Perguntas relacionadas

Perguntas Recentes