Buscar

2017 2 Estatística experimental Material inicio GES102

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Universidade Federal de Lavras
Departamento de Estatística
ESTATÍSTICA EXPERIMENTAL
Augusto Ramalho de Morais
Lavras, MG
2017
Capitulo 1. Introdução
Prof. Augusto Ramalho de Morais
Pesquisa – estudo minucioso e sistemático com o fim de descobrir ou estabelecer fatos ou princípios relativos a um campo do conhecimento.
1. Por que usar estatística?
A estatística experimental tem por objetivo o estudo dos experimentos em aspectos como:
	Planejamento (quais técnicas serão utilizadas)
	Execução (como serão usadas)
	Análise dos dados obtidos (quais variáveis, como)
	Interpretação dos resultados
Importância em:
	Testar variedades melhoradas;
	Testar efeito de fertilizantes;
	Testar métodos de combate a pragas e doenças;
	Aprimoramento de métodos e técnicas;
	Avaliar conservantes...
2. Conceitos básicos
a) Experimento ou ensaio:
É um procedimento previamente planejado de acordo com determinados princípios básicos e, no qual se faz comparação dos efeitos de tratamentos.
b) Tratamento:
É uma condição imposta ou método, elemento, material, objeto cujo efeito se deseja medir ou comparar no experimento. No experimento é utilizado mais de um tratamento.
Como exemplos têm-se:
	Variedade de soja; variedade de milho;
	Adubação para a cultura do tomate;
	Espaçamento para a cultura da cana-de-açúcar;
	Recipiente para armazenamento de maça;
	Aditivo para conservação de uva;
	Época de colheita de ameixa;
c) Unidade experimental ou parcela:
É a unidade que vai receber o tratamento e fornecer os dados que irão refletir seu efeito. Refere-se a unidade do experimento na qual será designado de modo aleatório um tratamento. Deve ser representativa do fenômeno em estudo. É a menor porção de um experimento; logo o experimento é constituído por várias unidades experimentais.
Como exemplo cita-se:
	Uma planta de laranjeira; um grupo de plantas de milho;
	Uma área de terreno com plantas; uma área de 20 m2;
	Um vaso com plantas; 
	Um conjunto de três vasos, cada um com uma planta;
	Um animal (cavalo, vaca, touro);
	Um grupo de aves (uma gaiola com cinco aves);
	Um conjunto de cinco frutos; uma placa de petri;
d) delineamento experimental:
É o plano ou modo utilizado na experimentação para indicar como os tratamentos são atribuídos ou distribuídos às parcelas.
Os mais conhecidos são:
	Delineamento inteiramente ao acaso;
	Delineamento em blocos ao acaso;
	Delineamento em quadrado latino;
	Delineamento em blocos incompletos.
3. Unidade experimental ou Parcela
A escolha da parcela deve ser feita de modo a minimizar o erro experimental. As parcelas devem ser o mais uniforme possível, para quando submetidas a tratamentos diferentes, seja possível detectar os efeitos dos tratamentos.
O tamanho da parcela se refere não somente a área de coleta ou de tomada dos dados observados; mas também variam em função de:
i)Material com que se está trabalhando – parcela para planta frutífera deve ser maior do que para uma gramínea; parcela para bovino deve ser maior do que suínos (baia, área de pastejo); parcela para couve deve ser maior do que para cebola;
ii) Objetivo da pesquisa – estudo para produção de mudas e para produção de madeira de eucalipto; estudo sobre efeito de rações e sobre o efeito de vacinas ou medicamentos; estudo sobre produção de frutos e sobre avaliação química dos frutos.
iii) Número de tratamentos – maior número de tratamentos sugere utilizar menor tamanho de parcelas; este fato visa a manter a distância entre as parcelas extremas o mais uniforme possível (homogeneidade entre as parcelas).
iv) Quantidade disponível de material – ensaios de introdução de novos materiais genéticos, de animais, de certos tipos de análise química ou de doença.
v) Uso de equipamentos – ensaios com maquinas agrícolas, colheitadeiras exigem parcelas grandes.
vi) Área total disponível – o experimento deve ser ajustado para a área experimental disponível; as vezes, deve-se utilizar parcelas pequenas para se avaliar os tratamentos disponíveis.
vii) Custo, tempo e mão-de-obra – em experimentos que tem custo alto, deve-se utilizar parcelas menores (pequenas); o tempo disponível do pesquisador para a condução e obtenção das observações indica que se deve utilizar parcelas menores em detrimento de parcelas muito grandes; a quantidade de mão-de-obra disponível limita o tamanho da parcela, para mão-de-obra escassa deve utilizar parcelas menores.
Forma da parcela
A forma da parcela depende do material que se esta em estudo. Em geral, para parcelas pequenas o efeito da forma é pequeno, mas quando a parcela é grande, o efeito da forma é maior.
i)Compridas e estreitas – facilitam a condução e tratos culturais. Uma parcela com 15 plantas:
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
ii) Circular – utilizado muito em laboratórios, placa de petri:
iii) Quadradas – uma parcela com 16 plantas
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	x
	X
Tamanho e forma ótimos de parcela resultam daqueles que tem menor variação entre as parcelas (menor variabilidade).
Bordadura – é uma parte da parcela situada nas bordas, constituída pelas linhas laterais e de parte das extremidades:
Área útil é uma linha central e a bordadura as linhas laterais e parte das extremidades:
Nos casos de experimento no qual se avalia o crescimento das plantas, sendo as avaliações feitas semanais, a parcela pode ter a seguinte representação:
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	←bordadura
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	←avaliação
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	←bordadura
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	←avaliação
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	←bordadura
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	←avaliação
	X
	O
	O
	O
	O
	O
	O
	O
	O
	X
	
	X
	X
	X
	X
	X
	X
	X
	X
	X
	X
	←bordadura
Nesse exemplo de parcela, é feito três avaliações de sete em sete dias, sendo que a área útil (bolinhas) de cada avaliação é sorteada; em alguns casos, fez-se em ordem sequencial (sem sorteio). Os símbolos X referem-se as bordaduras. A área útil de cada parcela é constituída por 16 plantas (O) e a área total é formada por 40 plantas (O e X).
Outra opção para dois cultivares e coleta em três épocas é dividir cada parcela com uma cultivar em três partes:
	Repetição 1
	
	Repetição 2
	C1 E1
	
	C2 E1
	
	C2 E1
	
	C1 E3
	C1 E3
	
	C2 E2
	
	C2 E2
	
	C1 E1
	C1 E2
	
	C2 E3
	
	C2 E3
	
	C1 E2
Outro modo seria utilizar parcelas separadas para cada época de avaliação:
	Repetição 1
	
	Repetição 2
	C1 E2
	
	C2 E1
	
	C2 E1
	
	C1 E2
	
	
	
	
	
	
	
	C2 E2
	
	C1 E3
	
	C1 E3
	
	C2 E2
	
	
	
	
	
	
	
	C1 E1
	
	C2 E3
	
	C2 E3
	
	C1 E1
	
Exemplos de parcelas:
Em casa de vegetação:
Um único vaso com 1, 2 ou três plantas;
Um conjunto de vasos (2, 3 ou mais vasos com uma planta).
Em laboratório:
Uma placa de petri; um conjunto de duas ou mais placas de petri;
Uma amostra simples;
Uma amostra composta (usa-se a média); a amostra composta não é as repetições.
Em experimento de campo, a parcela tem vários tamanhos e forma, podendo ser formada por quatro linhas de 10 metros de comprimento, sendo que as duas linhas laterais constituem a bordadura.
Em gramíneas como arroz e cana-de-açúcar são usadas parcelas de 3 a 5 linhas de 10 m de comprimento cada uma.
Em café usa-se de duas a quatro linhas com 7 a 10 plantas cada uma.
Em bovino usam-se um ou mais animais de acordo com a disponibilidade dos animais, pois é difícil encontrar muitos animais com características semelhantes.
Em parcelas com animais de pequeno porte, como coelho, frango, cobaia, podem-se utilizar vários animaispara formar cada parcela.
Em parcelas para árvores frutíferas usa-se uma a duas plantas.
Em geral, se pergunta frequentemente, qual é o tamanho da parcela?
É ainda um dos problemas dos pesquisadores, pois este tipo de informação depende de muitos fatores, como o tipo de experimento, as variáveis que vão ser medidas, o tipo de tratamento, etc.
4. Fases que antecedem a instalação de um experimento
a) Formulação das hipóteses:
Esta relacionada à finalidade do experimento;
Do ponto de vista estatístico – duas hipóteses: hipótese de nulidade vs hipótese alternativa
Devem ser bem definidas a fim de permitir conclusões bem definidas e objetivas;
Hipótese alternativa: 	Ha: T1> T2 Quando se tem conhecimento prévio
			Ha: T1< T2 Quando se tem conhecimento prévio
			Ha: T1 ≠ T2Quando não se tem conhecimento prévio
Exemplo: T1 testemunha, T2 uso de herbicidas
As hipóteses adequadas para peso de ervas daninhas são:
H0: T1 = T2 não há diferença entre os dois tratamentos
Ha: T1 > T2 o peso da erva daninha é maior nas observações associadas ao tratamento testemunha.
As hipóteses são autoconclusivas: Ha o herbicida foi eficiente.
A hipótese bilateral necessita de uma complementação, por exemplo, média de T1 = 10 g e média de T2 = 15 g; se H0 for rejeitada, embora Ha seja bilateral, o resultado é apresentado unilateralmente, T2 é mais produtivo do que T1.
b) Seleção dos fatores – os tratamentos são os níveis de um fator ou a combinação de níveis dos fatores.
Deve-se evitar experimento com um grande número de fatores, é melhor fazer por partes;
Variedades, espaçamentos, sistemas de plantio, adubações, épocas de plantio, tamanhos de mudas, tipos de equipamentos, ...são fatores de estudo.
Fator fixo – inferência é valida para os níveis utilizados;
Fator aleatório – inferência é valida para todos os níveis do fator.
c) Seleção de variáveis – que tipos de dados serão coletados, variáveis devem ser bem definidas (sua natureza, o método de obtenção, ...)
Como exemplos: produção, altura de planta, resistência a pragas, ciclo de maturação, ...
d) Seleção do delineamento
e) Identificação da unidade experimental.
	No planejamento de um experimento deve-se sempre procurar tornar mínimos os efeitos de fatores não controlados (que podem ou não ser controlados) e que causam variação; o conjunto dos efeitos de fatores não controlados ou variação do acaso ou aleatória é chamado de erro experimental. Como exemplos desses fatores, tem-se: pequenas diferenças de fertilidade, manchas de solo; pequenas variações de espaçamento; profundidade de semeadura; variação na constituição genética; variações nas doses de adubos, fungicidas, etc.; variações nos pesos dos animais; diferenças de idade, sexo, altura, peso, nível escolar. Todos esses efeitos, que sempre podem ocorrer em um experimento, como são pequenas variações, não podem ser conhecidos ou medidos e, assim, podem afetar o tratamento. Um bom experimento deve ser planejado para que os efeitos desses fatores seja o mínimo possível.
5. Procedimento geral para realização de um teste de hipótese
	Apresentam-se alguns passos básicos para a realização de um teste de hipótese, usando o teste F da análise da variância como referência.
i) Elaborar e enunciar a hipótese de nulidade (H0) e a hipótese alternativa (Ha).
Ou 
H0 : não existem diferenças significativas entre as médias dos tratamentos;
Ha : existe ao menos uma diferença significativa entre as médias dos tratamentos.
ii) Fixar o nível de significância α, conhecido por erro tipo I ou valor p.
iii) Identificar o teste a ser utilizado.
iv) Determinar a região critica e a região de não rejeição em função do nível de significância α (usa-se tabelas estatísticas ou cálculo do valor p).
No caso da análise da variância o valor calculado do teste F (FC) é significativo se sua probabilidade (valor p) for menor que 5% ou 0,05 (*) ou ainda, 1% ou 0,01 (**), dependendo da escolha do nível de significância. Nesse caso, o teste F é significativo e rejeita-se a hipótese H0.
O valor do teste F calculado será não significativo (ns) quando o valor de sua probabilidade for menor que 5%; nesse caso, não se rejeita a hipótese H0.
v) Utilizando os dados amostrais, obtidos no experimento, calcula-se a estatística do teste.
No caso do teste F, a distribuição F é obtida em relação ao número de graus de liberdade de tratamento (ou do fator em estudo) e do número de graus de liberdade do erro (ou resíduo). A representação gráfica da distribuição de F para F(3; 8) é
Para valores entre 0 e 4,07 tem a região de não rejeição da hipótese H0 (RNRH0), sendo que a área deste intervalo sob a curva da distribuição F é de 0,95 ou de 95%; sendo não significativo.
Para valores de F acima de 4,07 tem-se a região de rejeição da hipótese H0 (RRH0), sendo significativo no nível de 5% de probabilidade, que é a probabilidade deste evento ocorrer aleatoriamente.
v) Utilizando os dados amostrais obtidos no experimento calculam-se as estatísticas do teste.
O valor calculado de F foi de FC = 5,88.
vi) Conclusão do teste.
Pela rejeição ou não rejeição de H0, dependendo de o valor da estatística F calculada, pertença ou não pertença, à região critica definida em (iv). Neste caso, como o valor calculado FC é maior do que o valor F crítico, e encontra-se na região de rejeição da hipótese H0, portanto, infere-se que o teste foi significativo no nível de 5% de probabilidade.
Observação:
Pode-se destacar que a contribuição da estatística está, em grande parte, na técnica conhecida como teste de significância, o qual consiste em uma regra para decidir após exame dos dados, se rejeita ou não a hipótese. Essas regras são estabelecidas para satisfazer as seguintes condições desejáveis:
i) hipóteses que são verdadeiras serão rejeitadas muito raramente (e a probabilidade de rejeição pode ser escolhida pelo pesquisador);
ii) hipóteses que são falsas são rejeitadas tão frequentemente quanto possível.
Assim, o pesquisador pode testar a hipótese sobre a ação dos tratamentos com a segurança de que existe pouco risco de se rejeitar de modo errôneo uma hipótese que é correta. As probabilidades de 0,05 e 0,01 são as mais usadas para esse risco e que correspondem aos níveis de 5% e 1% de significância, respectivamente.
CAPÍTULO 2. VARIABILIDADE
1. Conceitos básicos
	Variabilidade é a qualidade de variável, ou daquilo que pode apresentar diversos valores distintos ou aquilo sujeito à variações. Nesse contexto, a natureza é pródiga em fornecer a idéia de variação nos múltiplos fenômenos. Veja a aparência das pessoas, seus pesos, as alturas de plantas; todas elas sugerem variabilidade.
	Define-se variação do acaso como a variação existente nos dados experimentais devido a fatores estranhos ou não controláveis (fatores aleatórios). 
Dado uma coleção de valores, um modelo linear simples para estudar a variabilidade é:
yi = ( + ei para i = 1, 2, ..., n
em que yi é o i-ésimo valor observado; ( é a media populacional e ei é o erro ou desvio do i-ésimo valor observado em relação à media.
	Como os parâmetros populacionais são desconhecidos, usam-se seus estimadores para que sejam avaliados. Dado uma amostra aleatória com n observações, o estimador para ( é 
; nesse caso, 
é um estimador não viesado (não tendencioso) da média, com a propriedade:
 
.
Nota: O estimador 
 é obtido através do método dos quadrados mínimos e é determinado de modo que a soma dos quadrados dos erros seja mínima, ou seja, 
 seja mínima.
	Em seguida apresentam-se alguns modos de estudar ou quantificar a variabilidade. Os dados que se seguem referem-se aos teores de vitamina C (ml/100g) de uma amostra aleatória de 26 frutos de laranjeira cultivar valência: 
	67
	77
	83
	65
	70
	68
	75
	77
	70
	65
	70
	78
	68
	60
	68
	68
	80
	67
	78
	82
	75
	76
	65
	72
	68
	80i) Uma estimativa da média populacional (, é 
 = 72 ml/100gr. Este valor é uma das estimativas do teor médio de vitamina C da cultivar de laranjeira valência (população em estudo).
ii) Os erros (do modelo adotado) são calculados por 
, onde: e1 = 67 - 72 = -5, e2 = 77 - 72 = 5, e3 = 83 - 72 = 11, ... , e26 = 80 -72 = 8.
Verifica-se, facilmente, que os erros possuem a propriedade de que a sua soma é igual a zero, ou seja, (-5) + (5) + (11) + ... + (8) = 0.
	Quando os erros apresentam uma distribuição sem nenhuma tendência definida, isto é, estão distribuídos de modo uniforme ao redor da média, diz-se que o modelo adotado se ajustou de modo adequado, sendo portanto, útil na interpretação dos dados. A representação gráfica dos erros ou desvios dos valores observados tomados em relação a media fornece uma idéia da variação do acaso; pontos muito dispersos indicam uma maior variabilidade. Um modo de quantificar essa idéia é através da variância.
iii) Denomina-se de soma de quadrados de desvios ou de erros ou de resíduo à parte da variação que é devida aos fatores estranhos que não são controlados pelo pesquisador. Para os dados de vitamina C, do exemplo, é calculada por
SQ Res =. 
 938
iv) Um estimador da variância amostral é:
sendo n o número de observações da amostra; n-1 é o número de graus de liberdade associado a s2. 
Para o exemplo, tem-se que:
 (ml/100g)2 
v) A variabilidade, também, pode ser descrita pelo desvio-padrão s = (s2)1/2, o qual fornece uma idéia de dispersão dos dados. No exemplo, 
s = (37,52)1/2 = 6,12 ml/100g.
vi) A variância da media e erro-padrão da media (idéia de dispersão ao redor da média) são obtidos através das expressões:
 e 
No exemplo, 
 = 1,44 (ml/100g)2 e 
 = 1,20 ml/100g. Estas estimativas fornecem uma idéia da precisão da estimativa da media; logo, pode-se representá-los por 72 (1,2).
vii) O coeficiente de variação (C.V.) é uma medida da variação residual do experimento, apropriada para comparar experimentos entre si. Expressa, em forma percentual, o desvio-padrão por unidade da média, e é calculado por 
. No exemplo, 
C.V. = 100(6,12)/72 = 8,51%.
viii) Intervalo de confiança para a media IC((), expressa ou fornece uma idéia da precisão da estimativa com que a media foi calculada mas em termos probabilísticos, obtido por:
 IC(()(1-() : 
 
em que 1-( é o coeficiente de confiança; 
 a estimativa da media; 
 o desvio-padrão da media, associado a n-1 graus de liberdade e t((/2) o valor tabelado da distribuição de t, ao nível ( de probabilidade com n-1 graus de liberdade. No exemplo,
IC(()(1 - 0,05) : 72 ( 2,064(1,20) : 72 ( 2,5
portanto, existe 95% de probabilidade de que o intervalo [69,5; 74,5] contenha a verdadeira média populacional (.
	Outro procedimento para estudar a variabilidade dos dados é a análise da variância, que será vista em seguida.
2. Introdução à análise da variância 
Uma vez obtidos os dados experimentais, o pesquisador quer tirar as conclusões pertinentes, e um dos métodos para se analisar os dados é a análise de variância (ANAVA).
 A análise de variância estuda as diferentes variações consideradas nos dados experimentais. É um método introduzido por Fisher, no início do século XX (década de 20), e é usado com grandes vantagens em todos os campos de pesquisa experimental. É um conjunto de técnicas estatísticas usada para determinar a existência de mudanças sistemáticas em alguma variável de interesse ou verificar se medias de duas ou mais populações são iguais. A análise de variância é uma generalização do teste t de Student para a diferença entre duas medias, para o caso de comparações simultâneas de I medias (I ( 2), supondo que as mesmas foram calculadas sobre amostras aleatórias da população.
	Para introduzir o método de análise de variância e os tipos de variação será considerado os dados de teores de glicose, contidos na Tabela 2, oriundos de um experimento conduzido a campo, com a finalidade de avaliar a introdução de palmito na região de Lavras, MG. Foram escolhidos quatro ambientes que se imagina sejam propícios para o desenvolvimento das plantas de palmito. Em cada ambiente foi plantado o palmito segundo as técnicas apropriadas. Para avaliação do desenvolvimento do palmito foram feitas várias determinações, das quais tomou-se apenas como exemplo, a densidade do solo. Neste tipo de dados existem as variações entre os ambientes (que são os tratamentos em estudo) e aquelas que ocorrem dentro de cada ambiente. Cada dado da Tabela 2 será representado por yij e, em geral podem ser visualizados como está na Tabela 3.
Tabela 2. Valores da densidade do solo (g/cm3) em função de quatro sistemas agroflorestais.
	Sistemas
	Obs. 1
	Obs. 2
	Obs. 3
	Obs. 4
	Total
	Média
	Palmito x Pinus
	1,33
	1,37
	1,40
	1,38
	5,48
	1,37
	Palmito x Eucalipto
	1,36
	1,39
	1,42
	1,40
	5,57
	1,39
	Palmito x Mata
	1,24
	1,26
	1,30
	1,28
	5,08
	1,27
	Palmito Pleno Sol
	1,43
	1,46
	1,49
	1,46
	5,84
	1,46
	
	
	
	
	
	21,97
	1,37
Fonte: Dados adaptados de Tsukamoto Filho, 1999.
Tabela 3. Representação teórica de um conjunto de dados em função de I tratamentos e J observações em cada tratamento.
	Tratamento
	Elementos da amostra
	Soma
	Média
	
	1
	2
	...
	j
	...
	J
	
	
	1
	y11
	y12
	...
	y1j
	...
	y1J
	y1+
	
	2
	y21
	y22
	...
	y2j
	...
	y2J
	y2+
	
	...
	...
	...
	...
	...
	...
	...
	...
	...
	I
	YI1
	yI2
	...
	yIj
	...
	yIJ
	yI+
	
	Soma
	Y+1
	Y+2
	...
	Y+j
	...
	Y+J
	y++
	
em que yij é a observação realizada no j-ésimo elemento (j = 1, 2, ..., J) da amostra no i-ésimo tratamento, com i = 1, 2, ..., I tratamentos (linhas), 
 é o estimador da média do i-ésimo tratamento e 
 é o estimador da media geral.
	Um modelo linear adequado para estudar os dados da Tabela 3 é 
yij = ( + ti + eij
em que yij é o valor observado na j-ésima amostra do i-ésimo tratamento, com i = 1, 2, ..., I tratamentos (linhas) e j = 1, 2, ..., J amostras (colunas); ( é uma constante inerente a todos os dados (às vezes é a média); eij é o erro experimental associado a observação yij . 
	Os tipos de variação que ocorrem nesse modelo são:
i) Medida da variação total
Inicialmente considera a hipótese de que não há efeitos de tratamentos. Essa é a hipótese de nulidade e representa-se por H0: t1 = t2 = ... = tI = 0. As respostas ou dados experimentais podem ser explicadas pelo modelo yij = ( + eij . Assim, pode-se supor que todos os dados do experimento estão distribuídos ao redor da mesma média (, com variância (2. A soma de quadrados total mede a variação total dos valores observados no experimento e está associada a n-1 graus de liberdade. Usando os dados da Tabela 2, obtêm-se:
SQTotal = (1,33-1,37)2 + (1,37-1,37)2 + ... + (1,46-1,37)2 = 0,08254
Partição da variação total
	A variação total dos dados é a variação de cada observação em relação à média geral do experimento; é calculada por 
V.T. = SQTotal = SQTot = 
 (1)
para ser decomposta usa-se o artifício de somar e subtrair 
, obtendo
 = 
 = 
 + 2
 + 
 = 
 = 
+ 
pois o duplo produto é nulo. Assim, tem-se que a variação entre tratamentos é
 = 
= SQ Entre (2)
e, a variação dentro (de tratamentos) é
 = 
 = SQ Dentro (3)
	Assim, a variabilidade total é decomposta nas variabilidades entre e dentro de tratamentos, ou seja: SQTotal = SQ Entre + SQ Dentro.
ii) Variação entre tratamento
	A medida desta variação é a soma de quadrados entre tratamentos e ela mede a variação entre os tratamentos, e está associada a I-1 graus de liberdade. No exemplo, tem-se
SQT = SQ Entre = 
 = 4[(1,37-1,37)2 + (1,39-1,37)2 +... + (1,46-1,37)2] = 0,07427
iii) Variaçãodentro de tratamento
A medida da variação entre parcelas tratadas do mesmo modo é a medida da variação do erro experimental. A soma de quadrados do resíduo mede a variação entre as parcelas do mesmo tratamento e está associada a n – I graus de liberdade. No exemplo, tem-se
SQ Resíduo = SQErro = SQ Dentro =
 = (1,33-1,37)2 +... + (1,36-1,39)2 + ... + (1,49-1,46)2 + (1,46-1,46)2 = 0,00827.
Associado com as somas de quadrados existem os números de graus de liberdade (GL); Kirk (1968) definiu número de graus de liberdade, de uma fonte de variação, como o número de observações necessárias àquele cálculo menos o número de parâmetros independentes estimados. Para o caso da variância (s)2, há necessidade de estimar somente a média. 
Define-se como quadrado médio de uma fonte de variação como sua soma de quadrados dividida pelo respectivo número de graus de liberdade. Representa-se por QM. Por exemplo, QM Entre = SQ Entre/GL Entre. Assim, o esquema de análise de variância para os dados da Tabela 3, está apresentado na Tabela 4.
Tabela 4. Tabela para realização da análise de variância com a decomposição da variabilidade total em variação entre e dentro para um conjunto de I tratamentos repetidos J vezes.
	Fontes de Variação
	G.L.
	Soma de Quadrados
	Quadrado Médio
	Teste F
	Entre
	I-1
	SQ Entre
	SQE/(I-1) = QME
	F = QME/QMD
	Dentro 
	n-I
	SQ Dentre
	SQD/(n-I) = QMD
	
	Total
	n-1
	SQTotal
	
	
 
Para os dados de densidade do solo da Tabela 2, tem-se
	Fontes de Variação
	G.L.
	Soma de Quadrados
	Quadrado Médio
	Teste F
	Entre
	 3
	0,07427
	0,02476
	35,92
	Dentro 
	12
	0,00827
	0,00069
	
	Total
	15
	0,08254
	
	
	O teste F permite avaliar a hipótese de que não há efeito de tratamentos. Essa hipótese pode ser representada por 
H0: ti = 0 para todo i vs Ha : ti ( 0 para algum i
ou ( H0 : (i = ( para todo i; Ha : (i ( ( para algum i).
	Na distribuição de F, tem-se um valor crítico Ft que será excedido por acaso, com uma probabilidade (. A quantidade Ft = QMT/QMR seque uma distribuição de F, com I-1 e n-I graus de liberdade (sob H0). O valor Ft = F( depende do número de graus de liberdade de ambos os quadrados médios. Para verificação da hipótese de igualdade entre os tratamentos, compara-se o valor calculado (Fc) com o valor crítico Ft (tabelado); se o valor calculado for maior que o tabelado (Fc ( Ft) rejeita-se a hipótese de nulidade e conclui-se que existem evidências de que há alguma diferença entre os tratamentos. Quando Fc ( Ft conclui-se que existem evid6encias de que os tratamentos têm comportamento semelhantes. No exemplo, tem F(5%; 3; 12) = 3,49 e F(1%; 3; 12) = 5,95.
	Conclusão: Como Fc ( Ft então rejeita-se Ho, logo existem fortes evidencias de que os valores de densidade do solo diferem entre si de acordo com o sistema agroflorestal. Existe pelo menos um contraste entre as médias dos sistemas que difere de zero.
3. Suposições básicas da análise de variância
Para a realização da análise de variância é preciso considerar algumas suposições básicas. As hipóteses básicas que se deve admitir para a validade de uma análise de variância são: 
i) Aditividade – os efeitos dos fatores considerados no modelo linear adotado devem ser aditivos; 
ii) Homogeneidade de variâncias – os tratamentos devem possuir variâncias homogêneas; 
iii) Normalidade – os erros ou desvios devidos aos fatores não controlados são variáveis aleatórias com distribuição normal de média zero e variância constante (2; 
iv) Independência - os erros são variáveis aleatórias independentes, isto é, E(eij ei’j’) = 0; isto implica que os tratamentos sejam independentes ou que não haja correlação entre eles. Este fato, pode não ocorrer quando os tratamentos são doses crescentes de adubos, inseticidas, ocasião que a analise de variância deve ser feita estudando-se os efeitos de tratamentos pela regressão.
Às vezes, ocorre que uma ou mais dessas hipóteses não se verifique; um dos casos mais comum é aquele em que não existe homogeneidade de variâncias. Nesses casos, outros modelos podem ser adotados ou pode-se usar algum artifício como a transformação de dados para se contornar este problema.
As suposições (iii) e (iv) são necessárias para validade dos testes estatísticos, como exemplo, o teste F e outros testes para comparações de médias.
4. Introdução aos delineamentos experimentais
	A disposição das parcelas no experimento, resultante da maneira de designar os tratamentos a elas, chama-se delineamento experimental. O principal objetivo do delineamento experimental é selecionar e agrupar os tratamentos de modo que a ‘perturbação’ ou ‘ruído’ ou erro experimental do experimento seja reduzido. Assim, as unidades experimentais nas quais os tratamentos são avaliados devem ser tão semelhantes quanto possível, de modo que, uma pequena diferença entre dois tratamentos possa ser detectada.
	Os fatores que afetam a escolha de um delineamento experimental são: características físicas e topográficas da área experimental, variabilidade do solo (quantidade e modo), número e natureza dos tratamentos, cultura a ser usada, duração do experimento, natureza das máquinas a ser usadas, tamanho da diferença a ser detectada, nível de significância, quantidade de recursos (terra, semente, fertilizante) que podem ser destinado para o estudo, custo (dinheiro, tempo, pessoal) requerido para completar o experimento. Sugere-se escolher o delineamento mais simples que fornece uma boa precisão dentro dos limites dos recursos disponíveis.
4.1 Estruturas de um delineamento experimental 
	Um delineamento experimental consiste de duas estruturas básicas, e é muito importante a identificação e distinção entre cada estrutura.
	A estrutura de tratamentos consiste de um conjunto de tratamentos, combinações de tratamentos ou populações que o pesquisador seleciona para estudar ou compararem. A estrutura de tratamentos pode ser um conjunto de I tratamentos, chamada de estrutura de tratamentos, com um critério (one-way) ou um conjunto de combinações de tratamentos como um arranjo fatorial com dois critérios (two-way) ou um arranjo fatorial com mais de dois critérios, mais algum controle ou tratamentos padrão, mormente chamado testemunha.
	A estrutura de delineamento consiste no agrupamento das unidades experimentais em grupos homogêneos ou blocos. Se todas as unidades experimentais são muito homogêneas, então existe somente um grupo ou bloco de observações, e as unidades experimentais podem ser designadas para os tratamentos de modo completamente ao acaso. Tal estrutura de delineamento é chamada delineamento inteiramente casualizado.
	Se mais de um grupo de unidades experimentais é requerido de modo que as unidades dentro de grupo são muito mais homogêneas que as unidades experimentais entre grupos, então a estrutura de delineamento é algum tipo de delineamento em blocos. Uma vez que a estrutura de tratamento e a de delineamento foi selecionada, o delineamento experimental é especificado pela descrição exata e método de casualização, distribuindo (casualizando) os tratamentos da estrutura de tratamentos para as unidades experimentais na estrutura de delineamento.
Assim, o delineamento experimental envolve: i) a escolha da estrutura de tratamentos ii) a escolha da estrutura de delineamento e iii) o método de casualização. A Figura 1 apresenta o esquema de relacionamento entre estas partes.
	
	Delineamento experimental
	
	Estrutura de tratamentos
	
	Estrutura de delineamento
	((((
	Casualização
	((((
Figura 1 - Esquema das estruturas de um delineamento experimental.
	O delineamento experimental prescreve o modelo apropriado a ser usado para obter a análise correta. Na construção do modelo duas pressuposições são feitas: primeiro é assumido que as componentes da estrutura de delineamento são efeitos aleatórios, isto é, os blocos usados são uma amostra aleatória da população possível de blocos de unidadesexperimentais; segundo é assumido que não existe interação entre os componentes da estrutura de delineamento e os componentes da estrutura de tratamentos. De outro modo, é assumido que as relações existentes entre os tratamentos devem ser consistentes de bloco para bloco (exceto para variação aleatória), ou que os blocos não podem influir na relação entre tratamentos.
5. Exercícios:
1. Construa exemplos de experimentos com I = 3 tratamentos e J = 4 repetições, tais que: 
a) Apenas a variabilidade dentro de um tratamento seja nula (os outros não); 
b) apenas a variabilidade entre tratamentos seja nula;
 c) apenas a variabilidade dentro de tratamentos seja nula;
 d) apenas a variabilidade total seja nula.
2. Os dados seguintes são as produções de sementes de lentilha (kg/parcela) em função de cinco tipos diferentes de solo existentes em uma fazenda.
	Tipos de
	
	Observação
	
	Soma
	Média
	Solo
	1
	2
	3
	
	
	S1
	42
	35
	30
	
	
	S2
	28
	28
	23
	
	
	S3
	19
	20
	13
	
	
	S4
	42
	36
	32
	
	
	S5
	33
	26
	31
	
	
Obter:
i) As somas ou totais, médias e variâncias para cada tipo de solo;
ii) As variações totais, entre e dentro;
iii) A tabela da análise de variância;
iv) Interpretação dos resultados.
3. Valores observados de teores de vitamina C (em mg/100g) de três cultivares de pêra observados em cinco plantas, um mês após o florescimento.
	Cultivar
	
	
	Plantas
	
	
	
	1
	2
	3
	4
	5
	Smith
	22
	32
	18
	12
	26
	Garber
	20
	28
	15
	10
	23
	LeConte
	17
	32
	15
	9
	21
	Total
	59
	92
	48
	31
	70
i) Formular as hipóteses;
ii) Obter as variações totais, entre e dentre e a análise de variância
iii) Interpretar os resultados.
4. Um proprietário rural desejando saber em qual de suas fazendas existe um maior teor de areia, tomou 12 amostras na fazenda A, 8 na B e 7 na C. Os teores de areia foram:
	Fazenda
	Amostras
	A
	35 40 38 39 33 41 36 37 38 35 36 36 
	B
	31 28 30 28 31 28 30 33 
	C
	28 30 25 22 20 25 23
i) Obter as variações entre, dentro e total e completar a análise de variância;
ii) Mostrar que a variabilidade total pode ser decomposta nas variabilidades entre e dentro de fazenda;
iii) Interpretar os resultados.
Capitulo 3. DELINEAMENTO INTEIRAMENTE CASUALIZADO
1. Introdução
É o mais simples de todos os tipos de delineamentos experimentais;
Estão envolvidos os princípios da repetição e casualização;
Os tratamentos são distribuídos nas parcelas de forma inteiramente casual (aleatória);
Deve ser usado somente quando existe certeza de homogeneidade existente na área experimental.
Vantagens:
 i) é um delineamento bastante flexível, pois o número de repetições e o de tratamentos depende apenas do número de parcelas disponíveis;
ii) o número de repetições por tratamento não precisa ser o mesmo para todos tratamentos, mas o delineamento é mais eficiente se os tratamentos são igualmente repetidos; 
iii) a análise estatística é simples, mesmo com número de repetições diferentes por tratamento;
iv) o número de graus de liberdade para o erro (ou resíduo) é o maior possível, em comparação com os outros delineamentos com o mesmo número total de parcelas
Desvantagens:
i) exige homogeneidade total das condições experimentais;
ii) exige que o material experimental seja semelhante e que as condições de estudo sejam completamente uniformes;
iii)pode conduzir a estimativa da variância residual bastante alta, pois não usando nenhum controle local, todas as variações, exceto aquelas de tratamentos, são consideradas como variação do erro experimental, logo pode ter baixa precisão se as parcelas não são uniformes.
Usado nas situações em que:
i) a área experimental é relativamente uniforme,
ii) uma fração das parcelas pode ou não ter resposta ou pode se perder durante o curso do experimento, 
iii) o número de parcelas é limitado, dado que o número de graus de liberdade associado ao resíduo é máximo.
iv) Utilizado em laboratórios e ensaios realizados em casa-de-vegetação; nos experimentos com vasos, sugere-se que estes devem ser constantemente mudados de posição, de modo inteiramente casual, para evitar influências externas sempre sobre os mesmos vasos.
2. Analise de variância
Na análise dos dados de um experimento conduzido no delineamento inteiramente casualizado, em geral, pretende-se:
i) estimar as médias ou efeitos dos tratamentos;
ii) estimar o erro-padrão da média de um tratamento ou da diferença entre médias;
iii) testar a significância das diferenças entre as médias dos tratamentos.
Tabela 1. Esquema de análise de variância para um experimento conduzido no delineamento experimental inteiramente casualizado com I tratamentos e J repetições.
	Fontes de variação
	G.L.
	S.Q.
	Q.M.
	E(Q.M.)
	Teste F
	Tratamentos
	I-1
	SQTra
	QMTra
	(2 + J((t)
	QMTra/QMErro
	Erro
	I(J-1)
	SQErro
	QMErro
	(2
	
	Total
	IJ – 1
	SQTot
	
	
	
As expressões para cálculo das somas de quadrados são:
i) soma de quadrados total (SQTot), associada a IJ – 1 números de graus de liberdade
SQTot = 
 = 
é a soma de todas as observações;
ii) soma de quadrados de tratamentos (SQTra), associada a I – 1 graus de liberdade
SQTra = 
 = 
 = 
é a soma das observações do tratamento 1, idem para os demais;
iii) soma de quadrados do erro (SQErro), associada a I(J – 1) graus de liberdade
SQErro = 
 = 
 - 
 = 
 = SQTot - SQTra
Os quadrados médios são obtidos dividindo-se as somas de quadrados pelos seus correspondentes números de graus de liberdade, assim: QMTra = SQTra/(I-1) , QMRes = SQErro/[I(J-1)]
	E, finalmente, o valor de F calculado é
3. Exemplo Ilustrativo
Para exemplificar o uso de um delineamento inteiramente casualizado,considera-se dados de experimento conduzido em laboratório, no qual foi estudado quatro meios de cultura para propagação de crisântemo. Os dados referem-se aos valores de comprimento da parte aérea de explantes, em mm, avaliados aos 45 dias após inoculação e instalado o experimento. Cada parcela foi formada por oito tubos de ensaio, sendo que o valor observado da parcela foi a média das oito medidas realizadas em cada tubo.
Tabela 2. Comprimento da parte aérea de explantes de crisântemo (em mm) em função de quatro meios de cultura.
	(Tratamentos)
	Repetição
	Soma
	Média
	Meios
	1
	2
	3
	
	
	i = 1 A
	4
	5
	6
	 15(3)
	5
	i = 2 B
	10
	12
	8
	30
	10
	i = 3 C
	7
	9
	11
	27
	9
	i = 4 D
	10
	14
	12
	36
	12
	Soma
	
	
	
	 108(12)
	9
Hipóteses:
H0: Os comprimentos da parte aérea entre os meios de cultura não diferem entre si versus
Ha: existe pelo menos uma diferença entre os meios de cultura quanto ao comprimento da parte aérea.
Os números de graus de liberdade associados às somas de quadrados são: 
GL total = IJ– 1 = 12 – 1 = 11;GL tratamentos = I – 1 = 4 – 1 = 3; 
GL Erro = GL total – GL tratamentos = 11 – 3 = 8.
	As somas de quadrados são obtidas do seguinte modo:
SQTot = 42+ 52+ ... + 122- (4 + 5 + ... + 12)2/12 = 1076,00 - (108)2/12 =
 = 1076,00–972,00 = 104,00
SQTra = 
 = 1050,00– 972,00 = 78,00
SQErro = SQTot - SQTra = 104,00 – 78,00 = 26,00.
Nota: O termo 
 = 972,00 será chamado de correção.
	Os quadrados médios são: QMTra = SQTra/GLTra = 78,00/3 = 26,00; QMErro = SQErro/GLErro = 26,00/8 = 3,25.
O teste F é calculado por Fc = QMTra/QMErro = 26,00/3,25 = 8,00.
	A análise de variância com aplicação do teste F está mostrada na Tabela 2.
Tabela 3. Análise de variância dos dados de comprimento da parte aérea.
	Fontes de Variação
	G.L.
	S.Q.
	Q.M.
	Fc
	F[0,05; 3; 8]
	Tratamentos
	3
	78,00
	26,00
	8,00
	4,07
	Erro
	8
	26,00
	3,25
	
	
	Total
	11
	104,00
	
	
	
	Confrontando o valor de Fcobtido para meios de cultura (tratamentos) com o valor tabelado, verifica-se que o valor calculado é maior do que o valor tabelado, portanto rejeita-se H0 no nível de 5% de significância, concluindo que existe efeito significativo dos meios de cultura sobre o comprimento da parte aérea de explantes de crisântemo; isto indica que os meios de cultura testados possuem efeitos diferentes sobre o comprimento da parte aérea, isto é, existe pelo menos uma combinação linear entre os meios de cultura que difere de zero. Muitos dos programas de computadores que realizam análises de variância, atualmente fornecem o nível de significância do valor de F calculado, conhecido como valor p (no caso, é igual a p = 0,0086).
O erro-padrão da média de tratamento é 
, e o erro-padrão da diferença entre duas médias é 
.
O coeficiente de variação do experimento é 
O qual fornece uma ideia da precisão do experimento; para um experimento de laboratório, pode ser considerado de média precisão.
	E, o coeficiente de precisão experimental também fornece uma idéia melhor da precisão experimental, pois considera em seu cálculo o número de repetições, e pode ser obtido usando o estimador:
4. Exercícios
 Um experimento foi conduzido no delineamento inteiramente casualizado, com três repetições, para avaliar o teor de óleo essencial extraído de folhas de erva-cidreira submetidas à secagem com diferentes temperaturas do ar.
	Os tratamentos (tipos de secagem) e os valores observados do teor de geranial, em %, foram:
	Tratamentos
(tipos de secagem)
	Repetição
	Soma
	Média
	Variância
	
	1
	2
	3
	
	
	
	A = Matéria fresca
	44,3
	41,1
	45,1
	 130,5(3)
	43,5
	4,48
	B = Matéria seca Temp ambiente
	51,0
	46,4
	53,2
	150,6
	50,2
	12,04
	C = Matéria seca a 40ºC
	51,4
	49,9
	54,7
	156,0
	52,0
	6,03
	D = matéria seca á 60ºC
	49,7
	48,8
	45,5
	144,0
	48,0
	4,89
	Soma
	
	
	
	 581,1(12)
	48,3
	27,44
a) Fazer a análise da variância completa detalhando todos os passos de realização dos cálculos.
xxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
� PAGE \* MERGEFORMAT �26�
_1523680476.unknown
_1567404192.unknown
_1567495963.unknown
_1567496097.unknown
_1567496137.unknown
_1567497119.unknown
_1567497124.unknown
_1567496177.unknown
_1567496123.unknown
_1567496025.unknown
_1567496067.unknown
_1567495986.unknown
_1567495875.unknown
_1567495930.unknown
_1567495939.unknown
_1567495918.unknown
_1567404254.unknown
_1567495859.unknown
_1567405022.unknown
_1567404235.unknown
_1523680480.unknown
_1523680486.unknown
_1567404082.unknown
_1567404164.unknown
_1523680488.unknown
_1567404056.unknown
_1523680487.unknown
_1523680482.unknown
_1523680483.unknown
_1523680481.unknown
_1523680478.unknown
_1523680479.unknown
_1523680477.unknown
_1007915576.unknown
_1523680472.unknown
_1523680474.unknown
_1523680475.unknown
_1523680473.unknown
_1014654428.unknown
_1014654482.unknown
_1007915901.unknown
_1007915946.unknown
_1007915785.unknown
_987524363.unknown
_987524373.unknown
_987524378.unknown
_987524380.unknown
_987524394.unknown
_987524379.unknown
_987524377.unknown
_987524369.unknown
_987524372.unknown
_987524364.unknown
_987524358.unknown
_987524361.unknown
_987524357.unknown

Outros materiais