Buscar

APOSTILA DE ESTATÍSTICA EXPERIMENTAL UFRRJ PROF JANGARELLI

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 73 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO 
INSTITUTO DE CIÊNCIAS EXATAS 
Departamento de Matemática 
Área Estatística 
 
 
 
 
 
 
IC 283 – BIOESTATÍSTICA 
IC 284 – ESTATÍSTICA EXPERIMENTAL 
 
 
 
 
 
 
 
Marcelo Jangarelli 
Prof. Adjunto – DEMAT/ICE/UFRRJ 
 
 
 
 
 
Seropédica – Rio de Janeiro 
Outubro – 2013 
 
 
 
UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO 
INSTITUTO DE CIÊNCIAS EXATAS 
Departamento de Matemática 
Área Estatística 
 
 
 
 
 
 
IC 283 – BIOESTATÍSTICA 
IC 284 – ESTATÍSTICA EXPERIMENTAL 
 
 
 
 
Esta apostila constitui o material básico das disciplinas IC 283 – Bioestatística e IC 
284 – Estatística Experimental. Em todas as aulas serão feitas complementações 
suplementares com o objetivo de atualizar, acrescentar novas informações relevantes ainda 
não implementadas e facilitar o entendimento do material apresentado. 
 
 
Marcelo Jangarelli 
Prof. Adjunto – DEMAT/ICE/UFRRJ 
 
 
 
 
Seropédica – Rio de Janeiro 
Outubro – 2013 
 
Sumário 
 
 
 
I Distribuição Amostral e Intervalo de Confiança 01 
II Testes de Hipóteses 05 
III Princípios Básicos da Experimentação 16 
IV Delineamentos Experimentais e Teste de Comparação de Médias * 20 
V Experimentos Fatoriais 37 
VI Regressão Linear 42 
VII Listas de Exercícios 47 
VIII Gabarito 62 
 Referências 65 
 Apêndice 66 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
*
 O tópico “Delineamento em Quadrado Latino” presente no CONTEÚDO IV apenas será 
abordado na Disciplina IC 284 – Estatística Experimental. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 1 
 
CONTEÚDO I 
 
DISTRIBUIÇÃO AMOSTRAL E INTERVALO DE CONFIANÇA 
 
1 – INTRODUÇÃO 
 
 Ao retirarmos uma amostra aleatória de uma população e calcularmos a partir desta 
amostra qualquer quantidade (medidas descritivas numéricas), encontramos a estatística, ou 
seja, chamaremos os valores calculados em função dos elementos da amostra de estatísticas. 
 As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, 
com uma média, uma variância, etc. A Distribuição de Probabilidade de uma estatística é 
denominada de Distribuição Amostral. 
 A Inferência Estatística tem por objetivo fazer generalização sobre uma população 
com base em dados de uma amostra (Estatísticas). As populações são caracterizadas por 
medidas descritivas numéricas, chamadas de parâmetros. Muitas pesquisas tem por objetivo 
fazer inferência a respeito de um ou mais parâmetros da população. Essa inferência pode ser 
por meio de um único valor numérico (Estimação por Ponto), por uma amplitude de valores 
numéricos (Estimação por Intervalo) ou pelo simples “sim” ou “não” (Teste de Hipótese). 
 Como exemplo, considere uma nova marca de inseticida lançada no mercado. A 
pesquisa pode ter diversos interesses: i) saber qual dose de inseticida mata 90% dos insetos 
(estimação por ponto); ii) desejar um intervalo da dose com coeficiente 1 – α de confiança 
para que se tenha a mortalidade de 90% dos insetos (estimação por intervalo); iii) ou ainda o 
interesse poderia focar se o inseticida novo é melhor do que os já existentes no mercado 
(testes de hipóteses). 
 A estimação por ponto utiliza a informação da amostra para chegar a um único valor 
numérico ou ponto, que estima o parâmetro de interesse (parâmetro populacional). Ex: Média, 
Variância, Coeficiente de Variação, etc. 
 A estimação por intervalo utiliza a informação da amostra para chegar a dois números, 
entre os quais pretende-se que esteja o parâmetro de interesse. Caso esse intervalo esteja 
associado a uma probabilidade “1 – α”, tem-se um intervalo de confiança com coeficiente de 
confiança de 1 – α. 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 2 
 
2 – DEFINIÇÕES 
 
• População: é o conjunto de todos os elementos sobre os quais desejamos desenvolver 
determinado estudo; 
• Amostra: é uma parte desses elementos, ou seja, qualquer subconjunto da população; 
• Parâmetro: é uma medida utilizada para descrever uma característica da população; 
• Estatística: é uma característica da amostra, ou seja, uma estatística T é uma função 
de X1, X2, X3, ..., Xn → T = f (X1, X2, X3, ..., Xn); 
• Estimador: é qualquer estatística T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma 
quantia desconhecida. Em geral, ele é representado por uma determinada fórmula; 
• Estimativa: é o valor numérico assumido pelo estimador quando os valores 
observados (X1, X2, X3, ..., Xn) são considerados. 
 
3 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 
 
 A distribuição amostral de determinada estatística é a distribuição de todos os 
possíveis valores que ela pode assumir, calculados a partir de todas as possíveis amostras de 
mesmo tamanho. 
 Para determinado tamanho “n” da amostra, tomada de uma população com média “µ”, 
o valor da média amostral ( X ) irá variar de uma amostra para outra. A distribuição amostral 
da média é descrita para determinar o valor esperado [E( X )] e o desvio padrão [σ( X )] da 
distribuição das médias. Uma vez que este desvio padrão indica a acurácia da média da 
amostra como um estimador por ponto, σ( X ) é usualmente chamado de erro padrão da 
média. Em geral, o valor esperado e o erro padrão da média são definidos como: 
E( X ) = µ 
 
σ( X ) = 
n
σ
 
 
Se o desvio padrão da população (σ) for desconhecido o erro padrão da média pode ser 
estimado por meio do desvio padrão amostral (s). 
s( X ) = 
n
s
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 3 
 
4 – INTERVALO DE CONFIANÇA (IC) 
 
 A estimação por ponto é bastante útil, embora não indique nenhuma acurácia ou 
precisão associada a ela. Assim, ao invés de inferirmos sobre um único valor referente ao 
parâmetro populacional, podemos inferir se o verdadeiro parâmetro está contido em um 
determinado intervalo compreendido entre dois valores, que representam os extremos do 
intervalo (LSuperior e LInferior). 
 O objetivo da estimação por intervalo é gerar intervalos pequenos que incluam o 
verdadeiro parâmetro populacional com alta probabilidade. 
 Os extremos do intervalo podem variar aleatoriamente de uma amostra para outra, pois 
estão em função das médias amostrais (estimativas). 
O comprimento do intervalo pode ser obtido pela diferença entre os limites superior e 
inferior (LSup. – LInf.). 
 
4.1 IC para a média (µ) de uma população normal com σ2 conhecida 
 
P 





+≤≤−
n
ZX
n
ZX σµσ αα
22
 = 1 – α 
IC (µ)
 1 – α: X ± 
n
Z σα
2
 
 Note que, o comprimento do IC também pode ser obtido pela expressão: 
2.
n
Z σα
2
 
Caso seja mantido os valores de “n”, “σ” e “α” o seu comprimento será fixo/constante. 
Já a estimativa da média ( X ) continua sendo uma variável aleatória, determinando os 
extremos do intervalo de acordo com a amostra considerada. 
 A interpretação do IC pode ser assim mencionada: Tem-se 1 – α (%) de confiança de 
que o parâmetro populacional (µ) esteja compreendido no intervalo obtido. Ou mesmo, se 
construirmos n intervalos do mesmo tipo (tamanho e nível de confiança), espera-se que em 1 
– α (%) deles contenha o verdadeiro parâmetro (µ). 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 4 
 
4.2 IC para a média (µ) de uma população normal com σ2 desconhecida 
 
 Se a variância populacional (σ2) não for conhecida, podemos substituir o σ( X ) por 
s( X ), em que o desvio padrãoamostral (s) é a raiz quadrada da variância amostral (s2). 
A pressuposição da distribuição normal é garantida para amostras grandes (n ≥ 30), ou 
mesmo amostras menores, desde que sua população seja normalmente distribuída e o σ 
conhecido. Para amostras pequenas em que não se pode afirmar sobre sua normalidade, a 
distribuição normal (Z) deve ser substituída pela distribuição t de Student. 
IC (µ)
 1 – α: X ± 
n
s
t
2
α … ..)1(
2
lgnt −α 
 
 
 
 
EXERCÍCIOS PROPOSTOS 
 
1 – Uma Variável Aleatória X tem distribuição normal, com média 100 e desvio padrão 10. 
a) Qual a P (90 < X < 110)? 
b) Se X é a média de uma amostra de 25 elementos, calcular P (95 < X < 105); 
c) Qual tamanho deveria ter a amostra para que P (90 < X < 110) fosse obtido a 95% de 
confiança? 
 
 
2 – Seja X a duração da vida de uma peça de equipamento tal que σ = 5 horas. Admita que 
100 peças foram ensaiadas fornecendo uma duração de vida média de X = 500 horas. 
a) Obter um intervalo de 95% para a média µ; 
b) Qual o tamanho da amostra para o intervalo obtido? “IC (µ)95%: 500 ± 1,63” 
c) Com a amostra de 100 peças foi obtido o intervalo 500 ± 0,765. Determinar a 
confiança (%) utilizada para obter este intervalo; 
 
 
3 – Em uma amostra aleatória de 25 crianças de uma determinada comunidade encontrou-se 
altura média 150 cm e desvio padrão 5 cm. Admitindo que a distribuição das alturas das 
crianças é normal, determine: 
a) Um intervalo de 95% de confiança para a altura média da população; 
b) O comprimento do intervalo obtido na letra “a”. 
 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 5 
 
CONTEÚDO II 
 
TESTES DE HIPÓTESES 
 
1 – INTRODUÇÃO 
 
 As duas principais áreas de inferência estatística são: estimação de parâmetros 
populacionais e testes de hipóteses. 
 O objetivo dos testes de hipóteses é desenvolver métodos gerais para testar hipóteses, 
aplicando tais metodologias a alguns problemas comuns. Em geral, é feita uma determinada 
afirmação sobre uma população, usualmente sobre um parâmetro desta, e desejamos saber se 
os resultados de uma amostra contrariam ou não tal afirmação. 
 Desta forma, a finalidade do teste estatístico de hipótese é fornecer ferramentas que 
nos permitam validar ou rejeitar uma hipótese através dos resultados amostrais. 
 
2 – DEFINIÇÕES 
 
Parâmetro → é uma função de valores populacionais. Em geral, representa um valor 
desconhecido associado à população; 
Estimador → O estimador de um parâmetro é qualquer função das observações 
amostrais (X1, X2, ..., Xn). Ele representa uma determinada fórmula de cálculo, fornecendo 
valores diferentes conforme a amostra selecionada; 
Estimativa → É o valor numérico assumido pelo estimador quando os valores 
amostrais (X1, X2, ..., Xn) são considerados. 
 
3 – TESTES DE HIPÓTESES 
 
 É uma regra decisória que nos permite aceitar ou rejeitar uma hipótese estatística com 
base nos elementos de uma amostra. Estas hipóteses são, em geral, sobre parâmetros 
populacionais ou relacionadas à natureza da distribuição da população. 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 6 
 
3.1 Hipótese Estatística 
 
 É uma suposição referente ao valor de um parâmetro populacional que será verificada 
por um teste paramétrico, ou mesmo uma afirmação quanto à natureza da população que pode 
ser verificada por meio de um teste de aderência. 
 Exemplos de hipóteses estatísticas: 
1. A média populacional da altura dos brasileiros é de 1,66 metros, isto é, µ = 1,66; 
2. A proporção de brasileiros com determinada doença é de 40%, ou seja, p = 0,40; 
3. A distribuição dos pesos dos alunos da UFRRJ é normal, ou seja, X ~ N (µ;σ2); 
 
Hipóteses a serem formuladas: 
 
3.1.1 Hipótese de Nulidade (H0) 
 
 É a hipótese a ser testada, também chamada de hipótese básica ou nula. Os testes são 
construídos sobre a pressuposição de que H0 seja verdadeiro. 
 O teste de hipótese consiste em verificar se determinado valor estimado, a partir de 
uma amostra representativa da população, difere significativamente do resultado esperado sob 
H0. 
Exemplos: 
1. Um pesquisador informa que a produtividade média de uma cultura é de 500 kg/ha; 
H0: µ = 500; 
2. Duas marcas de rações (I e II) para leitões em fase de crescimento propiciam em 
média o mesmo ganho de peso. H0: µ1 = µ2. 
 
Para os dois exemplos, o raciocínio é que enquanto não houver evidências amostrais 
sugerindo que tais informações não sejam verdadeiras, elas são tomadas como verídicas 
(verdadeiras). 
 
3.1.2 Hipótese Alternativa (H1) 
 
 É a hipótese que contraria H0, formulada com base no conhecimento prévio do 
problema, informações de pesquisas/científicas, entre outras indagações. Considerando os 
exemplos anteriores: 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 7 
 
1. H1: µ > 500 ou µ < 500 ou µ ≠ 500; 
2. H1: µ1 > µ2 ou µ1 < µ2 ou µ1 ≠ µ2. 
 
No teste de hipótese, a rejeição de H0 implicará na aceitação automática de H1. Isso se 
deve ao fato dessas hipóteses serem contrastantes e mutuamente excludentes, 
impossibilitando que sejam simultaneamente verdadeiras. 
Denomina-se teste de significância àquele utilizado para se testar tais hipóteses. 
 
3.2 Região Crítica (RC) 
 
 É a faixa de valores da estatística do teste que nos leva a rejeição da hipótese H0, ou 
seja, a RC para um teste de hipótese é a que nos leva a rejeição de H0. É válido ressaltar que o 
teste estatístico é construído na suposição de que H0 é verdadeiro. 
 Caso o valor observado da estatística do teste (F, t, 2χ , etc.) pertença à região crítica, 
rejeitamos H0, caso contrário, não rejeitamos ou aceitamos H0. 
 
3.3 Tipos de Erros 
 
 Para qualquer decisão que tomarmos, a partir de uma amostra da população, estaremos 
sujeitos a erros, pois trabalhamos com amostras e não com a população como um todo. 
 
3.3.1 Erro tipo I ou erro α 
 
 O erro tipo I é caracterizado pelo fato de rejeitarmos H0 sendo H0 verdadeiro. Sua 
probabilidade é representada por “α”, sendo denominada nível de significância do teste. Logo, 
α = P (erro tipo I) = P (rejeitar H0/ H0 é verdadeiro). 
 
3.3.2 Erro tipo II ou erro β 
 
 O erro tipo II é caracterizado pelo fato de não rejeitarmos H0 sendo H0 falso. A 
probabilidade de cometermos este tipo de erro é indicada por β. Logo, β = P (erro tipo II) = P 
(não rejeitar H0/ H0 é falso). 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 8 
 
A tabela a seguir apresenta as probabilidades de cometermos os erros do tipo I e do 
tipo II. 
Decisão \ Realidade H0 é verdadeiro H0 é falso 
Rejeitar H0 α 1 – β 
Não rejeitar H0 1 – α β 
 
 
3.4 Tipos de Testes 
 
3.4.1 Teste Unilateral à Direita 
 
A partir de uma valor C (ponto crítico), rejeita-se H0 se X ≥ C. 
H0: µ = K 
H1: µ > K 
 
3.4.2 Teste Unilateral à Esquerda 
 
 A partir de uma valor C (ponto crítico), rejeita-se H0 se X ≤ C. 
H0: µ = K 
H1: µ < K 
 
3.4.3 Teste Bilateral 
 
 Rejeita-se H0 se X ≤ C1 ou X ≥ C2. 
H0: µ = K 
H1: µ ≠ K 
 
3.5 Etapas para construção de um Teste de Hipótese 
 
1. Enunciar a hipótese nula (H0) e a hipótese alternativa (H1); 
2. Especificar o nível de significância (erro I ou α) a ser utilizado, selecionando a 
estatística do teste; 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 9 
 
3. Estabelecer o valor crítico (C) ou os valores críticos (C1 e C2) da estatísticado teste 
em função do nível α e das tabelas estatísticas apropriadas; 
4. Determinar o valor real da estatística do teste por meio dos elementos amostrais; 
5. Tomar a decisão pela não rejeição ou rejeição de H0 (conclusão) pela comparação do 
valor obtido na 4ª etapa com o valor crítico (ou valores críticos) fixado (s) pela 
estatística do teste na 3ª etapa. 
 
4 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA UMA MÉDIA DA 
POPULAÇÃO COM DESVIO PADRÃO POPULACIONAL (σ) DESCONHECIDO 
(Teste t) 
 
 Para testar hipóteses referentes à média de uma população, cujo desvio padrão 
populacional (σ) é desconhecido, utiliza-se a estatística “t” (Teste t), definida por: 
 
n
s
X
s
X
t
X
calc
µµ −
=
−
=
)(
.
, 
 
que tem Distribuição de Student com n – 1 graus de liberdade (g.l.). 
 
 Hipóteses: 
 
 H0: µ = K 
H1: µ > K ou 
 µ < K ou 
 µ ≠ K 
 
 Valor crítico da distribuição t: 
ttab. = f [α; (n – 1)g.l.] 
 
Tomada de decisão (conclusão): 
• Se 
.calct ≥ ttab: Rejeita-se H0; 
• Se 
.calct < ttab: Não Rejeita-se H0 ou Aceita-se H0. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 10 
 
 
OBS: A tabela da distribuição t de Student a ser utilizada em nossas aulas é bilateral. Assim, 
se o teste efetuado for bilateral, entra exatamente com o α na tabela. Caso contrário, o teste 
realizado seja unilateral, deve-se entrar com 2α na tabela. 
 
5 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA COMPARAR MÉDIAS DE 
DUAS AMOSTRAS INDEPENDENTES DE POPULAÇÕES NORMAIS COM 
VARIÂNCIAS DESCONHECIDAS (Teste t) 
 
 Muitos problemas aparecem quando se deseja testar hipóteses sobre médias de 
populações. Por exemplo, um pesquisador pode ter interesse em investigar um novo tipo de 
adubo, comparando a produtividade de determinada cultura em dois períodos simultâneos, um 
referente à utilização do adubo antigo e outro referente à utilização do adubo novo. 
 Quando as variâncias das populações são substituídas pelas variâncias das amostras, 
isto é, σ2 por s2, o teste recomendado é o Teste t. A execução do teste fica na dependência se 
as variâncias das populações são ou não iguais entre si, tendo assim dois casos a serem 
considerados. 
 Seja X a medida de certo atributo dos elementos de uma população A, e Y a medida 
do mesmo atributo dos elementos de uma população B. Sejam X e Y normalmente 
distribuídas com variâncias desconhecidas. 
 Considere as hipóteses: 
H0: µA = µB 
H1: µA > µB ou 
 µA < µB ou 
 µA ≠ µB 
 
 Inicialmente deve-se efetuar um Teste Preliminar com o objetivo de comparar as 
variâncias das duas populações, ou seja, aplicamos o Teste F. 
A Distribuição F (Teste F) testa a diferença entre duas variâncias de populações 
normais. Considere duas amostras, casuais e independentes, de tamanho nx e ny, 
respectivamente. 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 11 
 
Sejam as hipóteses: 
H0’: 2xσ = 
2
yσ 
 H1’: 2xσ > 
2
yσ ou 
 
2
xσ < 
2
yσ ou 
 
2
xσ ≠ 
2
yσ 
 Para testar H0, utiliza-se a estatística “F” (Teste F), definida por: 
2
2
.
y
x
Calc
s
s
F = , 
que tem Distribuição de Fisher com (nx – 1) e (ny – 1) graus de liberdade. 
 
OBS: Para simplificar o uso da tabela utilizaremos à expressão: 
1
var
var
..
>→
<
>
= Calccalc Fiância
iânciaF 
 Assim, a hipótese alternativa corresponderá a um teste unilateral à direita. 
H0’: 2xσ = 
2
yσ 
H1’: 2xσ > 
2
yσ 
 O valor crítico da distribuição F será estabelecido de acordo com o nível de 
significância (α) e o número de graus de liberdade. 
Ftab = f (α; n1 ; n2) 
n1 = número de g.l. do numerador 
n2 = número de g.l. do denominador 
 Tomada de decisão (conclusão): 
• Se Fcalc. ≥ Ftab: Rejeita-se H0’; 
• Se Fcalc. < Ftab: Não Rejeita-se H0’ ou Aceita-se H0’. 
 
Ao testarmos as hipóteses do Teste F teremos dois casos a considerar: 
 
 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 12 
 
5.1 Caso 1 ou Caso A 
 
 Quando H0’ não for rejeitada. Admitimos que as variâncias sejam iguais, cujos valores 
assumidos por 2As e 
2
Bs são estimativas de um mesmo valor σ
2
. Devemos combinar essas 
variâncias ( 2As e 2Bs ), estimando-se uma variância comum ( 2Cs ). 
2
As = 
2).1(
1 AAAA
A snSQD
n
SQD
−=→
−
 
2
Bs = 
2).1(
1 BBBB
B snSQD
n
SQD
−=→
−
 
2
Cs = 22
).1().1( 22
−+
+
=
−+
−+−
BA
BA
BA
BBAA
nn
SQDSQD
nn
snsn
 
 A seguir, testa-se H0 utilizando-se a distribuição t de Student (Teste t), definida por: 






+
−
=
BA
C
calc
nn
s
YX
t
112
.
 
 
ttab. = f (α ; nA + nB – 2 g.l.) 
 
Tomada de decisão (conclusão): 
• Se 
.calct ≥ ttab: Rejeita-se H0; 
• Se 
.calct < ttab: Não Rejeita-se H0 ou Aceita-se H0. 
 
5.2 Caso 2 ou Caso B 
 
 Quando H0’ for rejeitada. Admitimos que as variâncias sejam diferentes, não devendo 
assim estimar uma variância comum. Neste caso, utilizaremos para o nosso teste, os valores 
assumidos por 2As e 
2
Bs . 
 Neste caso, a estatística t de Student (Teste t) fica definida: 
B
B
A
A
calc
n
s
n
s
YX
t
22.
+
−
= , 
que segue distribuição “t” com n* graus de liberdade, em que n* é dado por: 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 13 
 
11
2222
222
*
−






+
−












+
=
B
B
B
A
A
A
B
B
A
A
n
n
s
n
n
s
n
s
n
s
n 
 
ttab. = f (α ; n* g.l.) 
 
OBS: Adotar como g.l. o maior valor inteiro desde que não supere o valor calculado. 
 
Tomada de decisão (conclusão): 
• Se 
.calct ≥ ttab: Rejeita-se H0; 
• Se 
.calct < ttab: Não Rejeita-se H0 ou Aceita-se H0. 
 
6 – DISTRIBUIÇÃO “t” DE STUDENT E O TESTE PARA COMPARAR A 
DIFERENÇA ENTRE AS MÉDIAS DE DUAS AMOSTRAS DEPENDENTES (DADOS 
PAREADOS/EMPARELHAD0S) (Teste t) 
 
 Os procedimentos do item seis (6) são baseados na hipótese de que as duas amostras 
foram coletadas independentemente uma da outra. Contudo, em muitas situações as amostras 
são coletadas como pares de valores, tal como medidas sobre o mesmo indivíduo antes e 
depois da aplicação de algum medicamento; sobre um mesmo animal antes e depois do 
fornecimento de uma suplementação alimentar; ou também sobre uma mesma planta antes e 
depois de administrar um determinado fertilizante. Referimo-nos a isto como 
observações/dados emparelhados ou pareados. Contrastando com amostras independentes, 
duas amostras que contém observações emparelhadas são chamadas de amostras dependentes. 
 Para observações emparelhadas, o teste apropriado para a diferença entre as médias 
das duas amostras consiste em determinar primeiro a diferença “d” entre cada par de valores, 
e então testar a hipótese nula de que a média das diferenças na população é zero (ou igual a 
determinado valor ∆). Logo, do ponto de vista de cálculo, o teste é aplicado a uma única 
amostra de n diferenças di. 
 A média e o desvio padrão da amostra de valores di são obtidos pelas fórmulas básicas 
de estatística, substituindo os valores Xi por di. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 14 
 
n
d
d
n
i
i∑
=
=
1
 e 
1
1
212
−






−
=
∑
∑
=
=
n
n
d
d
s
n
i
n
i
i
i
d 
 
 O erro padrão da diferença média entre as observações emparelhadas é obtido por: 
n
s
s dd = 
 Sejam as hipótese: 
H0: D = 0 
H1: D > 0 ou 
 D < 0 ou 
 
D
 ≠ 0 
 Para testar H0, utiliza-se a estatística “t” de Student, definida por: 
d
i
calc
s
Dd
t
−
=
.
 
 Sob H0 D = 0: 
n
s
d
n
s
d
t
d
i
d
i
calc =
−
=
0
.
, 
que tem distribuição “t” de Student, cujo grau de liberdade representa o número de pares 
observados menos um, ou seja, (n – 1) graus de liberdade (g.l.). 
ttab. = f [α; (n – 1)g.l.] 
 
Tomada de decisão (conclusão): 
• Se 
.calct ≥ ttab: Rejeita-se H0; 
• Se 
.calct < ttab: Não Rejeita-se H0 ou Aceita-se H0. 
 
 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 15 
 
EXERCÍCIOS PROPOSTOS 
 
1 – Um fertilizante foi aplicado a uma variedade de tomate. As produções, em kg, de dez pés 
de tomate foram: 1,6; 1,7; 1,8; 1,4; 1,5; 1,9; 2,3; 2,1; 1,9 e 1,7 Kg. Verificar se o fertilizante 
proporciona uma produção superior a 1,5 kg por pé de tomate. Adotar α = 5%. 
 
 
2 – Em indivíduos sadios o consumo renal de oxigênio (O2) distribui-se normalmente com 
média de 12 cm3/minuto. Deseja investigar, com base em cinco indivíduos portadores de certa 
doença, se esta tem influência no consumo renal médio de O2. Os consumos medidos para os 
cinco pacientes foram: 14,4; 12,9; 15,0; 13,7 e 13,5 cm3/minuto. Qual a conclusão ao nível de 
1% de significância? 
 
 
3 – Os dados a seguir referem-se a um experimento de competição de duas progênies de 
Eucalyptus saligna. Cada progênie foi cultivada em solos com características semelhantes e a 
avaliação das plantas foi feita pela média dos diâmetros à altura do peito (DAP) de cada 
parcela. Foram utilizadas dez parcelas para cada progênie. Avaliar as progênies (A e B) com 
relação à característica mensurada. (α = 5%) 
 Progênie A Progênie B 
Média – DAP (cm) 15,4 13,5 
Variância – DAP (cm2) 2,5 3,0 
Número de Parcelas 10 10 
 
 
 
 
4 – Desejando saber se duas rações A e B, para determinada raça de suínos, são equivalentes 
ou se a ração A é superior a ração B em relação ao ganho de peso, há 11 animais sorteados ao 
acaso foi dado a ração A e a outros 19 a ração B. Os resultados, em kg, foram: 
AX = 66 kg e 2As = 40 kg
2
 
BX = 63 kg e 2Bs = 16 kg
2
 
 A que conclusão chegar se adotarmos o nível de significância de 5%? 
 
 
5 – A Tabela abaixo apresenta dados da pressão sanguínea sistólica de dez mulheres, na faixa 
etária de 30 a 35 anos, que fizeram uso de anovulatório por determinado período e depois não 
o fez, e vice e versa. Teste a hipótese de que o uso de anovulatório não tem efeito sobre a 
pressão sanguínea sistólica. (α = 5%) 
Anovulatório Mulheres (30 – 35 anos) 
Sim 111 119 121 113 116 126 128 123 122 121 
Não 109 113 120 117 108 120 122 124 115 112 
 
 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 16 
 
CONTEÚDO III 
 
PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO 
 
1 – INTRODUÇÃO 
 
 Grande parte do conhecimento que a humanidade acumulou ao longo dos séculos foi 
adquirido através da experimentação. A ideia de experimentar não se limita a antiguidade, 
pois também está presente no nosso dia a dia. Todos nós já aprendemos alguma coisa ao 
longo da vida experimentando. Entretanto, a experimentação só se difundiu como técnica 
sistemática de pesquisa há pouco mais de um século, quando foi formalizada através da 
estatística (Vieira, 2006). 
Entende-se por experimento uma experiência realizada sob condições previamente 
estabelecidas e que opera com causas controladas. O propósito da estatística experimental é 
analisar, objetivamente, os dados experimentais, isolando as causas da variação do acaso, 
próprias de qualquer conjunto de dados observados (Dias & Barros, 2009). 
 A experimentação tem por objetivo o estudo dos experimentos, ou seja, seu 
planejamento, execução, análise dos dados e interpretação dos resultados. 
 
2 – CONCEITOS 
 
a) Experimento ou Ensaio: é um trabalho previamente planejado seguindo 
determinados princípios básicos. Nele se faz a comparação dos efeitos dos 
tratamentos; 
b) Tratamento: é o método, elemento ou material cujo efeito desejamos medir ou 
comparar em um experimento; 
c) Unidade Experimental: é a unidade que vai receber o tratamento e fornecer os dados 
que deverão refletir o seu efeito; 
d) Variável Resposta: é a variável (característica) mensurada no experimento utilizada 
para avaliar o efeito do (s) tratamento (s); 
e) Delineamento Experimental: é o plano utilizado na experimentação. Implica na 
forma como os tratamentos serão designados às unidades experimentais e em um 
amplo entendimento das análises a serem feitas quando todos os dados estiverem 
disponíveis. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 17 
 
A pesquisa científica está constantemente se utilizando de experimentos para avaliar e 
validar suas hipóteses. Apesar dos experimentos variarem de uma pesquisa para outra, todos 
eles são regidos por alguns princípios básicos, necessários para que as conclusões que venham 
a ser obtidas se tornem válidas. 
 
3 – PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO 
 
 São três os princípios básicos da experimentação: Repetição, Casualização e Controle 
Local. 
 
3.1 Repetição 
 
 O princípio da repetição consiste na reprodução do experimento básico e tem por 
finalidade propiciar a obtenção da estimativa do erro experimental. A repetição consiste em 
aplicar determinado tratamento em várias parcelas em um mesmo experimento. 
 Quanto maior o número de repetições, maior será a precisão do experimento. Contudo, 
esta relação é válida até determinado número de repetições, a partir do qual o incremento na 
precisão não é significativo. 
 O número de repetições é dependente do conhecimento que o pesquisador tem sobre o 
assunto e do conjunto de condições em que será realizado o experimento. O número de 
tratamentos, o nível de precisão desejado, o tipo de unidade experimental a ser 
estudada/utilizada e o custo da realização do experimento são alguns exemplos de fatores 
limitantes ao número de repetições. 
 O número de repetições necessárias pode ser calculado através de fórmulas. A 
aplicação de tais fórmulas exige, no entanto, que o pesquisador tenha informações estatísticas 
de experimentos anteriores. 
 Quanto menor a diferença a ser comparada entre os tratamentos, maior deverá ser o 
número de repetições para cada tratamento. Aumentando o número de repetições, menores 
diferenças entre os tratamentos podem atingir a significância estatística, isto é, há um 
aumento da precisão do experimento. 
 De acordo com Gomes (2009), os experimentos devem ter pelo menos 20 unidades 
experimentais (parcelas) e 10 graus de liberdade para o erro experimental ou resíduo. 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 18 
 
3.2 Casualização 
 
 O princípio da casualização tem por finalidade propiciar, a todos os tratamentos, a 
mesma probabilidade de serem designados a qualquer uma das unidades experimentais. Desta 
forma, seu objetivo é evitar que determinado tratamento venha a ser sistematicamente 
favorecido ou desfavorecido por fatores externos nas diversas parcelas. Isto significa que a 
distribuição dos tratamentos nas unidades experimentais deve ser feita ao acaso, através de 
um mecanismoqualquer de sorteio. 
 O princípio da casualização se faz necessário para que as variações que contribuem 
para o erro experimental sejam convertidas em variáveis aleatórias. Além disso, a 
casualização permite obter uma estimativa válida do erro experimental, além de garantir o uso 
de testes de significância por tornar os erros experimentais independentes. 
 É digno de nota ressaltar que sem os princípios básicos da repetição e da casualização 
não existe experimentação. 
 
3.3 Controle Local 
 
 A finalidade do controle local é dividir um ambiente heterogêneo em sub-ambientes 
homogêneos, tornando o experimento mais eficiente pela redução do erro experimental. O 
controle local isola fontes de variação que podem ser controladas e que normalmente seriam 
incluídas no resíduo, o que acarreta a redução do erro. 
 O material experimental é dividido em porções homogêneas ou blocos, cada um dos 
quais contendo todos os tratamentos. A formação dos blocos corresponde a uma 
estratificação. A casualização dos tratamentos às unidades experimentais sofre a restrição de 
ser dentro de cada bloco. 
 Entre os blocos poderá existir grande variabilidade. Entretanto, dentro de cada bloco a 
uniformidade/homogeneidade deve ser máxima. 
 
4 – FONTES DE VARIAÇÃO DE UM EXPERIMENTO 
 
4.1 Premeditada 
 
 É a variação introduzida pelo pesquisador com a finalidade de fazer comparações. 
Exemplo: os tratamentos. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 19 
 
4.2 Sistemática 
 
 Variação não intencional, porém de natureza conhecida. São variações inerentes ao 
material experimental, que podem ser controladas pelo pesquisador. Exemplo: 
heterogeneidade do solo, tamanho de semente, idade dos animais, etc. 
 
4.3 Aleatória 
 
 São variações de origem desconhecida, que não podem ser controladas. Constituem o 
erro experimental propriamente dito. São resultantes de duas fontes: variações do material 
experimental e falta de uniformidade nas condições experimentais. 
 Ressalta-se que nem sempre é possível distinguir claramente esse tipo de variação da 
variação sistemática. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 20 
 
CONTEÚDO IV 
 
DELINEAMENTOS EXPERIMENTAIS E TESTE DE COMPARAÇÃO DE MÉDIAS 
 
1 – DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) 
 
 É o tipo de delineamento mais simples que existe, representando o delineamento 
básico. Os demais delineamentos se originam dele, pela imposição de restrições (ex. controle 
local). A distribuição dos tratamentos às unidades experimentais é feita completamente ao 
acaso, ou seja, sem nenhuma restrição na casualização. 
 O DIC envolve dois princípios básicos da experimentação: repetição e casualização. 
Ele é indicado quando as condições experimentais são homogêneas, sendo mais recomendado 
em experimentos de laboratório e casas de vegetação, em que as condições ambientais podem 
ser melhor controladas. 
 Para a instalação deste delineamento no campo deve-se ter certeza quanto à 
homogeneidade das condições ambientais e do material experimental. 
 
1.1 Vantagens e Desvantagens do DIC 
 
1.1.1 Vantagens 
 
� Pode-se utilizar qualquer número de tratamento e repetições, sendo que o número de 
repetições pode variar de um tratamento para outro sem ocasionar maiores 
dificuldades na análise estatística. No entanto, sempre que possível, deve-se manter o 
mesmo número de repetições entre os tratamentos; 
 
1.1.2 Desvantagens 
 
� Exige homogeneidade total das condições experimentais; 
� Pode conduzir a uma estimativa da variância residual bastante alta, uma vez que ao 
não utilizar o princípio do controle local todas as variações serão consideradas como 
variação do acaso, exceto as devidas aos tratamentos. 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 21 
 
1.2 Quadro de tabulação dos dados 
 
 A título de exemplo, considere um experimento instalado no DIC com I tratamentos e 
J repetições. A coleta de dados da pesquisa pode ser resumida no quadro a seguir: 
 
 Tratamentos 
Repetições 1 2 ..... I 
1 Y11 Y21 ..... YI1 
2 Y12 Y22 ..... YI2 
..... ..... ..... ..... ..... 
J Y1J Y2J ..... YIJ 
Totais T1 T2 ..... TI 
 
 Deste quadro podem-se retirar algumas informações de interesse: 
 
• Nº de unidades experimentais: N = I x J 
• Total geral: G = ∑∑
=
=
=
=
I
i
i
JI
j
i
ij TY
1
,
1
1
 
• Total para o tratamento i: Ti = ∑
=
J
j
ijY
1
 
• Média para o tratamento i: 
^
im = J
Ti
 
• Média geral do experimento: 
^
m = 
IJ
G
 
 
1.3 Análise de Variância (ANOVA) 
 
 É uma técnica de análise estatística que permite decompor a variação total, ou seja, a 
variação existente entre todas as observações, na variação devido à diferença entre os 
tratamentos e na variação devido ao acaso (erro experimental ou resíduo). Entretanto, para 
que esta técnica seja empregada é necessário que sejam satisfeitas diversas pressuposições, 
entre elas citam-se: 
� Os erros são variáveis aleatórias independentes; 
� A variância é constante (homocedasticidade); 
� A distribuição dos erros é normal ou aproximadamente normal. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 22 
 
Por meio do modelo estatístico pode-se decompor a variação total entre as observações 
em duas partes que a compõem, como será demonstrado a seguir. 
Considere o modelo estatístico para um experimento instalado segundo o DIC: 
Yij = m + ti + eij , 
 
fazendo ti = mi – m, tem-se: 
 
(Yij – m) = (mi – m) + eij , 
 
Substituindo m e mi por seus estimadores, elevando ambos os membros ao quadrado e 
aplicando somatório, tem-se: 
 
∑∑∑
=
=
=
=
=
=
+−=−
JI
j
i
ij
JI
j
i
i
JI
j
i
ij emmmY
,
1
1
22
^,
1
1
^
2
,
1
1
^
)()( 
 
 Escrevendo de forma mais simplificada, a igualdade anterior representa: 
 
SQTotal = SQTratamentos + SQResíduo 
 
 Aplicando as propriedades do somatório em cada termo da soma de quadrados tem-se 
o desenvolvendo de fórmulas mais práticas para encontrar os valores das respectivas somas de 
quadrados. 
 Para a SQTotal tem-se que: 
SQTotal = 2
,
1
1
^
)(∑
=
=
−
JI
j
i
ij mY = IJ
Y
Y
JI
ji
ijJI
j
i
ij
2
,
1,1
,
1
1
2
)( ∑
∑ ==
=
=
− 
 
 Para a SQTratamento: 
SQTrat. = 2
^,
1
1
^
)( mm
JI
j
i
i∑
=
=
− = 
IJ
Y
J
T
JI
ji
ijI
i
i
2
,
1,1
1
2 )( ∑
∑ ==
=
− 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 23 
 
 Esta fórmula é utilizada quando o número de repetições é igual para todos os 
tratamentos. Quando ocorrer variação no número de repetições entre os tratamentos a fórmula 
apropriada é: 
SQTrat. = 
N
Y
J
T
JI
ji
ijI
i
i
2
,
1,1
1
2 )( ∑
∑ ==
=
− , 
em que: 
• N = é o número de unidades experimentais = ∑
=
I
i
ir
1
; 
• ri = é o número de unidades experimentais (repetições) do tratamento i. 
 
A soma de quadrados do resíduo é obtida por diferença: 
 
SQResíduo = SQTotal – SQTratamento 
 
 O quadro da Análise de Variância (ANOVA) para um experimento instalado segundo 
o DIC, com igual número de repetições para todos os tratamentos, é dado a seguir: 
 
FV GL SQ QM F 
Tratamentos (I – 1) SQTrat. 
1−I
SQTratResíduo I(J – 1) SQRes. 
)1(
Re
−JI
sSQ
 
sQM
QMTrat
Re
 
Total IJ – 1 SQTotal - - 
 
 A partir das SQTratamentos e SQResíduo obtêm-se os respectivos quadrados médios, 
por meio do quociente entre a soma de quadrado com o respectivo número de graus de 
liberdade. 
 Para concluir se existe diferença entre os tratamentos calcula-se o valor da estatística 
F, que é obtido pelo quociente do QMTrat. com o QMRes. Este valor, denominado F 
calculado, deve ser comparado com o valor de F tabelado, o qual é obtido na tabela de 
distribuição da variável aleatória F (Fisher), de acordo com o nível de significância do teste, o 
grau de liberdade para tratamento e o grau de liberdade para resíduo. 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 24 
 
 As hipóteses para o Teste F da Análise de Variância são: 
 
• H0: m1 = m2 = ... = mI = m; O que equivale a dizer que todos os possíveis contrastes 
entre as médias dos tratamentos são estatisticamente nulos ao nível “α” de 
probabilidade/significância em que foi realizado o teste; 
• H1: não H0; O que equivale a dizer que existe pelo menos um contraste entre as 
médias dos tratamentos estatisticamente diferente de zero ao nível “α” de 
probabilidade/significância em que foi realizado o teste. 
 
A regra decisória para o Teste F é a seguinte: 
 
• Se o valor do F calculado for maior ou igual ao valor do F tabelado, rejeita-se H0. 
Conclui-se que os tratamentos tem efeitos diferenciados ao nível de significância em 
que foi realizado o teste; 
• Se o valor do F calculado for menor que o valor do F tabelado, não rejeita-se H0. 
Conclui-se que os tratamentos tem efeitos iguais ao nível de significância em que foi 
realizado o teste. 
 
2 – MEDIDAS DE AVALIAÇÃO DA QUALIDADE DOS EXPERIMENTOS 
 
2.1 Coeficiente de Variação (C.V.) 
 
O Coeficiente de Variação permite avaliar a precisão do experimento. Quanto menor o 
C.V., maior será a precisão do experimento. O conhecimento desta precisão auxilia na 
avaliação dos seus resultados. 
O C.V. é calculado da seguinte maneira: 
 
100.
Re
.(%).
^
m
sdQ
VC
µ
= , em que 
N
G
m =
^
 
 
De acordo com Gomes (2009), na experimentação agrícola (experimentos de campo) o 
coeficiente de variação pode ser classificado nas seguintes categorias, com relação a sua 
precisão: 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 25 
 
C.V.(%) Precisão 
< 10% Alta 
10% a 20% Média 
20% a 30% Baixa 
> 30% Muito Baixa 
 
2.2 Coeficiente de Determinação (R2) 
 
Por definição, o Coeficiente de Determinação (R2) é a razão entre a soma de quadrado 
de tratamento e a soma de quadrado total, isto é: 
 
SQTotal
SQTratR .2 = 
 
Portanto, o R2 é uma medida da proporção da variação total explicada pela variação 
devido aos tratamentos. Como o valor de R2 varia entre 0 e 1, pode-se interpretá-lo como uma 
percentagem. 
 Ex: R2 = 0,9215 → 92,15% da variação total está sendo explicada pela variação devido 
aos tratamentos. 
 
3 – TESTE DE COMPARAÇÃO DE MÉDIAS 
 
Os modelos de Análise de Variância são geralmente utilizados para analisar os efeitos 
de um ou mais fatores (variável independente sob estudo) sobre a variável dependente. 
 O Teste F tem seu emprego na Análise de Variância dos delineamentos experimentais. 
Ele é utilizado para comparar variâncias, representando um teste preliminar, cujo resultado 
estabelece se será necessária uma detalhada análise dos efeitos dos níveis do fator em estudo. 
 Se o Teste F leva a conclusão que os efeitos dos níveis do fator são iguais, a 
implicação é que não existe nenhuma relação entre o fator e a variável dependente. Todavia, 
se o Teste F leva a conclusão que nem todos os níveis do fator tem efeitos idênticos, a 
implicação é que existe uma relação entre o fator e a variável dependente. 
 Em experimentos envolvendo dois ou mais tratamentos (ou níveis do fator) é de 
interesse saber onde estão as diferenças no caso em que o Teste F leva a rejeição da hipótese 
de igualdade dos efeitos dos tratamentos. Isso pode ser feito pela comparação direta dos 
tratamentos (ou níveis do fator) utilizando técnicas de estimação. Neste caso, podem-se 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 26 
 
estimar contrastes entre os níveis do fator em estudo e, posteriormente, aplicar um Teste de 
Médias. 
 Existe um grande número de procedimentos para comparações de médias utilizados 
posteriormente à Análise de Variância quando o Teste F for significativo. Os testes de médias 
são utilizados para identificar os níveis do fator (ou tratamentos) que diferem estatisticamente 
entre si. Cada teste está fundamentado em um particular conjunto de suposições que o torna 
efetivo para os propósitos específicos. 
 
3.1 Contraste 
 
O estudo de contraste na estatística experimental é de grande relevância, 
principalmente quando o experimento em análise é composto por dois ou mais tratamentos. O 
uso de contraste possibilita ao pesquisador estabelecer comparações entre tratamentos ou 
grupos de tratamentos que sejam de interesse. Os contrastes assim estabelecidos podem ser 
testados por meio de um teste de comparação de médias, o qual complementa o resultado da 
análise de variância. 
 
3.1.1 Definição de Contraste 
 
Considere a seguinte função linear de médias populacionais de tratamentos: 
 
Y = a1m1 + a2m2 + ... + anmn 
 
A função Y será um contraste entre médias se satisfazer a seguinte condição: 
 
0
1
=∑
=
n
i
ia 
 
3.1.2 Estimador do Contraste 
 
Na prática, geralmente não se conhece os valores das médias populacionais (mi), mas 
sim suas estimativas ( ^ im ). Dessa forma, na estatística experimental não trabalhamos com o 
contraste Y, mas sim com seu estimador Ŷ. Este também representa uma função linear de 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 27 
 
médias obtidas por meio de experimentos ou amostras. Assim, o estimador para o contraste de 
médias é dado por: 
Ŷ = a1
^
1m + a2
^
2m + ... + an
^
nm 
 
3.2 Teste de Tukey 
 
 O teste de Tukey, baseado na amplitude total estudentizada, pode ser utilizado para 
comparar todo e qualquer contraste entre duas médias de tratamentos. Ou seja, para nI 
tratamentos (número de tratamentos ou de níveis do fator em estudo) poderão ser 
estabelecidos nI(nI – 1)/2 contrastes do tipo Yij = mi – mj, para i ≠ j. 
 Este teste baseia-se na diferença mínima significativa (DMS), representada por ∆, dada 
por: 
∆ = q
^^
)(
2
1 YV 
em que: 
� ∆ = é a diferença mínima significativa (DMS); 
� q = é o valor tabelado da amplitude estudentizada, que é obtido pela expressão: 
qα(n1;n2), em que α é o nível de significância; n1 é o número de tratamentos ou níveis 
do fator e n2 representa o número de graus de liberdade do resíduo na Análise de 
Variância. 
 A estimativa da variância da estimativa do contraste é dada por: 
^^
)(YV = QMRes 








+
ji rr
11
 
 
Para ri ≠ rj, o cálculo de ∆ é dado pelo seguinte estimador: 
∆ = q sQM
rr ji
Re11
2
1








+ 
 
 
Para ri = rj = r, o cálculo de ∆ pode ser representado pela expressão: 
∆ = q
r
sQM Re
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 28 
 
 
 Para a realização do Teste de Tukey é necessário: 
a) Enunciar as hipóteses: 
H0: mi = mj 
H1: mi ≠ mj , para i ≠ j 
b) Obter as estimativas dos contrastes: jiij mmY
^^^
−= , com basenos valores amostrais; 
c) Calcular a diferença mínima significativa (∆); 
d) Concluir a respeito da significância dos nI(nI – 1)/2 contrastes em teste, utilizando a 
seguinte relação: 
• Se ∆≥ijY
^
, rejeita-se H0; 
• Se ∆<ijY
^
, não rejeita-se H0. 
Neste caso a conclusão será única para todos os contrastes que se fizerem necessário 
avaliar: “As médias seguidas por pelo menos uma mesma letra não diferem entre si ao nível 
“α” de probabilidade pelo Teste de Tukey”. 
 
 
4 – DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC) 
 
 O Delineamento em Blocos Casualizados (DBC) constitui no delineamento estatístico 
mais utilizado na pesquisa agronômica, devido a sua simplicidade, flexibilidade e alta 
precisão. Ele é utilizado quando as condições experimentais não são completamente 
homogêneas. Nesta situação, devemos subdividir a área ou o material experimental em blocos 
(ou grupos), de modo que exista homogeneidade dentro de cada bloco e que ele contenha uma 
repetição de cada tratamento, distribuído dentro de cada bloco inteiramente ao acaso. 
 Os experimentos em blocos casualizados levam em consideração os três princípios 
básicos da experimentação: repetição, casualização e controle local. No controle local faz-se a 
divisão do local ou material experimental em subgrupos ou blocos, de tal forma que se tenha 
garantido a uniformidade dentro de cada bloco. 
 Em experimentos de campo deve-se subdividir a área em blocos de maneira que se 
tenha homogeneidade dentro deles, por exemplo: com relação à declividade do solo; a 
fertilidade do solo; a incidência de luz solar; etc. Em experimentos zootécnicos deve-se 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 29 
 
subdividir os animais em blocos de tal forma que cada bloco possa ser homogêneo dentro de 
si, por exemplo: com relação a idade; peso; raça; etc. 
 Em experimentos instalados segundo o DBC, não importa que as condições 
experimentais de um bloco sejam diferentes das condições experimentais do outro bloco. O 
importante é a homogeneidade dentro de cada bloco. 
 
4.1 Vantagens e Desvantagens do DBC 
 
4.1.1 Vantagens 
 
� Se o controle local se fizer necessário, esse delineamento é mais eficiente que o 
inteiramente casualizado (DIC), pois a formação dos blocos isola as variações 
controláveis (sistemática) que causam a heterogeneidade, diminuindo sensivelmente a 
variação ao acaso (aleatória ou erro experimental); 
� O delineamento não tem restrições de uso, seja com relação ao número de tratamentos 
(Delineamento em Quadrado Latino – DQL), seja por exigir uniformidade nas 
condições experimentais (DIC). 
 
4.1.2 Desvantagens 
 
� O delineamento perde eficiência quando o controle local for dispensável, uma vez que 
o número de graus de liberdade do resíduo será menor ao que se obteria caso o 
delineamento utilizado fosse o inteiramente casualizado; 
� Esse delineamento exige que todos os tratamentos tenham o mesmo número de 
repetições. Logo, quando há perda de parcela a soma de quadrado para tratamento 
(SQTrat.) é apenas aproximada. 
 
 
4.2 Quadro de tabulação dos dados 
 
 Considere um experimento instalado no DBC, com I tratamentos e J repetições 
(blocos). A coleta de dados da pesquisa pode ser resumida no quadro a seguir: 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 30 
 
 Tratamentos 
Blocos 1 2 ..... I Totais 
1 Y11 Y21 ..... YI1 B1 
2 Y12 Y22 ..... YI2 B2 
..... ..... ..... ..... ..... ..... 
J Y1J Y2J ..... YIJ BJ 
Totais T1 T2 ..... TI G 
 
 Deste quadro podem-se retirar as seguintes informações: 
 
• Nº de unidades experimentais: N = I x J 
• Total geral: G = ∑∑
=
=
=
=
I
i
i
JI
j
i
ij TY
1
,
1
1
=∑
=
J
j
jB
1
 
• Total para o tratamento I: Ti = ∑
=
J
j
ijY
1
 
• Total para o bloco J: Bj = ∑
=
I
i
ijY
1
 
• Média para o tratamento I: 
^
im = J
Ti
 
• Média para o bloco J: jm
^
 = 
I
B j
 
• Média geral do experimento: 
^
m = 
IJ
G
 
 
4.3 Análise de Variância (ANOVA) 
 
 Para analisar os dados obtidos no delineamento em blocos casualizados deve-se 
decompor a variação total, que existe entre todas as observações, na variação devido à 
diferença entre os efeitos de blocos, na variação devido à diferença entre os efeitos de 
tratamentos e na variação devido ao acaso, que também é denominada de erro experimental 
ou resíduo. 
 Neste tipo de delineamento a decomposição é feita da seguinte forma: 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 31 
 
SQTotal = 
IJ
Y
Y
JI
ji
ijJI
j
i
ij
2
,
1,1
,
1
1
2
)( ∑
∑ ==
=
=
− 
SQTrat. = 
IJ
Y
J
T
JI
ji
ijI
i
i
2
,
1,1
1
2 )( ∑
∑ ==
=
− 
 
SQBloco = 
IJ
Y
I
B
JI
ji
ijJ
j
j
2
,
1,1
1
2 )( ∑
∑ ==
=
− 
 
SQResíduo = SQTotal – SQTratamento – SQBloco 
 
 O quadro da Análise de Variância (ANOVA) para um experimento instalado no DBC 
é dado a seguir: 
FV GL SQ QM F 
Blocos (J – 1) SQBlocos - - 
Tratamentos (I – 1) SQTrat. 
1−I
SQTrat
 
Resíduo (I – 1)(J – 1) SQRes. 
)1)(1(
Re
−− JI
sSQ
 
sQM
QMTrat
Re
 
Total (IJ – 1) SQTotal - - 
 
As hipóteses para o Teste F da Análise de Variância são as seguintes: 
 
• H0: m1 = m2 = ... = mI = m 
• H1: não H0 
 
Ou, 
 
• Todos os possíveis contrastes entre as médias dos tratamentos são estatisticamente 
nulos ao nível “α” de probabilidade/significância; 
• Existe pelo menos um contraste entre as médias dos tratamentos estatisticamente 
diferente de zero ao nível “α” de probabilidade/significância. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 32 
 
Por fim chega-se a tomada de decisão: 
 
• Se Fcal ≥ Ftab → Rejeita-se H0 
• Se Fcal < Ftab → Não Rejeita-se H0 
 
5 – DELINEAMENTO EM QUADRADO LATINO (DQL) 
 
 Os delineamentos em quadrado latino, assim como os blocos casualizados, consideram 
os princípios da repetição, casualização e controle local. Neste delineamento o controle é 
efetuado em duas direções: blocos horizontais (linhas) e blocos verticais (colunas). 
Entretanto, os delineamentos em quadrado latino são menos usuais na experimentação 
agrícola, em analogia aos blocos casualizados. 
O Delineamento em Quadrado Latino (DQL) é mais utilizado nas pesquisas em que 
duas fontes principais de variação estão presentes e precisam ser controladas, sendo sua 
aplicação mais comum na experimentação animal. A sua configuração é constituída de linhas 
e colunas, cada qual estruturado como um bloco. Assim, em caso de I tratamentos, o número 
total de parcelas é I2. No DQL cada tratamento está representado uma única vez em cada linha 
e em cada coluna. Logo, o DQL é utilizado quando podemos observar duas fontes de 
variabilidade nas unidades experimentais. 
Vejamos alguns exemplos ilustrativos nos quais o seu emprego é recomendado: 
Exemplo 1 – Em um laboratório devem ser comparados cinco métodos de análise (A, 
B, C, D, E), programados em cinco dias úteis e, em cada dia, é feita uma análise a cada hora, 
totalizando um período de cinco horas. 
O quadrado latino assegura que todos os métodos sejam processados uma única vez 
em cada período e em cada dia. O quadro abaixo ilustra a configuração a ser adotada. 
 
 Dias 
Períodos 1 2 3 4 5 
1 A E C D B 
2 C B E A D 
3 D C A B E 
4 E D B C A 
5 B A D E C 
 
OBS: Note que os níveis de uma fonte formam as linhas e os níveis da outra fonte formam as 
colunas.IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 33 
 
 Exemplo 2 – Em um experimento com suínos pretende-se avaliar quatro tipos de 
ração (A, B, C, D), em quatro raças distintas e em quatro idades de animais. Como o interesse 
é avaliar os quatro tipos de ração, tomam-se as raças e as idades dos animais como blocos, ou 
seja: 
 Raças 
Idades R1 R2 R3 R4 
I1 A B D C 
I2 B C A D 
I3 D A C B 
I4 C D B A 
 
5.1 Características do DQL 
 
� O número total de unidades experimentais necessárias é igual a I2, sendo I o número 
de tratamentos; 
� Cada tratamento é representado uma única vez, e ao acaso, em cada linha e em cada 
coluna; 
� O número de tratamento é igual ao número de repetições; 
� Este delineamento é aconselhável quando o número de tratamentos oscila entre 3 e 10. 
Contudo, para 3 e 4 tratamentos somente quando se puder repetir o experimento em 
vários quadrados latinos. 
 
5.2 Análise de Variância (ANOVA) 
 
 Admitindo-se K tratamentos, I linhas e J colunas (I = J = K), o esquema da Análise de 
Variância fica conforme o quadro a seguir: 
FV GL SQ QM F 
Linhas (I – 1) SQLinhas - 
Colunas (J – 1) SQColunas - - 
Tratamentos (K – 1) SQTratamentos QMTrat. 
Resíduo (K – 1)(K – 2) SQResíduo QMRes. sQM
QMTrat
Re
 
Total (K2 – 1) SQTotal - - 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 34 
 
Considerando: 
� LI = Total da linha i; 
� CJ = Total da coluna j; 
� TK = Total do tratamento k; 
� G = Total geral. 
 As somas de quadrados são dadas por: 
SQTotal = CY
JI
j
i
ij −∑
=
=
,
1
1
2
 → C = 2
22
2
,
1,1
)(
I
G
IJ
G
IJ
Y
JI
ji
ij
==
∑
==
 
SQLinhas = CL
I
I
i
i −∑
=1
21
 
SQColunas = CC
I
J
j
j −∑
=1
21
 
SQTratamentos = CT
I
K
k
k −∑
=1
21
 
 
SQResíduo = SQTotal – SQLinhas – SQColunas – SQTratamentos 
 
As hipóteses para o Teste F da Análise de Variância, bem como a tomada de decisão, 
seguem os mesmos princípios já mencionados para os delineamentos anteriores (DIC e DBC). 
 
Hipóteses: 
• H0: m1 = m2 = ... = mI = m 
• H1: não H0 
Ou, 
• Todos os possíveis contrastes entre as médias dos tratamentos são estatisticamente 
nulos ao nível “α” de probabilidade/significância; 
• Existe pelo menos um contraste entre as médias dos tratamentos estatisticamente 
diferente de zero ao nível “α” de probabilidade/significância. 
 
Tomada de decisão: 
• Se Fcal ≥ Ftab → Rejeita-se H0 
• Se Fcal < Ftab → Não Rejeita-se H0 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 35 
 
EXERCÍCIOS PROPOSTOS 
1 – Para comparar o crescimento de mudas de quatro espécies de eucalipto um pesquisador 
tomou 20 parcelas similares e distribuiu, inteiramente ao acaso, cada uma das quatro espécies 
em cinco parcelas experimentais. A partir dos dados fornecidos abaixo, é possível concluir 
que existe diferença significativa entre as espécies com relação ao crescimento das mudas? 
Utilizar o nível de significância de 5%. 
 
 Espécies 
 A B C D 
 
25 31 22 33 
 
26 25 26 29 
 
20 28 28 31 
 
23 27 25 34 
 
21 24 29 28 
Totais 115 135 130 155 
 
 
2 – Considere as seguintes produções diárias (kg) de leite a 4% de gordura de vacas em 
lactação submetidas à administração de raízes e tubérculos como suplementação de inverno 
na alimentação. 
 
Sem Suplementação Mandioca Araruta Batata Doce 
19,58 23,40 35,42 22,15 
21,07 22,37 32,47 24,37 
23,43 24,36 34,48 26,54 
25,42 25,12 33,79 20,37 
22,81 22,94 35,04 19,54 
23,54 - 35,19 24,06 
 
a) Ao nível de 5% de significância, concluir a respeito das suplementações utilizadas; 
b) Obter o Coeficiente de Variação; 
c) Obter o Coeficiente de Determinação, interpretando-o. 
 
 
3 – Foi montado um experimento no DIC com o objetivo de verificar qual meio de cultura (A, 
B, C e D) propicia maior crescimento de colônias bacterianas. O número de colônias 
bacterianas, 48 horas após a inoculação, é fornecido abaixo: 
 
Meio de Cultura Nº. de Colônias Bacterianas Totais 
A - 19 31 15 30 95 
B 40 35 46 41 33 195 
C 39 27 20 29 45 160 
D 27 12 13 28 30 110 
 
 Considerando o nível de significância de 5%, pede-se: 
a) Proceder a ANOVA; 
b) Aplicar o Teste de Tukey, se necessário; 
c) Estabelecer um contraste entre o meio de cultura A versus os meios de culturas B, C e 
D. Obter sua estimativa e interpretação. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 36 
 
 
4 – Aplicar o Teste de Tukey as comparações múltiplas obtidas com as médias dos 
tratamentos. O experimento foi conduzido utilizando o Delineamento Inteiramente 
Casualizado (DIC). Concluir para o nível de 1% de significância. 
 
6,230ˆ 1 =m ; 2,217ˆ 2 =m ; 9,204ˆ 3 =m ; 9,209ˆ 4 =m ; 3,188ˆ 5 =m 
r1 = r2 = r3 = 4 ; r4 = r5 = 3 
C.V.(%) = 2,7483% 
 
 
5 – Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma 
alimentação mais apropriada, um criador separou 28 ovelhas de sua criação. Como eram de 
idades diferentes elas foram divididas em sete grupos, de modo que dentro de cada grupo 
existiam quatro ovelhas com idade similar e homogeneidade para as demais características. 
Em cada grupo foi realizado um sorteio para distribuir inteiramente ao acaso quatro tipos de 
alimentação. O experimento iniciou-se no momento de se realizar uma nova tosquia, obtendo 
os seguintes resultados expressos em unidades de medidas de lã por animal: 
 
 Grupos 
Alimentação 1 2 3 4 5 6 7 Totais 
1 30 32 33 34 29 30 33 221 
2 29 31 34 31 33 33 29 220 
3 43 47 46 47 48 44 47 322 
4 23 25 21 19 20 21 22 151 
Totais 125 135 134 131 130 128 131 914 
 
Avaliar os tipos de alimentação, aplicando o teste de Tukey se necessário. Adotar α = 
1%. 
 
 
6 – Com os resultados apresentados a seguir, resultantes de um experimento conduzido no 
Delineamento em Quadrado Latino (DQL), pede-se: (α = 5%) 
 
 Dias 
Períodos 1 2 3 4 5 Totais 
1 40,8 (A) 57,3 (E) 61,8 (C) 38,6 (D) 50,6 (B) 249,1 
2 66,3 (C) 46,5 (B) 54,8 (E) 38,7 (A) 30,2 (D) 236,5 
3 33,4 (D) 70,6 (C) 53,2 (A) 41,7 (B) 50,1 (E) 249,0 
4 60,2 (E) 35,6 (D) 54,2 (B) 64,0 (C) 45,3 (A) 259,3 
5 51,7 (B) 48,7 (A) 29,8 (D) 55,3 (E) 65,7 (C) 251,2 
Totais 252,4 258,7 253,8 238,3 241,9 1.245,1 
 
a) ANOVA; 
b) Aplicar o Teste de Tukey, se necessário. 
 
 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 37 
 
CONTEÚDO V 
 
EXPERIMENTOS FATORIAIS 
 
1 – INTRODUÇÃO 
 
 Os Experimentos Fatoriais são aqueles em que se estudam dois ou mais fatores 
simultaneamente, cada qual com dois ou mais níveis. O experimento fatorial é um tipo de 
esquema, ou seja, uma maneira de organizar os tratamentos, não constituindo um tipo de 
delineamento. 
 Os experimentos fatoriais são montados seguindo determinado tipo de delineamento 
(DIC, DBC ou DQL). Neles, os tratamentos são obtidos pelas combinações dos níveis dos 
fatores. Cada nível de um fator combina com todos os níveis dos outros fatores. 
 Exemplo: 
• Fator A → A1 ; A2 ; A3 ; A4 (quatro níveis) 
• Fator B → B1 ; B2 ; B3 (três níveis) 
A combinação dos níveis entre os Fatores A e B totalizam 12 tratamentos (4Ai x 3Bj). 
 O objetivo da aplicação dos experimentos fatoriais é avaliar o efeito/influência de 
diversos fatores sobre a variável em estudo, bem como o relacionamento entre os fatores 
sobre a variável resposta. 
 A simbologia comumente utilizada é indicar o produto dos níveis dos fatores emteste. 
Exemplo: o experimento fatorial (2 x 4 x 6) informa que foram testados três fatores 
simultaneamente. O primeiro com dois níveis, o segundo com quatro níveis e o terceiro com 
seis níveis. Quando o número de níveis é igual para todos os fatores pode-se utilizar a 
seguinte simbologia: nF, em que: F é o número de fatores e n é o número de níveis de cada 
fator. Exemplo: 43 → indica que no experimento fatorial foram testados três fatores com 
quatro níveis cada (4 x 4 x 4). 
 
2 – VANTAGEM E DESVANTAGEM DO EXPERIMENTO FATORIAL 
 
2.1 Vantagem 
� Permite o estudo dos efeitos principais dos fatores e a interação entre fatores; 
 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 38 
 
2.2 Desvantagem 
� Requer maior número de unidades experimentais em comparação aos experimentos 
simples. 
 
3 – EFEITOS AVALIADOS EM UM EXPERIMENTO FATORIAL 
 
 Nos experimentos fatoriais podem ser estudados os seguintes efeitos: 
 
• Efeito Principal: é o efeito de cada fator, independente do efeito dos outros fatores; 
• Efeito da Interação: é o efeito simultâneo dos fatores à variável em estudo. Ocorre 
interação entre os fatores quando os efeitos dos níveis de um fator são modificados 
pelos efeitos dos níveis de outros fatores. 
 
4 – QUADRO DE TABULAÇÃO DOS DADOS 
 
 Uma maneira de tabular os dados de um experimento fatorial com dois fatores A e B, 
com i e j níveis, respectivamente, instalados segundo o DIC com k repetições, é fornecida 
abaixo: 
A1 A2 ... AI 
B1 B2 ... BJ B1 B2 ... BJ ... B1 B2 ... BJ 
Y111 Y121 ... Y1J1 Y211 Y221 ... Y2J1 ... YI11 YI21 ... YIJ1 
Y112 Y122 ... Y1J2 ... ... ... ... ... ... ... ... ... 
... ... ... ... ... ... ... ... ... ... ... ... ... 
Y11K Y12K ... Y1JK Y21K Y22K ... Y2JK ... YI1K YI2K ... YIJK 
A1B1 A1B2 ... A1BJ A2B1 A2B2 ... A2BJ ... AIB1 AIB2 ... AIBJ 
 
• Total do ij-ésimo tratamento : (AB)ij = ∑
=
K
k
ijkY
1
 
• Total do i-ésimo nível do fator A: Ai = ∑
=
=
JK
j
k
ijkY
;
1
1
 
• Total do j-ésimo nível do fator B: Bj = ∑
=
=
IK
i
k
ijkY
;
1
1
 
• Total geral: G = ∑
=
=
=
IJK
i
j
k
ijkY
;;
1
1
1
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 39 
 
• Média do i-ésimo nível do fator A: 
JK
A
m iAi =
^
 
• Média do j-ésimo nível do fator B: 
IK
B
m
j
Bj =
^
 
• Média geral: 
IJK
G
m =
^
 
 
A tabulação dos dados fornecida acima pode ser resumida no quadro a seguir: 
Bj \ Ai A1 A2 ... AI Total 
B1 A1B1 A2B1 ... AIB1 B1 
B2 A1B2 A2B2 ... AIB2 B2 
... ... ... ... ... ... 
BJ A1BJ A2BJ ... AIBJ BJ 
Total A1 A2 ... AI G 
 
5 – ANÁLISE DE VARIÂNCIA 
 
 A Análise de Variância de um experimento fatorial é feita desdobrando-se a soma de 
quadrados de tratamentos (SQTrat.) nas partes devido aos efeitos principais de cada fator e na 
parte devido à interação entre os fatores. 
 O quadro abaixo representa a ANOVA de um experimento fatorial com dois fatores A e 
B, com i e j níveis, respectivamente, e com k repetições, instalado segundo o DIC. 
FV GL SQ QM F 
Fator A (I – 1) SQA QMA 
sQM
QMA
Re
 
Fator B (J – 1) SQB QMB 
sQM
QMB
Re
 
Interação (AxB) (I – 1)(J – 1) SQ(AxB) QM(AxB) 
sQM
QMAxB
Re
 
Tratamento (IJ – 1) SQTrat.(AB) - 
Resíduo (IJ)(K – 1) SQResíduo QMRes. 
- 
Total (IJK – 1) SQTotal - - 
 
SQTotal = 
IJK
GY
KJI
k
j
i
ijk
2,,
1
1
1
2
−∑
=
=
=
 
SQTrat(AB) = 
IJK
GBA
K
JI
j
i
ji
2,
1
1
2)(1 −∑
=
=
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 40 
 
SQA = 
IJK
GA
JK
I
i
i
2
1
21
−∑
=
 
SQB = 
IJK
GB
IK
J
j
j
2
1
21
−∑
=
 
 
SQ(AxB) = SQTrat(AB) – SQA – SQB 
 
SQResíduo = SQTotal – SQTrat(AB) 
ou 
SQResíduo = SQTotal – SQA – SQB – SQ(AxB) 
As hipóteses estatísticas para o Teste F da análise de variância devem ser lançadas 
para cada um dos efeitos principais, como também para a interação. As hipóteses serão assim 
enunciadas: 
 
� Efeitos Principais 
 
Fator A: 
H0: mA1 = mA2 = ... = mAI = m 
H1: Não H0 
Ou, 
H0: Todos os possíveis contrastes entre as médias dos níveis do fator A são estatisticamente 
nulos ao nível de α% de probabilidade; 
H1: Existe pelo menos um contraste entre as médias dos níveis do fator A estatisticamente 
diferente de zero ao nível de α% de probabilidade. 
 
 Fator B: 
H0: mB1 = mB2 = ... = mBJ = m 
H1: Não H0 
Ou, 
H0: Todos os possíveis contrastes entre as médias dos níveis do fator B são estatisticamente 
nulos ao nível de α% de probabilidade; 
H1: Existe pelo menos um contraste entre as médias dos níveis do fator B estatisticamente 
diferente de zero ao nível de α% de probabilidade. 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 41 
 
� Efeito da Interação 
 
H0: Os fatores atuam independentemente; 
H1: Os fatores não atuam independentemente. 
 
 Os valores de Fcal obtidos na análise de variância para cada uma das fontes de variação 
em teste (efeitos principais e efeito da interação) devem ser comparados com os valores de 
Ftab apropriados, os quais serão obtidos na tabela para valores de F, de acordo com o nível de 
significância (α) desejado, graus de liberdade da fonte de variação em teste (n1) e o grau de 
liberdade do resíduo (n2). 
 A Tomada de Decisão deve ser feita inicialmente para a interação. Se Fcal ≥ Ftab → A 
decisão é Rejeitar H0 ao nível de significância em que foi executado o teste. Caso contrário 
(Fcal < Ftab) → Não Rejeita H0. 
 A Não Rejeição de H0 para a interação implica que os fatores atuam 
independentemente. Assim, devem-se estudar os fatores isoladamente. Neste caso, observa-se 
o resultado do teste F para cada fator e, caso ele seja significativo, aplica-se um teste de média 
para comparar os níveis do fator. 
 A Rejeição de H0 para a interação implica que os fatores não atuam 
independentemente. Assim, não se devem estudar os fatores isoladamente. Neste caso, deve-
se proceder a uma nova análise estatística de cada fator dentro dos níveis do (s) outro (s) fator 
(es). 
 
EXERCÍCIO PROPOSTO 
 
1 – Considere um Experimento Fatorial com dois fatores: Variedade de Sorgo com três níveis 
e Adubação Nitrogenada com quatro níveis. Ele foi instalado utilizando o DBC, com três 
repetições (blocos). Os dados, para os totais de produção, são apresentados a seguir: 
 
 Adubação Nitrogenada 
Variedade de Sorgo 1 2 3 4 Totais 
1 25,4 27,8 29,6 31,4 114,2 
2 23,1 25,0 27,2 29,6 104,9 
3 20,5 22,8 24,8 26,8 94,9 
Totais 69,0 75,6 81,6 87,8 314,0 
Dados: SQResd. = 36,2780 e α = 5% 
 
Pede-se: 
a) ANOVA; 
b) Aplicar o Teste de Tukey, se necessário. 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 42 
 
CONTEÚDO VI 
 
REGRESSÃO LINEAR 
 
1 – INTRODUÇÃO 
 
 A Análise de Regressão consiste na realização de uma análise estatística com o 
objetivo de verificar a existência de uma relação funcional entre variáveis dependente e 
independente. 
 A expressão Análise de Regressão Simples indica que a predição da variável 
dependente é feita por uma única variável independente, enquanto a Análise de Regressão 
Múltipla diz respeito à predição da variável dependente com base em duas ou mais variáveis 
independentes. 
 Na análise de regressão obtém-se uma equação que tenta explicar a variação da 
variável dependente pela variação dos níveis da (s) variável (is) independente (s). As variáveis 
independentessão classificadas como quantitativas, cujos níveis representam diferentes 
quantidades de um mesmo fator. 
 
2 – ANÁLISE DE REGRESSÃO 
 
 Para tentar estabelecer uma equação que representa o fenômeno em estudo pode-se 
plotar (desenhar) um Diagrama de Dispersão para verificar como se comporta os valores da 
variável dependente (Y) em função da variação dos níveis da variável independente (X). O 
diagrama de dispersão é um gráfico no qual cada ponto plotado representa um par observado 
de valores para as variáveis dependente e independente. O valor da variável independente X é 
plotado no eixo horizontal, enquanto o valor da variável dependente Y no eixo vertical. 
 O comportamento de Y em relação a X pode-se apresentar de diversas maneiras: 
linear, quadrático, exponencial, etc. Para estabelecer o modelo apropriado para explicar o 
fenômeno, deve-se verificar qual o tipo de curva e equação de um modelo matemático que 
mais se aproxima dos pontos plotados no diagrama de dispersão. 
 Contudo, pode-se observar que os pontos do diagrama de dispersão não se ajustarão 
perfeitamente ao modelo matemático proposto. Existirá, na maioria dos pontos, uma distância 
entre os pontos do diagrama e os pontos do modelo matemático. Isto é devido ao fato do 
fenômeno em estudo não ser um fenômeno matemático e sim um fenômeno sujeito a 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 43 
 
influências que acontecem ao acaso. Desta forma, o objetivo da regressão é obter um modelo 
matemático que melhor se ajuste aos valores observados de Y em função da variação dos 
níveis da variável X. 
 
2.1 Modelo da Regressão Linear Simples e Método de Estimação dos Parâmetros 
 
O modelo estatístico da Regressão Linear Simples é definido por: 
 
Yi = β0 + β1Xi + ei 
 
em que: 
• Yi → é o valor observado para a variável dependente Y no i’ésimo nível da variável 
independente X; 
• β0 → é a Constante de Regressão. Representa o intercepto da reta com o eixo Y; 
• β1 → é o Coeficiente de Regressão. Representa a variação de Y em função da variação 
de uma unidade da variável X; 
• Xi → é o i’ésimo nível da variável independente X (i = 1, 2, 3, ..., n); 
• ei → é o erro associado a distância entre o valor observado Yi e o seu respectivo 
correspondente na curva do modelo proposto (valor estimado). 
 
 Um método adequado para estimar os parâmetros da equação de regressão linear 
simples entre duas variáveis X e Y será aquele que minimize as distâncias entre os pontos do 
diagrama de dispersão e do modelo matemático. Este método é denominado de Método dos 
Mínimos Quadrados (MMQ). Nele, a soma dos quadrados das distâncias entre os pontos do 
diagrama de dispersão e os respectivos pontos na reta/curva da equação estimada é 
minimizada, obtendo assim uma relação funcional entre X e Y com o mínimo de erro possível, 
de acordo com o modelo escolhido. 
Os estimadores de β0 e β1 são então obtidos pelo MMQ, minimizando a soma de 
quadrados dos erros, por meio de derivações. Os estimadores pelos quais se estimam os 
valores de β0 e β1 são: 
XY
^
1
^
0 ββ −= 
 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 44 
 
( ) ( ) X
XY
SQD
SP
n
X
X
n
YX
XY
n
n
X
X
n
n
YX
XY
XVar
YXCov
=
−
−
=
−
−
−
−
==
∑ ∑
∑ ∑ ∑
∑ ∑
∑
∑ ∑
2
2
2
2
^
1
1
1
.
),(β 
 
 Uma vez obtida as estimativas de 
^
0β e 
^
1β , podemos escrever a equação estimada de 
Regressão Linear Simples da seguinte maneira: 
iXY
^
1
^
0
^ ββ += 
 
2.2 Avaliação Estatística do Modelo 
 
2.2.1 Análise de Variância da Regressão 
 
 A obtenção da equação estimada apenas estabelece uma relação funcional entre a 
variável dependente e a variável independente para o fenômeno em estudo. A simples 
obtenção da equação estimada não responde ao pesquisador se a variação dos níveis da 
variável independente (X) influencia significativamente a variável dependente (Y). 
 Para solucionar esta indagação é necessário realizar um teste estatístico para a 
estimativa do coeficiente de regressão (
^
1β ). Um teste que pode ser realizado para verificar tal 
fato é o Teste F da Análise de Variância. 
 O quadro para Análise de Variância da Regressão fica assim estabelecido: 
FV GL SQ QM F 
Regressão p SQRegressão 
p
gresSQ .Re
 
Resíduo da 
Regressão 
n – 1 – p SQResíduo 
pn
sdSQ
−−1
.Re
 
.Re
.Re
sdQM
gresQM
 
Total n – 1 SQTotal - - 
 
em que: 
� p → Número de Coeficientes de Regressão (não inclui o β0); 
� n → Número de observações ou níveis; 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 45 
 
SQTotal = 
n
Y
Y
n
i
in
i
i
2
1
1
2
)(∑
∑ =
=
− 
SQRegressão = ( ) )(^1
2
XY
X
XY SP
SQD
SP β= 
SQResíduo = SQTotal – SQRegressão 
 
As hipóteses estatísticas para o Teste F são as seguintes: 
• H0: β1 = 0; O que equivale a dizer que a variável independente não exerce influência 
na variável dependente, de acordo com o modelo proposto; 
• H1: β1 ≠ 0; O que equivale a dizer que a variável independente exerce influência na 
variável dependente, de acordo com o modelo proposto. 
 
 Considerando Fα (p ; n – 1 – p), a regra decisória para o Teste F é a seguinte: 
 
• Se o valor do F calculado for maior ou igual ao valor do F tabelado, então Rejeita H0 
ao nível α% de probabilidade. Pode-se inferir que o modelo proposto é adequado para 
descrever o fenômeno. 
• Se o valor do F calculado for menor que o valor do F tabelado, então Não Rejeita H0 
ao nível α% de probabilidade. Infere-se que o modelo proposto não é adequado para 
descrever o fenômeno. 
 
2.2.2 Coeficiente de Determinação 
 
 O Coeficiente de Determinação, denominado R2 (Regressão Linear Múltipla) ou r2 
(Regressão Linear Simples), fornece uma informação auxiliar ao resultado da análise de 
variância da regressão, verificando se o modelo proposto é adequado ou não para descrever o 
fenômeno. 
R2 = r2 = ( )
YX
XY
SQDSQD
SP
SQTotal
gressãoSQ
.
Re 2
= 
 
 O valor do coeficiente de determinação varia no intervalo de 0 a 1. Valores próximos 
de 1 indicam que o modelo proposto é adequado para descrever o fenômeno. Ele representa a 
IC283 – Bioestatística e IC284 – Estatística Experimental 
Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 
 46 
 
percentagem da variação total (Y – variável dependente) que é explicada pela equação de 
regressão (X – variável independente). 
 
2.2.3 Gráfico da Equação de Regressão Estimada 
 
O Gráfico da Equação de Regressão Estimada pode ser obtido atribuindo valores para 
a variável independente e, consequentemente, obtendo os respectivos valores estimados para a 
variável dependente. Esses pares de valores são plotados nos respectivos eixos X e Y, obtendo 
assim o gráfico da equação de regressão estimada. 
A distância dos pontos observados no experimento em relação ao gráfico (curva ou 
reta) da equação de regressão estimada também é uma indicação da adequação ou não do 
modelo de regressão proposto para descrever o fenômeno. 
 
 
EXERCÍCIOS PROPOSTOS 
 
1 – De acordo com os dados fornecidos abaixo para a variável X (dose de Zn em ppm) e para a 
variável Y (MS(g)/planta), pede-se: 
 
a) Obter a equação de regressão de 1º grau; 
b) Verificar se o modelo de regressão linear de 1º grau é adequado para descrever a 
relação entre as variáveis. Utilize os métodos vistos em sala de aula: i) ANOVA; ii) 
Coeficiente de Determinação; iii) Gráfico da Equação de Regressão Estimada. (α = 
5%). 
 
X 1,0 2,5 4,0 5,5 7,0 8,5 
Y

Outros materiais