Buscar

Luiz Alexandre Peternelli

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 68 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
8. USO DA ANÁLISE DE VARIÂNCIA E DA REGRESSÃO 
8.1. Introdução 
A estatística é a ciência que lida com a coleta, o processamento e a disposição de 
dados (informação) atuando como ferramenta fundamental nos processos de soluções de 
problemas. 
A estatística trata da coleta de dados informativos e da interpretação destes dados, 
facilitando o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja 
sendo estudado. 
A estatística viabiliza a: 
 
Coleta 
Processamento dos dados. 
Apresentação 
 
O conhecimento gerado é, então vitalizado por meio do método gerencial (Ciclo 
PDCA) para atingir metas. 
Atualmente têm sido estimulado e difundido administrações de empresas segundo a 
filosofia do Controle de Qualidade. 
Três tipos de ações gerenciais são possíveis nestes tipos de empresas, as quais, serão 
abordados a seguir. 
8.2. Tipos de Ações Gerenciais em Empresas que Valorizam o Controle de Qualidade 
(A) Planejamento da Qualidade 
Ação: Definir novos padrões (novo produto e novo processo) para atingir as metas 
de qualidade, custo, entrega, moral e segurança. 
(B) Manutenção da Qualidade 
Ação: Cumprir os padrões estabelecidos para o produto e o processo, verificando os 
resultados e atuando no processo para corrigir os desvios (anomalias). 
(C) Melhoria da Qualidade 
Ação: Alterar os padrões estabelecidos no planejamento da qualidade para atingir 
novas metas de qualidade, custo, entrega, moral e segurança. 
 
 
 1 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Essas ações são exercidas por meio do Ciclo PDCA: 
 
 
 
 
 
 
 
 
 
 
OBS: Representa o caminho a ser seguido para alcançar certo objetivo. 
 
O Ciclo PDCA é um método gerencial de tomada de decisões para garantir o alcance 
das metas necessárias à sobrevivência de uma organização. 
Esquema do Ciclo PDCA: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Maiores explicações: 
P – Planejamento 
Estabelecer metas; • 
• 
• 
Estabelecer o método para alcançar as metas propostas. 
 
D – Execução 
Executar as tarefas exatamente como foi previsto na etapa de planejamento; 
 2 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Coletar dados que serão utilizados na próxima etapa do processo; • 
• 
• 
• 
• 
• 
São essenciais a educação e o tratamento no trabalho. 
 
C – Verificação 
Usando os dados previamente coletados, comparar o resultado alcançado com a meta 
planejada. 
 
A – Atuação Corretiva 
Atuar no processo em função dos resultados obtidos; 
Formas de atuação: 
- Adotar como padrão o plano proposto, caso a meta tenha sido alcançada; 
- Agir sobre as causas do não atingimento da meta, caso o plano não tenha sido 
efetivo. 
 
Na utilização desse método de gestão (PDCA) poderá ser preciso: 
Empregar ferramentas estatísticas para: 
- Coleta; 
- Processamento; necessárias à condução das etapas do PDCA 
- Disposição das informações. 
 
Dependendo do tipo de ação gerencial executado e, dentro de cada tipo de ação, 
podem ser utilizadas diferentes ferramentas estatísticas. 
Segundo Werkmam e Aguiar (1996) uma boa abordagem sobre o assunto pode ser 
encontrado em Campos (1994 e 1995). 
Uma breve abordagem sobre o assunto será feita a seguir. 
 
8.3. Uso do Planejamento de Experimentos no Ciclo PDCA 
 
Apesar do uso da estatística ser fundamental em diversas etapas dos vários tipos de 
ações gerenciais (como o uso de gráficos, estatísticas descritivas, análise de regressão, etc.), 
será apresentado inicialmente apenas o uso de planejamento e análise de experimentos de 
algumas ações. 
Ação: Planejamento de Qualidade 
Ao desenvolver a característica do produto que atendam as necessidades dos 
clientes; 
• 
 3 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Ao desenvolver processos que sejam capazes de produzir aquelas características do 
produto; 
• 
Ação: Melhoria da Qualidade 
OBS: O Ciclo PDCA para essa ação também é denominado Método de Solução de Problemas, já que cada 
meta de melhoria gera um problema que a empresa deverá solucionar. 
• 
• 
• 
• 
Nesse tipo de ação, é essencial o uso de ferramentas estatísticas apropriadas para 
coletar, processar e dispor o grande volume de informações utilizadas. 
A sofisticação das ferramentas aumenta com o aumento da capacidade de 
gerenciamento (alcance de metas) da empresa. 
As técnicas de planejamento e análise de experimentos fazem parte das técnicas 
mais sofisticadas. 
Detalhando o Ciclo PDCA de melhoria temos (p.4 v.6): 
 
A maior efetividade das técnicas de planejamento e análise de experimentos ocorre 
na fase de análise, mas também podem ser efetivas nas fases de observação e verificação, e 
até mesmo na identificação do problema (p.4 v.6). 
OBS: As técnicas de análise de regressão são igualmente efetivas nas mesmas fases. 
 
Nesse modo de ação (melhoria), na fase de análise, o emprego dessas técnicas de 
planejamento e análise de experimentos são úteis para: 
O estudo do efeito conjunto das diversas causas que compõem o processo sobre o 
resultado para a qual foi estabelecida a meta de melhoria; 
• 
• 
• 
A identificação das principais causas sobre as quais devemos atuar no sentido de 
fazer com que a meta de melhoria seja alcançada; 
A determinação da condição de operação do processo que permitirá o alcance da 
meta de melhoria. 
 4 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Essas técnicas apresentam a vantagem de, por meio do seu emprego, fazer com que 
as ações relacionadas acima possam ser realizadas com o mínimo de tempo e custos e com a 
manutenção de um nível de confiança pré-estabelecido para as conclusões. 
O uso dessas técnicas envolve a realização de interferências no processo. 
Uso de plantas-piloto da linha de produção (se variações nos fatores forem grandes); • 
• Uso da própria linha de produção com pequenas variações seqüenciais dos níveis 
dos fatores. 
8.4. Planejamento de Experimentos 
Definição de experimentos: Procedimentos nos quais alterações propositais são feitas 
nas variáveis de entrada de um processo ou sistema, de modo que se possa avaliar as 
possíveis alterações sofridas pela variável resposta, como também as razões dessas 
alterações. 
OBS 1: Variável de Entrada – Fatores ou causas do processo. 
OBS 2: Variável Resposta – Efeitos deste processo. 
OBS 3: Processo – Conjunto de causas ou fatores (insumos, equipamentos, informações do processo ou 
medidas, condições ambientais, pessoas e métodos ou procedimentos) que tem como objetivo produzir um 
determinado efeito (produto de processo) que apresenta uma ou mais resposta observáveis. 
 
Esquema ilustrativo: 
 
 
8.4.1. Alguns Objetivos de um Experimento Planejado 
(A) Determinar as causas (fatores) que mais influenciam o efeito de interesse; 
 5 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
(B) determinar as faixas de valores para os itens de verificação associados aos fatores 
controláveis X’s de modo a garantir o melhor valor (ou variabilidade) para a característica 
da qualidade do produto. 
8.4.2. Princípios Básicos do Planejamento de Experimentos 
(A) Repetição (réplicas) 
As repetições do experimento devem ser feitas sob as mesmas condições 
experimentais; 
• 
• 
• 
• 
• 
• 
Permite a obtenção de uma estimativa da variabilidade devido ao erro experimental; 
Pela escolha adequada do número de repetições é possível detectar, com precisão 
adequada, se os efeitos produzidos pelas diferentes condições experimentais são 
significantes na prática, ou não. 
(B) Casualização (aleatorização) 
Fazer de forma aleatória a alocação do material às diversas condições experimentais; 
Dá garantia ao uso de métodos estatísticos para a análise dos dados. 
(C)Controle Local (formação de blocos) 
Eliminar (controlar) fontes de variação sistemática que não fazem parte do interesse 
da pesquisa. 
 
Esquema ilustrativo: 
 
 6 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
8.4.3. Terminologia Básica 
(A) Unidade Experimental 
Unidade básica para a qual será feita a medida da resposta. 
(B) Fatores 
Variáveis cuja influência sobre a variável resposta está sendo estudada no 
experimento. 
(C) Níveis de um Fator 
Os diferentes modos de presença de um fator no estudo considerado. 
(D) Tratamento 
Combinações específicas dos níveis de diferentes fatores; 
Se há apenas um fator, os níveis desse fator correspondem aos tratamentos. 
(E) Variável Resposta 
Resultado de interesse registrado após a realização de um ensaio. 
8.4.4. Fases de Experimento Delineado Estatisticamente 
(A) Fase da Definição do Delineamento 
Definir o melhor delineamento que responda sobre o efeito dos fatores de interesse 
na característica avaliada. 
Definido o delineamento, gera-se o plano experimental: Atribuição dos tratamentos 
às chamadas unidades experimentais. 
Existem procedimentos no SAS que geram a maioria dos planos experimentais, mas 
nada impede de fazê-lo sem o auxilio do SAS, bastando conhecer bem as particularidades 
estatísticas dos diversos delineamentos. 
(B) Fase da Tomada de Dados 
Corresponde à coleta dos dados propriamente dita. 
(C) Fase da Análise de Dados 
Existem diversos procedimentos disponíveis no SAS (SAS base, SAS/STAT e 
SAS/GRAPH) que auxiliam na análise e interpretação dos dados. 
OBS: No entanto, outros softwares poderiam ser usados ao invés dos SAS, exemplo: o R. 
 
8.4.5. Roteiro para a Realização de um Bom Experimento. 
OBS: Extraído, integralmente, de Werkema e Aguiar (1996) pág. 34, mas também encontrado em 
Montgomery (1997) pág. 14, 4ª edição. 
 
 7 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Para usar a abordagem estatística no planejamento e na análise de um experimento é 
necessário que as pessoas envolvidas na experimentação tenham, antecipadamente, uma 
idéia clara do que será estudado e da forma como os dados serão coletados. Também é 
desejável que se tenha pelo menos uma idéia qualitativa de como os dados serão analisados. 
Um roteiro do procedimento usualmente recomendado é apresentado a seguir. 
8.4.5.1. Identificação dos Objetivos do Experimento 
• Realize uma sessão (brainstorming) com o propósito de definir claramente os objetivos 
do experimento a ser realizado. Todas as pessoas que possam contribuir para a definição 
dos objetivos devem participar da reunião. 
• Utilize todo o conhecimento disponível sobre o problema que está sendo estudado com o 
propósito de definir claramente os objetivos do experimento. Isto é, devem ser utilizados 
as informações já publicadas sobre o assunto, a experiência prática do grupo e os 
resultados dos experimentos similares já realizados. 
• Expresse as informações sobre o problema em termos quantitativos. 
8.4.5.2. Seleção da Variável Resposta 
• Utilize uma variável resposta que realmente forneça informações sobre o problema em 
estudo. 
• Determine o método de medição da variável resposta e a escala de medida a ser utilizada 
(por exemplo, temperatura ou logaritmo da temperatura). 
• Determine a exatidão das medidas da variável resposta (veja Werkema, M. C. C. – 
1996a) – vol. 13 da série “Ferramentas da Qualidade”. 
8.4.5.3. Escolha dos Fatores e seus Níveis 
• Utilize conhecimento não estatístico para: 
 Identificar os fatores cujos níveis irão variar, os fatores cujos níveis permanecerão 
constantes e os fatores que não poderão ser controlados durante a realização do 
experimento. 
 Escolher as faixas de variação dos fatores e o número de níveis de cada fator para os 
quais as medidas da variável resposta serão obtidas. 
• Planeje a forma de controle dos fatores quantitativos nos níveis desejados e determine o 
método de medição dos níveis destes fatores, bem como a escala de medida a ser 
utilizada. 
 8 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
• Determine a exatidão das medidas dos fatores quantitativos (veja Werkema, M. C. M. – 
1996a) – vol. 13 da série “Ferramentas da Qualidade”. 
8.4.5.4. Planejamento do Procedimento Experimental 
• Escolha um procedimento experimental que ajude a eliminar o efeito de fatores não 
controláveis sobre as comparações de interesse e que simplifique a análise dos 
resultados. 
• Considere as possíveis interações entre os fatores. 
• Determine as influências exercidas pelas possíveis limitações de tempo, custo, materiais, 
mão-de-obra e equipamentos, e por condições externas, tais como fatores climáticos. 
• Determine o percentual dos recursos (orçamento, tempo, etc.) disponíveis para o 
desenvolvimento do estudo completo, que deverá ser investido na realização do 
experimento. Muitas vezes este experimento é um meio para a aprendizagem da forma 
de condição do estudo, ou seja, é apenas um experimento inicial. Portanto, devem sobrar 
recursos para cumprir os objetivos finais do trabalho, não devendo então ser feito um 
investimento de mais de 25% ou 30% dos recursos totais neste experimento inicial. 
• Proponha um modelo matemático para o experimento, de modo que a análise estatística 
dos dados possa ser realizada. 
• Determine o método de aleatorização a ser utilizado e a ordem de coleta dos dados. 
• Determine a magnitude das diferenças obtidas entre as respostas médias correspondentes 
aos tratamentos incluídos no estudo, que será considerada significativa sob o ponto de 
vista prático. 
• Considere a variabilidade resultante do procedimento de amostragem e da precisão dos 
métodos de medição. 
• Determine o número mínimo de réplicas a serem realizadas, de modo a permitir que a 
variância do erro experimental seja estimada de forma adequada e a garantir que seja 
obtida a precisão necessária para alcançar os objetivos do experimento. 
• Prepare o roteiro que detalhe os passos a serem seguidos durante a realização do 
experimento, com o objetivo de minimizar a ocorrência de erros. Este roteiro deve 
incluir o detalhamento dos métodos, materiais e equipamentos a serem utilizados, bem 
com das precauções a serem tomadas durante a coleta e o registro dos dados. 
• Sensibilize as pessoas sobre a importância do experimento que será realizado. 
 9 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
8.4.5.5. Realização do Experimento 
• Execute o procedimento de coleta dos dados de acordo com o que foi planejado no item 
8.4.5.4. 
• Monitore o progresso do experimento, registrando dados auxiliares (datas, número de 
ordem dos ensaios, dados omissos, ensaios adicionais) e quaisquer modificações que 
tenham sido feitas no planejamento experimental inicial. 
8.4.5.6. Análise de Dados 
• Execute o processo de revisão dos dados com o objetivo de detectar possíveis erros de 
registros e emissões. 
• Utilize métodos gráficos para a representação dos dados. 
• Empregue os métodos estatísticos apropriados para a análise dos dados do experimento. 
• Verifique a adequação do modelo matemático adotado no item 8.4.5.4. Deve ser feito 
um exame crítico do modelo adotado e das suposições a ele associadas. 
8.4.5.7. Interpretação dos Resultados 
• Considere todos os dados coletados no experimento, durante a execução da fase de 
interpretação dos resultados. 
• Estabeleça as conclusões somente a partir dos resultados obtidos pelo experimento que 
foi realizado. Evite fazer extrapolações para outras condições que não tenham sido 
incluídas no estudo. 
• Detalhe a análise dos dados em termos gráficos e numéricos para tornar mais clara a 
interpretação dos resultados. 
• Estabeleça os resultados em termos de suas probabilidades associadas, as quais irão 
medir a confiabilidade das conclusõesobtidas. 
• Avalie a significância prática das conclusões alem de avaliar a significância estatística. 
• Interprete as conclusões obtidas sob o ponto de vista técnico e traduza seu significado 
para as aplicações de interesse. 
• Registre as possíveis limitações impostas pelos dados ou pelos métodos de análise 
utilizados. 
 10 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
8.4.5.8. Elaboração do Relatório 
• Descreva claramente o trabalho realizado, mostrando a importância do problema tratado 
e significado prático dos resultados obtidos. Inclua também resultados anteriores que 
sejam relevantes. 
• Utilize gráficos e tabelas para apresentar os dados. 
• Apresente informações suficientes para que os leitores possam verificar os resultados e 
estabelecer suas próprias conclusões. 
• Expresse as conclusões sob a forma de um sumário. 
• Faça recomendações sobre as conclusões obtidas. Estas recomendações podem, por 
exemplo, incluir a necessidades de realização de uma nova série de experimentos, já que 
a experimentação é um processo interativo, onde o experimento responde algumas 
questões e simultaneamente coloca outras. Isto é, à medida que o experimento avança, 
alguns fatores iniciais podem ser abandonados, outros fatores adicionados, as faixas de 
variação dos fatores podem ser alteradas, em alguns casos, novas variáveis respostas 
podem ser empregadas. 
• Minimize o uso de terminologia estatística desnecessária e expresse as informações do 
mundo mais simples possível. 
8.5. Testes de Hipóteses 
Ao tratarmos da análise de experimentos, será necessária a realização de testes 
estatísticos para a verificação de determinadas hipóteses. Assim, é necessário que se faça 
uma breve revisão sobre alguns conceitos relacionados à inferência estatística, ou mais 
especificamente, aos testes de hipóteses. 
8.5.1. Idéia Geral sobre os Testes de Hipóteses 
Definição: Estabelecimento de uma regra decisória que permite rejeitar ou não rejeitar uma 
hipótese estatísticas com base nos elementos amostrais. 
A idéia básica sobre o testes de hipóteses consiste no uso de um conjunto de regras 
para decidir se rejeita, ou não, uma hipótese nula (ou hipótese básica ou de nulidade). 
Ex: 
oo :H θ=θ
Se for rejeitada, valida-se a hipótese alternativa Ha. 
Ex: Teste Bilateral oa :H θ≠θ
 Ou 
 11 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
 
oaH θθ >:
Teste Unilateral ou 
 θθ <:aH
 
Definição: Uma estatística é qualquer função das observações em uma amostra que não 
contenha parâmetros desconhecidos. 
Alguns exemplos de estatísticas são dados a seguir: 
( )
n
S
Xt
n
XX
S
n
X
X ii µ−=
−
−
== ∑∑ ;
1
;
2
2
 
Ho: µ = valor 
definido 
 
O procedimento tradicional do teste é: 
(A) Formular Ho e Ha, e especificar o nível de confiança α; 
(B) De acordo com α e a distribuição da estatística do teste apropriado, define-se a região 
crítica de tamanho α; 
 
α/2 α/2 
θ0 
 
 
 
 
 
 
 
 
 
 
 
 
OBS: Chamamos “Região Crítica” a faixa de valores de estatística do teste que leva à rejeição da hipótese de 
nulidade. 
 
(C) Com base na amostra, obtida geralmente a partir de um experimento controlado, é 
computado todo o valor da estatística do teste. 
(D) Se o valor da estatística do teste pertencer à região crítica, rejeita-se Ho. Caso contrário, 
não se rejeita Ho. 
OBS.: Para discussão em aula: Qual termo utilizar – “não rejeita Ho” ou “aceita Ho”? 
 12 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
8.5.2. Tipos de Erros Inerentes aos Testes de Hipóteses 
 Ao executarmos um teste de hipóteses estamos sujeitos a dois tipos de erros: o 
chamado “erro tipo I” e o chamado “erro tipo II”. Esses dois tipos de erros poderiam ser 
entendidos da seguinte maneira: 
Erro Tipo I: Rejeitar Ho quando Ho é verdadeira. 
Erro Tipo II: Não rejeitar Ho quando Ho é falsa. 
 
Define-se: 
α = P(cometer o erro tipo I) nível de significância ≡
β = P(cometer o erro tipo II) 
OBS.: 1 - β é também conhecido como o poder de um teste. Corresponde à probabilidade de rejeitar H0 quando 
H0 é falsa. 
8.5.3. P-value (ou valor-p) 
Atualmente, ao invés de fixar o nível de significância de um teste, e simplesmente 
relatar se Ho foi rejeitada ou não, tem-se dado preferência ao uso do p-value. 
Assim, ao invés de comparar o valor da estatística obtida da amostra, com o valor 
crítico da estatística do teste definido em função de um α fixado, faz-se: Comparar o p-
value obtido para a amostra com o α fixado. 
Portanto, Ho é rejeitada se o p-value for menor ou igual a α. 
Definição Geral: para um dado valor observado de uma estatística do teste, o p-value 
corresponde ao menor nível de significância para o qual a hipótese Ho 
poderia ter sido rejeitada. 
OBS: 
 
Quando H0 é verdadeira 
Dependendo da direção do teste 
 
 
 
 
 
 
 
 
 
 
 
( )tPvaluepHSe a ≤=−⇒< τθθ 0:
( ) verdadeiraHsetPvaluep >=− τ
( ) ( )tPoutPvaluepHSe a ≤≥=−⇒≠ ττθθ 22: 0
HSe a 00: ⇒> θθ
Estatística do teste 
obtida da amostra 
Variável aleatória 
estatística do teste 
 
 
Assim, usando o p-value, o procedimento para o teste seria: 
(A) Formular Ho e Ha (e definir α se for de interesse); 
(B) Especificar a estatística do teste; 
 13 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
(C) Determinar o valor da estatística do teste e o p-value correspondente baseado na 
amostra; 
(D) Comparar p-value com α 
- Se p-value ≤ α ⇒ rejeição de Ho; 
- Se p-value > α não-rejeição de H⇒ o. 
Obs.: ou permita que o julgamento seja particularizado. 
Exemplo ilustrativo dado em aula: folha solta 
8.6. Experimentos Completamente Casualizados com um Único Fator 
Para esse tópico pressupõe-se um razoável conhecimento em delineamentos 
experimentais apresentados em disciplina básica de estatística experimental. 
Os experimentos no delineamento inteiramente casualizado envolvem os princípios 
da repetição e casualização. Supõe-se um fator influenciando um item de controle. Quer-se 
conhecer a faixa de valores desse fator, no processo, de modo a ter o item de controle dentro 
da meta definida. 
É importante controlar os outros fatores que não são do interesse do pesquisador. 
Mantê-los em níveis constantes. Assim, pressupõem-se condições homogêneas; 
A casualização equilibra os efeitos dos fatores não-controláveis sobre o item de 
controle. 
 
Seja: Nº de Tratamentos = I = I níveis do fator 
 Nº de repetições = J 
 
Tratamentos Repetições (observações) Totais Médias 
1 y11 y12 K y1J y1. .1y 
2 y21 y22 K y2J y2. .2y 
... 
 
... ... ... ... ... 
I yI1 yI2 K yIJ yI. .Iy 
 y.. ..y 
 
O modelo estatístico é: 
Yij = µ + ti + eij i = 1, 2, ... , I; j = 1, 2, ... , J 
 
Onde: 
Yij = Valor observado na j-ésima repetição do i-ésimo tratamento; • 
• µ = Média geral dos dados (geralmente); 
 14 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
ti = Efeito do i-ésimo tratamento; • 
• 
• 
• 
• 
eij = Erro aleatório associado às observações yij. 
 
Pressuposições usuais: 
eij são variáveis aleatórias independentes; 
eij são identicamente distribuídas; 
eij têm distribuição normal com média zero e variância σ² constante, ou seja, eij ∼ 
NID(0, σ²) 
 
OBS 1: os eij podem ser oriundos de: 
• Erros de medição; 
• Efeitos de fatores não incluídos no processo e não bem controlados; 
• Causas de variação aleatórias desconhecidas. 
OBS 2: as pressuposições acima são necessárias para que os testes de hipóteses sejam aplicados sobre os 
efeitos de tratamentos. 
OBS 3: de modo geral, o objetivo da análise é estimar os efeitos de tratamentos e testá-los. 
8.6.1. Modelo Fixo ou Modelo Aleatório 
Duas situações podem ocorrer em relação aos efeitos de tratamento. 
Essas diferentes situações vão ocorrer emfunção da maneira como os níveis do fator 
são escolhidos. 
 
(I) Modelo de Efeitos Fixos 
Quando os níveis do fator são especificados pelo experimentador. Neste caso: 
Testa-se hipóteses sobre as médias de tratamentos; • 
• 
• 
• 
• 
• 
Conclusões são válidas apenas para esses níveis; 
Pode-se estar interessado em estimar µ, ti, σ². 
(II) Modelo de Efeitos Aleatórios 
Os efeitos aleatórios poderão ocorrer quando os K tratamentos corresponderem a 
uma amostra aleatória de uma grande população de tratamentos. Nesse caso: 
Conclusões obtidas para essa amostra de tratamentos podem ser estendidas para a 
população; 
Os ti são variáveis aleatórias. Assim, informações particulares sobre um certo ti 
geralmente são sem utilidades; 
O que testamos é a hipótese a respeito da variabilidade dos efeitos de tratamento, 
além de estimar tal variabilidade. 
 
 15 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Alguns exemplos podem tornar esses conceitos mais claros: 
Efeitos Fixos Fator: Tipo de têmpera para aumenta dureza em peça de aço. 
 Níveis: Água, óleo. 
 
Efeitos Aleatórios Fator: Teares usados para fabricar determinado tipo de tecido. 
 Níveis: Amostra aleatória dos teares. 
Objetivo: Avaliar se haveria variação entre as resistências dos 
tecidos fabricados pelos diferentes teares. 
8.6.1.1. Análise de Variância de Modelos de Efeitos Fixos 
Os efeitos ti são, geralmente definidos como: 
ti = µi - µ i = 1, 2, ... , I 
assim, 
( )∑ ∑∑
==
−=−=
I
i i
ii
I
i
i It
11
µµµµ , mas == ∑I
iµµ média geral 
então, 
0. =−= ∑∑∑ IIt
i
i
i
i
i
µ
µ 
As hipóteses a serem testadas são: 
 Ho: µ1 = µ2 = ... = µI vs 
 Ha: µi ≠ µj para pelo menos um par (i, j) 
Se Ho é verdadeira, todos os tratamentos terão média µ . Como ti = µi - µ , então, sob 
Ho verdadeira, seria equivalente escrever as hipóteses como: 
Ho: t1 = t2 = ... = tI = 0 
Ha: ti 0 para pelo menos um tratamento i. ≠
8.6.1.1.1. Idéia Principal da Análise de Variância 
Decompor a variabilidade total dos dados nas partes que a compõem de acordo com 
o modelo proposto. Assim, no caso do modelo Yij = µ + ti + eij podemos escrever: 
(Yij - µ) = (µi - µ) + eij 
que seria o ponto inicial para se fazer a decomposição pretendida, bastando, para isso, elevar 
ao quadrado cada lado da igualdade acima, substituir os parâmetros por seus estimadores e 
aplicar operações de somatório. 
 16 
Desafio: Tente executar essa decomposição como exercício. 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
A partição será: 
 
 
 
 
 
 
 
 
 
 
 
 
( ) ( ) ( )− iij yy 2.∑ ∑∑ +−=−
ji jiji
iij yyyy
, ,,
2
...
2
..
Variação entre as 
observações dentro 
dos tratamentos 
Variação entre média de 
tratamentos e média geral 
Variação Total 
Que é representado por: 
 
SQtotal = SQtrat - SQresíduo 
 
As fórmulas usuais para as Somas de Quadrados são: 
( )
IJ
y
y
rI
y
ySQtotal
ji
ij
ji
ij
ji
ij
2
..
,
2
2
,
,
2 −=






−= ∑
∑
∑ 
( )
IJ
yy
JIJ
y
y
J
SQtrat
i
i
i
i
i
i
2
2
.
2
.
2
.
..11
−=






−= ∑
∑
∑ 
 
A SQResíduo geralmente é obtido por diferença. 
O quadro da análise de variância, ou comumente chamada de ANOVA, será: 
F.V. g.l. SQ QM Fcalc 
Tratamento I - 1 SQTrat SQTrat / (I – 1) QMTrat / QMRes 
Resíduo I(J - 1) SQRes SQRes / I(J – 1) 
Total IJ - 1 SQTotal 
 
A regra decisória será: 
Se Fcalc ≥ Fα[(I – 1);I(J – 1)] rejeita-se Ho 
ou 
Se p-value = P[F[(I – 1) ; I(J – 1)] > Fcalc ] < α rejeita-se Ho 
 
Gráfico ilustrativo: 
 
 
 17 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
 
 
 
 
 
 
 
 
 
 
 
 
 
OBS 1: 
Se o número de observações tomadas dentro de cada tratamento for diferente, algumas adaptações às fórmulas 
para a SQTotal e SQTratamentos (principalmente) são necessários: 
IJ
y
ySQtotal
I
i
n
j
ij
i 2
..
1 1
2 −= ∑∑
= =
 
onde: ni = número de repetições do tratamento ij; e 
IJ
y
n
ySQtrat
i i
i
2
..
2
. −= ∑ 
E o quadro da ANOVA continua o mesmo, mudando logicamente, o número de graus de liberdade (g.l.) para 
cada fonte de variação. 
Se isto ocorrer, dizemos que o delineamento é DESBALANCEADO. 
 
OBS 2: 
 Segundo Montgomery (1997, p. 79) são as seguintes as vantagens para se ter um delineamento balanceado. 
(A) Pequenas variações na variância dos tratamentos não afetam tanto a estatística do teste; 
(B) O poder do teste é maximizado. 
 
Exemplo: 
Balanceado; • 
• 
• 
• 
Desbalanceado; 
Balanceado, mas mudando valores dentro de um tratamento; 
Analisando DBC como DIC. 
 
8.6.3. Análise de Variância de Modelos de Efeitos Aleatórios 
Se o fator em estudo tem um grande número de níveis possíveis, e se o 
experimentador seleciona, para estudo, I desses níveis, de uma hipotética população de 
níveis desse fator, então dizemos que o fator é aleatório. Esquematicamente teríamos: 
 
 18 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Pop 
de 
níveis 
do 
fator 
 
I níveis selecionados 
∴ o fator é aleatório 
 
 
 
 
 
 
 
 
 
O modelo estatístico continua o mesmo: 
Yij = µ + ti + eij i = 1, 2, ..., I; j = 1, 2, ..., J 
Porém, agora, também definimos ti uma variável aleatória, assim como os eij. 
Para esses efeitos aleatórios usualmente definimos: 
ti tem média zero e variância , e é independente dos erros e
2
tσ ij. 
Assim, 
 ( ) 22 σσ += tijyV 
OBS: e são chamados componentes de variância e o modelo acima é chamado “modelo de efeito 
2
tσ 2σ
aleatório” ou “modelo de componentes de variância”. 
 
A decomposição da SQTotal é a mesma que no modelo fixo, ou seja: 
SQTotal = SQTrat – SQResíduo 
Uma vez que os níveis do fator usado (selecionado) no experimento foram 
escolhidos aleatoriamente, as interferências são realizadas sobre a população de todos os 
níveis desse fator. 
Para a validade dos testes de hipóteses nesse modelo pressupõe-se: 
(A) eij ~ NID (0, ); 
2σ
(B) ti ~ NID (0, ); 
2
tσ
(C) ti e eij sejam independentes. 
 
Testa-se: 
Ho: = 0 vs Ha: > 0 
2
tσ
2
tσ
Se = 0 todos os tratamentos são idênticos, e t
2
tσ ⇒ i = 0 ∀ i; 
OBS: pois µi = µ i, de modo que t∀ i = µi - µ = 0 ∀ i. 
 19 
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 
Se > 0 existe variabilidade entre tratamentos. 
2
tσ ⇒
Para 1 fator o teste é obtido por: 
QMres
QMtratFcalc = 
e a regra decisória é a mesma que no caso anterior. 
 20 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.7. Experimentos Casualizados em Blocos Completos 
 
Usamos “Blocos” quando queremos controlar fontes de variação conhecidas, 
mas sem interesse para o pesquisador. 
Ex: Corpos de prova oriundos de época diferentes, ou com espessuras variadas, 
ou seja, não-homogêneas. Operadores, equipamentos diferentes. 
Idéia Principal: Eliminar do erro experimental a variabilidade existente entre blocos. 
OBS: veremos nesse tópico o desenvolvimento da ANOVA para modelo de efeitos fixos. No entanto, o 
mesmo procedimento de análise seria usado se tanto tratamento, ou bloco, ou ambos forem aleatórios. 
Logicamente, haveria apenas mudança na interpretação de alguns resultados. 
 
O modelo estatístico para o Delineamento em Blocos Casualizados (DBC) é: 
yij = µ + ti + bj + eij i = 1, 2, ..., I; j = 1, 2, ..., J 
onde , adicionalmente à definição dos componentes do modelo para o delineamento 
inteiramente casualizado, temos, 
bj = efeito do j-ésimo bloco. 
Para efeitos fixos podemos incluir as restrições: 00 == ∑∑
j
j
i
i bet
 
As hipóteses a serem testadas são: 
jia
Io
ummenospeloH
H
µµ
µµµ
≠
===
:
: 21 K
 
É importante notar que, já que a média de cadatratamento 
( ) i
J
j
jii tbtb
+=++= ∑
=
µµµ
1
1
 , equivalentemente poderíamos escrever:, 
iummenospeloparatH
tttH
ia
Io
0:
0: 21
≠
==== K
 
A partição da SQTotal é: 
SQTotal = SQBlocos + SQTrat + SQResíduo 
Onde: 
SQTotal = ∑∑∑∑ −=− ••
i j
ij
i j
ij IJ
yyyy
2
..22)( 
SQBloco = ( ) ∑∑∑ •••••• −=−
j
j
i j
j IJ
y
I
y
yy
22
2 
 
 21 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
SQTtrat = ( ) ∑∑∑ •••••• −=−
i
i
i j
i IJ
y
J
yyy
22
2 
 
e SQResíduo = 2)(∑∑ •••• +−−
i j
jiij yyyy , ou obtida por diferença: 
SQResíduo = SQTotal – SQBloco – SQTrat. 
 
O quadro ANOVA é dado por: 
F.V. g.l. SQ QM Fcalc 
Blocos J - 1 SQBloco 
Tratamento I - 1 SQTrat SQTrat / (I - 1) QMTrat / QMRes 
Resíduo (I - 1)(J - 1) SQRes SQRes / (I - 1)(J - 1) 
Total IJ - 1 SQTotal 
 
A regra decisória será: 
 
Se Fcalc ≥ Fα[(J – 1);(I – 1)(J – 1)] rejeita-se H0 
 
ou 
 
Se P-Value = P[F[(J – 1);(I – 1)(J – 1)] > Fcalc ] < α rejeita-se H0 
 
(a) Realizar o teste para a fonte de variação Blocos não é necessário, mas pode ser útil para auxiliar 
na decisão em usar essa fonte de variação como bloco em experimentos futuros; 
(b) O teste para a fonte de variação blocos é apenas aproximado. Se QMBloco/QMRes for grande, 
indica que o fator bloco teve um efeito grande, e que o uso de blocos no experimento foi 
satisfatório para diminuir o resíduo. Veja Montgomery (1997, p.176). 
 
8.8. Exercícios Propostos – DIC e DBC 
(8.8.1) Um engenheiro avaliou quatro banhos de têmpera para aumentar a dureza de 
peças de aço segundo o DIC, e obteve os seguintes dados numa escala apropriada: 
 Total Média 
A 25 26 20 23 21 115 23 
B 31 25 28 27 24 135 27 
C 22 26 28 25 29 130 26 
D 22 28 27 23 20 120 24 
 
 
Realizar a ANOVA para testar a hipótese de igualdade dos efeitos de tratamentos. Se 
necessário use o nível de significância de 5%. 
 
Resposta: Fcalc = 2,02 QMtrat = 16,66 QMres = 8,25 
 Ftab (5%; (I – 1); I(I – 1)) = 3,24 
 22 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
 Faça essas análises a mão para treinar. Posteriormente a faremos usando o R. 
 
(8.8.2) Usando os mesmos dados do problema 8.8.1, verificar o que ocorreria (ou seja, 
refaça a análise) se os valores obtidos para o tratamento D fossem adicionados de 6 
unidades, ou seja, y4j = y4j antigo + 6. 
(Os novos valores para o tratamento D seriam, então: 28, 34, 33, 29, 26) 
 
Resposta: QMtrat = 41,66 QMres = 8,25 Fcalc = 5,04 
 
OBS: Observe que a diferença entre os valores dentro do tratamento 4 continuou a mesma. Só mudou a 
diferença entre as medidas de tratamento. 
 
(8.8.3) Usando os mesmos dados do problema (8.8.1), verificar o que ocorreria se os 
primeiros valores obtidos para cada tratamento fossem aumentados em 5 unidades, ou 
seja: 
 Total Média 
A 30 26 20 23 21 
B 36 25 28 27 24 
C 27 26 28 25 29 
D 27 28 27 23 20 
 
Resposta: QMtrat = 16,667; QMres = 13,25; Fcalc = 1,26 ns 
 
(8.8.4) Usando os mesmos dados do problema (1), subtraia 25 de cada valor e monte o 
quadro da ANOVA. Ou seja, use os valores: 
Totais Médias
A 0 1 -5 -2 -4 -10 -2
B 6 0 3 2 -1 10 2
C -3 1 3 0 4 5 1
D -3 3 2 -2 -5 -5 -1
 
 
OBS: Lembre-se das propriedades da variância. 
 
(8.8.5) Pág. 177 Montgomery, (descrição do problema pág. 171). Verificar se 4 “TIPS” 
(ponteiras de uma máquina de fazer leituras de força) distintos produzem leituras 
diferentes em máquina de teste de dureza. 
OBS: Um experimento desse tipo poderia ser parte de um estudo de capacidade de “Gage”, ou medição 
de forças. A máquina opera da seguinte maneira: ela pressiona a ponta (tip) sobre um corpo de prova de 
metal. De acordo com a profundidade da depressão causada na peça de metal, sua dureza poderá ser 
determinada (gaged, ou gauged). 
• 
• 
Foram usada 4 repetições de cada tipo; 
Fator: Tipo de TIP. 4 níveis (ou tipos); 
 23 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
• 
• 
Devido à variabilidade na origem dos corpos de prova “blocos”; 
Portanto cada tipo de TIP foi atribuído uma vez a corpos de prova homogêneos. 
Os dados, na escala de dureza C de Rockewell estão apresentados abaixo. A tabela da 
direita apresenta os dados codificados: Y = (X – 49,5) x 10: 
 
 Tipo
de Ponto 1 2 3 4 Yi.
1 -2 -1 1 5 3
2 -1 -2 3 4 4
3 -3 -1 0 2 -2
4 2 1 5 7 15
Y.j -4 -3 9 18 20
Blocos
 
 
 
 
 
Tipo
de Ponto 1 2 3 4
1 49,3 49,4 49,6 50,0
2 49,4 49,3 49,8 49,9
3 49,2 49,4 49,5 49,7
4 49,7 49,6 50,0 50,2
Blocos
Solução (usando tabela da direita): 
 
 
( )
( )
00,850,8250,3800,129
50,82
16
20189)3()4(
4
11cos
50,38
16
2015)2(43
4
11
00,129
16
2000,154
2
2222
2
..2
.
2
2222
2
..2
.
22
..
4
1
4
1
2
=−−=
=−++−+−=−=
=−+−++=−=
=−=−=
∑
∑
∑∑
= =
SQres
IJ
yy
I
SQblo
IJ
yy
J
SQtrat
IJ
yySQtotal
j
i
i j
ij 
 
 
 
 
 
 
 
 
 
F.V. g.l. SQ QM F
Blocos 3 82,50 27,50
Trat. 3 38,50 12,83 14,40
Res. 9 8,00 0,89
Total 15 129,00 
P-Value = 0,0009 
ou 
Fcrit = F (5%;3;9) = 3,86 
 
Como Fcalc> Ftab ⇒ rejeita-se Ho 
ou 
Avalia pelo P-Value. 
 
Já que o F foi significativo, então 
4321: µµµµ ===oH foi rejeitada 
 
(8.8.6) Usando os dados originais do problema 8.8.5, ou seja, sem usar a recodificação, 
monte o quadro da ANOVA e conclua (use α = 5%, se desejar). Depois compare esse 
quadro da ANOVA obtido com aquele obtido no problema 8.8.5, e também o resultado 
do teste F nas duas análises. Discuta. 
 
(8.8.7) Considere os mesmos dados codificados do problema 8.8.5. Suponha que foi 
feita a completa casualização dos 4 TIPS nos 16 corpos de prova (U.E.). Suponha que as 
mesmas atribuições de valores ocorrem conforme tabela de dados inicial. A ANOVA 
segundo um DIC seria: 
 
 24 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
F.V. g.l. SQ QM F
Trat. 3 38,50 12,83 1,70
Res. 12 90,50 7,54
Total 15 129,00 
F (5%;3;12) = 3,49 
∴ não rej. Ho 
 
OBS.: sabemos que essa análise estaria incorreta no sentido de que não poderíamos confiar na sua 
interpretação já que havia diferenças sistemáticas (blocos) entre os corpos de prova. 
 
Conclusão: O DBC reduziu a variação sistemática o suficiente de modo que pequenas 
variações entre os tratamentos pudessem ser detectadas. 
 
(8.8.8.) Pense sobre as seguintes considerações e depois realize os problema propostos 
 
OBS 1: O fato de ser significativo a determinado nível de significância, o teste F não indica quais médias 
de tratamentos são diferentes entre si, exceto quando o tratamento (fator) possuir apenas 2 níveis. 
 
OBS 2: Se o tratamento possuir apenas 2 níveis, o teste F será equivalente será equivalente ao teste T. Na 
verdade, Fcalc = (Tcalc)² 
 - Se amostras independentes: teste T para 2 médias ≡ teste F do DIC; 
 - Se dados são pareados: teste T para dados pareados ≡ teste F do DBC. 
 
Exemplo: (use seu material de Estatística Aplicada ou de Estatística Experimental para 
conhecer as fórmulas necessárias na resolução desse problema) 
 
Seja: X = {X1 = 4; X2 = 10; X3 = 5; X4 = 3; X5 = 8} 
Y = {Y1 = 2; Y2 = 7; Y3 = 1; Y4 = 2; Y5 = 8} 
 
(A) Considere X = tratamento 1 e Y = tratamento 2 e compare as medidas entre os dois 
tratamentos pelo teste t e pelo teste F da ANOVA de um DIC com 5 repetições. 
Compare os resultados. 
(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um 
teste da ANOVA de um DBC com 5 blocos. Compare os resultados. 
 
OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as medidas 
podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos 
sobre o teste de Tukey e o teste de Duncan. 
 
 
 
 25 
INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli 
 
 (B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um 
teste da ANOVA de um DBC com 5 blocos. Compare os resultados. 
 
OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as médias 
podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos 
sobre o teste de Tukey e o teste de Duncan. 
8.9. Teste de Tukey 
É usado para testar qualquer contrastes entre 2 médias. Este teste é exato quando 
o número de repetições for o mesmo para cada tratamento. Tem por base a diferença 
mínima significativa (dms) representada por ∆ e dada por: 
)ˆ(ˆ
2
1 CVq=∆ 
em que: 
(é a amplitude total estudentizada)( )nIfq
mmC
,,
ˆˆˆ 21
α=
−=
 
 
 
 
 
 
De modo geral, 





+=∆
21
11
2 rr
QMresq onde r1 e r2 são as repetições dos 
tratamentos 1 e 2, respectivamente. 
 
Se r1 = r2 = J ⇒ J
QMresq=∆ , que é a fórmula usual encontrada em vários 
livros de estatística. 
 
 
OBS 1: 
1
21
11
2
1
−












+=
rr
J corresponde à média harmônica das repetições de tratamentos. 
 
OBS 2: No SAS – Se temos I tratamentos, cada qual com diferentes números de repetições, o SAS obtêm 
um único ∆ fazendo J = média harmônica do número de repetições. 
Nº de tratamentos g.l. do resíduo 
 26 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.9.1. Procedimento 
Testamos: 
 
Ho: mi = mj 
 para i ≠ j 
Ha: mi ≠ mj 
 
Obtemos ∆, a diferença mínima significativa: 
Calculamos todas as estimativas dos contrastes ( ) entre 2 médias; ĉ• 
• Comparamos | c | com ∆; ˆ
- Se | c | ∆ o contraste é significativo ao nível α de probabilidade. 
Então há diferença entre médias de tratamentos a esse nível de 
significância; 
ˆ ≥ ⇒
- Se | c | < ∆ ⇒ o contraste não é significativo. ˆ
OBS: Pode acontecer de o teste F da ANOVA ser significativo, mas não ser encontrado nenhum teste 
significativo pelo teste de Tukey. Ver Pimentel Gomes. 
 
Exemplo 8.9.1.1: 
Considere o exercício 8.8.2, onde m , QMres = 
8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Tukey. 
30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm
Solução: 
2,5
5
25,805,4
5
1
5
1.25,8.
2
1
)16;4%(5 ==




 +=∆ q • 
Ordenar as médias. Indicar com letras iguais médias “iguais” • 
 
o
o
o
o
Hrejnãomm
Hrejmm
Hrejnãomm
Hrejnãomm
bm
bam
bam
am
.42327ˆˆ
.72330ˆˆ
.42630ˆˆ
.32730ˆˆ
23ˆ
26ˆ
27ˆ
30ˆ
12
14
34
24
1
3
2
4
⇒∆>=−=−
⇒∆>=−=−
⇒∆<=−=−
⇒∆<=−=−
=
=
=
=
 
 
 27 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Conclusão: As médias seguidas de pelo menos uma mesma letra não diferem entre si ao 
nível de 5% de probabilidade pelo teste de Tukey. 
 
Exercício 8.9.1.2: 
Supor um experimento com 5 tratamentos e 6 repetições, cuja análise está 
apresentada a seguir: 
FV G.l. SQ QM F p-value 
trat 4 328,8 82,2 14,05 3,8×10-6 
Res 25 146,25 5,85 
Total 29 475,05 
obs.: F-tab = F(5%; 4; 25) = 2,76 
 
1m̂ = 25; = 31; = 24; = 22; = 29. 2m̂ 3m̂ 4m̂ 5m̂
 
Comparar as medias de tratamentos usando o teste de Tukey (se necessário use α = 5%) 
Resposta: 
Tratamentos 
2 a 
5 a b 
1 b c 
3 c 
4 c 
Médias seguidas de uma mesma letra não 
diferem entre si, pelo teste de Tukey, ao 
nível de 5% de significância. 
8.10. Teste de Duncan 
Também é usado para testar contrastes entre 2 médias. É um concorrente ao teste 
de Tukey. Para ser exato exige que todos os tratamentos tenham o mesmo número de 
repetições. Comparado ao teste de Tukey, o teste de Duncan discrimina mais os 
tratamentos, isto é, o teste de Ducan pode indicar resultados significativos em casos em 
que o teste de Tukey não indicaria. 
Nesse sentido dizemos que o teste de Tukey é mais rigoroso que o teste de 
Duncan. 
Fórmula Geral: 






+==
21
11
2
1)ˆ(ˆ
2
1
rr
QMresZCVZD iii 
onde: 
( )',, nnfZ ii α= 
Nº de médias ordenadas 
abrangidas pelo contraste 
g.l do resíduo 
 
 
 
 
 28 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
OBS: 





+=
21 r
1
r
1QMres
2
1)Ĉ(V̂
2
1
 se r1 = r2 = r 
 
8.10.1.Procedimento 
 Vamos explicar o procedimento desse teste usando um exemplo. 
 
Exemplo 8.10.1.1. 
Considere o exercício 8.8.2, onde m , QMres = 
8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Duncan. 
30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm
 
Ho: mi = mj • 
• 
• 
 para i j; ≠
Ha: mi ≠ mj 
 
Ordenar as médias de modo crescente; 
Encontrar o valor de Di para a maior abrangência de médias (no caso Di = D4). 
Comparar com as estimativas do contraste e, se for significativo, encontrar um 
novo Di (no caso Di = D3) para uma menor abrangência, e assim sucessivamente. 
 
23ˆ
26ˆ
27ˆ
30ˆ
1
3
2
4
=
=
=
=
m
m
m
m
 ou com letras 
bm
bam
bam
am
23ˆ
26ˆ
27ˆ
30ˆ
1
3
2
4
=
=
=
=
 
 
OBS: No caso, o resultado foi igual ao do teste de Tukey, mas nem sempre é assim 
 
oHrejDmm
ZD
.72330ˆˆ
149,4
5
25,823,3
5
25,8
414
)16;4%;5(4
⇒>=−=−
===
 
 
o
o
HrejnãoDmm
HrejnãoDmm
ZD
.42327ˆˆ
.42630ˆˆ
04,4
5
25,815,3
5
25,8
312
334
)16;3%;5(3
⇒<=−=−
⇒<=−=−
===
 unir e com uma barra; 4m̂ 3m̂
idem. 
 
 
 29 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Conclusão: as médias unidas por uma mesma barra não diferem entre si, ao nível 
de 5% de significância, pelo teste de Duncan. 
• 
 
OBS 1: Nem sempre as comparações realizadas pelo teste de Duncan e pelo teste de Tukey são 
coincidentes. 
- Alterar os valores dos dados no computador e proceder à análise novamente, para observar esse 
resultado. 
OBS 2: No teste de Duncan, quando, numa determinada abrangência, a maior média não diferir 
significativamente da menor, não se admitirá diferença significativa, pelo mesmo teste, entre médias 
intermediárias. 
 
Exemplo 8.10.1.2. 
Realize o teste de Duncan para o problema 8.8.5. Use α = 5%. 
 
75,300,175,050,0 .4.2.1.3 ===−= yyyy QMres = 0,89 
344.3.4
9;4%;544
:.67,125,4)50,0(75,3
67,147,0.41,3
4
89,0
µµ =⇒=>=−−=−
====
oHrejDyy
Z
J
QMresZD
 
323.3.2
143.1.4
9;3%;533
:.57,105,1)50,0(00,1
:.57,100,375,075,3
57,147,0.34,3
4
89,0
µµ
µµ
=⇒=<=−−=−
=⇒=>=−=−
====
o
o
HrejnãoDyy
HrejDyy
Z
J
QMresZD
 
 
242.2.4
9;2%;522
:.50,175,200,175,3
50,147,0.20,3
4
89,0
µµ =⇒=>=−=−
====
oHrejDyy
Z
J
QMresZD
 
Então: 
Comparações 
875,495,49
10
.4
.4 =+=
y
y a 
.2y = 49,600 b 
.1y = 49,575 b 
.3y = 49,450 b 
 
 30 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Exercício 8.10.1.3. 
Realize o teste de Duncan para os dados do exercício 8.9.1.2. 
Resposta: 
Tratamentos 
2 a 
5 a 
1 b 
3 b 
4 b 
 
Exercício 8.10.1.4. 
Compare os resultados dos exercícios 8.9.1.2 e 8.10.1.3. O que poderia ser 
concluído a respeito do rigor de cada teste? Qual seria o teste menos rigoroso, no 
sentido de apresentar resultados significativos com maior facilidade? 
8.11. Análise de Resíduos 
Essa análise pode ser útil para verificar a adequação do modelo utilizado na 
análise de variância. 
Nos tópicos anteriores foi comentado que as pressuposições para validade do 
teste realizado numa análise de variância eram que os erros deveriam ser independentes, 
não correlacionados, e normalmente distribuídos com média zero e com variância 
comum . Assim, após usarmos um determinado modelo estatístico, podemos estimar 
os erros pelos seus resíduos (e ) e avaliarmos esses resíduos como forma de inferirmos a 
respeito dos erros aleatórios. Ou seja, obtemos 
2σ
ˆ
ijijij yye ˆˆ −= 
onde corresponde ao valor estimado a partir do modelo. ijŷ
Por exemplo, consideremos o caso em que podemos usar o delineamento 
inteiramente casualizado(DIC) ou o delineamento em blocos casualizados (DBC). 
Se for o DIC: 
.ˆˆ
)(ˆˆˆ
iijiijij
iiiijijiij
yyyyeentão
yyyytycomety
−=−=
=−+=+=++=
•
••••••µµ
 
 
Se for o DBC: 
 31 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
••••
••••••••••••
+−−=−=
−+=−+−+=
++=+++=
yyyyyyeentão
yyyyyyyyy
btycomebty
jiijijijij
jijiij
jiijijjiij
ˆˆ
)()(ˆ
ˆˆˆˆ µµ
 
 
Obtidos os resíduos, estes poderiam ser plotados de diversas formas, 
dependendo do interesse de análise. Para cada modelo existem gráficos comuns ou mais 
apropriados. 
8.11.1. Gráficos Usuais 
DIC 
Resíduos contra o tempo – para avaliar pressuposição de independência; • 
• Resíduos contra médias .iy – para avaliar pressuposição de homogeneidade de 
variância; 
Probabilidade normal para os resíduos – para avaliar pressuposição de 
normalidade; 
• 
 
OBS: Existem também, alguns testes estatísticos para checar cada uma dessas pressuposições. No entanto 
tais testes não serão discutidos nesse curso. 
 
DBC 
• Resíduo contra valores ajustados – não deve representar nenhum 
relacionamento da magnitude dos resíduos e os valores ajustados. Se ocorrer, no 
gráfico, uma forma curvilínea, poderia implicar a presença de interação entre 
tratamentos e blocos. Poderia existir outro tipo de disposição dos pontos no 
gráfico indicando a presença dessa interação. Uma situação de forma curvilínea 
no gráfico poderia acarretar, por exemplo, resíduo negativo para baixos e altos 
valores ajustados, e resíduo positivos para valores ajustados intermediários. 
.ˆ iy
Resíduos contra tratamentos e contra blocos – para verificar a pressuposição de 
homogeneidade de variância nos tratamentos e nos blocos; 
• 
• Gráficos de probabilidade normal dos resíduos – para avaliar a normalidade dos 
resíduos. Proximidade de uma certa linha reta indica normalidade; 
OBS: Tipos comuns de gráficos serão apresentados em aula. 
 32 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.11.2. Exemplos 
Para cada exercício apresentado nessa apostila realize a análise de resíduos 
seguindo o roteiro “tutorial para análise de resíduos”. Exemplos também serão 
apresentados em sala de aula. 
Observe o arquivo existente nos tutoriais do R para INF 460, disponibilizado no 
link www.dpi.ufv.br/~peternelli/inf460/materiais.htm referente aos exercícios 8.8.5 e 
8.8.7 (nome do arquivo: anares.exemplo.8.8.5.pdf). Com os comandos apresentados 
nesse tutorial, após fazer pequenas adaptações, é possível você fazer análise de resíduos 
para outros exercícios, se desejar. 
8.12. Escolha do Número de Repetições 
Esse tópico provavelmente não será apresentado em aula. Porém o assunto estará 
sendo incluído nesse material por se tratar de informações interessantes para 
conhecimento geral do estudante. Aqueles interessados em mais informação poderão 
entrar com contato com o professor da disciplina ou buscar maiores detalhes em livros 
que abordam o assunto. A não ser que o problema seja novo, na prática o pesquisador já 
tem uma idéia do número de repetições a ser usado, baseado em resultados de 
experimentos prévios ou de artigos publicados na mesma linha de pesquisa. Uma 
decisão crítica em qualquer planejamento de delineamento experimental é a 
determinação do número de repetições dos tratamentos a ser usado. De modo geral: 
Se o interesse reside em detectar pequenos efeitos, então se deve utilizar um 
maior número de repetições; 
• 
• 
• 
• 
• 
Se o interesse reside em detectar grandes efeitos, então pode ser utilizado um 
menor número de repetições. 
 
Montgomery (1997) discute 3 métodos (pág. 126 – 132): 
Baseado nas curvas características de operação; 
Baseado na especificação do aumento do desvio-padrão; 
Baseado na estimação do Intervalo de Confiança. 
Exemplificaremos apenas o primeiro. 
Para o método baseado nas curvas características de operação, Montgomery 
(1997, pág. 126) apresenta um interessante embasamento teórico e motivacional. 
 33 
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.12.1. Curva Característica de Operação 
É um gráfico onde no eixo das ordenadas (y) temos a probabilidade do erro tipo 
II de um teste estatístico para um determinado tamanho amostral, e no eixo das 
abscissas (x) temos valores de um parâmetro que reflete o quanto a hipótese nula é falsa. 
Com o uso dessas curvas (C.C.O.) pode-se selecionar o número de repetições 
necessárias de modo que o delineamento possa ser útil em detectar diferenças 
potencialmente importantes entre os tratamentos. 
Seja a realização de uma ANOVA. A probabilidade do erro tipo II é definida 
como: 
β = 1 – P (rejeitar Ho / Ho é falsa) 
 = 1- P [(Fcalc > Fcrit) / Ho é falsa)] 
onde Fcrit = F(α; g.l. numerador; g.l. denominador) 
 
 I - 1 I(I – 1) para o DIC, por exemplo 
 
Para calcular a probabilidade indicada acima é necessário conhecer a 
distribuição da estatística do teste (Fcalc) quando Ho é falsa. É possível demonstrar que 
quando Ho é falsa, Fcalc tem distribuição F não central com (I – 1) e I(J – 1) graus de 
liberdade e parâmetro de não-centralidade . Quando = 0 então a distribuição F 
não-central passa a ser a distribuição F central usual. 
λ λ
As C.C.O. são usadas para avaliar a expressão probabilística discutida acima. 
Nessas curvas, no eixo das abscissas tem-se um parâmetro φ ,onde φ é relacionado ao 
parâmetro de não-centralidade λ discutido anteriormente. 
Nesse material estão apresentadas as C.C.O. para α = 0,05 e α = 0,01, e para um 
conjunto de valores do grau de liberdade do numerador e do denominador. (Extraído de 
Drumond, Werkema e Aguiar – 1996). 
A função do φ mais prática para que seja usado numa C.C.O. é: 
2
2
2
2 σ
φ
I
JD
= 
 
onde: 
2σ = variabilidade da variável resposta de interesse; 
I = número de tratamentos; 
J = número de repetições (a ser escolhido); 
D = diferença mínima que se deseja detectar entre as médias de 2 tratamentos. 
 34 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
 
Para prática, isso significa que só faz sentido considerar que 2 médias não são 
equivalentes se a diferença entre elas for igual ou superior a D. 
 
OBS: Para fatores de efeitos aleatórios veja Montgomery, 1997 pág. 129. 
8.12.1.1. Exemplo do Uso das C.C.O. 
 (pág. 79 Werkema e Aguiar 1996) 
 
Suponha que desejemos obter o número de repetições para um DIC com um 
único fator em três níveis; 
• 
• 
• 
Suponha que desejemos rejeitar H0 com pelo menos 95% de probabilidade, se a 
diferença entre as médias de 2 níveis quaisquer fosse superior a 2 unidades de 
medida em questão; 
Suponha que, por conhecimento prévio, tenhamos σ = 1. 
 
Assim, os seguintes passos poderiam ser considerados: 
 
(A) Fixar o nível de significância α (5 ou 1%). 
(B) Determinar a diferença mínima que se deseja detectar entre as médias de 2 
tratamentos (ou seja, definir um valor para D). 
(C) Fixar a probabilidade mínima (1 - β) com a qual se deseja detectar a diferença D. 
(D) Determinar uma estimativa para a variabilidade da variável resposta, σ . 
(E) Calcular 2
2
2
2 σI
JD
=φ como uma função de n, onde I é o número de níveis do fator. 
(F) Utilizando o gráfico da C.C.O. apropriado, apresentado em diversos livros, 
determinar o valor de n por tentativa. 
 
Para o exemplo acima teríamos: 
(A) α = 5%; 
(B) D = 2; 
(C) 1 – β = 0,95; 
(D) σ = 1; 
(E) J
JJ
I
JD 67,0
6
.4
1.3.2
2.
2 2
2
2
2
2 ====
σ
φ 
 35 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
(F) Utiliza-se a C.C.O. para V1 = I – 1 = 3 – 1 = 2 e V2 = I(J – 1) = 3(J – 1) graus de 
liberdade, com α = 5%. 
 
Continuando o exercícios temos, chute inicial: J= 5 
O resultado obtido foi: (figura 2B, em anexo) 
Portanto: φ )15.(31283,135,35.67,0 2
2 −===⇒== Veφ
Observando na figura 2B, o valor de β (eixo das ordenadas) seria 
aproximadamente 0,29, de forma que 1 (poder do teste). Este valor 
é inferior ao 0,95 desejado em (C). Isso implica que J = 5 repetições não é suficiente. 
71,029,01 =−≈− β
Agora, deveríamos escolher outro valor de J, sendo J > 5, e continuar o 
procedimento até que 1 seja maior que 0,95. β−
A seguinte tabela é apropriada: 
J 2φ φ I(J – 1) β 1 – β 
5 3,35 1,83 12 0,29 0,71 
8 5,36 2,32 21 0,075 0,925 
9 6,03 2,50 24 0,035 0,965 
 
Portanto, pelo menos J = 9 unidades experimentais deveriam ser submetidas a 
cada nível do fator, para satisfazer à condição estabelecida inicialmente para o poder do 
teste. 
 
OBS: Para experimentos no DBC faríamos de modo similar nos passos (A), (B), (C) e (D), porém,: 
(E) calcular 2
2
2
2 σa
bD
=φ onde b = número de repetições (ou blocos) a serem determinados ( J) e a = ≡
número de níveis do fator em estudo ( ) I≡
(F) Obter a C.C.O. para V1 = a – 1 e V2 = (a – 1)(b – 1) 
 
 
 g.l. denominador g.l. numerador 
 
b é, então, obtido por tentativa. 
 36 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.13. Análise de Regressão 
A análise de regressão consiste na realização de uma análise estatística com o 
objetivo de verificar a existência de uma relação funcional entre uma variável 
dependente com uma ou mais variáveis independentes. Em outras palavras consiste na 
obtenção de uma equação que tenta explicar a variação da variável dependente pela 
variação do(s) nível(is) da(s) variável(is) independente(s). 
Para tentar estabelecer uma equação que representa o fenômeno em estudo pode-
se fazer um gráfico, chamado de diagrama de dispersão, para verificar como se 
comportam os valores da variável dependente (Y) em função da variação da variável 
independente (X). 
O comportamento de Y em relação a X pode se apresentar de diversas maneiras: 
linear, quadrático, cúbico, exponencial, logarítmico etc. Para se estabelecer o modelo 
para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um modelo 
matemático que mais se aproxime dos pontos representados no diagrama de dispersão. 
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se 
ajustar perfeitamente à curva do modelo matemático proposto. Haverá na maior parte 
dos pontos, uma distância entre os pontos do diagrama e a curva do modelo matemático. 
Isto acontece, devido ao fato do fenômeno que está em estudo, não ser um fenômeno 
matemático e sim um fenômeno que está sujeito a influências que acontecem ao acaso. 
Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos 
valores observados de Y em função da variação dos níveis da variável X. 
No entanto o modelo escolhido deve ser coerente com o que acontece na prática. 
Para isto, deve-se levar em conta as seguintes considerações no momento de se escolher 
o modelo: 
• O modelo selecionado deve ser condizente tanto no grau como no aspecto da 
curva, para representar em termos práticos, o fenômeno em estudo; 
• O modelo deve conter apenas as variáveis que são relevantes para explicar o 
fenômeno; 
Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um 
pouco distantes da curva do modelo matemático escolhido. Um dos métodos que se 
pode utilizar para obter a relação funcional, se baseia na obtenção de uma equação 
estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos da 
curva do modelo matemático, no todo, sejam as menores possíveis. Este método é 
 37 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
denominado de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a 
soma de quadrados das distâncias entre os pontos do diagrama e os respectivos pontos 
na curva da equação estimada é minimizada, obtendo-se, desta forma, uma relação 
funcional entre X e Y, para o modelo escolhido, com um mínimo de erro possível. 
Veremos, em apenas uma aula, como realizar uma ANOVA para regressão, e 
como interpretar seus resultados. Serão apresentadas apenas suas fórmulas usuais e sua 
interpretação, finalizando com um exemplo, executado no computador, para regressão 
linear simples e um para regressão linear múltipla. 
O problema básico da Análise de Regressão consiste em: 
(A) Estimar os parâmetros do modelo estatístico admitido; 
(B) Realizar testes de significância para estes parâmetros; 
(C) Obter intervalos de confiança para estes parâmetros; 
(D) Checar a adequabilidade do modelo utilizado, usando análise de resíduos por 
exemplo, e sua adequação ao problema real em questão; 
(E) Dependendo dos resultados anteriores definir um novo modelo e refazer os passos 
acima 
Veremos, primeiramente, e usando um exemplo com poucos dados hipotéticos, a 
análise da regressão linear simples. Posteriormente, usando também um exemplo com 
poucos dados hipotéticos será dada uma noção da análise da regressão linear múltipla. 
8.13.1. Modelo linear de 1º grau (Regressão Linear Simples) 
O modelo estatístico para esta situação seria: 
iii eXY ++= 10 ββ 
em que: 
=iY valor observado para a variável dependente Y no i-ésimo nível da variável 
independente X. 
=0β constante de regressão. Representa o intercepto da reta com o eixo dos Y. 
=1β coeficiente de regressão. Representa a variação de Y em função da variação de 
uma unidade da variável X. 
=iX i-ésimo nível da variável independente X ( )ni ,,2,1 K=
=ie é o erro aleatório; está associado à distância entre o valor observado Yi e o 
correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X. 
 38 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Para se obter a equação estimada, vamos utilizar o MMQ, visando a 
minimização dos erros. Assim, tem-se que: 
ii Xe 10 ββ −−= iY . 
Elevando ambos os membros da equação ao quadrado, 
[ ]2102 ii Xe ββ −−= iY . 
Aplicando o somatório, 
[ ]∑∑
==
−−=
n
i
i
n
i
i Xe
1
2
10
1
2 ββiY (1) 
Por meio da obtenção de estimadores de e , que minimizem o valor obtido 
na expressão anterior (1), é possível alcançar a minimização da soma de quadrados dos 
erros. 
0β 1β
Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação ao 
parâmetro de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente, 
ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados. 
Derivando então a expressão (1) em relação a e , e igualando-as a zero, 
poderemos obter duas equações que, juntas, vão compor o chamado sistemas de 
equações normais. A solução desse sistema fornecerá: 
0β 1β
( )
∑ ∑
∑ ∑ ∑
−
−
=
n
x
x
n
yx
yx
i
i
ii
ii
2
2
1β̂ =
x
xy
SQD
SPD
 e XY 10 ˆˆ ββ −= 
Uma vez obtidas estas estimativas, podemos escrever a equação estimada: 
ii XY 10 ˆˆˆ ββ += 
8.13.1.1. Teste de hipótese na regressão linear simples 
Após ajustar uma equação de regressão devemos verificar sua adequabilidade, 
por meio de testes de hipóteses para os parâmetros do modelo e/ou a construção de 
intervalos de confiança. Para tal intento precisamos da pressuposição adicional de que 
os erros tenham distribuição normal. 
Em outras palavras, a equação estimada obtida, apenas estabelece uma relação 
funcional, entre a variável dependente e a variável independente, para representar o 
fenômeno em estudo. Portanto a simples obtenção da equação estimada não responde ao 
 39 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
pesquisador se a variação da variável independente influencia significativamente na 
variação da variável dependente. 
Para se responder a esta pergunta, é necessário realizar um teste estatísticopara 
as estimativas dos coeficientes da equação de regressão estimada. Um teste que pode ser 
realizado para verificar tal fato é o teste F da análise de variância e/ou o teste t. 
Portanto, é necessário realizar uma análise de variância dos dados observados, em 
função do modelo proposto. 
Como temos dois parâmetros no modelo Y , poderíamos realizar 
os seguintes testes: 
iii eX ++= 10 ββ
H0: β1 = β1* versus Ha: β1 ≠ β1* 
H0: β0 = β0* versus Ha: β0 ≠ β0* 
Em cada caso a estatística do teste e as conclusões seriam: 
tcalc = 
)ˆ(ˆ
ˆ
1
*
11
β
ββ
V
−
, onde 
xSQD
2
1
ˆ
)ˆ(ˆ σβ =V 
regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0 
tcalc = 
)ˆ(ˆ
ˆ
0
*
00
β
ββ
V
−
, onde 





+=
xSQD
X
n
2
2
0
1ˆ)ˆ(ˆ σβV 
regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0 
OBS.: σ = estimativa da variância dos erros = 2ˆ
2
Re
−n
sSQ = 
2
ˆ
1
−
−
n
SPDSQD xyy β 
Um caso especial muito importante seria: H0: β1 = 0 versus Ha: β1 ≠ 0. Essas 
hipóteses estão relacionadas com a significância da regressão. Não rejeitar H0 é 
equivalente a concluir que não há relação linear entre X e Y. Por outro lado, se H0: β1 = 
0 for rejeitado indicaria que X é importante para explicar a variabilidade em Y. Veja 
ilustrações apresentadas em aula, para alguns casos especiais. 
De maneira alternativa poderíamos testar a significância da regressão pelo 
método da Análise de Variância (ANOVA). 
O método da ANOVA consiste em fazer uma partição da variabilidade total da 
variável resposta Y em outros componentes de acordo com o modelo e o teste a ser 
feito. Assim a seguinte identidade pode ser verificada: 
222 )ˆ()ˆ()( ∑∑∑ −+−=− YYYYYY iii , 
ou, em outra palavras, 
 40 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
SQTotal = SQRegressão + SQResíduo, 
onde 
SQTotal = variação total em Y = SQDY 
SQRegressão = variação em Y explicada pela regressão ajustada = SPD1β̂ XY, de modo 
que 
SQResíduo = SQRes = variação não explicada pela regressão = SQDY - SPD1β̂ XY. 
Baseado nessa identidade o seguinte quadro pode ser montado: 
FV GL SQ QM F 
Regressão 1 SQReg QMReg = SQReg 
sQM
gQM
Re
Re 
Resíduo, ou 
Independente da 
Regressão 
n – 2 SQRes 
QMRes = 
2
Re
−n
sSQ - 
Total n – 1 SQTotal 
 
A estatística F obtida no quadro acima também serve para testar a significância 
da regressão, ou seja, testar H0: β1 = 0 versus Ha: β1 ≠ 0. 
regra de decisão: Se Fcalc ≥ F(α, 1, n-2) ⇒ rejeita H0, 
ou conclui-se de acordo com o p-value. 
 
OBS.: Se regressão linear simples, e para H0: β1 = 0 temos que (tcalc)2 = Fcalc 
 
8.13.1.1.1.Exemplos: 
Exercício 8.13.1.1.1.1. 
Para verificar se existe relação linear de primeiro grau entre umidade relativa (UR) do ar 
de secagem de sementes e a germinação das mesmas, um pesquisador realizou um 
experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados 
(dados hipotéticos) 
% UR 20 30 40 50 
% germinação 94 96 95 97 
a) Obter as estimativas do β0 e do β1 considerando o modelo proposto; 
b) Obter o quadro da ANOVA para checar a significância da regressão, ou seja, se 
existe efeito da UR do ar de secagem na % de germinação. Se necessário use α = 
5%; 
c) Realize o teste t para o coeficiente de regressão. Se necessário use α = 5%; 
 41 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
d) Compare os resultados dos itens b e c; 
e) Qual seria a % de germinação esperada quando UR = 45 %? 
f) Como deveria ser apresentada, num relatório técnico, a equação de regressão 
ajustada para esse exemplo? 
R.: a) = 92,7; = 0,08 . Algumas das outras respostas podem ser obtidas no 
endereço 
0β̂ 1β̂
www.dpi.ufv.br/~peternelli/inf460/materiais.htm. 
 
Exercício 8.13.1.1.1.2 
Adaptado dos dados existentes em algumas calculadoras de bolso. Um engenheiro está 
interessado em avaliar o efeito da temperatura sobre o comprimento de certa peça 
metálica. Para isso obteve cinco corpos de prova de mesmo comprimento inicial (certa 
unidade de medida) e os submeteu a 5 temperaturas (oC) diferentes. Os dados estão 
apresentados abaixo. 
Temperatura 10 15 20 25 30 
Comprimento 1003 1005 1010 1011 1014 
Pede-se: (use α = 5% se necessário) 
a) Obter o diagrama de dispersão dos dados; 
b) Ajustar a equação de regressão baseado no modelo de uma regressão linear 
simples e traçar a reta no diagrama obtido em a; 
c) Interpretar as estimativas dos parâmetros obtidas; 
d) Checar a significância da regressão por meio da ANOVA; 
e) Checar a significância da regressão por meio do teste t; 
f) Qual seria o comprimento esperado da peça quando a temperatura for igual a 
17oC? 
g) Qual seria o comprimento esperado da peça quando a temperatura for igual a 
40oC? 
h) (Calibração) Qual deve ser a temperatura a ser usada para que o comprimento da 
barra atinja 1009 unidades de medida? 
Respostas: Realize os cálculos à mão. Depois as compare com os resultados obtidos no 
R, e parcialmente apresentados no endereço: 
 www.dpi.ufv.br/~peternelli/inf460/materiais.htm. 
 
 
 42 
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.13.1.2 Intervalo de Confiança em Regressão Linear Simples 
Complementam, ou substituem, as informações das estimativas pontuais, e seus 
testes de hipóteses, já que fornecem faixas dos possíveis valores que os parâmetros do 
modelo podem assumir, com um nível de confiança 100 (1 – α)% conhecido. 
 
I.C. 100 (1 – α)% para β1 é: 
x
residuo
n SQD
QM
t
1,
2
1
ˆ
−
± αβ 
 
I.C. 100 (1 – α)% para βo é: 
 








+±
−
x
resíduon SQD
x
n
QMt
2
2,
2
0
1ˆ
αβ 
8.13.1.2.1. Exemplos 
Exercício 8.13.1.2.1.1. 
Considerando os dados do exercício 8.13.1.1.1.1. calcule o intervalo de 95% de 
confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de 
confiança para concluir a respeito da significância da regressão. 
 
Exercício 8.13.1.2.1.2. 
Considerando os dados do exercício 8.13.1.1.1.2. calcule o intervalo de 95% de 
confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de 
confiança para concluir a respeito da significância da regressão. 
 
 43 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
8.13.2 Regressão Múltipla 
Modelos que envolvem mais de uma variável explicativa (ou modelos 
polinomiais com uma ou mais variáveis explicativas). 
Para ilustrar esse tópico será usado o exemplo do livro do Werkema e Aguiar, 
página 15, a seguir. 
8.13.2.1. Exemplo Ilustrativo (Werkema e Aguiar pág. 149) 
Uma indústria produz grandes quantidades de Alumina (Al2O3 de elevado teor 
de pureza) para a fabricação de alumínio metálico. A matéria prima para a fabricação de 
alumina é a bauxita, um mineral com cerca de 55% de óxido de alumínio (Al2O3). 
No processo de fabricação da alumina, o teor de Na2O (óxido de sódio) ocluído 
no produto é um fator importante do ponto de vista da qualidade da alumina fabricada. 
O Na2O é uma impureza e, portanto, é desejável que o seu teor na alumina seja o mais 
baixo possível. 
Objetivo da indústria: teor de Na2O ≤ 0,42%. 
Quer-se avaliar como a razão AP2O3/NaOH e a temperatura de reação afetam o 
teor de Na2O final. 
Hidróxido de 
Sódio. Um dos 
reagentes do 
processo 
 
 
 
 
 
Erro aleatório Modelo proposto: 
iiioi eXXY +++= 2211 βββ 
 
 
 Teor de óxido de 
sódio (Na2O) 
ocluído na alumina 
Temperatura 
de reação 
Razão 
Al2O3/NaO
 
 
 
 






sódiodeHidróxido
alumíniodeÓxido
 
Presente na bauxita que entra no 
processo de produção do alumínio 
 
Um dos 
reagentes do 
processo 
 
 
 44 
INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli 
 
Dados: 
 
 
 
Ordem de Teor de Na2O Razão Temperatura
coleta das (%) Al2O3/NaOH (°C)
observações Y X1 X2
1 0,43 0,647 77,1
2 0,39 0,638 78,3
3 0,44 0,651 76,0
4 0,42 0,648 77,9
5 0,43 0,640 74,1
6 0,42 0,643 74,6
7 0,41 0,643 76,0
8 0,46 0,651 73,3
9 0,42 0,650 78,6
10 0,40 0,639 78,7
11 0,39 0,636 77,8
12 0,41 0,641 75,8
13 0,43 0,649 77,3
14 0,39 0,633 76,5
15 0,41 0,645 78,6
16 0,43 0,642 74,7
17 0,40 0,638 75,5
18 0,39 0,635 78,2
19 0,40 0,639 75,9
20 0,40 0,639 76,6
21 0,42 0,645 78,0
22 0,44 0,650 77,2
23 0,40 0,642 78,0
24 0,43 0,648 76,1
25 0,42 0,642 74,6
26 0,39 0,633 77,5
Dados utilizados no estudo do Tipo de Relacionamento existente entre a razão
 Al2O3/NaOH, a temperatura de reação e o teor de Na2O ocluído na Alumina
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Assim, 
262262126126
32321313
22221212
12121111
eXXY
eXXY
eXXY
eXXY
o
o
o
o
+++=
+++=
+++=
+++=
βββ
βββ
βββ
βββ
M
 
 
Na forma matricial teríamos: 
 45 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 












+






















=












26
2
1
2
1
0
226126
2212
2111
26
2
1
1
1
1
e
e
e
XX
XX
XX
Y
Y
Y
MMM
β
β
β
 
3 x 1
 26 x 1 26 x 3 26 x 1
 
 
ou seja, . εβ += XY
 
Pode-se demonstrar que 
 ~
1
~
')'(ˆ YXXX −=β
 












=










−
−
≅




















−
−
−−
=
2
1
0
ˆ
ˆ
ˆ
0051,0
7904,2
9878,0
160,825
923,6
770,10
02,049,063,1
49,066,133293,893
63,193,89355,699
β
β
β
x
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Assim, o modelo ajustado será: 
 
21 0051,07904,29878,0ˆ XXY −+−= 
 
Baseado nessa equação ajustada as seguintes interpretações poderiam ser 
estabelecidas: 
um aumento de uma unidade em X1, com X2 constante aumento médio de 
2,79% em Y; 
⇒• 
• um aumento de um °C em X2, com X1 constante ⇒ redução média de 0,0051% 
em Y; 
 46 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
→0β̂ sem interpretação pois X1 = 0 ou X2 = 0 não ocorrem, além de, nesse 
exemplo, não fazerem sentido. 
• 
Observe que ainda não foi realizado nenhum teste para verificação da validade 
dessa equação ajustada. Portanto, a validade dessas interpretações só se dará após a 
análise de resíduos, seguido dos testes estatísticos apropriados. 
8.13.2.2 Inferência em regressão múltipla 
Suposição: );0(~ 2σNiidsãoei
0
210
)1;(~
01:
0:
HsobKnKF
QMresíduo
oQMregressãF
émenospeloH
H
calc
ia
K
−−=
≠
====
β
βββ L
 
 
Se α/. pHrejFF otabcalc ⇒≥
 
Tabela para obter o Fcalc: 
F.V. g.l. SQ QM Fcalc 
Regressão k SQRegr QMRegr QMReg/QMRes 
Resíduo n-k-1 SQRes QMRes 
Total n-1 
 
OBS1: As expressões para os cálculos das SQ e QM são dadas abaixo. 
 
( )
1
''ˆ'
1
''ˆ
2
−−
−
=
−−
=
−
==
∑
Kn
YXYY
Kn
SQQM
K
n
Y
YX
K
SQ
QM
res
res
i
regr
regr
β
β
 
 
OBS2: Outras fórmulas bastante úteis para o bom entendimento dos cálculos realizados são: 
SQTotal = ∑
=
−
n
i
i yy
1
2)( ; SQRegressão = ∑
=
−
n
i
i yy
1
2)ˆ( ;SQResíduo = ∑ ∑
= =
=−
n
i
n
i
iii eyy
1 1
22)ˆ(
8.13.2.3 Exemplos 
Exemplo 8.13.2.3.1 
Seja X1 = {1, 2, 3, 4, 5}, X2 = {2, 3, 4, 6, 10} e Y = {12, 16, 18, 21, 24} 
 47 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
Pede-se: 
a) Considerando o modelo Y = β0 + β1X1 + β2X2 + ε, obtenha o vetor Y e a matriz 
X; 
b) Obtenha as matrizes X’X e X’y 
c) Obtenha as estimativas dos parâmetros, dado a seguinte (X’X)-1 
 x1 x2 
 1.2256410 -0.6410256 0.1794872 
x1 -0.6410256 1.0256410 -0.4871795 
x2 0.1794872 -0.4871795 0.2564103 
d) Obtenha a média de y; 
e) Obtenha os valores ajustados de y; 
f) Usando as fórmulas dadas na observação 2 acima, calcule a SQTotal, 
SQRegressão e SQResíduo. Monte o quadro na ANOVA e conclua. 
Dica: todas as respostas podem ser obtidas no endereço 
www.dpi.ufv.br/~peternelli/inf460/materiais.htm 
 
Adicionalmente poderíamos testar cada coeficiente separadamente utilizando um 
teste t. 
 
Ho: βj = 0 vs Ha: βj ≠ 0 j = 0, 1, ..., k 
 
( )..1~
ˆ
ˆ
2
lgKnt
C
t
jj
j
calc −−=
σ
β
 
 
onde: ̂ 2σ
onde Cjj corresponde ao elemento ocupando a posição jj na matriz (X’X)-1, com j 
variando de 0 a k. 
( ) ( )1/''ˆ' −−−== KnYXYYQM residuo β
A regra decisória continua sendo: 
Se 0Hserejeitatt tabcalc −⇒≥ 
Ou avalia-se pelo p-value. 
 
Intervalos de confiança também podem ser obtidos para os coeficientes de 
regressão. Um intervalo de 100 (1 – α)% de confiança para βi é dado por: 
 
 48 
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
1,
2
22 ˆˆˆ.ˆ
−−
=
+≤≤−
kntab
jjtabjjjjtabj
tt
CtCt
α
σββσβ
 onde: 
8.14 O Coeficiente de Determinação e o Coeficiente de Determinação Ajustado 
 
2R
2
ajR
Na regressão linear simples, o coeficiente de determinação é representado por r². 
No entanto, para regressão linear múltipla, usamos R², chamado, geralmente, coeficiente 
de determinação múltiplos. 
O R² informa a quantidade reduzida na variabilidade de Y pelo uso das variáveis 
regressoras X1, X2, ..., Xk no modelo. Em outras palavras, o quanto da variação de Y 
que é explicada pelo modelo. 
O R² é dado por: 
total
resíduo
total
regressão
SQ
SQ
SQ
SQ
R −== 12 
 É importante notar que um valor grande do R² não implica, 
necessariamente, que o modelo de regressão é bom. Ao adicionar uma variável ao 
modelo, sempre haverá um incremento no R². Isso ocorre mesmo que a variável incluída 
seja significativa estatisticamente ou não. 
Ex: (um exemplo numérico será visto oportunamente) 
pmReXXY
mreXY
iiioi
iioi
+=→+++=
==++=
22
21
2
1
βββ
ββ
 
 
Portanto, é possível que modelos com R² elevado forneçam predições de novas 
observações ruins ou estimativas de respostas médias ruins. 
Uma alternativa para esse problema de interpretação do R² e uso do R² ajustado, 
definido por: 
( )22 1.11
)1(
)(1 R
pn
n
n
SQ
pn
SQ
R
toal
resíduo
aj −





−
−
−=
−
−
−= 
 49 
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 
 
ou seja, 
total
resíduo
aj QM
QM
R −=12 
 De modo geral o R² ajustado nem sempre aumenta quando variáveis são 
incluídas no modelo. E o mais importante é que o R² ajustado irá diminuir se uma 
variável não importante (estatisticamente não significativa) for adicionada ao modelo. 
OBS: Quando o R² e o forem muito discrepantes, haverá bom indicativo de que termos não 2ajR
significativos tenham sido adicionados no modelo. 
 
8.14.1. Exercícios 
Exercício 8.14.1.1. considere os dados do exercício 8.13.2.3.1. Pede-se: 
a) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + ε. 
b) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + β2X2 + ε, ou 
seja, foi incluído a variável X2 no modelo. Observe agora que X2 é não 
significativo; 
c) Compare os resultados dos coeficientes de determinação 
d) Compare os resultados dos coeficientes de determinação ajustados. 
e) Discuta sobre os resultados obtidos em c e d. 
Respostas: As respostas para esse problema podem ser obtidas no endereço 
eletrônico www.dpi.ufv.br/~peternelli/inf460/materiais.htm, na resolução do 
exercício 8.13.2.3.1. 
 
8.15. Teste para a Falta de Ajustamento 
Quando alguns níveis da variável regressora X (ou combinação de níveis das 
variáveis regressoras Xi) são repetidos, o modelo ajustado pode ser testado usando o 
teste para a falta de ajustamento. Isto freqüentemente ocorre quando a análise de 
regressão esta inserida no contexto de delineamentos experimentais. 
Uma explicação mais teórica, com fórmulas e suas deduções pode

Outros materiais