Prévia do material em texto
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
8. USO DA ANÁLISE DE VARIÂNCIA E DA REGRESSÃO
8.1. Introdução
A estatística é a ciência que lida com a coleta, o processamento e a disposição de
dados (informação) atuando como ferramenta fundamental nos processos de soluções de
problemas.
A estatística trata da coleta de dados informativos e da interpretação destes dados,
facilitando o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja
sendo estudado.
A estatística viabiliza a:
Coleta
Processamento dos dados.
Apresentação
O conhecimento gerado é, então vitalizado por meio do método gerencial (Ciclo
PDCA) para atingir metas.
Atualmente têm sido estimulado e difundido administrações de empresas segundo a
filosofia do Controle de Qualidade.
Três tipos de ações gerenciais são possíveis nestes tipos de empresas, as quais, serão
abordados a seguir.
8.2. Tipos de Ações Gerenciais em Empresas que Valorizam o Controle de Qualidade
(A) Planejamento da Qualidade
Ação: Definir novos padrões (novo produto e novo processo) para atingir as metas
de qualidade, custo, entrega, moral e segurança.
(B) Manutenção da Qualidade
Ação: Cumprir os padrões estabelecidos para o produto e o processo, verificando os
resultados e atuando no processo para corrigir os desvios (anomalias).
(C) Melhoria da Qualidade
Ação: Alterar os padrões estabelecidos no planejamento da qualidade para atingir
novas metas de qualidade, custo, entrega, moral e segurança.
1
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Essas ações são exercidas por meio do Ciclo PDCA:
OBS: Representa o caminho a ser seguido para alcançar certo objetivo.
O Ciclo PDCA é um método gerencial de tomada de decisões para garantir o alcance
das metas necessárias à sobrevivência de uma organização.
Esquema do Ciclo PDCA:
Maiores explicações:
P – Planejamento
Estabelecer metas; •
•
•
Estabelecer o método para alcançar as metas propostas.
D – Execução
Executar as tarefas exatamente como foi previsto na etapa de planejamento;
2
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Coletar dados que serão utilizados na próxima etapa do processo; •
•
•
•
•
•
São essenciais a educação e o tratamento no trabalho.
C – Verificação
Usando os dados previamente coletados, comparar o resultado alcançado com a meta
planejada.
A – Atuação Corretiva
Atuar no processo em função dos resultados obtidos;
Formas de atuação:
- Adotar como padrão o plano proposto, caso a meta tenha sido alcançada;
- Agir sobre as causas do não atingimento da meta, caso o plano não tenha sido
efetivo.
Na utilização desse método de gestão (PDCA) poderá ser preciso:
Empregar ferramentas estatísticas para:
- Coleta;
- Processamento; necessárias à condução das etapas do PDCA
- Disposição das informações.
Dependendo do tipo de ação gerencial executado e, dentro de cada tipo de ação,
podem ser utilizadas diferentes ferramentas estatísticas.
Segundo Werkmam e Aguiar (1996) uma boa abordagem sobre o assunto pode ser
encontrado em Campos (1994 e 1995).
Uma breve abordagem sobre o assunto será feita a seguir.
8.3. Uso do Planejamento de Experimentos no Ciclo PDCA
Apesar do uso da estatística ser fundamental em diversas etapas dos vários tipos de
ações gerenciais (como o uso de gráficos, estatísticas descritivas, análise de regressão, etc.),
será apresentado inicialmente apenas o uso de planejamento e análise de experimentos de
algumas ações.
Ação: Planejamento de Qualidade
Ao desenvolver a característica do produto que atendam as necessidades dos
clientes;
•
3
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Ao desenvolver processos que sejam capazes de produzir aquelas características do
produto;
•
Ação: Melhoria da Qualidade
OBS: O Ciclo PDCA para essa ação também é denominado Método de Solução de Problemas, já que cada
meta de melhoria gera um problema que a empresa deverá solucionar.
•
•
•
•
Nesse tipo de ação, é essencial o uso de ferramentas estatísticas apropriadas para
coletar, processar e dispor o grande volume de informações utilizadas.
A sofisticação das ferramentas aumenta com o aumento da capacidade de
gerenciamento (alcance de metas) da empresa.
As técnicas de planejamento e análise de experimentos fazem parte das técnicas
mais sofisticadas.
Detalhando o Ciclo PDCA de melhoria temos (p.4 v.6):
A maior efetividade das técnicas de planejamento e análise de experimentos ocorre
na fase de análise, mas também podem ser efetivas nas fases de observação e verificação, e
até mesmo na identificação do problema (p.4 v.6).
OBS: As técnicas de análise de regressão são igualmente efetivas nas mesmas fases.
Nesse modo de ação (melhoria), na fase de análise, o emprego dessas técnicas de
planejamento e análise de experimentos são úteis para:
O estudo do efeito conjunto das diversas causas que compõem o processo sobre o
resultado para a qual foi estabelecida a meta de melhoria;
•
•
•
A identificação das principais causas sobre as quais devemos atuar no sentido de
fazer com que a meta de melhoria seja alcançada;
A determinação da condição de operação do processo que permitirá o alcance da
meta de melhoria.
4
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Essas técnicas apresentam a vantagem de, por meio do seu emprego, fazer com que
as ações relacionadas acima possam ser realizadas com o mínimo de tempo e custos e com a
manutenção de um nível de confiança pré-estabelecido para as conclusões.
O uso dessas técnicas envolve a realização de interferências no processo.
Uso de plantas-piloto da linha de produção (se variações nos fatores forem grandes); •
• Uso da própria linha de produção com pequenas variações seqüenciais dos níveis
dos fatores.
8.4. Planejamento de Experimentos
Definição de experimentos: Procedimentos nos quais alterações propositais são feitas
nas variáveis de entrada de um processo ou sistema, de modo que se possa avaliar as
possíveis alterações sofridas pela variável resposta, como também as razões dessas
alterações.
OBS 1: Variável de Entrada – Fatores ou causas do processo.
OBS 2: Variável Resposta – Efeitos deste processo.
OBS 3: Processo – Conjunto de causas ou fatores (insumos, equipamentos, informações do processo ou
medidas, condições ambientais, pessoas e métodos ou procedimentos) que tem como objetivo produzir um
determinado efeito (produto de processo) que apresenta uma ou mais resposta observáveis.
Esquema ilustrativo:
8.4.1. Alguns Objetivos de um Experimento Planejado
(A) Determinar as causas (fatores) que mais influenciam o efeito de interesse;
5
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
(B) determinar as faixas de valores para os itens de verificação associados aos fatores
controláveis X’s de modo a garantir o melhor valor (ou variabilidade) para a característica
da qualidade do produto.
8.4.2. Princípios Básicos do Planejamento de Experimentos
(A) Repetição (réplicas)
As repetições do experimento devem ser feitas sob as mesmas condições
experimentais;
•
•
•
•
•
•
Permite a obtenção de uma estimativa da variabilidade devido ao erro experimental;
Pela escolha adequada do número de repetições é possível detectar, com precisão
adequada, se os efeitos produzidos pelas diferentes condições experimentais são
significantes na prática, ou não.
(B) Casualização (aleatorização)
Fazer de forma aleatória a alocação do material às diversas condições experimentais;
Dá garantia ao uso de métodos estatísticos para a análise dos dados.
(C)Controle Local (formação de blocos)
Eliminar (controlar) fontes de variação sistemática que não fazem parte do interesse
da pesquisa.
Esquema ilustrativo:
6
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
8.4.3. Terminologia Básica
(A) Unidade Experimental
Unidade básica para a qual será feita a medida da resposta.
(B) Fatores
Variáveis cuja influência sobre a variável resposta está sendo estudada no
experimento.
(C) Níveis de um Fator
Os diferentes modos de presença de um fator no estudo considerado.
(D) Tratamento
Combinações específicas dos níveis de diferentes fatores;
Se há apenas um fator, os níveis desse fator correspondem aos tratamentos.
(E) Variável Resposta
Resultado de interesse registrado após a realização de um ensaio.
8.4.4. Fases de Experimento Delineado Estatisticamente
(A) Fase da Definição do Delineamento
Definir o melhor delineamento que responda sobre o efeito dos fatores de interesse
na característica avaliada.
Definido o delineamento, gera-se o plano experimental: Atribuição dos tratamentos
às chamadas unidades experimentais.
Existem procedimentos no SAS que geram a maioria dos planos experimentais, mas
nada impede de fazê-lo sem o auxilio do SAS, bastando conhecer bem as particularidades
estatísticas dos diversos delineamentos.
(B) Fase da Tomada de Dados
Corresponde à coleta dos dados propriamente dita.
(C) Fase da Análise de Dados
Existem diversos procedimentos disponíveis no SAS (SAS base, SAS/STAT e
SAS/GRAPH) que auxiliam na análise e interpretação dos dados.
OBS: No entanto, outros softwares poderiam ser usados ao invés dos SAS, exemplo: o R.
8.4.5. Roteiro para a Realização de um Bom Experimento.
OBS: Extraído, integralmente, de Werkema e Aguiar (1996) pág. 34, mas também encontrado em
Montgomery (1997) pág. 14, 4ª edição.
7
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Para usar a abordagem estatística no planejamento e na análise de um experimento é
necessário que as pessoas envolvidas na experimentação tenham, antecipadamente, uma
idéia clara do que será estudado e da forma como os dados serão coletados. Também é
desejável que se tenha pelo menos uma idéia qualitativa de como os dados serão analisados.
Um roteiro do procedimento usualmente recomendado é apresentado a seguir.
8.4.5.1. Identificação dos Objetivos do Experimento
• Realize uma sessão (brainstorming) com o propósito de definir claramente os objetivos
do experimento a ser realizado. Todas as pessoas que possam contribuir para a definição
dos objetivos devem participar da reunião.
• Utilize todo o conhecimento disponível sobre o problema que está sendo estudado com o
propósito de definir claramente os objetivos do experimento. Isto é, devem ser utilizados
as informações já publicadas sobre o assunto, a experiência prática do grupo e os
resultados dos experimentos similares já realizados.
• Expresse as informações sobre o problema em termos quantitativos.
8.4.5.2. Seleção da Variável Resposta
• Utilize uma variável resposta que realmente forneça informações sobre o problema em
estudo.
• Determine o método de medição da variável resposta e a escala de medida a ser utilizada
(por exemplo, temperatura ou logaritmo da temperatura).
• Determine a exatidão das medidas da variável resposta (veja Werkema, M. C. C. –
1996a) – vol. 13 da série “Ferramentas da Qualidade”.
8.4.5.3. Escolha dos Fatores e seus Níveis
• Utilize conhecimento não estatístico para:
Identificar os fatores cujos níveis irão variar, os fatores cujos níveis permanecerão
constantes e os fatores que não poderão ser controlados durante a realização do
experimento.
Escolher as faixas de variação dos fatores e o número de níveis de cada fator para os
quais as medidas da variável resposta serão obtidas.
• Planeje a forma de controle dos fatores quantitativos nos níveis desejados e determine o
método de medição dos níveis destes fatores, bem como a escala de medida a ser
utilizada.
8
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
• Determine a exatidão das medidas dos fatores quantitativos (veja Werkema, M. C. M. –
1996a) – vol. 13 da série “Ferramentas da Qualidade”.
8.4.5.4. Planejamento do Procedimento Experimental
• Escolha um procedimento experimental que ajude a eliminar o efeito de fatores não
controláveis sobre as comparações de interesse e que simplifique a análise dos
resultados.
• Considere as possíveis interações entre os fatores.
• Determine as influências exercidas pelas possíveis limitações de tempo, custo, materiais,
mão-de-obra e equipamentos, e por condições externas, tais como fatores climáticos.
• Determine o percentual dos recursos (orçamento, tempo, etc.) disponíveis para o
desenvolvimento do estudo completo, que deverá ser investido na realização do
experimento. Muitas vezes este experimento é um meio para a aprendizagem da forma
de condição do estudo, ou seja, é apenas um experimento inicial. Portanto, devem sobrar
recursos para cumprir os objetivos finais do trabalho, não devendo então ser feito um
investimento de mais de 25% ou 30% dos recursos totais neste experimento inicial.
• Proponha um modelo matemático para o experimento, de modo que a análise estatística
dos dados possa ser realizada.
• Determine o método de aleatorização a ser utilizado e a ordem de coleta dos dados.
• Determine a magnitude das diferenças obtidas entre as respostas médias correspondentes
aos tratamentos incluídos no estudo, que será considerada significativa sob o ponto de
vista prático.
• Considere a variabilidade resultante do procedimento de amostragem e da precisão dos
métodos de medição.
• Determine o número mínimo de réplicas a serem realizadas, de modo a permitir que a
variância do erro experimental seja estimada de forma adequada e a garantir que seja
obtida a precisão necessária para alcançar os objetivos do experimento.
• Prepare o roteiro que detalhe os passos a serem seguidos durante a realização do
experimento, com o objetivo de minimizar a ocorrência de erros. Este roteiro deve
incluir o detalhamento dos métodos, materiais e equipamentos a serem utilizados, bem
com das precauções a serem tomadas durante a coleta e o registro dos dados.
• Sensibilize as pessoas sobre a importância do experimento que será realizado.
9
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
8.4.5.5. Realização do Experimento
• Execute o procedimento de coleta dos dados de acordo com o que foi planejado no item
8.4.5.4.
• Monitore o progresso do experimento, registrando dados auxiliares (datas, número de
ordem dos ensaios, dados omissos, ensaios adicionais) e quaisquer modificações que
tenham sido feitas no planejamento experimental inicial.
8.4.5.6. Análise de Dados
• Execute o processo de revisão dos dados com o objetivo de detectar possíveis erros de
registros e emissões.
• Utilize métodos gráficos para a representação dos dados.
• Empregue os métodos estatísticos apropriados para a análise dos dados do experimento.
• Verifique a adequação do modelo matemático adotado no item 8.4.5.4. Deve ser feito
um exame crítico do modelo adotado e das suposições a ele associadas.
8.4.5.7. Interpretação dos Resultados
• Considere todos os dados coletados no experimento, durante a execução da fase de
interpretação dos resultados.
• Estabeleça as conclusões somente a partir dos resultados obtidos pelo experimento que
foi realizado. Evite fazer extrapolações para outras condições que não tenham sido
incluídas no estudo.
• Detalhe a análise dos dados em termos gráficos e numéricos para tornar mais clara a
interpretação dos resultados.
• Estabeleça os resultados em termos de suas probabilidades associadas, as quais irão
medir a confiabilidade das conclusõesobtidas.
• Avalie a significância prática das conclusões alem de avaliar a significância estatística.
• Interprete as conclusões obtidas sob o ponto de vista técnico e traduza seu significado
para as aplicações de interesse.
• Registre as possíveis limitações impostas pelos dados ou pelos métodos de análise
utilizados.
10
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
8.4.5.8. Elaboração do Relatório
• Descreva claramente o trabalho realizado, mostrando a importância do problema tratado
e significado prático dos resultados obtidos. Inclua também resultados anteriores que
sejam relevantes.
• Utilize gráficos e tabelas para apresentar os dados.
• Apresente informações suficientes para que os leitores possam verificar os resultados e
estabelecer suas próprias conclusões.
• Expresse as conclusões sob a forma de um sumário.
• Faça recomendações sobre as conclusões obtidas. Estas recomendações podem, por
exemplo, incluir a necessidades de realização de uma nova série de experimentos, já que
a experimentação é um processo interativo, onde o experimento responde algumas
questões e simultaneamente coloca outras. Isto é, à medida que o experimento avança,
alguns fatores iniciais podem ser abandonados, outros fatores adicionados, as faixas de
variação dos fatores podem ser alteradas, em alguns casos, novas variáveis respostas
podem ser empregadas.
• Minimize o uso de terminologia estatística desnecessária e expresse as informações do
mundo mais simples possível.
8.5. Testes de Hipóteses
Ao tratarmos da análise de experimentos, será necessária a realização de testes
estatísticos para a verificação de determinadas hipóteses. Assim, é necessário que se faça
uma breve revisão sobre alguns conceitos relacionados à inferência estatística, ou mais
especificamente, aos testes de hipóteses.
8.5.1. Idéia Geral sobre os Testes de Hipóteses
Definição: Estabelecimento de uma regra decisória que permite rejeitar ou não rejeitar uma
hipótese estatísticas com base nos elementos amostrais.
A idéia básica sobre o testes de hipóteses consiste no uso de um conjunto de regras
para decidir se rejeita, ou não, uma hipótese nula (ou hipótese básica ou de nulidade).
Ex:
oo :H θ=θ
Se for rejeitada, valida-se a hipótese alternativa Ha.
Ex: Teste Bilateral oa :H θ≠θ
Ou
11
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
oaH θθ >:
Teste Unilateral ou
θθ <:aH
Definição: Uma estatística é qualquer função das observações em uma amostra que não
contenha parâmetros desconhecidos.
Alguns exemplos de estatísticas são dados a seguir:
( )
n
S
Xt
n
XX
S
n
X
X ii µ−=
−
−
== ∑∑ ;
1
;
2
2
Ho: µ = valor
definido
O procedimento tradicional do teste é:
(A) Formular Ho e Ha, e especificar o nível de confiança α;
(B) De acordo com α e a distribuição da estatística do teste apropriado, define-se a região
crítica de tamanho α;
α/2 α/2
θ0
OBS: Chamamos “Região Crítica” a faixa de valores de estatística do teste que leva à rejeição da hipótese de
nulidade.
(C) Com base na amostra, obtida geralmente a partir de um experimento controlado, é
computado todo o valor da estatística do teste.
(D) Se o valor da estatística do teste pertencer à região crítica, rejeita-se Ho. Caso contrário,
não se rejeita Ho.
OBS.: Para discussão em aula: Qual termo utilizar – “não rejeita Ho” ou “aceita Ho”?
12
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
8.5.2. Tipos de Erros Inerentes aos Testes de Hipóteses
Ao executarmos um teste de hipóteses estamos sujeitos a dois tipos de erros: o
chamado “erro tipo I” e o chamado “erro tipo II”. Esses dois tipos de erros poderiam ser
entendidos da seguinte maneira:
Erro Tipo I: Rejeitar Ho quando Ho é verdadeira.
Erro Tipo II: Não rejeitar Ho quando Ho é falsa.
Define-se:
α = P(cometer o erro tipo I) nível de significância ≡
β = P(cometer o erro tipo II)
OBS.: 1 - β é também conhecido como o poder de um teste. Corresponde à probabilidade de rejeitar H0 quando
H0 é falsa.
8.5.3. P-value (ou valor-p)
Atualmente, ao invés de fixar o nível de significância de um teste, e simplesmente
relatar se Ho foi rejeitada ou não, tem-se dado preferência ao uso do p-value.
Assim, ao invés de comparar o valor da estatística obtida da amostra, com o valor
crítico da estatística do teste definido em função de um α fixado, faz-se: Comparar o p-
value obtido para a amostra com o α fixado.
Portanto, Ho é rejeitada se o p-value for menor ou igual a α.
Definição Geral: para um dado valor observado de uma estatística do teste, o p-value
corresponde ao menor nível de significância para o qual a hipótese Ho
poderia ter sido rejeitada.
OBS:
Quando H0 é verdadeira
Dependendo da direção do teste
( )tPvaluepHSe a ≤=−⇒< τθθ 0:
( ) verdadeiraHsetPvaluep >=− τ
( ) ( )tPoutPvaluepHSe a ≤≥=−⇒≠ ττθθ 22: 0
HSe a 00: ⇒> θθ
Estatística do teste
obtida da amostra
Variável aleatória
estatística do teste
Assim, usando o p-value, o procedimento para o teste seria:
(A) Formular Ho e Ha (e definir α se for de interesse);
(B) Especificar a estatística do teste;
13
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
(C) Determinar o valor da estatística do teste e o p-value correspondente baseado na
amostra;
(D) Comparar p-value com α
- Se p-value ≤ α ⇒ rejeição de Ho;
- Se p-value > α não-rejeição de H⇒ o.
Obs.: ou permita que o julgamento seja particularizado.
Exemplo ilustrativo dado em aula: folha solta
8.6. Experimentos Completamente Casualizados com um Único Fator
Para esse tópico pressupõe-se um razoável conhecimento em delineamentos
experimentais apresentados em disciplina básica de estatística experimental.
Os experimentos no delineamento inteiramente casualizado envolvem os princípios
da repetição e casualização. Supõe-se um fator influenciando um item de controle. Quer-se
conhecer a faixa de valores desse fator, no processo, de modo a ter o item de controle dentro
da meta definida.
É importante controlar os outros fatores que não são do interesse do pesquisador.
Mantê-los em níveis constantes. Assim, pressupõem-se condições homogêneas;
A casualização equilibra os efeitos dos fatores não-controláveis sobre o item de
controle.
Seja: Nº de Tratamentos = I = I níveis do fator
Nº de repetições = J
Tratamentos Repetições (observações) Totais Médias
1 y11 y12 K y1J y1. .1y
2 y21 y22 K y2J y2. .2y
...
... ... ... ... ...
I yI1 yI2 K yIJ yI. .Iy
y.. ..y
O modelo estatístico é:
Yij = µ + ti + eij i = 1, 2, ... , I; j = 1, 2, ... , J
Onde:
Yij = Valor observado na j-ésima repetição do i-ésimo tratamento; •
• µ = Média geral dos dados (geralmente);
14
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
ti = Efeito do i-ésimo tratamento; •
•
•
•
•
eij = Erro aleatório associado às observações yij.
Pressuposições usuais:
eij são variáveis aleatórias independentes;
eij são identicamente distribuídas;
eij têm distribuição normal com média zero e variância σ² constante, ou seja, eij ∼
NID(0, σ²)
OBS 1: os eij podem ser oriundos de:
• Erros de medição;
• Efeitos de fatores não incluídos no processo e não bem controlados;
• Causas de variação aleatórias desconhecidas.
OBS 2: as pressuposições acima são necessárias para que os testes de hipóteses sejam aplicados sobre os
efeitos de tratamentos.
OBS 3: de modo geral, o objetivo da análise é estimar os efeitos de tratamentos e testá-los.
8.6.1. Modelo Fixo ou Modelo Aleatório
Duas situações podem ocorrer em relação aos efeitos de tratamento.
Essas diferentes situações vão ocorrer emfunção da maneira como os níveis do fator
são escolhidos.
(I) Modelo de Efeitos Fixos
Quando os níveis do fator são especificados pelo experimentador. Neste caso:
Testa-se hipóteses sobre as médias de tratamentos; •
•
•
•
•
•
Conclusões são válidas apenas para esses níveis;
Pode-se estar interessado em estimar µ, ti, σ².
(II) Modelo de Efeitos Aleatórios
Os efeitos aleatórios poderão ocorrer quando os K tratamentos corresponderem a
uma amostra aleatória de uma grande população de tratamentos. Nesse caso:
Conclusões obtidas para essa amostra de tratamentos podem ser estendidas para a
população;
Os ti são variáveis aleatórias. Assim, informações particulares sobre um certo ti
geralmente são sem utilidades;
O que testamos é a hipótese a respeito da variabilidade dos efeitos de tratamento,
além de estimar tal variabilidade.
15
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Alguns exemplos podem tornar esses conceitos mais claros:
Efeitos Fixos Fator: Tipo de têmpera para aumenta dureza em peça de aço.
Níveis: Água, óleo.
Efeitos Aleatórios Fator: Teares usados para fabricar determinado tipo de tecido.
Níveis: Amostra aleatória dos teares.
Objetivo: Avaliar se haveria variação entre as resistências dos
tecidos fabricados pelos diferentes teares.
8.6.1.1. Análise de Variância de Modelos de Efeitos Fixos
Os efeitos ti são, geralmente definidos como:
ti = µi - µ i = 1, 2, ... , I
assim,
( )∑ ∑∑
==
−=−=
I
i i
ii
I
i
i It
11
µµµµ , mas == ∑I
iµµ média geral
então,
0. =−= ∑∑∑ IIt
i
i
i
i
i
µ
µ
As hipóteses a serem testadas são:
Ho: µ1 = µ2 = ... = µI vs
Ha: µi ≠ µj para pelo menos um par (i, j)
Se Ho é verdadeira, todos os tratamentos terão média µ . Como ti = µi - µ , então, sob
Ho verdadeira, seria equivalente escrever as hipóteses como:
Ho: t1 = t2 = ... = tI = 0
Ha: ti 0 para pelo menos um tratamento i. ≠
8.6.1.1.1. Idéia Principal da Análise de Variância
Decompor a variabilidade total dos dados nas partes que a compõem de acordo com
o modelo proposto. Assim, no caso do modelo Yij = µ + ti + eij podemos escrever:
(Yij - µ) = (µi - µ) + eij
que seria o ponto inicial para se fazer a decomposição pretendida, bastando, para isso, elevar
ao quadrado cada lado da igualdade acima, substituir os parâmetros por seus estimadores e
aplicar operações de somatório.
16
Desafio: Tente executar essa decomposição como exercício.
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
A partição será:
( ) ( ) ( )− iij yy 2.∑ ∑∑ +−=−
ji jiji
iij yyyy
, ,,
2
...
2
..
Variação entre as
observações dentro
dos tratamentos
Variação entre média de
tratamentos e média geral
Variação Total
Que é representado por:
SQtotal = SQtrat - SQresíduo
As fórmulas usuais para as Somas de Quadrados são:
( )
IJ
y
y
rI
y
ySQtotal
ji
ij
ji
ij
ji
ij
2
..
,
2
2
,
,
2 −=
−= ∑
∑
∑
( )
IJ
yy
JIJ
y
y
J
SQtrat
i
i
i
i
i
i
2
2
.
2
.
2
.
..11
−=
−= ∑
∑
∑
A SQResíduo geralmente é obtido por diferença.
O quadro da análise de variância, ou comumente chamada de ANOVA, será:
F.V. g.l. SQ QM Fcalc
Tratamento I - 1 SQTrat SQTrat / (I – 1) QMTrat / QMRes
Resíduo I(J - 1) SQRes SQRes / I(J – 1)
Total IJ - 1 SQTotal
A regra decisória será:
Se Fcalc ≥ Fα[(I – 1);I(J – 1)] rejeita-se Ho
ou
Se p-value = P[F[(I – 1) ; I(J – 1)] > Fcalc ] < α rejeita-se Ho
Gráfico ilustrativo:
17
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
OBS 1:
Se o número de observações tomadas dentro de cada tratamento for diferente, algumas adaptações às fórmulas
para a SQTotal e SQTratamentos (principalmente) são necessários:
IJ
y
ySQtotal
I
i
n
j
ij
i 2
..
1 1
2 −= ∑∑
= =
onde: ni = número de repetições do tratamento ij; e
IJ
y
n
ySQtrat
i i
i
2
..
2
. −= ∑
E o quadro da ANOVA continua o mesmo, mudando logicamente, o número de graus de liberdade (g.l.) para
cada fonte de variação.
Se isto ocorrer, dizemos que o delineamento é DESBALANCEADO.
OBS 2:
Segundo Montgomery (1997, p. 79) são as seguintes as vantagens para se ter um delineamento balanceado.
(A) Pequenas variações na variância dos tratamentos não afetam tanto a estatística do teste;
(B) O poder do teste é maximizado.
Exemplo:
Balanceado; •
•
•
•
Desbalanceado;
Balanceado, mas mudando valores dentro de um tratamento;
Analisando DBC como DIC.
8.6.3. Análise de Variância de Modelos de Efeitos Aleatórios
Se o fator em estudo tem um grande número de níveis possíveis, e se o
experimentador seleciona, para estudo, I desses níveis, de uma hipotética população de
níveis desse fator, então dizemos que o fator é aleatório. Esquematicamente teríamos:
18
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Pop
de
níveis
do
fator
I níveis selecionados
∴ o fator é aleatório
O modelo estatístico continua o mesmo:
Yij = µ + ti + eij i = 1, 2, ..., I; j = 1, 2, ..., J
Porém, agora, também definimos ti uma variável aleatória, assim como os eij.
Para esses efeitos aleatórios usualmente definimos:
ti tem média zero e variância , e é independente dos erros e
2
tσ ij.
Assim,
( ) 22 σσ += tijyV
OBS: e são chamados componentes de variância e o modelo acima é chamado “modelo de efeito
2
tσ 2σ
aleatório” ou “modelo de componentes de variância”.
A decomposição da SQTotal é a mesma que no modelo fixo, ou seja:
SQTotal = SQTrat – SQResíduo
Uma vez que os níveis do fator usado (selecionado) no experimento foram
escolhidos aleatoriamente, as interferências são realizadas sobre a população de todos os
níveis desse fator.
Para a validade dos testes de hipóteses nesse modelo pressupõe-se:
(A) eij ~ NID (0, );
2σ
(B) ti ~ NID (0, );
2
tσ
(C) ti e eij sejam independentes.
Testa-se:
Ho: = 0 vs Ha: > 0
2
tσ
2
tσ
Se = 0 todos os tratamentos são idênticos, e t
2
tσ ⇒ i = 0 ∀ i;
OBS: pois µi = µ i, de modo que t∀ i = µi - µ = 0 ∀ i.
19
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli
Se > 0 existe variabilidade entre tratamentos.
2
tσ ⇒
Para 1 fator o teste é obtido por:
QMres
QMtratFcalc =
e a regra decisória é a mesma que no caso anterior.
20
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.7. Experimentos Casualizados em Blocos Completos
Usamos “Blocos” quando queremos controlar fontes de variação conhecidas,
mas sem interesse para o pesquisador.
Ex: Corpos de prova oriundos de época diferentes, ou com espessuras variadas,
ou seja, não-homogêneas. Operadores, equipamentos diferentes.
Idéia Principal: Eliminar do erro experimental a variabilidade existente entre blocos.
OBS: veremos nesse tópico o desenvolvimento da ANOVA para modelo de efeitos fixos. No entanto, o
mesmo procedimento de análise seria usado se tanto tratamento, ou bloco, ou ambos forem aleatórios.
Logicamente, haveria apenas mudança na interpretação de alguns resultados.
O modelo estatístico para o Delineamento em Blocos Casualizados (DBC) é:
yij = µ + ti + bj + eij i = 1, 2, ..., I; j = 1, 2, ..., J
onde , adicionalmente à definição dos componentes do modelo para o delineamento
inteiramente casualizado, temos,
bj = efeito do j-ésimo bloco.
Para efeitos fixos podemos incluir as restrições: 00 == ∑∑
j
j
i
i bet
As hipóteses a serem testadas são:
jia
Io
ummenospeloH
H
µµ
µµµ
≠
===
:
: 21 K
É importante notar que, já que a média de cadatratamento
( ) i
J
j
jii tbtb
+=++= ∑
=
µµµ
1
1
, equivalentemente poderíamos escrever:,
iummenospeloparatH
tttH
ia
Io
0:
0: 21
≠
==== K
A partição da SQTotal é:
SQTotal = SQBlocos + SQTrat + SQResíduo
Onde:
SQTotal = ∑∑∑∑ −=− ••
i j
ij
i j
ij IJ
yyyy
2
..22)(
SQBloco = ( ) ∑∑∑ •••••• −=−
j
j
i j
j IJ
y
I
y
yy
22
2
21
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
SQTtrat = ( ) ∑∑∑ •••••• −=−
i
i
i j
i IJ
y
J
yyy
22
2
e SQResíduo = 2)(∑∑ •••• +−−
i j
jiij yyyy , ou obtida por diferença:
SQResíduo = SQTotal – SQBloco – SQTrat.
O quadro ANOVA é dado por:
F.V. g.l. SQ QM Fcalc
Blocos J - 1 SQBloco
Tratamento I - 1 SQTrat SQTrat / (I - 1) QMTrat / QMRes
Resíduo (I - 1)(J - 1) SQRes SQRes / (I - 1)(J - 1)
Total IJ - 1 SQTotal
A regra decisória será:
Se Fcalc ≥ Fα[(J – 1);(I – 1)(J – 1)] rejeita-se H0
ou
Se P-Value = P[F[(J – 1);(I – 1)(J – 1)] > Fcalc ] < α rejeita-se H0
(a) Realizar o teste para a fonte de variação Blocos não é necessário, mas pode ser útil para auxiliar
na decisão em usar essa fonte de variação como bloco em experimentos futuros;
(b) O teste para a fonte de variação blocos é apenas aproximado. Se QMBloco/QMRes for grande,
indica que o fator bloco teve um efeito grande, e que o uso de blocos no experimento foi
satisfatório para diminuir o resíduo. Veja Montgomery (1997, p.176).
8.8. Exercícios Propostos – DIC e DBC
(8.8.1) Um engenheiro avaliou quatro banhos de têmpera para aumentar a dureza de
peças de aço segundo o DIC, e obteve os seguintes dados numa escala apropriada:
Total Média
A 25 26 20 23 21 115 23
B 31 25 28 27 24 135 27
C 22 26 28 25 29 130 26
D 22 28 27 23 20 120 24
Realizar a ANOVA para testar a hipótese de igualdade dos efeitos de tratamentos. Se
necessário use o nível de significância de 5%.
Resposta: Fcalc = 2,02 QMtrat = 16,66 QMres = 8,25
Ftab (5%; (I – 1); I(I – 1)) = 3,24
22
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Faça essas análises a mão para treinar. Posteriormente a faremos usando o R.
(8.8.2) Usando os mesmos dados do problema 8.8.1, verificar o que ocorreria (ou seja,
refaça a análise) se os valores obtidos para o tratamento D fossem adicionados de 6
unidades, ou seja, y4j = y4j antigo + 6.
(Os novos valores para o tratamento D seriam, então: 28, 34, 33, 29, 26)
Resposta: QMtrat = 41,66 QMres = 8,25 Fcalc = 5,04
OBS: Observe que a diferença entre os valores dentro do tratamento 4 continuou a mesma. Só mudou a
diferença entre as medidas de tratamento.
(8.8.3) Usando os mesmos dados do problema (8.8.1), verificar o que ocorreria se os
primeiros valores obtidos para cada tratamento fossem aumentados em 5 unidades, ou
seja:
Total Média
A 30 26 20 23 21
B 36 25 28 27 24
C 27 26 28 25 29
D 27 28 27 23 20
Resposta: QMtrat = 16,667; QMres = 13,25; Fcalc = 1,26 ns
(8.8.4) Usando os mesmos dados do problema (1), subtraia 25 de cada valor e monte o
quadro da ANOVA. Ou seja, use os valores:
Totais Médias
A 0 1 -5 -2 -4 -10 -2
B 6 0 3 2 -1 10 2
C -3 1 3 0 4 5 1
D -3 3 2 -2 -5 -5 -1
OBS: Lembre-se das propriedades da variância.
(8.8.5) Pág. 177 Montgomery, (descrição do problema pág. 171). Verificar se 4 “TIPS”
(ponteiras de uma máquina de fazer leituras de força) distintos produzem leituras
diferentes em máquina de teste de dureza.
OBS: Um experimento desse tipo poderia ser parte de um estudo de capacidade de “Gage”, ou medição
de forças. A máquina opera da seguinte maneira: ela pressiona a ponta (tip) sobre um corpo de prova de
metal. De acordo com a profundidade da depressão causada na peça de metal, sua dureza poderá ser
determinada (gaged, ou gauged).
•
•
Foram usada 4 repetições de cada tipo;
Fator: Tipo de TIP. 4 níveis (ou tipos);
23
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
•
•
Devido à variabilidade na origem dos corpos de prova “blocos”;
Portanto cada tipo de TIP foi atribuído uma vez a corpos de prova homogêneos.
Os dados, na escala de dureza C de Rockewell estão apresentados abaixo. A tabela da
direita apresenta os dados codificados: Y = (X – 49,5) x 10:
Tipo
de Ponto 1 2 3 4 Yi.
1 -2 -1 1 5 3
2 -1 -2 3 4 4
3 -3 -1 0 2 -2
4 2 1 5 7 15
Y.j -4 -3 9 18 20
Blocos
Tipo
de Ponto 1 2 3 4
1 49,3 49,4 49,6 50,0
2 49,4 49,3 49,8 49,9
3 49,2 49,4 49,5 49,7
4 49,7 49,6 50,0 50,2
Blocos
Solução (usando tabela da direita):
( )
( )
00,850,8250,3800,129
50,82
16
20189)3()4(
4
11cos
50,38
16
2015)2(43
4
11
00,129
16
2000,154
2
2222
2
..2
.
2
2222
2
..2
.
22
..
4
1
4
1
2
=−−=
=−++−+−=−=
=−+−++=−=
=−=−=
∑
∑
∑∑
= =
SQres
IJ
yy
I
SQblo
IJ
yy
J
SQtrat
IJ
yySQtotal
j
i
i j
ij
F.V. g.l. SQ QM F
Blocos 3 82,50 27,50
Trat. 3 38,50 12,83 14,40
Res. 9 8,00 0,89
Total 15 129,00
P-Value = 0,0009
ou
Fcrit = F (5%;3;9) = 3,86
Como Fcalc> Ftab ⇒ rejeita-se Ho
ou
Avalia pelo P-Value.
Já que o F foi significativo, então
4321: µµµµ ===oH foi rejeitada
(8.8.6) Usando os dados originais do problema 8.8.5, ou seja, sem usar a recodificação,
monte o quadro da ANOVA e conclua (use α = 5%, se desejar). Depois compare esse
quadro da ANOVA obtido com aquele obtido no problema 8.8.5, e também o resultado
do teste F nas duas análises. Discuta.
(8.8.7) Considere os mesmos dados codificados do problema 8.8.5. Suponha que foi
feita a completa casualização dos 4 TIPS nos 16 corpos de prova (U.E.). Suponha que as
mesmas atribuições de valores ocorrem conforme tabela de dados inicial. A ANOVA
segundo um DIC seria:
24
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
F.V. g.l. SQ QM F
Trat. 3 38,50 12,83 1,70
Res. 12 90,50 7,54
Total 15 129,00
F (5%;3;12) = 3,49
∴ não rej. Ho
OBS.: sabemos que essa análise estaria incorreta no sentido de que não poderíamos confiar na sua
interpretação já que havia diferenças sistemáticas (blocos) entre os corpos de prova.
Conclusão: O DBC reduziu a variação sistemática o suficiente de modo que pequenas
variações entre os tratamentos pudessem ser detectadas.
(8.8.8.) Pense sobre as seguintes considerações e depois realize os problema propostos
OBS 1: O fato de ser significativo a determinado nível de significância, o teste F não indica quais médias
de tratamentos são diferentes entre si, exceto quando o tratamento (fator) possuir apenas 2 níveis.
OBS 2: Se o tratamento possuir apenas 2 níveis, o teste F será equivalente será equivalente ao teste T. Na
verdade, Fcalc = (Tcalc)²
- Se amostras independentes: teste T para 2 médias ≡ teste F do DIC;
- Se dados são pareados: teste T para dados pareados ≡ teste F do DBC.
Exemplo: (use seu material de Estatística Aplicada ou de Estatística Experimental para
conhecer as fórmulas necessárias na resolução desse problema)
Seja: X = {X1 = 4; X2 = 10; X3 = 5; X4 = 3; X5 = 8}
Y = {Y1 = 2; Y2 = 7; Y3 = 1; Y4 = 2; Y5 = 8}
(A) Considere X = tratamento 1 e Y = tratamento 2 e compare as medidas entre os dois
tratamentos pelo teste t e pelo teste F da ANOVA de um DIC com 5 repetições.
Compare os resultados.
(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um
teste da ANOVA de um DBC com 5 blocos. Compare os resultados.
OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as medidas
podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos
sobre o teste de Tukey e o teste de Duncan.
25
INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli
(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um
teste da ANOVA de um DBC com 5 blocos. Compare os resultados.
OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as médias
podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos
sobre o teste de Tukey e o teste de Duncan.
8.9. Teste de Tukey
É usado para testar qualquer contrastes entre 2 médias. Este teste é exato quando
o número de repetições for o mesmo para cada tratamento. Tem por base a diferença
mínima significativa (dms) representada por ∆ e dada por:
)ˆ(ˆ
2
1 CVq=∆
em que:
(é a amplitude total estudentizada)( )nIfq
mmC
,,
ˆˆˆ 21
α=
−=
De modo geral,
+=∆
21
11
2 rr
QMresq onde r1 e r2 são as repetições dos
tratamentos 1 e 2, respectivamente.
Se r1 = r2 = J ⇒ J
QMresq=∆ , que é a fórmula usual encontrada em vários
livros de estatística.
OBS 1:
1
21
11
2
1
−
+=
rr
J corresponde à média harmônica das repetições de tratamentos.
OBS 2: No SAS – Se temos I tratamentos, cada qual com diferentes números de repetições, o SAS obtêm
um único ∆ fazendo J = média harmônica do número de repetições.
Nº de tratamentos g.l. do resíduo
26
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.9.1. Procedimento
Testamos:
Ho: mi = mj
para i ≠ j
Ha: mi ≠ mj
Obtemos ∆, a diferença mínima significativa:
Calculamos todas as estimativas dos contrastes ( ) entre 2 médias; ĉ•
• Comparamos | c | com ∆; ˆ
- Se | c | ∆ o contraste é significativo ao nível α de probabilidade.
Então há diferença entre médias de tratamentos a esse nível de
significância;
ˆ ≥ ⇒
- Se | c | < ∆ ⇒ o contraste não é significativo. ˆ
OBS: Pode acontecer de o teste F da ANOVA ser significativo, mas não ser encontrado nenhum teste
significativo pelo teste de Tukey. Ver Pimentel Gomes.
Exemplo 8.9.1.1:
Considere o exercício 8.8.2, onde m , QMres =
8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Tukey.
30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm
Solução:
2,5
5
25,805,4
5
1
5
1.25,8.
2
1
)16;4%(5 ==
+=∆ q •
Ordenar as médias. Indicar com letras iguais médias “iguais” •
o
o
o
o
Hrejnãomm
Hrejmm
Hrejnãomm
Hrejnãomm
bm
bam
bam
am
.42327ˆˆ
.72330ˆˆ
.42630ˆˆ
.32730ˆˆ
23ˆ
26ˆ
27ˆ
30ˆ
12
14
34
24
1
3
2
4
⇒∆>=−=−
⇒∆>=−=−
⇒∆<=−=−
⇒∆<=−=−
=
=
=
=
27
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Conclusão: As médias seguidas de pelo menos uma mesma letra não diferem entre si ao
nível de 5% de probabilidade pelo teste de Tukey.
Exercício 8.9.1.2:
Supor um experimento com 5 tratamentos e 6 repetições, cuja análise está
apresentada a seguir:
FV G.l. SQ QM F p-value
trat 4 328,8 82,2 14,05 3,8×10-6
Res 25 146,25 5,85
Total 29 475,05
obs.: F-tab = F(5%; 4; 25) = 2,76
1m̂ = 25; = 31; = 24; = 22; = 29. 2m̂ 3m̂ 4m̂ 5m̂
Comparar as medias de tratamentos usando o teste de Tukey (se necessário use α = 5%)
Resposta:
Tratamentos
2 a
5 a b
1 b c
3 c
4 c
Médias seguidas de uma mesma letra não
diferem entre si, pelo teste de Tukey, ao
nível de 5% de significância.
8.10. Teste de Duncan
Também é usado para testar contrastes entre 2 médias. É um concorrente ao teste
de Tukey. Para ser exato exige que todos os tratamentos tenham o mesmo número de
repetições. Comparado ao teste de Tukey, o teste de Duncan discrimina mais os
tratamentos, isto é, o teste de Ducan pode indicar resultados significativos em casos em
que o teste de Tukey não indicaria.
Nesse sentido dizemos que o teste de Tukey é mais rigoroso que o teste de
Duncan.
Fórmula Geral:
+==
21
11
2
1)ˆ(ˆ
2
1
rr
QMresZCVZD iii
onde:
( )',, nnfZ ii α=
Nº de médias ordenadas
abrangidas pelo contraste
g.l do resíduo
28
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
OBS:
+=
21 r
1
r
1QMres
2
1)Ĉ(V̂
2
1
se r1 = r2 = r
8.10.1.Procedimento
Vamos explicar o procedimento desse teste usando um exemplo.
Exemplo 8.10.1.1.
Considere o exercício 8.8.2, onde m , QMres =
8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Duncan.
30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm
Ho: mi = mj •
•
•
para i j; ≠
Ha: mi ≠ mj
Ordenar as médias de modo crescente;
Encontrar o valor de Di para a maior abrangência de médias (no caso Di = D4).
Comparar com as estimativas do contraste e, se for significativo, encontrar um
novo Di (no caso Di = D3) para uma menor abrangência, e assim sucessivamente.
23ˆ
26ˆ
27ˆ
30ˆ
1
3
2
4
=
=
=
=
m
m
m
m
ou com letras
bm
bam
bam
am
23ˆ
26ˆ
27ˆ
30ˆ
1
3
2
4
=
=
=
=
OBS: No caso, o resultado foi igual ao do teste de Tukey, mas nem sempre é assim
oHrejDmm
ZD
.72330ˆˆ
149,4
5
25,823,3
5
25,8
414
)16;4%;5(4
⇒>=−=−
===
o
o
HrejnãoDmm
HrejnãoDmm
ZD
.42327ˆˆ
.42630ˆˆ
04,4
5
25,815,3
5
25,8
312
334
)16;3%;5(3
⇒<=−=−
⇒<=−=−
===
unir e com uma barra; 4m̂ 3m̂
idem.
29
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Conclusão: as médias unidas por uma mesma barra não diferem entre si, ao nível
de 5% de significância, pelo teste de Duncan.
•
OBS 1: Nem sempre as comparações realizadas pelo teste de Duncan e pelo teste de Tukey são
coincidentes.
- Alterar os valores dos dados no computador e proceder à análise novamente, para observar esse
resultado.
OBS 2: No teste de Duncan, quando, numa determinada abrangência, a maior média não diferir
significativamente da menor, não se admitirá diferença significativa, pelo mesmo teste, entre médias
intermediárias.
Exemplo 8.10.1.2.
Realize o teste de Duncan para o problema 8.8.5. Use α = 5%.
75,300,175,050,0 .4.2.1.3 ===−= yyyy QMres = 0,89
344.3.4
9;4%;544
:.67,125,4)50,0(75,3
67,147,0.41,3
4
89,0
µµ =⇒=>=−−=−
====
oHrejDyy
Z
J
QMresZD
323.3.2
143.1.4
9;3%;533
:.57,105,1)50,0(00,1
:.57,100,375,075,3
57,147,0.34,3
4
89,0
µµ
µµ
=⇒=<=−−=−
=⇒=>=−=−
====
o
o
HrejnãoDyy
HrejDyy
Z
J
QMresZD
242.2.4
9;2%;522
:.50,175,200,175,3
50,147,0.20,3
4
89,0
µµ =⇒=>=−=−
====
oHrejDyy
Z
J
QMresZD
Então:
Comparações
875,495,49
10
.4
.4 =+=
y
y a
.2y = 49,600 b
.1y = 49,575 b
.3y = 49,450 b
30
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Exercício 8.10.1.3.
Realize o teste de Duncan para os dados do exercício 8.9.1.2.
Resposta:
Tratamentos
2 a
5 a
1 b
3 b
4 b
Exercício 8.10.1.4.
Compare os resultados dos exercícios 8.9.1.2 e 8.10.1.3. O que poderia ser
concluído a respeito do rigor de cada teste? Qual seria o teste menos rigoroso, no
sentido de apresentar resultados significativos com maior facilidade?
8.11. Análise de Resíduos
Essa análise pode ser útil para verificar a adequação do modelo utilizado na
análise de variância.
Nos tópicos anteriores foi comentado que as pressuposições para validade do
teste realizado numa análise de variância eram que os erros deveriam ser independentes,
não correlacionados, e normalmente distribuídos com média zero e com variância
comum . Assim, após usarmos um determinado modelo estatístico, podemos estimar
os erros pelos seus resíduos (e ) e avaliarmos esses resíduos como forma de inferirmos a
respeito dos erros aleatórios. Ou seja, obtemos
2σ
ˆ
ijijij yye ˆˆ −=
onde corresponde ao valor estimado a partir do modelo. ijŷ
Por exemplo, consideremos o caso em que podemos usar o delineamento
inteiramente casualizado(DIC) ou o delineamento em blocos casualizados (DBC).
Se for o DIC:
.ˆˆ
)(ˆˆˆ
iijiijij
iiiijijiij
yyyyeentão
yyyytycomety
−=−=
=−+=+=++=
•
••••••µµ
Se for o DBC:
31
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
••••
••••••••••••
+−−=−=
−+=−+−+=
++=+++=
yyyyyyeentão
yyyyyyyyy
btycomebty
jiijijijij
jijiij
jiijijjiij
ˆˆ
)()(ˆ
ˆˆˆˆ µµ
Obtidos os resíduos, estes poderiam ser plotados de diversas formas,
dependendo do interesse de análise. Para cada modelo existem gráficos comuns ou mais
apropriados.
8.11.1. Gráficos Usuais
DIC
Resíduos contra o tempo – para avaliar pressuposição de independência; •
• Resíduos contra médias .iy – para avaliar pressuposição de homogeneidade de
variância;
Probabilidade normal para os resíduos – para avaliar pressuposição de
normalidade;
•
OBS: Existem também, alguns testes estatísticos para checar cada uma dessas pressuposições. No entanto
tais testes não serão discutidos nesse curso.
DBC
• Resíduo contra valores ajustados – não deve representar nenhum
relacionamento da magnitude dos resíduos e os valores ajustados. Se ocorrer, no
gráfico, uma forma curvilínea, poderia implicar a presença de interação entre
tratamentos e blocos. Poderia existir outro tipo de disposição dos pontos no
gráfico indicando a presença dessa interação. Uma situação de forma curvilínea
no gráfico poderia acarretar, por exemplo, resíduo negativo para baixos e altos
valores ajustados, e resíduo positivos para valores ajustados intermediários.
.ˆ iy
Resíduos contra tratamentos e contra blocos – para verificar a pressuposição de
homogeneidade de variância nos tratamentos e nos blocos;
•
• Gráficos de probabilidade normal dos resíduos – para avaliar a normalidade dos
resíduos. Proximidade de uma certa linha reta indica normalidade;
OBS: Tipos comuns de gráficos serão apresentados em aula.
32
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.11.2. Exemplos
Para cada exercício apresentado nessa apostila realize a análise de resíduos
seguindo o roteiro “tutorial para análise de resíduos”. Exemplos também serão
apresentados em sala de aula.
Observe o arquivo existente nos tutoriais do R para INF 460, disponibilizado no
link www.dpi.ufv.br/~peternelli/inf460/materiais.htm referente aos exercícios 8.8.5 e
8.8.7 (nome do arquivo: anares.exemplo.8.8.5.pdf). Com os comandos apresentados
nesse tutorial, após fazer pequenas adaptações, é possível você fazer análise de resíduos
para outros exercícios, se desejar.
8.12. Escolha do Número de Repetições
Esse tópico provavelmente não será apresentado em aula. Porém o assunto estará
sendo incluído nesse material por se tratar de informações interessantes para
conhecimento geral do estudante. Aqueles interessados em mais informação poderão
entrar com contato com o professor da disciplina ou buscar maiores detalhes em livros
que abordam o assunto. A não ser que o problema seja novo, na prática o pesquisador já
tem uma idéia do número de repetições a ser usado, baseado em resultados de
experimentos prévios ou de artigos publicados na mesma linha de pesquisa. Uma
decisão crítica em qualquer planejamento de delineamento experimental é a
determinação do número de repetições dos tratamentos a ser usado. De modo geral:
Se o interesse reside em detectar pequenos efeitos, então se deve utilizar um
maior número de repetições;
•
•
•
•
•
Se o interesse reside em detectar grandes efeitos, então pode ser utilizado um
menor número de repetições.
Montgomery (1997) discute 3 métodos (pág. 126 – 132):
Baseado nas curvas características de operação;
Baseado na especificação do aumento do desvio-padrão;
Baseado na estimação do Intervalo de Confiança.
Exemplificaremos apenas o primeiro.
Para o método baseado nas curvas características de operação, Montgomery
(1997, pág. 126) apresenta um interessante embasamento teórico e motivacional.
33
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.12.1. Curva Característica de Operação
É um gráfico onde no eixo das ordenadas (y) temos a probabilidade do erro tipo
II de um teste estatístico para um determinado tamanho amostral, e no eixo das
abscissas (x) temos valores de um parâmetro que reflete o quanto a hipótese nula é falsa.
Com o uso dessas curvas (C.C.O.) pode-se selecionar o número de repetições
necessárias de modo que o delineamento possa ser útil em detectar diferenças
potencialmente importantes entre os tratamentos.
Seja a realização de uma ANOVA. A probabilidade do erro tipo II é definida
como:
β = 1 – P (rejeitar Ho / Ho é falsa)
= 1- P [(Fcalc > Fcrit) / Ho é falsa)]
onde Fcrit = F(α; g.l. numerador; g.l. denominador)
I - 1 I(I – 1) para o DIC, por exemplo
Para calcular a probabilidade indicada acima é necessário conhecer a
distribuição da estatística do teste (Fcalc) quando Ho é falsa. É possível demonstrar que
quando Ho é falsa, Fcalc tem distribuição F não central com (I – 1) e I(J – 1) graus de
liberdade e parâmetro de não-centralidade . Quando = 0 então a distribuição F
não-central passa a ser a distribuição F central usual.
λ λ
As C.C.O. são usadas para avaliar a expressão probabilística discutida acima.
Nessas curvas, no eixo das abscissas tem-se um parâmetro φ ,onde φ é relacionado ao
parâmetro de não-centralidade λ discutido anteriormente.
Nesse material estão apresentadas as C.C.O. para α = 0,05 e α = 0,01, e para um
conjunto de valores do grau de liberdade do numerador e do denominador. (Extraído de
Drumond, Werkema e Aguiar – 1996).
A função do φ mais prática para que seja usado numa C.C.O. é:
2
2
2
2 σ
φ
I
JD
=
onde:
2σ = variabilidade da variável resposta de interesse;
I = número de tratamentos;
J = número de repetições (a ser escolhido);
D = diferença mínima que se deseja detectar entre as médias de 2 tratamentos.
34
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Para prática, isso significa que só faz sentido considerar que 2 médias não são
equivalentes se a diferença entre elas for igual ou superior a D.
OBS: Para fatores de efeitos aleatórios veja Montgomery, 1997 pág. 129.
8.12.1.1. Exemplo do Uso das C.C.O.
(pág. 79 Werkema e Aguiar 1996)
Suponha que desejemos obter o número de repetições para um DIC com um
único fator em três níveis;
•
•
•
Suponha que desejemos rejeitar H0 com pelo menos 95% de probabilidade, se a
diferença entre as médias de 2 níveis quaisquer fosse superior a 2 unidades de
medida em questão;
Suponha que, por conhecimento prévio, tenhamos σ = 1.
Assim, os seguintes passos poderiam ser considerados:
(A) Fixar o nível de significância α (5 ou 1%).
(B) Determinar a diferença mínima que se deseja detectar entre as médias de 2
tratamentos (ou seja, definir um valor para D).
(C) Fixar a probabilidade mínima (1 - β) com a qual se deseja detectar a diferença D.
(D) Determinar uma estimativa para a variabilidade da variável resposta, σ .
(E) Calcular 2
2
2
2 σI
JD
=φ como uma função de n, onde I é o número de níveis do fator.
(F) Utilizando o gráfico da C.C.O. apropriado, apresentado em diversos livros,
determinar o valor de n por tentativa.
Para o exemplo acima teríamos:
(A) α = 5%;
(B) D = 2;
(C) 1 – β = 0,95;
(D) σ = 1;
(E) J
JJ
I
JD 67,0
6
.4
1.3.2
2.
2 2
2
2
2
2 ====
σ
φ
35
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
(F) Utiliza-se a C.C.O. para V1 = I – 1 = 3 – 1 = 2 e V2 = I(J – 1) = 3(J – 1) graus de
liberdade, com α = 5%.
Continuando o exercícios temos, chute inicial: J= 5
O resultado obtido foi: (figura 2B, em anexo)
Portanto: φ )15.(31283,135,35.67,0 2
2 −===⇒== Veφ
Observando na figura 2B, o valor de β (eixo das ordenadas) seria
aproximadamente 0,29, de forma que 1 (poder do teste). Este valor
é inferior ao 0,95 desejado em (C). Isso implica que J = 5 repetições não é suficiente.
71,029,01 =−≈− β
Agora, deveríamos escolher outro valor de J, sendo J > 5, e continuar o
procedimento até que 1 seja maior que 0,95. β−
A seguinte tabela é apropriada:
J 2φ φ I(J – 1) β 1 – β
5 3,35 1,83 12 0,29 0,71
8 5,36 2,32 21 0,075 0,925
9 6,03 2,50 24 0,035 0,965
Portanto, pelo menos J = 9 unidades experimentais deveriam ser submetidas a
cada nível do fator, para satisfazer à condição estabelecida inicialmente para o poder do
teste.
OBS: Para experimentos no DBC faríamos de modo similar nos passos (A), (B), (C) e (D), porém,:
(E) calcular 2
2
2
2 σa
bD
=φ onde b = número de repetições (ou blocos) a serem determinados ( J) e a = ≡
número de níveis do fator em estudo ( ) I≡
(F) Obter a C.C.O. para V1 = a – 1 e V2 = (a – 1)(b – 1)
g.l. denominador g.l. numerador
b é, então, obtido por tentativa.
36
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.13. Análise de Regressão
A análise de regressão consiste na realização de uma análise estatística com o
objetivo de verificar a existência de uma relação funcional entre uma variável
dependente com uma ou mais variáveis independentes. Em outras palavras consiste na
obtenção de uma equação que tenta explicar a variação da variável dependente pela
variação do(s) nível(is) da(s) variável(is) independente(s).
Para tentar estabelecer uma equação que representa o fenômeno em estudo pode-
se fazer um gráfico, chamado de diagrama de dispersão, para verificar como se
comportam os valores da variável dependente (Y) em função da variação da variável
independente (X).
O comportamento de Y em relação a X pode se apresentar de diversas maneiras:
linear, quadrático, cúbico, exponencial, logarítmico etc. Para se estabelecer o modelo
para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um modelo
matemático que mais se aproxime dos pontos representados no diagrama de dispersão.
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se
ajustar perfeitamente à curva do modelo matemático proposto. Haverá na maior parte
dos pontos, uma distância entre os pontos do diagrama e a curva do modelo matemático.
Isto acontece, devido ao fato do fenômeno que está em estudo, não ser um fenômeno
matemático e sim um fenômeno que está sujeito a influências que acontecem ao acaso.
Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos
valores observados de Y em função da variação dos níveis da variável X.
No entanto o modelo escolhido deve ser coerente com o que acontece na prática.
Para isto, deve-se levar em conta as seguintes considerações no momento de se escolher
o modelo:
• O modelo selecionado deve ser condizente tanto no grau como no aspecto da
curva, para representar em termos práticos, o fenômeno em estudo;
• O modelo deve conter apenas as variáveis que são relevantes para explicar o
fenômeno;
Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um
pouco distantes da curva do modelo matemático escolhido. Um dos métodos que se
pode utilizar para obter a relação funcional, se baseia na obtenção de uma equação
estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos da
curva do modelo matemático, no todo, sejam as menores possíveis. Este método é
37
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
denominado de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a
soma de quadrados das distâncias entre os pontos do diagrama e os respectivos pontos
na curva da equação estimada é minimizada, obtendo-se, desta forma, uma relação
funcional entre X e Y, para o modelo escolhido, com um mínimo de erro possível.
Veremos, em apenas uma aula, como realizar uma ANOVA para regressão, e
como interpretar seus resultados. Serão apresentadas apenas suas fórmulas usuais e sua
interpretação, finalizando com um exemplo, executado no computador, para regressão
linear simples e um para regressão linear múltipla.
O problema básico da Análise de Regressão consiste em:
(A) Estimar os parâmetros do modelo estatístico admitido;
(B) Realizar testes de significância para estes parâmetros;
(C) Obter intervalos de confiança para estes parâmetros;
(D) Checar a adequabilidade do modelo utilizado, usando análise de resíduos por
exemplo, e sua adequação ao problema real em questão;
(E) Dependendo dos resultados anteriores definir um novo modelo e refazer os passos
acima
Veremos, primeiramente, e usando um exemplo com poucos dados hipotéticos, a
análise da regressão linear simples. Posteriormente, usando também um exemplo com
poucos dados hipotéticos será dada uma noção da análise da regressão linear múltipla.
8.13.1. Modelo linear de 1º grau (Regressão Linear Simples)
O modelo estatístico para esta situação seria:
iii eXY ++= 10 ββ
em que:
=iY valor observado para a variável dependente Y no i-ésimo nível da variável
independente X.
=0β constante de regressão. Representa o intercepto da reta com o eixo dos Y.
=1β coeficiente de regressão. Representa a variação de Y em função da variação de
uma unidade da variável X.
=iX i-ésimo nível da variável independente X ( )ni ,,2,1 K=
=ie é o erro aleatório; está associado à distância entre o valor observado Yi e o
correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X.
38
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Para se obter a equação estimada, vamos utilizar o MMQ, visando a
minimização dos erros. Assim, tem-se que:
ii Xe 10 ββ −−= iY .
Elevando ambos os membros da equação ao quadrado,
[ ]2102 ii Xe ββ −−= iY .
Aplicando o somatório,
[ ]∑∑
==
−−=
n
i
i
n
i
i Xe
1
2
10
1
2 ββiY (1)
Por meio da obtenção de estimadores de e , que minimizem o valor obtido
na expressão anterior (1), é possível alcançar a minimização da soma de quadrados dos
erros.
0β 1β
Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação ao
parâmetro de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente,
ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados.
Derivando então a expressão (1) em relação a e , e igualando-as a zero,
poderemos obter duas equações que, juntas, vão compor o chamado sistemas de
equações normais. A solução desse sistema fornecerá:
0β 1β
( )
∑ ∑
∑ ∑ ∑
−
−
=
n
x
x
n
yx
yx
i
i
ii
ii
2
2
1β̂ =
x
xy
SQD
SPD
e XY 10 ˆˆ ββ −=
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
ii XY 10 ˆˆˆ ββ +=
8.13.1.1. Teste de hipótese na regressão linear simples
Após ajustar uma equação de regressão devemos verificar sua adequabilidade,
por meio de testes de hipóteses para os parâmetros do modelo e/ou a construção de
intervalos de confiança. Para tal intento precisamos da pressuposição adicional de que
os erros tenham distribuição normal.
Em outras palavras, a equação estimada obtida, apenas estabelece uma relação
funcional, entre a variável dependente e a variável independente, para representar o
fenômeno em estudo. Portanto a simples obtenção da equação estimada não responde ao
39
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
pesquisador se a variação da variável independente influencia significativamente na
variação da variável dependente.
Para se responder a esta pergunta, é necessário realizar um teste estatísticopara
as estimativas dos coeficientes da equação de regressão estimada. Um teste que pode ser
realizado para verificar tal fato é o teste F da análise de variância e/ou o teste t.
Portanto, é necessário realizar uma análise de variância dos dados observados, em
função do modelo proposto.
Como temos dois parâmetros no modelo Y , poderíamos realizar
os seguintes testes:
iii eX ++= 10 ββ
H0: β1 = β1* versus Ha: β1 ≠ β1*
H0: β0 = β0* versus Ha: β0 ≠ β0*
Em cada caso a estatística do teste e as conclusões seriam:
tcalc =
)ˆ(ˆ
ˆ
1
*
11
β
ββ
V
−
, onde
xSQD
2
1
ˆ
)ˆ(ˆ σβ =V
regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0
tcalc =
)ˆ(ˆ
ˆ
0
*
00
β
ββ
V
−
, onde
+=
xSQD
X
n
2
2
0
1ˆ)ˆ(ˆ σβV
regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0
OBS.: σ = estimativa da variância dos erros = 2ˆ
2
Re
−n
sSQ =
2
ˆ
1
−
−
n
SPDSQD xyy β
Um caso especial muito importante seria: H0: β1 = 0 versus Ha: β1 ≠ 0. Essas
hipóteses estão relacionadas com a significância da regressão. Não rejeitar H0 é
equivalente a concluir que não há relação linear entre X e Y. Por outro lado, se H0: β1 =
0 for rejeitado indicaria que X é importante para explicar a variabilidade em Y. Veja
ilustrações apresentadas em aula, para alguns casos especiais.
De maneira alternativa poderíamos testar a significância da regressão pelo
método da Análise de Variância (ANOVA).
O método da ANOVA consiste em fazer uma partição da variabilidade total da
variável resposta Y em outros componentes de acordo com o modelo e o teste a ser
feito. Assim a seguinte identidade pode ser verificada:
222 )ˆ()ˆ()( ∑∑∑ −+−=− YYYYYY iii ,
ou, em outra palavras,
40
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
SQTotal = SQRegressão + SQResíduo,
onde
SQTotal = variação total em Y = SQDY
SQRegressão = variação em Y explicada pela regressão ajustada = SPD1β̂ XY, de modo
que
SQResíduo = SQRes = variação não explicada pela regressão = SQDY - SPD1β̂ XY.
Baseado nessa identidade o seguinte quadro pode ser montado:
FV GL SQ QM F
Regressão 1 SQReg QMReg = SQReg
sQM
gQM
Re
Re
Resíduo, ou
Independente da
Regressão
n – 2 SQRes
QMRes =
2
Re
−n
sSQ -
Total n – 1 SQTotal
A estatística F obtida no quadro acima também serve para testar a significância
da regressão, ou seja, testar H0: β1 = 0 versus Ha: β1 ≠ 0.
regra de decisão: Se Fcalc ≥ F(α, 1, n-2) ⇒ rejeita H0,
ou conclui-se de acordo com o p-value.
OBS.: Se regressão linear simples, e para H0: β1 = 0 temos que (tcalc)2 = Fcalc
8.13.1.1.1.Exemplos:
Exercício 8.13.1.1.1.1.
Para verificar se existe relação linear de primeiro grau entre umidade relativa (UR) do ar
de secagem de sementes e a germinação das mesmas, um pesquisador realizou um
experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados
(dados hipotéticos)
% UR 20 30 40 50
% germinação 94 96 95 97
a) Obter as estimativas do β0 e do β1 considerando o modelo proposto;
b) Obter o quadro da ANOVA para checar a significância da regressão, ou seja, se
existe efeito da UR do ar de secagem na % de germinação. Se necessário use α =
5%;
c) Realize o teste t para o coeficiente de regressão. Se necessário use α = 5%;
41
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
d) Compare os resultados dos itens b e c;
e) Qual seria a % de germinação esperada quando UR = 45 %?
f) Como deveria ser apresentada, num relatório técnico, a equação de regressão
ajustada para esse exemplo?
R.: a) = 92,7; = 0,08 . Algumas das outras respostas podem ser obtidas no
endereço
0β̂ 1β̂
www.dpi.ufv.br/~peternelli/inf460/materiais.htm.
Exercício 8.13.1.1.1.2
Adaptado dos dados existentes em algumas calculadoras de bolso. Um engenheiro está
interessado em avaliar o efeito da temperatura sobre o comprimento de certa peça
metálica. Para isso obteve cinco corpos de prova de mesmo comprimento inicial (certa
unidade de medida) e os submeteu a 5 temperaturas (oC) diferentes. Os dados estão
apresentados abaixo.
Temperatura 10 15 20 25 30
Comprimento 1003 1005 1010 1011 1014
Pede-se: (use α = 5% se necessário)
a) Obter o diagrama de dispersão dos dados;
b) Ajustar a equação de regressão baseado no modelo de uma regressão linear
simples e traçar a reta no diagrama obtido em a;
c) Interpretar as estimativas dos parâmetros obtidas;
d) Checar a significância da regressão por meio da ANOVA;
e) Checar a significância da regressão por meio do teste t;
f) Qual seria o comprimento esperado da peça quando a temperatura for igual a
17oC?
g) Qual seria o comprimento esperado da peça quando a temperatura for igual a
40oC?
h) (Calibração) Qual deve ser a temperatura a ser usada para que o comprimento da
barra atinja 1009 unidades de medida?
Respostas: Realize os cálculos à mão. Depois as compare com os resultados obtidos no
R, e parcialmente apresentados no endereço:
www.dpi.ufv.br/~peternelli/inf460/materiais.htm.
42
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.13.1.2 Intervalo de Confiança em Regressão Linear Simples
Complementam, ou substituem, as informações das estimativas pontuais, e seus
testes de hipóteses, já que fornecem faixas dos possíveis valores que os parâmetros do
modelo podem assumir, com um nível de confiança 100 (1 – α)% conhecido.
I.C. 100 (1 – α)% para β1 é:
x
residuo
n SQD
QM
t
1,
2
1
ˆ
−
± αβ
I.C. 100 (1 – α)% para βo é:
+±
−
x
resíduon SQD
x
n
QMt
2
2,
2
0
1ˆ
αβ
8.13.1.2.1. Exemplos
Exercício 8.13.1.2.1.1.
Considerando os dados do exercício 8.13.1.1.1.1. calcule o intervalo de 95% de
confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de
confiança para concluir a respeito da significância da regressão.
Exercício 8.13.1.2.1.2.
Considerando os dados do exercício 8.13.1.1.1.2. calcule o intervalo de 95% de
confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de
confiança para concluir a respeito da significância da regressão.
43
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.13.2 Regressão Múltipla
Modelos que envolvem mais de uma variável explicativa (ou modelos
polinomiais com uma ou mais variáveis explicativas).
Para ilustrar esse tópico será usado o exemplo do livro do Werkema e Aguiar,
página 15, a seguir.
8.13.2.1. Exemplo Ilustrativo (Werkema e Aguiar pág. 149)
Uma indústria produz grandes quantidades de Alumina (Al2O3 de elevado teor
de pureza) para a fabricação de alumínio metálico. A matéria prima para a fabricação de
alumina é a bauxita, um mineral com cerca de 55% de óxido de alumínio (Al2O3).
No processo de fabricação da alumina, o teor de Na2O (óxido de sódio) ocluído
no produto é um fator importante do ponto de vista da qualidade da alumina fabricada.
O Na2O é uma impureza e, portanto, é desejável que o seu teor na alumina seja o mais
baixo possível.
Objetivo da indústria: teor de Na2O ≤ 0,42%.
Quer-se avaliar como a razão AP2O3/NaOH e a temperatura de reação afetam o
teor de Na2O final.
Hidróxido de
Sódio. Um dos
reagentes do
processo
Erro aleatório Modelo proposto:
iiioi eXXY +++= 2211 βββ
Teor de óxido de
sódio (Na2O)
ocluído na alumina
Temperatura
de reação
Razão
Al2O3/NaO
sódiodeHidróxido
alumíniodeÓxido
Presente na bauxita que entra no
processo de produção do alumínio
Um dos
reagentes do
processo
44
INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli
Dados:
Ordem de Teor de Na2O Razão Temperatura
coleta das (%) Al2O3/NaOH (°C)
observações Y X1 X2
1 0,43 0,647 77,1
2 0,39 0,638 78,3
3 0,44 0,651 76,0
4 0,42 0,648 77,9
5 0,43 0,640 74,1
6 0,42 0,643 74,6
7 0,41 0,643 76,0
8 0,46 0,651 73,3
9 0,42 0,650 78,6
10 0,40 0,639 78,7
11 0,39 0,636 77,8
12 0,41 0,641 75,8
13 0,43 0,649 77,3
14 0,39 0,633 76,5
15 0,41 0,645 78,6
16 0,43 0,642 74,7
17 0,40 0,638 75,5
18 0,39 0,635 78,2
19 0,40 0,639 75,9
20 0,40 0,639 76,6
21 0,42 0,645 78,0
22 0,44 0,650 77,2
23 0,40 0,642 78,0
24 0,43 0,648 76,1
25 0,42 0,642 74,6
26 0,39 0,633 77,5
Dados utilizados no estudo do Tipo de Relacionamento existente entre a razão
Al2O3/NaOH, a temperatura de reação e o teor de Na2O ocluído na Alumina
Assim,
262262126126
32321313
22221212
12121111
eXXY
eXXY
eXXY
eXXY
o
o
o
o
+++=
+++=
+++=
+++=
βββ
βββ
βββ
βββ
M
Na forma matricial teríamos:
45
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
+
=
26
2
1
2
1
0
226126
2212
2111
26
2
1
1
1
1
e
e
e
XX
XX
XX
Y
Y
Y
MMM
β
β
β
3 x 1
26 x 1 26 x 3 26 x 1
ou seja, . εβ += XY
Pode-se demonstrar que
~
1
~
')'(ˆ YXXX −=β
=
−
−
≅
−
−
−−
=
2
1
0
ˆ
ˆ
ˆ
0051,0
7904,2
9878,0
160,825
923,6
770,10
02,049,063,1
49,066,133293,893
63,193,89355,699
β
β
β
x
Assim, o modelo ajustado será:
21 0051,07904,29878,0ˆ XXY −+−=
Baseado nessa equação ajustada as seguintes interpretações poderiam ser
estabelecidas:
um aumento de uma unidade em X1, com X2 constante aumento médio de
2,79% em Y;
⇒•
• um aumento de um °C em X2, com X1 constante ⇒ redução média de 0,0051%
em Y;
46
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
→0β̂ sem interpretação pois X1 = 0 ou X2 = 0 não ocorrem, além de, nesse
exemplo, não fazerem sentido.
•
Observe que ainda não foi realizado nenhum teste para verificação da validade
dessa equação ajustada. Portanto, a validade dessas interpretações só se dará após a
análise de resíduos, seguido dos testes estatísticos apropriados.
8.13.2.2 Inferência em regressão múltipla
Suposição: );0(~ 2σNiidsãoei
0
210
)1;(~
01:
0:
HsobKnKF
QMresíduo
oQMregressãF
émenospeloH
H
calc
ia
K
−−=
≠
====
β
βββ L
Se α/. pHrejFF otabcalc ⇒≥
Tabela para obter o Fcalc:
F.V. g.l. SQ QM Fcalc
Regressão k SQRegr QMRegr QMReg/QMRes
Resíduo n-k-1 SQRes QMRes
Total n-1
OBS1: As expressões para os cálculos das SQ e QM são dadas abaixo.
( )
1
''ˆ'
1
''ˆ
2
−−
−
=
−−
=
−
==
∑
Kn
YXYY
Kn
SQQM
K
n
Y
YX
K
SQ
QM
res
res
i
regr
regr
β
β
OBS2: Outras fórmulas bastante úteis para o bom entendimento dos cálculos realizados são:
SQTotal = ∑
=
−
n
i
i yy
1
2)( ; SQRegressão = ∑
=
−
n
i
i yy
1
2)ˆ( ;SQResíduo = ∑ ∑
= =
=−
n
i
n
i
iii eyy
1 1
22)ˆ(
8.13.2.3 Exemplos
Exemplo 8.13.2.3.1
Seja X1 = {1, 2, 3, 4, 5}, X2 = {2, 3, 4, 6, 10} e Y = {12, 16, 18, 21, 24}
47
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Pede-se:
a) Considerando o modelo Y = β0 + β1X1 + β2X2 + ε, obtenha o vetor Y e a matriz
X;
b) Obtenha as matrizes X’X e X’y
c) Obtenha as estimativas dos parâmetros, dado a seguinte (X’X)-1
x1 x2
1.2256410 -0.6410256 0.1794872
x1 -0.6410256 1.0256410 -0.4871795
x2 0.1794872 -0.4871795 0.2564103
d) Obtenha a média de y;
e) Obtenha os valores ajustados de y;
f) Usando as fórmulas dadas na observação 2 acima, calcule a SQTotal,
SQRegressão e SQResíduo. Monte o quadro na ANOVA e conclua.
Dica: todas as respostas podem ser obtidas no endereço
www.dpi.ufv.br/~peternelli/inf460/materiais.htm
Adicionalmente poderíamos testar cada coeficiente separadamente utilizando um
teste t.
Ho: βj = 0 vs Ha: βj ≠ 0 j = 0, 1, ..., k
( )..1~
ˆ
ˆ
2
lgKnt
C
t
jj
j
calc −−=
σ
β
onde: ̂ 2σ
onde Cjj corresponde ao elemento ocupando a posição jj na matriz (X’X)-1, com j
variando de 0 a k.
( ) ( )1/''ˆ' −−−== KnYXYYQM residuo β
A regra decisória continua sendo:
Se 0Hserejeitatt tabcalc −⇒≥
Ou avalia-se pelo p-value.
Intervalos de confiança também podem ser obtidos para os coeficientes de
regressão. Um intervalo de 100 (1 – α)% de confiança para βi é dado por:
48
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
1,
2
22 ˆˆˆ.ˆ
−−
=
+≤≤−
kntab
jjtabjjjjtabj
tt
CtCt
α
σββσβ
onde:
8.14 O Coeficiente de Determinação e o Coeficiente de Determinação Ajustado
2R
2
ajR
Na regressão linear simples, o coeficiente de determinação é representado por r².
No entanto, para regressão linear múltipla, usamos R², chamado, geralmente, coeficiente
de determinação múltiplos.
O R² informa a quantidade reduzida na variabilidade de Y pelo uso das variáveis
regressoras X1, X2, ..., Xk no modelo. Em outras palavras, o quanto da variação de Y
que é explicada pelo modelo.
O R² é dado por:
total
resíduo
total
regressão
SQ
SQ
SQ
SQ
R −== 12
É importante notar que um valor grande do R² não implica,
necessariamente, que o modelo de regressão é bom. Ao adicionar uma variável ao
modelo, sempre haverá um incremento no R². Isso ocorre mesmo que a variável incluída
seja significativa estatisticamente ou não.
Ex: (um exemplo numérico será visto oportunamente)
pmReXXY
mreXY
iiioi
iioi
+=→+++=
==++=
22
21
2
1
βββ
ββ
Portanto, é possível que modelos com R² elevado forneçam predições de novas
observações ruins ou estimativas de respostas médias ruins.
Uma alternativa para esse problema de interpretação do R² e uso do R² ajustado,
definido por:
( )22 1.11
)1(
)(1 R
pn
n
n
SQ
pn
SQ
R
toal
resíduo
aj −
−
−
−=
−
−
−=
49
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
ou seja,
total
resíduo
aj QM
QM
R −=12
De modo geral o R² ajustado nem sempre aumenta quando variáveis são
incluídas no modelo. E o mais importante é que o R² ajustado irá diminuir se uma
variável não importante (estatisticamente não significativa) for adicionada ao modelo.
OBS: Quando o R² e o forem muito discrepantes, haverá bom indicativo de que termos não 2ajR
significativos tenham sido adicionados no modelo.
8.14.1. Exercícios
Exercício 8.14.1.1. considere os dados do exercício 8.13.2.3.1. Pede-se:
a) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + ε.
b) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + β2X2 + ε, ou
seja, foi incluído a variável X2 no modelo. Observe agora que X2 é não
significativo;
c) Compare os resultados dos coeficientes de determinação
d) Compare os resultados dos coeficientes de determinação ajustados.
e) Discuta sobre os resultados obtidos em c e d.
Respostas: As respostas para esse problema podem ser obtidas no endereço
eletrônico www.dpi.ufv.br/~peternelli/inf460/materiais.htm, na resolução do
exercício 8.13.2.3.1.
8.15. Teste para a Falta de Ajustamento
Quando alguns níveis da variável regressora X (ou combinação de níveis das
variáveis regressoras Xi) são repetidos, o modelo ajustado pode ser testado usando o
teste para a falta de ajustamento. Isto freqüentemente ocorre quando a análise de
regressão esta inserida no contexto de delineamentos experimentais.
Uma explicação mais teórica, com fórmulas e suas deduções podeser
encontrada em Montgomery (1996, pág. 568). Aqui será apresentado apenas uma
abordagem prática à partir dos resultados das saídas das análises realizadas no SAS.
Posteriormente será disponibilizado na internet os resultados obtidos no R.
A idéia básica é apresentada a seguir, supondo, para facilitar, a existência de
apenas 1 fator no DIC com K níveis distintos. No entanto, certos níveis podem aparecer
repetidos nj vezes.
Passos:
(A) Procede-se à realização de uma ANOVA do tipo:
50
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
F.V. g.l. SQ
Trat. K – 1 SQtrat.
Erro Puro por diferença por diferença
Total N – 1 SQtotal
= Erro (A)
onde N = número total de observações;
g.l. erro puro = N – 1 – K + 1 = N – K.
(B) Procede-se à realização de uma análise de variância para a regressão, segundo o
modelo proposto. Por exemplo, se o modelo é Y , então: io eX ++= 1ββ
F.V. g.l. SQ
Regressão p = 1 SQregressão.
Resíduo por diferença
Total N – 1
= Erro (B)
assim, o g.l. do resíduo será N – p – 1
(C) Considera-se a seguinte partição envolvendo os passos (A) e (B):
To
OBS: Para outros modelos de regressão basta substituir o valor de p, o g.l. da regressão, apropriado.
(D) O teste será o seguinte:
PuroErro
ajFalta
calc QM
QM
F .= e ( )puroerrolgajfaltalgcritico FF ...;..;α=
regra decisória:
Se ⇒< criticocal FF
F.V. g.l. SQ
Trat. K - 1 SQtrat.
Erro Puro N - K
tal N - 1
F.V. g.l. SQ
Trat. p SQregressão
Falta de Ajust. K - 1 - p SQtrat - SQreg
Erro Puro N - K
Total N – 1 SQtotal
��������������������������������������������������������������������������������������������������������������������������
Não rejeita a hipótese H0 de que o
modelo escolhido é apropriado. Ou
seja, não há indícios de “falta de
ajustamento”.
então QM )(. amenteestatisticQM PuroErroAjFalta =
pode-se obter QMconjunto ou não para testar os parâmetros do modelo
Se ⇒≥ críticocalc FF
Rejeita-se Ho. Então existe “falta de
ajuste”. Assim, há indícios de que o
modelo não seja apropriado.
51
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Nesse último caso devemos tentar outro modelo.
OBS: Se houver interesse em apresentar o R² do modelo final quando tem-se repetições de alguns
“níveis” de X, faz-se:
tratamento
regressão
SQ
SQ
R =2
Algumas considerações extras serão apresentadas em sala de aula se for
conveniente, e se o tempo permitir.
8.15.1. Exercícios
Exercício 8.15.1.1. Considerando os dados usados na análise de regressão múltipla,
considerar apenas a variável ”razão” e fazer o teste para a falta de ajustamento
considerando o modelo de uma regressão linear simples.
Respostas parciais. (a análise completa está apresentada em anexo)
(a)
F.V. g.l. SQ
Trat 14 0,007767
Erro(a) 11 0,001067
Total 25 0,00883
(b)
F.V. g.l. SQ
Regressão 1 0,00654
Erro(b) 24 0,00230
Total 25 0,00883
(c)
F.V. g.l. SQ QM F
Regressão 1 0,00654
Falta Ajust. 13 1,227x10-3 9,438x10-5 0,97
Erro (a) 11 9,7x10-5
Total 25
obs.: o valor F calculado é não significativo. Então há indícios de que o modelo seja
adequado.
52
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
8.16. Experimentos Fatoriais e o Fatorial Fracionado
Segundo King (1995) os arranjos fatoriais e fatorial fracionado estão dentre os
arranjos mais usados em experimentos industriais. Veremos aqui alguns casos mais
gerais e simplificados desses dois arranjos, com exemplos.
Neste tipo de experimento todos os fatores em estudo variam simultaneamente
de forma a termos uma visão mais realística das operações conjuntas de um processo.
Dessa forma, ao invés de estudarmos um fator por vez, como por exemplo, o fator
temperatura, e seu efeito na variável resposta, podemos estudar o efeito da temperatura
conjuntamente com outros fatores (por exemplo, concentração de reagente,
luminosidade, etc) na variável resposta (por exemplo, qualidade sensorial do produto
final). Essa avaliação conjunta permite o estudo da interação existente entre os fatores.
Mais sobre o significados do termo “interação” será discutido oportunamente.
8.16.1. Experimentos Fatoriais
Cada fator é colocado em dois ou mais valores (níveis ou categorias)
dependendo da situação experimental.
Na área industrial geralmente os fatores são testados num mesmo número de
níveis, que varia de 2 a 3.
Uma notação conveniente para esse tipo de experimento é “pn”, onde n
corresponde ao número de fatores e p é o número de níveis de cada fator. Por exemplo:
Um experimento fatorial com 2 fatores A e B, cada um com 3 níveis, A1, A2 e
A3, e B1, B2 e B3, respectivamente, seria representado por: experimento fatorial
32 (= 3 x 3).
•
•
•
Vejamos: nesse experimento teremos 9 = 32 tratamentos, que são: A1B1, A1B2,
A1B3, A2B1, A2B2, A2B3, A3B1, A3B2, A3B3.
Assim, essa notação mostra o número de tratamentos (combinação dos níveis
dos fatores existentes) do experimento;
Se, por acaso, tivéssemos um fatorial com os tratamentos: A1B1, A1B2, A1B3,
A2B1, A2B2, A2B3, teríamos dois fatores com níveis diferentes. O fator A com 2
níveis, e o fator B com 3 níveis. Assim, a representação seria: 2 x 3, ou seja,
“fatorial 2 x 3”;
Se temos, agora, 3 fatores, A, B e C. O fator A com 3 níveis e os outros fatores
com 2 níveis. Teremos, então, o “fatorial 3 x 2 x 2” = “fatorial 3 x 22” .
53
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Os seguintes efeitos podem ser estudados num experimento fatorial:
(A) Efeito Principal: o efeito principal de um fator é a variação média na resposta
produzida por uma variação no nível do fator, ou seja, ao mudar o nível de um fator,
independente do atual nível dos demais fatores, qual será a variação média da variável
resposta produzida?
(B) Efeitos de Interação: É o efeito simultâneo dos fatores sobre a variável em estudo.
Existe interação entre os fatores quando a diferença na resposta entre os níveis de um
fator não é a mesma para todos os níveis dos outros fatores.
Graficamente Teríamos: Suponha um experimento fatorial 3 x 2 (3 operadores; 2
máquinas).
8.16.1.1. Modelo Linear para os Experimentos Fatoriais
Considere um experimento fatorial com 2 fatores, com a e b níveis, segundo o
delineamento inteiramente casualizado, com K repetições. O modelo será:
ijkijjiijk eY ++++= αββαµ
em que:
Yijk = valor observado para a variável em estudo referente a k-ésima repetição da
combinação do i-ésimo nível do fator A com o j-ésimo nível do fator B;
=µ média geral;
54
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
=iα efeito do i-ésimo nível do fator A no valor observado Yijk;
=jβ efeito do j-ésimo nível do fator B no valor observado Yijk ;
=ijαβ efeito da interação do i-ésimo nível do fator A como o j-ésimo nível do fator B;
=ijke erro associado à observação Yijk.
OBS: Se o experimento fosse instalado segundo o DBC, com K blocos, o modelo seria:
ijkkijjiijk ewY +++++= αββαµ
em que, adicionalmente:
=kw efeito do k-ésimo bloco na observação Yijk.
A decomposição da variação total observada pode ser organizada no seguinte
quadro de análise de variância (para o DIC):
FV gl SQ QM F
A b-1 SQA
B b-1 SQB
A*B (a-1)(b-1) SQAB
Resíduo ab(K-1) SQRes
Total abK-1 SQTotal
Tratamento por diferença
As fórmulas das Somas de Quadrados são:
∑∑∑ −=
k j i
ijk CYSQTotal
2
onde
( )
abk
Yijk
2∑∑∑=C
( )
C
k
AB
SQTrat
j i
ij −= ∑∑
2
em que ABij é o total da combinaçãoij
dos fatores A e B.
C
bk
ASQA
i
i −= ∑
2
onde Ai é o total do nível i do fator A.
55
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
C
ak
B
SQB
j
j −= ∑
2
onde Bj é o total do nível j do fator B.
SQBSQASQTratSQAB −−=
SQTratSQTotalsSQ −=Re
OBS: se for DBC, precisamos da Cab
wSQBlo
k
k −= ∑
2
cos
O teste F é feito da maneira usual (se efeitos são fixos). Veremos aqui apenas o
caso para modelo de efeito fixo. Nesse caso as hipóteses estatísticas seriam:
Efeito Principal:
H0: m1 = m2 = ... = mi
Ha: não H0
Interação:
Ho: os fatores atuam independentemente
Ha: os fatores não atuam independentemente
Se ; ( ) 0min..;..; HserejeitaFFF adordenolgnumeradorlgcríticocalc −⇒=≥ α•
•
•
Se H0 da interação não for rejeitada estudar os fatores separadamente; ⇒
Se H0 da interação for rejeitada ⇒ estudar um fator dentro de cada nível de
outro fator.
OBS 1: Se todos os efeitos, ou alguns, forem aleatórios, precisaríamos conhecer as esperanças dos
quadrados médios associados a cada fonte de variação. Nesse caso as razões usadas nos testes F não
seriam tão óbvias. O leitor interessado deve consultar Montgomery (1997).
OBS 2: Se o fator tem apenas 2 níveis, o teste F já é conclusivo.
OBS 3: Se fator qualitativo com mais de dois níveis, pode-se aplicar teste de médias.
OBS 4: Se fator quantitativo com mais de dois níveis, deve-se usar regressão.
Os exemplos abaixo foram rodados no SAS e seus outputs estão disponibilizados
no endereço eletrônico www.dpi.ufv.br/~peternelli/inf460/materiais.htm
56
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Exercício 8.16.1.1.1.
Extraído de Drumond, Werkema e Aguiar, 1996, v6, p164. Fatorial 3x6 (3
operadores e 6 engomadeiras). Problema: na prática estavam ocorrendo valores de y
fora da fixa limite de especificação. Suspeitas: existiam 6 engomadeiras de marcas
distintas, as quais eram controladas por 3 operadores. Então poderia estar havendo
diferenças na forma de funcionamento das engomadeiras e no modo de trabalho dos
operadores. Objetivo: identificar onde estaria o problema.
Pede-se:
a) Realize a ANOVA;
b) Realize a análise de resíduos;
c) Se possível, conclua.
d) Se for necessário use o teste de Tukey para auxiliar em suas conclusões.
Exercício 8.16.1.1.2.
Exemplo do King (data) p.332 e 184.
O experimento foi conduzido numa fábrica de tijolos. Variável resposta:
“modulus of ruptura (MOR)”, que seria a resistência do tijolo. Os fatores em estudo
foram: Tempo (Time) e Temperatura (Temp) do processo de cozimento do tijolo. Foram
realizadas 4 repetições do experimento. Cada valor da variável rsposta foi obtida
apoiando-se os extremos do tijolo num suporte e aplicando-se uma força crescente no
seu centro até sua quebra.
Pede-se:
a) Realize a ANOVA;
b) Realize a análise de resíduos;
c) Se possível, conclua.
d) Faça as análises necessárias para auxiliar em suas conclusões.
Apesar de ser possível delinear um experimento fatorial com qualquer número
de fatores e níveis de fatores, na área industrial, principalmente, alguns tipos especiais
de experimentos fatoriais são mais importantes e freqüentemente usados.
Estamos falando dos experimentos fatoriais com K fatores, cada qual com
apenas 2 níveis, ou seja, os experimentos fatoriais 2K.
57
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Aqui os níveis poderão ser quantitativos, como os valores da temperatura,
pressão, ou tempo; ou eles poderão ser qualitativos, como 2 máquinas, ou 2 operadores
nos “níveis” “alto” e “baixo” ou, talvez a “presença” ou “ausência” do fator.
Pressupõe-se:
(A) Os fatores são fixos;
(B) O delineamento é completamente casualizado;
(C) A pressuposição usual de normalidade é satisfeita.
Montgomery (1997) enfatiza que esses experimentos fatoriais 2K são
particularmente úteis nos estágios iniciais de um trabalho, quando é provável existir
muitos fatores a serem investigados. Nesses experimentos teremos o menor número de
ensaios (runs, em inglês) para que os fatores possam ser estudados num fatorial
completo. Por isso esse tipo de experimento é usado na identificação de fatores
importantes no início de estudos de processos.
Como estamos considerando apenas 2 níveis para cada fator, deve ser assumido
que a resposta seja linear no intervalo escolhido para os níveis do fator. Por exemplo,
considerando um único fator:
No gráfico (B) a resposta real não é linear entre os níveis do fator A estudado.
Quando isso puder ocorrer, o pesquisador pode incluir “pontos centrais” no
delineamento, ou escolher outros delineamentos para avaliar os efeitos dos fatores.
Veremos isso melhor ao falarmos de superfície de resposta.
Exemplo 8.16.1.1.3.: P. 291 (Montgomery)
Fatores:
Concentração de um reagente (A) •
• Quantidade do catalisador (B)
58
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Resposta: Resultado da reação química (Y)
Níveis do fator:
•
•
ia
A A→ 1 = 15%; A2 = 25%
B → B1 = 1 unidade de peso (pounds ≅ 0,5 Kg); B2 = 2 unidades de peso
Repetições: n = k = 3
Dados: Valores do Y obtidos
A B I II III A B Total méd
15 1 (15.1) 28 25 27 - - (1) 80 80/3
25 1 (25.1) 36 32 32 + - a 100 100/3
15 2 (15.2) 18 19 23 - + b 60 60/3
25 2 (25.2) 31 30 29 + + ab 90 90/3
Fatores Repetição Cod. Possíveltrat
�
�
�
�
��
���
�
�
�
�
�
�
�
�
�
�
�
��
��
��
��
��
��
O modelo estatístico seria: Y ijkijjiijk e++++= αββαµ
Da tabela acima, última coluna, podemos fazer a seguinte associação: µ ;
; ; e αβ ab, para podermos obter as estimativas dos efeitos de A, B e AB.
)1(=
a=α b=β =
O efeito de A pode ser obtido como:
( ) 33,8806010090
3.2
1
2
)1(
2
=−−+=
+
−
+
=−= −+
n
b
n
aabYYA AA
De B:
( ) 00,5801006090
3.2
1
−=−−+=−= −+ BB YYB
De AB:
( ) ( ) 67,1601008090
3.2
1)1(
3.2
1
=−−+=−−+= baabAB
Observe que AB = A*B, ou seja:
A B AB- - + (1)+ - - a- + - b+ + + ab
Assim obtemos o sinal
de cada efeito.
A metade da diferença
entre a média dos + e –
é o efeito desejado.
59
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Baseado nas estimativas dos efeitos as seguintes conclusões poderiam ser apresentadas:
O efeito de A (concentração do reagente) é positivo. Isto indica que
aumentando-se A do nível baixo (15%) para o nível alto (25%), irá aumentar a
“produção”;
•
•
•
O efeito do B (catalisador) é negativo, sugerindo o contrário do anterior;
O efeito da interação parece ser pequeno, em relação aos efeitos principais.
Em experimentos envolvendo experimentos fatoriais, 2K, nós examinamos a
magnitude e a direção dos efeitos dos fatores para identificar as variáveis de
importância.
Uma maneira mais fácil para identificá-las seria através da análise de variância.
Veremos isso no SAS. (a análise completa realizada no SAS está apresentada no
endereço eletrônico www.dpi.ufv.br/~peternelli/inf460/materiais.htm
Nesse exemplo o quadro da ANOVA seria:
FV gl SQ QM F p-value
A 1 208,33 208,33 53,15 < 0,01
B 1 75,00 75 19,13 < 0,01
A*B 1 8,33 8,33 2,13 0,1826
Resíduo 8 31,34 3,92
Total 11 (= n - 1) 323,00
Onde n = nº de observações = n x 2 x 2 = 22 x n = 4 x 3 = 12
OBS 1: As fórmulas para o cálculo das Somas de Quadrados são as usuais.
OBS 2: Montgomery (1997) apresenta fórmulas práticas bastante simples para as Somas de Quadrados.
No entanto, estamos imaginando que tais análises serão realizadas no computador, de modo que usar ou
não fórmulas práticas seria irrelevante. O mais importante no contexto dessa disciplina seriamas
interpretações.
Comparar o quadro da ANOVA acima com as saídas obtidas do computador.
OBS 3: Após a identificação das variáveis importantes no processo, pode ser ajustado um modelo de
regressão para que facilmente se possa obter a resposta para cada combinação de níveis dos fatores
importantes. Se o modelo envolver duas variáveis explicativas, teremos os modelos de superfície de
resposta.
No exemplo:
60
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
21 2
00,5
2
33,85,27ˆ XXY
−+
+=
= - 1 se B = 1
= 1 se B = 2
= - 1 se A = 15
= 1 se A = 25
Exemplo 8.16.1.1.4. Outro exemplo: Fatorial 2³
Montgomery (1997), p. 305. Estudo do efeito da porcentagem de “carbonation”,
A, pressão de operação, B, e velocidade da linha de produção, C, sobre a altura de
enchimento de refrigerantes.
A = B = C = 2 Rep.
10
12
25
30
200
250
Explicação do problema: p. 258 do livro
Inicialmente pode-se rodar uma ANOVA para se avaliar a significância dos
efeitos. Veja o output no endereço: www.dpi.ufv.br/~peternelli/inf460/materiais.htm
Posteriormente podemos até ajustar um modelo de regressão:
21123322110
ˆˆˆˆ XXXXXY βββββ ++++=
ou . 214ˆ XXβ
21321 2
75,0
2
75,1
2
25,2
2
00,300,1ˆ XXXXXY
+
+
+
+=
8.16.2. Experimentos Fatoriais com uma Única Repetição
parei aqui
61
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
21 2
00,5
2
33,85,27ˆ XXY
−+
+=
= - 1 se B = 1
= 1 se B = 2
= - 1 se A = 15
= 1 se A = 25
Exemplo 8.16.1.1.4. Outro exemplo: Fatorial 2³
Montgomery (1997), p. 305. Estudo do efeito da porcentagem de “carbonation”,
A, pressão de operação, B, e velocidade da linha de produção, C, sobre a altura de
enchimento de refrigerantes.
A = B = C = 2 Rep.
10
12
25
30
200
250
Explicação do problema: p. 258 do livro
Inicialmente pode-se rodar uma ANOVA para se avaliar a significância dos
efeitos. Veja o output no endereço: www.dpi.ufv.br/~peternelli/inf460/materiais.htm
Posteriormente podemos até ajustar um modelo de regressão:
21123322110
ˆˆˆˆ XXXXXY βββββ ++++=
ou . 214ˆ XXβ
21321 2
75,0
2
75,1
2
25,2
2
00,300,1ˆ XXXXXY
+
+
+
+=
8.16.2. Experimentos Fatoriais com uma Única Repetição
Nos experimentos fatoriais do tipo 2K, quando o número de fatores é grande,
freqüentemente só é possível executar uma única realização do experimento chamado
“fatorial sem repetição”.
Usualmente pode-se considerar essa estratégia quando é variável a pressuposição
de que o erro aleatório no processo em estudo é pequeno.
Com uma única repetição do experimento, não é possível estimar o erro puro.
61
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Uma proposta para a análise desse tipo de experimento é a seguinte: Examinar o
gráfico da probabilidade normal das estimativas dos efeitos.
O princípio básico é:
Os efeitos que são insignificantes são normalmente distribuídos com média zero
e variância σ e tenderão a cair sobre uma linha reta nesse gráfico; 2
•
•
•
•
No entanto, os efeitos significativos ficarão fora dessa reta, ou seja, terão médias
diferentes de zero;
Assim, o modelo preliminar será aquele contendo apenas aqueles efeitos
aparentemente com média diferente de zero, baseado nesse gráfico;
Os efeitos não significativos são, então, combinados para estimar σ . 2
Exemplo P. 319, Montgomery (1997) – (exercício p319doM)
(esse exercício poderá ser encontrado no endereço eletrônico
www.dpi.ufv.br/~peternelli/inf460/materiais.htm)
Estudo dos fatores que possam influenciar na taxa de filtragem de certo produto
químico.
Fatores:
A: Temperatura; •
•
•
•
B: Pressão;
C: Concentração de formaldeído;
D: Taxa de rotação (stirring).
8.16.3. Experimentos Fatoriais Fracionados
Será dado nesse curso uma rápida idéia sobre esse tipo de experimento seguido
da análise e interpretação no SAS. Para uma abordagem geral, ler Montgomery (1996,
cap 9 e 10).
Imagine um experimento fatorial 26. São 6 fatores e, para a realização de uma
repetição completa desse experimento, seriam necessários 26 = 64 ensaios. Pode
acontecer que mesmo uma única repetição desse experimento ultrapasse os recursos
disponíveis pelo experimentador.
Alem disso, apenas 6 dos 63 gl correspondem aos efeitos principais, e apenas 15
gl correspondem às interações de 2 fatores. Os demais gl correspondem às demais
interações.
62
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Se puder ser assumido que algumas interações de ordem elevada são
insignificantes, então as informações sobre os efeitos principais e interações de ordem
baixa poderão ser obtidas se apenas uma fração do experimento completo for realizada.
Segundo Montgomery (1997) esse tipo de experimento está entre os mais
amplamente usados tipos de delineamentos para o desenvolvimento e melhoria de
processos e produtos.
É importante salientar que seu principal uso é no desenvolvimento de
experimentos iniciais, quando só tem muitos fatores e pouco se sabe sobre seus efeitos
na resposta de interesse.
Os fatores eventualmente identificados como sendo de grande efeito são, então,
melhor investigados em experimentos subseqüentes.
Vejamos um exemplo:
Considere a situação em que existam 3 fatores, cada um com 2 níveis. Teríamos
então 8 ensaios para as 8 combinações de tratamentos (supondo apenas uma repetição
do experimento). A tabela abaixo ilustra o delineamento:
Tratamento I A B C AB AC BC ABC
a + + - - - - + +
b + - + - - + - +
c + - - + + - - +
abc + + + + + + + +
ab + + + - + - - -
ac + + - + - + - -
bc + - + + - - + -
(1) + - - - + + + -
Efeitos Fatoriais
������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
OBS: As interações são obtidas por produto direto.
Se pudermos ensaiar apenas 4 realizações (ensaios), então poderemos montar a
½ fração do fatorial 23. Essa ½ fração formará o 23-1 = 22 experimento fatorial, com
apenas 4 ensaios.
A maneira de montar a tabela ilustrada para esse delineamento seria o seguinte:
(a) Escolhe-se 3 – 1 = 2 fatores. Supor A e B; e construa a tabela mostrando a
combinação desses níveis dos fatores desse fatorial completo:
63
A B
+ -
- +
- -
+ +
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
(b) Faz-se C = A*B. Obtém os sinais de C e dos demais efeitos:
I A B C = A*B AB AC BC ABC Y
+ + - - - - + + Y1
+ - + - - + - + Y2
+ - - + + - - + Y3
+ + + + + + + + Y4
�
��
�
�
�
�
�
�
�
Assim, para a estimação da média geral, I, seria necessário “somar” todas as 4
observações, e também para obter a interação ABC. Então não podemos separar a média
geral da interação ABC. Eles são ditos estarem “aliased”, do inglês. A notação será I =
ABC.
Observando a tabela vemos que: A = BC, B = AC e C = AB, além de I = ABC.
Nesse caso, se assumirmos que as interações BC, AC, AB e ABC são
insignificantes, então esse fatorialfracionado poderia ser usado no experimento e
poderiam ser estimadas:
A média geral, I; •
• Os efeitos principais A, B e C.
OBS: Ainda poderíamos ter frações desses fatoriais fracionados. Por exemplo:
Fatoriais fracionados 2K-p, correspondendo à fração 1/2p do fatorial completo 2K.
Os fatoriais fracionados são classificados de acordo com o tipo de “aliases”
existente. A isso chamamos resolução de delineamento, e representamos por algarismos
romanos.
OBS: Uma maneira fácil de entender a resolução de um delineamento é considerar que a sua resolução é
igual ao menor número de letras em qualquer “palavra” da relação de definição.
Por exemplo, no exemplo acima, I = ABC, A = BC, B = AC e C = AB
3 Letras 4
Portanto resolução III e escrevemos:
Fatorial fracionado 132 −III
3 3
Os delineamentos com resoluções III, IV e V são particularmente importantes.
Teremos:
(1) Delineamentos de Resolução III
64
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
Úteis quando somente os efeitos principais são de interesse. E todos os demais
efeitos são assumidos insignificantes;
•
•
•
Efeitos principais estão “aliased” com interações duplas e interações duplas
“aliased” com outras interações duplas;
Exemplo: o exemplo anterior: . 132 −III
(2) Delineamentos de Resolução IV
Úteis quando os efeitos principais e certas interações duplas são de interesse, e
os outros efeitos são assumidos insignificantes;
•
•
•
Efeitos principais estão livres das interações duplas, mas interações duplas estão
“aliased” entre si;
Exemplo: (veja quadro abaixo): 142 −IV
A B C D = ABC
- - -
+ - -
- + -
+ + -
- - +
+ - +
- + +
+ + +
Assim,
A = A2BCD = BCD
B = ACD
C = ABC
AB = CD
AC = BD
BC = AD
Definição de relação ⇒ I = ABCD
(3) Delineamentos de Resolução V
Efeitos principais e interações duplas são de interesse. Todos os demais efeitos
assumidos insignificantes;
•
• Nenhum efeito principal ou interação dupla esta “aliased” com qualquer outro
efeito principal ou interação dupla, mas interações duplas estão “aliased” com
interações triplas;
•
A B C D E = ABCD
Exemplo: com relação de definição I = ABCDE 152 −V
A = BCDE
B = ACDE
C = ABDE
D = ACCE
AB = CDE
AC = BDE
M
65
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
O ideal é ter fatoriais fracionados com a maior resolução possível, pois, quanto
maior a resolução, menos restrições nas pressuposições sobre as insignificâncias de
certas interações são necessárias, para que possamos obter interpretações únicas dos
dados
Montegomery (1997, P. 398 e 683) apresenta duas extensas tabelas mostrando,
respectivamente, uma seleção de 2k-p delineamentos fatoriais fracionados para k ≤ 15
fatores e até o máximo de 128 combinações de níveis dos fatores, e a relação de “alias”
para a maioria dos delineamentos. Veja parte da tabela em anexo.
O uso dessas tabelas torna fácil selecionar o delineamento com a resolução
suficiente para garantir que qualquer interação de interesse potencial possa ser estimada.
Uma vez escolhido o delineamento que melhor atenda os interesses do
experimentador, e com boa qualidade estatística, ou seja:
que inclua o máximo de fatores de interesse; •
•
•
•
que estime, livremente, o máximo de efeitos;
que tenha o mínimo necessário de combinações de níveis dos fatores (mínimo de
“runs”);
que tenha a maior resolução possível,
basta realizar o experimento, coletar os dados, e executar a análise de variância.
Baseado na ANOVA, determinar os efeitos de maior importância e interpretar o
resultado. Os efeitos, e sua significância, também poderiam ser obtidos pela ANOVA da
regressão (lembre-se de multiplicar por 2 as estimativas dos coeficientes, obtidas via
codificação -1,1).
OBS: Se o experimento não tiver repetição, podemos usar o gráfico de probabilidade normal dos efeitos
para determinar quais efeitos usar no “erro” da ANOVA.
Exemplo Montgomery (1997, P. 381) – exercício p381M
(esse exercício poderá ser encontrado no endereço eletrônico
www.dpi.ufv.br/~peternelli/inf460/materiais.htm)
Estudo de 5 fatores para o processo de fabricação de certo circuito integrado
usando o delineamento 25-1, com o objetivo de melhorar o processo de produção.
Fatores:
A: Ajuste da abertura, pequeno ou grande; •
•
•
•
B: Tempo de exposição 20% abaixo ou 20% acima do nominal;
C: Tempo de desenvolvimento 30s ou 40s;
D: Dimensão da peça, pequena ou grande;
66
http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm
INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli
E: Tempo preparo final, 14,5 minutos ou 15,5 minutos. •
DADOS:
Delineamento Básico
run A B C D E=ABCD ... Trat produção
1 − − − − + e 8
2 + − − − − a 9
3 − + − − − b 34
4 + + − − + abe 52
5 − − + − − c 16
6 + − + − + ace 22
7 − + + − + bce 45
8 + + + − − abc 60
9 − − − + − d 6
10 + − − + + ade 10
11 − + − + + bde 30
12 + + − + − abd 50
13 − − + + + cde 15
14 + − + + − acd 21
15 − + + + − bcd 44
16 + + + + + abcde 63
67