Baixe o app para aproveitar ainda mais
Prévia do material em texto
INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 8. USO DA ANÁLISE DE VARIÂNCIA E DA REGRESSÃO 8.1. Introdução A estatística é a ciência que lida com a coleta, o processamento e a disposição de dados (informação) atuando como ferramenta fundamental nos processos de soluções de problemas. A estatística trata da coleta de dados informativos e da interpretação destes dados, facilitando o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja sendo estudado. A estatística viabiliza a: Coleta Processamento dos dados. Apresentação O conhecimento gerado é, então vitalizado por meio do método gerencial (Ciclo PDCA) para atingir metas. Atualmente têm sido estimulado e difundido administrações de empresas segundo a filosofia do Controle de Qualidade. Três tipos de ações gerenciais são possíveis nestes tipos de empresas, as quais, serão abordados a seguir. 8.2. Tipos de Ações Gerenciais em Empresas que Valorizam o Controle de Qualidade (A) Planejamento da Qualidade Ação: Definir novos padrões (novo produto e novo processo) para atingir as metas de qualidade, custo, entrega, moral e segurança. (B) Manutenção da Qualidade Ação: Cumprir os padrões estabelecidos para o produto e o processo, verificando os resultados e atuando no processo para corrigir os desvios (anomalias). (C) Melhoria da Qualidade Ação: Alterar os padrões estabelecidos no planejamento da qualidade para atingir novas metas de qualidade, custo, entrega, moral e segurança. 1 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Essas ações são exercidas por meio do Ciclo PDCA: OBS: Representa o caminho a ser seguido para alcançar certo objetivo. O Ciclo PDCA é um método gerencial de tomada de decisões para garantir o alcance das metas necessárias à sobrevivência de uma organização. Esquema do Ciclo PDCA: Maiores explicações: P – Planejamento Estabelecer metas; • • • Estabelecer o método para alcançar as metas propostas. D – Execução Executar as tarefas exatamente como foi previsto na etapa de planejamento; 2 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Coletar dados que serão utilizados na próxima etapa do processo; • • • • • • São essenciais a educação e o tratamento no trabalho. C – Verificação Usando os dados previamente coletados, comparar o resultado alcançado com a meta planejada. A – Atuação Corretiva Atuar no processo em função dos resultados obtidos; Formas de atuação: - Adotar como padrão o plano proposto, caso a meta tenha sido alcançada; - Agir sobre as causas do não atingimento da meta, caso o plano não tenha sido efetivo. Na utilização desse método de gestão (PDCA) poderá ser preciso: Empregar ferramentas estatísticas para: - Coleta; - Processamento; necessárias à condução das etapas do PDCA - Disposição das informações. Dependendo do tipo de ação gerencial executado e, dentro de cada tipo de ação, podem ser utilizadas diferentes ferramentas estatísticas. Segundo Werkmam e Aguiar (1996) uma boa abordagem sobre o assunto pode ser encontrado em Campos (1994 e 1995). Uma breve abordagem sobre o assunto será feita a seguir. 8.3. Uso do Planejamento de Experimentos no Ciclo PDCA Apesar do uso da estatística ser fundamental em diversas etapas dos vários tipos de ações gerenciais (como o uso de gráficos, estatísticas descritivas, análise de regressão, etc.), será apresentado inicialmente apenas o uso de planejamento e análise de experimentos de algumas ações. Ação: Planejamento de Qualidade Ao desenvolver a característica do produto que atendam as necessidades dos clientes; • 3 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Ao desenvolver processos que sejam capazes de produzir aquelas características do produto; • Ação: Melhoria da Qualidade OBS: O Ciclo PDCA para essa ação também é denominado Método de Solução de Problemas, já que cada meta de melhoria gera um problema que a empresa deverá solucionar. • • • • Nesse tipo de ação, é essencial o uso de ferramentas estatísticas apropriadas para coletar, processar e dispor o grande volume de informações utilizadas. A sofisticação das ferramentas aumenta com o aumento da capacidade de gerenciamento (alcance de metas) da empresa. As técnicas de planejamento e análise de experimentos fazem parte das técnicas mais sofisticadas. Detalhando o Ciclo PDCA de melhoria temos (p.4 v.6): A maior efetividade das técnicas de planejamento e análise de experimentos ocorre na fase de análise, mas também podem ser efetivas nas fases de observação e verificação, e até mesmo na identificação do problema (p.4 v.6). OBS: As técnicas de análise de regressão são igualmente efetivas nas mesmas fases. Nesse modo de ação (melhoria), na fase de análise, o emprego dessas técnicas de planejamento e análise de experimentos são úteis para: O estudo do efeito conjunto das diversas causas que compõem o processo sobre o resultado para a qual foi estabelecida a meta de melhoria; • • • A identificação das principais causas sobre as quais devemos atuar no sentido de fazer com que a meta de melhoria seja alcançada; A determinação da condição de operação do processo que permitirá o alcance da meta de melhoria. 4 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Essas técnicas apresentam a vantagem de, por meio do seu emprego, fazer com que as ações relacionadas acima possam ser realizadas com o mínimo de tempo e custos e com a manutenção de um nível de confiança pré-estabelecido para as conclusões. O uso dessas técnicas envolve a realização de interferências no processo. Uso de plantas-piloto da linha de produção (se variações nos fatores forem grandes); • • Uso da própria linha de produção com pequenas variações seqüenciais dos níveis dos fatores. 8.4. Planejamento de Experimentos Definição de experimentos: Procedimentos nos quais alterações propositais são feitas nas variáveis de entrada de um processo ou sistema, de modo que se possa avaliar as possíveis alterações sofridas pela variável resposta, como também as razões dessas alterações. OBS 1: Variável de Entrada – Fatores ou causas do processo. OBS 2: Variável Resposta – Efeitos deste processo. OBS 3: Processo – Conjunto de causas ou fatores (insumos, equipamentos, informações do processo ou medidas, condições ambientais, pessoas e métodos ou procedimentos) que tem como objetivo produzir um determinado efeito (produto de processo) que apresenta uma ou mais resposta observáveis. Esquema ilustrativo: 8.4.1. Alguns Objetivos de um Experimento Planejado (A) Determinar as causas (fatores) que mais influenciam o efeito de interesse; 5 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli (B) determinar as faixas de valores para os itens de verificação associados aos fatores controláveis X’s de modo a garantir o melhor valor (ou variabilidade) para a característica da qualidade do produto. 8.4.2. Princípios Básicos do Planejamento de Experimentos (A) Repetição (réplicas) As repetições do experimento devem ser feitas sob as mesmas condições experimentais; • • • • • • Permite a obtenção de uma estimativa da variabilidade devido ao erro experimental; Pela escolha adequada do número de repetições é possível detectar, com precisão adequada, se os efeitos produzidos pelas diferentes condições experimentais são significantes na prática, ou não. (B) Casualização (aleatorização) Fazer de forma aleatória a alocação do material às diversas condições experimentais; Dá garantia ao uso de métodos estatísticos para a análise dos dados. (C)Controle Local (formação de blocos) Eliminar (controlar) fontes de variação sistemática que não fazem parte do interesse da pesquisa. Esquema ilustrativo: 6 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 8.4.3. Terminologia Básica (A) Unidade Experimental Unidade básica para a qual será feita a medida da resposta. (B) Fatores Variáveis cuja influência sobre a variável resposta está sendo estudada no experimento. (C) Níveis de um Fator Os diferentes modos de presença de um fator no estudo considerado. (D) Tratamento Combinações específicas dos níveis de diferentes fatores; Se há apenas um fator, os níveis desse fator correspondem aos tratamentos. (E) Variável Resposta Resultado de interesse registrado após a realização de um ensaio. 8.4.4. Fases de Experimento Delineado Estatisticamente (A) Fase da Definição do Delineamento Definir o melhor delineamento que responda sobre o efeito dos fatores de interesse na característica avaliada. Definido o delineamento, gera-se o plano experimental: Atribuição dos tratamentos às chamadas unidades experimentais. Existem procedimentos no SAS que geram a maioria dos planos experimentais, mas nada impede de fazê-lo sem o auxilio do SAS, bastando conhecer bem as particularidades estatísticas dos diversos delineamentos. (B) Fase da Tomada de Dados Corresponde à coleta dos dados propriamente dita. (C) Fase da Análise de Dados Existem diversos procedimentos disponíveis no SAS (SAS base, SAS/STAT e SAS/GRAPH) que auxiliam na análise e interpretação dos dados. OBS: No entanto, outros softwares poderiam ser usados ao invés dos SAS, exemplo: o R. 8.4.5. Roteiro para a Realização de um Bom Experimento. OBS: Extraído, integralmente, de Werkema e Aguiar (1996) pág. 34, mas também encontrado em Montgomery (1997) pág. 14, 4ª edição. 7 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Para usar a abordagem estatística no planejamento e na análise de um experimento é necessário que as pessoas envolvidas na experimentação tenham, antecipadamente, uma idéia clara do que será estudado e da forma como os dados serão coletados. Também é desejável que se tenha pelo menos uma idéia qualitativa de como os dados serão analisados. Um roteiro do procedimento usualmente recomendado é apresentado a seguir. 8.4.5.1. Identificação dos Objetivos do Experimento • Realize uma sessão (brainstorming) com o propósito de definir claramente os objetivos do experimento a ser realizado. Todas as pessoas que possam contribuir para a definição dos objetivos devem participar da reunião. • Utilize todo o conhecimento disponível sobre o problema que está sendo estudado com o propósito de definir claramente os objetivos do experimento. Isto é, devem ser utilizados as informações já publicadas sobre o assunto, a experiência prática do grupo e os resultados dos experimentos similares já realizados. • Expresse as informações sobre o problema em termos quantitativos. 8.4.5.2. Seleção da Variável Resposta • Utilize uma variável resposta que realmente forneça informações sobre o problema em estudo. • Determine o método de medição da variável resposta e a escala de medida a ser utilizada (por exemplo, temperatura ou logaritmo da temperatura). • Determine a exatidão das medidas da variável resposta (veja Werkema, M. C. C. – 1996a) – vol. 13 da série “Ferramentas da Qualidade”. 8.4.5.3. Escolha dos Fatores e seus Níveis • Utilize conhecimento não estatístico para: Identificar os fatores cujos níveis irão variar, os fatores cujos níveis permanecerão constantes e os fatores que não poderão ser controlados durante a realização do experimento. Escolher as faixas de variação dos fatores e o número de níveis de cada fator para os quais as medidas da variável resposta serão obtidas. • Planeje a forma de controle dos fatores quantitativos nos níveis desejados e determine o método de medição dos níveis destes fatores, bem como a escala de medida a ser utilizada. 8 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli • Determine a exatidão das medidas dos fatores quantitativos (veja Werkema, M. C. M. – 1996a) – vol. 13 da série “Ferramentas da Qualidade”. 8.4.5.4. Planejamento do Procedimento Experimental • Escolha um procedimento experimental que ajude a eliminar o efeito de fatores não controláveis sobre as comparações de interesse e que simplifique a análise dos resultados. • Considere as possíveis interações entre os fatores. • Determine as influências exercidas pelas possíveis limitações de tempo, custo, materiais, mão-de-obra e equipamentos, e por condições externas, tais como fatores climáticos. • Determine o percentual dos recursos (orçamento, tempo, etc.) disponíveis para o desenvolvimento do estudo completo, que deverá ser investido na realização do experimento. Muitas vezes este experimento é um meio para a aprendizagem da forma de condição do estudo, ou seja, é apenas um experimento inicial. Portanto, devem sobrar recursos para cumprir os objetivos finais do trabalho, não devendo então ser feito um investimento de mais de 25% ou 30% dos recursos totais neste experimento inicial. • Proponha um modelo matemático para o experimento, de modo que a análise estatística dos dados possa ser realizada. • Determine o método de aleatorização a ser utilizado e a ordem de coleta dos dados. • Determine a magnitude das diferenças obtidas entre as respostas médias correspondentes aos tratamentos incluídos no estudo, que será considerada significativa sob o ponto de vista prático. • Considere a variabilidade resultante do procedimento de amostragem e da precisão dos métodos de medição. • Determine o número mínimo de réplicas a serem realizadas, de modo a permitir que a variância do erro experimental seja estimada de forma adequada e a garantir que seja obtida a precisão necessária para alcançar os objetivos do experimento. • Prepare o roteiro que detalhe os passos a serem seguidos durante a realização do experimento, com o objetivo de minimizar a ocorrência de erros. Este roteiro deve incluir o detalhamento dos métodos, materiais e equipamentos a serem utilizados, bem com das precauções a serem tomadas durante a coleta e o registro dos dados. • Sensibilize as pessoas sobre a importância do experimento que será realizado. 9 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 8.4.5.5. Realização do Experimento • Execute o procedimento de coleta dos dados de acordo com o que foi planejado no item 8.4.5.4. • Monitore o progresso do experimento, registrando dados auxiliares (datas, número de ordem dos ensaios, dados omissos, ensaios adicionais) e quaisquer modificações que tenham sido feitas no planejamento experimental inicial. 8.4.5.6. Análise de Dados • Execute o processo de revisão dos dados com o objetivo de detectar possíveis erros de registros e emissões. • Utilize métodos gráficos para a representação dos dados. • Empregue os métodos estatísticos apropriados para a análise dos dados do experimento. • Verifique a adequação do modelo matemático adotado no item 8.4.5.4. Deve ser feito um exame crítico do modelo adotado e das suposições a ele associadas. 8.4.5.7. Interpretação dos Resultados • Considere todos os dados coletados no experimento, durante a execução da fase de interpretação dos resultados. • Estabeleça as conclusões somente a partir dos resultados obtidos pelo experimento que foi realizado. Evite fazer extrapolações para outras condições que não tenham sido incluídas no estudo. • Detalhe a análise dos dados em termos gráficos e numéricos para tornar mais clara a interpretação dos resultados. • Estabeleça os resultados em termos de suas probabilidades associadas, as quais irão medir a confiabilidade das conclusõesobtidas. • Avalie a significância prática das conclusões alem de avaliar a significância estatística. • Interprete as conclusões obtidas sob o ponto de vista técnico e traduza seu significado para as aplicações de interesse. • Registre as possíveis limitações impostas pelos dados ou pelos métodos de análise utilizados. 10 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 8.4.5.8. Elaboração do Relatório • Descreva claramente o trabalho realizado, mostrando a importância do problema tratado e significado prático dos resultados obtidos. Inclua também resultados anteriores que sejam relevantes. • Utilize gráficos e tabelas para apresentar os dados. • Apresente informações suficientes para que os leitores possam verificar os resultados e estabelecer suas próprias conclusões. • Expresse as conclusões sob a forma de um sumário. • Faça recomendações sobre as conclusões obtidas. Estas recomendações podem, por exemplo, incluir a necessidades de realização de uma nova série de experimentos, já que a experimentação é um processo interativo, onde o experimento responde algumas questões e simultaneamente coloca outras. Isto é, à medida que o experimento avança, alguns fatores iniciais podem ser abandonados, outros fatores adicionados, as faixas de variação dos fatores podem ser alteradas, em alguns casos, novas variáveis respostas podem ser empregadas. • Minimize o uso de terminologia estatística desnecessária e expresse as informações do mundo mais simples possível. 8.5. Testes de Hipóteses Ao tratarmos da análise de experimentos, será necessária a realização de testes estatísticos para a verificação de determinadas hipóteses. Assim, é necessário que se faça uma breve revisão sobre alguns conceitos relacionados à inferência estatística, ou mais especificamente, aos testes de hipóteses. 8.5.1. Idéia Geral sobre os Testes de Hipóteses Definição: Estabelecimento de uma regra decisória que permite rejeitar ou não rejeitar uma hipótese estatísticas com base nos elementos amostrais. A idéia básica sobre o testes de hipóteses consiste no uso de um conjunto de regras para decidir se rejeita, ou não, uma hipótese nula (ou hipótese básica ou de nulidade). Ex: oo :H θ=θ Se for rejeitada, valida-se a hipótese alternativa Ha. Ex: Teste Bilateral oa :H θ≠θ Ou 11 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli oaH θθ >: Teste Unilateral ou θθ <:aH Definição: Uma estatística é qualquer função das observações em uma amostra que não contenha parâmetros desconhecidos. Alguns exemplos de estatísticas são dados a seguir: ( ) n S Xt n XX S n X X ii µ−= − − == ∑∑ ; 1 ; 2 2 Ho: µ = valor definido O procedimento tradicional do teste é: (A) Formular Ho e Ha, e especificar o nível de confiança α; (B) De acordo com α e a distribuição da estatística do teste apropriado, define-se a região crítica de tamanho α; α/2 α/2 θ0 OBS: Chamamos “Região Crítica” a faixa de valores de estatística do teste que leva à rejeição da hipótese de nulidade. (C) Com base na amostra, obtida geralmente a partir de um experimento controlado, é computado todo o valor da estatística do teste. (D) Se o valor da estatística do teste pertencer à região crítica, rejeita-se Ho. Caso contrário, não se rejeita Ho. OBS.: Para discussão em aula: Qual termo utilizar – “não rejeita Ho” ou “aceita Ho”? 12 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli 8.5.2. Tipos de Erros Inerentes aos Testes de Hipóteses Ao executarmos um teste de hipóteses estamos sujeitos a dois tipos de erros: o chamado “erro tipo I” e o chamado “erro tipo II”. Esses dois tipos de erros poderiam ser entendidos da seguinte maneira: Erro Tipo I: Rejeitar Ho quando Ho é verdadeira. Erro Tipo II: Não rejeitar Ho quando Ho é falsa. Define-se: α = P(cometer o erro tipo I) nível de significância ≡ β = P(cometer o erro tipo II) OBS.: 1 - β é também conhecido como o poder de um teste. Corresponde à probabilidade de rejeitar H0 quando H0 é falsa. 8.5.3. P-value (ou valor-p) Atualmente, ao invés de fixar o nível de significância de um teste, e simplesmente relatar se Ho foi rejeitada ou não, tem-se dado preferência ao uso do p-value. Assim, ao invés de comparar o valor da estatística obtida da amostra, com o valor crítico da estatística do teste definido em função de um α fixado, faz-se: Comparar o p- value obtido para a amostra com o α fixado. Portanto, Ho é rejeitada se o p-value for menor ou igual a α. Definição Geral: para um dado valor observado de uma estatística do teste, o p-value corresponde ao menor nível de significância para o qual a hipótese Ho poderia ter sido rejeitada. OBS: Quando H0 é verdadeira Dependendo da direção do teste ( )tPvaluepHSe a ≤=−⇒< τθθ 0: ( ) verdadeiraHsetPvaluep >=− τ ( ) ( )tPoutPvaluepHSe a ≤≥=−⇒≠ ττθθ 22: 0 HSe a 00: ⇒> θθ Estatística do teste obtida da amostra Variável aleatória estatística do teste Assim, usando o p-value, o procedimento para o teste seria: (A) Formular Ho e Ha (e definir α se for de interesse); (B) Especificar a estatística do teste; 13 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli (C) Determinar o valor da estatística do teste e o p-value correspondente baseado na amostra; (D) Comparar p-value com α - Se p-value ≤ α ⇒ rejeição de Ho; - Se p-value > α não-rejeição de H⇒ o. Obs.: ou permita que o julgamento seja particularizado. Exemplo ilustrativo dado em aula: folha solta 8.6. Experimentos Completamente Casualizados com um Único Fator Para esse tópico pressupõe-se um razoável conhecimento em delineamentos experimentais apresentados em disciplina básica de estatística experimental. Os experimentos no delineamento inteiramente casualizado envolvem os princípios da repetição e casualização. Supõe-se um fator influenciando um item de controle. Quer-se conhecer a faixa de valores desse fator, no processo, de modo a ter o item de controle dentro da meta definida. É importante controlar os outros fatores que não são do interesse do pesquisador. Mantê-los em níveis constantes. Assim, pressupõem-se condições homogêneas; A casualização equilibra os efeitos dos fatores não-controláveis sobre o item de controle. Seja: Nº de Tratamentos = I = I níveis do fator Nº de repetições = J Tratamentos Repetições (observações) Totais Médias 1 y11 y12 K y1J y1. .1y 2 y21 y22 K y2J y2. .2y ... ... ... ... ... ... I yI1 yI2 K yIJ yI. .Iy y.. ..y O modelo estatístico é: Yij = µ + ti + eij i = 1, 2, ... , I; j = 1, 2, ... , J Onde: Yij = Valor observado na j-ésima repetição do i-ésimo tratamento; • • µ = Média geral dos dados (geralmente); 14 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli ti = Efeito do i-ésimo tratamento; • • • • • eij = Erro aleatório associado às observações yij. Pressuposições usuais: eij são variáveis aleatórias independentes; eij são identicamente distribuídas; eij têm distribuição normal com média zero e variância σ² constante, ou seja, eij ∼ NID(0, σ²) OBS 1: os eij podem ser oriundos de: • Erros de medição; • Efeitos de fatores não incluídos no processo e não bem controlados; • Causas de variação aleatórias desconhecidas. OBS 2: as pressuposições acima são necessárias para que os testes de hipóteses sejam aplicados sobre os efeitos de tratamentos. OBS 3: de modo geral, o objetivo da análise é estimar os efeitos de tratamentos e testá-los. 8.6.1. Modelo Fixo ou Modelo Aleatório Duas situações podem ocorrer em relação aos efeitos de tratamento. Essas diferentes situações vão ocorrer emfunção da maneira como os níveis do fator são escolhidos. (I) Modelo de Efeitos Fixos Quando os níveis do fator são especificados pelo experimentador. Neste caso: Testa-se hipóteses sobre as médias de tratamentos; • • • • • • Conclusões são válidas apenas para esses níveis; Pode-se estar interessado em estimar µ, ti, σ². (II) Modelo de Efeitos Aleatórios Os efeitos aleatórios poderão ocorrer quando os K tratamentos corresponderem a uma amostra aleatória de uma grande população de tratamentos. Nesse caso: Conclusões obtidas para essa amostra de tratamentos podem ser estendidas para a população; Os ti são variáveis aleatórias. Assim, informações particulares sobre um certo ti geralmente são sem utilidades; O que testamos é a hipótese a respeito da variabilidade dos efeitos de tratamento, além de estimar tal variabilidade. 15 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Alguns exemplos podem tornar esses conceitos mais claros: Efeitos Fixos Fator: Tipo de têmpera para aumenta dureza em peça de aço. Níveis: Água, óleo. Efeitos Aleatórios Fator: Teares usados para fabricar determinado tipo de tecido. Níveis: Amostra aleatória dos teares. Objetivo: Avaliar se haveria variação entre as resistências dos tecidos fabricados pelos diferentes teares. 8.6.1.1. Análise de Variância de Modelos de Efeitos Fixos Os efeitos ti são, geralmente definidos como: ti = µi - µ i = 1, 2, ... , I assim, ( )∑ ∑∑ == −=−= I i i ii I i i It 11 µµµµ , mas == ∑I iµµ média geral então, 0. =−= ∑∑∑ IIt i i i i i µ µ As hipóteses a serem testadas são: Ho: µ1 = µ2 = ... = µI vs Ha: µi ≠ µj para pelo menos um par (i, j) Se Ho é verdadeira, todos os tratamentos terão média µ . Como ti = µi - µ , então, sob Ho verdadeira, seria equivalente escrever as hipóteses como: Ho: t1 = t2 = ... = tI = 0 Ha: ti 0 para pelo menos um tratamento i. ≠ 8.6.1.1.1. Idéia Principal da Análise de Variância Decompor a variabilidade total dos dados nas partes que a compõem de acordo com o modelo proposto. Assim, no caso do modelo Yij = µ + ti + eij podemos escrever: (Yij - µ) = (µi - µ) + eij que seria o ponto inicial para se fazer a decomposição pretendida, bastando, para isso, elevar ao quadrado cada lado da igualdade acima, substituir os parâmetros por seus estimadores e aplicar operações de somatório. 16 Desafio: Tente executar essa decomposição como exercício. INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli A partição será: ( ) ( ) ( )− iij yy 2.∑ ∑∑ +−=− ji jiji iij yyyy , ,, 2 ... 2 .. Variação entre as observações dentro dos tratamentos Variação entre média de tratamentos e média geral Variação Total Que é representado por: SQtotal = SQtrat - SQresíduo As fórmulas usuais para as Somas de Quadrados são: ( ) IJ y y rI y ySQtotal ji ij ji ij ji ij 2 .. , 2 2 , , 2 −= −= ∑ ∑ ∑ ( ) IJ yy JIJ y y J SQtrat i i i i i i 2 2 . 2 . 2 . ..11 −= −= ∑ ∑ ∑ A SQResíduo geralmente é obtido por diferença. O quadro da análise de variância, ou comumente chamada de ANOVA, será: F.V. g.l. SQ QM Fcalc Tratamento I - 1 SQTrat SQTrat / (I – 1) QMTrat / QMRes Resíduo I(J - 1) SQRes SQRes / I(J – 1) Total IJ - 1 SQTotal A regra decisória será: Se Fcalc ≥ Fα[(I – 1);I(J – 1)] rejeita-se Ho ou Se p-value = P[F[(I – 1) ; I(J – 1)] > Fcalc ] < α rejeita-se Ho Gráfico ilustrativo: 17 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli OBS 1: Se o número de observações tomadas dentro de cada tratamento for diferente, algumas adaptações às fórmulas para a SQTotal e SQTratamentos (principalmente) são necessários: IJ y ySQtotal I i n j ij i 2 .. 1 1 2 −= ∑∑ = = onde: ni = número de repetições do tratamento ij; e IJ y n ySQtrat i i i 2 .. 2 . −= ∑ E o quadro da ANOVA continua o mesmo, mudando logicamente, o número de graus de liberdade (g.l.) para cada fonte de variação. Se isto ocorrer, dizemos que o delineamento é DESBALANCEADO. OBS 2: Segundo Montgomery (1997, p. 79) são as seguintes as vantagens para se ter um delineamento balanceado. (A) Pequenas variações na variância dos tratamentos não afetam tanto a estatística do teste; (B) O poder do teste é maximizado. Exemplo: Balanceado; • • • • Desbalanceado; Balanceado, mas mudando valores dentro de um tratamento; Analisando DBC como DIC. 8.6.3. Análise de Variância de Modelos de Efeitos Aleatórios Se o fator em estudo tem um grande número de níveis possíveis, e se o experimentador seleciona, para estudo, I desses níveis, de uma hipotética população de níveis desse fator, então dizemos que o fator é aleatório. Esquematicamente teríamos: 18 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Pop de níveis do fator I níveis selecionados ∴ o fator é aleatório O modelo estatístico continua o mesmo: Yij = µ + ti + eij i = 1, 2, ..., I; j = 1, 2, ..., J Porém, agora, também definimos ti uma variável aleatória, assim como os eij. Para esses efeitos aleatórios usualmente definimos: ti tem média zero e variância , e é independente dos erros e 2 tσ ij. Assim, ( ) 22 σσ += tijyV OBS: e são chamados componentes de variância e o modelo acima é chamado “modelo de efeito 2 tσ 2σ aleatório” ou “modelo de componentes de variância”. A decomposição da SQTotal é a mesma que no modelo fixo, ou seja: SQTotal = SQTrat – SQResíduo Uma vez que os níveis do fator usado (selecionado) no experimento foram escolhidos aleatoriamente, as interferências são realizadas sobre a população de todos os níveis desse fator. Para a validade dos testes de hipóteses nesse modelo pressupõe-se: (A) eij ~ NID (0, ); 2σ (B) ti ~ NID (0, ); 2 tσ (C) ti e eij sejam independentes. Testa-se: Ho: = 0 vs Ha: > 0 2 tσ 2 tσ Se = 0 todos os tratamentos são idênticos, e t 2 tσ ⇒ i = 0 ∀ i; OBS: pois µi = µ i, de modo que t∀ i = µi - µ = 0 ∀ i. 19 INF 460 – Notas de Aula – Sujeito a correções Prof. Luiz Alexandre Peternelli Se > 0 existe variabilidade entre tratamentos. 2 tσ ⇒ Para 1 fator o teste é obtido por: QMres QMtratFcalc = e a regra decisória é a mesma que no caso anterior. 20 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.7. Experimentos Casualizados em Blocos Completos Usamos “Blocos” quando queremos controlar fontes de variação conhecidas, mas sem interesse para o pesquisador. Ex: Corpos de prova oriundos de época diferentes, ou com espessuras variadas, ou seja, não-homogêneas. Operadores, equipamentos diferentes. Idéia Principal: Eliminar do erro experimental a variabilidade existente entre blocos. OBS: veremos nesse tópico o desenvolvimento da ANOVA para modelo de efeitos fixos. No entanto, o mesmo procedimento de análise seria usado se tanto tratamento, ou bloco, ou ambos forem aleatórios. Logicamente, haveria apenas mudança na interpretação de alguns resultados. O modelo estatístico para o Delineamento em Blocos Casualizados (DBC) é: yij = µ + ti + bj + eij i = 1, 2, ..., I; j = 1, 2, ..., J onde , adicionalmente à definição dos componentes do modelo para o delineamento inteiramente casualizado, temos, bj = efeito do j-ésimo bloco. Para efeitos fixos podemos incluir as restrições: 00 == ∑∑ j j i i bet As hipóteses a serem testadas são: jia Io ummenospeloH H µµ µµµ ≠ === : : 21 K É importante notar que, já que a média de cadatratamento ( ) i J j jii tbtb +=++= ∑ = µµµ 1 1 , equivalentemente poderíamos escrever:, iummenospeloparatH tttH ia Io 0: 0: 21 ≠ ==== K A partição da SQTotal é: SQTotal = SQBlocos + SQTrat + SQResíduo Onde: SQTotal = ∑∑∑∑ −=− •• i j ij i j ij IJ yyyy 2 ..22)( SQBloco = ( ) ∑∑∑ •••••• −=− j j i j j IJ y I y yy 22 2 21 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli SQTtrat = ( ) ∑∑∑ •••••• −=− i i i j i IJ y J yyy 22 2 e SQResíduo = 2)(∑∑ •••• +−− i j jiij yyyy , ou obtida por diferença: SQResíduo = SQTotal – SQBloco – SQTrat. O quadro ANOVA é dado por: F.V. g.l. SQ QM Fcalc Blocos J - 1 SQBloco Tratamento I - 1 SQTrat SQTrat / (I - 1) QMTrat / QMRes Resíduo (I - 1)(J - 1) SQRes SQRes / (I - 1)(J - 1) Total IJ - 1 SQTotal A regra decisória será: Se Fcalc ≥ Fα[(J – 1);(I – 1)(J – 1)] rejeita-se H0 ou Se P-Value = P[F[(J – 1);(I – 1)(J – 1)] > Fcalc ] < α rejeita-se H0 (a) Realizar o teste para a fonte de variação Blocos não é necessário, mas pode ser útil para auxiliar na decisão em usar essa fonte de variação como bloco em experimentos futuros; (b) O teste para a fonte de variação blocos é apenas aproximado. Se QMBloco/QMRes for grande, indica que o fator bloco teve um efeito grande, e que o uso de blocos no experimento foi satisfatório para diminuir o resíduo. Veja Montgomery (1997, p.176). 8.8. Exercícios Propostos – DIC e DBC (8.8.1) Um engenheiro avaliou quatro banhos de têmpera para aumentar a dureza de peças de aço segundo o DIC, e obteve os seguintes dados numa escala apropriada: Total Média A 25 26 20 23 21 115 23 B 31 25 28 27 24 135 27 C 22 26 28 25 29 130 26 D 22 28 27 23 20 120 24 Realizar a ANOVA para testar a hipótese de igualdade dos efeitos de tratamentos. Se necessário use o nível de significância de 5%. Resposta: Fcalc = 2,02 QMtrat = 16,66 QMres = 8,25 Ftab (5%; (I – 1); I(I – 1)) = 3,24 22 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Faça essas análises a mão para treinar. Posteriormente a faremos usando o R. (8.8.2) Usando os mesmos dados do problema 8.8.1, verificar o que ocorreria (ou seja, refaça a análise) se os valores obtidos para o tratamento D fossem adicionados de 6 unidades, ou seja, y4j = y4j antigo + 6. (Os novos valores para o tratamento D seriam, então: 28, 34, 33, 29, 26) Resposta: QMtrat = 41,66 QMres = 8,25 Fcalc = 5,04 OBS: Observe que a diferença entre os valores dentro do tratamento 4 continuou a mesma. Só mudou a diferença entre as medidas de tratamento. (8.8.3) Usando os mesmos dados do problema (8.8.1), verificar o que ocorreria se os primeiros valores obtidos para cada tratamento fossem aumentados em 5 unidades, ou seja: Total Média A 30 26 20 23 21 B 36 25 28 27 24 C 27 26 28 25 29 D 27 28 27 23 20 Resposta: QMtrat = 16,667; QMres = 13,25; Fcalc = 1,26 ns (8.8.4) Usando os mesmos dados do problema (1), subtraia 25 de cada valor e monte o quadro da ANOVA. Ou seja, use os valores: Totais Médias A 0 1 -5 -2 -4 -10 -2 B 6 0 3 2 -1 10 2 C -3 1 3 0 4 5 1 D -3 3 2 -2 -5 -5 -1 OBS: Lembre-se das propriedades da variância. (8.8.5) Pág. 177 Montgomery, (descrição do problema pág. 171). Verificar se 4 “TIPS” (ponteiras de uma máquina de fazer leituras de força) distintos produzem leituras diferentes em máquina de teste de dureza. OBS: Um experimento desse tipo poderia ser parte de um estudo de capacidade de “Gage”, ou medição de forças. A máquina opera da seguinte maneira: ela pressiona a ponta (tip) sobre um corpo de prova de metal. De acordo com a profundidade da depressão causada na peça de metal, sua dureza poderá ser determinada (gaged, ou gauged). • • Foram usada 4 repetições de cada tipo; Fator: Tipo de TIP. 4 níveis (ou tipos); 23 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli • • Devido à variabilidade na origem dos corpos de prova “blocos”; Portanto cada tipo de TIP foi atribuído uma vez a corpos de prova homogêneos. Os dados, na escala de dureza C de Rockewell estão apresentados abaixo. A tabela da direita apresenta os dados codificados: Y = (X – 49,5) x 10: Tipo de Ponto 1 2 3 4 Yi. 1 -2 -1 1 5 3 2 -1 -2 3 4 4 3 -3 -1 0 2 -2 4 2 1 5 7 15 Y.j -4 -3 9 18 20 Blocos Tipo de Ponto 1 2 3 4 1 49,3 49,4 49,6 50,0 2 49,4 49,3 49,8 49,9 3 49,2 49,4 49,5 49,7 4 49,7 49,6 50,0 50,2 Blocos Solução (usando tabela da direita): ( ) ( ) 00,850,8250,3800,129 50,82 16 20189)3()4( 4 11cos 50,38 16 2015)2(43 4 11 00,129 16 2000,154 2 2222 2 ..2 . 2 2222 2 ..2 . 22 .. 4 1 4 1 2 =−−= =−++−+−=−= =−+−++=−= =−=−= ∑ ∑ ∑∑ = = SQres IJ yy I SQblo IJ yy J SQtrat IJ yySQtotal j i i j ij F.V. g.l. SQ QM F Blocos 3 82,50 27,50 Trat. 3 38,50 12,83 14,40 Res. 9 8,00 0,89 Total 15 129,00 P-Value = 0,0009 ou Fcrit = F (5%;3;9) = 3,86 Como Fcalc> Ftab ⇒ rejeita-se Ho ou Avalia pelo P-Value. Já que o F foi significativo, então 4321: µµµµ ===oH foi rejeitada (8.8.6) Usando os dados originais do problema 8.8.5, ou seja, sem usar a recodificação, monte o quadro da ANOVA e conclua (use α = 5%, se desejar). Depois compare esse quadro da ANOVA obtido com aquele obtido no problema 8.8.5, e também o resultado do teste F nas duas análises. Discuta. (8.8.7) Considere os mesmos dados codificados do problema 8.8.5. Suponha que foi feita a completa casualização dos 4 TIPS nos 16 corpos de prova (U.E.). Suponha que as mesmas atribuições de valores ocorrem conforme tabela de dados inicial. A ANOVA segundo um DIC seria: 24 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli F.V. g.l. SQ QM F Trat. 3 38,50 12,83 1,70 Res. 12 90,50 7,54 Total 15 129,00 F (5%;3;12) = 3,49 ∴ não rej. Ho OBS.: sabemos que essa análise estaria incorreta no sentido de que não poderíamos confiar na sua interpretação já que havia diferenças sistemáticas (blocos) entre os corpos de prova. Conclusão: O DBC reduziu a variação sistemática o suficiente de modo que pequenas variações entre os tratamentos pudessem ser detectadas. (8.8.8.) Pense sobre as seguintes considerações e depois realize os problema propostos OBS 1: O fato de ser significativo a determinado nível de significância, o teste F não indica quais médias de tratamentos são diferentes entre si, exceto quando o tratamento (fator) possuir apenas 2 níveis. OBS 2: Se o tratamento possuir apenas 2 níveis, o teste F será equivalente será equivalente ao teste T. Na verdade, Fcalc = (Tcalc)² - Se amostras independentes: teste T para 2 médias ≡ teste F do DIC; - Se dados são pareados: teste T para dados pareados ≡ teste F do DBC. Exemplo: (use seu material de Estatística Aplicada ou de Estatística Experimental para conhecer as fórmulas necessárias na resolução desse problema) Seja: X = {X1 = 4; X2 = 10; X3 = 5; X4 = 3; X5 = 8} Y = {Y1 = 2; Y2 = 7; Y3 = 1; Y4 = 2; Y5 = 8} (A) Considere X = tratamento 1 e Y = tratamento 2 e compare as medidas entre os dois tratamentos pelo teste t e pelo teste F da ANOVA de um DIC com 5 repetições. Compare os resultados. (B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados. OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as medidas podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos sobre o teste de Tukey e o teste de Duncan. 25 INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli (B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados. OBS 3: No caso do fator possuir 3 ou mais níveis e quando o F da ANOVA for significativo, as médias podem ser comparadas usando-se alguns dos procedimentos para comparações múltiplas. Falaremos sobre o teste de Tukey e o teste de Duncan. 8.9. Teste de Tukey É usado para testar qualquer contrastes entre 2 médias. Este teste é exato quando o número de repetições for o mesmo para cada tratamento. Tem por base a diferença mínima significativa (dms) representada por ∆ e dada por: )ˆ(ˆ 2 1 CVq=∆ em que: (é a amplitude total estudentizada)( )nIfq mmC ,, ˆˆˆ 21 α= −= De modo geral, +=∆ 21 11 2 rr QMresq onde r1 e r2 são as repetições dos tratamentos 1 e 2, respectivamente. Se r1 = r2 = J ⇒ J QMresq=∆ , que é a fórmula usual encontrada em vários livros de estatística. OBS 1: 1 21 11 2 1 − += rr J corresponde à média harmônica das repetições de tratamentos. OBS 2: No SAS – Se temos I tratamentos, cada qual com diferentes números de repetições, o SAS obtêm um único ∆ fazendo J = média harmônica do número de repetições. Nº de tratamentos g.l. do resíduo 26 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.9.1. Procedimento Testamos: Ho: mi = mj para i ≠ j Ha: mi ≠ mj Obtemos ∆, a diferença mínima significativa: Calculamos todas as estimativas dos contrastes ( ) entre 2 médias; ĉ• • Comparamos | c | com ∆; ˆ - Se | c | ∆ o contraste é significativo ao nível α de probabilidade. Então há diferença entre médias de tratamentos a esse nível de significância; ˆ ≥ ⇒ - Se | c | < ∆ ⇒ o contraste não é significativo. ˆ OBS: Pode acontecer de o teste F da ANOVA ser significativo, mas não ser encontrado nenhum teste significativo pelo teste de Tukey. Ver Pimentel Gomes. Exemplo 8.9.1.1: Considere o exercício 8.8.2, onde m , QMres = 8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Tukey. 30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm Solução: 2,5 5 25,805,4 5 1 5 1.25,8. 2 1 )16;4%(5 == +=∆ q • Ordenar as médias. Indicar com letras iguais médias “iguais” • o o o o Hrejnãomm Hrejmm Hrejnãomm Hrejnãomm bm bam bam am .42327ˆˆ .72330ˆˆ .42630ˆˆ .32730ˆˆ 23ˆ 26ˆ 27ˆ 30ˆ 12 14 34 24 1 3 2 4 ⇒∆>=−=− ⇒∆>=−=− ⇒∆<=−=− ⇒∆<=−=− = = = = 27 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Conclusão: As médias seguidas de pelo menos uma mesma letra não diferem entre si ao nível de 5% de probabilidade pelo teste de Tukey. Exercício 8.9.1.2: Supor um experimento com 5 tratamentos e 6 repetições, cuja análise está apresentada a seguir: FV G.l. SQ QM F p-value trat 4 328,8 82,2 14,05 3,8×10-6 Res 25 146,25 5,85 Total 29 475,05 obs.: F-tab = F(5%; 4; 25) = 2,76 1m̂ = 25; = 31; = 24; = 22; = 29. 2m̂ 3m̂ 4m̂ 5m̂ Comparar as medias de tratamentos usando o teste de Tukey (se necessário use α = 5%) Resposta: Tratamentos 2 a 5 a b 1 b c 3 c 4 c Médias seguidas de uma mesma letra não diferem entre si, pelo teste de Tukey, ao nível de 5% de significância. 8.10. Teste de Duncan Também é usado para testar contrastes entre 2 médias. É um concorrente ao teste de Tukey. Para ser exato exige que todos os tratamentos tenham o mesmo número de repetições. Comparado ao teste de Tukey, o teste de Duncan discrimina mais os tratamentos, isto é, o teste de Ducan pode indicar resultados significativos em casos em que o teste de Tukey não indicaria. Nesse sentido dizemos que o teste de Tukey é mais rigoroso que o teste de Duncan. Fórmula Geral: +== 21 11 2 1)ˆ(ˆ 2 1 rr QMresZCVZD iii onde: ( )',, nnfZ ii α= Nº de médias ordenadas abrangidas pelo contraste g.l do resíduo 28 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli OBS: += 21 r 1 r 1QMres 2 1)Ĉ(V̂ 2 1 se r1 = r2 = r 8.10.1.Procedimento Vamos explicar o procedimento desse teste usando um exemplo. Exemplo 8.10.1.1. Considere o exercício 8.8.2, onde m , QMres = 8,25, J = 5. Use α = 5% para comparar as médias pelo teste de Duncan. 30ˆ,26ˆ,27ˆ,23ˆ 4321 ==== mmm Ho: mi = mj • • • para i j; ≠ Ha: mi ≠ mj Ordenar as médias de modo crescente; Encontrar o valor de Di para a maior abrangência de médias (no caso Di = D4). Comparar com as estimativas do contraste e, se for significativo, encontrar um novo Di (no caso Di = D3) para uma menor abrangência, e assim sucessivamente. 23ˆ 26ˆ 27ˆ 30ˆ 1 3 2 4 = = = = m m m m ou com letras bm bam bam am 23ˆ 26ˆ 27ˆ 30ˆ 1 3 2 4 = = = = OBS: No caso, o resultado foi igual ao do teste de Tukey, mas nem sempre é assim oHrejDmm ZD .72330ˆˆ 149,4 5 25,823,3 5 25,8 414 )16;4%;5(4 ⇒>=−=− === o o HrejnãoDmm HrejnãoDmm ZD .42327ˆˆ .42630ˆˆ 04,4 5 25,815,3 5 25,8 312 334 )16;3%;5(3 ⇒<=−=− ⇒<=−=− === unir e com uma barra; 4m̂ 3m̂ idem. 29 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Conclusão: as médias unidas por uma mesma barra não diferem entre si, ao nível de 5% de significância, pelo teste de Duncan. • OBS 1: Nem sempre as comparações realizadas pelo teste de Duncan e pelo teste de Tukey são coincidentes. - Alterar os valores dos dados no computador e proceder à análise novamente, para observar esse resultado. OBS 2: No teste de Duncan, quando, numa determinada abrangência, a maior média não diferir significativamente da menor, não se admitirá diferença significativa, pelo mesmo teste, entre médias intermediárias. Exemplo 8.10.1.2. Realize o teste de Duncan para o problema 8.8.5. Use α = 5%. 75,300,175,050,0 .4.2.1.3 ===−= yyyy QMres = 0,89 344.3.4 9;4%;544 :.67,125,4)50,0(75,3 67,147,0.41,3 4 89,0 µµ =⇒=>=−−=− ==== oHrejDyy Z J QMresZD 323.3.2 143.1.4 9;3%;533 :.57,105,1)50,0(00,1 :.57,100,375,075,3 57,147,0.34,3 4 89,0 µµ µµ =⇒=<=−−=− =⇒=>=−=− ==== o o HrejnãoDyy HrejDyy Z J QMresZD 242.2.4 9;2%;522 :.50,175,200,175,3 50,147,0.20,3 4 89,0 µµ =⇒=>=−=− ==== oHrejDyy Z J QMresZD Então: Comparações 875,495,49 10 .4 .4 =+= y y a .2y = 49,600 b .1y = 49,575 b .3y = 49,450 b 30 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Exercício 8.10.1.3. Realize o teste de Duncan para os dados do exercício 8.9.1.2. Resposta: Tratamentos 2 a 5 a 1 b 3 b 4 b Exercício 8.10.1.4. Compare os resultados dos exercícios 8.9.1.2 e 8.10.1.3. O que poderia ser concluído a respeito do rigor de cada teste? Qual seria o teste menos rigoroso, no sentido de apresentar resultados significativos com maior facilidade? 8.11. Análise de Resíduos Essa análise pode ser útil para verificar a adequação do modelo utilizado na análise de variância. Nos tópicos anteriores foi comentado que as pressuposições para validade do teste realizado numa análise de variância eram que os erros deveriam ser independentes, não correlacionados, e normalmente distribuídos com média zero e com variância comum . Assim, após usarmos um determinado modelo estatístico, podemos estimar os erros pelos seus resíduos (e ) e avaliarmos esses resíduos como forma de inferirmos a respeito dos erros aleatórios. Ou seja, obtemos 2σ ˆ ijijij yye ˆˆ −= onde corresponde ao valor estimado a partir do modelo. ijŷ Por exemplo, consideremos o caso em que podemos usar o delineamento inteiramente casualizado(DIC) ou o delineamento em blocos casualizados (DBC). Se for o DIC: .ˆˆ )(ˆˆˆ iijiijij iiiijijiij yyyyeentão yyyytycomety −=−= =−+=+=++= • ••••••µµ Se for o DBC: 31 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli •••• •••••••••••• +−−=−= −+=−+−+= ++=+++= yyyyyyeentão yyyyyyyyy btycomebty jiijijijij jijiij jiijijjiij ˆˆ )()(ˆ ˆˆˆˆ µµ Obtidos os resíduos, estes poderiam ser plotados de diversas formas, dependendo do interesse de análise. Para cada modelo existem gráficos comuns ou mais apropriados. 8.11.1. Gráficos Usuais DIC Resíduos contra o tempo – para avaliar pressuposição de independência; • • Resíduos contra médias .iy – para avaliar pressuposição de homogeneidade de variância; Probabilidade normal para os resíduos – para avaliar pressuposição de normalidade; • OBS: Existem também, alguns testes estatísticos para checar cada uma dessas pressuposições. No entanto tais testes não serão discutidos nesse curso. DBC • Resíduo contra valores ajustados – não deve representar nenhum relacionamento da magnitude dos resíduos e os valores ajustados. Se ocorrer, no gráfico, uma forma curvilínea, poderia implicar a presença de interação entre tratamentos e blocos. Poderia existir outro tipo de disposição dos pontos no gráfico indicando a presença dessa interação. Uma situação de forma curvilínea no gráfico poderia acarretar, por exemplo, resíduo negativo para baixos e altos valores ajustados, e resíduo positivos para valores ajustados intermediários. .ˆ iy Resíduos contra tratamentos e contra blocos – para verificar a pressuposição de homogeneidade de variância nos tratamentos e nos blocos; • • Gráficos de probabilidade normal dos resíduos – para avaliar a normalidade dos resíduos. Proximidade de uma certa linha reta indica normalidade; OBS: Tipos comuns de gráficos serão apresentados em aula. 32 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.11.2. Exemplos Para cada exercício apresentado nessa apostila realize a análise de resíduos seguindo o roteiro “tutorial para análise de resíduos”. Exemplos também serão apresentados em sala de aula. Observe o arquivo existente nos tutoriais do R para INF 460, disponibilizado no link www.dpi.ufv.br/~peternelli/inf460/materiais.htm referente aos exercícios 8.8.5 e 8.8.7 (nome do arquivo: anares.exemplo.8.8.5.pdf). Com os comandos apresentados nesse tutorial, após fazer pequenas adaptações, é possível você fazer análise de resíduos para outros exercícios, se desejar. 8.12. Escolha do Número de Repetições Esse tópico provavelmente não será apresentado em aula. Porém o assunto estará sendo incluído nesse material por se tratar de informações interessantes para conhecimento geral do estudante. Aqueles interessados em mais informação poderão entrar com contato com o professor da disciplina ou buscar maiores detalhes em livros que abordam o assunto. A não ser que o problema seja novo, na prática o pesquisador já tem uma idéia do número de repetições a ser usado, baseado em resultados de experimentos prévios ou de artigos publicados na mesma linha de pesquisa. Uma decisão crítica em qualquer planejamento de delineamento experimental é a determinação do número de repetições dos tratamentos a ser usado. De modo geral: Se o interesse reside em detectar pequenos efeitos, então se deve utilizar um maior número de repetições; • • • • • Se o interesse reside em detectar grandes efeitos, então pode ser utilizado um menor número de repetições. Montgomery (1997) discute 3 métodos (pág. 126 – 132): Baseado nas curvas características de operação; Baseado na especificação do aumento do desvio-padrão; Baseado na estimação do Intervalo de Confiança. Exemplificaremos apenas o primeiro. Para o método baseado nas curvas características de operação, Montgomery (1997, pág. 126) apresenta um interessante embasamento teórico e motivacional. 33 http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.12.1. Curva Característica de Operação É um gráfico onde no eixo das ordenadas (y) temos a probabilidade do erro tipo II de um teste estatístico para um determinado tamanho amostral, e no eixo das abscissas (x) temos valores de um parâmetro que reflete o quanto a hipótese nula é falsa. Com o uso dessas curvas (C.C.O.) pode-se selecionar o número de repetições necessárias de modo que o delineamento possa ser útil em detectar diferenças potencialmente importantes entre os tratamentos. Seja a realização de uma ANOVA. A probabilidade do erro tipo II é definida como: β = 1 – P (rejeitar Ho / Ho é falsa) = 1- P [(Fcalc > Fcrit) / Ho é falsa)] onde Fcrit = F(α; g.l. numerador; g.l. denominador) I - 1 I(I – 1) para o DIC, por exemplo Para calcular a probabilidade indicada acima é necessário conhecer a distribuição da estatística do teste (Fcalc) quando Ho é falsa. É possível demonstrar que quando Ho é falsa, Fcalc tem distribuição F não central com (I – 1) e I(J – 1) graus de liberdade e parâmetro de não-centralidade . Quando = 0 então a distribuição F não-central passa a ser a distribuição F central usual. λ λ As C.C.O. são usadas para avaliar a expressão probabilística discutida acima. Nessas curvas, no eixo das abscissas tem-se um parâmetro φ ,onde φ é relacionado ao parâmetro de não-centralidade λ discutido anteriormente. Nesse material estão apresentadas as C.C.O. para α = 0,05 e α = 0,01, e para um conjunto de valores do grau de liberdade do numerador e do denominador. (Extraído de Drumond, Werkema e Aguiar – 1996). A função do φ mais prática para que seja usado numa C.C.O. é: 2 2 2 2 σ φ I JD = onde: 2σ = variabilidade da variável resposta de interesse; I = número de tratamentos; J = número de repetições (a ser escolhido); D = diferença mínima que se deseja detectar entre as médias de 2 tratamentos. 34 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Para prática, isso significa que só faz sentido considerar que 2 médias não são equivalentes se a diferença entre elas for igual ou superior a D. OBS: Para fatores de efeitos aleatórios veja Montgomery, 1997 pág. 129. 8.12.1.1. Exemplo do Uso das C.C.O. (pág. 79 Werkema e Aguiar 1996) Suponha que desejemos obter o número de repetições para um DIC com um único fator em três níveis; • • • Suponha que desejemos rejeitar H0 com pelo menos 95% de probabilidade, se a diferença entre as médias de 2 níveis quaisquer fosse superior a 2 unidades de medida em questão; Suponha que, por conhecimento prévio, tenhamos σ = 1. Assim, os seguintes passos poderiam ser considerados: (A) Fixar o nível de significância α (5 ou 1%). (B) Determinar a diferença mínima que se deseja detectar entre as médias de 2 tratamentos (ou seja, definir um valor para D). (C) Fixar a probabilidade mínima (1 - β) com a qual se deseja detectar a diferença D. (D) Determinar uma estimativa para a variabilidade da variável resposta, σ . (E) Calcular 2 2 2 2 σI JD =φ como uma função de n, onde I é o número de níveis do fator. (F) Utilizando o gráfico da C.C.O. apropriado, apresentado em diversos livros, determinar o valor de n por tentativa. Para o exemplo acima teríamos: (A) α = 5%; (B) D = 2; (C) 1 – β = 0,95; (D) σ = 1; (E) J JJ I JD 67,0 6 .4 1.3.2 2. 2 2 2 2 2 2 ==== σ φ 35 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli (F) Utiliza-se a C.C.O. para V1 = I – 1 = 3 – 1 = 2 e V2 = I(J – 1) = 3(J – 1) graus de liberdade, com α = 5%. Continuando o exercícios temos, chute inicial: J= 5 O resultado obtido foi: (figura 2B, em anexo) Portanto: φ )15.(31283,135,35.67,0 2 2 −===⇒== Veφ Observando na figura 2B, o valor de β (eixo das ordenadas) seria aproximadamente 0,29, de forma que 1 (poder do teste). Este valor é inferior ao 0,95 desejado em (C). Isso implica que J = 5 repetições não é suficiente. 71,029,01 =−≈− β Agora, deveríamos escolher outro valor de J, sendo J > 5, e continuar o procedimento até que 1 seja maior que 0,95. β− A seguinte tabela é apropriada: J 2φ φ I(J – 1) β 1 – β 5 3,35 1,83 12 0,29 0,71 8 5,36 2,32 21 0,075 0,925 9 6,03 2,50 24 0,035 0,965 Portanto, pelo menos J = 9 unidades experimentais deveriam ser submetidas a cada nível do fator, para satisfazer à condição estabelecida inicialmente para o poder do teste. OBS: Para experimentos no DBC faríamos de modo similar nos passos (A), (B), (C) e (D), porém,: (E) calcular 2 2 2 2 σa bD =φ onde b = número de repetições (ou blocos) a serem determinados ( J) e a = ≡ número de níveis do fator em estudo ( ) I≡ (F) Obter a C.C.O. para V1 = a – 1 e V2 = (a – 1)(b – 1) g.l. denominador g.l. numerador b é, então, obtido por tentativa. 36 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.13. Análise de Regressão A análise de regressão consiste na realização de uma análise estatística com o objetivo de verificar a existência de uma relação funcional entre uma variável dependente com uma ou mais variáveis independentes. Em outras palavras consiste na obtenção de uma equação que tenta explicar a variação da variável dependente pela variação do(s) nível(is) da(s) variável(is) independente(s). Para tentar estabelecer uma equação que representa o fenômeno em estudo pode- se fazer um gráfico, chamado de diagrama de dispersão, para verificar como se comportam os valores da variável dependente (Y) em função da variação da variável independente (X). O comportamento de Y em relação a X pode se apresentar de diversas maneiras: linear, quadrático, cúbico, exponencial, logarítmico etc. Para se estabelecer o modelo para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um modelo matemático que mais se aproxime dos pontos representados no diagrama de dispersão. Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se ajustar perfeitamente à curva do modelo matemático proposto. Haverá na maior parte dos pontos, uma distância entre os pontos do diagrama e a curva do modelo matemático. Isto acontece, devido ao fato do fenômeno que está em estudo, não ser um fenômeno matemático e sim um fenômeno que está sujeito a influências que acontecem ao acaso. Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos valores observados de Y em função da variação dos níveis da variável X. No entanto o modelo escolhido deve ser coerente com o que acontece na prática. Para isto, deve-se levar em conta as seguintes considerações no momento de se escolher o modelo: • O modelo selecionado deve ser condizente tanto no grau como no aspecto da curva, para representar em termos práticos, o fenômeno em estudo; • O modelo deve conter apenas as variáveis que são relevantes para explicar o fenômeno; Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um pouco distantes da curva do modelo matemático escolhido. Um dos métodos que se pode utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada de tal forma que as distâncias entre os pontos do diagrama e os pontos da curva do modelo matemático, no todo, sejam as menores possíveis. Este método é 37 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli denominado de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a soma de quadrados das distâncias entre os pontos do diagrama e os respectivos pontos na curva da equação estimada é minimizada, obtendo-se, desta forma, uma relação funcional entre X e Y, para o modelo escolhido, com um mínimo de erro possível. Veremos, em apenas uma aula, como realizar uma ANOVA para regressão, e como interpretar seus resultados. Serão apresentadas apenas suas fórmulas usuais e sua interpretação, finalizando com um exemplo, executado no computador, para regressão linear simples e um para regressão linear múltipla. O problema básico da Análise de Regressão consiste em: (A) Estimar os parâmetros do modelo estatístico admitido; (B) Realizar testes de significância para estes parâmetros; (C) Obter intervalos de confiança para estes parâmetros; (D) Checar a adequabilidade do modelo utilizado, usando análise de resíduos por exemplo, e sua adequação ao problema real em questão; (E) Dependendo dos resultados anteriores definir um novo modelo e refazer os passos acima Veremos, primeiramente, e usando um exemplo com poucos dados hipotéticos, a análise da regressão linear simples. Posteriormente, usando também um exemplo com poucos dados hipotéticos será dada uma noção da análise da regressão linear múltipla. 8.13.1. Modelo linear de 1º grau (Regressão Linear Simples) O modelo estatístico para esta situação seria: iii eXY ++= 10 ββ em que: =iY valor observado para a variável dependente Y no i-ésimo nível da variável independente X. =0β constante de regressão. Representa o intercepto da reta com o eixo dos Y. =1β coeficiente de regressão. Representa a variação de Y em função da variação de uma unidade da variável X. =iX i-ésimo nível da variável independente X ( )ni ,,2,1 K= =ie é o erro aleatório; está associado à distância entre o valor observado Yi e o correspondente ponto na curva, do modelo proposto, para o mesmo nível i de X. 38 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Para se obter a equação estimada, vamos utilizar o MMQ, visando a minimização dos erros. Assim, tem-se que: ii Xe 10 ββ −−= iY . Elevando ambos os membros da equação ao quadrado, [ ]2102 ii Xe ββ −−= iY . Aplicando o somatório, [ ]∑∑ == −−= n i i n i i Xe 1 2 10 1 2 ββiY (1) Por meio da obtenção de estimadores de e , que minimizem o valor obtido na expressão anterior (1), é possível alcançar a minimização da soma de quadrados dos erros. 0β 1β Para se encontrar o mínimo para uma equação, deve-se derivá-la em relação ao parâmetro de interesse e igualá-la a zero. A sua derivada segunda deverá, obviamente, ser positiva, o que no caso sempre ocorrerá, por se tratar de uma soma de quadrados. Derivando então a expressão (1) em relação a e , e igualando-as a zero, poderemos obter duas equações que, juntas, vão compor o chamado sistemas de equações normais. A solução desse sistema fornecerá: 0β 1β ( ) ∑ ∑ ∑ ∑ ∑ − − = n x x n yx yx i i ii ii 2 2 1β̂ = x xy SQD SPD e XY 10 ˆˆ ββ −= Uma vez obtidas estas estimativas, podemos escrever a equação estimada: ii XY 10 ˆˆˆ ββ += 8.13.1.1. Teste de hipótese na regressão linear simples Após ajustar uma equação de regressão devemos verificar sua adequabilidade, por meio de testes de hipóteses para os parâmetros do modelo e/ou a construção de intervalos de confiança. Para tal intento precisamos da pressuposição adicional de que os erros tenham distribuição normal. Em outras palavras, a equação estimada obtida, apenas estabelece uma relação funcional, entre a variável dependente e a variável independente, para representar o fenômeno em estudo. Portanto a simples obtenção da equação estimada não responde ao 39 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli pesquisador se a variação da variável independente influencia significativamente na variação da variável dependente. Para se responder a esta pergunta, é necessário realizar um teste estatísticopara as estimativas dos coeficientes da equação de regressão estimada. Um teste que pode ser realizado para verificar tal fato é o teste F da análise de variância e/ou o teste t. Portanto, é necessário realizar uma análise de variância dos dados observados, em função do modelo proposto. Como temos dois parâmetros no modelo Y , poderíamos realizar os seguintes testes: iii eX ++= 10 ββ H0: β1 = β1* versus Ha: β1 ≠ β1* H0: β0 = β0* versus Ha: β0 ≠ β0* Em cada caso a estatística do teste e as conclusões seriam: tcalc = )ˆ(ˆ ˆ 1 * 11 β ββ V − , onde xSQD 2 1 ˆ )ˆ(ˆ σβ =V regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0 tcalc = )ˆ(ˆ ˆ 0 * 00 β ββ V − , onde += xSQD X n 2 2 0 1ˆ)ˆ(ˆ σβV regra de decisão: Se | tcalc | ≥ t(α/2, n-2) ⇒ rejeita H0 OBS.: σ = estimativa da variância dos erros = 2ˆ 2 Re −n sSQ = 2 ˆ 1 − − n SPDSQD xyy β Um caso especial muito importante seria: H0: β1 = 0 versus Ha: β1 ≠ 0. Essas hipóteses estão relacionadas com a significância da regressão. Não rejeitar H0 é equivalente a concluir que não há relação linear entre X e Y. Por outro lado, se H0: β1 = 0 for rejeitado indicaria que X é importante para explicar a variabilidade em Y. Veja ilustrações apresentadas em aula, para alguns casos especiais. De maneira alternativa poderíamos testar a significância da regressão pelo método da Análise de Variância (ANOVA). O método da ANOVA consiste em fazer uma partição da variabilidade total da variável resposta Y em outros componentes de acordo com o modelo e o teste a ser feito. Assim a seguinte identidade pode ser verificada: 222 )ˆ()ˆ()( ∑∑∑ −+−=− YYYYYY iii , ou, em outra palavras, 40 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli SQTotal = SQRegressão + SQResíduo, onde SQTotal = variação total em Y = SQDY SQRegressão = variação em Y explicada pela regressão ajustada = SPD1β̂ XY, de modo que SQResíduo = SQRes = variação não explicada pela regressão = SQDY - SPD1β̂ XY. Baseado nessa identidade o seguinte quadro pode ser montado: FV GL SQ QM F Regressão 1 SQReg QMReg = SQReg sQM gQM Re Re Resíduo, ou Independente da Regressão n – 2 SQRes QMRes = 2 Re −n sSQ - Total n – 1 SQTotal A estatística F obtida no quadro acima também serve para testar a significância da regressão, ou seja, testar H0: β1 = 0 versus Ha: β1 ≠ 0. regra de decisão: Se Fcalc ≥ F(α, 1, n-2) ⇒ rejeita H0, ou conclui-se de acordo com o p-value. OBS.: Se regressão linear simples, e para H0: β1 = 0 temos que (tcalc)2 = Fcalc 8.13.1.1.1.Exemplos: Exercício 8.13.1.1.1.1. Para verificar se existe relação linear de primeiro grau entre umidade relativa (UR) do ar de secagem de sementes e a germinação das mesmas, um pesquisador realizou um experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados (dados hipotéticos) % UR 20 30 40 50 % germinação 94 96 95 97 a) Obter as estimativas do β0 e do β1 considerando o modelo proposto; b) Obter o quadro da ANOVA para checar a significância da regressão, ou seja, se existe efeito da UR do ar de secagem na % de germinação. Se necessário use α = 5%; c) Realize o teste t para o coeficiente de regressão. Se necessário use α = 5%; 41 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli d) Compare os resultados dos itens b e c; e) Qual seria a % de germinação esperada quando UR = 45 %? f) Como deveria ser apresentada, num relatório técnico, a equação de regressão ajustada para esse exemplo? R.: a) = 92,7; = 0,08 . Algumas das outras respostas podem ser obtidas no endereço 0β̂ 1β̂ www.dpi.ufv.br/~peternelli/inf460/materiais.htm. Exercício 8.13.1.1.1.2 Adaptado dos dados existentes em algumas calculadoras de bolso. Um engenheiro está interessado em avaliar o efeito da temperatura sobre o comprimento de certa peça metálica. Para isso obteve cinco corpos de prova de mesmo comprimento inicial (certa unidade de medida) e os submeteu a 5 temperaturas (oC) diferentes. Os dados estão apresentados abaixo. Temperatura 10 15 20 25 30 Comprimento 1003 1005 1010 1011 1014 Pede-se: (use α = 5% se necessário) a) Obter o diagrama de dispersão dos dados; b) Ajustar a equação de regressão baseado no modelo de uma regressão linear simples e traçar a reta no diagrama obtido em a; c) Interpretar as estimativas dos parâmetros obtidas; d) Checar a significância da regressão por meio da ANOVA; e) Checar a significância da regressão por meio do teste t; f) Qual seria o comprimento esperado da peça quando a temperatura for igual a 17oC? g) Qual seria o comprimento esperado da peça quando a temperatura for igual a 40oC? h) (Calibração) Qual deve ser a temperatura a ser usada para que o comprimento da barra atinja 1009 unidades de medida? Respostas: Realize os cálculos à mão. Depois as compare com os resultados obtidos no R, e parcialmente apresentados no endereço: www.dpi.ufv.br/~peternelli/inf460/materiais.htm. 42 http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.13.1.2 Intervalo de Confiança em Regressão Linear Simples Complementam, ou substituem, as informações das estimativas pontuais, e seus testes de hipóteses, já que fornecem faixas dos possíveis valores que os parâmetros do modelo podem assumir, com um nível de confiança 100 (1 – α)% conhecido. I.C. 100 (1 – α)% para β1 é: x residuo n SQD QM t 1, 2 1 ˆ − ± αβ I.C. 100 (1 – α)% para βo é: +± − x resíduon SQD x n QMt 2 2, 2 0 1ˆ αβ 8.13.1.2.1. Exemplos Exercício 8.13.1.2.1.1. Considerando os dados do exercício 8.13.1.1.1.1. calcule o intervalo de 95% de confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de confiança para concluir a respeito da significância da regressão. Exercício 8.13.1.2.1.2. Considerando os dados do exercício 8.13.1.1.1.2. calcule o intervalo de 95% de confiança para o coeficiente de regressão. Discuta como podemos usar esse intervalo de confiança para concluir a respeito da significância da regressão. 43 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 8.13.2 Regressão Múltipla Modelos que envolvem mais de uma variável explicativa (ou modelos polinomiais com uma ou mais variáveis explicativas). Para ilustrar esse tópico será usado o exemplo do livro do Werkema e Aguiar, página 15, a seguir. 8.13.2.1. Exemplo Ilustrativo (Werkema e Aguiar pág. 149) Uma indústria produz grandes quantidades de Alumina (Al2O3 de elevado teor de pureza) para a fabricação de alumínio metálico. A matéria prima para a fabricação de alumina é a bauxita, um mineral com cerca de 55% de óxido de alumínio (Al2O3). No processo de fabricação da alumina, o teor de Na2O (óxido de sódio) ocluído no produto é um fator importante do ponto de vista da qualidade da alumina fabricada. O Na2O é uma impureza e, portanto, é desejável que o seu teor na alumina seja o mais baixo possível. Objetivo da indústria: teor de Na2O ≤ 0,42%. Quer-se avaliar como a razão AP2O3/NaOH e a temperatura de reação afetam o teor de Na2O final. Hidróxido de Sódio. Um dos reagentes do processo Erro aleatório Modelo proposto: iiioi eXXY +++= 2211 βββ Teor de óxido de sódio (Na2O) ocluído na alumina Temperatura de reação Razão Al2O3/NaO sódiodeHidróxido alumíniodeÓxido Presente na bauxita que entra no processo de produção do alumínio Um dos reagentes do processo 44 INF 460 – Notas de aula – sujeito a correçõesProf. Luiz Alexandre Peternelli Dados: Ordem de Teor de Na2O Razão Temperatura coleta das (%) Al2O3/NaOH (°C) observações Y X1 X2 1 0,43 0,647 77,1 2 0,39 0,638 78,3 3 0,44 0,651 76,0 4 0,42 0,648 77,9 5 0,43 0,640 74,1 6 0,42 0,643 74,6 7 0,41 0,643 76,0 8 0,46 0,651 73,3 9 0,42 0,650 78,6 10 0,40 0,639 78,7 11 0,39 0,636 77,8 12 0,41 0,641 75,8 13 0,43 0,649 77,3 14 0,39 0,633 76,5 15 0,41 0,645 78,6 16 0,43 0,642 74,7 17 0,40 0,638 75,5 18 0,39 0,635 78,2 19 0,40 0,639 75,9 20 0,40 0,639 76,6 21 0,42 0,645 78,0 22 0,44 0,650 77,2 23 0,40 0,642 78,0 24 0,43 0,648 76,1 25 0,42 0,642 74,6 26 0,39 0,633 77,5 Dados utilizados no estudo do Tipo de Relacionamento existente entre a razão Al2O3/NaOH, a temperatura de reação e o teor de Na2O ocluído na Alumina Assim, 262262126126 32321313 22221212 12121111 eXXY eXXY eXXY eXXY o o o o +++= +++= +++= +++= βββ βββ βββ βββ M Na forma matricial teríamos: 45 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli + = 26 2 1 2 1 0 226126 2212 2111 26 2 1 1 1 1 e e e XX XX XX Y Y Y MMM β β β 3 x 1 26 x 1 26 x 3 26 x 1 ou seja, . εβ += XY Pode-se demonstrar que ~ 1 ~ ')'(ˆ YXXX −=β = − − ≅ − − −− = 2 1 0 ˆ ˆ ˆ 0051,0 7904,2 9878,0 160,825 923,6 770,10 02,049,063,1 49,066,133293,893 63,193,89355,699 β β β x Assim, o modelo ajustado será: 21 0051,07904,29878,0ˆ XXY −+−= Baseado nessa equação ajustada as seguintes interpretações poderiam ser estabelecidas: um aumento de uma unidade em X1, com X2 constante aumento médio de 2,79% em Y; ⇒• • um aumento de um °C em X2, com X1 constante ⇒ redução média de 0,0051% em Y; 46 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli →0β̂ sem interpretação pois X1 = 0 ou X2 = 0 não ocorrem, além de, nesse exemplo, não fazerem sentido. • Observe que ainda não foi realizado nenhum teste para verificação da validade dessa equação ajustada. Portanto, a validade dessas interpretações só se dará após a análise de resíduos, seguido dos testes estatísticos apropriados. 8.13.2.2 Inferência em regressão múltipla Suposição: );0(~ 2σNiidsãoei 0 210 )1;(~ 01: 0: HsobKnKF QMresíduo oQMregressãF émenospeloH H calc ia K −−= ≠ ==== β βββ L Se α/. pHrejFF otabcalc ⇒≥ Tabela para obter o Fcalc: F.V. g.l. SQ QM Fcalc Regressão k SQRegr QMRegr QMReg/QMRes Resíduo n-k-1 SQRes QMRes Total n-1 OBS1: As expressões para os cálculos das SQ e QM são dadas abaixo. ( ) 1 ''ˆ' 1 ''ˆ 2 −− − = −− = − == ∑ Kn YXYY Kn SQQM K n Y YX K SQ QM res res i regr regr β β OBS2: Outras fórmulas bastante úteis para o bom entendimento dos cálculos realizados são: SQTotal = ∑ = − n i i yy 1 2)( ; SQRegressão = ∑ = − n i i yy 1 2)ˆ( ;SQResíduo = ∑ ∑ = = =− n i n i iii eyy 1 1 22)ˆ( 8.13.2.3 Exemplos Exemplo 8.13.2.3.1 Seja X1 = {1, 2, 3, 4, 5}, X2 = {2, 3, 4, 6, 10} e Y = {12, 16, 18, 21, 24} 47 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli Pede-se: a) Considerando o modelo Y = β0 + β1X1 + β2X2 + ε, obtenha o vetor Y e a matriz X; b) Obtenha as matrizes X’X e X’y c) Obtenha as estimativas dos parâmetros, dado a seguinte (X’X)-1 x1 x2 1.2256410 -0.6410256 0.1794872 x1 -0.6410256 1.0256410 -0.4871795 x2 0.1794872 -0.4871795 0.2564103 d) Obtenha a média de y; e) Obtenha os valores ajustados de y; f) Usando as fórmulas dadas na observação 2 acima, calcule a SQTotal, SQRegressão e SQResíduo. Monte o quadro na ANOVA e conclua. Dica: todas as respostas podem ser obtidas no endereço www.dpi.ufv.br/~peternelli/inf460/materiais.htm Adicionalmente poderíamos testar cada coeficiente separadamente utilizando um teste t. Ho: βj = 0 vs Ha: βj ≠ 0 j = 0, 1, ..., k ( )..1~ ˆ ˆ 2 lgKnt C t jj j calc −−= σ β onde: ̂ 2σ onde Cjj corresponde ao elemento ocupando a posição jj na matriz (X’X)-1, com j variando de 0 a k. ( ) ( )1/''ˆ' −−−== KnYXYYQM residuo β A regra decisória continua sendo: Se 0Hserejeitatt tabcalc −⇒≥ Ou avalia-se pelo p-value. Intervalos de confiança também podem ser obtidos para os coeficientes de regressão. Um intervalo de 100 (1 – α)% de confiança para βi é dado por: 48 http://www.dpi.ufv.br/~peternelli/inf460/materiais.htm INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli 1, 2 22 ˆˆˆ.ˆ −− = +≤≤− kntab jjtabjjjjtabj tt CtCt α σββσβ onde: 8.14 O Coeficiente de Determinação e o Coeficiente de Determinação Ajustado 2R 2 ajR Na regressão linear simples, o coeficiente de determinação é representado por r². No entanto, para regressão linear múltipla, usamos R², chamado, geralmente, coeficiente de determinação múltiplos. O R² informa a quantidade reduzida na variabilidade de Y pelo uso das variáveis regressoras X1, X2, ..., Xk no modelo. Em outras palavras, o quanto da variação de Y que é explicada pelo modelo. O R² é dado por: total resíduo total regressão SQ SQ SQ SQ R −== 12 É importante notar que um valor grande do R² não implica, necessariamente, que o modelo de regressão é bom. Ao adicionar uma variável ao modelo, sempre haverá um incremento no R². Isso ocorre mesmo que a variável incluída seja significativa estatisticamente ou não. Ex: (um exemplo numérico será visto oportunamente) pmReXXY mreXY iiioi iioi +=→+++= ==++= 22 21 2 1 βββ ββ Portanto, é possível que modelos com R² elevado forneçam predições de novas observações ruins ou estimativas de respostas médias ruins. Uma alternativa para esse problema de interpretação do R² e uso do R² ajustado, definido por: ( )22 1.11 )1( )(1 R pn n n SQ pn SQ R toal resíduo aj − − − −= − − −= 49 INF 460 – Notas de aula – sujeito a correções Prof. Luiz Alexandre Peternelli ou seja, total resíduo aj QM QM R −=12 De modo geral o R² ajustado nem sempre aumenta quando variáveis são incluídas no modelo. E o mais importante é que o R² ajustado irá diminuir se uma variável não importante (estatisticamente não significativa) for adicionada ao modelo. OBS: Quando o R² e o forem muito discrepantes, haverá bom indicativo de que termos não 2ajR significativos tenham sido adicionados no modelo. 8.14.1. Exercícios Exercício 8.14.1.1. considere os dados do exercício 8.13.2.3.1. Pede-se: a) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + ε. b) Realize a análise de variância supondo o modelo Y = β0 + β1X1 + β2X2 + ε, ou seja, foi incluído a variável X2 no modelo. Observe agora que X2 é não significativo; c) Compare os resultados dos coeficientes de determinação d) Compare os resultados dos coeficientes de determinação ajustados. e) Discuta sobre os resultados obtidos em c e d. Respostas: As respostas para esse problema podem ser obtidas no endereço eletrônico www.dpi.ufv.br/~peternelli/inf460/materiais.htm, na resolução do exercício 8.13.2.3.1. 8.15. Teste para a Falta de Ajustamento Quando alguns níveis da variável regressora X (ou combinação de níveis das variáveis regressoras Xi) são repetidos, o modelo ajustado pode ser testado usando o teste para a falta de ajustamento. Isto freqüentemente ocorre quando a análise de regressão esta inserida no contexto de delineamentos experimentais. Uma explicação mais teórica, com fórmulas e suas deduções pode
Compartilhar