Prévia do material em texto
UTFPR – Universidade Tecnológica Federal do Paraná/ Campus Londrina Disciplina: Probabilidade e Estatística Curso: MA92B-EM21 – Engenharia de Materiais Professor: Joelmir André Borssoi CAPÍTULO IV TESTES ESTATÍSTICOS E ANÁLISE DE VARIÂNCIA 1 TESTES ESTATÍSTICOS Os testes estatísticos são testes de hipóteses que auxiliam em tomadas de decisões sobre um parâmetro de uma população, com base em amostras. Essas tomadas de decisões são chamadas decisões estatísticas. 1.1 Principais conceitos i) Hipótese estatística: é uma suposição quanto ao valor de um parâmetro populacional que será verificada por meio de um teste paramétrico. São exemplos de hipóteses estatísticas: 1) Substituindo o processador A pelo processador B, há diferença no tempo médio de resposta de um computador; 2) As instalações elétricas de uma casa foram trocadas. O proprietário deseja saber se há diferença significativa na média de consumo de energia; 3) A proporção de reclamações após a implantação de um programa de melhoria de qualidade é menor do que antes da implantação. ii) Teste de hipótese: é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais. iii) As hipóteses: designa-se H0 (hipótese nula) a hipótese estatística a ser testada e por H1 a hipótese alternativa. A rejeição de H0 implicará na aceitação de H1. A hipótese alternativa geralmente representa a suposição que o pesquisador quer provar, sendo H0 formulada com o expresso propósito de ser rejeitada. A seguir são apresentados os tipos de testes: i) Teste bicaudal (bilateral): H0: θ = θ0 vs H1: θ θ0 ii) Teste unicaudal (unilateral) à direita: H0: θ = θ0 vs H1: θ > θ0 iii) Teste unicaudal (unilateral) à esquerda: H0: θ = θ0 vs H1: θ < θ0 1.2 Erros de decisão Erro tipo I ou erro de primeira espécie. Constitui-se em rejeitar H0 quando ela é verdadeira. Designa-se por a probabilidade de se cometer o erro tipo I (nível de significância). Erro tipo II ou erro de segunda espécie. Constitui-se em aceitar H0 quando ela é falsa. Designa-se por a probabilidade de se cometer erro de tipo II. O objetivo de se testar uma hipótese é tomar uma decisão, se possível, correta. Rejeitar H0 implica a aceitação de H1; aceitar H0 implica a rejeição de H1. Só pode ocorrer o erro tipo I quando H0 é rejeitada e o erro tipo II, quando H0 não é rejeitada. Exemplo: Decisão de um juiz sobre um réu. TESTE Situação específica da população H0 Verdadeira: Inocente H0 Falsa: Culpado Aceitar H0: Absolve o réu Decisão correta (1-) Erro tipo II () Rejeitar H0: Condena o réu Erro tipo I () Decisão correta (1-) O tomador de decisão deseja, obviamente, reduzir ao mínimo as probabilidades dos dois tipos de erros. Infelizmente, esta é uma tarefa difícil, porque para uma amostra de determinado tamanho, a probabilidade de se incorrer em um erro Tipo II aumenta à medida que diminui a probabilidade do erro Tipo I, e vice-versa. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra. 1.3 Procedimentos gerais para se efetuar um teste 1º Passo) Enunciar as hipótese H0 e H1; 2º Passo) Fixar o limite de erro e identificar a estatística do teste; 3º Passo) Determinar as RC (Região Crítica) e RA (Região de Aceitação) em função do nível de , pelas tabelas estatísticas; Bicaudal Unicaudal à direita Unicaudal à esquerda 4º Passo) Por meio dos elementos amostrais, avaliar o valor da variável do teste (Z ou t); 5º Passo) Concluir pela aceitação ou rejeição de H0, pela comparação do valor obtido no 4º passo com as regiões críticas e de aceitação fixadas no 3º passo. Para decidir qual variável será utilizada no teste pode-se observar a seguinte tabela: Tamanho da amostra (n) Variância Populacional ( 2) Uso da distribuição n é grande (n 30) É conhecida Normal (Z) Não é conhecida Normal (Z) n é pequeno (n < 30) É conhecida Normal (Z) Não é conhecida t de Student (t) 1.4 Teste para a Média () - variância 𝝈𝟐 conhecida É conveniente lembrar que todos os testes de médias, pressupõem a normalidade da distribuição amostral da variável do teste X . Neste caso, a variável do teste será 𝑍𝑐 = �̄� − 𝜇0 𝜎 √𝑛 ⁄ em que: x : média amostral; 0: valor de H0; : desvio padrão populacional; n: tamanho da amostra. Conclusões do teste: se Zc estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0, o que implica em aceitar a hipótese H1, ou seja: a) Teste Bicaudal: se −𝑍𝛼 2⁄ ≤ 𝑍𝑐 ≤ 𝑍𝛼 2⁄ , aceita-se H0; b) Teste Unicaudal à direita: se 𝑍𝑐 > 𝑍𝛼 , rejeita-se H0; c) Teste Unicaudal à esquerda: se 𝑍𝑐 < −𝑍𝛼, rejeita-se H0; Exemplo: O diâmetro das peças produzidas é uma variável que tem se comportado segundo um modelo normal, com média igual a 7,4 mm e variância 1,3 mm2. Foi tomada uma amostra de 25 peças que acusou média de 6,72 mm. Considerando que não houve alteração na variabilidade e um nível de 1% de significância, existe evidência suficiente de que a média do diâmetro reduziu? 1º passo) vamos testar as hipóteses: H0: = 7,4 vs H1: < 7,4 (c) teste unicaudal à esquerda 2º passo) Como a variância populacional é conhecida, aplicamos o teste Z. Nível de significância: 0,01, ou seja, =0,01 ou 1% 3º passo) Para o teste unicaudal a esquerda e =0,01, obtém-se o valor de Z = -2,33. Assim, temos: 4º passo) calcular o valor de Zc 𝑍𝑐 = �̄� − 𝜇0 𝜎 √𝑛 ⁄ = 6,72 − 7,4 √1,3 √25 ⁄ = −0,68 0,228 ⇒ 𝑍𝑐 = −2,98 5º passo) Conclusão: como 𝑍𝑐 < −𝑍𝛼, o valor de Zc = – 2,98 encontra-se na região crítica (RC), então, rejeita-se a hipótese H0. Portanto, aceita-se a hipótese alternativa, ou seja, com 1% de significância, podemos dizer que a média do diâmetro reduziu. Exercício: Uma fábrica produz eixos para um motor de automóvel. O desgaste dos eixos depois de 100000 Km é de interesse, visto que é provável ter um impacto nas reinvindicações de garantia. Uma amostra aleatória de n=15 eixos é testada e apresenta média igual a 2,78. Sabe-se que = 0,9 e que o desgaste é normalmente distribuído. Usando =0,05: a) teste se a verdadeira média de desgaste é igual ou diferente de 3; b) teste se a verdadeira média de desgaste é igual ou inferior 3. 1.5 Teste para a Média () - variância 𝝈𝟐 desconhecida Neste caso, admitindo-se que não se conhece a variância populacional e n < 30, a variável do teste será “t” que tem distribuição t de Student, com n-1 graus de liberdade: 𝑡𝑐 = �̄� − 𝜇0 𝑠 √𝑛⁄ x : média amostral; 0: valor de H0; S: desvio padrão amostral; n: tamanho da amostra. As regiões Críticas (RC) e de Aceitação (RA) são: Conclusões do teste: se tc estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0, o que implica em aceitar a hipótese H1. a) Teste Bicaudal: se −𝑡1−𝛼 2⁄ ≤ 𝑡𝑐 ≤ 𝑡1−𝛼 2⁄ , aceita-se H0; b) Teste Unicaudal à direita: se 𝑡𝑐 > 𝑡1−𝛼, rejeita-se H0; c) Teste Unicaudal à esquerda: se 𝑡𝑐 < −𝑡1−𝛼, rejeita-se H0. Exemplo: Uma máquina foi regulada para fabricar placas com espessura média de 30mm. As espessuras das peças fabricadas seguem uma distribuição gaussiana. Iniciada a produção, foi obtida uma amostra de 15 placas, que forneceu as seguintes medidas de espessura abaixo: 22, 31, 31, 26, 27, 22, 26, 24, 21, 40, 42, 30, 28, 26 e 25mm. Ao nível de 5% de significância, pode-se aceitar a hipótese de que a regulagem da máquina é satisfatória, ou seja, é de 30mm? Solução: 07,28 15 421 === n x x i mm ( ) ( ) − − = − − = = 15 421 12337* 115 1 * 1 1 22 1 22 n x x n Si n i i 21,3793,520* 14 12 ==S , portanto, 1,621,37 ==S mm 1º passo) vamos testar a hipótese de igualdade ou diferença: H0: = 30 vs H1: 30 (a) teste bicaudal 2º passo) Como a variância populacional é desconhecida, e n=15 < 30, aplicamos o teste t. Graus de liberdade (gl): n-1 = 15-1=14; Nível de significância: 0,05, ou seja, =0,05 = 5% 3º passo) Busca-se na tabela “t” Student, no eixo horizontal, o valor correspondente a 1-/2 e no eixo vertical os graus de liberdade (gl=14). Obtendo-se desta forma o valor de 2,145. Assim teríamos: 4º passo) calcular o valor de tc: 𝑡𝑐 = �̄�−𝜇0 𝑠 √𝑛⁄ = 28,07−30 6,10 √15⁄ = −1,225 5º passo) Conclusão: como o valor de tc = -1,225 encontra-se na região aceitável (RA), aceita-se a hipótese H0. Assim, a média amostral ( x =28,07mm) é estatisticamente igual à média = 30mm, ou seja, a regulagem da máquina é satisfatória. Exercício: Uma fábrica produz eixos para um motor de automóvel. O desgaste dos eixos depois de 100.000 Km é de interesse, visto que é provável ter um impacto nas reinvindicações de garantia. Uma amostra aleatória de n=15 eixos é testada e apresenta média igual a 2,78 e desvio padrão igual a 0,9. Usando =0,05, teste se a verdadeira média de desgaste é igual ou inferior 3. 1.6 Teste para a proporção populacional () As mesmas ideias apresentadas no caso do teste de uma média podem ser utilizadas para se realizarem testes envolvendo a proporção populacional. Assim teremos: 1º passo) Enunciar as hipóteses H0: = 0 vs H1: 0 (a) teste bicaudal H1: > 0 (b) teste unicaudal à direita H1: < 0 (c) teste unicaudal à esquerda. 2º passo) Fixa-se o nível de significância . A variável usada é a normal padronizada Z, em geral quando n > 30. 3º passo) Definir a Região Crítica (RC) e Região Aceitável (RA) 4º passo) Calcular o valor da variável Z: 𝑍𝑐 = 𝑝 − 𝜌0 √𝜌0 ⋅ (1 − 𝜌0) 𝑛 em que: n: tamanho da amostra; p = X/n: proporção a favor de determinada característica, baseada na amostra; 0: proporção segundo a hipótese H0. 5º passo) Conclusões Se Zc estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0, o que implica aceitar a hipótese H1. a) Teste Bicaudal: se −𝑍𝛼 2⁄ ≤ 𝑍𝑐 ≤ 𝑍𝛼 2⁄ , aceita-se H0; b) Teste Unicaudal à direita: se 𝑍𝑐 > 𝑍𝛼, rejeita-se H0; c) Teste Unicaudal à esquerda: se 𝑍𝑐 < −𝑍𝛼, rejeita-se H0. Exemplo: Há alguns anos foi realizado um estudo para saber a proporção de papeis filtro que eram fornecidos a um laboratório com algum contaminante. A conclusão foi que essa proporção era de 60%. Passado algum tempo, deseja-se verificar se houve alteração na qualidade dos papeis filtro. Para tanto, tomou-se uma amostra aleatória de 500 filtros e verificou-se que 265 continham algum contaminante. Ao nível de 5%, teste se a proporção verdadeira atual é significativamente diferente da anterior. 1º passo: H0: = 60% vs H1: 60% (a) teste bicaudal 2º passo: Nível de significância: 0,05, ou seja, = 0,05 = 5% e a variável usada é a normal padrão, Z ~ N(0,1). 3º passo: Quando se trata da família de distribuição normal reduzida Z, para a proporção de 95% de área abaixo da curva, obtemos o valor de Z igual a 1,96. Ou seja, com nível de significância de 5%, obtém-se o valor crítico (RC) de 96,1025,0 2 == ZZ . 4º passo: calcular o valor de Z 53,0 500 265 ==p que representa a proporção de papéis filtro contaminados dos 500 amostrados. n p Z cal )1(* 00 0 − − = 500 )60,01(*60,0 60,053,0 − − =calZ 19,3−=calZ 5º passo: Conclusão: Como o valor de Zcal = -3,19 encontra-se na região crítica (RC), rejeita-se a hipótese H0. Portanto, a proporção atual de papéis filtro com contaminante é estatisticamente diferente da proporção anterior ( = 0,60). Exercício: Um fabricante garante que 90% das peças que fornece à linha de produção de uma determinada fábrica estão de acordo com as especificações exigidas. A análise de uma amostra de 200 peças revelou 25 defeituosas. A um nível de 5%, podemos dizer que é verdadeira a afirmação do fabricante? (R: é verdadeira) 1.7 Abordagem do p-valor para testes de hipóteses O p-valor é o chamado nível descritivo do teste de hipóteses e é a probabilidade da variável do teste assumir um valor mais extremo do que o valor calculado para tal variável (Zc ou tc). Regra de decisão: usando esta abordagem, compara-se o p-valor com o nível de significância: i) p-valor ≥ α => não rejeita-se H0; ii) p-valor < α => rejeita-se H0. 2 EXPERIMENTAÇÃO E ANÁLISE DE VARIÂNCIA Experimentos são uma parte natural do processo de tomada de decisões em engenharia. Suponha, por exemplo, que um engenheiro de materiais esteja investigando os efeitos de diferentes métodos de cura sobre a resistência à compressão do concreto. O experimento consistiria em fabricar vários corpos de prova de concreto usando cada um dos métodos de cura e então testar a resistência à compressão de cada um. Assim, seria possível determinar qual método de cura deveria ser usado para fornecer a máxima resistência média à compressão. A experimentação tem por objetivo o estudo de experimentos, isto é, seu planejamento, execução, análise dos dados obtidos e interpretação dos resultados. Isto é realizado a partir de uma pesquisa. Denomina-se pesquisa, um conjunto de atividades orientadas para a busca de um determinado conhecimento. Para merecer o qualificativo de científica, a pesquisa deve ser feita de modo sistematizado, utilizando, para isto, métodos próprios e técnicas específicas. 2.1 DEFINIÇÕES a) Experimento ou ensaio: é um procedimento no qual alterações propositais são feitas nas variáveis de entrada de um processo ou sistema, de forma que se possa avaliar as possíveis alterações sofridas pela variável resposta, como também a razão destas alterações. É um trabalho previamente planejado que segue determinados princípios básicos no qual se faz a comparação dos efeitos dos tratamentos. b) Variável resposta (Y): é o resultado de interesse registrado após a realização de um ensaio. c) Unidade experimental ou parcela: é a unidade que vai receber o tratamento e fornecer os dados que deverão refletir seu efeito. d) Fatores: são tipos distintos de condições que serão manipuladas nas unidades experimentais. Os diferentes modos de presença de um fator no estudo são considerados níveis do fator. e) Tratamento: é um método, elemento ou material cujo efeito deseja-se medir ou comparar em um experimento (máquinas, métodos, produtos, materiais). Como exemplo, veja a Figura 1, que mostra o esquema de um experimento feito para comparar dois compostos químicos (Tratamentos 1 e 2), em tubos de ensaio. Figura 1. Tratamento1 versus Tratamento2. f) Testemunha ou grupo controle: conjunto de parcelas que, ou não recebe tratamento, ou recebe um tratamento já conhecido. Sua resposta é comparada com as respostas dos grupos tratados. g) Erro experimental: é a variação existente entre duas parcelas que receberam o mesmo tratamento. É importante ressaltar que a homogeneidade das parcelas experimentais, antes de receber os tratamentos, é condição essencial para validade do experimento; h) Delineamento experimental: é o plano utilizado na experimentação e implica na forma como os tratamentos serão designados às unidades experimentais e em um amplo entendimento da análise estatística. 2.2 PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO Para que possamos planejar adequadamente a coleta de dados, devemos conhecer ainda três princípios básicos do planejamento de experimentos que são: a réplica (repetição), a aleatorização (ou casualização) e a formação de blocos. i) Réplica De acordo com VIEIRA & HOFFMANN (1989) em experimentação a ideia é comparargrupos e não apenas unidades. As unidades experimentais do mesmo grupo recebem, em estatística, o nome genérico de repetições. A repetição é importante porque: ➢ permite a obtenção de uma estimativa da variabilidade devido ao erro experimental dentro de cada tratamento; ➢ aumenta a precisão do experimento e das estimativas obtidas no experimento; ➢ amplia o alcance da inferência pela repetição do experimento no tempo e no espaço. Exemplo: Imagine que para verificar se determinado hormônio tem efeito sobre o peso de ratos, um pesquisador forneceu o hormônio para um rato e deixou outro sem o hormônio. Se no final do experimento, o rato que recebeu hormônio pesar, por exemplo, 150g e o outro 120g, o pesquisador poderia afirmar que o hormônio tem efeito sobre o peso dos ratos (150g > 120g). Mas esta é uma conclusão pouco confiável, porque dois ratos podem apresentar diferenças de peso por diversas razões, além do tratamento. Porém, se um grupo de ratos receber hormônio (tratado) e um outro grupo de ratos ficar sem hormônio (controle) e mesmo assim, ao final do experimento encontrar o resultado acima (150g > 120g), o pesquisador poderá concluir com maior confiabilidade que o hormônio tem efeito sobre o peso dos ratos. ii) Aleatorização O termo aleatorização (casualização) refere-se ao fato de que tanto a alocação do material experimental às diversas condições de experimentação, quanto à ordem segundo a qual os ensaios serão realizados, são determinados ao acaso. A aleatorização torna possível a aplicação dos métodos estatísticos para análise dos dados, pois modelos estatísticos exigem que o erro experimental seja aleatório e independente. A aleatorização permite ainda que os efeitos não-controláveis que afetam a variável resposta sejam balanceados entre todas as medidas. iii) Formação de blocos A formação de blocos é realizada quando se deseja avaliar com maior eficiência os efeitos dos fatores de interesse (fatores perturbadores conhecidos). Assim, os blocos são considerados conjuntos homogêneos de unidades experimentais. A principal finalidade é reunir unidades experimentais heterogêneas em grupos homogêneos. 2.3 DELINEAMENTOS EXPERIMENTAIS E TESTES DE COMPARAÇÕES DE MÉDIAS A comparação de várias situações experimentais pode ser feita utilizando-se amostras da população. Muitas vezes deseja-se comparar médias de duas ou mais populações. A análise de variância, conhecida por ANOVA, consiste de uma generalização do teste para igualdade de duas médias populacionais. Nesta análise testamos k (k > 2) médias populacionais para serem testadas. Suponha que se deseja testar a hipótese de k (k > 2) médias populacionais sejam iguais, ou seja, H0: μ1= μ2= ... = μk, contra a hipótese alternativa de que pelo menos uma dessas médias seja diferente das demais. Na ANOVA, a variabilidade devido aos “tratamentos” é separada da variabilidade residual (erro devido ao acaso). Assim, a ideia da análise de variância é comparar a variação devida aos tratamentos com a variação devido ao acaso. O desenvolvimento da ANOVA depende do tipo de delineamento experimental que está sendo considerado. 2.3.1 Delineamento Inteiramente Casualizado (DIC) Este delineamento é o mais simples de todos os delineamentos experimentais. Entretanto, deve ser utilizado apenas quando se tem certeza absoluta da homogeneidade das condições ambientais e do material experimental. Assim, as parcelas que receberão cada um dos tratamentos são determinadas de forma inteiramente casual, através de sorteio, para que cada unidade experimental tenha a mesma probabilidade de receber qualquer um dos tratamentos estudados, sem qualquer restrição (BANZATTO & KRONKA, 1992). Exemplo: Considere que um produtor dispõe de 12 suínos e queira comparar o efeito de três tipos de ração (fator): A, B e C (tratamentos) sobre o peso dos animais (variável resposta - Y). Considerando que as unidades experimentais (suínos) são similares, ou seja, mesma raça, sexo, idade e pesos próximos no início do experimento, o produtor realizou o sorteio de 4 animais para cada tipo de ração, conforme o que é apresentado na Figura 2. Figura 2. Experimento inteiramente ao acaso. Fonte: VIEIRA & HOFFMANN (1989). Figura 3. Experimento inteiramente ao acaso com nº diferente de repetições. Fonte: VIEIRA & HOFFMANN (1989). É comum em experimentos inteiramente ao acaso, que todos os tratamentos tenham igual número de repetições, como foi visto na Figura 2. Entretanto, existem situações onde isto não ocorre. Vamos supor que um professor pretenda comparar dois métodos de ensino e dispõe de 41 crianças similares para o experimento. Assim, uma das formas de resolver o problema seria o professor dividir o conjunto de 41 crianças, ao acaso, em dois grupos iguais de 20 crianças e descartar uma delas, ou então, ter um grupo de 20 crianças e outro de 21 crianças, como mostra a Figura 3. Análise de Variância – ANOVA Uma suposição básica e implícita na ANOVA é que as diversas médias amostrais são obtidas de populações normalmente distribuídas e que têm mesma variância. Entretanto, segundo KAZMIER (1982) esta suposição não é muito afetado por violações da hipótese de normalidade, quando as populações são unimodais e os tamanhos das amostras aproximadamente iguais. Se a variável em estudo tem distribuição normal ou aproximadamente normal, para comparar mais de duas médias aplica-se o teste F (Fisher-Snedecor). Primeiro, é preciso estudar as causas da variação. Por que os dados variam??? Uma explicação é o fato de as amostras provirem de populações diferentes. Outra explicação é o acaso, porque mesmo dados provenientes da mesma população variam. O teste F é feito por meio da análise de variância. Na ANOVA, a variabilidade devido aos “tratamentos” é separada da variabilidade residual (erro devido ao acaso). Assim, a ideia da análise de variância é comparar a variação devida aos tratamentos com a variação devido ao acaso. Seja k o número de níveis de um fator em estudo. A notação é a seguinte: Repetição Tratamento Total T1 T2 T3 ... Tk 1 Y11 Y21 Y31 ... Yk1 2 Y12 Y22 Y32 ... Yk2 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ri Y1r1 Y2r2 Y3r3 ... Ykrk Total T1 T2 T3 … Tk T Média de cada tratamento .1T Y .2TY .3TY … .TkY ..Y Nº de repetições r1 r2 r3 ... rk n=kr em que: Yij : é a j-ésima observação correspondente ao i-ésimo tratamento (valor da variável resposta); ri : é o número de unidades experimentais ou parcelas submetidas ao i-ésimo tratamento; = = k i irn 1 : é o tamanho amostral (o número total de ensaios); = = in j ij i i Y r Y 1 . 1 : média por tratamento i=1,2,...,k; == = in j ij k i Y n Y 11 .. 1 : média geral. a) Modelo Estatístico (Modelos de Efeito Fixo) O modelo estatístico associado a experimentos com um fator fixo é dado pela forma: ijiij ΤμY ++= para i =1,2,..., k e j=1,2,..., ri em que: Yij = variável resposta para o tratamento i e repetição j; = média geral comum a todas as observações = = k i iir n 1 1 ; i = efeito do i-ésimo tratamento em Y e mede o desvio padrão da i-ésima média, i, em relação a , isto é −= iiT ; ij = é o erro aleatório não observável associado a Yij. As suposições associadas a este modelo são: i) Os erros ij são independentes (aleatorização); ii) Os erros ij possuem variância constante (2 = cte); iii) Os erros ij são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição normal com média zero e variância constante, isto é, ij N (0,2). b) Hipóteses O objetivo do estudo realizado é verificar se as médias 1, 2,…, k são iguais ou não, o que equivale a testar se os efeitos dos tratamentos (i) são iguais a zero ou não. Este teste pode ser expresso por: 0: 1=2= … = k=0 (igualdade dos tratamentos) vs1: i 0 para pelo menos um i, (hipótese alternativa), ou seja, existe o efeito tratamento. O procedimento utilizado para testar as hipóteses é a análise de variância. c) Tabela de Análise de Variância para um fator (ANOVA) A ANOVA constata se existe efeito dos tratamentos em estudo. Fonte de Variação (FV) Graus de Liberdade(GL) Soma Quadrado (SQ) Quadrado Médio (QM) F Tratamentos k–1 SQTr QMTr F0 Resíduos n–k SQR QMR - TOTAL n–1 SQTot - - Para fazer a análise de variância de um experimento inteiramente casualizado (DIC) é preciso calcular os seguintes itens: i) graus de liberdade: * dos tratamentos: k -1; * do total: n -1; * do resíduo: (n -1)-(k -1) = n - k. ii) Correção C: o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. ( ) n Y C ij 2 = ou ( ) n T C i 2 = iii) soma de quadrados total: mede a variabilidade total das observações em relação a média geral. CYSQTot ij −= 2 ou ( ) = = −= k i n j ij i ..YYSQTot 1 1 2 iv) soma de quadrados de tratamentos: mede a variabilidade entre as médias dos tratamentos em relação a média geral C r Τ SQTr i −= 2 ou ( ) = −= k i ii ..Y.YrSQTr 1 2 OBS: Caso o número de repetições seja diferente entre os tratamentos (experimento não balanceado), calcula-se: C r T r T r T SQTr k k − +++= 2 2 2 2 1 2 1 ... , em que, r1, r2,...,rk representam o número de repetições para cada tratamento. v) soma de quadrados de resíduos: é uma medida de homogeneidade interna dos tratamentos. SQTot-SQTrSQR = ou ( ) = = −= k i n j iij i .YYSQR 1 1 2 vi) quadrado médio de tratamentos: este será um estimador não viciado da variância populacional 2, se a hipótese de nulidade for verdadeira. 1− = k SQTr QMTr vii) quadrado médio de resíduos: este é um estimador não viciado de 2. n-k SQR QMR = viii) valor de F: QMR QMTr F = 0 d) Regra de Decisão: Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabela 1, para nível de significância de 5%) procurando o valor de F(k-1,n-k,%), com (k-1) graus de liberdade no numerador e (n - k) no denominador. ➢ Se F0 F(k-1, n-k,%), rejeita-se a hipótese 0 ao nível de % de significância, ou seja, aceita-se a hipótese alternativa 1 que diz que em média os tratamentos são diferentes. ➢ Se F0 < F(k-1, n-k,%), aceita-se a hipótese 0 ao nível de % de significância, ou seja, em média não há diferença entre os tratamentos. 2.3.2 Testes de comparações múltiplas Quando a ANOVA (Fo) de um experimento mostra que as médias dos tratamentos são estatisticamente diferentes, pode-se perguntar quais as médias que diferem entre si. Imagine que um pesquisador deseje comparar três tratamentos (A,B,C) entre si. Se a ANOVA mostrar que as médias desses tratamentos são estatisticamente diferentes, pode-se usar um determinado teste estatístico para comparar as médias de A e B, A e C, B e C, que representam os contrastes. Estes testes estatísticos servem então, como um complemento do teste F (Fisher-Snedecor) aplicado na análise de variância, pois este permite estabelecer apenas se as médias das populações em estudo são, ou não, estatisticamente iguais. No entanto, este tipo de análise não permite detectar quais são as médias estatisticamente diferentes das demais. Existe uma série de métodos de comparação múltipla: teste T, Tukey, Scott-Knott, Duncan, Dunnett, Scheffé e Bonferroni. Os quatro testes iniciais, só devem ser aplicados quando a estatística F0 (ANOVA) for significativa, ou seja, existir diferenças significativas entre os tratamentos (aceitar a hipótese H1). ❑ O teste T deve ser utilizado apenas para comparação de duas médias. ❑ O teste Tukey pode ser utilizado para realizar a comparação entre as médias. ❑ O teste Dunnett deve ser utilizado somente para comparar os tratamentos com um tratamento controle. ❑ O teste de Duncan é utilizado para saber qual dos tratamentos é o melhor. Antes de estudarmos estes testes, são necessários alguns conceitos. Contraste (C) é a combinação linear das médias dos k tratamentos em estudo. Numa análise estatística devemos formular aqueles contrastes que sejam de maior interesse para o experimentador. Os contrastes são ditos ortogonais, quando existe independência entre duas comparações, ou seja, a variação de um contraste é inteiramente independente da variação do outro. Os contrastes devem ser avaliados comparativamente com um método que forneça a diferença mínima significante (d.m.s) entre duas médias, que é um instrumento de medida. Toda vez que o valor absoluto da diferença entre duas médias for maior ou igual que a d.m.s, as médias são consideradas estatisticamente diferentes, ao nível de significância adotado. Foram propostas diversas maneiras de calcular a d.m.s. Cada proposta é, na realidade, um teste que, de forma geral, leva o nome do autor. Não existe procedimento para comparação de médias que seja “melhor” que todos os outros. Por isto, estão apresentados e discutidos abaixo os testes mais utilizados. a) Teste T (t de Student) De acordo com BANZATTO & KRONKA (1992), os requisitos básicos deste teste são: i) os contrastes a serem testados devem ser ortogonais entre si; ii) os contrastes devem ser estabelecidos antes de serem examinados os dados (na fase de planejamento do experimento). ❑ Hipótese de interesse H0: C=0 vs H1: C0 A estatística do Teste T para testar a hipótese H0 é dada através da diferença mínima significativa (d.m.s.): • Experimento não balanceado → QMR rr tsmd ji kn * 11 *... %);( += − • Experimento balanceado → r QMR tsmd kn *2 *... %);( −= O valor de t(n-k; %) com n-k graus de liberdade para o resíduo e % de significância podem ser encontrados na Tabela t-Student. Já QMR (quadrado médio dos resíduos) pode ser encontrado na Tabela ANOVA e r, representa o nº de repetições de cada tratamento. ❑ Regra de Decisão Toda vez que o valor absoluto da diferença entre duas médias (contrastes) for maior ou igual que o valor da d.m.s, as médias são estatisticamente diferentes, ao nível de significância de %, o que implica na rejeição da hipótese H0. b) Teste de Tukey De acordo com BANZATTO & KRONKA (1992), este teste pode ser utilizado para testar todo e qualquer contraste entre duas médias. É um teste muito versátil, mas não permite comparar grupos entre si. Para que o teste seja exato, é necessário que todos os tratamentos possuam o mesmo número de réplicas. O teste tem por base a diferença mínima significante (d.m.s), ou seja, a menor diferença de médias de amostras que deve ser tomada como estatisticamente significante, em determinado nível. ❑ Hipótese de interesse H0: i=j vs H1: ij para ij A estatística de Tukey é dada através da diferença mínima significativa (d.m.s) • Experimento não balanceado → 2 QMR * r 1 r 1 *qd.m.s. ji α%)k;n(k; += − • Experimento balanceado → r QMR *qd.m.s. α%)k;n(k; − = O valor de qc(k;n-k;%) com k graus de liberdade para o tratamento e (n-k) graus de liberdade para o resíduo podem ser encontrados na Tabela 2, para um nível de significância de 5% (anexo). Já QMR (quadrado médio dos resíduos) pode ser encontrado na Tabela ANOVA e r, representa o nº de repetições de cada tratamento. ❑ Regra de Decisão Para este teste, duas médias são estatisticamente diferentes quando o valor absoluto da diferença entre elas for maior ou igual a d.m.s. Obs.: De acordo com GOMES (1987), no caso de serem diferentes os números de repetições, o teste de Tukey pode ainda ser usado, mas então é apenas aproximado. Exemplo: Um engenheiro de uma indústria produtora de material cerâmico iniciou um processo de controle para melhorar resultados com o objetivode reduzir a proporção de tijolos de 8 furos que apresentam defeitos. Na fase de observação do processo identificou-se que ocorrências de trincas eram provocadas pelo rompimento de bolhas de vapor no interior de tijolos e então passou a desconfiar que algumas das secadoras da indústria poderiam estar provocando o problema por não extrair dos tijolos a umidade necessária. No processo de análise foi então planejado um experimento com o objetivo de verificar se as secadoras eram similares no que diz respeito à umidade retirada de tijolos ou existiam diferenças entre elas. Para a realização do experimento foram utilizados 28 tijolos fabricados com matéria prima extraída de uma jazida e submetidos às mesmas condições de preparação e conformação (etapa anterior a secagem). O experimento consistiu em submeter 7 tijolos, escolhidos aleatoriamente, a cada uma das quatro secadoras e, após a secagem, medir a quantidade de umidade que foi retirada de cada tijolo. Os resultados obtidos no experimento estão apresentados na tabela abaixo. Tabela – Umidade (%) extraída dos tijolos durante a secagem Tijolo Secadora A B C D 1 22,7 19,5 20,5 22,5 2 24,2 20,2 22,5 21,9 3 21,5 20,5 21,9 23,3 4 23,3 19,4 23,3 23,5 5 22,8 21,2 21,1 21,5 6 21,8 20,0 21,7 22,1 7 22,5 18,5 21,4 22,9 Total 158,8 139,3 152,4 157,7 Média 22,7 19,9 21,8 22,5 a) Identificação do experimento e Modelo • Variável de Interesse: % de Umidade extraída dos tijolos durante a secagem; • Unidade Experimental: Os tijolos; • Fator em estudo: Secadoras; • Níveis do Fator: 4 (Secadora A, Secadora B, Secadora C, Secadora D) Quando temos um experimento completamente ao acaso, temos interesse em verificar a influência dos k níveis desse fator na variável resposta Y em estudo. Assim um modelo estatístico associado a este tipo de experimento é da forma: 𝑌𝑖𝑗 = 𝜇 + 𝑇𝑖 + 𝜀𝑖𝑗 b) Estimativas dos parâmetros Estimadores de : a % de umidade média extraída da amostra de tijolos (n = 28) nas 4 secadoras foi: �̂� = 𝑌. . = (22,7+19,9+21,8+22,5) 4 = 21,7%. A média por tratamento 𝑌𝑖 . (cada secadora), pode ser vista na Tabela 1 e é apresentada abaixo: Secadora A: �̂�𝐴 = 𝑌𝐴. = 22,7 % Secadora B: �̂�𝐵 = 𝑌𝐵 . = 19,9 % Secadora C: �̂�𝐶 = 𝑌𝐶 . = 21,8 % e Secadora D: �̂�𝐷 = 𝑌𝐷. = 22,5 % Estimadores dos Tratamentos i : �̂�𝒊 = 𝒀𝒊. − 𝒀.. : Secadora A: �̂�𝐴 = 𝑌𝐴. − 𝑌. . = 22,7 − 21,7 = 1,0% Secadora B: �̂�2 = 𝑌𝐵 . − 𝑌. . = 19,9 − 21,7 = −1,8% Secadora C: �̂�𝐶 = 𝑌𝐶 . − 𝑌. . = 21,8 − 21,7 = 0,1% Secadora D: �̂�𝐷 = 𝑌𝐷 . − 𝑌. . = 22,5 − 21,7 = 0,8% Análise: Analisando-se o desempenho de cada secadora em relação à média geral das % de umidades médias extraídas das amostras de tijolos, verifica-se que a Secadora A retira em média 1,0% de umidade dos seus tijolos; a Secadora B deixa de retirar umidade dos tijolos na faixa de 1,8%; já as Secadoras C e D retiram em média 0,1% e 0,8%, respectivamente. c) Tabela de Análise de Variância para um fator (ANOVA) Para fazer a análise de variância de um experimento inteiramente casualizado é preciso calcular as seguintes quantidades: i) graus de liberdade: * de tratamentos: k -1 => 4 - 1=3 * do total: n -1 => 28 - 1=27 * do resíduo: (n -1) - (k -1) = (n - k) => 27 - 3=24 ii) correção C: 𝐶 = (∑𝑇𝑖) 2 𝑛 → 𝐶 = (158,8+139,3+152,4+157,7)2 28 = (608,2)2 28 ⇒ 𝐶 = 13211 iii) soma de quadrados total: 𝑺𝑸𝑻𝒐𝒕 = (∑𝒀𝒊𝒋 𝟐 ) − 𝑪 𝑺𝑸𝑻𝒐𝒕 = (𝟐𝟐, 𝟕𝟐 + 𝟐𝟒, 𝟐𝟐 + 𝟐𝟏, 𝟓𝟐+. . . . +𝟐𝟐, 𝟏𝟐 + 𝟐𝟐, 𝟗𝟐) − 𝟏𝟑211 𝑺𝑸𝑻𝒐𝒕 = (𝟏3263,12) − 𝟏𝟑211 ⇒ 𝑺𝑸𝑻𝒐𝒕 = 52,12 iv) soma de quadrados de tratamentos: 𝑺𝑸𝑻𝒓 = ∑𝜯𝒊 𝟐 𝒓 − 𝑪 𝑺𝑸𝑻𝒓 = ( 𝟏𝟓𝟖,𝟖𝟐+𝟏𝟑𝟗,𝟑𝟐+𝟏𝟓𝟐,𝟒𝟐+𝟏𝟓𝟕,𝟕𝟐+ 𝟕 ) − 𝟏𝟑211 = ( 𝟗2716,98 𝟕 ) − 𝟏3211=> 𝑺𝑸𝑻𝒓 = 34,28 v) soma de quadrados de resíduos: 𝑺𝑸𝑹 = 𝑺𝑸𝑻𝒐𝒕 − 𝑺𝑸𝑻𝒓 => 𝑺𝑸𝑹 = 52,12 − 34,28 ⇒ 𝑺𝑸𝑹 = 𝟏𝟕, 84 vi) quadrado médio de tratamentos: 𝑸𝑴𝑻𝒓 = 𝑺𝑸𝑻𝒓 𝒌−𝟏 => 𝑸𝑴𝑻𝒓 = 34,28 𝟑 ⇒ 𝑸𝑴𝑻𝒓 = 11,43 vii) quadrado médio de resíduos: 𝑸𝑴𝑹 = 𝑺𝑸𝑹 𝒏−𝒌 => 𝑸𝑴𝑹 = 𝟏𝟕,84 𝟐𝟒 ⇒ 𝑸𝑴𝑹 = 𝟎, 𝟕4 viii) valor de F: 𝑭𝟎 = 𝑸𝑴𝑻𝒓 𝑸𝑴𝑹 => 𝑭𝟎 = 11,43 𝟎,𝟕4 ⇒ 𝑭𝟎 = 15,44 Tabela de análise de variância (ANOVA): FV GL SQ QM F Tratamentos 3 34,28 11,43 15,44 Resíduo 24 17,84 0,74 - TOTAL 27 52,12 - - d) Hipóteses de interesse H0: A=B=C=D= 0 (hipótese de nulidade) versus H1: pelo menos um i é diferente de zero (hipótese alternativa) e) Regra de Decisão Na tabela de Fisher-Snedecor procuramos o F(k-1;n-k;%). Nesta tabela, para 5% de significância, encontramos no eixo horizontal os graus de liberdade dos tratamentos (k-1), ao passo que no eixo vertical os graus de liberdade dos resíduos (n – k). Desta forma encontramos o valor de F(3;24;0,05) = 3,009. ➢ Como F0 = 15,44 > F(3;24;0,05) = 3,009, rejeita-se a hipótese de nulidade H0, ao nível de 5% de significância, ou seja, pelo menos um tratamento i é diferente de zero. Com isto, verifica-se que realmente pelo menos um tratamento (secadora A, B, C ou D) possui estatisticamente média diferente. Porém, falta ainda descobrirmos quais médias são estatisticamente iguais e quais diferem entre si, e isto se consegue fazendo-se uso dos testes de comparações múltiplas. f) Comparações múltiplas entre as quantidades de umidade extraídas dos tijolos pelas diferentes secadoras. Utilizando o teste Tukey, quais são suas conclusões ao nível de 5% de significância? ➢ As estimativas de A B, C e D são 𝑌𝐴. = 22,7, 𝑌𝐵 . = 19,9, 𝑌𝐶 . = 21,8 e 𝑌𝐷 . = 22,5, respectivamente. ➢ Os contrastes (C) do estimador, entre as porcentagens médias de umidade extraídas dos tijolos para as diferentes secadoras são: Secadora A e Secadora B CAB = 𝑌𝐴. -𝑌𝐵 . = 22,7–19,9 = 2,8 Secadora A e Secadora C CAC = 𝑌𝐴. -𝑌𝐶 . = 22,7–21,8 = 0,9 Secadora A e Secadora D CAD = 𝑌𝐴 . -𝑌𝐷. = 22,7–22,5 = 0,2 Secadora B e Secadora C CBC = 𝑌𝐵. -𝑌𝐶 . = 19,9–21,8 = -1,9 Secadora B e Secadora D CBD = 𝑌𝐵. -𝑌𝐷. = 19,9–22,5 = -2,6 Secadora C e Secadora D CCD = 𝑌𝐶 . -𝑌𝐷. = 21,8–22,5 = -0,7 ➢ Hipóteses de Interesse H0: CAB=0; CAC=0; CAD=0; CBC=0; CBD=0; CCD=0 versus H1: O Contraste Cij é diferente de zero O Teste Tukey ➢ Hipótese de interesse H0: i = j versus H1: i j para i j ➢ A estatística de Tukey é a diferença mínima significativa (dms): 𝑑𝑚𝑠 = 𝑞(𝑘; 𝑛−𝑘) ∗ √ 𝑄𝑀𝑅 𝑟 O valor de q(k; n-k) com k graus de liberdade para o tratamento e n - k graus de liberdade para o resíduo é encontrado Tabela 2, ao nível de 5% de significância (anexo). Assim, q(k; n-k) = q(4; 24)=3,90. Pela tabela da ANOVA, temos que QMR=0,74 e o número de repetições é r =7. Assim, o valor da dms será: 𝑑.𝑚. 𝑠. = 3,90 ∗ √ 0,74 7 => dms = 1,27. Para este teste, duas médias são estatisticamente diferentes quando o valor absoluto da diferença entre elas for maior ou igual a dms. Por exemplo, como o contraste CAB = |2,8| > dms =1,27 as médias são estatisticamente diferentes, ou seja rejeito H0. Tabela: Resultado das comparações múltiplas, segundo o teste Tukey: Contrastes Valor dms Decisão com = 5% CAB |2,8| 1,27 Rejeito H0 CAC |0,9| 1,27 Aceito H0 CAD |0,2| 1,27 Aceito H0 CBC |-1,9| 1,27 Rejeito H0 CBD |-2,6| 1,27 Rejeito H0 CCD |-0,7| 1,27 Aceito H0 Abaixo é apresentada uma tabela resumida, onde colocam-se as médias dos tratamentos em ordem decrescente e atribuem-se letras iguais aos tratamentos iguais e letras diferentes aos tratamentos diferentes, a 5% de significância. Secadora Resultado (Tukey) A a D a C a B b Conclusões: Ao nível de 5% de significância, pode-se dizer que as Secadoras A, C e D têm o mesmo desempenhoentre si (letras iguais na tabela), ou seja, a porcentagem média de umidade extraída dos tijolos não difere entre elas. Porém, a Secadora B, em média, extrai menos umidade do que as demais. Exercício: Uma indústria metalúrgica recentemente passou a produzir um tipo especial de peças de aço para atender um novo cliente. Estas peças são produzidas com um aço de baixa liga e após serem usinadas são submetidas ao processo de têmpera em água. Para satisfazer às especificações do novo cliente, o item de controle de dureza, medida no centro das peças temperadas, deve estar na faixa de 32 a 38 Rockwell (HR). O grupo considerou que se fosse utilizado óleo em lugar de água, talvez o processo se tornasse capaz de atender às especificações, já que o óleo é um meio de têmpera mais brando. Com o objetivo de avaliar a veracidade desta hipótese, o grupo decidiu realizar um experimento para comparar a eficácia da água e de dois tipos de óleo mineral como banhos de têmpera para as peças especiais de aço produzidas pela indústria. O experimento consistiu em submeter 9 peças de aço a cada tipo de banho de têmpera (água, óleo A e óleo B), e medir a dureza no centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de identificar o meio de têmpera mais adequado. Tabela Valores da dureza, medida no centro da peça, após a realização da têmpera Observação Banho de têmpera Água Óleo A Óleo B 1 36,7 36,0 35,3 2 38,9 36,4 35,0 3 38,7 35,3 34,3 4 38,8 36,8 35,7 5 37,6 36,9 35,2 6 37,2 37,5 34,2 7 38,8 35,3 36,5 8 38,0 36,0 35,6 9 37,2 35,7 35,5 Realize uma análise de variância e, se necessário, as comparações múltiplas, de forma a responder: há diferença entre os banhos de têmpera? Se há, quais são diferentes? Qual banho de têmpera é mais indicado? 2.3.2 Delineamento em Blocos Casualizados (DBC) Para VIEIRA & HOFFMANN (1989), um pesquisador só deve optar por experimentos inteiramente ao acaso (DIC) quando dispõe de número suficientemente grande de unidades experimentais similares. Como isso dificilmente acontece na prática, é preciso um delineamento que permita comparar adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Este tipo de delineamento considera os princípios de repetição, aleatorização e controle local. É o mais empregado de todos os delineamentos. De acordo com BANZATTO & KRONKA (1992), as principais características deste delineamento são: i) as parcelas são distribuídas em grupos ou blocos (princípio do controle local), de tal forma que elas sejam o mais uniformes possível dentro de cada bloco, mas os blocos poderão diferir bastante uns dos outros; ii) o número de parcelas por bloco deve ser um múltiplo do número de tratamentos (geralmente, esse número é igual ao número de tratamentos); iii) os tratamentos são designados às parcelas de forma casual, sendo essa casualização feita dentro de cada bloco. Exemplo: Considere um esquema que pode ser utilizado, onde tem-se um delineamento em blocos casualizados com 5 níveis (tratamentos A, B, C, D e E) e 4 blocos, resultando num total de 20 parcelas experimentais. Bloco 1 B A D C E Bloco 2 E D A B C Bloco 3 A C D E B Bloco 4 B D C A E Análise de Variância – ANOVA Para analisar este tipo de experimento, vamos considerar que há um único fator de interesse com k níveis e que o experimento para avaliar o efeito deste fator será em “b” blocos. Aqui será demonstrado o estudo de apenas uma observação para cada nível do fator, em cada bloco. Bloco Tratamento (fator) Total T1 T2 T3 ... Tk B1 Y11 Y21 Y31 ... Yk1 B1 B2 Y12 Y22 Y32 ... Yk2 B2 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ Bb Y1b Y2b Y3b ... Ykb Bb Total T1 T2 T3 … Tk T=B Nº de repetições r1 r2 r3 ... rk n=kb Média .1Y .2Y .3Y … .kY ..Y a) Modelo Estatístico (efeito fixo) Considerando que os efeitos têm um comportamento aditivo o modelo estatístico para este experimento será: ijjiij BTY +++= para i=1,2,...,k e j=1,2,...,b, sujeito a: == == b j j k i i BT 11 0 , em que: Yij = variável resposta coletada sob o i-ésimo nível do fator no bloco j; = média global comum a todas as observações = = k i iir N 1 1 ou para experimento balanceado = = k i i k 1 1 ; Ti = efeito do i-ésimo nível do fator, ou seja, efeito tratamento; Bj = efeito do j-ésimo bloco, ou seja, efeito do bloco; ij = componente do erro aleatório associado à observação Yij. As suposições associadas a este modelo são: i) Os erros ij são independentes (aleatorização); ii) Os erros ij possuem variância constante (2 = cte); iii) Os erros ij são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição normal com média zero e variância constante, isto é ij N(0,2). b) Hipóteses de interesse: considerando o caso em que o fator é fixo. b1) Há o efeito do bloco? Se “não há o efeito do bloco”, a análise de variância deve ser refeita sem considerar os blocos. H0: B1 = B2 =...= Bb = 0 (não há o efeito do bloco) vs. H1: Bj 0, para pelo menos um j (há o efeito de pelo menos um bloco) b2) Há o efeito do tratamento? H0:T1 = T2 =...= Tk = 0 (não há o efeito do tratamento) vs. H1: Ti 0, para pelo menos um i (há o efeito de pelo menos tratamento) c) Tabela de Análise de Variância para um fator fixo (ANOVA) Para fazer a análise de variância de um experimento em blocos casualizados é preciso calcular as seguintes medidas: i) os graus de liberdade: * de tratamentos: k -1 * de blocos: b -1 * do total: kb -1 * do resíduo: (kb-1)-(k-1)-(b-1)= (k-1)·(b-1) ii) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor de C é chamado de “correção”: 𝐶 = (∑𝑌𝑖𝑗) 2 𝑘𝑏 ou 𝐶 = (∑𝑇𝑖) 2 𝑘𝑏 iii) a soma de quadrados total: mede a variabilidade total das observações em relação a média geral; 𝑺𝑸𝑻𝒐𝒕 =∑𝒀𝒊𝒋 𝟐 − 𝑪 iv) a soma de quadrados de tratamentos: mede a variabilidade entre as médias dos tratamentos em relação a média geral; 𝑺𝑸𝑻𝒓 = ∑𝜯𝒊 𝟐 𝒃 − 𝑪 v) a soma de quadrados de blocos: mede a variabilidade entre as médias dos blocos em relação a média geral; 𝑺𝑸𝑩 = ∑𝑩𝒋 𝟐 𝒌 − 𝑪 vi) a soma de quadrados de resíduos (é uma medida de homogeneidade interna dos tratamentos): 𝑺𝑸𝑹 = 𝑺𝑸𝑻𝒐𝒕 − 𝑺𝑸𝑻𝒓 − 𝑺𝑸𝑩 vii) o quadrado médio de tratamentos (este será um estimador não viciado da variância populacional 2, se a hipótese de nulidade for verdadeira): 𝑸𝑴𝑻𝒓 = 𝑺𝑸𝑻𝒓 𝒌 − 𝟏 viii) o quadrado médio de blocos: 𝑸𝑴𝑩 = 𝑺𝑸𝑩 𝒃−𝟏 ix) o quadrado médio de resíduos: este é um estimador não viciado para 2; 𝑸𝑴𝑹 = 𝑺𝑸𝑹 (𝒌 − 𝟏)(𝒃 − 𝟏) x) valores de F: o valor de F0 é utilizado para testar a hipótese de efeito dos tratamentos, já F1 é utilizado para testar se era realmente necessário considerar os blocos. 𝑭𝟎 = 𝑸𝑴𝑻𝒓 𝑸𝑴𝑹 𝑭𝟏 = 𝑸𝑴𝑩 𝑸𝑴𝑹 A Tabela de Análise de Variância – ANOVA fica então da seguinte forma: Fonte de Variação Graus de Liberdade Soma Quadrado Quadrado Médio F Tratamento k–1 SQTr QMTr Fo Bloco b–1 SQB QMB F1 Resíduo (k-1)(b-1) SQR QMR TOTAL n–1 SQTot d) Regra de Decisão Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabela 1) procurando o valor de F[b-1; (k-1)(b-1);%] (para bloco) e F[k-1; (k-1)(b-1);%] (para tratamento), em que (b-1) e (k-1) são graus de liberdade do numerador e (k-1)(b-1) são graus de liberdade para o resíduo (denominador). i) Efeito do Bloco (F1): Se F1 F[b-1; (k-1)(b-1);%], rejeita-se a hipótese H0 ao nível de % de significância, ou seja, há o efeito do Bloco. ii) Efeito do Tratamento (F0): Se F0 F[k-1; (k-1)(b-1);%], rejeita-se a hipótese de nulidade H0 ao nível de % de significância, consequentemente, pelo menos um Tratamento Ti é diferente de zero.f) Comparações múltiplas Se o fator em um experimento aleatório em blocos completos é fixo e a ANOVA indica que existe uma diferença significativa entre as médias dos níveis do fator (tratamentos), então deve-se realizar as comparações múltiplas para detectar e localizar as diferenças detectadas no teste F. Os testes T, Tukey e Dunnett podem ser utilizados, considerando r = b (uma repetição) e os graus de liberdade do resíduo (k-1)(b-1). Exemplo: Um pesquisador deseja comparar o tempo de secagem de quatro diferentes composições de um polímero (A, B, C e D), os quais foram deixados em cinco ambientes distintos (I, II, III, IV e V). Foi medido o tempo de secagem (horas) de placas de 1 m2 e os dados são apresentados abaixo. Ambiente (Bloco) Composição (Tratamento) Total A B C D I 34 26 37 23 120 II 26 37 45 28 136 III 33 42 39 30 144 IV 36 34 41 37 148 V 31 36 53 32 152 Total 160 175 215 150 700 Média 32 35 43 30 35 Quais são as conclusões, a 5% de significância? a) Identificação do experimento e Modelo; * Variável de interesse: Tempo de secagem (horas); * Unidade Experimental: Placa de 1 m2; * Fator em estudo: Composição do polímero; * Níveis do Fator: 4 (Composições A, B, C, D); * Blocos: 5 (Ambientes I, II, III, IV, V). Quando temos um experimento em Blocos completamente ao acaso (balanceado), com um fator fixo, temos interesse em verificar a influência dos k níveis desse fator (tratamento) nos diferentes Blocos, para a variável resposta Y em estudo. Assim um modelo estatístico associado a este tipo de experimento é dado pela forma: ijjiij BTY +++= b) Hipóteses de Interesse b1) Há o efeito do bloco? b2) Há o efeito do tratamento? c) Tabela de Análise de variância (ANOVA) Para fazer a análise de variância de um experimento em blocos casualizados é preciso calcular as seguintes quantidades: i) os graus de liberdade: * de tratamentos: k-1 => 4-1=3 * de blocos: b-1 => 5-1=4 * do total: kb-1 => 4*5-1=20-1=19 * do resíduo: (kb-1)-(k-1)-(b-1) = (k-1)*(b-1) => (4-1)*(5-1)=12 ii) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor de C é chamado de “correção”: ( ) kb Y C ij 2 = ou ( ) kb T C i 2 = iii) a soma de quadrados total: CYSQTot 2ij −= ( ) 950SQTot450023237...332634SQTot 22222 =−+++++= iv) a soma de quadrados de tratamentos: CSQTr 2 − = b i 490SQTr 24500 5 150215175160 SQTr 2222 =− +++ = v) a soma de quadrados de blocos : CSQB 2 −= k B j 160SQB45002 4 152148144136120 SQB 22222 =− ++++ = vi) a soma de quadrados de resíduos : SQB-SQTr-SQTotSQR = 300SQR160490509SQR =−−= vii) o quadrado médio de tratamentos: 1k SQTr QMTr − = → 33,163QMTr 14 490 QMTr = − = viii) o quadrado médio de blocos: 1b SQB QMB − = → 40QMB 15 160 QMB = − = ix) o quadrado médio de resíduos: 1)-1)(b-(k SQR QMR = → 25QMR 4*3 300 1)-(5*1)-(4 300 QMR === x) valores de F: 53,6F 25 163,33 QMR QMTr F 00 === 601 0025 0040 11 ,F , , QMR QMB F === A Tabela de Análise de variância – ANOVA – fica então da seguinte forma: FV GL SQ QM F Tratamento 3 490 163,33 6,53 Bloco 4 160 40,00 1,60 Resíduo 12 300 25,00 - TOTAL 19 950 - - d) Regra de Decisão Efeito do bloco (F1): Na tabela de Fisher-Snedecor encontramos no eixo horizontal os graus de liberdade do bloco (b-1), ao passo que no eixo vertical os graus de liberdade do resíduo (k-1)·(b-1). Desta forma encontramos o valor de F(4;12;0,05) = 3,259. Como F1=1,60 < F(4;12;0,05) = 3,259, conclui-se por não rejeitar a hipótese nula (não existe o efeito do bloco). Neste caso, devemos refazer a tabela da ANOVA, desconsiderando os blocos, ou seja, o delineamento passa a ser um DIC. Tabela de Análise de Variância (ANOVA), sem blocos: Fonte de Variação Graus de Liberdade Soma Quadrado Quadrado Médio F Tratamento 3 490 163,33 5,68 Resíduo 16 460 28,75 TOTAL 19 950 Grau de liberdade do resíduo: n-k = 20 – 4 = 16 460490-950SQTr-SQTotSQR === 75,28 16 460 k-n SQR QMR === 68,5F 28,75 163,33 QMR QMTr F 00 === Efeito do Tratamento (F0): Na tabela de Fisher-Snedecor encontramos no eixo horizontal os graus de liberdade do bloco (k-1) e no eixo vertical os graus de liberdade do resíduo (n - k). Desta forma encontramos o valor de F(3;16;0,05) = 3,239. Como F0=5,68 > F(3;16;0,05) = 3,239, rejeita-se a hipótese de nulidade H0 ao nível de 5% de significância, ou seja, pelo menos um tratamento i é diferente de zero. Com isto, verifica-se que realmente pelo menos um tratamento (A, B, C ou D) possui, estatisticamente, média diferente dos demais. Basta agora descobrirmos quais médias são estatisticamente iguais e quais diferem entre si. Isto se consegue fazendo uso dos testes de comparações múltiplas. e) Estimativas dos parâmetros Média geral: ( ) 354/30433532..ˆ =+++==Y horas. A média por tratamento .iY é: Tratamento A 32.ˆ 11 ==Y horas Tratamento B 35.ˆ 22 ==Y horas Tratamento C 43.ˆ 33 ==Y horas Tratamento D 30.ˆ 44 ==Y horas Os estimadores dos Tratamentos i serão ...ˆ YYT ii −= : Tratamento A 33532...ˆ 11 −=−=−= YYT horas Tratamento B 03535...ˆ 22 =−=−= YYT hora Tratamento C 83543...ˆ 33 =−=−= YYT horas Tratamento D 53530...ˆ 44 −=−=−= YYT horas Analisando-se o desempenho das diferentes composições do polímero (tratamentos), percebe- se que as composições A e B apresentaram um tempo médio inferior à média geral dos dados. A composição C apresentou um acréscimo no tempo na ordem de 8 horas e a composição B com tempo médio igual ao geral. f) Faremos a comparação múltipla entre os tratamentos, utilizando o teste de Tukey. Quais são suas conclusões ao nível de 5% de significância? As estimativas de 1 2 3 e 4 são respectivamente, .1Y = 32 (A) .2Y = 35 (B) .3Y = 43 (C) .4Y = 30 (D) Os contrastes(C) do estimador entre os tratamentos são: A e B CAB = .1Y - .2Y = 32-35 = -3 A e C CAC = .1Y - .3Y = 32-43 = -11 A e D CAD = .1Y - .4Y = 32-30 = 2 B e C CBC = .2Y - .3Y = 35-43 = -8 B e D CBD = .2Y - .4Y = 35-30 = 5 C e D CCD = .3Y - .4Y = 43-30 = 13 Hipóteses de Interesse H0: CAB=0; CAC=0; CAD=0; CBC=0; CBD=0; CCD=0 (médias iguais) Versus H1: O Contraste(C) é diferente de zero (médias diferentes) O Teste de Tukey: Hipótese de interesse H0: i = j Versus H1: i j para ij O valor de q[k;(n-k);%] com k graus de liberdade para o tratamento e (n-k) graus de liberdade para o resíduo é encontrado na Tabela 2, ao nível de 5% de significância. Caso existisse o efeito do bloco no experimento, deveríamos considerar (k-1)(b-1) como grau de liberdade do resíduo. Neste exemplo, temos: q[k;(n-k);%] = q[4;(20-4);5%]= q[4;16;5%]=4,05; QMR=28,75 (ANOVA) e r=b=5 Assim, o valor da d.m.s será: 7,9d.m.s. 5 28,75 05,4d.m.s. == . Assim, para o teste de Tukey, duas médias serão estatisticamente diferentes quando o valor absoluto da diferença entre elas for maior ou igual a d.m.s. Por exemplo, como para o contraste CAB=|-3,0| d.m.s=9,7 as médias são estatisticamente iguais, ou seja, aceito H0. Já para o contraste CAc=11,0 d.m.s=9,7 as médias são estatisticamente diferentes, ou seja, rejeito H0. Resumo do teste Tukey Contrastes Valor absoluto(C) d.m.s Decisão com = 5% CAB |-3| Aceito H0 (iguais) CAC |-11| Rejeito H0(diferente) CAD |2| 9,7 Aceito H0 (iguais) CBC |-8| Aceito H0 (iguais) CBD |5| Aceito H0 (iguais) CCD |13| Rejeito H0 (diferente) Tabela de comparações de médias, com = 5% Médias Tukey C 43 a B 35 a A 32 ab D 30 b Nota: Letras iguais correspondem a médias iguais ao nível de 5% de significância pelo teste de Tukey. Exercício: Um experimento foi feito para determinaro efeito de quatro produtos químicos diferentes sobre a resistência de um tecido. Foram utilizados quatro tipos diferentes de tecidos e devido a esta diferença, o tipo de tecido foi considerado como bloco. Os dados estão a seguir. Produto químico Bloco Total 1 2 3 4 A 1,3 1,6 0,5 1,2 B 2,2 2,4 0,4 2,0 C 1,8 1,7 0,6 1,5 D 3,9 4,4 2,0 4,1 Total Considerando 5% de significância, proceda a análise de variância e, se necessário, as comparações múltiplas. Tire conclusões. 2.3.3 Delineamento em blocos casualizados com repetições (DBCr) Este tipo de delineamento é utilizado quando temos mais de uma repetição de cada tratamento dentro de cada bloco e, portanto, permite o estudo de interação entre tratamentos e blocos. Caso haja interação entre tratamentos e blocos, o pesquisador deverá tomar alguns cuidados para não chegar a conclusões equivocadas. Quando existe interação, os tratamentos não têm o mesmo efeito em todos os blocos, ou seja, existe diferença entre médias de tratamentos, mas a magnitude da diferença depende do bloco. Vamos considerar um exemplo: Um psicólogo quer comparar o “grau de aceitação” de dois tipos de “terapia ocupacional” A e B, entre adultos e crianças. Definiu então que as terapias ocupacionais (A e B) seriam os tratamentos ao passo que a faixa de idade (adultos e crianças) os blocos. 1) Haverá interação tratamentos versus blocos se: i) O tratamento A for mais bem aceito por adultos e o tratamento B mais bem aceito por crianças, conforme figura abaixo (esquerda): ii) O tratamento A for mais bem aceito por adultos, mas A e B forem igualmente bem aceitos por crianças, conforme figura abaixo (direita): 3 4 5 6 7 8 A B N o ta s Tratamentos crianças adultos 3 4 5 6 7 8 9 A B N o ta s Tratamentos crianças adultos Não haverá interação tratamentos versus blocos se: os tratamentos tiverem o mesmo efeito em todos os blocos, conforme abaixo: Análise de Variância – ANOVA Para analisar este tipo de experimento, vamos considerar que há um único fator de interesse com “k” níveis e que o experimento para avaliar o efeito deste fator será em “b” blocos. Aqui será apresentado o estudo de r repetições para cada nível do fator, em cada bloco. Blocos Tratamentos (fator) Total T1 T2 T3 ... Tk B1 Y111 Y211 Y311 ... Yk11 B1 Y112 Y212 Y312 ... Yk12 ⋮ ⋮ ⋮ ... ⋮ B2 Y121 Y221 Y321 ... Yk21 B2 Y122 Y222 Y322 ... Yk22 ⋮ ⋮ ⋮ ... ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ Bb Y1b1 Y2b1 Y3b1 ... Ykb1 Bb Y1b2 Y2b2 Y3b2 ... Ykb2 ⋮ ⋮ ⋮ ... ⋮ Total T1 T2 T3 … Tk T=B Nº de repetições b*r1 b*r2 b*r3 ... b*rk n=k*b*r Média .1Y .2Y .3Y … .kY ..Y a) Modelo Estatístico (efeito fixo) Considerando que haja interação tratamento versus blocos, o modelo estatístico para este experimento será: ijlijjiijl TBBTY ++++= , para i=1,..., k, j=1,..., b e l=1,..., r, sujeito a: == == b j j k i i BT 11 0, em que: Yijl : variável resposta coletada sob o i-ésimo nível do fator no bloco j; : média global comum a todas as observações; Ti : efeito do i-ésimo nível do fator, ou seja, efeito tratamento; Bj : efeito do j-ésimo bloco, ou seja, efeito do bloco; TBij : efeito da interação entre tratamentos e blocos; ijl : componente do erro aleatório associado à observação Yijl. 3 4 5 6 7 8 9 10 A B N o ta s Tratamentos crianças adultos As suposições associadas a este modelo são: i) Os erros ijl são independentes (aleatorização); ii) Os erros ijl possuem variância constante (2 = cte); iii) Os erros ijl são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição normal com média zero e variância constante, isto é ijl N (0,2). Se não há interação tratamentos versus blocos, o modelo é aditivo, conforme o discutido anteriormente. b) Hipóteses de Interesse b1) Há o efeito da interação? Se “não há o efeito da interação”, a análise de variância se resume a de um delineamento simples. H0: TB11 = TB12 =...= TBkb = 0 (não há o efeito da interação) vs. H1: TBij 0, para pelo menos um ij (há o efeito de pelo menos uma interação) b2) Há o efeito do bloco? Se “não há o efeito do bloco”, a análise de variância deve ser refeita sem considerar os blocos. H0: B1 = B2 =...= Bb = 0 (não há o efeito do bloco) vs. H1: Bj 0, para pelo menos um j (há o efeito de pelo menos um bloco) b3) Há o efeito do tratamento? H0:T1 = T2 =...= Tk = 0 (não há o efeito do tratamento) vs. H1: Ti 0, para pelo menos um i (há o efeito de pelo menos tratamento) c) Tabela de Análise de Variância para um fator fixo (ANOVA) Para fazer a análise de variância de um experimento em blocos casualizados com repetições é preciso calcular as seguintes informações: i) os graus de liberdade: * de tratamentos: k-1; * de blocos: b-1; * da interação: (k-1)*(b-1); * do resíduo: k*b*(r-1); * do total: n-1. ii) o valor da “correção” C: ( ) n Y C 2 ijl = ou ( ) n T C 2 i = iii) a soma de quadrados total : CYSQTot 2ijl −= iv) a soma de quadrados de tratamentos: C * SQTr 2 − = rb i v) a soma de quadrados de blocos: C * SQB 2 −= rk B j vi) a soma de quadrados da interação (tratamento versus blocos): SQB-SQTr-C-SQI 2 r I = vii) a soma de quadrados de resíduos: SQI-SQB-SQTr-SQTotSQR = viii) o quadrado médio de tratamentos: 1k SQTr QMTr − = ix) o quadrado médio de blocos: 1b SQB QMB − = x) o quadrado médio da interação: 1)-(b*1)-(k SQI QMI = xi) o quadrado médio de resíduos: 1)-(r*b*k SQR QMR = xii) os valores de F: QMR QMTr F0 = QMR QMB F1 = QMR QMI F2 = A Tabela de Análise de Variância – ANOVA fica então da seguinte forma: Fonte de Variação (FV) Graus de Liberdade (GL) Soma de Quadrado (SQ) Quadrado Médio (QM) F Tratamentos k–1 SQTr QMTr F0 Bloco b-1 SQB QMB F1 Interação (TxB) (k-1)(b-1) SQI QMI F2 Resíduos k*b*(r-1) SQR QMR - TOTAL n–1 SQTot - - d) Regra de Decisão Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabelas 1 e 2, respectivamente para níveis de significância de 5 e 1%) procurando os valores tabelados de Ftab utilizando-se os GL da ANOVA de cada fonte de variação na coluna da tabela e os GL do resíduo na linha da tabela. Inicialmente precisamos verificar se a interação é ou não significativa, vejamos: ➢ Se F2 F{[(k-1)(b-1)];[k*b*(r-1)];%}, rejeita-se a hipótese de nulidade H0 a nível de % de significância, consequentemente, a interação entre tratamentos e blocos é significativa, portanto, o comportamento dos tratamentos depende do bloco. Caso contrário, a interação não é significativa e, portanto, os resultados dos tratamentos não dependem dos blocos e os valores de Fo e F1 podem ser interpretados normalmente. ➢ Se F1 F{b-1;[k*b*(r-1)];%}, rejeita-se a hipótese de nulidade H0 a nível de % de significância, consequentemente, houve diferença significativa entre os blocos, caso contrário, os blocos não diferem entre si. ➢ Se Fo F{k-1;[k*b*(r-1)];%}, rejeita-se a hipótese de nulidade H0 a nível de % de significância, consequentemente, pelo menos um Tratamento Ti é diferente de zero. Caso contrário, os tratamentos não diferem entre si. e) Comparações múltiplas Se, em um experimento aleatório de efeito fixo, em blocos ao acaso e com repetições, a ANOVA indicar que a interação é significativa, as médias dos tratamentos devem ser comparadas dentro de cada bloco. Caso contrário, procede-se à comparação de médias da forma tradicional, ou seja, verifica-se se existe diferença significativa entre as médias dos níveis do fator (tratamentos), através dos testes de comparações múltiplas T, Tukey e Dunnett, por exemplo. É importante ressaltar que se a interação não for significativa, ou seja F2 < Ftab, a ANOVA apresentadaacima, deverá ser organizada de tal forma que os resultados dos graus de liberdade e da soma quadrada da interação deverão ser somados aos graus de liberdade do resíduo e soma quadrada do resíduo, mudando assim, os valores de F0 e F1, que deverão novamente ser determinados. Assim sendo, caso haja diferença significativa entre os tratamentos (F0 Ftab), procede-se as comparações múltiplas da forma tradicional, ou seja, faz-se a comparação das médias gerais de cada tratamento, independente do bloco. Exemplo: Um professor conduziu um experimento para comparar a eficiência de quatro fontes de informação: jornais (JO), televisão (TV), revistas (RE) e rádio (RA). Participaram desse experimento 24 alunos. Como os alunos eram de idades diferentes, o professor separou os alunos em dois blocos, de acordo com a faixa de idade (jovens e adultos). Depois sorteou, dentro de cada bloco, uma fonte de informação para cada aluno. Os alunos então se submeteram ao experimento, isto é, tomaram conhecimento sobre determinado assunto apenas pela fonte de informação que lhes havia sido sorteada. Depois, todos fizeram o mesmo teste de conhecimento, obtendo-se as notas abaixo: Desempenho, em notas, dos alunos para cada fonte de informação e faixa de idade Blocos Tratamentos TOTAL JO TV RE RA 65 56 58 38 I 69 49 65 30 648 73 54 57 34 72 73 76 71 II 79 77 69 65 864 80 69 71 62 TOTAL 438 378 396 300 1512 a) Identificação do experimento e Modelo; * Variável de Interesse: Eficiência das fontes de informação; * Unidade Experimental: Alunos; * Fator em estudo: Fontes de informação; * Níveis do Fator: 4 (jornal (JO), televisão (TV), revista (RE), rádio (RA)); * Blocos: 2 blocos: I: jovens; II: adultos. Quando temos um experimento em blocos casualizados com repetições (balanceado), com um fator fixo, temos interesse em verificar a influência dos k níveis desse fator (tratamento) nos diferentes blocos para a variável resposta Y em estudo. Assim, os seguintes modelos estatísticos associados a este tipo de experimento podem ocorrer, respectivamente, caso haja interação ou não haja interação: ijlijjiijl TBBTY ++++= ou ijljiijl BTY +++= . Para termos uma indicação sobre a existência ou não de interação, abaixo apresentam-se a tabela e o gráfico das médias dos tratamentos dentro de cada bloco. Médias dos tratamentos dentro de cada bloco Blocos Tratamentos JO TV RE RA I 69 53 60 34 II 77 73 72 66 Gráfico das médias dos tratamentos dentro dos blocos. Como não houve paralelismo entre os comportamentos dos tratamentos considerando os dois blocos, há indícios de que haja interação entre tratamentos e blocos. b) Hipóteses de Interesse b1) Há o efeito da interação? b2) Há o efeito do bloco? b3) Há o efeito do tratamento? c) Tabela de Análise de Variância para um fator fixo (ANOVA) Para fazer a análise de variância de um experimento em blocos casualizado é preciso calcular as seguintes informações: i) os graus de liberdade: * de tratamentos: k-1 = 4-1=3 * de blocos: b-1= 2-1=1 * da interação: (k-1)*(b-1) = (4-1)*(2- 1)=3*1=3 * do resíduo: k*b*(r-1) = 4*2*(3-1)=16 * do total: n-1 = 24-1=23 30 35 40 45 50 55 60 65 70 75 80 JO TE RE RA N o ta s Tratamentos I II ii) o valor da “correção”C: ( ) ( ) 95256 24 1512 n T C 22 i === C iii) a soma de quadrados total: CYSQTot 2ijl −= ( ) 525696265...6965SQTot 2222 −++++= 4382SQTot5256999638SQTot =−= iv) a soma de quadrados de tratamentos: C * SQTr 2 − = rb i 52569 3*2 300396378438 SQTr 2222 − ++++ = => 1668SQTr5256996924SQTr =−= v) a soma de quadrados de blocos: C * SQB 2 −= rk B j 1944SQB52569 3*4 864648 SQB 22 =− + = vi) a soma de quadrados da interação (tratamento versus blocos): SQB-SQTr-C-SQI 2 r I = 1944-1668-95256- 3 198102216180219159231207 SQI 22222222 +++++++ = 50498868-99372 ==SQI vii) a soma de quadrados de resíduos: SQI-SQB-SQTr-SQTotSQR = 266SQR504-1944-1668-3824SQR == viii) o quadrado médio de tratamentos: 1k SQTr QMTr − = => 556 14 1668 QMTr = − = ix) o quadrado médio de blocos: 1b SQB QMB − = => 1944 12 1944 QMB = − = x) o quadrado médio da interação: 1)-1)(b-(k SQI QMI = => ( )( ) 168 1214 504 QMI = −− = xi) o quadrado médio de resíduos: 1)-(r*b*k SQR QMR = => ( ) 625,16 13*2*4 266 QMR = − = xii) os valores de F: 44,33 625,16 556 QMR QMTr F0 === 93,116 625,16 1944 QMR QMB F1 === 11,10 625,16 168 QMR QMI F2 === A tabela de Análise de Variância – ANOVA fica então da seguinte forma: Fonte de Variação (FV) Graus de Liberdade(GL) Soma Quadrado SQ) Quadrado Médio (QM) F Tratamentos 3 1668 556,000 33,44 Bloco 1 1944 1944,000 116,93 Interação (TxB) 3 504 168,000 10,11 Resíduos 16 266 16,625 – TOTAL 23 4382 – – d) Regra de Decisão ➢ Como F2=10,11 > F[3;16;5%] = 3,24, rejeita-se a hipótese de nulidade H0 ao nível de 5% de significância, ou seja, há interação entre tratamentos (fontes de informação) e os blocos (faixa de idade), portanto, o comportamento dos tratamentos depende do bloco. ➢ Como F1=116,93 > F[1;16;5%]=4,49, rejeita-se a hipótese de nulidade H0 ao nível de 5% de significância, ou seja, houve diferença significativa entre os blocos (faixa de idade), portanto, o professor tinha razão quando suspeitou da diferença de resultados em função da faixa de idade dos alunos. ➢ Como Fo=33,44 > F[3;16;5%]=3,24, rejeita-se a hipótese de nulidade H0 ao nível de 5% de significância, ou seja, pelo menos um tratamento (fonte de informação) apresenta resultado estatisticamente diferente dos demais. Entretanto, como a interação foi significativa, devemos realizar o desdobramento das médias, ou seja, estudar o comportamento de cada tratamento (fontes de informação) dentro de cada bloco (faixa de idade). Para o caso em estudo, verificou-se que houve interação entre tratamentos e blocos, assim, as comparações de médias (contrastes) serão realizadas entre os tratamentos dentro de cada bloco. Médias dos tratamentos dentro de cada bloco Blocos Tratamentos JO TV RE RA I (jovens) 69 53 60 34 II (velhos) 77 73 72 66 Quais são suas conclusões ao nível de 5% de significância? Usando o teste de Tukey: r QMR qsmd k *... %]1),-(r*b*k,[ = O valor na tabela de Tukey é 05,4%],516,4[ =q . O QMR=16,625 (ANOVA) e r=3 (quando se trata de experimentos em blocos com repetições e há interação, utiliza-se o número de repetições de cada tratamento dentro de cada bloco, caso contrário o número total de repetições de cada tratamento, independente do bloco). Assim, o valor da d.m.s será: 53,9... 3 625,16 *05,4... == smdsmd . Assim, para o teste de Tukey, duas médias serão estatisticamente diferentes quando o valor absoluto da diferença entre elas (|C|) for maior ou igual a d.m.s. ➢ Os contrastes(C) entre os tratamentos são apresentados na tabela abaixo: Contrastes(C) Bloco I Bloco II CJO-TV |69-53|=16 () |77-73|=4 (=) CJO-RE |69-60|=9 (=) |77-72|=5 (=) CJO-RA |69-34|=35 () |77-66|=11 () CTV-RE |53-60|=7 (=) |73-72|=1 (=) CTV-RA |53-34|=19 () |73-66|=7 (=) CRE-RA |60-34|=26 () |72-66|=6 (=) Por exemplo, como dentro do Bloco I o contraste CJO-TV=16 > d.m.s=9,53, diz-se que as médias são estatisticamente diferentes entre si. Quadro de comparações de médias segundo os tratamentos e blocos Médias Bloco I (jovens) Bloco II (adultos) jornal 69 a 77 a televisão 53 b 73 a b revista 60 a b 72 a b rádio 34 c 66 b Nota: Letras iguais correspondem à médias iguais ao nível de 5% de significância por t de Student. Com base nisto, verifica-se que: a) Para os Jovens (bloco I): i) a Televisão e a Revista deramresultados estatisticamente iguais; ii) o Jornal foi estatisticamente melhor que as outras 3 fontes de informação; iii) o Rádio foi o que apresentou resultados estatisticamente piores quando comparados com as outras 3 fontes de informação; b) Para os Adultos (bloco II): i) as fontes de informação Jornal, Televisão e Revistas apresentaram entre si resultados estatisticamente iguais; ii) as fontes de informação Televisão, Revistas e Rádio também apresentaram entre si resultados estatisticamente iguais; iii) observou-se que somente o Jornal apresentou resultado estatisticamente diferente e melhor que o Rádio. TABELA 1 Limites unilaterais de F ao nível de 5% de significância n1: número de graus de liberdade do numerador n2: número de graus de liberdade do denominador n2/n1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 20 40 60 120 240 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 248.0 251.1 252.2 253.3 253.8 2 18.51 19.00 19.16 19.25 19.29 19.329 19.35 19.37 19.38 19.39 19.40 19.41 19.42 19.42 19.43 19.44 19.47 19.48 19.49 19.49 3 10.128 9.552 9.277 9.117 9.013 8.941 8.887 8.845 8.812 8.785 8.763 8.745 8.729 8.715 8.703 8.660 8.594 8.572 8.549 8.538 4 7.709 6.944 6.591 6.388 6.256 6.163 6.094 6.041 5.999 5.964 5.936 5.912 5.891 5.873 5.858 5.803 5.717 5.688 5.658 5.643 5 6.608 5.786 5.409 5.192 5.050 4.950 4.876 4.818 4.772 4.735 4.704 4.678 4.655 4.636 4.619 4.558 4.464 4.431 4.398 4.382 6 5.987 5.143 4.757 4.534 4.387 4.284 4.207 4.147 4.099 4.060 4.027 4.000 3.976 3.956 3.938 3.874 3.774 3.740 3.705 3.687 7 5.591 4.737 4.347 4.120 3.972 3.866 3.787 3.726 3.677 3.637 3.603 3.575 3.550 3.529 3.511 3.445 3.340 3.304 3.267 3.249 8 5.318 4.459 4.066 3.838 3.688 3.581 3.500 3.438 3.388 3.347 3.313 3.284 3.259 3.237 3.218 3.150 3.043 3.005 2.967 2.947 9 5.117 4.256 3.863 3.633 3.482 3.374 3.293 3.230 3.179 3.137 3.102 3.073 3.048 3.025 3.006 2.936 2.826 2.787 2.748 2.727 10 4.965 4.103 3.708 3.478 3.326 3.217 3.135 3.072 3.020 2.978 2.943 2.913 2.887 2.865 2.845 2.774 2.661 2.621 2.580 2.559 11 4.844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2.896 2.854 2.818 2.788 2.761 2.739 2.719 2.646 2.531 2.490 2.448 2.426 12 4.747 3.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753 2.717 2.687 2.660 2.637 2.617 2.544 2.426 2.384 2.341 2.319 13 4.667 3.806 3.411 3.179 3.025 2.915 2.832 2.767 2.714 2.671 2.635 2.604 2.577 2.554 2.533 2.459 2.339 2.297 2.252 2.230 14 4.600 3.739 3.344 3.112 2.958 2.848 2.764 2.699 2.646 2.602 2.565 2.534 2.507 2.484 2.463 2.388 2.266 2.223 2.178 2.155 15 4.543 3.682 3.287 3.056 2.901 2.790 2.707 2.641 2.588 2.544 2.507 2.475 2.448 2.424 2.403 2.328 2.204 2.160 2.114 2.090 16 4.494 3.634 3.239 3.007 2.852 2.741 2.657 2.591 2.538 2.494 2.456 2.425 2.397 2.373 2.352 2.276 2.151 2.106 2.059 2.035 17 4.451 3.592 3.197 2.965 2.810 2.699 2.614 2.548 2.494 2.450 2.413 2.381 2.353 2.329 2.308 2.230 2.104 2.058 2.011 1.986 18 4.414 3.555 3.160 2.928 2.773 2.661 2.577 2.510 2.456 2.412 2.374 2.342 2.314 2.290 2.269 2.191 2.063 2.017 1.968 1.943 19 4.381 3.522 3.127 2.895 2.740 2.628 2.544 2.477 2.423 2.378 2.340 2.308 2.280 2.256 2.234 2.155 2.026 1.980 1.930 1.905 20 4.351 3.493 3.098 2.866 2.711 2.599 2.514 2.447 2.393 2.348 2.310 2.278 2.250 2.225 2.203 2.124 1.994 1.946 1.896 1.870 21 4.325 3.467 3.072 2.840 2.685 2.573 2.488 2.420 2.366 2.321 2.283 2.250 2.222 2.197 2.176 2.096 1.965 1.916 1.866 1.839 22 4.301 3.443 3.049 2.817 2.661 2.549 2.464 2.397 2.342 2.297 2.259 2.226 2.198 2.173 2.151 2.071 1.938 1.889 1.838 1.811 23 4.279 3.422 3.028 2.796 2.640 2.528 2.442 2.375 2.320 2.275 2.236 2.204 2.175 2.150 2.128 2.048 1.914 1.865 1.813 1.785 24 4.260 3.403 3.009 2.776 2.621 2.508 2.423 2.355 2.300 2.255 2.216 2.183 2.155 2.130 2.108 2.027 1.892 1.842 1.790 1.762 25 4.242 3.385 2.991 2.759 2.603 2.490 2.405 2.337 2.282 2.236 2.198 2.165 2.136 2.111 2.089 2.007 1.872 1.822 1.768 1.740 26 4.225 3.369 2.975 2.743 2.587 2.474 2.388 2.321 2.265 2.220 2.181 2.148 2.119 2.094 2.072 1.990 1.853 1.803 1.749 1.720 27 4.210 3.354 2.960 2.728 2.572 2.459 2.373 2.305 2.250 2.204 2.166 2.132 2.103 2.078 2.056 1.974 1.836 1.785 1.731 1.702 28 4.196 3.340 2.947 2.714 2.558 2.445 2.359 2.291 2.236 2.190 2.151 2.118 2.089 2.064 2.041 1.959 1.820 1.769 1.714 1.685 29 4.183 3.328 2.934 2.701 2.545 2.432 2.346 2.278 2.223 2.177 2.138 2.104 2.075 2.050 2.027 1.945 1.806 1.754 1.698 1.669 30 4.171 3.316 2.922 2.690 2.534 2.421 2.334 2.266 2.211 2.165 2.126 2.092 2.063 2.037 2.015 1.932 1.792 1.740 1.683 1.654 40 4.085 3.232 2.839 2.606 2.449 2.336 2.249 2.180 2.124 2.077 2.038 2.003 1.974 1.948 1.924 1.839 1.693 1.637 1.577 1.544 50 4.034 3.183 2.790 2.557 2.400 2.286 2.199 2.130 2.073 2.026 1.986 1.952 1.921 1.895 1.871 1.784 1.634 1.576 1.511 1.476 60 4.001 3.150 2.758 2.525 2.368 2.254 2.167 2.097 2.040 1.993 1.952 1.917 1.887 1.860 1.836 1.748 1.594 1.534 1.467 1.430 80 3.960 3.111 2.719 2.486 2.329 2.214 2.126 2.056 1.999 1.951 1.910 1.875 1.845 1.817 1.793 1.703 1.545 1.482 1.411 1.370 100 3.936 3.087 2.696 2.463 2.305 2.191 2.103 2.032 1.975 1.927 1.886 1.850 1.819 1.792 1.768 1.676 1.515 1.450 1.376 1.333 120 3.920 3.072 2.680 2.447 2.290 2.175 2.087 2.016 1.959 1.910 1.869 1.834 1.803 1.775 1.750 1.659 1.495 1.429 1.352 1.307 240 3.881 3.033 2.642 2.409 2.252 2.136 2.048 1.977 1.919 1.870 1.829 1.793 1.761 1.733 1.708 1.614 1.445 1.375 1.290 1.237 TABELA 2 Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nível de 5% de probabilidade K: número de tratamentos n': graus de liberdade do resíduo n' \ k 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07 50,59 51,96 53,19 54,32 55,36 56,32 57,21 58,04 58,82 59,56 2 6,09 8,33 9,80 10,88 11,73 12,44 13,03 13,54 13,99 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,37 16,57 16,77 3 4,50 5,91 6,83 7,50 8,04 8,48 8,85 9,18 9,46 9,72 9,95 10,16 10,35 10,52 10,69 10,84 10,98 11,11 11,24 4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,03 8,21 8,37 8,52 8,66 8,79 8,91 9,03 9,13 9,23 5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 7,00 7,17 7,32 7,47 7,60 7,72 7,83 7,93 8,03 8,12 8,21 6 3,46 4,34 4,90 5,31 5,63 5,90 6,12 6,32 6,49 6,65 6,79 6,92 7,03 7,14 7,24 7,34 7,43 7,51 7,59 7 3,34 4,17 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,30 6,43 6,55 6,66 6,76 6,85 6,94 7,02 7,10 7,17 8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,05 6,18 6,29 6,39 6,48 6,57 6,65 6,73 6,80 6,87 9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,87 5,98 6,09 6,19 6,28 6,36 6,44 6,51 6,58 6,64 10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60 5,72 5,83 5,94 6,03 6,11 6,19 6,27 6,34 6,41 6,47 11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,61 5,71 5,81 5,90 5,98 6,06 6,13 6,20 6,27 6,33 12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40 5,51 5,62 5,71 5,80 5,88 5,95 6,02 6,09 6,15 6,21 13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32 5,43 5,53 5,63 5,71 5,79 5,86 5,93 6,00 6,06 6,11 14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,36 5,46 5,55 5,64 5,71 5,79 5,85 5,92 5,97 6,03 15 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5,20 5,31 5,40 5,49 5,57 5,65 5,72 5,79 5,85 5,90 5,96 16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,26 5,35 5,44 5,52 5,59 5,66 5,73 5,79 5,84 5,90 17 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5,11 5,21 5,31 5,39 5,47 5,54 5,61 5,68 5,73 5,79 5,84 18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07 5,17 5,27 5,35 5,43 5,50 5,57 5,63 5,69 5,74 5,79 19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,14 5,23 5,31 5,39 5,46 5,53 5,59 5,65 5,70 5,75 20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,11 5,20 5,28 5,36 5,43 5,49 5,55 5,61 5,66 5,71 21 2,94 3,57 3,94 4,21 4,42 4,60 4,74 4,87 4,98 5,08 5,17 5,25 5,33 5,40 5,46 5,52 5,58 5,63 5,68 22 2,93 3,55 3,93 4,20 4,41 4,58 4,72 4,85 4,96 5,06 5,14 5,23 5,30 5,37 5,43 5,49 5,555,60 5,65 23 2,93 3,54 3,91 4,18 4,39 4,56 4,70 4,83 4,94 5,03 5,12 5,20 5,27 5,34 5,41 5,46 5,52 5,57 5,62 24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,01 5,10 5,18 5,25 5,32 5,38 5,44 5,49 5,55 5,59 25 2,91 3,52 3,89 4,15 4,36 4,53 4,67 4,79 4,90 4,99 5,08 5,16 5,23 5,30 5,36 5,42 5,47 5,52 5,57 26 2,91 3,51 3,88 4,14 4,35 4,51 4,65 4,77 4,88 4,98 5,06 5,14 5,21 5,28 5,34 5,40 5,45 5,50 5,55 27 2,90 3,51 3,87 4,13 4,33 4,50 4,64 4,76 4,86 4,96 5,04 5,12 5,19 5,26 5,32 5,38 5,43 5,48 5,53 28 2,90 3,50 3,86 4,12 4,32 4,49 4,63 4,75 4,85 4,94 5,03 5,11 5,18 5,24 5,30 5,36 5,41 5,46 5,51 29 2,89 3,49 3,85 4,11 4,31 4,48 4,61 4,73 4,84 4,93 5,01 5,09 5,16 5,23 5,29 5,34 5,40 5,45 5,49 30 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82 4,92 5,00 5,08 5,15 5,21 5,27 5,33 5,38 5,43 5,48 31 2,88 3,48 3,84 4,09 4,29 4,45 4,59 4,71 4,81 4,91 4,99 5,06 5,13 5,20 5,26 5,31 5,37 5,41 5,46 32 2,88 3,48 3,83 4,09 4,28 4,45 4,58 4,70 4,80 4,89 4,98 5,05 5,12 5,19 5,24 5,30 5,35 5,40 5,45 33 2,88 3,47 3,83 4,08 4,28 4,44 4,57 4,69 4,79 4,88 4,97 5,04 5,11 5,17 5,23 5,29 5,34 5,39 5,43 34 2,87 3,47 3,82 4,07 4,27 4,43 4,56 4,68 4,78 4,87 4,96 5,03 5,10 5,16 5,22 5,28 5,33 5,37 5,42 35 2,87 3,46 3,81 4,07 4,26 4,42 4,56 4,67 4,77 4,86 4,95 5,02 5,09 5,15 5,21 5,26 5,32 5,36 5,41 36 2,87 3,46 3,81 4,06 4,26 4,41 4,55 4,66 4,76 4,86 4,94 5,01 5,08 5,14 5,20 5,25 5,30 5,35 5,40 37 2,87 3,45 3,80 4,05 4,25 4,41 4,54 4,66 4,76 4,85 4,93 5,00 5,07 5,13 5,19 5,24 5,29 5,34 5,39 38 2,86 3,45 3,80 4,05 4,24 4,40 4,53 4,65 4,75 4,84 4,92 4,99 5,06 5,12 5,18 5,23 5,28 5,33 5,38 39 2,86 3,45 3,80 4,04 4,24 4,39 4,53 4,64 4,74 4,83 4,91 4,99 5,05 5,11 5,17 5,23 5,28 5,32 5,37 40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,74 4,82 4,90 4,98 5,04 5,11 5,16 5,22 5,27 5,31 5,36 48 2,84 3,42 3,76 4,01 4,20 4,35 4,48 4,59 4,69 4,78 4,86 4,93 4,99 5,05 5,11 5,16 5,21 5,26 5,30 60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,73 4,81 4,88 4,94 5,00 5,06 5,11 5,15 5,20 5,24 80 2,81 3,38 3,71 3,95 4,13 4,28 4,40 4,51 4,60 4,69 4,76 4,83 4,89 4,95 5,00 5,05 5,10 5,14 5,18 120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 4,56 4,64 4,71 4,78 4,84 4,90 4,95 5,00 5,04 5,09 5,13 240 2,79 3,34 3,66 3,89 4,06 4,21 4,32 4,43 4,52 4,60 4,67 4,73 4,79 4,85 4,90 4,94 4,99 5,03 5,07 Inf 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47 4,55 4,62 4,69 4,74 4,80 4,85 4,89 4,93 4,97 5,01