Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Universidade Estadual do Sudoeste da Bahia Programas de pós-gradução stricto sensu Campus de Itapetinga Curso de Estatística Aplicada Paulo Bonomo Professor da UESB Universidade Estadual do Sudoeste da Bahia Itapetinga - Bahia 2019 2 Apresentação Existem muitos métodos de interesse na estatística experimental. Porém, devido a extensão do conhecimento estatístico existente, apenas uma pequena parte do assunto poderá ser abordada, com ênfase aos tópicos mais relevantes. A disciplina Estatística Aplicada procura atender aos interesses dos estudantes de pós-graduação em Zootecnia, Eng. de Alimentos e Ciências Ambientais. O presente material foi elaborado com o objetivo de dar suporte didático ao curso Estatística Aplicada. No entanto, não substitui a pesquisa em livros editados por autores nacionais e internacionais. Índice Capítulos Páginas Cap. 1 - Preliminares: Noções sobre Álgebra de Matrizes ....................... 03 Cap. 2 - Testes de Hipóteses ..................................................................... 11 Cap. 3 - Princípios Básicos da Experimentação ....................................... 29 Cap. 4 - Delineamento Inteiramente Casualizado ..................................... 35 Cap. 5 - Testes de Comparação entre Médias ou grupos de médias ......... 55 Cap. 6 - Delineamento em Blocos Casualizados ...................................... 79 Cap. 7 - Delineamento em Quadrado Latino ............................................ 95 Cap. 8 - Experimentos Fatoriais ................................................................ 105 Cap. 9 - Experimentos em Parcelas Subdivididas ..................................... 125 Cap. 10- Análise de Regressão .................................................................. 137 Cap. 11- Bibliográfica Consultada ............................................................. 167 3 Cap. 1 - Noções sobre Álgebra de Matrizes 1.1. Introdução Chama-se Matriz ao conjunto retangular de números disposto em linhas e colunas. Assim, 333231 232221 131211 aaa aaa aaa A É uma matriz 3x3, pois é uma matriz com 3 linhas e 3 colunas. Os elementos de uma matriz são identificados por índices, assim, a31 se refere ao elemento na terceira linha e primeira coluna. No presente caso temos uma matriz quadrada porque o número de linhas é igual ao número de coluna. Também conhecida como matriz de ordem 3. Se a matriz A é de ordem m por n, escreve-se simplesmente Amxn. Assim se uma matriz tiver 2 linhas e 3 colunas, escreve-se A2x3 e lê-se matriz A, 2 por 3. 1.2. Igualdade, Adição e Subtração de Matrizes Duas matrizes são iguais quando tem as mesmas dimensões (isto é, o mesmo número de linhas e colunas) e além disso seus elementos ordenadamente iguais. 967 318 425 aaa aaa aaa 333231 232221 131211 Logo, a11 = 5 a12 = 2 a13 = 4 a21 = 8 a22 = 1 a23 = 3 a31 = 7 a32 = 6 a33 = 9 A condição para se somar ou subtrair matrizes é que elas tenham a mesma dimensão. As operações são feitas com os termos correspondentes. Sejam: 967 318 425 A 345 216 522 B 121012 5214 943 BA 622 102 107 BA Uma matriz que tenha uma única linha ou uma única coluna é um vetor. Assim, a matriz A é formada pelos vetores coluna, 7 8 5 6 1 2 9 3 4 Ou pelos vetores linha, 425 318 967 4 1.3. Matriz Transposta Dada uma A, sua transposta A’ é obtida com os mesmos elementos originais, mas, escrevendo suas linhas como coluna e vice-versa. Assim a transposta de A, será: 2x3 41 30 21 A 3x2 432 101 'A Observações: 1. A transposta de um produto é igual ao produto das transpostas, isto é, (AB)’ = B’A’; o produto é tomado em ordem inversa. 2. A transposta de uma soma é a soma das transpostas, isto é, (A + B)’ = A’ + B’. 3. Uma matriz A igual a sua transposta, se diz simétrica. Ex. 137 395 752 A 137 395 752 'A logo, A é uma Matriz Simétrica. 1.4. Matriz Quadrada Diz-se matriz quadrada quando o número de linhas é igual ao número de colunas, m = n. Ex. 3x3 133 212 432 E , portanto m = n = 3, e dizemos matriz de ordem 3. 1.5. Matriz Diagonal É uma matriz quadrada cujos termos fora da diagonal principal são todos nulos. Ex. 500 090 002 Z 1.6. Matriz Unitária ou Matriz Identidade ( I ) É uma matriz diagonal em que os elementos da diagonal principal são iguais à unidade. 100 010 001 I é chamada matriz Identidade de ordem n = In, neste caso I3. 1.7. Matriz Nula É uma Matriz cujos elementos são todos nulos. Geralmente é representada por , assim, 000 000 5 1.8. Multiplicação de uma Matriz por um Escalar Se n é um escalar, o produto de uma matriz por esse escalar é dada por: B = (bij) e A = (aij) Fazendo: B = n.A, logo bij = n.aij Ex. 012 36 04 12 *3 1.9. Multiplicação de Matrizes A condição para que duas matrizes possam ser multiplicadas é que o número de colunas da matriz que pré-multiplica seja igual ao número de linhas da matriz que pós-multiplica. O produto AB da matriz (m x n) por uma matriz (n x q) terá dimensões (m x q) No caso geral, sendo AB = C, o termos Cij de C é igual ao produto da linha i de A pela coluna j de B. 2x22221 1211 aa aa A 3x2232221 131211 bbb bbb B 3x2232213212222122121221121 231213112212121121121111 babababababa babababababa ABC Exemplo: 2x3 41 30 21 A 3x2 112 301 B 3x3 749 336 525 ABC O produto entre dois vetores DE tem dimensão 1x1, ou seja, é um escalar. Exemplo: 3x1 845D 1x3 7 1 3 E 677x8)1(x43x5DEF 1.10. Traço de uma Matriz O traço de uma matriz é dado pela soma dos elementos da diagonal principal da matriz. Ex. 143 222 321 A traço de A = 1 + 2 + 1 = 4 6 1.11. Determinante É um número associado a cada Matriz Quadrada (só existe determinantede matriz quadrada) como segue. a) Dada a matriz A de ordem 1x1, seu determinante, que se representa por A, ou det A é igual ao único elemento da matriz. b) No caso de uma matriz A de ordem 2x2, temos: 64 57 aa aa A 2221 1211 224x56x7aaaaA 21122211 c) No caso de uma matriz A de ordem 3x3, calcula-se o determinante pela regra de Sarrus, 3231 2221 1211 333231 232221 131211 aa aa aa aaa aaa aaa A )aaaaaaaaa()aaaaaaaaa(A 332112322311312213322113312312332211 Exemplo: 143 201 432 A 43 01 32 143 201 432 A 151934)1x1x34x2x23x0x4()4x1x43x2x31x0x2(A Para matrizes de dimensões maiores, utilizam-se outros processos. 1.12. Determinante de uma Matriz Singular Toda matriz quadrada singular tem determinante nulo, reciprocamente é singular toda matriz quadrada de determinante nulo. 22 11 A 0A , logo, A é uma matriz singular e não admite inversa. Algumas propriedades dos determinantes: 1. Determinante de A é igual ao det de A’. 2. Se todos os elementos de uma linha ou coluna de A são nulos, então det A é zero. 3. Se todos os elementos correspondentes de duas linhas ou duas colunas forem iguais, então, o det A = 0. 4. Se todos os elementos de uma linha ou coluna de A foram iguais a combinações lineares de outras linhas ou colunas de A, então, o det A = 0. 7 1.13. Posto (Característica ou Rank) de uma Matriz O posto de uma matriz A é definido como sendo o número de colunas linearmente independentes. Ou seja, posto de uma matriz é igual a ordem da maior submatriz de A, cujo determinante seja diferente de zero. Ex. 135 012 243 A 303 033 336 B 11543 61022 1521 C p(A) = 3 p(B) = 2 p(C) = 3 1.14. Matriz Inversa comum Dada uma matriz quadrada A, sua inversa A -1 é uma matriz tal que, AA -1 = A -1 A = I Somente matriz quadrada admite inversa comum, porém nem toda matriz quadrada tem inversa. As que têm chamam-se matrizes não singulares; as que não admitem inversa são denominadas singulares. Método para obtenção da Inversa A Adeadjunta A 1 , sendo “adjunta de A” = transposta da matriz dos cofatores. A Adecofatores A ' 1 O cofator de ij ji ijij M.)1(ca , onde ijM (Mij - menor complementar) é o determinante da matriz obtida de A, suprimindo-se a i-ésima linha e a j-ésima coluna. Ex.1: encontrar a inversa de 106 75 A A Acofatores A ' 1 87x610x5A Matriz dos cofatores: ij ji ij M.)1(c 1010.1c 1111 66.1c 2112 77.1c 1221 55.1c 2222 8 57 610 AdeCofatores 56 710 AdeCofatores ' 56 710 8 1 A 1 ou 8/58/6 8/78/10 A 1 Verificação 10 01 8/58/6 8/78/10 * 106 75 IA.A 2 1 Ex.2: encontrar a inversa de 113 125 321 B B Bcofatores B ' 1 Matriz dos cofatores: ij ji ij M.)1(c 1 11 12 .)1(c 1111 2 13 15 .)1(c 2112 1 13 25 .)1(c 3113 1 11 32 .)1(c 1221 8 13 31 .)1(c 2222 5 13 21 .)1(c 3223 4 12 32 .)1(c 1331 14 15 31 .)1(c 2332 8 25 21 .)1(c 3333 8144 581 121 BdeCofatores 851 1482 411 BdeCofatores ' 62923)1x5x21x1x13x2x3()1x5x33x1x21x2x1(B 851 1482 411 6 1 B 1 , ou 3/46/56/1 3/73/43/1 3/26/16/1 B 1 , ou ainda 3333,18333,01667,0 3333,23333,13333,0 6667,01667,01667,0 B 1 Verificação 100 010 001 IB.B 3 1 9 1.15. Exercícios 1. Dadas as matrizes 34 21 A 10 01 I 30 02 D 202 033 235 B 2/100 03/10 000 C 6 12 18 Y 110 011 001 W 46 52 E Calcular: a) AI, IA, AA, AA’, A’A, AD, DA b) CB, CY c) W’CB d) det B e posto de B e) (AE)’ e E’A’ [Note que: (AE)’ = E’A’] 2. Dado o vetor: 4 1 3 X , calcular X’X e XX’. 3. Verifique que é singular a matriz. 63 21 B 4. Determine b e x de modo que sejam singulares as matrizes: b3 81 M x84 2x1 N 5. Dado as matrizes: 103 32 A 1093 672 332 B a) Obter a inversa simples das matrizes A e B; b) Verifique numericamente que A -1 A = I2 e B -1 B = I3. 10 6. Dado o sistema de equações: 2X1 + X2 = 3 2X1 + 3X2 = 5 Pede-se: a) Escreva o sistema na forma matricial AX = g; b) Determine a solução do sistema sabendo-se que X = A -1 g; c) Pré-multiplique ambos os lados da igualdade de (a) por A’, obtendo A’AX = A’g; d) Determine a solução para o novo sistema por meio de X = (A’A)-1A'g; e) Compare os resultados obtidos em (b) e (d). 7. Dado o sistema de equações: 8XX 5XX2 9XXX 32 21 321 a) Escreva o sistema na forma matricial AX = g; b) Determine a solução do sistema sabendo-se que X = A -1 g; Respostas 1. a) 34 21 AI 34 21 IA 1716 89 AA 2510 105 'AA 1314 1417 A'A 98 62 AD 912 42 DA b) 101 011 000 CB 3 4 0 CY c) 101 112 011 CB'W d) 0)B(det 2)B(posto e) 3213 2614 )'AE( 3213 2614 'A'E 2. 26X'X 16412 413 1239 'XX 3. 0)B(det 4. 24b e 9xe0x ''' 5. a) 182,0273,0 273,0909,0 A 1 471,0530,0176,0 353,0650,0118,0 176,0180,0941,0 B 1 6. a) 32 12 A 2 1 x x X 5 3 g b) 1 1 X c) 1818 1616 g'AAX'A d) 1 1 X 7. a) 110 012 111 A 3 2 1 x x x X 8 5 9 g b) 5 3 1 X 11 Cap. 2 - Testes de Hipóteses 2.1. Introdução O teste de hipótese é uma técnica para a realização de inferência estatística, isto é, a partir de dados amostrais pode-se generalizar conclusões sobre a população. Uma hipótese estatística é uma suposição ou afirmação relativa a uma ou mais populações. Exemplo, no Brasil a proporção de pessoas que tomam café é de 0,75. O teste de hipótese consiste em verificar se a afirmação é verdadeira ou falsa. O teste estatístico de hipótese é uma regra decisória que nos permite rejeitar ou não rejeitar uma hipótese estatística com base nos resultados de uma amostra. Estas hipóteses são, em geral, sobre parâmetros populacionais e a realização do teste se baseia na distribuição amostral dos respectivos estimadores. 2.2. Alguns Conceitos 2.2.1. Parâmetro é uma função de valores populacionais, sendo em geral, um valor desconhecido associado à população. Exemplo: Na distribuição normal os parâmetros são a média )( XE e a variância )( XV2 . 2.2.2. Estimador de um parâmetro é qualquer função das observações de uma amostra aleatória X1, X2, ... , Xn. Ele representa uma dada fórmula de cálculo que fornecerá valores que serão diferentes, conforme a amostra selecionada. Exemplos: i ) O estimador da média : n X Xˆ n 1i i ii) O estimador da variância 2 : 11 1 2 12 2 122 n n X X n XX s n i n i i i n i i ˆ 2.2.3. Estimativa é o valor numérico assumido pelo estimador quando os valores X1, X2, ... , Xn são considerados. Ex .: Variância da altura, em metros da população, ., 22 2710 mS 2.2.4. Hipótese Estatística é uma suposição quanto ao valor de um parâmetro populacional que será verificada por um teste paramétrico, ou uma afirmação quanto à natureza da população, que será verificada por um teste de aderência. As hipóteses estatísticas devem ser formuladas de modo a minimizar os erros de decisão. Exemplos: l. A média populacional da altura dos brasileiros adultos é 1,65 m, isto é, = 1,65 m; 2. A distribuição dos pesos de animais nelore adulto é normal. 3. A proporção de indivíduos com a doença X é 3 %, p = 0,03. 12 Em um teste de hipótese, formula-se duas hipóteses: 2.2.4.1. Hipótese de nulidade (Ho): Também chamada de hipótese básica ou hipótese nula, é a hipótese estatística a ser testada. A hipótese Ho é formulada com o "expresso propósito de ser rejeitada", e os testes são construídos sob a pressuposição de Ho ser verdadeira. Portanto, o teste de hipótese consiste em verificar se a amostra observada difere significativamente do resultado esperado sob Ho. Exemplos: 1. Um fabricante informa que a tensão média de ruptura dos cabos é 50 kgf. Ho: = 50. 2. A informação de um fabricante, quanto à durabilidade média de suas lâmpadas, é de 6.000 horas. Ho: = 6.000. 3. Duas marcas de rações, A e B, para leitões em fase de crescimento, propiciam em média o mesmo ganho de peso. Ho: A = B Para os três exemplos anteriores o raciocínio é que, enquanto não houver evidência amostral sugerindo que a informação não deve ser verdadeira, toma-se a informação como verdadeira. 2.2.4.2. Hipótese alternativa (Ha): É uma hipótese que contraria Ho, formulada com base no conhecimento prévio do problema, informações de pesquisa etc. Para o caso das duas médias, anteriormente citado, poderíamos ter: BAa BAa BAa H ouH ouH 3 2 1 , , Neste caso, 1a H e 2a H são unilaterais e 3a H é bilateral. O resultado final do teste é enunciado em termos da hipótese de nulidade. 2.2.5. Teste de hipótese (ou teste de significância ou regra decisória): É um procedimento que mediante informações obtidas de amostras, permite decidir rejeitar ou não rejeitar Ho. 2.2.6. Região Crítica: É a faixa de valores que nos levam à rejeição da hipótese Ho. Isto é, caso o valor observado da estatística do teste (Z, t, 2, F) pertença à região crítica, rejeita-se Ho, caso contrário não rejeitamos Ho. Qualquer decisão tomada implica na possibilidade de ter basicamente dois tipos de erros: Erro tipo I e Erro tipo II. 2.2.7. Erro Tipo I: O erro tipo I é caracterizado pelo fato de rejeitarmos Ho quando esta é verdadeira. Designaremos por a probabilidade de se cometer o erro tipo I, também chamado de nível de significância do teste. 2.2.8. Erro Tipo II: O erro tipo II é caracterizado pelo fato de não rejeitar Ho quando esta é falsa. É normalmente designado por a probabilidade de se cometer o erro tipo II. O Quadro abaixo sintetiza as probabilidades numa escolha decisiva. Realidade Decisão Ho é verdadeira Ho é falsa Rejeitar Ho 1 - Não Rejeitar Ho 1 - 13 2.2.9. Poder de um teste: O poder de um teste frente à determinada hipótese é uma informação utilizada para o dimensionamento de tamanhos de amostras tendo-se em vista o controle dos dois tipos de erros. É a probabilidade de rejeitar Ho quando esta é falsa. Poder do teste = 1 - 2.2.10. Procedimentos para Realização de um Teste de Hipótese O procedimento para a realização do teste pode ser resumido nos passos: 1. enunciar as hipóteses Ho e Ha; 2. fixar o nível de significância e identificar a estatística do teste; 3. determinar a região crítica e a região de não rejeição em função do nível de significância , por meio de tabelas estatísticas; 4. por meio dos elementos amostrais, calcular o valor da estatística do teste; e 5. concluir pela rejeição ou não rejeição de Ho, caso o valor da estatística obtido no 4° passo pertença ou não pertença, respectivamente, à região crítica determinada no 3° passo. 2.3. Alguns Testes de Hipóteses 2.3.1. Teste para proporção (Distribuição normal) Se selecionarmos uma amostra aleatória de tamanho n de determinada população, n suficientemente grande, de sorte que X1, X2,..., Xn sejam independentes, então para testar a hipótese: 0ppHo : contra 01 ppHa : ou 02 ppHa : ou 03 ppHa : usamos a estatística Z dada por, n qp pf zcalc 00 0 , onde 00 1 pq , tem distribuição normal padronizada. Esta suposição é garantida sempre que o tamanho da amostra seja de, no mínimo, 30 elementos. Sendo: n x f , x: número de sucesso na amostra; n: tamanho da amostra; então f será a proporção amostral. Sabe-se que f, o estimador de p, tem distribuição dada por: se 𝑋 ~ 𝐵 (𝑁, 𝑝) e sendo 𝑓 = 𝑥 𝑛 então 𝑓 ~ 𝑁 (𝑝, 𝑝.𝑞 𝑛 ). Pois (considerando-se que X tem distribuição binomial com parâmetros N e p): 𝐸[𝑓] = 𝐸 [ 𝑋 𝑛 ] = 𝐸[𝑋] 𝑛 = 𝑛𝑝 𝑛 = 𝑝 𝑉[𝑓] = 𝑉 [ 𝑋 𝑛 ] = 𝑉[𝑋] 𝑛2 = 𝑛.𝑝.𝑞 𝑛2 = 𝑝.𝑞 𝑛 14 Estimação por meio de Intervalo de confiança (IC) Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído com os elementos amostrais, pode-se inferir sobre um parâmetro populacional. O intervalo de confiança (IC) fornece um intervalo de valores, baseado na estatística amostral, dentro do qual se espera estar contido o parâmetro da população, com uma conhecida probabilidade (margem de erro). Por exemplo, retira-se uma amostra de 1.000 brasileiros e calcula-se a média de suas alturas e encontra-se 170 cm. Logo, uma estimativa pontual da verdadeira altura média µ é dado por cmX 170 . Já através do intervalo de confiança poder-se-ia encontrar um intervalo, por exemplo, entre 165 e 175 cm que, em 95% das vezes incluiria µ (a verdadeira altura média dos brasileiros). Ou seja, poder-se-ia dizer que tem 95% de probabilidade da média real da população brasileira estar entre 165 e 175 cm. Para populações infinitas, a variável padronizada de f será: 𝑍 = 𝑓− 𝑝 √ 𝑝.𝑞 𝑛 Fixando-se um nível de confiança de 1 − 𝛼, tem-se: 𝑃 (−𝑍𝛼 2 ≤ 𝑍 ≤ 𝑍𝛼 2 ) = 1 − 𝛼 Substituindo-se o valor de Z, 𝑃 (−𝑍𝛼 2 ≤ 𝑓−𝑝 √ 𝑝.𝑞 𝑛 ≤ 𝑍𝛼 2 ) = 1 − 𝛼 Resolvendo-se as duas inequações para p, têm-se o intervalo de confiança para a proporção: 𝑃 (𝑓 − 𝑍𝛼 2 . √ 𝑝. 𝑞 𝑛 ≤ 𝑝 ≤ 𝑓 + 𝑍𝛼 2 . √ 𝑝. 𝑞 𝑛 ) = 1 − 𝛼 Para amostras grandes (n > 50) pode-se substituir o p da raiz por f. Assim o IC para proporção será: 𝑃 (𝑓 − 𝑍𝛼 2 . √ 𝑓. (1 − 𝑓) 𝑛 ≤ 𝑝 ≤ 𝑓 + 𝑍𝛼 2 . √ 𝑓. (1 − 𝑓) 𝑛 ) = 1 − 𝛼 Ex. 1. Menelau é candidato a prefeito para a cidade de Umbuzeiros que possui 173.000 eleitores. Imaginando que estava com 40% de intenção de votos contratou um instituto de pesquisa para verificar sua convicção. O instituto após entrevistar 1.800 eleitores verificou que 748 têm intenção de votar em Menelau. Caso o instituto rejeite a informação do candidato qual a probabilidade de erro tipo I estará sujeita nessa conclusão. O que você recomendaria? 1º) 40,0:40,0: pHvspH ao 2º) = 0,05; Teste Z 3º) Gráfico da região crítica: Z5% = 1,96 Z1% = 2,57 4º) 4156,0 800.1 748 n x f 35,1 800.1 )40,01(40,0 40,04156,0 )1( 00 0 n pp pf zcalc P = 2x(0,5 - 0,4115) = 2x0,0885 = 0,1770 5º) Conclusão: Caso o instituto rejeite a informação de Menelau a probabilidade de erro tipo I será de 17,70%. Como o instituto admite até 5% de probabilidade de erro tipo I, não se rejeita H0. Ou seja, admite-se a informação de Menelau. Ou simplesmente: a intenção de voto em Menelau é próxima a 40% (P>0,05). Obs. O erro tipo I nesse exemplo constitui a prob. de em novas amostras encontrar valores de Zcalc superiores a 1,35 ou inferiores a -1,35 e será de 17,70%. 15 Construir o intervalo de confiança (IC) para o valor esperado com 95% ( 05,0 ) de probab. 05,01 )1()1( 22 n ff zfp n ff zfP 05,01 800.1 )416,01(416,0 96,1416,0 800.1 )416,01(416,0 96,1416,0 pP 𝛥 = 0,023 95,0438,0393,0 pP Ex. 2. Um fabricante A afirma que 85% dos parafusos que produz encontram-se dentro de suas especificações. Uma empresa que compra esses parafusos realizou uma amostra de 200 itens escolhidos ao acaso que revelou 18 itens fora de especificação. Caso a empresa rejeite a informação do fabricante qual a probabilidade de erro tipo I estará sujeita nessa conclusão. O que você recomendaria? 1º) 85,0:85,0: pHvspH ao 2º) = p; Teste Z 3º) Gráfico da região crítica: Z5% = 1,96 Z1% = 2,57 4º) 91,0 200 )18200( n x f - proporção de parafusos dentro das especificações. 38,2 200 )85,01(85,0 85,091,0 )1( 00 0 n pp pf zcalc P = 2x(0,5 - 0,4913) = 2x0,0087 = 0,0174 5º) Conclusão: Caso a informação do fabricante seja rejeitada a probabilidade de erro tipo I será de 1,74%. Normalmente admite-se até 5% de probabilidade de erro tipo I, nesse caso rejeita-se H0. Ou seja, rejeita-se a informação do fabricante. Ou simplesmente: a proporção de parafusos produzidos pelo fabricante A, dentro das especificações, não é de 85% (P<0,05). Obs. O erro tipo I nesse exemplo constitui a prob. de em novas amostras encontrar valores de Zcalc superiores 2,38 ou inferiores a -2,38 será de 1,74%. Construir o intervalo de confiança (IC) para o valor esperado com 94% ( 06,0 ) de probab. 06,01 )1()1( 22 n ff zfp n ff zfP 06,01 200 )91,01(91,0 88,191,0 200 )91,01(91,0 88,191,0 pP 𝛥 = 0,038 94,0948,0872,0 pP 16 2.3.2. Teste de Comparação de Variância de duas Populações (Teste F) Considere duas amostras de tamanhos nx e ny das variáveis aleatórias normais X e Y, respectivamente, pode-se demonstrar que: Sob 222: yxo H , a estatística 2 2 y x s s F tem distribuição F, de Fisher-Snedecor, com n1 = (nx - 1) e n2 = (ny - 1) graus de liberdade. Assim para testar 22: YXoH contra 22: 1 YXa H , ou 22: 2 YXa H , ou 22: 3 YXa H usamos a estatística F dada acima. Obs.: Vamos adotar sempre colocar a maior variância no numerador, de modo a obter um Fcalculado (Fcalc) maior que 1, e usaremos a tabela unilateral para F 1. Assim se: 22 22 : : YXa YXo H H 2 2 2 2 Y X calc S S S S F Ftab F(nx – 1; ny – 1) ou 22 22 : : XYa YXo H H 2 2 2 2 X Y calc S S S S F Ftab F(ny – 1; nx – 1) Decisão: Se Fcal Ftab Rejeita-se Ho a de probabilidade pelo teste F. 17 Exemplos: Ex.1. Dois programas de treinamento de funcionários foram efetuados. Os 21 funcionários treinados no programa antigo apresentaram uma variância de 78 em suas taxas de erros. No novo programa, 13 funcionários apresentaram uma variância de 200. Pode-se concluir que a variância é diferente para os dois programas? Programa S 2 N Antigo - X 78 21 Novo - Y 200 13 Solução: 1º) 22 22 XYa YXo H H : : 2º) = 5%; Teste F 3º) Gráfico da região crítica: Ftab 28220125 ,),%( F 23320121 ,),%( F 4º) 562 78200 2 2 2 2 , X Y calc S S S S F , valor de probabilidade, P = 0,030. 5º) Conclusão: Fcalc > Ftab Rejeita-se Ho a 5% de probabilidade pelo teste F. Ou seja, a variância de Y é maior que a variância de X. Ex.2. Com o objetivo de controlar a homogeneidade de produção de vacas leiteiras, são realizadas amostras semanais. Amostras retiradas em duas semanas consecutivas apresentaram os seguintes valores: X 10,3 15,0 8,0 7,4 15,5 12,3 12,4 8,9 10,7 100,5 Y 8,8 9,4 8,5 10,5 12,2 9,5 - - - 58,9 Podemos concluir que houve alteração na variabilidade? 3250,8 8 9 5,100 85,188.1 1n n X X S 2n 1i 2 n 1i i 2 i 2 X nX = 9 8377,1 5 6 9,58 39,587 1 2 1 2 12 2 n n Y Y S n i n i i i Y nY = 6 1º) 22 22 : : YXa YXo H H 2º) = 1%; Teste F 3º) Gráfico da região crítica: Ftab F1%(8; 5) = 10,29 F5%(8; 5) = 4,82 P = 0,056 4º) 53,4 8377,1 3250,8 2 2 2 2 Y X calc S S S S F 5º) Conclusão: Fcalc < Ftab Não se Rejeita Ho a 1% de probabilidade pelo teste F. Ou seja, a variância de X é estatisticamente igual a variância de Y. 18 2.3.3. Teste t de Student 2.3.3.1. Teste de Hipótese para uma média populacional Caso em que X é normalmente distribuída com variância desconhecida. Se selecionarmos uma amostra aleatória de tamanho n de determinada população, de sorte que X1, X2,..., Xn sejam independentes, então: X S X t tem distribuição t de Student com n – 1 graus de liberdade. Mas, n S n S XVS XX X 2 )(ˆ logo, n S X t X Assim para testar 0: oH contra 0:1 aH ou 0:2 aH ou 0:3 aH usamos a estatística t dada acima. Decisão: a) Teste bilateral Se 0Hserejeitatt tabcalc b) Teste unilateral a direita Se 0Hserejeitatt tabcalc c) Teste unilateral a esquerda Se 0Hserejeitatt tabcalc Observação: o valor de t é obtido em tabelas apropriadas: Tabela Bilateral: - Teste bilateral: entrar com - Teste unilateral: entrar com 2 Tabela unilateral - Teste bilateral: entrar com /2 - Teste unilateral: entrar com Intervalo de confiança Um IC fornece um intervalo de valores, baseado na estatística amostral, dentro do qual espera-se estar contido o parâmetro da população, com uma conhecida margem de erro. Para o cálculo do IC para média, quando a variância é desconhecida, se utiliza a distribuição t de Student. Considerando o caso bilateral, temos a expressão: 1 2 2 2 2 n S tX n S tXP xx 19 Exemplos: Ex.1. Um criador de frangos de corte aloja um plantel de 20.000 aves. Este produtor envia para abate as aves quando estas atingem 2,10 kg. Para verificar se as aves estavam no ponto de abate realizou uma amostra de oito aves, cujo peso foram: 2,2 1,8 1,9 2,1 2,0 1,9 2,3 2,2. Efetuar um teste de hipótese para verificar se as aves estão prontas para abate. 1º) 10,2: 10,2: a o H H 2º) = 0,05; Teste t n = 8 �̅� = 2,05 𝑆𝑋 2 = 0,0314 3º) Gráfico da região crítica: ttab t5%(7gl) = 2,36 t1%(7gl) = 3,50 4º) 80,0 8 0314,0 10,205,2 2 n S X t X calc 𝑃 = 2 𝑥 ∫ 𝑓(𝑡)𝑑𝑡 = 0,4512 −0,80 −∞ 5º) Conclusão: tcalc > -ttab Não se rejeita Ho a 5% de probabilidade pelo teste t. Ou seja, as aves já estão prontas para o abate. Intervalo de confiança para a média com probabilidade de 100 - . 1 2 2 2 2 n S tX n S tXP xx , então: 95,0 8 0314,0 36,210,2 8 0314,0 36,210,2 P 148,0 95,0198,2902,1 P Ex.2. Em indivíduos normais o consumo renal médio de oxigênio é 12,0 cm 3 /min. Deseja-se investigar, com base em 5 indivíduos portadores de certa moléstia, se esta tem influência no consumo renal de oxigênio. Dados observados: 14,4 - 12,9 - 15,0 - 13,7 - 13,5. ( = 1%) 1º) 0,12: 0,12: a o H H 2º) = 1%; Teste t n = 5 3º) Gráfico da região crítica: ttab t1%(4) = 4,60 t5%(4) = 2,78 P = 0,0065 4º) 665,0 4 5 5,69 71,968 1 2 1 2 12 2 n n X X S n i n i i i X 9,13 5 5,691 n X X n i i 21,5 5 665,0 0,129,13 2 n S X t X calc 5º) Conclusão: tcalc > ttab Rejeita-se Ho a 1% de probabilidade pelo teste t. Ou seja, essa moléstia tem efeito sobre o consumo médio de oxigênio. Intervalo de confiança para a média com probabilidade de 100 - . 1 2 2 2 2 n S tX n S tXP xx 990 5 6650 64913 5 6650 64913 , , ,, , ,, P 99058152212 ,,, P 20 2.3.3.2. Teste de Hipótese para o caso de duas amostras independentes Muitos problemas aparecem quando se deseja testar hipóteses sobre médias de diferentes populações. Por exemplo, um experimentador pode estar investigando um novo tipo de adubo, comparando a produção média de períodos em que foi usado o adubo antigo e o novo. Quando as variâncias das populações são substituídas pelas variâncias das amostras, isto é, S 2 em lugar de 2, o teste Z passa ao teste t. Sejam X e Y normalmente distribuídas, sendo suas variâncias desconhecidas, e desejamos testar : YXoH : contra YXaH :1 ou YXaH :2 ou YXaH :3 Vamos admitir que as variâncias são iguais e que, consequentemente, os valores assumidos por 2 XS e 2 YS serão estimativas de um mesmo valor de 2 que é a variância (comum) de ambas as populações. Sendo assim, vamos combinar 2 XS e 2 YS a fim de obter um melhor estimador de 2. Temos que: 11 1 2 12 2 x n i x n i i i x x x n n X X n SQD s e 11 1 2 12 2 y n i y n i i i y y y n n Y Y n SQD s 2 )1()1( 2 22 2 yx yyxx yx yx C nn snsn nn SQDSQD S em que 2 CS é o estimador da variância comum (estimador de 2). A seguir utilizaremos para o nosso teste, a variável aleatória yx C nn S YX t 112 que tem distribuição t de Student com (nx + ny – 2) graus de liberdade. 21 Exemplos: Ex.1. O dados a seguir referem-se a acidez (gramas de ácido cítrico por 100 ml de polpa) de dois lotes de laranja, em amostras coletadasao acaso. Verificar se existe diferenças entre os lotes. Os resultados foram: Amostra Média Var 1 2 3 4 5 6 7 8 X 2S Lote 1 5 5 4 6 7 7 6 5 5,625 1,125 Lote 2 2 3 4 6 2 4 3,500 2,300 Resolução: 1º) 2121 :: ao HcontraH 2º) = 5%; Teste t 3º) Gráfico da região crítica: ttab t5%(12) = 2,18 t1%(12) = 3,06 P = 0,0092 4º) 6151 268 163002181251 2 11 21 2 22 2 112 , .,.,)()( nn snsn SC 0973 6 1 8 1 6151 5036255 11 21 2 21 , ., ,, . nn S XX t C calc 5º) Conclusão: tcalc > ttab Rejeita-se Ho a 5% de probabilidade pelo teste t. Ou seja, existe diferença significativa entre os dois lotes de laranja amostrados quanto a acidez. Ex.2. Deseja-se saber se dois suplementos alimentares para aves são equivalentes, ou se o suplemento Y é superior ao X. Para tanto foram alimentados 13 animais, sorteados ao acaso, com o suplemento X, e a outros 19, com o suplemento Y. Os resultados foram: 13n kg0,17S kg70,2X x 22 x 19 5,14 95,2 22 y y n kgS kgY A que conclusão chegar se adotarmos = 5%. Resolução: 1º) XYaXYo HcontraH :: 2º) = 5%; Teste t 3º) Gráfico da região crítica: ttab t5%(30) = 1,70 t1%(30) = 2,46 P = 0,430 4º) 2222 5,15 21913 119.5,14113.0,17 2 )1()1( kg nn snsn S yx yyxx C 176,0 19 1 13 1 .5,15 70,295,2 n 1 n 1 .S XY t yx 2 C calc 5º) Conclusão: tcalc < ttab Não se Rejeita Ho a 5% de probabilidade pelo teste t. Ou seja, os suplementos alimentares são equivalentes. 22 2.3.3.3. Teste de Hipótese para o caso de dados emparelhados Os resultados de duas amostras constituem dados emparelhados quando estão emparelhados dois a dois segundo algum critério que introduz uma influência marcante entre os diversos pares, que supomos, influir igualmente sobre os valores de cada par. Por exemplo, medidas sobre o mesmo indivíduo, antes e depois da aplicação de algum medicamento ou uma ração. Sejam por exemplo: X1i: representa o peso de determinado animal i antes de receber uma ração, X2i: representa o peso do mesmo animal i depois que recebeu a ração. di = X2i – X1i Tomando n animais nestas condições, podemos montar a seguinte tabela: Nº 1 2 ... n X1i X11 X12 ... X1n X2i X21 X22 ... X2n di = X2i – X1i d1 D2 ... dn Nesse teste estaremos testando a hipótese de que a diferença entre a média das duas populações emparelhadas seja igual a um certo valor , o que equivale a testar a hipótese de que a média de todas as diferenças D , seja igual a . n d d n i i 1 , é um estimador de D . Por exemplo, para 0 , as hipóteses seriam: 0: DHo contra 0: 1 DHa , ou 0: 2 DHa , ou 0: 3 DHa . A estatística do teste t é: )(ds Dd t Sob 0: 0 DH )(ds d t . Em que: 11 )(ˆ 1 2 12 2 n n d d n SQD dVS n i n i i i d d n S n dV dV d 2 )(ˆ )(ˆ 23 Exemplos: Ex.1. O quadro abaixo mostra a sequência de observação das pressões de 7 indivíduos antes e depois da aplicação de um medicamento que tem por finalidade baixar a pressão. Verificar se o medicamento teve efeito? %1 Indivíduo 1 2 3 4 5 6 7 Antes (X1) 2,1 3,9 3,1 5,3 5,3 3,4 5,0 Depois (X2) 1,0 1,2 2,1 2,1 3,4 2,2 3,2 di = X2i - X1i Resolução: Indivíduo 1 2 3 4 5 6 7 Antes (X1) 2,1 3,9 3,1 5,3 5,3 3,4 5,0 Depois (X2) 1,0 1,2 2,1 2,1 3,4 2,2 3,2 di = X2i - X1i -1,1 -2,7 -1,0 -3,2 -1,9 -1,2 -1,8 84,1 7 9,121 n d d n i i 7095,0 17 7 9,12 03,28 1 2 1 2 12 2 n n d d S n i n i i i d 1º) 0: 0: DH DH a o 2º) = 1%; Teste t 3º) Gráfico da região crítica: ttab t1%(6) = 3,14 t5%(6) = 1,94 P = 0,0006 4º) 78,5 7 7095,0 84,1 2 n S d t d calc 5º) Conclusão: tcalc < -ttab Rejeita-se Ho a 1% de probabilidade pelo teste t. Ou seja, o medicamento teve efeito significativo para abaixar a pressão. 24 2.4. Exercícios 1. Para verificar a eficácia de uma nova droga foram injetadas doses em 72 ratos, obtendo-se a seguinte tabela: Tamanho da amostra variância Machos 41 43,2 Fêmeas 31 29,5 Testar a igualdade das variâncias sendo = 0,05. 2. A qualidade de rebites é tanto melhor quanto maior for sua homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se obtido as seguintes cargas de ruptura: Rebite 1 2 3 4 5 6 Marca A 34,9 35,5 38,8 39,2 33,7 37,6 Marca B 38,5 39,0 40,7 42,9 37,8 41,4 Estes resultados ratificam as informações do produtor da marca B, de que seus rebites são melhores? Use o nível de significância de 0,01 e 0,05. 3. Os registros dos últimos anos de um colégio atestam, para os calouros admitidos, uma nota média de 115 (teste vocacional). Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se média de 118 e desvio padrão 20. Admitir =0,05, para efetuar o teste. 4. 15 animais foram alimentados com uma certa dieta durante 3 semanas e verificaram-se os seguintes aumentos de pesos: 25 30 32 24 40 34 37 33 34 28 30 32 38 29 31 Testar a hipótese de que a média é 30, sendo = 0,10 (teste bilateral). 5. Uma amostra de seis elementos, extraída de uma população normal, forneceu: 6 1 0,84 i iX e 6 1 2 0,55)( i i XX . Deseja-se saber se a média da população pode ser considerada como superior a 11. Qual a conclusão, = 0,05? 6. Deseja-se saber se duas máquinas de empacotar ração para gatos estão fornecendo o mesmo peso médio por pacote. As amostras disponíveis constam de seis pacotes produzidos pela máquina nova e nove produzidos pela máquina velha. Os pesos, em quilograma, desses pacotes são: Maq. Nova 0,82 0,83 0,79 0,81 0,81 0,80 Maq. Velha 0,79 0,82 0,78 0,77 0,80 0,77 0,76 0,84 0,78 Qual a conclusão? ( = 0,05) 25 7. Deseja-se saber se duas rações alimentares X e Y para determinada raça de suínos são equivalente, ou se a ração X é superior a ração Y no sentido de causar um maior aumento médio de peso. A 11 animais sorteados ao acaso, foi dada a ração X, e a outros 19, a ração Y. Os resultados foram: ( = 0,01) 11n kg40s kg66X x 22 x 19n kg16s kg63Y y 22 y 8. Um experimento deseja testar o efeito de certo fertilizante na produção de milho. Para realizar o experimento tinham-se 12 unidades experimentais de áreas iguais, onde 7 receberam ofertilizante e as outras não; sendo as demais condições mantidas iguais. As produções em kg/unidade experimental foram as seguintes: Com fertilizante 25 35 45 30 20 25 30 Sem fertilizante 35 25 20 15 30 Concluir, usar 05,0 . 9. Os dados abaixo se referem aos pesos, em gramas, de ratos machos da raça Wistar com 15 dias de idade, segundo condições normais e submetidos à extirpação do timo aos 4 dias de idade. Verificar se a extirpação do timo piora o ganho de peso destes animais, 05,0 . Normal 40,3 40,0 39,6 35,2 32,0 Sem timo 18,6 20,3 23,6 22,2 20,9 10. Sem a utilização da análise de variância, comparar as médias de dois grupos experimentais com cinco observações cada: = 0,01. Grupo A 72 75 70 71 68 Grupo B 72 67 72 70 66 11. Com o objetivo de testar certo carrapaticida em bovinos, realizou-se uma pesquisa com 11 animais. Para tanto se realizou uma contagem de carrapatos antes e depois da aplicação do carrapaticida, a qual originou os seguintes dados (n o de carrapatos): Antes 8 6 7 8 9 6 7 8 9 7 6 Depois 4 0 3 5 3 4 2 3 5 1 3 Por meio destes dados e = 0,01, é possível concluir, em termos médios, que o produto utilizado é eficiente para controlar carrapatos? 12. Com o objetivo de testar certa ração no ganho de peso de bovinos, realizou-se uma pesquisa com 10 animais. Para tanto se pesou os animais individualmente antes e depois do período de alimentação, a qual originaram os seguintes dados (kg): Animal 1 2 3 4 5 6 7 8 9 10 Antes 300 330 310 270 280 305 320 360 330 305 Depois 370 375 360 340 340 385 355 410 390 375 Por meio destes dados e = 0,05, é possível concluir, em termos médios, que o ganho de peso foi de 60 kg? 26 13. Na tentativa de selecionar um antígeno identificador da Scistosomiase (ou seja, aquele que, injetado subcutaneamente em pacientes infectados naturalmente, revelar uma área de reação epidérmica maior), foram testados 2 antígenos (A e B) em 11 pacientes, um em cada braço, e após oito minutos a área de reação epidérmica foi medida, em cm 2 . Realizar o teste a = 0,05 e = 0,01. Indivíduo Pedro Paulo Maria José João Neiva Saulo Clara Carla Saul Mara Antígeno A 3,58 1,67 2,70 3,00 0,88 0,97 2,20 3,90 2,85 2,50 1,30 Antígeno B 2,96 0,62 2,08 2,70 0,03 0,41 1,14 3,20 1,93 1,60 0,80 14. Numa pesquisa realizada entre 1198 mulheres em São Paulo, nas idades de 41 a 50 anos, verificou-se 320 mulheres com câncer de mama. Com base nessa amostra, pode-se concluir que mais de 20% das mulheres residentes em São Paulo apresentam câncer de mama? Use = 0,01. 15. O fabricante de uma droga medicinal informa que ela é 90% eficaz em curar certa alergia, em um período de oito horas. Em uma amostra de 200 pessoas que tinham alergia, a droga curou 160 pessoas. A alegação do fabricante é legítima. 16. Para investigar se as crianças negras de uma geração passada apresentavam conscientização racial e preconceito antinegro, Clark (1958) estudou um grupo de 252 crianças negras. A cada uma pediu que escolhesse uma boneca de um grupo de quatro bonecas, duas brancas e duas não brancas, 169 dentre as 252 escolheram bonecas brancas. Pode-se concluir que as crianças negras tinham preconceito em favor das crianças brancas? Use = 0,05. 17. Um fabricante informa que a quantidade de impureza contida em cada pacote de seu produto é de 12,1 mg. Um laboratório fez oito determinações da quantidade de impureza em diferentes pacotes desse composto. Os valores obtidos: 13,4; 12,6; 12,0; 12,0; 12,1; 12,3; 12,5; 12,7 mg. A informação do fabricante é correta. 18. Num estudo comparativo do tempo médio de adaptação para certa amostra aleatória de 50 homens e 50 mulheres, num grande complexo industrial, surgiram as seguintes estatísticas amostrais: Homens Mulheres Tempo médio 3,2 anos 3,7 anos Desvio padrão 0,8 anos 0,9 anos Pode-se concluir a = 0,05 de que os homens tenham tempo médio de adaptação menor que as mulheres? 19. As condições de mortalidade de certa região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,60. Testar essa hipótese = 0,05. Foram amostrados 1000 nascimento aleatoriamente, verificou-se 575 sobreviventes até 60 anos. 27 20. Uma empresa deseja lançar um produto no mercado com um preço de R$ 15,00 por unidade, e deseja saber se o valor médio de mercado está abaixo desse preço. Para tanto, uma amostra de 25 pontos de venda foi coletada, na qual observou-se uma média de R$ 13,50 e uma variância de R$ 4,00. Pressupõe-se que a população tivesse distribuição normal. 21. Um engenheiro florestal deseja verificar se um novo clone de eucalipto (‘clone A’), por ele desenvolvido, supera em produtividade o clone mais utilizado em sua empresa (‘clone B’). Assim, ele instala um experimento, no qual os dois clones são cultivados, cada qual em 15 parcelas. O volume médio de madeira por parcela, para cada clone, foi, respectivamente, 3467,36 mYA e 3291,31 mYB . As variâncias amostrais, entre parcelas, foram: 5469,42 AS e 232 )(4627,6 mSB . 22. Na linha de produção de uma indústria, são fabricados tubos de 2,5 polegadas. Uma nova máquina foi adquirida. O gerente responsável deseja verificar se a variância na produção da nova máquina é equivalente a velha, pois caso isto não ocorra a nova máquina deverá passar por ajustes. Para tanto coleta uma amostra de 26 tubos da máquina velha no qual observou uma variância de 0,02 e uma amostra de 15 tubos da máquina nova no qual observou uma variância de 0,01. 28 RESPOSTAS 1. 2222 :: FMaFMo HvsH Fcal = 1,46, (Ftab = 1,79), Não se rejeita Ho. 2. 2222 :: ABaBAo HvsH Fcal = 1,326, (Ftab = 5,05), Não se rejeita Ho. (a 5%) 3. 115:115: ao HvsH tcal = 0,67 (ttab = -2,09 e 2,09) , Não se rejeita Ho. 4. 30:30: ao HvsH tcal = 1,56 (ttab = -1,76 e 1,76) , Não se rejeita Ho. 5. 11:11: ao HvsH tcal = 2,21 (ttab = 2,02) , Rejeita-se Ho. 6. VNaVNo HvsH :: tcal = 1,71 (ttab = -2,16 e 2,16) , Não se rejeita Ho. 7. yxayXo HvsH :: tcal = 1,597 (ttab = 2,47), Não se rejeita Ho. 8. SCaSCo HvsH :: tcal = 1,06 (ttab = 1,81), Não se rejeita Ho. 9. NSaNSo HvsH :: tcal = -8,81 (ttab = -1,86), Rejeita-se Ho. 10. BAaBAo HvsH :: tcal = 1,057 (ttab = -3,36 e 3,36), Não se Rejeita Ho. 11. 0:0: DHvsDH ao tcal = -10,63 (ttab = 2,76), Rejeita-se Ho. 12. 60:60: DHvsDH ao tcal = -0,23 (ttab = -2,26 e 2,26), Não se Rejeita Ho. 13. 0:0: DHvsDH ao tcal = 10,09 Rejeita-se Ho a 1% de probabilidade. 14. 200200 ,:,: pHvspH ao zcal = 5,81 Rejeita-se Ho a 1% de probabilidade. 15. 900900 ,:,: pHvspH ao zcal = -4,71 Rejeita-se Ho a 1% de probabilidade. 16. 500500 ,:,: pHvspH ao zcal = 5,42 Rejeita-se Ho a 5% de probabilidade. 17. 112112 ,:,: ao HvsH tcal = 2,11 (ttab = -2,36 e 2,36), Não se Rejeita Ho. 18. MHaMHo HvsH :: tcal = 2,94 (ttab = 1,66), Rejeita-se Ho. 19. 600600 ,:,: pHvspH ao zcal = -1,61 Não se rejeita-se Ho a 5% de prob. Bons estudos! 29 Cap. 3 - Princípios Básicos da Experimentação 3.1. Introdução A experimentação tem por objetivo o estudo dos experimentos, isto é, seu planejamento, execução, análise dos dados e interpretação dos resultados (BANZATTO e KRONKA,1989). 3.2. Alguns Conceitos Básicos a. Experimento ou ensaio: é um trabalho previamente planejado, que segue determinados princípios básicos e no qual se faz a comparação dos efeitos dos tratamentos. b. Tratamento: é o método, elemento ou material cujo efeito desejamos medir ou comparar em um experimento. Exemplos: variedades de milho, níveis de proteína na ração, tipos de aleitamento de bezerros, diferentes tempos e temperaturas de pasteurização do leite e outros. c. Unidade experimental ou parcela: é a unidade que vai receber o tratamento e fornecer os dados que deverão refletir o seu efeito. Por exemplo, em experimentos de alimentação de suínos, a parcela pode ser de 1 leitão ou um grupo de leitões. Em ensaios de competição de forrageiras, a parcela pode ser uma única linha de 10 m de comprimento, ou 2 a 4 linhas, de mesmo tamanho, que serão colhidas e pesadas em conjunto. Em experimentos conduzidos em casa de vegetação a parcela pode ser um vaso; ou em laboratório, uma placa de Petri com um meio de cultura etc. d. Delineamento experimental: é o plano utilizado na experimentação e implica na forma como os tratamentos serão designados às unidades experimentais. Exemplos: delineamento inteiramente casualizado (DIC), delineamento em blocos casualizados (DBC) e delineamento em quadrado latino (DQL). A pesquisa científica está constantemente utilizando experimentos para provar suas hipóteses. É claro que os experimentos variam de uma pesquisa para outra, porém, todos eles são regidos por alguns princípios básicos, necessários para que as conclusões que venham a ser obtidas se tornem válidas. 3.3. Princípios Básicos da Experimentação São três os princípios básicos da experimentação: repetição, casualização e controle local. 3.3.1. Princípio da Repetição O princípio da repetição consiste na reprodução do experimento básico e tem por finalidade propiciar a obtenção de uma estimativa do erro experimental. A repetição consiste em aplicar o mesmo tratamento a várias parcelas num mesmo experimento. Ao se comparar, por exemplo, duas rações (A e B), aplicadas a duas parcelas constituídas, cada uma por 2 leitões perfeitamente iguais, apenas o fato da ração A ter propiciado um maior ganho de peso que a ração B, não é suficiente para que possamos concluir que a ração A é mais eficiente, pois esse seu melhor desempenho poderá ter ocorrido por simples acaso. Por outro lado, se as duas rações forem aplicadas a várias parcelas e, ainda assim, verificarmos que a ração A apresenta, em média, maior ganho de peso, então já existe um indicativo de que ela seja mais eficiente, ou seja, podemos afirmar que a possibilidade deste resultado ter sido obtido por mero acaso é bastante reduzida, transmitindo então um maior grau de confiabilidade na conclusão obtida. Não existe uma regra dizendo qual deve ser o número de repetições. Isto depende do conhecimento do pesquisador sobre o assunto e do conjunto de condições em que será realizado o experimento. Como regra prática, aplicável a uma grande maioria dos casos, GOMES (1987) relata que os experimentos devem ter pelo menos 20 parcelas e 10 g. l. para o resíduo. Quanto maior é o número de repetições, maior será a precisão do experimento. Porém esta relação vale até determinado número de repetições, pois além deste, o incremento na precisão não é significativo. 30 3.3.2. Princípio da Casualização Considerando o exemplo utilizado anteriormente, apesar de termos várias parcelas das rações A e B, pode ocorrer que a ração A tenha apresentado maior ganho de peso médio, por ter sido favorecida por algum fator qualquer, como por exemplo, ter todas as suas parcelas destinadas a animais com maior potencial genético. Para evitar que uma das rações seja sistematicamente favorecida por qualquer fator externo, procedemos a casualização das rações, ou seja, as rações serão distribuídas de maneira aleatória às parcelas. Desta maneira, as rações têm a mesma probabilidade de ser destinada a qualquer parcela. Como podemos ver, o princípio da casualização tem por finalidade propiciar, a todos os tratamentos, a mesma chance de serem designados a qualquer uma das unidades experimentais, evitando assim que nenhum dos tratamentos seja sistematicamente favorecido ou desfavorecido por fatores externos. O princípio da casualização se faz necessário para que as variações que contribuem para o erro experimental, sejam convertidas em variáveis aleatórias. Além disso, a casualização: a. permite obter uma estimativa válida do erro experimental; e b. garante o uso de testes de significância por tornar os erros experimentais independentes. Vale ressaltar que sem os princípios básicos da repetição e da casualização não existe experimentação. 3.3.3. Princípio do Controle Local É um princípio muito usado, mas não é obrigatório, pois podemos realizar experimentos sem utilizá-lo. A finalidade do princípio do controle local é dividir um ambiente heterogêneo em sub-ambientes homogêneos e tornar o delineamento experimental mais eficiente, pela redução do erro experimental. Considerando o exemplo usado anteriormente, suponha que tenhamos leitões com idades muito diferentes. Diante disto, leitões com idades diferentes podem apresentar taxas de crescimento diferenciadas, portanto não podemos distribuir as rações inteiramente ao acaso. O princípio do controle local consiste em dividirmos este grupo heterogêneo quanto à idade em subgrupos homogêneos. Estes subgrupos assim formados são chamados de blocos e, as rações são distribuídas, de maneira casualizada, dentro de cada bloco. A utilização do princípio do controle local sempre conduz a uma redução do número de graus de liberdade do resíduo, o que causa uma desvantagem. Entretanto, essa desvantagem geralmente é compensada, pois ocorrerá também uma redução na soma de quadrados do resíduo, obtendo-se, assim, maior precisão para o experimento, pois há uma redução na variância residual, devido se isolar o efeito dos fatores que normalmente seriam incluídos no resíduo. A formação dos blocos corresponde a uma estratificação e a casualização dos tratamentos às unidades experimentais sofre a restrição de ser dentro de cada bloco. Poderá haver, grande variação de um bloco para os outros, isto não importa. O que importa é que cada bloco seja o mais uniforme possível. Em experimentos com animais, a uniformidade da aplicação dos tratamentos deve ser observada com atenção. Às vezes parece que um tratamento pode ser aplicado sem maiores problemas e que os animais irão desfrutá-lo igualmente. É preciso um pouco de experiência para verificar que nem sempre isto é alcançado, em face de algum tipo de problema técnico ou de infraestrutura. Por exemplo, em uma baia com 16 leitões (onde cada um será uma repetição) um comedouro mal projetado não proporcionará a mesma facilidade de alimentação a todos os animais da baia. Então, a variação individual será superestimada por conter o efeito individual que normalmente existiria acrescido da hierarquia observada entre eles. Se os tratamentos são impostos por injeções, o grupo controle precisa receber uma de igual volume, de material inerte (soro fisiológico). Assim, todos os animais sofrerão o mesmo estresse, sem que haja o confundimento deste com o efeito de cada tratamento. 31 3.4. Fontes de Variação de um Experimento Em um experimento podem ocorrer as seguintes fontes de variação: 3.4.1. Premeditada É aquela introduzida pelo pesquisador com a finalidade de fazer as comparações. Por exemplo: tratamentos. 3.4.2. Sistemática Variações não intencionais, mas de natureza conhecida. Variaçãoinerente ao material experimental. Podem ser controladas pelo pesquisador, por meio de blocos. Por exemplo: heterogeneidade do solo, tamanho de semente, idade de leitões, entre outros. 3.4.3. Aleatória São variações de origem desconhecida, não podendo ser controladas. Constituem o erro experimental. São devidas a duas fontes: variações no material experimental e falta de uniformidade nas condições experimentais. Nem sempre é possível distinguir claramente este tipo de variação da anterior. 3.5. Situações Experimentais A estratégia de análise dos resultados, bem como o planejamento amostral, irá depender do tipo de resposta medida e da situação experimental pertinente. As situações experimentais mais frequentes são: a) O pesquisador não planeja um experimento, mas executa um levantamento de dados dentro de um universo disponível e verifica a ocorrência de determinada resposta. Exemplo: influência de fatores genéticos (sexo do animal, pai da vaca) e circunstanciais (mês e ano do parto, idade da vaca) sobre a produção de leite de vacas de um mesmo criatório. b) O pesquisador planeja o experimento, utilizando unidades experimentais que serão submetidas a diferentes tratamentos, para posterior mensuração das respostas desejadas e comparação daqueles tratamentos. Exemplos: comparação de desempenho (peso em kg) de diferentes linhagens de aves de corte aos 40 dias de idade. Avaliação da digestibilidade in vitro de diferentes forrageiras tropicais, cortadas a uma mesma idade. A unidade experimental neste caso é cada amostra da forrageira obtida de diferentes canteiros no campo, colocada em um becher e ali incubada durante um tempo definido. 32 3.6. Resposta Medida Na experimentação existem as mais variadas formas de resultados a serem obtidos. A resposta medida (poderá existir mais de uma) deverá ser definida no planejamento do experimento. Devido a sua capacidade de variação as respostas são chamadas de variáveis aleatórias e podem ser assim classificadas: a) Quanto à categoria: a.1- Variáveis Quantitativas, são aquelas com magnitudes numéricas geralmente expressas em unidades específicas, em frequência absoluta, em percentual, ou mesmo adimensionais. Exemplos: área de lombos em suínos, mortalidade de pintos de um dia, conversão alimentar. a.2- Variáveis Qualitativas, são aquelas expressas por categoria sem que possam ser matemati- camente quantificadas. Exemplos: prenhez (positiva ou negativa), grau de necrose (inexistente, leve, moderada, grave). b) Quanto à continuidade. b.1- Variáveis contínuas, são aquelas cuja magnitude pode variar continuamente dentro de um intervalo, normalmente proveniente de medições. Exemplos: tempo de anestesia em cães, produção diária de leite. b.2- Variáveis discretas ou descontínuas, são aquelas cuja magnitude só pode ser expressa em valores inteiros, sem frações. Normalmente proveniente de contagens. Exemplos: tamanho da leitegada, número de insetos capturados em uma armadilha. c) Quanto ao fluxo de resposta. c.1- Variáveis de fluxo continuado, são aquelas que podem ser obtidas pela reutilização da unidade experimental permitindo a avaliação de respostas sob diferentes condições experimentais sequenciais. Exemplo: digestibilidade da matéria seca de forrageiras em ruminantes, frequência cardíaca de cães anestesiados. c.2- Variáveis de fluxo descontínuo ou transversais, são aquelas em que a resposta só poderá ser obtida uma única vez na mesma unidade experimental. Exemplo: peso a desmama em suínos, produção de carne. d) Quanto ao tipo de distribuição. d.1- Variáveis com distribuição normal, apresentam maiores frequências para valores centrais próximos a média, diminuindo simetricamente sua ocorrência a medida que a resposta se afasta daquele valor central. Exemplos: altura na cernelha de cavalos, peso médio de frangos aos 40 dias de idade. d.2- Variáveis sem distribuição normal, apresentando assimetrias diversas ou características peculiares diferentes daquelas da distribuição normal. Exemplo: distribuição de salários dos empregados de uma empresa, neste caso, nitidamente valores mais baixos apresentarão maior frequência que valores superiores. e) Quanto à instabilidade, ou seja, a capacidade de variação considerando as mesmas condições. e.1- Variáveis pouco instáveis, quando o intervalo de variação é pequeno, normalmente uma característica própria da variável. Exemplo: degradação de matéria seca, período de gestação de bovinos. e.2- Variáveis muito instáveis, quando há uma grande variação nos valores observados, originados pela própria natureza da variável ou pela dificuldade de mensuração. Exemplos: titulação de anticorpos do soro, tempo de consolidação de fratura óssea em cães. 33 3.7. A Unidade Experimental Entende-se por unidade experimental cada repetição para um determinado tratamento. Geralmente ela é composta de apenas um animal (no caso de experimentação com animais). Há casos, entretanto, que por insuficiência de material para análise laboratorial, dificuldade de mensuração ou por condição de criação comercial, a unidade experimental é composta por mais de um animal ou planta, embora continue a representar apenas uma unidade experimental. Os casos mais comuns para contornar aquelas condições adversas são: Amostra composta (pool de indivíduos) Resposta média de grupo de indivíduos Resposta média de observações de um mesmo indivíduo. 3.7.1. Amostra composta Quando o material colhido de apenas um indivíduo se mostra insuficiente para atender uma análise laboratorial ou sorológica, é preciso reunir um grupo de indivíduos para garantir aquela quantidade necessária. Todas as repetições de cada tratamento devem ser obtidas de pool de mesmo tamanho. Este é o caso da análise de sólidos totais em gema de ovos, onde é necessário reunir de 2 a 3 gemas para se obter um resultado detectável. Um pool representará uma repetição. O pool de diversos animais subdividido posteriormente em p alíquotas não representarão p repetições e sim p réplicas, cuja média será uma repetição. 3.7.2. Resposta média de um grupo de indivíduos Quando o pesquisador deseja reproduzir as condições comercias de criação, o controle sobre cada animal fica comprometido. A solução é utilizar a média de alguns deles amostrados dentro de uma repetição comercial de cada um dos tratamentos. As repetições comerciais seriam, em caso de aves de corte, os boxes contendo mais de 200 aves (de onde seriam amostradas apenas 20 ou 30), ou mesmo no caso de suínos, baias coletivas de 16 animais (onde embora podemos utilizar o peso individual de indivíduos não podemos fazer o mesmo em relação ao consumo de ração, que terá que ser representado pelo peso médio). 3.7.3. Resposta média de observações no mesmo indivíduo A única justificativa para a avaliação múltipla de resposta no mesmo indivíduo é a dificuldade de mensuração da resposta, quer pelo método empregado para tal ou pela alta variabilidade da resposta. Com este procedimento cada observação passa a ser definida pelo valor mais provável da resposta naquele animal, ou seja, pela média das determinações obtidas. Estão nesse caso respostas que dependem de análises laboratoriais muito sensíveis com amplo espectro de variação de resultados para uma mesma amostra. 34 3.8. Tamanho de um Experimento Segundo GOMES (1987), na experimentação agrícola ou zootécnica a experiência indica que dificilmente seconsegue resultados razoáveis com ensaios que tenham menos de 20 unidades experimentais. Este número deve ser tomado, pois, em geral, como mínimo. Outra indicação útil é que devemos ter, em geral, pelo menos, 10 graus de liberdade para o resíduo. Estas duas restrições, embora muito úteis na pratica, podem ser deixadas de lado em alguns casos. Tal ocorre nos experimentos de grande precisão, ou então quando temos um grupo numeroso de experimentos, que serão estudados em conjunto, tendo em vista unicamente resultados gerais. Neste caso cada experimento tem individualmente pouco valor e, pois, podemos, se necessário, reduzir o número de repetições a fim de aumentar o número de ensaios. Por outro lado, a idéia dos testes de hipótese podem ser usada para sugerir um certo número de repetições a serem utilizadas num experimento. Com esta finalidade pode ser utilizado o procedimento do teste de Tukey, discutido a seguir. Precisa-se, primeiramente, de uma estimativa prévia da variância residual ( 2 1S ), com n1 graus de liberdade, obtidos normalmente de experimentos anteriores conduzidos em condições análogas. Além disso, deve-se fixar a diferença mínima d que deverá ser comprovada estatisticamente pelo ensaio. Então, sendo q a amplitude total estudentizada para o experimento a ser realizado (com n médias e n3 g.l. do resíduo do novo experimento). Sendo F o valor da tabela de Fisher, ao nível de probabilidade escolhido, com números de graus de liberdade n2 (do novo experimento) e n1 (g.l. do resíduo do experimento anterior) o número de repetições r é dado pela seguinte fórmula: 2 2 1 2 d FSq r Como os valores de q e F a serem utilizados no segundo membro dependem de r, é claro que só se pode obter uma solução por aproximações sucessivas, a partir de uma tentativa inicial qualquer. Este número de repetições nos garantirá uma probabilidade de que o ensaio não venha comprovar a diferença d, isto é, uma probabilidade (1 - ) de que esta diferença seja comprovada estatisticamente, pelo teste de Tukey. Obs.: Outros procedimentos existem para determinação do número mínimo de repetições. 35 Cap. 4 - Delineamento Inteiramente Casualizado (DIC) 4.1. Introdução O Delineamento Inteiramente Casualizado é o mais simples de todos os delineamentos experimentais. A distribuição dos tratamentos às unidades experimentais é feita completamente ao acaso, ou seja, não é feita nenhuma restrição na casualização. Este é o delineamento básico, os demais se originam dele pela imposição de restrições (controle local). Envolve dois princípios básicos da experimentação: repetição e casualização. É indicado quando as condições experimentais são homogêneas sendo mais recomendado em condições de laboratório, onde as condições ambientais podem ser melhor controladas. Para a instalação desses experimentos no campo, deve-se ter certeza da homogeneidade das condições ambientais e do material experimental. 4.2. Vantagens e Desvantagens do DIC 4.2.1. Vantagens: a) pode ser usado com qualquer número de tratamentos e repetições, sendo que o número de repetições pode variar de um tratamento para outro sem que isto venha dificultar a análise. No entanto, sempre que possível, deve-se usar o mesmo número de repetições; b) apresenta maior número de graus de liberdade associado ao resíduo em relação a outros delineamentos. 4.2.2. Desvantagens: a) exige homogeneidade total das condições experimentais; b) pode conduzir a uma estimativa de variância residual bastante alta, uma vez que, não se utilizando o princípio do controle local, todas as variações exceto as devidas a tratamentos, são consideradas como variação do acaso. 4.3. Modelo Estatístico Para todos os delineamentos estudados são lançados modelos estatísticos. Este modelo estatístico visa identificar que fatores estão influenciando a variável em estudo. Para o DIC tem-se o seguinte modelo: ijiij tmY em que ijY é o valor observado para a variável em estudo referente ao i-ésimo tratamento na j- ésima repetição; m é a média de todas as unidades experimentais para a variável em estudo; it é o efeito do particular tratamento i no valor da observação ijY ; mmt ii ij é o erro associado a observação ijY . iijij mY O erro se deve ao fato de não ser possível controlar todas as condições experimentais. O erro experimental se refere às variações observadas entre as repetições do mesmo tratamento. 36 4.4. Quadro de Tabulação dos Dados A título de exemplo, considere um experimento instalado no DIC com I tratamento e ri repetições. A coleta de dados da pesquisa pode ser resumida, num quadro do tipo a seguir: Repetições Totais Tratamentos 1 2 ... ri Tratamentos 1 Y11 Y12 ... Y1r1 T1 2 Y21 Y22 ... Y2r2 T2 ... ... ... ... ... … I YI1 YI2 ... YIrI TI G Deste quadro pode-se retirar algumas informações de interesse: n° de unidades experimentais: I 1i irN Total geral: .. I 1i i I 1i ri 1j ij YTYG Total para o tratamento i: .i ri 1j iji YYT Média para o tratamento i: i i i r T mˆ Média geral do experimento: N G mˆ . 4.5. Análise de Variância (ANOVA) É uma técnica de análise estatística desenvolvida por R. A. Fisher em 1925, publicada no trabalho intitulado “Statistical methods for research workers”, esta técnica permite decompor a variação total, ou seja, a variação existente entre todas as observações, na variação devido à diferença entre os efeitos dos tratamentos e na variação devido ao acaso, que também é denominada de erro experimental ou resíduo. No entanto, para que esta técnica seja empregada é necessário que sejam satisfeitas as seguintes pressuposições: 1º) Independência dos erros: os erros ou desvios ij , devidos aos efeitos de fatores não controlados, devem ser independentes. Isto implica que os efeitos de tratamentos sejam independentes, que não haja correlação entre eles. Isto pode não ocorrer quando os tratamentos são doses crescentes de adubos, inseticidas, temperatura etc. Ocasião que a análise de variância deve ser feita estudando a regressão. 2º) Homogeneidade de variância: os erros ou desvios ij , devido ao efeito de fatores não controlados devem possuir uma variância comum 2 . Isto significa que a variabilidade das repetições de um tratamento deve ser semelhante à dos outros tratamentos, isto é, os tratamentos devem possuir variâncias homogêneas. 3º) Normalidade: os erros ou desvios ij , devido ao efeito de fatores não controlados devem possuir uma distribuição normal de probabilidades. Foram desenvolvidos vários testes para verificação das pressuposições da análise de variância. Pode acontecer que uma ou mais dessas pressuposições não se verifique e, então, antes de proceder a análise de variância, os dados experimentais devem ser transformados. São exemplos: transformação logarítmica, raiz quadrada, arco seno etc. No entanto, se não for possível encontrar uma transformação que atenda as pressuposições da análise de variância, deve-se então utilizar um teste não paramétrico. 37 Partindo do modelo estatístico, pode-se decompor a variação total entre as observações nas partes que a compõem, como será demonstrado a seguir. Seja um experimento instalado com o objetivo de testar 3 tratamentos, com 4 repetições. Repetições Totais de Tratamentos 1
Compartilhar