Baixe o app para aproveitar ainda mais
Prévia do material em texto
2017 UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO INSTITUTO DE CIÊNCIAS EXATAS Departamento de Matemática Área Estatística IC 283 – BIOESTATÍSTICA IC 284 – ESTATÍSTICA EXPERIMENTAL Esta apostila constitui o material didático básico das disciplinas IC 283 – Bioestatística e IC 284 – Estatística Experimental. Nas aulas serão feitas complementações com o objetivo de atualizar e facilitar o entendimento do material didático apresentado. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 1 CONTEÚDO I DISTRIBUIÇÃO AMOSTRAL E INTERVALO DE CONFIANÇA 1 – INTRODUÇÃO Grande parte dos trabalhos científicos utiliza amostras aleatórias extraídas de uma população, na qual se deseja fazer um determinado estudo. As medidas descritivas numéricas calculadas a partir dessas amostras são definidas como Estatísticas (Média Amostral, Variância Amostral, Desvio Padrão Amostral, etc). A Inferência Estatística é uma área da estatística que tem por objetivo obter informações relativas a uma população por meio da utilização de amostras dela extraídas. Nas populações, as medidas descritivas numéricas são denominadas de parâmetros (Média, Variância, Desvio Padrão, etc). Um dos problemas da estatística é a estimativa desses parâmetros populacionais, mediante o uso de amostras (estatísticas). 1.1 Métodos utilizados para estimar um parâmetro populacional � Estimação por ponto: Inferência com base em um único valor numérico (estatística). Por exemplo, a estimativa pontual da média populacional (µ) é feita por um valor (Média Amostral: X ); � Estimação por intervalo: Inferência mediante a uma amplitude de dois valores numéricos a e b (a < b), entre os quais se espera que o parâmetro esteja contido. As estimativas por intervalo são preferíveis às estimativas por ponto por apresentarem uma precisão, denominada grau de confiança ou nível de confiança. Por exemplo, ao dizermos que o diâmetro médio da artéria aorta em bovino é de 1,75 cm tem-se uma estimativa por ponto. Entretanto, se for dito que o diâmetro mede 1,75 ± 0,05 cm, a estimativa é por intervalo, no qual se infere que o diâmetro da aorta está entre 1,70 e 1,80 cm para um determinado nível de confiança (c). � Testes de Hipóteses: Método a ser detalhado ao longo do Conteúdo II, no qual se aplicam testes específicos para inferir sobre hipóteses (afirmações) previamente formuladas a respeito de um parâmetro populacional. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 2 2 – DEFINIÇÕES � População: é o conjunto de todos os elementos sobre os quais desejamos desenvolver determinado estudo; � Amostra: é uma parte desses elementos da população, ou seja, qualquer subconjunto da população; � Parâmetro: é uma medida utilizada para descrever uma característica da população; � Estatística: é uma medida utilizada para descrever uma característica da amostra, ou seja, uma estatística T é uma função de X1, X2, X3, ..., Xn → T = f (X1, X2, X3, ..., Xn); � Estimador: é qualquer estatística T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma quantia desconhecida (parâmetro). Em geral, ele é representado por uma determinada fórmula; � Estimativa: é o valor numérico assumido pelo estimador quando os valores observados (X1, X2, X3, ..., Xn) são considerados. 3 – DISTRIBUIÇÃO AMOSTRAL DA MÉDIA A Distribuição Amostral de determinada estatística é a distribuição de todos os possíveis valores que ela pode assumir, calculados a partir de todas as possíveis amostras de tamanho “n”. Toda estatística, sendo uma função de uma amostra aleatória (X1; X2; ...; Xn), é uma variável aleatória e, consequentemente, apresenta uma distribuição de probabilidade. No caso das estatísticas, a distribuição de probabilidade é denominada Distribuição de Amostral. Esquematicamente, considere uma população X, onde θ é o parâmetro de interesse na população e t é o valor da estatística T para cada amostra extraída: Para exemplificar, consideremos a Distribuição Amostral da Média, em que: para determinado tamanho da amostra “n”, tomada de uma população com média “µ”, o valor da média amostral ( X ) irá variar de uma amostra para outra. A Distribuição Amostral da Média é descrita para determinar o valor esperado [E( X )] e o desvio padrão [σ( X )] da distribuição IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 3 das médias. O desvio padrão da média [σ( X )] também pode ser definido como Erro Padrão da Média. Seja X1; X2; ...; Xn uma amostra aleatória de tamanho n de uma população representada pela variável aleatória X com média µ e variância 2σ . Então: E( X ) = µ σ 2 ( X ) = n 2σ ∴ σ( X ) = n σ Se o desvio padrão da população (σ) for desconhecido o erro padrão da média pode ser estimado por meio do desvio padrão amostral (s ou DP). s( X ) = DP( X ) = n s = n DP 4 – INTERVALO DE CONFIANÇA (IC) Seja X1; X2; ...; Xn uma amostra aleatória de tamanho n e θ um parâmetro desconhecido da população. Um Intervalo de Confiança para θ é um intervalo construído a partir das observações da amostra, de modo que ele inclui o verdadeiro e desconhecido valor de θ, com uma específica e alta probabilidade. Esta probabilidade é denotada por “c” ou “1 – α”, definida como grau de confiança ou nível de confiança: P(a < θ < b) = 1 - α Assim, o intervalo ]a ; b[ é chamado de intervalo com 100(1 – α)% de confiança para o parâmetro θ, em que a e b são os limites de confiança, inferior e superior, respectivamente, do intervalo. O comprimento/amplitude do intervalo pode ser obtido pela diferença entre os limites superior e inferior (b – a). 4.1 IC para a média populacional (µ): σ2 conhecida O desenvolvimento de intervalos de confiança para µ é baseado na distribuição amostral de X . Neste caso, considera-se que a amostra siga comportamento aproximadamente normal ≈ N (0;1), sendo utilizada a tabela da Distribuição Normal (Z) para construção dos intervalos, como segue: P +≤≤− n ZX n ZX σµσ αα 22 = 1 – α IC (µ) 1 – α: X ± n Z σα 2 IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 4 Note que, o comprimento do IC também pode ser obtido pela expressão: Comprimento IC = 2 n Z σα 2 Caso sejam mantidos os valores de “n” e “1 – α” o comprimento do intervalo será fixo/constante. Já a estimativa da média amostral ( X ) continua sendo uma variável aleatória, determinando os limites do intervalo de acordo com a amostra considerada. Interpretação do IC: Tem-se 100 (1 – α)% de confiança de que o parâmetro populacional (µ) esteja compreendido no intervalo obtido. Ou mesmo: Se construirmos n intervalos do mesmo tipo (tamanho e nível de confiança), espera-se que em 100 (1 – α)% deles contenha o verdadeiro parâmetro (µ). 4.2 IC para a média populacional (µ): σ2 desconhecida Quando a variância populacional (σ2) ou o desvio padrão populacional (σ) não forem conhecidos, podemos substituí-los pelas suas estatísticas: variância amostral (s2) e desvio padrão amostral (s), respectivamente. Em que “s” é a raiz quadrada da “s2”. A pressuposição da distribuição normal é garantida para amostras grandes (n > 30), ou mesmo amostras menores, desde que ela tenha sido extraída de uma população com distribuição normal e σ2 e/ou σ conhecidos. Para amostras pequenas em que não se pode afirmar sobre sua normalidade, adistribuição normal deve ser substituída pela Distribuição t de Student com n – 1 graus de liberdade (gl). IC (µ) 1 – α: X ± n s t 2 α … ..)1( 2 lgnt −α O Grau de Liberdade é conceituado como o número de valores independentes de uma estatística. Tomando como exemplo o estimador s2 de σ2: 1n )xx( s 2 i2 − − = ∑ A quantidade (n – 1) graus de liberdade representa o numerador do estimador de s2 para um tamanho amostral n, ou seja, calculando-se (n – 1) desvios (independentes): )xx(,),xx(),xx( 1n21 −−− −K , o remanescente )xx( n − pode ser obtido por diferença, pois 0)xx( i =−∑ . IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 5 O comprimento do intervalo 2 n s t 2 α é uma variável aleatória, assim como a média amostral ( X ), pois envolve o desvio padrão amostral (s), mesmo sendo mantido o tamanho da amostra (n) e o nível de confiança (n – 1). Interpretação do IC: Tem-se 100 (1 – α)% de confiança de que o parâmetro populacional (µ) esteja compreendido no intervalo obtido. Ou mesmo: Se construirmos n intervalos do mesmo tipo (tamanho e nível de confiança), espera-se que em 100 (1 – α)% deles contenha o verdadeiro parâmetro (µ). EXERCÍCIOS PROPOSTOS 1 – Uma Variável Aleatória X tem distribuição normal, com média 100 e desvio padrão 10. a) Se X é a média de uma amostra de 25 elementos, calcular P (95 < X < 105); b) Qual tamanho deveria ter a amostra para que P (90 < X < 110) fosse obtido a 95% de confiança? 2 – Considere uma amostra de 100 animais da raça Nelore, onde o peso médio a desmama foi de 171,70 kg. Suponha que o desvio padrão da população (σ) seja igual a 7,79 kg. a) Determinar um IC de 95% para a média µ; b) Qual o tamanho da amostra (n) para o intervalo obtido? “IC (µ)95%: 171,70 ± 1,03” c) Com a amostra de 100 animais foi obtido o intervalo 171,70 ± 1,45. Determinar o nível de confiança (%) utilizado para obter este intervalo. 3 – Uma amostra de 10 cães sofrendo de uma determinada doença apresentou um tempo de sobrevivência médio de 46,9 meses e o desvio padrão de 43,3 meses. a) Determinar os limites de confiança de 90% para a média µ; b) O comprimento do intervalo obtido na alínea a. EXERCÍCIOS COMPLEMENTARES 1 – Seja X a duração da vida de uma peça de equipamento tal que σ = 5 horas. Admita que 100 peças foram ensaiadas fornecendo uma duração de vida média de X = 500 horas. a) Obter um intervalo de 95% para a média µ; b) Qual o tamanho da amostra para o intervalo obtido? “IC (µ)95%: 500 ± 1,63” c) Com a amostra de 100 peças foi obtido o intervalo 500 ± 0,765. Determinar o nível de confiança (%) utilizado para obter este intervalo; 2 – Em uma amostra aleatória de 25 crianças de uma determinada comunidade encontrou-se altura média 150 cm e desvio padrão 5 cm. Determinar: a) Um intervalo de 95% de confiança para a altura média da população; b) O comprimento do intervalo obtido na letra “a”. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 6 3 – Uma agência de propaganda, que atende a uma das principais estações de rádio, gostaria de calcular a quantidade média de tempo que a audiência gasta diariamente ouvindo rádio. A partir de diversos estudos anteriores, o desvio padrão é definido em 45 minutos. Determinar: a) O tamanho da amostra necessário caso a agência queira ter 90% de confiança de estar correta em um intervalo de ± 5 minutos; b) Se for desejado um nível de 99% de confiança, qual seria o novo tamanho da amostra necessário para o mesmo intervalo da alínea anterior (± 5 minutos)? c) Faça inferências a respeito dos tamanhos das amostras encontrados nas alíneas anteriores (a e b), explicando o motivo de ter encontrado dimensões distintas. 4 – O tempo de reação de um novo medicamento é a característica/variável avaliada em uma pesquisa. Deseja-se fazer inferência sobre a média que é desconhecida por meio de um intervalo de confiança. Vinte pacientes foram sorteados ao acaso e tiveram seu tempo de reação anotado. Os dados foram os seguintes (em minutos): 2,9 3,4 3,5 4,1 4,6 4,7 4,5 3,8 5,3 4,9 4,8 5,7 5,8 5,0 3,4 5,9 6,3 4,6 5,5 6,2 a) Obter um intervalo de 95% de confiança para a média do tempo de reação; b) Obter um intervalo de 99% de confiança para a média do tempo de reação; c) Estabelecer a amplitude (comprimento) para cada intervalo de confiança obtido nas alíneas anteriores (a e b). Faça inferências pertinentes ao comprimento. 5 – Estudos anteriores levam a supor que crianças de dois meses alimentadas exclusivamente com leite do tipo A sofrem aumento de peso, com média desconhecida, porém de variância 9.000 gramas2. Escolhe-se ao acaso 20 crianças de dois meses, alimentando-as exclusivamente com leite do tipo A. Nesta amostra o aumento de peso médio foi de 475 gramas. Obter um intervalo de 99% de confiança para o aumento médio do peso das crianças nas condições apresentadas. 6 – O consumo mensal de calorias (kcal/g) de certa espécie de esquilos apresentou desvio padrão 0,16. Recolheu-se uma amostra aleatória de dimensão 18 cuja média amostral foi de 0,41. a) Obter um intervalo de confiança a 95% para o consumo médio de calorias; b) Qual deve ser a dimensão da amostra para que um intervalo de confiança a 95% para a média tenha amplitude 0,2? 7 – Um experimento, composto por 12 animais, foi alimentado com uma dieta especial durante determinado tempo e verificou-se que os ganhos de peso (em kg) foram de: 25 – 22 – 30 – 26 – 24 – 39 – 32 – 26 – 32 – 33 – 28 – 30. Encontrar os limites de confiança para a média de ganho de peso ao nível de 90% de probabilidade. 8 – Qual deve ser a dimensão da amostra a recolher de uma população normal de valor médio µ e desvio padrão 10 de modo que o intervalo de confiança para µ a 99% tenha amplitude 1? 9 – Uma amostra de 60 camarões de água doce apresentou, para o comprimento dos corpos, uma média de 5,315 cm e um desvio padrão de 0,8293 cm. a) Determinar um intervalo de confiança a 99% para a média da população; b) Qual o erro padrão associado à média da amostra? IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 7 10 – A altura (em mm) da espuma de sabão em uma bacia é importante para os fabricantes de detergentes. Foi efetuada uma experiência colocando a mesma quantidade de detergente em 10 bacias de tamanho padrão e, depois de certa agitação da água, mediu-se a altura da espuma. Obtiveram-se os seguintes resultados: 229 10 1 =∑ =i ix ; ( ) 553.110 1 2 =−∑ =i i xx a) Determinar uma estimativa pontual para a média e para o desvio padrão; b) Determinar um intervalo de confiança de 99% para a média; c) Comente os dois tipos de estimativa obtidos para a média (alíneas a e b). GABARITO 1 – a) 499,02 ≤≤ µ 500,98 b) n = 36,15 ≈ 37 c) c = 0,874 = 87,4% 2 – a) 147,936 ≤≤ µ 152,064 b) Comprimento IC = 4,128 3 – a) n = 220,52 ≈ 221 b) n = 539,17 ≈ 540 4 – a) 4,279 ≤≤ µ 5,211 b) 4,108 ≤≤ µ 5,382 c) Comprimento(a) = 0,932 ; Comprimento (b) = 1,274 5 – 420,27 ≤≤ µ 529,73 6 – a) 0,3361 ≤≤ µ 0,4839 b) n = 9,83 ≈ 10 7 – 26,473 ≤≤ µ 31,367 8 – n = 2.662,56 ≈ 2.663 9 – a) 5,03 ≤≤ µ 5,6 b) X s = 0,10706 10 – a) X = 22,9 ; s = 13,136 b) 9,4 ≤≤ µ 36,4 IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 8 CONTEÚDOII TESTES DE HIPÓTESES 1 – INTRODUÇÃO Os Testes de Hipóteses representam uma das áreas da Inferência Estatística. Sua utilização permite ao pesquisador fazer inferências a respeito de uma população a partir de uma ou mais amostras representativas da população da qual as amostras foram retiradas. Com frequência utilizamos a inferência para tomarmos certas decisões. Por exemplo, quando vamos à feira/mercado para comprar frutas podemos experimentar uma unidade e depois inferir se levaremos ou não; na compra de um automóvel podemos fazer um teste drive e após inferir sobre sua compra; assim como na aquisição de um imóvel, em que avaliamos diversos fatores (localização, tamanho, preço, etc.) para tomarmos uma decisão de compra. Enfim, no dia a dia somos indagados constantemente para tomarmos decisões. Na ciência é necessário que os procedimentos inferenciais sejam padronizados e bem especificados. O objetivo deste capítulo é fornecer os conceitos teóricos fundamentais para um correto uso dos testes de hipóteses. Neste capítulo serão abordados alguns dos testes de hipóteses mais comuns para comparar no máximo parâmetros de duas populações. Outros testes aplicáveis para comparações de parâmetros envolvendo mais de duas populações serão apresentados no Conteúdo IV. 2 – HIPÓTESES EM UM TESTE ESTATÍSTICO Para realizar um teste de hipóteses e divulgar as conclusões é necessário seguir um procedimento aceito pela comunidade científica. Neste procedimento, o pesquisador deve deixar claro qual a hipótese que ele deseja testar. Para isto ele precisa descrever em termos estatísticos as suas hipóteses científicas. A hipótese científica do pesquisador nada mais é do que o que o levou a realizar a sua investigação. Assim, o teste de hipótese é uma regra decisória que nos permite aceitar ou rejeitar uma hipótese estatística com base nos elementos de uma ou mais amostras. A hipótese estatística é uma suposição/afirmação referente ao valor de um parâmetro populacional (média, variância, proporção, etc.) que será verificada por meio de um teste paramétrico. Exemplos de hipóteses estatísticas: � A altura média da população brasileira é de 1,66 metros, ou seja, µ = 1,66; IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 9 � A proporção de brasileiros com determinada doença é de 40%, ou seja, p = 0,40; � A variabilidade no peso ao nascer dos animais da raça A é semelhante aos animais da raça B, ou seja, 2Aσ = 2Bσ . Para realizar um teste de hipóteses é necessário que o pesquisador lance duas hipóteses: 2.1 Hipótese de Nulidade (H0) É a hipótese a ser testada, também chamada de hipótese básica ou nula. Os testes são construídos sobre a pressuposição de que H0 seja verdadeiro. Exemplos: � Um pesquisador informa que a produtividade média de uma cultura é de 500 kg/ha. H0: µ = 500 � Duas rações (I e II) para leitões em fase de crescimento propiciam, em média, o mesmo ganho de peso. H0: µI = µII Para os dois exemplos, o raciocínio é que enquanto não houver evidências amostrais sugerindo que tais informações não sejam verdadeiras, elas são tomadas como verídicas (verdadeiras). 2.2 Hipótese Alternativa (H1) É a hipótese que contraria H0, formulada com base no conhecimento prévio do problema (investigação), informações de pesquisas científicas, entre outras indagações. Considerando os exemplos anteriores podemos ter: � H1: µ > 500 ou µ < 500 ou µ ≠ 500 � H1: µI > µII ou µI < µII ou µI ≠ µII No teste de hipóteses, a rejeição de H0 implicará na aceitação automática de H1. Isso se deve ao fato dessas hipóteses serem contrastantes e mutuamente excludentes, impossibilitando que sejam simultaneamente verdadeiras. 3 – DECISÃO EM UM TESTE DE HIPÓTESES Para decidirmos se devemos ou não devemos rejeitar a hipótese de nulidade, baseamos na comparação do valor especificado para o parâmetro, denominado valor tabelado, com aquele estimado a partir de uma amostra da população, denominado valor calculado. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 10 Todos os possíveis valores que o teste estatístico pode assumir são pontos no eixo horizontal do gráfico da distribuição do teste estatístico, sendo dividido em duas regiões: uma região constitui o que denominamos de região de rejeição e a outra região constitui o que denominamos de região de não rejeição. A regra de decisão nos diz para rejeitar H0 se o valor do teste estatístico calculado da amostra (valor calculado) é um dos valores que está na região de rejeição e para não rejeitar H0 se o valor calculado do teste estatístico é um dos valores que está na região de não rejeição. O pesquisador sempre estará sujeito a cometer um de dois erros possíveis ao tomar qualquer decisão, pois um estimador pode assumir valores diferentes para amostras diferentes, os quais sendo variáveis aleatórias apresentarão uma distribuição de probabilidade para os valores de um estimador do teste estatístico. � Erro tipo I ou erro α: é caracterizado pelo fato de rejeitarmos H0 sendo H0 verdadeiro. Sua probabilidade é representada por “α”, sendo denominado nível de significância do teste estatístico. Logo, α = P (erro tipo I) = P (rejeitar H0/ H0 é verdadeiro). � Erro tipo II ou erro β: é caracterizado pelo fato de não rejeitarmos H0 sendo H0 falso. A probabilidade de cometermos este tipo de erro é indicada por β. Logo, β = P (erro tipo II) = P (não rejeitar H0/ H0 é falso). A tabela a seguir apresenta as probabilidades de cometermos os erros do tipo I e do tipo II. Decisão \ Hipótese H0 é verdadeiro H0 é falso Rejeitar H0 α 1 – β Não rejeitar H0 1 – α β Esses dois erros estão de tal forma associados, pois se diminuirmos a probabilidade de ocorrência de um deles, automaticamente aumentamos a probabilidade de ocorrência do outro. Em geral, controlamos somente o Erro Tipo I, por meio do nível de significância do teste representado por α, o qual é a probabilidade máxima com que nos sujeitamos a correr um risco de cometer um erro do Tipo I ao testar uma hipótese. Na prática é comum fixarmos α = 0,05 (5%) ou α = 0,01 (1%). Se, por exemplo, for escolhido α = 0,05, isto indica que temos 5 possibilidades em 100 de rejeitarmos a hipótese nula (H0), quando na verdade ela deveria ser aceita, ou seja, existe uma confiança de 95% de que tenhamos tomado uma decisão correta. Esta confiabilidade é denominada grau/nível de confiança (c) do teste sendo representada por 1 – α e expressa em percentagem. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 11 Tabelas estatísticas apropriadas para cada tipo de teste de hipóteses fornecem valores críticos a partir do nível de significância (α) estabelecido no teste, os quais delimitarão as regiões de rejeição e de não rejeição de H0. O valor obtido de uma ou mais amostras retirada da(s) população(ões) é então usado para calcular o valor de uma estatística que tem distribuição de probabilidades idêntica àquela utilizada para identificar o valor tabelado. A comparação dos valores calculado e tabelado permite ao pesquisador decidir entre rejeitar ou não rejeitar H0. 4 – TIPOS DE TESTES DE HIPÓTESES 4.1 Teste Unilateral à Direita A partir de um valor crítico (valor tabelado), rejeita-se H0 se “valor calculado ≥ valor tabelado”. H0: µ = K H1: µ > K 4.2 Teste Unilateral à Esquerda A partir de um valor crítico (valor tabelado), rejeita-se H0 se “valor calculado ≤ valor tabelado”. H0: µ = K H1: µ < K 4.3 Teste Bilateral A partir dos valores críticos (valores tabelados C1 e C2), rejeita-se H0 se “valor calculado ≤ C1 ou valorcalculado ≥ C2. H0: µ = K H1: µ ≠ K 5 – RESUMO DAS ETAPAS PARA CONSTRUÇÃO DE UM TESTE DE HIPÓTESES 1. Enunciar as hipóteses nula (H0) e alternativa (H1); 2. Especificar o nível de significância (α) e selecionar a estatística do teste; 3. Estabelecer o(s) valor(es) crítico(s) da estatística do teste (valor tabelado) por meio de tabelas estatísticas apropriadas; 4. Determinar o valor da estatística do teste (valor calculado) por meio da(s) amostra(s); 5. Tomar a decisão (inferência) pela rejeição ou não rejeição de H0 pela comparação do valor tabelado com o valor calculado. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 12 6 – ALGUNS TESTES DE HIPÓTESES 6.1 Teste F para Comparação de Variâncias de Duas Populações Este teste é indicado para verificar se duas populações, digamos X e Y, apresentam igual valor para o parâmetro variância. Em termos de hipóteses estatísticas teríamos: H0: 2xσ = 2 yσ H1: 2xσ > 2 yσ ou 2 xσ < 2 yσ ou 2 xσ ≠ 2 yσ A estatística F utilizada para decidir entre rejeitar ou não rejeitar H0 é dada pelo quociente entre as duas estimativas amostrais de variância, ou seja: 2 2 y x Calculado s sF = Sob a hipótese de nulidade, este quociente tem Distribuição F de Fisher-Snedecor, com n1 e n2 graus de liberdade, ou seja, a distribuição de probabilidade da estatística F depende dos números de graus de liberdade n1 e n2, em que: n1 = nx – 1 e n2 = ny – 1. O valor crítico (valor tabelado) da distribuição F será estabelecido de acordo com o nível de significância (α) e os números de graus de liberdade: FTabelado = F α (n1 ; n2) A tomada de decisão (inferência) do teste é feita mediante a comparação do valor de FCalculado com o valor de FTabelado: � Fcalc. ≥ Ftab: Rejeita-se H0 � Fcalc. < Ftab: Não Rejeita H0 ou Aceita H0 OBS: Para simplificar o uso da tabela do teste F utilizaremos à expressão: Assim, a hipótese alternativa (H1) corresponderá a um teste unilateral à direita: H0: 2xσ = 2 yσ H1: 2xσ > 2 yσ OU 2 yσ > 2 xσ 1 var var >→ < > = CCalculado Fiância iânciaF IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 13 6.2 Teste t de Student O teste t é indicado para testar hipóteses referentes à média de uma ou mais populações, cuja variância populacional (σ2) seja desconhecida. Serão apresentadas três aplicações principais para o teste t em teste de hipóteses: i) teste para uma média populacional; ii) teste para duas médias populacionais (amostras independentes); e iii) teste para duas médias populacionais (amostras dependentes). 6.2.1 Teste de hipóteses para uma média populacional Este teste é utilizado para verificar se a média de uma característica de uma população assume um valor específico (K). As hipóteses do teste t para uma média populacional são as seguintes: H0: µ = K H1: µ > K ou µ < K ou µ ≠ K Para aplicação deste teste devemos selecionar uma amostra de tamanho n da população, ou seja: X1 ; X2 ; ... ; Xn. Com base nestes elementos amostrais calculamos a média e o desvio padrão. Estas estatísticas são utilizadas para calcular a estatística t, definida por: n s X s X t X Calculado µµ − = − = )( Está estatística t tem Distribuição t de Student com n – 1 graus de liberdade. Para decidirmos entre rejeitar ou não rejeitar H0 comparamos o valor de tCalculado com o valor de tTabelado, sendo este obtido em função do nível de significância (α) e do número de graus de liberdade: tTabelado = t α (n – 1) OBS: A tabela da Distribuição t de Student utilizada em nossas aulas é para testes bilaterais. Assim, se o teste efetuado for bilateral, observamos na tabela o valor de α e o respectivo número de graus de liberdade. Caso contrário, se o teste realizado for unilateral, observamos na tabela 2α como nível de significância, para garantir a realização do teste ao nível de significância desejado para testes unilaterais. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 14 Tomada de decisão (inferência): � Se .calct ≥ ttab: Rejeita-se H0 � Se .calct < ttab: Não Rejeita-se H0 ou Aceita-se H0 6.2.2 Teste de hipóteses para duas médias populacionais (amostras independentes) Este teste verifica se duas populações, digamos A e B, apresentam um mesmo valor médio para uma determinada característica, ou seja, µA = µB. Neste caso é necessário obter uma amostra de cada população. Estas amostras podem ser relacionadas (dependentes) ou não relacionadas (independentes) uma da outra. Duas amostras são independentes quando não existe nada que as relacione. Nesta situação, os valores amostrais foram obtidos em conjuntos amostrais distintos, ou seja, os elementos amostrais que originaram os valores de uma amostra são distintos dos elementos amostrais que originaram a segunda amostra. Hipóteses a serem consideradas: H0: µA = µB H1: µA > µB ou µA < µB ou µA ≠ µB A aplicação deste teste t para duas amostras independentes fica na dependência se as variâncias de suas populações são ou não são iguais entre si. Inicialmente deve-se efetuar um Teste Preliminar com o objetivo de comparar suas variâncias, ou seja, aplicamos o teste F. Ao testarmos as hipóteses do teste F teremos dois casos a considerar: Caso 1 e Caso 2. 6.2.2.1 Caso 1 Representa o caso em que H0 não é rejeitada no teste F. Assim, admitimos que as variâncias sejam iguais, cujos valores assumidos por 2As e 2Bs são estimativas de um mesmo valor σ2. Devemos combinar essas variâncias ( 2As e 2Bs ) estimando-se uma variância comum ( 2Cs ). Um estimador comum para a variância é obtido tomando-se uma média ponderada das estimativas de variâncias obtidas para as duas amostras. O tamanho da amostra é utilizado como um peso para o cálculo desta variância média ponderada ( 2Cs ). 2 Cs = 2 )1()1( 22 −+ −+− BA BBAA nn snsn IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 15 Em seguida, calcula-se o valor da estatística t, definida por: + − = BA C Calculado nn s BA t 112 Esta estatística tem Distribuição t de Student com (nA + nB – 2) graus de liberdade, ou seja: tTabelado = t α (nA + nB – 2) Tomada de decisão (inferência): � Se .calct ≥ ttab: Rejeita-se H0 � Se .calct < ttab: Não Rejeita-se H0 ou Aceita-se H0 6.2.2.2 Caso 2 Representa o caso em que H0 é rejeitada no teste F. Assim, admitimos que as variâncias sejam diferentes, o que não requer estimar uma variância comum. Neste caso, utilizaremos para o teste t os valores assumidos por 2As e 2Bs . O valor da estatística t fica definido: B B A A Calculado n s n s BA t 22 + − = Esta estatística tem Distribuição t de Student com (n*) graus de liberdade, em que: 11 2222 222 * − + − + = B B B A A A B B A A n n s n n s n s n s n OBS: Adotar como graus de liberdade o maior valor inteiro desde que não supere o valor calculado. tTabelado = t α ( n*) Tomada de decisão (inferência): � Se .calct ≥ ttab: Rejeita-se H0 � Se .calct < ttab: Não Rejeita-se H0 ou Aceita-se H0 IC283 – Bioestatística e IC284 – EstatísticaExperimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 16 6.2.3 Teste de hipóteses para duas médias populacionais (amostras dependentes) Duas amostras são dependentes quando existe algo que as relacione. Por exemplo, se os valores de duas amostras foram obtidos de um mesmo conjunto de elementos amostrais, podemos dizer que as duas amostras de valores são dependentes uma vez que foram tomados de um conjunto de elementos amostrais comum. Em muitas situações as amostras são coletadas como pares de valores (dados pareados), tal como medidas sobre o mesmo indivíduo antes e depois da aplicação de algum medicamento; sobre um mesmo animal antes e depois do fornecimento de uma suplementação alimentar; ou também sobre uma mesma planta antes e depois de administrar um determinado fertilizante. O objetivo neste caso é verificar se houve alteração na média de uma população quando a mesma é avaliada sob duas condições diferentes. Cada condição representa uma população distinta, embora se suponha que os elementos populacionais sejam os mesmos nas duas condições. Para verificar se houve alteração na média, avalia-se uma característica de interesse do pesquisador em um conjunto de elementos amostrais tomados ao acaso na população quando a mesma esteja sob a condição 1. Digamos que esta avaliação resulte nos seguintes valores amostrais: X11 ; X12 ; ... ; X1n. Depois de feita esta avaliação, os elementos amostrais que originaram a primeira amostra são submetidos à condição 2. Os mesmos elementos amostrais são novamente avaliados na condição 2, resultando os seguintes valores amostrais: X21 ; X22 ; ... ; X2n. Caso a condição 2 não tenha nenhum efeito, espera-se que em média os valores observados nas duas condições sejam iguais. Em termos de desvios, se a alteração das condições não resultar em nenhum efeito significativo, podemos dizer que a diferença entre os valores observados na primeira condição e na segunda condição é, em média, igual a zero. Portanto, para verificar se houve alteração na média de uma população avaliada em duas condições diferentes, pode-se testar a hipótese de que o desvio médio seja estatisticamente igual a zero. Assim, a partir de duas amostras (dependentes) obtém-se outra amostra baseada nos desvios (di). Elemento Amostral i 1 2 ... N Amostra 1 X11 X12 ... X1n Amostra 2 X21 X22 ... X2n Desvios = di = X1i – X2i d1 d2 ... dn Desta forma, o teste t para duas amostras dependentes é reduzido para teste t para uma média populacional, conforme visto anteriormente. Neste caso, deseja-se testar se a média dos desvios é igual a zero (ou igual a determinado valor ∆). IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 17 A média e o desvio padrão da amostra de valores di são obtidos substituindo os valores Xi por di. n d d n i i∑ = = 1 e 1 1 2 12 − − = ∑ ∑ = = n n d d s n i n i i i d Hipóteses estatísticas: H0: D = 0 H1: D > 0 ou D < 0 ou D ≠ 0 Para decidir entre rejeitar ou não rejeitar H0, calcula-se o valor da estatística t, definida por: d i Calculado s Dd t − = Sob H0 “ D = 0”: n s d n s d t d i d i Calculado = − = 0 Esta estatística t tem Distribuição t de Student com (n – 1) graus de liberdade: tTabelado = t α (n – 1) Tomada de decisão (inferência): � Se .calct ≥ ttab: Rejeita-se H0 � Se .calct < ttab: Não Rejeita-se H0 ou Aceita-se H0 IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 18 EXERCÍCIOS PROPOSTOS 1 – Com o intuito de controlar a homogeneidade da produção de certas partes ao longo do tempo, amostras semanais são retiradas da produção corrente. Uma primeira amostragem, de dez elementos, forneceu média 284,55 e desvio padrão 0,320, ao passo que, em uma segunda amostra, forneceu, nas mesmas unidades, os seguintes valores: {284,6 ; 283,9 ; 284,8 ; 285,2 ; 284,3 ; 283,7 ; 284,0}. Ao nível de 5% de significância, podemos concluir que a semana (amostra) 2 apresentou maior variabilidade que a semana (amostra) 1? 2 – Em indivíduos sadios o consumo renal de oxigênio (O2) distribui-se normalmente com média de 12 cm3/minuto. Deseja investigar, com base em cinco indivíduos portadores de certa doença, se esta tem influência no consumo renal médio de O2. Os consumos medidos para os cinco pacientes foram: {14,4; 12,9; 15,0; 13,7 e 13,5 cm3/minuto}. Qual a conclusão ao nível de 1% de significância? 3 – Os dados a seguir referem-se a um experimento de competição de duas progênies de Eucalyptus saligna. Cada progênie foi cultivada em solos com características semelhantes e a avaliação das plantas foi feita pela média dos diâmetros à altura do peito (DAP) de cada parcela. Foram utilizadas dez parcelas para cada progênie. Avaliar as progênies (A e B) com relação à característica mensurada. (α = 5%) Progênie A Progênie B Média – DAP (cm) 15,4 13,5 Variância – DAP (cm2) 2,5 3,0 Número de Parcelas 10 10 4 – Desejando saber se duas rações A e B, para determinada raça de suínos, são equivalentes ou se a ração A é superior a ração B em relação ao ganho de peso, há 11 animais sorteados ao acaso foi dado a ração A e a outros 19 a ração B. Os resultados, em kg, foram: AX = 66 kg e 2As = 40 kg 2 BX = 63 kg e 2Bs = 16 kg 2 A que conclusão chegar se adotarmos o nível de significância de 5%? 5 – A Tabela abaixo apresenta dados da pressão sanguínea sistólica de dez mulheres, na faixa etária de 30 a 35 anos, que fizeram uso de anovulatório por determinado período e depois não o fez, e vice e versa. Teste a hipótese de que o uso de anovulatório não tem efeito sobre a pressão sanguínea sistólica. (α = 5%) Anovulatório Mulheres (30 – 35 anos) Sim 111 119 121 113 116 126 128 123 122 121 Não 109 113 120 117 108 120 122 124 115 112 IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 19 EXERCÍCIOS COMPLEMENTARES 1 – Um experimentador deseja testar o efeito de certo fertilizante na produção de milho. Para realizar o experimento tinha-se 12 unidades experimentais de áreas iguais, onde 7 receberam o fertilizante e as outras não. As demais condições foram mantidas iguais. As produções em kg/unidade experimental foram as seguintes: c/ fertilizante 25 35 45 30 20 25 30 s/ fertilizante 35 25 20 15 30 De posse dos dados acima, pode o experimentador concluir que há aumento de produção de milho por causa do fertilizante, com nível de significância igual a 5%? 2 – Desejando comparar os efeitos de dois analgésicos, A e B, em termos do tempo de ação sobre pacientes com certa doença, ambos foram aplicados a 14 doentes, em dias diferentes, sendo que 7 pacientes receberam primeiro o analgésico A, e os outros 7 receberam primeiro o analgésico B, e vice e versa. A situação foi controlada de forma a não haver interferência do efeito de um sobre o outro. Os resultados (em minutos) foram: Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 A 362 345 356 370 360 365 345 363 358 332 335 370 335 362 B 320 330 315 325 323 328 318 322 320 310 308 332 307 325 Testar a hipótese de diferença nula entre as médias populacionais, ao nível de significância de 1%. 3 – Considere uma amostra de 10 leitões da raça Large White. Aos 21 dias de idade foram feitas medições dos seus pesos (kg), fornecendo os seguintes dados: Leitões 1 2 3 4 5 6 7 8 9 10 Peso (kg) 5,0 5,2 5,4 4,8 5,1 4,9 5,0 5,2 5,5 5,6 Pode-se concluir, ao nível de 5% deprobabilidade, que o peso médio aos 21 dias de idade dos leitões não difere de 5,0 kg? 4 – Determinada cultura apresenta uma produtividade média de 10,8 t/ha. Um experimentador, desejando aumentar a produtividade média, introduziu um novo tratamento à cultura. Uma amostra de 20 parcelas submetidas ao novo tratamento apresentou uma produtividade média de 11,50 t/ha e desvio padrão de 1,2 t/ha. Testar H0 e concluir para α = 5%. 5 – Em um estudo sobre metabolismo de citrato no fígado foram tomadas amostras de sangue da veia hepática de 10 indivíduos normais e amostra de sangue arterial de outros 10 indivíduos normais, obtendo-se as seguintes determinações de citrato em cada amostra (em mg/ml): Veia Hepática 20,2 24,6 18,3 19,0 29,5 12,6 18,2 30,8 22,2 25,4 Sangue Arterial 26,4 32,2 37,8 25,0 28,4 26,2 31,3 35,0 29,7 27,4 Verificar se existe diferença significativa entre o conteúdo médio de citrato do sangue arterial e da veia hepática, adotando α = 1%. 6 – Modificações foram implementadas na linha de produção de determinado artigo, utilizado em motores agrícolas, com o objetivo de reduzir a percentagem de peças defeituosas produzidas nas diversas máquinas da linha. Considerando os dados abaixo e α = 1%, testar a hipótese H0 e concluir: IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 20 Máquina 1 2 3 4 5 6 7 8 % defeito antes (X) 3,8 4,2 2,3 3,3 3,4 3,1 3,0 2,5 % defeito após (Y) 2,5 4,2 2,5 2,2 2,0 1,8 2,0 2,0 7 – Um nutricionista, desejando comparar dois produtos com relação ao teor médio de Vitamina C, retira 10 amostras de cada produto e obtém os teores listados abaixo: Produto Teores de Vitamina C (mg) A 20,2 25,3 21,3 27,0 22,0 26,0 20,0 21,2 23,1 29,3 B 27,3 28,4 29,5 27,0 28,0 29,8 30,1 30,5 28,5 29,1 Testar H0 e concluir para α = 5%. 8 – Os dados abaixo referem aos pesos, em gramas, de ratos machos da raça Wistar com 15 dias de idade, segundo a condição normal e submetidos à extirpação do timo aos 4 dias de idade. Verificar se a timectomização piora o ganho de peso destes animais, usando α = 5%. Condição Normal 40,3 40,0 39,6 35,2 32,0 Timectomizado 18,6 20,3 23,6 22,2 20,9 9 – Para verificar o efeito da suplementação de alfafa no ganho de peso (kg), considerou-se 8 pares de coelhos, cujos resultados são dados a seguir: Sem Suplementação 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60 Com Suplementação 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75 Há evidência que a suplementação aumenta o desempenho, considerando α = 5%? 10 – Para verificar o efeito da suplementação de alfafa no ganho de peso (kg), considerou-se 8 coelhos, cujos resultados são dados a seguir: Sem Suplementação 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60 Com Suplementação 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75 Há evidência que a suplementação aumenta o desempenho, considerando α = 5%? GABARITO 1 – tcal = 1,06 tα = 1,81 2 – tcal = 14,61 tα = 3,01 3 – tcal = 2,05 tα = 2,26 4 – tcal = 2,61 tα = 1,73 5 – tcal = 3,57 tα = 2,88 6 – tcal = 3,64 tα = 3,10 7 – tcal = 4,92 tα = 2,20 8 – tcal = 8,81 tα = 1,86 9 – tcal = 5,19 tα = 1,76 10 – tcal = 4,72 tα = 1,90 IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 21 CONTEÚDO III PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO 1 – INTRODUÇÃO A experimentação tem por objetivo o estudo dos experimentos, compreendendo seu planejamento, execução, coleta e análise dos dados e interpretação dos resultados. 2 – CONCEITOS BÁSICOS � Experimento ou Ensaio: é um trabalho previamente planejado seguindo determinados princípios básicos. Nele se faz a comparação dos efeitos dos tratamentos; � Tratamento: é o método, elemento ou material cujo efeito desejamos medir ou comparar em um experimento. Exemplos: i) variedades de milho; ii) níveis de proteína na ração; iii) meios de cultura (substratos) para o cultivo de microorganismos; � Unidade/Parcela Experimental: é a unidade que vai receber o tratamento e fornecer os dados que deverão refletir o seu efeito. Exemplos: i) plantas; ii) animais; iii) vidrarias de laboratório; � Variável Resposta: é a variável (característica) mensurada no experimento utilizada para avaliar o efeito de tratamentos; � Delineamento Experimental: é a maneira como os tratamentos são designados às unidades experimentais. Exemplos: i) Delineamento Inteiramente Casualizado (DIC); ii) Delineamento em Blocos Casualizado (DBC); � Esquema Experimental: quando em um mesmo experimento são avaliados dois ou mais fatores, cada qual com pelo menos dois níveis. O esquema é a maneira utilizada pelo pesquisador ao combinar os níveis dos fatores para se obter os tratamentos. Exemplo: Experimento/Esquema Fatorial (Fator 1: variedades de soja; Fator 2: espaçamento no plantio). � Erro Experimental: é o efeito de fatores que atuam de forma aleatória e que não são passíveis de controle pelo pesquisador. A pesquisa científica está constantemente se utilizando de experimentos para avaliar e validar suas hipóteses. Apesar dos experimentos variarem de uma pesquisa para outra, todos IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 22 eles são regidos por alguns princípios básicos, necessários para que as conclusões que venham a ser obtidas se tornem válidas. 3 – PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO São três os princípios básicos da experimentação: Repetição, Casualização e Controle Local. 3.1 Repetição A repetição consiste em aplicar o mesmo tratamento a várias unidades/parcelas experimentais, ou seja, consiste na reprodução do experimento básico. O número mínimo de repetições depende do conhecimento do pesquisador sobre o assunto e do conjunto de condições em que será realizado o experimento. Quanto maior é o número de repetições, espera-se que seja maior a precisão do experimento. Contudo, esta relação é válida até determinado número de repetições, a partir do qual o incremento na precisão não é significativo. Em termos estatísticos, o uso do princípio da repetição tem por finalidade obter uma estimativa do erro experimental. 3.2 Casualização O princípio da casualização consiste em distribuir ao acaso os tratamentos às unidades experimentais. Este princípio tem por finalidade propiciar, a todos os tratamentos, a mesma chance/probabilidade de serem designados a qualquer uma das unidades experimentais, visando evitar que algum dos tratamentos seja sistematicamente favorecido ou desfavorecido por fatores fora de controle do pesquisador. Isto significa que a distribuição dos tratamentos às unidades experimentais deve ser feita ao acaso, por meio de um mecanismo qualquer de sorteio. Em termos estatísticos, o uso do princípio da casualização em um experimento permite obter uma estimativa válida do erro experimental, além de garantir a aplicação de testes de significância/hipóteses, pela atuação independente dos erros experimentais nas diversas unidades experimentais. Ressalta-se que todo experimento deve conter no mínimo os princípios básicos da repetição e da casualização. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 23 3.3 Controle Local O uso do princípio do controle local só é recomendado quando as unidades experimentais não são ou não estão sob condições homogêneas devido à influência de um ou mais fatores. Para utilizar este princípio, é necessário inicialmente dividir as unidades experimentais em blocos de unidades de tal forma que dentro de cada bloco haja homogeneidadee um número de unidades igual ao número de tratamentos do experimento. A distribuição dos tratamentos às unidades é feita dentro de cada bloco. A finalidade do uso do controle local é reduzir o efeito do erro experimental por meio do controle da variação existente entre às unidades experimentais. Espera-se que com o controle a estimativa obtida para o erro experimental seja menor. 4 – FONTES DE VARIAÇÃO DE UM EXPERIMENTO Em um experimento podem ocorrer as seguintes fontes de variação: 4.1 Premeditada É a variação introduzida pelo pesquisador com a finalidade de fazer comparações. Por exemplo: os tratamentos. 4.2 Sistemática Variações não intencionais, porém de natureza conhecida. São variações inerentes ao material experimental, e que podem ser controladas pelo pesquisador. Por exemplo: heterogeneidade do solo, tamanho de semente, idade dos animais, etc. 4.3 Aleatória São variações de origem desconhecida, não podendo ser controladas. Constituem o erro experimental. São resultantes de duas fontes: variações no material experimental e falta de uniformidade nas condições experimentais. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 24 CONTEÚDO IV DELINEAMENTOS EXPERIMENTAIS E TESTE DE COMPARAÇÃO DE MÉDIAS 1 – DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) No Delineamento Inteiramente Casualizado (DIC) a distribuição dos tratamentos às unidades experimentais é feita inteiramente ao acaso. Os demais delineamentos experimentais, por exemplo: Blocos Casualizado e Quadrado Latino, se originam do DIC pelo uso de restrições na casualização. O DIC utiliza apenas os princípios básicos da repetição e da casualização. Como não se faz restrições na casualização, a utilização do DIC pressupõe que as unidades experimentais estejam sob condições homogêneas. Estas condições homogêneas geralmente são obtidas em locais com ambientes controlados, tais como: laboratórios, estufas, granjas e casas de vegetação. 1.1 Quadro de tabulação dos dados A título de exemplo, considere um experimento instalado no DIC com I tratamentos e J repetições. A coleta de dados da pesquisa pode ser resumida no quadro a seguir: Tratamentos Repetições 1 2 ..... I 1 Y11 Y21 ..... YI1 2 Y12 Y22 ..... YI2 ..... ..... ..... ..... ..... J Y1J Y2J ..... YIJ Totais T1 T2 ..... TI Deste quadro podem-se retirar algumas informações de interesse: • Nº de unidades experimentais: N = I x J • Total geral: G = ∑∑ = = = = I i i JI j i ij TY 1 , 1 1 • Total para o tratamento i: Ti = ∑ = J j ijY 1 • Média para o tratamento i: ^ im = J Ti • Média geral do experimento: ^ m = IJ G IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 25 1.2 Modelo Estatístico Existe um modelo estatístico específico para cada tipo de delineamento. O modelo estatístico identifica quais são as fontes de variação dos valores de uma variável resposta em estudo. Para os dados oriundos de um experimento instalado segundo o DIC, o seguinte modelo estatístico deve ser utilizado nas análises: Yij = m + ti + eij em que, � Yij = é o valor observado para a variável resposta obtido para o i-ésimo tratamento em sua j-ésima repetição; � m = é a média de todos os valores possíveis da variável resposta; � ti = é o efeito do tratamento i no valor observado Yij (ti = mi – m); � eij = é o erro experimental associado ao valor observado Yij (eij = Yij – mi). O erro experimental ocorre em todos os experimentos, pois não é possível controlar o efeito de fontes de variações que ocorrem de forma aleatória e desconhecida. Este erro é o responsável pela variação observada entre as observações obtidas nas repetições para cada tratamento. 1.3 Análise de Variância (ANOVA) É uma técnica de análise estatística que permite decompor a variação total, ou seja, a variação existente entre todas as observações, na variação devido à diferença entre os efeitos dos tratamentos e na variação devido ao acaso, que também é denominada de erro experimental ou resíduo. Entretanto, para que esta técnica seja empregada é necessário que sejam satisfeitas as seguintes pressuposições: � Os efeitos do modelo estatístico devem ser aditivos; � Os erros experimentais devem ser normalmente distribuídos, independentes, com média zero e com variância comum. Por meio do modelo estatístico pode-se decompor a variação entre os valores observados (variação total) nas diferentes causas de variabilidade, como demonstrado a seguir. Considere o modelo estatístico para um experimento instalado segundo o DIC: Yij = m + ti + eij , fazendo ti = mi – m e eij = Yij – mi, tem-se: Yij – m = (mi – m) + (Yij – mi), IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 26 substituindo m, mi e eij por seus estimadores, elevando ambos os membros ao quadrado e aplicando somatório, tem-se: ∑∑ = = = = −+−=− JI j i iiji JI j i ij mYmmmY , 1 1 2 ^^^ 2 , 1 1 ^ )()()( Escrevendo de forma mais simplificada, a igualdade anterior temos: SQTotal = SQTratamentos + SQResíduo Aplicando propriedades do somatório em cada termo da soma de quadrados tem-se o desenvolvendo de fórmulas mais práticas para encontrar os valores das respectivas somas de quadrados. Para a SQTotal tem-se que: SQTotal = 2 , 1 1 ^ )(∑ = = − JI j i ij mY = IJ Y Y JI ji ijJI j i ij 2 , 1,1 , 1 1 2 )( ∑ ∑ == = = − Para a SQTratamento: SQTratamentos = 2 ^, 1 1 ^ )( mm JI j i i∑ = = − = IJ Y J T JI ji ijI i i 2 , 1,1 1 2 )( ∑ ∑ == = − Esta fórmula é utilizada quando o número de repetições é igual para todos os tratamentos. No caso em que o número de repetições varia de acordo com o tratamento a fórmula apropriada é: SQTratamentos = N Y J T JI ji ijI i i 2 , 1,1 1 2 )( ∑ ∑ == = − , em que: � N = é o número de unidades experimentais = ∑ = I i ir 1 ; � ri = é o número de unidades experimentais (repetições) do tratamento i. A soma de quadrados do resíduo é obtida por diferença: SQResíduo = SQTotal – SQTratamento IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 27 O quadro da Análise de Variância (ANOVA) para a análise de um experimento instalado segundo o DIC, com igual número de repetições para todos os tratamentos, é dado a seguir: FV GL SQ QM F Tratamentos (I – 1) SQTrat. 1−I SQTrat sQM QMTrat Re Resíduo I(J – 1) SQRes. )1( Re −JI sSQ Total IJ – 1 SQTotal - - A partir das SQTratamento e SQResíduo obtêm-se os respectivos quadrados médios, por meio do quociente entre a soma de quadrado com o respectivo número de graus de liberdade. Para concluir se existe diferença entre os tratamentos calcula-se o valor da estatística F, que é obtido pelo quociente do QMTrat. com o QMRes. Este valor, denominado FCalculado, deve ser comparado com o valor de FTabelado, o qual é obtido na tabela de Distribuição de Fisher (F), de acordo com o nível de significância do teste, graus de liberdade para tratamentos (n1) e graus de liberdade para resíduo (n2). As hipóteses para o Teste F da Análise de Variância para tratamentos são: � H0: m1 = m2 = ... = mI = m; O que equivale a dizer que todos os tratamentos apresentam efeito médioigual, ao nível “α” de probabilidade que foi realizado o teste; � H1: não H0; O que equivale a dizer que existe pelo menos um tratamento que apresenta efeito médio diferente dos demais, ao nível “α” de probabilidade que foi realizado o teste. A regra decisória (tomada de decisão/conclusão) para o Teste F é a seguinte: � Se o valor do FCalculado for maior ou igual ao valor do FTabelado, então rejeita-se H0. Conclui-se que pelo menos um dos tratamentos tem efeito diferenciado, ao nível de significância em que foi realizado o teste; � Se o valor do FCalculado for menor que o valor do FTabelado, então não rejeita-se H0. Conclui-se que os tratamentos tem efeitos iguais, ao nível de significância em que foi realizado o teste. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 28 2 – MEDIDAS DE AVALIAÇÃO DA QUALIDADE DOS EXPERIMENTOS 2.1 Coeficiente de Variação [C.V.(%)] O Coeficiente de Variação permite avaliar a precisão do experimento. Quanto menor o C.V. mais preciso tende a ser o experimento. O conhecimento desta precisão auxilia na avaliação dos resultados do experimento. O C.V. é calculado da seguinte maneira: 100Re.(%). ^ = m sdQ VC µ , em que N G m = ^ De acordo com Gomes (2009), na experimentação agrícola (experimentos de campo) o coeficiente de variação pode ser classificado nas seguintes categorias, com relação a sua precisão: C.V.(%) Precisão < 10% Alta 10% a 20% Média 20% a 30% Baixa > 30% Muito Baixa 2.2 Coeficiente de Determinação (R2) Por definição, o Coeficiente de Determinação (R2) é a razão entre a Soma de Quadrado de Tratamento e a Soma de Quadrado Total, isto é: SQTotal SQTratR .2 = Portanto, o R2 representa uma medida da proporção da variação total explicada pela variação devido aos tratamentos. Como o valor de R2 varia entre 0 e 1, pode-se interpretá-lo como uma percentagem. Exemplo: R2 = 0,9215 → 92,15% da variação total está sendo explicada pela variação devido aos tratamentos. 3 – TESTE DE COMPARAÇÃO DE MÉDIAS O Teste F é aplicado na Análise de Variância dos delineamentos experimentais. Ele é utilizado para comparar variâncias, representando um teste preliminar, cujo resultado estabelece se será necessária uma detalhada análise complementar. Se o Teste F levar a conclusão que os tratamentos tem efeitos iguais não é necessário a aplicação de um teste de comparação de médias, o que o torna um teste conclusivo. Todavia, se o Teste F levar a conclusão de que pelo menos um dos tratamentos tem efeito diferenciado IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 29 será necessário a aplicação de um teste de comparação de médias, pois neste caso o Teste F comporta-se como um teste preliminar. Os testes de comparações de médias são utilizados para identificar o (s) tratamento (s) que difere (m) estatisticamente entre si. 3.1 Teste de Tukey O Teste de Tukey pode ser utilizado para comparar todo e qualquer contraste (comparações entre tratamentos por meio de suas respectivas médias) envolvendo duas médias de tratamentos (comparações aos pares). Ou seja, para I tratamentos poderão ser estabelecidos ( ) − 2 1II contrastes do tipo Yij = mi – mj, para i ≠ j. O Teste de Tukey baseia-se na Diferença Mínima Significativa (DMS), representada por ∆, dada por: ∆ = qα(n1;n2) sQM rr ji Re11 2 1 + em que: � ∆ = é a Diferença Mínima Significativa (DMS); � q = é o valor da amplitude estudentizada do Teste de Tukey, obtido em tabelas adequadas conforme o nível de significância (α); o número de tratamentos (n1) e o número de graus de liberdade do resíduo na Análise de Variância (n2). Caso o número de repetições seja igual entre os tratamentos comparados no contraste (ri = rj = r), o cálculo da DMS (∆) pode ser simplificado conforme a expressão: ∆ = qα(n1;n2) r sQM Re Para a realização do Teste de Tukey, a um nível de significância α, é necessário: a) Enunciar as hipóteses: H0: mi = mj H1: mi ≠ mj , para i ≠ j b) Obter as estimativas dos contrastes: jiij mmY ^^^ −= , com base nos valores amostrais; IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 30 c) Calcular a Diferença Mínima Significativa (∆); d) Concluir a respeito da significância dos ( ) − 2 1II contrastes em teste, utilizando a seguinte relação: � Se ∆≥ijY ^ , Rejeita-se H0; � Se ∆<ijY ^ , Não Rejeita-se H0. A conclusão do Teste de Tukey será única para todos os contrastes que se fizerem necessário avaliar: “As médias seguidas por pelo menos uma mesma letra não diferem entre si ao nível “α” de probabilidade pelo Teste de Tukey”. 4 – DELINEAMENTO EM BLOCOS CASUALIZADO (DBC) Para a utilização do DIC pressupõe que as unidades experimentais sejam homogêneas, bem como estejam durante todo o experimento sob condições completamente homogêneas. Se o pesquisador perceber algum fator perturbador a homogeneidade, seja nas unidades experimentais ou nas condições ambientais em que serão submetidas às unidades experimentais, é necessário que o pesquisador controle o efeito deste fator perturbador. Entenda-se como fator perturbador uma fonte de variação indesejável (sistemática) presente no experimento. Como exemplo, suponha que o pesquisador deseja comparar o efeito de analgésicos em cobaias, no entanto, as cobaias não são da mesma idade. Se o pesquisador julgar que o fator idade da cobaia pode influenciar na avaliação dos analgésicos, o mesmo deverá controlar tal fator, tendo em vista que o fator idade comportar-se-á como uma fonte de variação indesejável (sistemática). O controle do efeito do fator perturbador é feito pela formação de grupos, ou seja, blocos de unidades experimentais homogêneas, fazendo com que todos os tratamentos em estudo sejam avaliados em cada grupo/bloco homogêneo do fator perturbador. No Delineamento em Blocos Casualizado (DBC), a distribuição ao acaso dos tratamentos às unidades experimentais sofre a restrição de ser feita dentro de cada bloco. Portanto, o DBC faz uso dos três princípios básicos da experimentação: repetição, casualização e controle local. Em experimentos instalados segundo o DBC, espera-se que as condições experimentais de um bloco sejam diferentes das condições experimentais do outro bloco, e que exista homogeneidade das condições experimentais dentro de cada bloco. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 31 No DBC o fator perturbador é controlado e tem o seu efeito quantificado, de modo que seja possível eliminar tal efeito na análise estatística dos dados experimentais. Caso o pesquisador não controle o efeito do fator perturbador por meio da formação de blocos homogêneos, o efeito do fator perturbador é absorvido pelo erro experimental. Tal absorção tende a provocar um aumento no valor do quadrado médio do resíduo (QMResíduo), o que pode acarretar a não identificação de diferenças nos efeitos dos tratamentos, depreciando a qualidade/precisão dos resultados experimentais. 4.1 Quadro de tabulação dos dados Considere um experimento instalado no DBC, com I tratamentos e J repetições (blocos). A coleta de dados da pesquisa pode ser resumida no quadro a seguir: Tratamentos Blocos 1 2 ..... I Totais 1 Y11 Y21 ..... YI1 B1 2 Y12 Y22 ..... YI2 B2 ..... ..... ..... ..... ..... ..... J Y1J Y2J ..... YIJ BJ Totais T1 T2 ..... TI G Deste quadro podem-se retiraras seguintes informações: • Nº de unidades experimentais: N = I x J • Total geral: G = ∑∑ = = = = I i i JI j i ij TY 1 , 1 1 =∑ = J j jB 1 • Total para o tratamento i: Ti = ∑ = J j ijY 1 • Total para o bloco j: Bj = ∑ = I i ijY 1 • Média para o tratamento i: ^ im = J Ti • Média para o bloco j: jm ^ = I B j • Média geral do experimento: ^ m = IJ G IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 32 4.2 Modelo Estatístico Para o DBC o modelo estatístico é: Yij = m + ti + bj + eij em que, � Yij = é o valor observado para a variável resposta obtido para o i-ésimo tratamento em sua j-ésima repetição (bloco); � m = é a média de todos os valores possíveis da variável resposta; � ti = é o efeito do tratamento i no valor observado Yij (ti = mi – m); � bj = é o efeito do bloco j no valor observado Yij (bj = mj – m); � eij = é o erro experimental associado ao valor observado Yij (eij = Yij + m – mi – mj). 4.3 Análise de Variância (ANOVA) Para analisar os dados obtidos no Delineamento em Blocos Casualizado deve-se decompor a variação total, que existe entre todas as observações, na variação devido à diferença entre os efeitos de blocos, na variação devido à diferença entre os efeitos de tratamentos e na variação devido ao acaso, que também é denominada de erro experimental ou resíduo, ou seja: SQTotal = SQTratamentos + SQBlocos + SQResíduo As quais apresentam estimadores práticos deduzidos das respectivas somas de quadrados: SQTotal = IJ Y Y JI ji ijJI j i ij 2 , 1,1 , 1 1 2 )( ∑ ∑ == = = − SQTratamentos = IJ Y J T JI ji ijI i i 2 , 1,1 1 2 )( ∑ ∑ == = − SQBlocos = IJ Y I B JI ji ijJ j j 2 , 1,1 1 2 )( ∑ ∑ == = − SQResíduo = SQTotal – SQTratamentos – SQBlocos IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 33 O quadro da Análise de Variância (ANOVA) para um experimento instalado no DBC é dado a seguir: FV GL SQ QM F Blocos (J – 1) SQBlocos - - Tratamentos (I – 1) SQTrat. 1−I SQTrat sQM QMTrat Re Resíduo (I – 1)(J – 1) SQRes. )1)(1( Re −− JI sSQ Total (IJ – 1) SQTotal - - Em geral, o interesse na análise de um experimento é avaliar se existe diferença entre os tratamentos, o que pode ser verificado por meio do Teste F para tratamentos. As hipóteses para o Teste F da Análise de Variância para tratamentos são as seguintes: � H0: m1 = m2 = ... = mI = m; O que equivale a dizer que todos os tratamentos apresentam efeito médio igual, ao nível “α” de probabilidade que foi realizado o teste; � H1: não H0; O que equivale a dizer que existe pelo menos um tratamento que apresenta efeito médio diferente dos demais, ao nível “α” de probabilidade que foi realizado o teste. A regra decisória (tomada de decisão/conclusão) para o Teste F é a seguinte: � Se o valor do FCalculado for maior ou igual ao valor do FTabelado, então rejeita-se H0. Conclui-se que pelo menos um dos tratamentos tem efeito diferenciado, ao nível de significância em que foi realizado o teste; � Se o valor do FCalculado for menor que o valor do FTabelado, então não rejeita-se H0. Conclui-se que os tratamentos tem efeitos iguais, ao nível de significância em que foi realizado o teste. O Teste F para blocos geralmente é desnecessária, pois ao instalar o experimento no DBC o pesquisador utilizou blocos para controlar uma fonte de variação conhecida (sistemática). IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 34 EXERCÍCIOS PROPOSTOS 1 – Foi montado um experimento no DIC com o objetivo de verificar qual meio de cultura (A, B, C e D) propicia maior crescimento de colônias bacterianas. O número de colônias bacterianas, 48 horas após a inoculação, é fornecido abaixo: Meio de Cultura Nº. de Colônias Bacterianas Totais A - 19 31 15 30 95 B 40 35 46 41 33 195 C 39 27 20 29 45 160 D 27 12 13 28 30 110 Considerando o nível de significância de 5%, pede-se: a) Proceder a ANOVA; b) Obter o Coeficiente de Variação, classificando o experimento; c) Obter o Coeficiente de Determinação, interpretando-o; d) Aplicar o Teste de Tukey, se necessário. 2 – Os dados abaixo foram obtidos de um experimento conduzido no Delineamento Inteiramente Casualizado (DIC). 6,230ˆ 1 =m ; 2,217ˆ 2 =m ; 9,204ˆ 3 =m ; 9,209ˆ 4 =m ; 3,188ˆ 5 =m J = 4 C.V.(%) = 2,7483% Admitindo o nível de 1% de significância, pede-se: a) Proceder ANOVA; b) Aplicar o Teste de Tukey, se necessário. 3 – Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma alimentação mais apropriada, um criador separou 28 ovelhas de sua criação. Como eram de idades diferentes elas foram divididas em sete grupos, de modo que dentro de cada grupo existiam quatro ovelhas com idade similar e homogeneidade para as demais características. Em cada grupo foi realizado um sorteio para distribuir inteiramente ao acaso quatro tipos de alimentação. O experimento iniciou-se no momento de se realizar uma nova tosquia, obtendo os seguintes resultados expressos em unidades de medidas de lã por animal: Grupos Alimentação 1 2 3 4 5 6 7 Totais 1 30 32 33 34 29 30 33 221 2 29 31 34 31 33 33 29 220 3 43 47 46 47 48 44 47 322 4 23 25 21 19 20 21 22 151 Totais 125 135 134 131 130 128 131 914 Avaliar os tipos de alimentação, aplicando o teste de Tukey se necessário. Adotar α = 1%. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 35 EXERCÍCIOS COMPLEMENTARES 1 – Considere as seguintes produções diárias (kg) de leite a 4% de gordura de vacas em lactação submetidas à administração de raízes e tubérculos como suplementação de inverno na alimentação. Sem Suplementação Mandioca Araruta Batata Doce 19,58 23,40 35,42 22,15 21,07 22,37 32,47 24,37 23,43 24,36 34,48 26,54 25,42 25,12 33,79 20,37 22,81 22,94 35,04 19,54 23,54 - 35,19 24,06 a) Ao nível de 5% de significância, concluir a respeito das suplementações utilizadas no DIC; b) Obter o Coeficiente de Variação; c) Obter o Coeficiente de Determinação, interpretando-o. 2 – Para comparar a produtividade de quatro variedades de milho, tomou-se 20 parcelas similares e distribuiu, inteiramente ao acaso, cada uma das quatro variedades em cinco parcelas experimentais. A partir dos dados fornecidos abaixo, é possível concluir que existe diferença significativa entre as variedades com relação à produtividade, utilizando o nível de 5% de significância. Variedades A B C D 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Totais 115 135 130 155 3 – Um treinador de corrida rústica, objetivando melhorar o desempenho de seus atletas, testou três novas técnicas de preparação. Para tanto trabalhou com um grupo de 15 atletas completamente homogêneos para características essenciais. A designação das técnicas de preparação aos atletas foi feita totalmente ao acaso, de tal forma que o número de atletas avaliados em cada uma das técnicas fosse o mesmo. Os resultados obtidos, após determinado período de tempo de aprendizado das técnicas pelos atletas, foram os seguintes: Técnicas de Preparação Repetições 1 2 3 1 130 125 127 2 129 131 129 3 128 130 131 4 126 129 128 5 130 127 130 Totais 643 642 645 IC283– Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 36 De acordo com os resultados, pede-se: a) Quais foram os princípios básicos da experimentação utilizados pelo pesquisador neste experimento? b) Qual/quem foi a unidade experimental utilizada nesta pesquisa? c) É possível concluir que exista diferença entre as técnicas de preparação? (α = 1%) d) Qual (is) seria (m) a (s) técnica (s) recomendada (s)? 4 – Com o objetivo de diminuir o consumo dos motores à gasolina, determinada indústria petroquímica testou quatro novas formulações de gasolina, as quais se diferenciavam pelo tipo de aditivo que era acrescentado à mesma durante o seu processo de fabricação. Para efetuar o teste, a indústria petroquímica utilizou carros completamente homogêneos para todas as características. A designação das formulações aos carros foi feita inteiramente ao acaso. Após os testes de rodagem, os resultados obtidos foram (km/l): Aditivos a base de: Ácido Forte Ácido Fraco Base Forte Base Fraca Médias 14,81 6,56 10,06 10,09 Nº de carros 10 10 10 10 Dado: SQResíduo = 6,0264 e α = 5% Com base nas informações fornecidas, pede-se: a) Existe diferença entre os quatro tipos de formulações? b) Estabeleça um contraste para comparar aditivos de formulação ácida. Obtenha a estimativa para este contraste; c) Estabeleça um contraste para comparar aditivos de formulação básica. Obtenha a estimativa para este contraste. 5 – Com a finalidade de comparar o efeito do tempo de pastejo no desempenho de suínos, foram comparados 16 animais com características similares distribuídos em três tempos. Os ganhos de peso (kg) no final do experimento são dados a seguir: Tempos Ganhos de Peso (kg) 4 h 7,12 6,91 6,80 6,72 6,34 6,45 6 h 8,45 8,53 9,02 8,94 8,35 - 8 h 6,58 7,04 7,15 7,38 7,23 - Existe algum tempo de pastejo no qual o ganho de peso médio diferiu dos demais ao nível de 5% de significância? 6 – Dez reprodutores foram separados em dois grupos independentes e alimentados com rações diferentes, obtendo-se os seguintes ganhos de peso (kg): Ração A 5,0 6,0 7,0 4,0 3,0 Ração B 8,0 9,0 6,0 7,0 10,0 Verificar se as rações influenciam no ganho de peso, ao nível de 5% de significância, utilizando a análise de variância para experimentos inteiramente casualizados. Concluir a respeito das duas rações fornecidas. 7 – Com o objetivo de avaliar a utilização de farelo bruto foi realizado um experimento inteiramente ao acaso com duração de 28 dias, composto de quatro tratamentos e cinco IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 37 repetições por tratamento. Cada parcela foi constituída de 50 pintos de um dia de idade, da linhagem “Ross”, sendo 25 machos e 25 fêmeas. Os resultados dos ganhos de peso médio por parcela são dados a seguir: 0% de Farelo 10% de Farelo 20% de Farelo 30% de Farelo 0,60 0,82 0,79 0,82 0,62 0,85 0,83 0,81 0,61 0,78 0,82 0,79 0,64 0,79 0,81 0,80 0,63 0,80 0,82 0,79 Ao nível de 5% de significância qual (is) tratamento (s), em média, propiciou (aram) o maior ganho de peso? 8 – Para os dados fornecidos a seguir aplicar o teste de Tukey e concluir adequadamente (α = 5%). 3701 ^ =m 3382 ^ =m 3803 ^ =m 3204 ^ =m 3255 ^ =m 3676 ^ =m ∆ = 33 9 – Com os dados abaixo, oriundos do delineamento inteiramente casualizado (DIC), aplicar o teste de Tukey e concluir ao nível de 5% de probabilidade. r1 = r2 = r3 = 4 r4 = r5 = 5 ∑ = ji ijY , 2 51,446.22 T1 = 120,6 T2 = 130,7 T3 = 140,8 T4 = 180,6 T5 = 115,6 10 – Aplicar o teste de Tukey às comparações múltiplas obtidas com as médias dos tratamentos de um experimento realizado no delineamento inteiramente casualizado (DIC). Concluir para o nível de 1% de probabilidade. SQResíduo = 438,8631 r1 = r2 = r3 = 4 r4 = r5 = 3 6,2301 ^ =m 2,2172 ^ =m 9,2043 ^ =m 9,2094 ^ =m 3,1885 ^ =m 11 – Em uma propriedade agrícola foi realizado um experimento com cinco empregados. Eles realizaram a pulverização de cinco áreas (uma área/empregado) com pulverizadores costais manuais (em condições iguais). No fim de cada turno de trabalho foi avaliado o consumo do pulverizador por empregado, obtendo, para 10 turnos, as seguintes médias (consumo em litros/100m2): 11,21 ^ =m 51,22 ^ =m 87,13 ^ =m 23,24 ^ =m 80,15 ^ =m Sabendo-se que a SQTotal = 235,51. Qual (is) empregado (s) apresentou (aram) maior (es) consumo (s) em seu pulverizador ao nível de 5% de significância? Se necessário, utilizar o teste de Tukey. 12 – Um experimento para avaliar a influência de quatro tipos de aleitamento, no ganho de peso de leitões, foi conduzido utilizando o delineamento inteiramente casualizado com quatro repetições. Foram obtidos os seguintes resultados: IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 38 Tratamentos 1 2 3 4 Totais 37,2 44,8 31,6 32,8 Quadro da ANOVA F.V. G.L. SQ QM F Tratamento Resíduo Total 33,82 Completar o quadro da ANOVA e, considerando α = 1%, responder: Qual(is) o(s) melhor(es) tipo(s) de aleitamento? (Utilizar o teste de Tukey, se necessário) 13 – Foi realizado um experimento utilizando o delineamento inteiramente casualizado para comparar a produtividade de cinco variedades de mandioca. Os resultados foram: Variedades 1 2 3 4 5 9,1 11,5 8,2 14,2 15,2 6,8 13,7 11,1 10,9 16,1 11,3 14,1 6,2 13,1 11,1 10,4 8,9 15,7 11,4 14,4 11,4 16,1 11,7 a) Efetuar a análise de variância e concluir para α = 5%; b) Para recomendar a(s) variedade(s) mais produtiva(s) é necessário aplicar algum teste de médias? Justificar sua resposta. 14 – Com a finalidade de aumentar a produção de lã de suas ovelhas, por meio de uma alimentação mais apropriada, um criador separou 28 ovelhas de sua criação. Como as ovelhas eram de idades diferentes, elas foram divididas em sete grupos, sendo que dentro de cada um destes grupos existiam quatro ovelhas da mesma idade e homogeneidade para as demais características. Em cada grupo foi realizado um sorteio para distribuir, inteiramente ao acaso, os quatro tipos de alimentação (TA) às ovelhas do grupo. O experimento iniciou-se no momento de se realizar uma nova tosquia, da qual se obteve os seguintes resultados, expressos em unidade de medida de lã por animal: Grupos TA 1 2 3 4 5 6 7 Totais 1 30 32 33 34 29 30 33 221 2 29 31 34 31 33 33 29 220 3 43 47 46 47 48 44 47 322 4 23 25 21 19 20 21 22 151 Totais 125 135 134 131 130 128 131 914 Com base nas informações anteriores, pede-se: a) Qual o tipo de delineamento experimental utilizado pelo criador? Justificar sua resposta. b) Existe diferença entre os tipos de alimentação fornecidos às ovelhas? (α = 1%) c) Com base no teste de Tukey, qual (is) seria (m) o (s) tipo (s) de alimentação a ser (em) recomendado (s) às ovelhas? d) Calcular o coeficiente de variação do experimento. IC283 – Bioestatística e IC284 – Estatística Experimental Professor Marcelo Jangarelli – DEMAT – ICE - UFRRJ 39 15 – Um experimento no DBC forneceu os dados abaixo: Blocos Tratamentos 1 2 3 4 Totais 1 142,36 144,78 145,19 138,88 571,21 2 139,28 137,77 144,44 130,61 552,10 3 140,73 134,06 136,07 144,11 554,97 4 150,88 135,83 136,97 136,36 560,04 5 153,49 165,02 151,75 150,22 620,48 Totais 726,74 717,46 714,42 700,18 2.858,80 Para o nível de 5% de significância, pede-se: a) ANOVA; b) Teste de Tukey, se necessário. 16 – Com o objetivo de
Compartilhar