Buscar

Análise de Variância (ANOVA)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

��
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL
FACULDADE DE MATEMÁTICA - DEPARTAMENTO DE ESTATÍSTICA- Bioestatística A – Lista 03
����
ANOVA- Análise de Variância surge com uma generalização do teste t para duas médias, quando o número de amostras a ser testado é maior do que dois.
A variância entre indivíduos é a peça fundamental para alcançarmos o objetivo em qualquer investigação cientifica que trate da comparação de médias. As situações experimentais envolvem muitos fatores, nem sempre totalmente controlados, além dos tratamentos que desejamos testar. Por exemplo, variações na idade dos animais, de sexo, de temporabilidade, de instalações, etc., que se não identificadas e controladas pelo uso de um delineamento adequado serão incorporados na estimativa da variação individual.
O propósito da análise de variância é o domínio dos efeitos dessas fontes de variação de modo que o valor estimado como variância entre indivíduos corresponda a sua própria natureza, sem a interferência de fatores estranhos que poderiam superestimá-lo.
Pressupostos para a realização de uma análise de variância (abreviadamente ANOVA do inglês “Analysis of Variance”):
A resposta que está sendo analisada deve ser uma variável com distribuição normal;
Os tratamentos onde esta resposta está sendo medida devem apresentar variâncias equivalentes. Este princípio, conhecido como homocedasticidade, reconhece que a instabilidade de uma variável não depende do grupo experimental onde ela está sendo medida;
Independência entre os grupos de tratamento.
O não cumprimento de uma dessas premissas compromete a análise de variância, embora dados assim definidos possam ser analisados por meio de métodos não paramétricos ou por uma análise de variância após a transformação de dados.
O sucesso no controle de fontes de variação indesejáveis estará no reconhecimento delas antes da instalação do ensaio (por exemplo, a variabilidade de idades na amostra disponível) no registro das mesmas segundo os dados observados e, principalmente, no balanceamento das mesmas dentro dos grupos experimentais. Por exemplo, se para um estudo com cinco diferentes rações para suínos, a amostragem disponível contiver leitões de ambos os sexos e a infra-estrutura necessária exigir a utilização de dois diferentes galpões, cada tratamento (rações) terá que ser igualmente distribuída nos dois galpões e conter a mesma proporção de sexo. Só assim poderemos avaliar o efeito de galpão e de sexo impedindo que os mesmos sejam incorporados como variação individual.
A ANOVA compara a proporção relativa da variância dentro das amostras ou grupos (também designada por variância residual, dos erros ou dentro dos grupos) com a variância entre amostras ou grupos. Se a variância residual (aquela associada aos erros de medida e outros) for significativamente inferior a variância entre os grupos ou amostras (que seria devida ao efeito do fator sob estudo, o tratamento), então as médias populacionais estimadas a partir das amostras, são significativamente diferentes.
O comportamento da variável resposta ou variável dependente (Y) pode ser explicitado por meio de um modelo matemático:
Yij = µ + αi + (ij
µ = média global hipotética; αi = efeito do tratamento para a amostra i; (ij = erro aleatório associado a cada observação ij.
Exemplo 1
Em uma experiência para comparar a eficiência de diversas técnicas no tratamento da dor produzida por uma intervenção cirúrgica superficial, 28 pacientes foram agrupados, ao acaso, em quatro grupos de sete, tratando-se o primeiro como placebo e, os demais com dois tipos de analgésicos (A e B) e acupuntura. Os dados estão na tabela seguinte:
	Tratamento 
	
	Minutos para a remissão da dor
	Placebo (1)
	 35 22 5 14 38 42 65 
	Analgésico A (2)
	 85 80 46 61 99 114 110 
	Analgésico B (3)
	 100 107 142 88 63 94 70 
	Acupuntura (4)
	 86 125 103 99 154 75 160 
Que conclusões podem ser obtidas desta experiência?
Hipóteses
H0: µ1 = µ2= µ3= µ4
H1: nem todas as médias são iguais
Decisão: Rejeita-se H0. F = 12.6418 p < 0,00100, pois p < 0,05.
 As médias seguidas pela mesma letra não diferem estatisticamente entre si. Foi aplicado o Teste de Tukey ao nível de 5% de probabilidade. 
Conclusão: A média do grupo placebo foi menor que as demais médias, ao passo que as médias dos demais tratamentos não diferem entre si, isto é, não há diferença no tempo para a remissão da dor, quando o tratamento foi com o analgésico A ou analgésico B ou acupuntura.
Exemplo 2
Três extratos de origem vegetal foram introduzidos em cães por via oral com a finalidade de testar o possível efeito sobre a pressão arterial sistólica desses animais. Os cães foram divididos em grupos de cinco animais, recebendo cada grupo um tipo de extrato – B (2), C(3) ou D(4)-, além de um grupo controle– A (1)- injetado com placebo. Teste a significância e apresente conclusões sobre o experimento.
 Teste de Tukey com 5%.
Hipóteses
H0: µ1 = µ2= µ3= µ4
H1: nem todas as médias são iguais
Decisão: rejeita-se a hipótese nula, pois, temos F= 50,2414**, isto é, significativo ao nível de 1% de probabilidade.
Conclusão: as médias dos tratamentos 1 e 4 não apresentam diferenças significativas entre si, bem como, os tratamentos 2 e 3 também não apresentam diferenças significativas entre si. Assim, a média do placebo não difere da média do extrato D (4) são inferiores as médias dos extratos do tipo B ou C.
Exemplo 3
Que cores atraem os besouros? Nas fazendas, detecta-se a presença de insetos nocivos erguendo-se placas cobertas com um material pegajoso, para depois examinarem-se os insetos capturados. A fim de investigar quais cores são as mais atraentes aos besouros devoradores de folhas, pesquisadores instalaram seis placas, de cada uma de quatro cores diferentes, em um campo de aveia. A tabela abaixo fornece os dados com o número de insetos capturados.
	Cor
	Insetos capturados
	Amarelo-limão (1)
	45
	59
	48
	46
	38
	47
	Branco (2)
	21
	12
	14
	17
	13
	17
	Verde (3)
	37
	32
	15
	25
	39
	41
	Azul (4)
	16
	11
	20
	21
	14
	7
Realize uma ANOVA. Use ( = 0,05
Hipóteses 
H0: µ1 = µ2 = µ3 = µ4
H1: pelo menos duas médias diferem entre si. 
No quadro do Assitat, temos F = 30,5519**
** significativo ao nível de 1% de probabilidade (p < .01) ; REJEITA-SE H0 , POIS A SIG. < 0,05.
Precisamos identificar por meio das comparações múltiplas onde estão as diferenças.
As diferenças mínimas significativas entre as médias, segundo o teste de Tukey é de 10,96772.
A cor amarelo-limão (A) apresentou a maior média, logo é a cor que mais atrai os insetos.
A média da cor verde é inferior à média da cor amarelo-limão, mas é superior as duas cores (B).
As cores azuis e brancas não apresentam diferenças significativas entre as suas médias, mas são inferiores as demais.
RELAÇÃO ENTRE VARIÁVEIS
Em diversas investigações deseja-se avaliar a relação entre duas medidas quantitativas. Por exemplo, estão as alturas de filhos relacionadas com as alturas dos seus pais? 
Três propósitos principais de tais investigações podem ser: 
Para verificar se os valores estão associados. (Os valores de uma medida tendem a crescer (ou decrescer) à medida que a outra cresce?).
Para predizer o valor de uma variável a partir de um valor conhecido da outra. 
Para descrever a relação entre variáveis. (Dado um aumento específico numa variável, qual o crescimento médio esperado para a segunda variável?) 
A associação linear entre duas variáveis é avaliada usando correlação. Para predizer o valor de uma variável contínua a partir de outra variável e para descrever a relação entre duas variáveis utiliza-se regressão.
A análise de correlação proporciona um meio de se verificar o grau de associação entre duas ou mais variável. Os testes mais utilizados para essa análise são:
Correlaçãolinear de Pearson - variáveis mensuradas num nível pelo menos intervalar (paramétrico - normalidade);
Correlação de Spearman - variáveis mensuradas num nível pelo menos ordinal (não - paramétrico);
Teste para associação entre duas variáveis categóricas- Qui-Quadrado (não-paramétrico).
Teste de Concordância:
Kappa – compara a opinião de dois juizes ou de um mesmo observador em dois momentos: respostas categóricas (matriz quadrada).
Coeficiente de correlação intraclasse (ICC) para dados contínuos. A correlação intraclasse é um aplicativo para testar a replicabilidade amostral.
O comando Correlate do SPSS calcula o coeficiente de correlação linear de Pearson (notação populacional: (: notação amostral: r). Este coeficiente terá um valor dentro do intervalo –1 ( r ( 1.
Se r for positivo, existe uma relação direta entre as variáveis (ambas aumentam ou ambas diminuem);
Se r for negativo, a relação é inversa (uma aumenta e a outra diminui);
Se r for nulo, significa que não existe correlação linear entre as variáveis. 
Exemplo 4
Um agricultor plantou um pé de feijão no quintal de sua casa, anotando semanalmente sua altura.
Teste a existência ou não da correlação linear.
Interprete o resultado encontrado.
	Idade (sem)
	1
	2
	3
	4
	5
	6
	7
	8
	9
	Altura (cm)
	5
	12
	16
	22
	34
	38
	41
	45
	50
Correlations: Idade; Altura
Pearson correlation of Idade and Altura = 0,989
P-Value = 0,000
Hipóteses 
H0: ( = 0, ou seja, o coeficiente obtido não é significativo; (não existe correlação).
H1: ( ( 0, ou seja, o coeficiente obtido é significativo; (existe correlação).
Decisão: rejeita-se H0, pois, P-Value = 0,000 < 0,05.
Conclusão: O valor r da correlação de Pearson = 0,989 é significativo, ou seja, há evidências da existência da correlação linear entre as variáveis idade e altura do pé de feijão.
Interpretação: A existência da correlação positiva indica que no período de tempo investigado, na medida em que passou o tempo percebeu que o pé de feijão aumentou de altura. As duas variáveis estão variando de maneira direta, no mesmo sentido, quando aumenta a outra também aumenta ou vice-verso.
Exemplo 5
Após uma regulagem eletrônica um veículo apresenta um rendimento ideal no que tange a consumo de combustível. Contudo, com o passar do tempo esse rendimento vai se degradando. Os dados a seguir representam o consumo medido mês a mês após a regulagem. Determine o coeficiente de correlação linear e ajuste um modelo linear a esses dados. Teste a significância estatística.
X: meses após a regulagem e Y: rendimento por litro de combustível (consumo por km rodado). 
Correlations: X; Y
Pearson correlation of X and Y = - 0,907
P-Value = 0,000
Hipóteses 
H0: ( = 0, ou seja, o coeficiente obtido não é significativo; (não existe correlação).
H1: ( ( 0, ou seja, o coeficiente obtido é significativo; (existe correlação).
Decisão: rejeita-se H0, pois, P-Value = 0,000 < 0,05.
Conclusão: O valor r da correlação de Pearson = - 0,907 é significativo, ou seja, há evidências da existência da correlação linear entre as variáveis X e Y.
Interpretação: A existência da correlação negativa indica que na medida em que passa o tempo após a regulagem do motor há uma redução no rendimento do litro de combustível por km rodado. As variáveis apresentam uma relação indireta, na medida em uma aumenta (X) a outra (Y) reduz ou na medida em que o X diminui o valor de Y aumenta. Assim, quanto mais meses de passaram após a regulagem do motor menor será o rendimento em termos de km rodado com um litro de combustível.
Exemplo 6
Uma avaliação precisa sobre a produtividade do solo é fundamental para o planejamento racional do uso da terra. Infelizmente, como afirma o autor do artigo “Productivity Ratings Based on Soil Series” (Prof. Geographer, 1980, p. 158-163), não é tão fácil de estabelecer um índice de produtividade do solo aceitável. Uma das dificuldades é a produtividade é determinada parcialmente pela cultura plantada, e a relação entre a produção de duas diferentes culturas plantadas no mesmo solo pode não ser muito forte. Para ilustrar, esse artigo apresenta os dados a seguir sobre a produção de milho x e a produção de amendoim y (MT/Ha) de oito diferentes tipos de solo. 
Teste a significância ao nível de 5%. Que conclusão você pode tirar? Existe correlação? 
Hipóteses 
H0: ( = 0, ou seja, o coeficiente obtido não é significativo; (não existe correlação).
H1: ( ( 0, ou seja, o coeficiente obtido é significativo; (existe correlação).
Decisão: Não se rejeita H0, pois, P-Value = Sig. ( 2-tailed)0,399 > 0,05.
Conclusão: O valor r da correlação de Pearson = 0,347 NÃ|O é significativo, ou seja, não há evidências da existência da correlação linear entre as variáveis produção de milho e produção de amendoim.
Observe que os pontos do gráfico não se aproximam de uma reta. Os pontos estão dispersos.
Exemplo 7
A irradiação é um controvertido método de preservação da carne. O infográfico mostra duas distribuições descrevendo as opiniões sobre a irradiação da carne vermelha. Você trabalha para uma fábrica de carnes enlatadas e deseja testar a distribuição que descreve a posição dos funcionários sobre a irradiação. Para testar a distribuição você seleciona ao acaso 500 pessoas (300 homens e 200 mulheres) e indaga se eles favoráveis ou não a irradiação ou se não tem opinião. Você diria que a opinião expressa depende do sexo do entrevistado? Use ( = 0,05.
	Resposta
	Mulher
	Homem
	Total
	Favorável
	100
	168
	268
	Contra
	48
	71
	129
	Sem opinião
	52
	61
	113
O resultado do teste estatístico foi:
H 0: O = E Há independência entre tipo de resposta e sexo do respondente 
H1: O ≠ E Não há independência entre tipo de resposta e sexo do respondente
Conclusão: Como não houve a rejeição de H0, (p = 0,2841 > 0,05) não temos evidências suficientes para afirmarmos que a opinião expressa depende do sexo do entrevistado. 
Exemplo 8
Os resultados de um experimento para avaliar o efeito do petróleo sobre parasitas de peixes foram descritos num artigo cientifico. Três tratamentos foram comparados: (1) sem contaminação, (2) contaminação por óleo derramado há um ano e (3) contaminação por óleo novo. Para cada condição de tratamento, uma amostra de peixe foi tomada e, então, cada peixe foi classificado como tendo ou não o parasita. Os dados a seguir indicam que os três tratamentos diferem em relação à proporção real de peixe com parasitas ou sem? Teste utilizando ( = 0,05.
H 0: O = E Há independência entre tipo de tratamento e condição de parasitado ou não, ou a proporção de parasitados é a mesma entre os três grupos
 
H1: O ≠ E Não há independência entre tipo tratamento e condição de parasitado ou não, ou a proporção de parasitados não é a mesma entre os três grupos.
Conclusão: Como não houve a rejeição de H0, (p = 0,0878 > 0,05) não temos evidências suficientes para afirmarmos que a proporção de parasitados dependa do tratamento (efeito do petróleo). 
Exemplo 9
 Sejam os seguintes resultados de um teste laboratorial de quatro inseticidas:
	Resultado
	Tipo 1
	Tipo 2
	Tipo 3
	Tipo 4
	Insetos mortos
	139
	100
	73
	98
	Insetos que sobreviveram 
	15
	50
	80
	47
Teste se os resultados estão relacionados com o tipo de inseticida utilizado? Qual você recomendaria? Use ( = 0,01.
H 0: O = E Há independência entre tipo de tratamento (inseticidas) e desfecho dos insetos 
H1: O ≠ E Não há independência entre tipo de tratamento (inseticidas) e desfecho dos insetos 
Rejeita-se a hipótese nula, pois 0, 00000 < 0,05.
Conclusão: Como houve a rejeição de H0, temos evidências suficientes para afirmarmos que a proporção de insetos mortos ou sobreviventes depende do tipo de inseticida utilizado.
 
Proporção de insetos mortos:
p1 = 139/139+15 = 0,9026; p2= 0,6667; p3 = 0,4771 e p4 = 0,6759
Recomendado o inseticida do tipo 1.
�PAGE �
�PAGE �12�
_1181232981/ole-[42, 4D, 02, 45, 01, 00, 00, 00]
_1350233976.xls
Gráf1
		5
		12
		16
		22
		34
		38
		41
		45
		50
IdadeX Altura
Plan1
				Idade (sem)		Altura (cm)
				1		5
				2		12
				3		16
				4		22
				5		34
				6		38
				7		41
				8		45
				9		50
Plan1
		0
		0
		0
		0
		0
		0
		0
		0
		0
Idade X Altura
Plan2
		0
		0
		0
		0
		0
		0
		0
		0
		0
Idade X Altura
Plan3
		
		
_1181232896/ole-[42, 4D, DE, B2, 08, 00, 00, 00]

Outros materiais

Outros materiais