Buscar

Aulas 3 4

Prévia do material em texto

*
Curso de Estatística Experimental
Slide *
*
Slide *
Prof. Dr. Luciano Farinha Watzlawick
UNICENTRO
farinha@unicentro.br
AULAS 3 e 4
Experimentação Agrícola
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
POPULAÇÃO E AMOSTRA
		População é um conjunto de medidas ou contagens de uma variável tomadas em todas unidades definidas como pertencentes à população. 
	
	
	Amostra é uma parte da população.
	
	
UNIDADE AMOSTRAL: Unidade mínima da amostra, de onde se obtém um dado referente à variável em estudo. 
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
*
Curso de Estatística Experimental
Slide *
*
Slide *
PARÂMETROS E ESTIMATIVAS
	Parâmetros são valores fixos.
Média 
Variância 2
Desvio padrão 
	
	
	Amostras são descritas pelos mesmos valores aplicados às populações, porém para elas são chamados de estimativas.
Média 
Variância S2
Desvio padrão S
	
*
Curso de Estatística Experimental
Slide *
*
Slide *
MEDIDAS DE POSIÇÃO
ESTATISTICA DESCRITIVA
	Proporcionam verificar a posição, dispersão, a descrição e compreensão das distribuições ou amostras de freqüência de um conjunto de dados.
MEDIDAS DE DISPERSÃO
MEDIDAS DE FORMA
*
Curso de Estatística Experimental
Slide *
*
Slide *
 Média aritmética
	 Mediana
Valor da classe central
Valor médio das classes centrais
 Moda
Valor da classe mais freqüente
MEDIDAS DE POSIÇÃO
*
Curso de Estatística Experimental
Slide *
*
Slide *
	 Variância (quadrado do desvio padrão)
 Desvio padrão (população e amostra)
 Coeficiente de variação
MEDIDAS DE DISPERSÃO
*
Curso de Estatística Experimental
Slide *
*
Slide *
	População infinita  (1-f )  0,98
 População finita  (1-f ) < 0,98
*
Curso de Estatística Experimental
Slide *
Coeficiente de Variação 
(Classificação de Pimentel Gomes)
		BAIXOS: se inferiores a 10%;
		MÉDIOS: quando de 10 a 20%;
		ALTOS: quando de 20 a 30%; e
		MUITO ALTOS: acima de 30%.
*
Curso de Estatística Experimental
Slide *
*
Slide *
	 Erro padrão (desvio padrão da média)
	Erro de amostragem (absoluto e relativo)
	
	 Intervalo de confiança para a média
*
Curso de Estatística Experimental
Slide *
*
Slide *
Valores de t segundo níveis diferentes níveis de probabilidade de confiança.
*
Curso de Estatística Experimental
Slide *
*
Slide *
	Número ideal de unidades amostrais
População infinita  (1-f )  0,98
População finita  (1-f ) < 0,98
INTENSIDADE IDEAL DE AMOSTRAGEM
*
Curso de Estatística Experimental
Slide *
*
Slide *
	ASSIMETRIA - Referem-se à forma da curva (GRAU DE DEFORMAÇÃO) de uma distribuição de freqüências. É interessante saber se a população da qual a amostra foi coletada pode ser descrita por uma curva NORMAL.
Curva simétrica (MEDIA = MEDIANA = MODA)
MEDIDAS DE FORMA
*
Curso de Estatística Experimental
Slide *
*
Slide *
A medida que quantifica o distanciamento de um conjunto de dados em relação à simetria é o Coeficiente de Assimetria (As).
e
sendo
Positivo (As>0) indica uma simetria à direita
Negativo (As<0) indica uma simetria à esquerda
ZERO (As = 0) simetria 
*
Curso de Estatística Experimental
Slide *
*
Slide *
	CURTOSE - Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão (NORMAL).
O Coeficiente de curtose (K) é o que quantifica o grau de achatamento. 
sendo
*
Curso de Estatística Experimental
Slide *
*
Slide *
K > 3: indica uma distribuição chamada leptocúrtica
K < 3: indica uma distribuição platicúrtica
K = 3: indica uma distribuição semelhante a NORMAL chamada mesocúrtica
*
Curso de Estatística Experimental
Slide *
*
Slide *
EXEMPLO 1: Foram amostrados 40 pessegueiros em uma propriedade estimando-se a safra anual (em alqueire/árvore), sendo que a produções são apresentados na Tabela. 
Utilizando a informação da produção, calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança, bem como o coeficiente de assimetria e coeficiente de curtose.
*
Curso de Estatística Experimental
Slide *
*
Slide *
EXEMPLO 2: Foram medidas em 50 árvores de Pinus taeda a altura total (m), sendo que os dados encontram-se apresentados na Tabela. 
 
Utilizando a informação da produção, calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 90% de probabilidade de confiança, bem como o coeficiente de assimetria e coeficiente de curtose.
*
Curso de Estatística Experimental
Slide *
*
Slide *
DISTRIBUIÇÃO DE FREQUÊNCIA
	Quando se estuda uma massa de dados (variáveis quantitativas podem assumir um grande número de valores) é de freqüente interesse resumir as informações de variáveis.
	
*
Curso de Estatística Experimental
Slide *
*
Slide *
	Costuma-se, freqüentemente, para uma melhor compreensão dos mesmos, distribuí-los em classes ou intervalos determinando-se o número de indivíduos pertencentes a cada classe ou intervalo.
	Desta forma, um arranjo tabular dos dados, juntamente com as freqüências correspondentes aos mesmos é denominado distribuição de freqüência ou tabela de freqüência.
*
Curso de Estatística Experimental
Slide *
*
Slide *
Produção, em g, de 400 parcelas de 1m2 de cevada
*
Curso de Estatística Experimental
Slide *
*
Slide *
Distribuição de freqüências
Distribuição de freqüências
Tabelas de freqüências
Intervalo, amplitude
Classes
11,8 classes  12 classes
Amplitude total  248 – 22 = 226
Amplitude da classe  226 / 12 = 18,83  19
*
Curso de Estatística Experimental
Slide *
*
Slide *
Tabela de Freqüências
Amplitude de classes, pontos médios e freqüências
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Definição das Classes
Número de Classes (Algoritmo de Ramsdall)
2) Amplitude dos Dados
3) Amplitude das Classes (arredonde está amplitude encontrada)
4) Organizar as classes de modo que a primeira classes contenha X mínimo e a última classe contenha X máximo
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
EXEMPLO 2: Foram medidas em 40 árvores de Pinus elliottii a produção de resina (kg), sendo que os dados (produção) encontram-se apresentados na Tabela 1. 
 
Utilizando a informação da produção, realize a distribuição de freqüência e calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança.
*
Curso de Estatística Experimental
Slide *
 Variância (quadrado do desvio padrão)
*
Slide *
 Média aritmética
*
Curso de Estatística Experimental
Slide *
EXEMPLO 3: Os dados a seguir se referem a altura (cm) de mudas de Eucalyptus grandis aos 7 meses de idade, realize a distribuição de freqüência, e lodo após calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança.
*
Curso de Estatística Experimental
Slide *
*
Slide *
	A distribuição normal é uma das mais importantes distribuições da Estatística, conhecida também como Distribuição de Gauss ou Gaussiana.
Distribuição Normal
*
Curso de Estatística Experimental
Slide *
*
Slide *
	Equação da curva normal
	y = freqüência em determinado ponto da curva
	 = média da população
	2 = variância da população
		 = 3,14159265359
	e = 2,7182818284
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
	Em uma distribuição normal, um desvio padrão (azul escuro) representa cerca de 68% do conjuntodos dados, enquanto dois desvios padrões desde a média (azul médio e escuro) representam cerca de 95%, e três desvios padrões (azul claro, médio e escuro) cobrem cerca de 99,7%.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
	Pequenos erros associados com a obtenção das observações;
	Erros associados com a falta de representatividade das amostras em relação à população da qual foram retiradas; e
	Um componente de erro resultante da falta de repetibilidade das condições ambientais de um experimento para outro.
*
Slide *
Erro Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
- Hipótese de nulidade H0
Não há diferenças entre as amostra
Hipótese alternativa H1
Existem diferenças entre as amostra
	
TESTE DE HIPÓTESES ESTATÍSTICAS
*
Curso de Estatística Experimental
Slide *
		Os procedimentos estatísticos para comparar duas ou mais médias de tratamentos assumem a existência da chamada hipótese da nulidade. 
		Esta afirma não haver diferenças entre os efeitos dos tratamentos. 
Hipótese de nulidade H0
	Não há diferenças entre as médias das amostras dos tratamentos
Hipótese alternativa H1
	Existem diferenças entre as médias das amostras dos tratamentos
*
Slide *
ANÁLISE DE VARIÂNCIA
*
Curso de Estatística Experimental
Slide *
		O fato da hipótese da nulidade não ser rejeitada, em princípio, significa que não existem diferenças significativas entre as médias, mas isto não assegura que alguns dos tratamentos não tenham efeito. 
		Há sempre a probabilidade de que as diferenças estejam presentes e não estejam detectadas. Nestes casos os experimentos não foram planejados adequadamente para detectar estas diferenças no nível de probabilidade desejado.
*
Slide *
*
Curso de Estatística Experimental
Slide *
*
Slide *
		A ANOVA baseia-se em 4 condicionantes:
Erros aleatórios, independentes, e normalmente distribuídos
Variâncias das amostras homogêneas
Médias e variâncias das amostras não correlacionadas
Efeitos principais devem ser aditivos
Condicionantes da ANOVA
*
Curso de Estatística Experimental
Slide *
Quando a casualização inicial é bem feita e o tipo de delineamento experimental utilizado é adequado, pode-se:
		assumir que os erros são independentes e normalmente distribuídos; 
		que médias e variâncias não são correlacionadas; 
		e, que os efeitos são aditivos. 
*
Slide *
Como verificar os requisitos para ANOVA
*
Curso de Estatística Experimental
Slide *
		A prática mostra que se as variâncias dos tratamentos são homogêneas as demais condicionantes também são respeitadas, e se as variâncias dos tratamentos não são homogêneas existe uma grande chance de que as outras condicionantes também não o sejam. 
		Quando se testa a homogeneidade das variâncias, de certa forma, testa-se todas as demais condicionantes.
*
Slide *
*
Curso de Estatística Experimental
Slide *
		Os erros ou desvios devidos ao efeito dos fatores não controlados devem assumir uma distribuição normal de probabilidade. 	
		
		Isto implica que os dados experimentais se ajustem a uma distribuição normal de probabilidade.
*
Slide *
Normalidade
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Teste de Normalidade – Schapiro-Wilk
	Existem numerosos testes para testar a normalidade:
	- Gráfico de Probabilidade Normal
	- Método dos Momentos
	- Teste “W” - Shapiro-Wilk
	- Teste Kolmogorov-Smirnov
	- Teste de Aderência X²
	
	
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
	Porém um dos mais utilizados é o teste W desenvolvido por Shapiro eWilk (1965).	
Interpretação: 
Compara-se o valor de Wcal com o valor de Wtab apresentando na tabela. Se Wcal for MENOR do que o Wtab, rejeita-se a hipótese de normalidade dos dados.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
EXEMPLO 4: Os dados a seguir se referem ao tempo (dias) de germinação de sementes de araucaria submetida a 4 tratamentos diferentes, com 10 repetições cada tratamento. Verifique a questão da normalidade dos dados levando-se em consideração uma probabilidade de confiança de 95%.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Ordenar em ordem crescente as j observações da amostra que apresenta a menor variância (parte-se do princípio de que se o tratamento que apresenta a menor dispersão não for normalmente distribuída, então as demais também não serão).
Calcular a partir do item 1.
 
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
3) Calcular b.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Tabela para os Coeficientes para o teste de Shapiro-Wilk.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
4) Calcular o valor de W
5) Conclusão:
Como o Wcal =0,840 < o valor de Wtab =0,842, rejeitamos a hipótese de normalidade dos dados, concluindo-se que é preciso realizar algum tipo de transformação nos mesmos para que ele passe a ser verdadeira. 
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Tabela dos valores críticos da estatística W de Shapiro-Wilk.
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
Independência
		Os erros ou desvios devidos ao efeito dos fatores não controlados devem independentes. Isto implica que os efeitos dos tratamentos sejam independentes, que não seja uma correlação entre eles.
		Isto pode não ocorrer quando os tratamentos são doses crescentes de adubos, inseticidas, etc. ocasião em que a análise de variância deve ser feita estudando a regressão.
*
Curso de Estatística Experimental
Slide *
	Para cada delineamento experimental existe um modelo matemático chamado modelo linear aditivo. 	Para o Delineamento Inteiramente Casualizado o modelo é:
	O valor de qualquer unidade experimental é formado pela média geral do experimento mais um efeito dos tratamentos e um erro.
*
Slide *
Aditividade
*
Curso de Estatística Experimental
Slide *
	Em um Delineamento em Blocos ao Acaso isto implica em que o efeito de um tratamento é o mesmo em todos os blocos e que o efeito dos blocos é o mesmo em todos os tratamentos. 
	Se um tratamento aumenta a produção em determinada quantidade em relação a média geral do ensaio assume-se que este aumento é o mesmo para os blocos com alta produção e para os blocos com baixa produção. 
*
Slide *
*
Curso de Estatística Experimental
Slide *
		A homogeneidade de variâncias pode ser testada pelos testes de:
	 	Bartlett
	 	Hartley e 
	 	Cochram 
	
	que serão exemplificados. 
*
Slide *
HOMOGENEIDADE OU 
HOMOCEDASTICIDADE DE VARIÂNCIAS
*
Curso de Estatística Experimental
Slide *
	Serve para testar a homogeneidade de variâncias. 	Parte-se da hipótese de que as variâncias são homogêneas. 
	Se o resultado do teste confirmar esta hipótese procede-se a análise de variância normalmente. 
	Se por outro lado, o teste revelar que as variâncias não são homogêneas transforma-se os dados e verifica-se novamente se; com os dados transformados, as variâncias tornaram-se homogêneas ou não. 
*
Slide *
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
	Testar a homogeneidade de variâncias
Hipótese de nulidadeH0
Não há diferenças entre variâncias das amostra
Hipótese alternativa H1
Existem diferenças entre as variâncias das amostras
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
Fórmula do teste de Bartlett
Resultado dividido pelo fator de correcão C
Onde:
2,3026 = constante
GL = graus de liberdade de cada tratamento
n = número de tratamentos
	= médias das variâncias
	= variância de cada tratamento
*
Slide *
Teste de Bartlett
*
Curso de Estatística Experimental
Slide *
*
Slide *
EXEMPLO 5: Dados fictícios de quatro tratamentos com 4 repetições em um delineamento em blocos ao acaso.
*
Curso de Estatística Experimental
Slide *
*
Slide *
O valor tabelado é obtido para graus de liberdade do número de tratamentos i em uma probabilidade de confiança.
Se o valor H observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade.
*
Curso de Estatística Experimental
Slide *
*
Slide *
Conclusão:
O valor tabelado é 7,815 ao nível de 5% de probabilidade. Como o valor calculado foi de 0,2616, não se encontra evidência de que a hipótese da nulidade seja falsa e conclui-se que as variâncias são homogêneas.
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
EXEMPLO 6: Um estudante de graduação da UNICENTRO realizou experimento, onde testou 6 diferentes tipos de tratamentos para a quebra de dormência de sementes de uma determinada espécie com 4 repetições em cada tratamento, sendo que em cada repetição foram testadas 100 sementes. O número de sementes germinadas após 180 dias da aplicação dos tratamentos são apresentados abaixo.
Teste a homogeneidade das variâncias dos tratamentos, escrevendo as hipóteses testadas e utilizando X² 5%. Conclua sobre os resultados obtidos.
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Teste bem simples para verificar a homocedasticidade, também é conhecido como F máximo de Hartley (H). 
O valor tabelado é obtido para o número de tratamentos i e graus de liberdade da repetição j.
Se o valor H observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade.
Teste de Hartley
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
O teste de Cochran compara a maior variância com as demais.
O valor tabelado é obtido o número de graus de liberdade (repetições) na linha e o número de tratamentos na coluna.
Se o valor C observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade.
Teste de Cochram
*
Curso de Estatística Experimental
Slide *
*
Curso de Estatística Experimental
Slide *
Curso de Estatística Experimental
*
Curso de Estatística Experimental
Slide *
*
Slide *
		Nem sempre os dados obtidos de experimentos atendem as hipóteses básicas para a análise de variância paramétrica.
		Existem duas alternativas: 
	
	Transformação dos dados (mudar a escala); ou
	Mudar o modelo (testes não paramétricas)
	
	
TRANSFORMAÇÃO DOS DADOS
*
Curso de Estatística Experimental
Slide *
*
Slide *
	 Logarítmica
	Desvios padrão proporcionais às médias dos tratamentos e suspeita de efeitos não aditivos dos tratamentos.
 Raiz quadrada
Contagens de efeitos raros  Distribuição de Poisson.
 Angular  arco-seno
Contagens expressas como percentagens do total.
*
Curso de Estatística Experimental
Slide *
Dados discretos, normalmente seguem a distribuição de Poisson (média é igual a variância). 
Contagem do número de insetos mortos ou capturados em armadilhas;
Número de plantas com uma determinada sintomatologia;
Número de frutos com determinadas características ou sintoma de uma doença;
Número de ovos de determinado tipo;
Número de árvores sadias ou doentes em uma determinada área....
	
Transformação de Raiz Quadrada
*
Curso de Estatística Experimental
Slide *
Transformação dos dados, consiste simplemente na extração da raiz quadrada dos dados, em seguida procede-se a análise.
Caso os dados apresentarem valores ZERO, recomenda-se acrescentar ao valor X que representa a parcela uma constante k, que normalmente assume valores 0,5 ou 1.
Após a transformação aplica-se o teste que comprovem a melhor homogeneidade dos tratamentos, além da redução do CV.
*
Curso de Estatística Experimental
Slide *
*
Slide *
Exemplo 7: Os dados a seguir se referem ao tempo (dias) de germinação de sementes de araucaria submetida a 4 tratamentos diferentes, com 10 repetições cada tratamento. Verifique a questão da normalidade dos dados levando-se em consideração uma probabilidade de confiança de 95%.
*
Curso de Estatística Experimental
Slide *
Normalmente recomendada quando os dados são expressos em porcentagem. Deve ser aplicada as porcentagens obtidas de quocientes entre variáveis discretas. Normalmente os dados desta natureza têm distribuição binomial.
Porcentagem de plantas com um determinado sintoma de doença;
Porcentagem de estacas enraizadas;
Porcentagem de sementes germinadas;
Porcentagem de raízes com sintomas de nematóides...
Transformação Angular
*
Curso de Estatística Experimental
Slide *
Para a transformação dos dados aplica-se a expressão.
		arc sen 
*
Curso de Estatística Experimental
Slide *
*
Slide *
Exemplo 8: Porcentagem de germinação de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas.
*
Curso de Estatística Experimental
Slide *
Muito utilizada quando se constata a proporcionalidade entre médias e os desvios padrões dos diversos tratamentos. 
Os efeitos não são aditivos e sim multiplicativos. A transformação além de estabilizar a variância, produz a aditividade nos efeitos e tende a normalizar a distribuição dos erros.
A transformação é utilizada porque nos casos em que o desvio padrão for igual a média, a distribuição em vez de ser normal passa a ser exponencial.
Transformação Logarítmica
*
Curso de Estatística Experimental
Slide *
Contagem do número de árvores por hectare;
Casos de populações de insetos é grande, o que implica normalmente em contagens grande para testemunha e para os tratamentos (variação de 100 para 10.000 por exemplo), enquanto que para os tratamentos, a faixa de variação é baixa (variação entre 5 e 50 por exemplo)
Comprimento de raízes...
*
Curso de Estatística Experimental
Slide *
Para a transformação dos dados aplica-se:
	
			log X ou ln X
A base 10 do logaritmo é usada por conveniência, podendo-se utilizar qualquer base.
Recomenda-se que a transformação seja usada para números inteiros positivos que cobrem uma grande amplitude.
 
Sendo que não pode ser usado diretamente quando ocorre valores zero e não devem ser usados quando os valores estiverem em uma faixa abaixo de 10. Nesse caso, a transformação mais indicada é:	
			log (X +1)
 
*
Curso de Estatística Experimental
Slide *
*
Slide *
Exemplo 9: Ensaio de época de plantio de milho. Dados de produção em peso de grãos (kg).
*
Curso de Estatística Experimental
Slide *
Após a transformação dos dados, a verificação da homogeneidade ou homocedasticidade das variâncias, a ANÁLISE DA VARIÂNCIA e as COMPARAÇÕES ENTRE MÉDIAS DOS TRATAMENTOS são feitas com os dados transformados, mas na apresentação dos resultados, utilizam-se os dados originais.
*
referem-se à forma da curva de 
uma distribuição de freqüências, mais especificamente do polígono 
de freqüência ou do histograma.
*

Continue navegando