Baixe o app para aproveitar ainda mais
Prévia do material em texto
* Curso de Estatística Experimental Slide * * Slide * Prof. Dr. Luciano Farinha Watzlawick UNICENTRO farinha@unicentro.br AULAS 3 e 4 Experimentação Agrícola * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * POPULAÇÃO E AMOSTRA População é um conjunto de medidas ou contagens de uma variável tomadas em todas unidades definidas como pertencentes à população. Amostra é uma parte da população. UNIDADE AMOSTRAL: Unidade mínima da amostra, de onde se obtém um dado referente à variável em estudo. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Slide * * Curso de Estatística Experimental Slide * * Slide * PARÂMETROS E ESTIMATIVAS Parâmetros são valores fixos. Média Variância 2 Desvio padrão Amostras são descritas pelos mesmos valores aplicados às populações, porém para elas são chamados de estimativas. Média Variância S2 Desvio padrão S * Curso de Estatística Experimental Slide * * Slide * MEDIDAS DE POSIÇÃO ESTATISTICA DESCRITIVA Proporcionam verificar a posição, dispersão, a descrição e compreensão das distribuições ou amostras de freqüência de um conjunto de dados. MEDIDAS DE DISPERSÃO MEDIDAS DE FORMA * Curso de Estatística Experimental Slide * * Slide * Média aritmética Mediana Valor da classe central Valor médio das classes centrais Moda Valor da classe mais freqüente MEDIDAS DE POSIÇÃO * Curso de Estatística Experimental Slide * * Slide * Variância (quadrado do desvio padrão) Desvio padrão (população e amostra) Coeficiente de variação MEDIDAS DE DISPERSÃO * Curso de Estatística Experimental Slide * * Slide * População infinita (1-f ) 0,98 População finita (1-f ) < 0,98 * Curso de Estatística Experimental Slide * Coeficiente de Variação (Classificação de Pimentel Gomes) BAIXOS: se inferiores a 10%; MÉDIOS: quando de 10 a 20%; ALTOS: quando de 20 a 30%; e MUITO ALTOS: acima de 30%. * Curso de Estatística Experimental Slide * * Slide * Erro padrão (desvio padrão da média) Erro de amostragem (absoluto e relativo) Intervalo de confiança para a média * Curso de Estatística Experimental Slide * * Slide * Valores de t segundo níveis diferentes níveis de probabilidade de confiança. * Curso de Estatística Experimental Slide * * Slide * Número ideal de unidades amostrais População infinita (1-f ) 0,98 População finita (1-f ) < 0,98 INTENSIDADE IDEAL DE AMOSTRAGEM * Curso de Estatística Experimental Slide * * Slide * ASSIMETRIA - Referem-se à forma da curva (GRAU DE DEFORMAÇÃO) de uma distribuição de freqüências. É interessante saber se a população da qual a amostra foi coletada pode ser descrita por uma curva NORMAL. Curva simétrica (MEDIA = MEDIANA = MODA) MEDIDAS DE FORMA * Curso de Estatística Experimental Slide * * Slide * A medida que quantifica o distanciamento de um conjunto de dados em relação à simetria é o Coeficiente de Assimetria (As). e sendo Positivo (As>0) indica uma simetria à direita Negativo (As<0) indica uma simetria à esquerda ZERO (As = 0) simetria * Curso de Estatística Experimental Slide * * Slide * CURTOSE - Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão (NORMAL). O Coeficiente de curtose (K) é o que quantifica o grau de achatamento. sendo * Curso de Estatística Experimental Slide * * Slide * K > 3: indica uma distribuição chamada leptocúrtica K < 3: indica uma distribuição platicúrtica K = 3: indica uma distribuição semelhante a NORMAL chamada mesocúrtica * Curso de Estatística Experimental Slide * * Slide * EXEMPLO 1: Foram amostrados 40 pessegueiros em uma propriedade estimando-se a safra anual (em alqueire/árvore), sendo que a produções são apresentados na Tabela. Utilizando a informação da produção, calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança, bem como o coeficiente de assimetria e coeficiente de curtose. * Curso de Estatística Experimental Slide * * Slide * EXEMPLO 2: Foram medidas em 50 árvores de Pinus taeda a altura total (m), sendo que os dados encontram-se apresentados na Tabela. Utilizando a informação da produção, calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 90% de probabilidade de confiança, bem como o coeficiente de assimetria e coeficiente de curtose. * Curso de Estatística Experimental Slide * * Slide * DISTRIBUIÇÃO DE FREQUÊNCIA Quando se estuda uma massa de dados (variáveis quantitativas podem assumir um grande número de valores) é de freqüente interesse resumir as informações de variáveis. * Curso de Estatística Experimental Slide * * Slide * Costuma-se, freqüentemente, para uma melhor compreensão dos mesmos, distribuí-los em classes ou intervalos determinando-se o número de indivíduos pertencentes a cada classe ou intervalo. Desta forma, um arranjo tabular dos dados, juntamente com as freqüências correspondentes aos mesmos é denominado distribuição de freqüência ou tabela de freqüência. * Curso de Estatística Experimental Slide * * Slide * Produção, em g, de 400 parcelas de 1m2 de cevada * Curso de Estatística Experimental Slide * * Slide * Distribuição de freqüências Distribuição de freqüências Tabelas de freqüências Intervalo, amplitude Classes 11,8 classes 12 classes Amplitude total 248 – 22 = 226 Amplitude da classe 226 / 12 = 18,83 19 * Curso de Estatística Experimental Slide * * Slide * Tabela de Freqüências Amplitude de classes, pontos médios e freqüências * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Definição das Classes Número de Classes (Algoritmo de Ramsdall) 2) Amplitude dos Dados 3) Amplitude das Classes (arredonde está amplitude encontrada) 4) Organizar as classes de modo que a primeira classes contenha X mínimo e a última classe contenha X máximo Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Slide * EXEMPLO 2: Foram medidas em 40 árvores de Pinus elliottii a produção de resina (kg), sendo que os dados (produção) encontram-se apresentados na Tabela 1. Utilizando a informação da produção, realize a distribuição de freqüência e calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança. * Curso de Estatística Experimental Slide * Variância (quadrado do desvio padrão) * Slide * Média aritmética * Curso de Estatística Experimental Slide * EXEMPLO 3: Os dados a seguir se referem a altura (cm) de mudas de Eucalyptus grandis aos 7 meses de idade, realize a distribuição de freqüência, e lodo após calcule: média, variância, desvio padrão, coeficiente de variação, erro padrão, intervalo de confiança à 95% de probabilidade de confiança. * Curso de Estatística Experimental Slide * * Slide * A distribuição normal é uma das mais importantes distribuições da Estatística, conhecida também como Distribuição de Gauss ou Gaussiana. Distribuição Normal * Curso de Estatística Experimental Slide * * Slide * Equação da curva normal y = freqüência em determinado ponto da curva = média da população 2 = variância da população = 3,14159265359 e = 2,7182818284 * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Em uma distribuição normal, um desvio padrão (azul escuro) representa cerca de 68% do conjuntodos dados, enquanto dois desvios padrões desde a média (azul médio e escuro) representam cerca de 95%, e três desvios padrões (azul claro, médio e escuro) cobrem cerca de 99,7%. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * Pequenos erros associados com a obtenção das observações; Erros associados com a falta de representatividade das amostras em relação à população da qual foram retiradas; e Um componente de erro resultante da falta de repetibilidade das condições ambientais de um experimento para outro. * Slide * Erro Experimental * Curso de Estatística Experimental Slide * * Slide * - Hipótese de nulidade H0 Não há diferenças entre as amostra Hipótese alternativa H1 Existem diferenças entre as amostra TESTE DE HIPÓTESES ESTATÍSTICAS * Curso de Estatística Experimental Slide * Os procedimentos estatísticos para comparar duas ou mais médias de tratamentos assumem a existência da chamada hipótese da nulidade. Esta afirma não haver diferenças entre os efeitos dos tratamentos. Hipótese de nulidade H0 Não há diferenças entre as médias das amostras dos tratamentos Hipótese alternativa H1 Existem diferenças entre as médias das amostras dos tratamentos * Slide * ANÁLISE DE VARIÂNCIA * Curso de Estatística Experimental Slide * O fato da hipótese da nulidade não ser rejeitada, em princípio, significa que não existem diferenças significativas entre as médias, mas isto não assegura que alguns dos tratamentos não tenham efeito. Há sempre a probabilidade de que as diferenças estejam presentes e não estejam detectadas. Nestes casos os experimentos não foram planejados adequadamente para detectar estas diferenças no nível de probabilidade desejado. * Slide * * Curso de Estatística Experimental Slide * * Slide * A ANOVA baseia-se em 4 condicionantes: Erros aleatórios, independentes, e normalmente distribuídos Variâncias das amostras homogêneas Médias e variâncias das amostras não correlacionadas Efeitos principais devem ser aditivos Condicionantes da ANOVA * Curso de Estatística Experimental Slide * Quando a casualização inicial é bem feita e o tipo de delineamento experimental utilizado é adequado, pode-se: assumir que os erros são independentes e normalmente distribuídos; que médias e variâncias não são correlacionadas; e, que os efeitos são aditivos. * Slide * Como verificar os requisitos para ANOVA * Curso de Estatística Experimental Slide * A prática mostra que se as variâncias dos tratamentos são homogêneas as demais condicionantes também são respeitadas, e se as variâncias dos tratamentos não são homogêneas existe uma grande chance de que as outras condicionantes também não o sejam. Quando se testa a homogeneidade das variâncias, de certa forma, testa-se todas as demais condicionantes. * Slide * * Curso de Estatística Experimental Slide * Os erros ou desvios devidos ao efeito dos fatores não controlados devem assumir uma distribuição normal de probabilidade. Isto implica que os dados experimentais se ajustem a uma distribuição normal de probabilidade. * Slide * Normalidade * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Teste de Normalidade – Schapiro-Wilk Existem numerosos testes para testar a normalidade: - Gráfico de Probabilidade Normal - Método dos Momentos - Teste “W” - Shapiro-Wilk - Teste Kolmogorov-Smirnov - Teste de Aderência X² Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Porém um dos mais utilizados é o teste W desenvolvido por Shapiro eWilk (1965). Interpretação: Compara-se o valor de Wcal com o valor de Wtab apresentando na tabela. Se Wcal for MENOR do que o Wtab, rejeita-se a hipótese de normalidade dos dados. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * EXEMPLO 4: Os dados a seguir se referem ao tempo (dias) de germinação de sementes de araucaria submetida a 4 tratamentos diferentes, com 10 repetições cada tratamento. Verifique a questão da normalidade dos dados levando-se em consideração uma probabilidade de confiança de 95%. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Ordenar em ordem crescente as j observações da amostra que apresenta a menor variância (parte-se do princípio de que se o tratamento que apresenta a menor dispersão não for normalmente distribuída, então as demais também não serão). Calcular a partir do item 1. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * 3) Calcular b. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Tabela para os Coeficientes para o teste de Shapiro-Wilk. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * 4) Calcular o valor de W 5) Conclusão: Como o Wcal =0,840 < o valor de Wtab =0,842, rejeitamos a hipótese de normalidade dos dados, concluindo-se que é preciso realizar algum tipo de transformação nos mesmos para que ele passe a ser verdadeira. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Tabela dos valores críticos da estatística W de Shapiro-Wilk. Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Slide * Independência Os erros ou desvios devidos ao efeito dos fatores não controlados devem independentes. Isto implica que os efeitos dos tratamentos sejam independentes, que não seja uma correlação entre eles. Isto pode não ocorrer quando os tratamentos são doses crescentes de adubos, inseticidas, etc. ocasião em que a análise de variância deve ser feita estudando a regressão. * Curso de Estatística Experimental Slide * Para cada delineamento experimental existe um modelo matemático chamado modelo linear aditivo. Para o Delineamento Inteiramente Casualizado o modelo é: O valor de qualquer unidade experimental é formado pela média geral do experimento mais um efeito dos tratamentos e um erro. * Slide * Aditividade * Curso de Estatística Experimental Slide * Em um Delineamento em Blocos ao Acaso isto implica em que o efeito de um tratamento é o mesmo em todos os blocos e que o efeito dos blocos é o mesmo em todos os tratamentos. Se um tratamento aumenta a produção em determinada quantidade em relação a média geral do ensaio assume-se que este aumento é o mesmo para os blocos com alta produção e para os blocos com baixa produção. * Slide * * Curso de Estatística Experimental Slide * A homogeneidade de variâncias pode ser testada pelos testes de: Bartlett Hartley e Cochram que serão exemplificados. * Slide * HOMOGENEIDADE OU HOMOCEDASTICIDADE DE VARIÂNCIAS * Curso de Estatística Experimental Slide * Serve para testar a homogeneidade de variâncias. Parte-se da hipótese de que as variâncias são homogêneas. Se o resultado do teste confirmar esta hipótese procede-se a análise de variância normalmente. Se por outro lado, o teste revelar que as variâncias não são homogêneas transforma-se os dados e verifica-se novamente se; com os dados transformados, as variâncias tornaram-se homogêneas ou não. * Slide * * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Testar a homogeneidade de variâncias Hipótese de nulidadeH0 Não há diferenças entre variâncias das amostra Hipótese alternativa H1 Existem diferenças entre as variâncias das amostras Curso de Estatística Experimental * Curso de Estatística Experimental Slide * Fórmula do teste de Bartlett Resultado dividido pelo fator de correcão C Onde: 2,3026 = constante GL = graus de liberdade de cada tratamento n = número de tratamentos = médias das variâncias = variância de cada tratamento * Slide * Teste de Bartlett * Curso de Estatística Experimental Slide * * Slide * EXEMPLO 5: Dados fictícios de quatro tratamentos com 4 repetições em um delineamento em blocos ao acaso. * Curso de Estatística Experimental Slide * * Slide * O valor tabelado é obtido para graus de liberdade do número de tratamentos i em uma probabilidade de confiança. Se o valor H observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade. * Curso de Estatística Experimental Slide * * Slide * Conclusão: O valor tabelado é 7,815 ao nível de 5% de probabilidade. Como o valor calculado foi de 0,2616, não se encontra evidência de que a hipótese da nulidade seja falsa e conclui-se que as variâncias são homogêneas. * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Curso de Estatística Experimental * Curso de Estatística Experimental Slide * EXEMPLO 6: Um estudante de graduação da UNICENTRO realizou experimento, onde testou 6 diferentes tipos de tratamentos para a quebra de dormência de sementes de uma determinada espécie com 4 repetições em cada tratamento, sendo que em cada repetição foram testadas 100 sementes. O número de sementes germinadas após 180 dias da aplicação dos tratamentos são apresentados abaixo. Teste a homogeneidade das variâncias dos tratamentos, escrevendo as hipóteses testadas e utilizando X² 5%. Conclua sobre os resultados obtidos. * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Teste bem simples para verificar a homocedasticidade, também é conhecido como F máximo de Hartley (H). O valor tabelado é obtido para o número de tratamentos i e graus de liberdade da repetição j. Se o valor H observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade. Teste de Hartley Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Slide * O teste de Cochran compara a maior variância com as demais. O valor tabelado é obtido o número de graus de liberdade (repetições) na linha e o número de tratamentos na coluna. Se o valor C observado for maior que o tabelado rejeita-se Ho e fica demostrado a presença de heterocedasticidade. Teste de Cochram * Curso de Estatística Experimental Slide * * Curso de Estatística Experimental Slide * Curso de Estatística Experimental * Curso de Estatística Experimental Slide * * Slide * Nem sempre os dados obtidos de experimentos atendem as hipóteses básicas para a análise de variância paramétrica. Existem duas alternativas: Transformação dos dados (mudar a escala); ou Mudar o modelo (testes não paramétricas) TRANSFORMAÇÃO DOS DADOS * Curso de Estatística Experimental Slide * * Slide * Logarítmica Desvios padrão proporcionais às médias dos tratamentos e suspeita de efeitos não aditivos dos tratamentos. Raiz quadrada Contagens de efeitos raros Distribuição de Poisson. Angular arco-seno Contagens expressas como percentagens do total. * Curso de Estatística Experimental Slide * Dados discretos, normalmente seguem a distribuição de Poisson (média é igual a variância). Contagem do número de insetos mortos ou capturados em armadilhas; Número de plantas com uma determinada sintomatologia; Número de frutos com determinadas características ou sintoma de uma doença; Número de ovos de determinado tipo; Número de árvores sadias ou doentes em uma determinada área.... Transformação de Raiz Quadrada * Curso de Estatística Experimental Slide * Transformação dos dados, consiste simplemente na extração da raiz quadrada dos dados, em seguida procede-se a análise. Caso os dados apresentarem valores ZERO, recomenda-se acrescentar ao valor X que representa a parcela uma constante k, que normalmente assume valores 0,5 ou 1. Após a transformação aplica-se o teste que comprovem a melhor homogeneidade dos tratamentos, além da redução do CV. * Curso de Estatística Experimental Slide * * Slide * Exemplo 7: Os dados a seguir se referem ao tempo (dias) de germinação de sementes de araucaria submetida a 4 tratamentos diferentes, com 10 repetições cada tratamento. Verifique a questão da normalidade dos dados levando-se em consideração uma probabilidade de confiança de 95%. * Curso de Estatística Experimental Slide * Normalmente recomendada quando os dados são expressos em porcentagem. Deve ser aplicada as porcentagens obtidas de quocientes entre variáveis discretas. Normalmente os dados desta natureza têm distribuição binomial. Porcentagem de plantas com um determinado sintoma de doença; Porcentagem de estacas enraizadas; Porcentagem de sementes germinadas; Porcentagem de raízes com sintomas de nematóides... Transformação Angular * Curso de Estatística Experimental Slide * Para a transformação dos dados aplica-se a expressão. arc sen * Curso de Estatística Experimental Slide * * Slide * Exemplo 8: Porcentagem de germinação de sementes de Dolichos biflorus L. germinadas em diferentes temperaturas. * Curso de Estatística Experimental Slide * Muito utilizada quando se constata a proporcionalidade entre médias e os desvios padrões dos diversos tratamentos. Os efeitos não são aditivos e sim multiplicativos. A transformação além de estabilizar a variância, produz a aditividade nos efeitos e tende a normalizar a distribuição dos erros. A transformação é utilizada porque nos casos em que o desvio padrão for igual a média, a distribuição em vez de ser normal passa a ser exponencial. Transformação Logarítmica * Curso de Estatística Experimental Slide * Contagem do número de árvores por hectare; Casos de populações de insetos é grande, o que implica normalmente em contagens grande para testemunha e para os tratamentos (variação de 100 para 10.000 por exemplo), enquanto que para os tratamentos, a faixa de variação é baixa (variação entre 5 e 50 por exemplo) Comprimento de raízes... * Curso de Estatística Experimental Slide * Para a transformação dos dados aplica-se: log X ou ln X A base 10 do logaritmo é usada por conveniência, podendo-se utilizar qualquer base. Recomenda-se que a transformação seja usada para números inteiros positivos que cobrem uma grande amplitude. Sendo que não pode ser usado diretamente quando ocorre valores zero e não devem ser usados quando os valores estiverem em uma faixa abaixo de 10. Nesse caso, a transformação mais indicada é: log (X +1) * Curso de Estatística Experimental Slide * * Slide * Exemplo 9: Ensaio de época de plantio de milho. Dados de produção em peso de grãos (kg). * Curso de Estatística Experimental Slide * Após a transformação dos dados, a verificação da homogeneidade ou homocedasticidade das variâncias, a ANÁLISE DA VARIÂNCIA e as COMPARAÇÕES ENTRE MÉDIAS DOS TRATAMENTOS são feitas com os dados transformados, mas na apresentação dos resultados, utilizam-se os dados originais. * referem-se à forma da curva de uma distribuição de freqüências, mais especificamente do polígono de freqüência ou do histograma. *
Compartilhar