Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE ESTATÍSTICA DE DADOS – IQA363 PAULA FERNANDES DE AGUIAR Profa. Departamento de Química Analítica Instituto de Química da UFRJ e-mail: paulafda@iq.ufrj.br /paula.fdeaguiar@gmail.com Tel: (21) 3938-7877 Sala: 517 PROGRAMA 1. CONCEITO ESTATÍSTICA 2. FERRAMENTAS NECESSÁRIAS AO CÁLCULO ESTATÍSTICO 2.1. ARREDONDAMENTO 2.2. ALGARISMOS SIGNIFICATIVOS 3. ERROS (TIPOS DE ERROS EXPERIMENTAIS) 3.1. ERROS GROSSEIROS 3.2. ERROS SISTEMÁTICOS OU DETERMINADOS 3.3. ERROS ALEATÓRIOS OU INDETERMINADOS 2 7. A DISTRIBUIÇÃO NORMAL 5. MEDIDAS DE DISPERSÃO 6. DISTRIBUIÇÃO DE FREQUÊNCIA 4. MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL 7.1. TESTE DE NORMALIDADE: SHAPIRO-WILK PROGRAMA 8. GRAU DE CONFIANÇA DE STUDENT (t) – TESTE t-STUDENT 9. TESTE F-SNEDECOR 3 10. TESTES DE HIPÓTESES PROGRAMA 10.1. CASO 1. COMPARAÇÃO DE UM VALOR MEDIDO COM UM VALOR “CONHECIDO” 10.2. CASO 2. COMPARAÇÃO DE DOIS VALORES MEDIDOS – COMPARAÇÃO ENTRE MEDIDAS REPETIDAS 10.3. CASO 3. COMPARAÇÃO DE MÉDIAS DE DADOS EM PARES 4 11. ANÁLISE DE VARIÂNCIA (ANOVA) 11.1. ANÁLISE DE VARIÂNCIA COM UM FATOR 11.2. ANÁLISE DE VARIÂNCIA COM DOIS FATORES PROGRAMA 14. AVALIAÇÃO DA HOMOGENEIDADE DAS VARIÂNCIAS (HOMOCEDASTICIDADE) 13. A REGRESSÃO LINEAR 13.1. A ESTIMATIVA DOS PARÂMETROS DE REGRESSÃO 13.2. A VALIDAÇÃO DO MODELO 13.2.1 A ANÁLISE DE RESÍDUOS 16. BOX PLOT 5 12. TESTE DE VALORES DISCREPANTES/ABERRANTES (OUTLIERS) 12.1. TESTE DE DIXON 12.2. TESTE DE GRUBB’S 13.2.2 A ANÁLISE DE VARIÂNCIA 15. COMPARAÇÃO DA INCLINAÇÃO DE DUAS RETAS 1. Conceito Estatística 6 Estatística - Conceito 7 “É um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento” Estatística - Conceito “É a ciência que coleta, classifica e avalia numericamente dados que servirão de base para inferências” 8 9 Inferência Estatística É o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. 10 “Dizemos que uma inferência estatística é feita quando se estabelecem conclusões para a população com base nos dados de uma amostra e no resultado de um teste estatístico” O uso da ESTATÍSTICA na análise dos DADOS EXPERIMENTAIS é de extrema importância para que um resultado analítico possua uma CONFIABILIDADE ACEITÁVEL. 11 A CONFIABILIDADE necessária para um resultado, justifica o esforço extra requerido para que análises em replicatas sejam realizadas. Os resultados individuais de um conjunto de medidas raramente são iguais. 12 2. Ferramentas necessárias ao cálculo Estatístico 13 2.1. Arredondamento 14 Arredondamento Aplica-se quando há a intenção de que um número limitado de dígitos em um valor deva ser considerado significativo para fins de determinação da conformidade com as especificações. 15 1. Um valor observado ou calculado deve ser arredondado para o valor mais próximo. Procedimento Arredondamento OBSERVAÇÃO: ARREDONDAR PARA A UNIDADE – 0 CASA DEPOIS DA VÍRGULA ARREDONDAR PARA O DÉCIMO – 1 CASA DEPOIS DA VÍRGULA ARREDONDAR PARA O CENTÉSIMO – 2 CASAS DEPOIS DA VÍRGULA ARREDONDAR PARA O MILÉSIMO- 3 CASAS DEPOIS DA VÍRGULA 16 Ex: 121,7948 para o centésimo – 121,79 Não se faz primeiro o arredondamento 121,795 e depois 121,80. 2. O valor arredondado deve ser obtido em uma só etapa, por arredondamento direto do valor disponível mais preciso, e não em dois ou mais arredondamentos sucessivos. Arredondamento Procedimento 17 3. Se o número a ser removido for menor que cinco, o subsequente à esquerda mantém o seu valor. Procedimento Ex: 5,1234 para o milésimo – 5,123 5,1234 para o centésimo – 5,12 5,1234 para o décimo – 5,1 Arredondamento 18 4. Se o número a ser removido é maior que cinco, o subsequente à esquerda aumenta o seu valor de uma unidade. Ex: 6,1878 para o milésimo – 6,188 6,1878 para o centésimo – 6,19 6,1987 para o décimo – 6,2 6,1878 para o décimo – 6,2 3,965001 para o décimo – 4,0 Arredondamento Procedimento 19 Arredondamento Procedimento 5. Quando o número a ser removido for exatamente igual à 5, e não houver outros dígitos além deste, ou houver somente zeros, o anterior aumenta se ele for ímpar e permanece inalterado se for par. Ex: 1,375 para o centésimo – 1,38 1,385 para o centésimo – 1,38 45,8775 para o milésimo - 45,878 45,8765 para o milésimo - 45,87620 6. Quando o número a ser removido for exatamente igual à 5, e houver outros dígitos diferentes de zero além deste, o subsequente à esquerda aumenta o seu valor de uma unidade. Ex: 3,8655001 para o milésimo - 3,866 3,865001para o centésimo - 3,87 364,5001 para a unidade - 365 Arredondamento Procedimento 21 22 ARREDONDAR OS NÚMEROS A SEGUIR CONFORME A PRECISÃO INDICADA NÚMERO PRECISÃO RESULTADO 48,6 UNIDADE 136,5 UNIDADE 2,484 CENTÉSIMO 0,0435 MILÉSIMO 5,40001 UNIDADE 143,95 DÉCIMO 24448 MILHAR 5,56500 CENTÉSIMO 5,56501 CENTÉSIMO Exercício 1 Arredondamento 23 ARREDONDAR OS NÚMEROS A SEGUIR CONFORME A PRECISÃO INDICADA NÚMERO PRECISÃO RESULTADO 48,6 UNIDADE 49 136,5 UNIDADE 136 2,484 CENTÉSIMO 2,48 0,0435 MILÉSIMO 0,044 5,40001 UNIDADE 5 143,95 DÉCIMO 144,0 24448 MILHAR 24000 5,56500 CENTÉSIMO 5,56 5,56501 CENTÉSIMO 5,57 Exercício 1 Arredondamento 24 25 ARRED(núm;núm_dígitos) A função estatística ARRED arredonda um número até a quantidade especificada de dígitos. Como fazer isto no EXCEL??? 26 Exemplo ARRED(núm;núm_dígitos) 27 VAMOS FAZER NO EXCEL? 2.2. Algarismos Significativos (AS) 28 O número de algarismos significativos é o número mínimo de algarismos necessários para escrever um determinado valor em notação científica sem a perda de exatidão. HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-1 Algarismos Significativos) Algarismos Significativos 29 O número de dígitos informado em uma medida reflete a exatidão da medida e a precisão do aparelho de medição. Todos os algarismos conhecidos com certeza mais um algarismo extra são chamados de algarismos significativos. Algarismos Significativos 30 Considera-se que na expressão numérica de uma medida, o último algarismo apresenta uma incerteza de +/- o valor da precisão do instrumento utilizado na medida, quando esta é conhecida. Caso contrário, utiliza-se a precisão avaliada, como sendo o décimo da menor medida da escala. Algarismos Significativos 31 Algarismos Significativos Procedimento 1. Números diferentes de zero são sempre significativos. Ex: 2,345 4 algarismos significativos 2. Zeros entre números diferentes de zero são sempre significativos. algarismos significativos Ex: 10,305 5 algarismos significativos 32 O dígito zero pode ter um valor específico ou apenas indicar uma ordem de grandeza. 3. Quando os zeros à frente do primeiro dígito não nulo de um número indicam apenas a ordem de grandeza, estes não são considerados dígitos significativos e devem ser expressos em notação científica. Ex: 0,0034 2 algarismos significativos 3,4 x 10-3 Procedimento Algarismos Significativos Ex: 0,0003 1 algarismo significativo 3 x 10-4 33 Algarismos Significativos Procedimento 4. Os zeros no final do número, depois de uma casa decimal, são significativos. Ex: 32,00 4 algarismos significativos 0,200 3 algarismos significativos 34 Algarismos Significativos Procedimento 5. Os zeros no final de um número, antes de uma casa decimal, são ambíguos (podem ou não ser significativos). algarismos significativos Ex: 140 000 2 a 6 algarismos significativos 10.300 3 a 5 algarismos significativos 35 Amostra pesada em vários tipos de balanças Balança Precisão (g) Medida (g) Resultado (g) 1 0,0001 6,1540 6,1540 2 0,001 6,1540 6,154 3 0,01 6,1540 6,15 4 0,1 6,1540 6,2 5 1 6,1540 65 36 Quantos algarismos significativos possuem os números abaixo: A) 142,7 B) 1,427 × 102 C) 1,4270 × 102 D) 1,9030 E) 0,03910 F) 1,40 × 104 G) 6,302 × 10−6 H) 0,000006302 Exemplo 1 Algarismos Significativos (AS) 37 38 Exemplo 1 Algarismos Significativos (AS) Quantos algarismos significativos possuem os números abaixo: A) 142,7 4AS B) 1,427 × 102 4AS C) 1,4270 × 102 5AS D) 1,9030 5AS E) 0,03910 4AS F) 1,40 × 104 3AS G) 6,302 × 10−6 4AS H) 0,000006302 4AS 39 1. ARREDONDE OS NÚMEROS PARA QUE TENHAM SOMENTE 1 ALGARISMO SIGNIFICATIVO NÚMERO 0,00025000 0,00025001 0,00025127 0,00035000 Exercício 1 Arredondamento e Algarismos Significativos 40 NÚMERO NOTAÇÃO CIENTÍFICA REGRA ARREDONDA MENTO RESULTADO 0,00025000 2,5000 x 10-4 5 2 x 10-4 0,00025001 2,5001 x 10-4 6 3 x 10-4 0,00025127 2,5127 x 10-4 6 3 x 10-4 0,00035000 3,5000 x 10-4 5 4 x 10-4 1. ARREDONDE OS NÚMEROS PARA QUE TENHAM SOMENTE 1 ALGARISMO SIGNIFICATIVO Exercício 1 41 2. QUANTOS ALGARISMOS SIGNIFICATIVOS HÁ EM CADA UM DOS SEGUINTES NÚMEROS ? NÚMERO NO. ALGARISMOS SIGNIFICATIVOS 45,8 cm 45,80 cm 1,40 m 3,50 x 10-3 mm 1,00560 cm 9 g 3,0 x 106 libras 7,54400 x 10-5 Kg Exercício 2 42 NÚMERO NO. ALGARISMOS SIGNIFICATIVOS 45,8 cm 3 45,80 cm 4 1,40 m 3 3,50 x 10-3 mm 3 1,00560 cm 6 9 g 1 3,0 x 106 libras 2 7,54400 x 10-5 Kg 6 2. QUANTOS ALGARISMOS SIGNIFICATIVOS HÁ EM CADA UM DOS SEGUINTES NÚMEROS ? Exercício 2 43 3. ARREDONDE OS NÚMEROS PARA QUE TENHAM OS NÚMEROS DE ALGARISMOS SIGNIFICATIVOS INDICADOS Exercício 3 NÚMERO NÚMERO DE ALGARISMOS SIGNIFICATIVOS REGRA ARREDONDA MENTO RESULTADO 7,243 g 2 3 4,736 g 3 4 43,5500 g 3 5 43,8500 g 3 5 43,8501 g 3 6 44 3. ARREDONDE OS NÚMEROS PARA QUE TENHAM OS NÚMEROS DE ALGARISMOS SIGNIFICATIVOS INDICADOS Exercício 3 NÚMERO NÚMERO DE ALGARISMOS SIGNIFICATIVOS REGRA ARREDONDA MENTO RESULTADO 7,243 g 2 3 7,2 g 4,736 g 3 4 4,74 g 43,5500 g 3 5 43,6 g 43,8500 g 3 5 43,8 g 43,8501 g 3 6 43,9 g 45 HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-1 Algarismos Significativos) Exercício 4 4. QUANTOS ALGARISMOS SIGNIFICATIVOS POSSUI O NÚMERO ABAIXO ? 92 500 46 Resposta: O número 92 500 é ambíguo em relação ao número de algarismos significativos. Ele pode ser representado por uma das seguintes formas: 9,25 x 104 9,250 x 104 9,2500 x 104 3 AS 4 AS 5 AS HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-1 Algarismos Significativos) Exercício 4 4. QUANTOS ALGARISMOS SIGNIFICATIVOS POSSUEM O NÚMERO ABAIXO: 92 500 47 Algarismos Significativos na Aritmética O arredondamento deve ser feito somente na resposta final (não nos resultados parciais), a fim de se evitar a acumulação de erros de arredondamento. HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-2 Algarismos Significativos na Aritmética) Veremos quantos algarismos devem existir em uma resposta após serem executadas operações aritme ́ticas com seus dados. 48 49 1,9834 + 2,4404 + 0,9184 = ? 1,9834 + 2,4404 + 0,9184 = 5,5422 N° casas decimais conta Final obtido Final esperado 0 casa 2 + 2 +1 5 6 1 casa 2,0 + 2,4 + 0,9 5,3 5,5 2 casas 1,98 + 2,44 + 0,92 5,34 5,54 3 casas 1,983 + 2,440 + 0,918 5,341 5,542 Adição e Subtração: Se os números a serem somados ou subtraídos tiverem o mesmo número de algarismos, a resposta deve ter o mesmo número de casas decimais que os números envolvidos na operação. HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-2 Algarismos Significativos na Aritmética) Algarismos Significativos na Aritmética 1,362 x 10-4 + 3,111 x 10-4 ___________________ 4,473 x 10-4 3 casas decimais / 4 AS 3 casas decimais / 4 AS ______________________________________ 3 casas decimais / 4 AS 50 Algarismos Significativos na Aritmética Adição e Subtração: o número de algarismos significativos na resposta pode ser maior ou menor do que o existente nos dados. HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-2 Algarismos Significativos na Aritmética) 5,345 + 6,728 __________ 12,073 4 AS 4 AS ________ 5 AS 3 casas decimais 7,26 x 10-14 - 6,69 x 10-14 ___________________ 0,57 x 10-14 3 AS 3 AS ________ 2 AS 2 casas decimais 51 Adição e Subtração: se os números a serem somados ou subtraídos não possuírem o mesmo número de algarismos significativos, a resposta estará limitada pelo número que tem o menor número de casas decimais. 18,998 403 2 + 18,998 403 2 83,798 ___________________ 121,794 806 4 Resultado: 121,795 9 AS 9 AS 5 AS 7 casas decimais 7 casas decimais 3 casas decimais Algarismos Significativos na Aritmética 52 20,4 + 1,322 83 ___________________ 104,722 Resultado:105 3 AS 4 AS 2 AS 1 casa decimal 3 casas decimais 0 casa decimal Algarismos Significativos na Aritmética 53 Adição e Subtração: em adições ou subtrações de números expressos em notação científica, todos os nu ́meros devem, primeiro, ser convertidos ao mesmo expoente. 1,632 x 105 + 4,107 x 103 + 0,984 x 106 ___________________ 1,632 x 105 + 0,041 07 x 105 + 9,84 x 105 ___________________ 11,513 07 x 105 R:11,51 x 105 3 casas decimais 5 casas decimais 2 casas decimais Algarismos Significativos na Aritmética 54 Multiplicação e Divisão: o número de algarismos significativos contido no número com menos algarismos significativos limita a resposta. 3,26 x 10-5 x 1,78 __________ 5,80 x 10-5 3 AS 3 AS ________ 3 AS 4,3179 x 1012 x 3,6 x 10-19 _____________________ 1,6 x 10-6 5 AS 2 AS ________ 2 AS HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-2 Algarismos Significativos na Aritmética) Algarismos Significativos na Aritmética 55 Algarismos Significativos na Aritmética 45,78 x 1,2 ________________ 54,936 Resultado:55 4 AS 2 AS ________ 5 AS 2 AS 56 Em qualquer cálculo, os resultados são informados com o menor número de algarismos significativos (para multiplicação e divisão) ou com o menor número de casas decimais (adição e subtração). 57 Resumindo: 58 Exercício 1 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 45,78 + 328,908 56,2 59 Exercício 1 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 45,78 + 328,908 56,2 430,888 430,9 2 casas decimais 3 casas decimais 1 casa decimal 1 casa decimal 60 Exercício 2 Algarismos Significativos na Aritmética HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 3 (3-2 Algarismos Significativos na Aritmética) Expresse o resultado da operação com o número de algarismos significativos adequado. 34,60 ÷ 2,462 87 _______________ 5,2 cm x 6,221 cm ________________ 61 34,60 ÷ 2,462 87 _______________ 14,05 4 AS 6 AS ________ 4 AS 5,2 cm x 6,221 cm _______________ 32,3492 cm2 2 AS 4 AS ________ 6 AS Resultado:32 cm2 2 AS Exercício 2 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 62 Exercício 3 Expresse o resultado da operação com o número de algarismos significativos adequado. 89,1 59,076,1 Algarismos Significativos na Aritmética 63 Exercício 3 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 89,1 59,076,1 a) faz-se primeiramente a subtração (1,76-0,59 = 1,17000) mantendo-se todas as casas. b) faz-se a divisão (1,17000/1,89 = 0,619048) mantendo-se o menor número de algarismos significativo (três), e fazendo-se o arredondamento. Resultado = 0,619 64 Exercício 4 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 59,0 89,176,1 65 Exercício 4 Algarismos Significativos na Aritmética Expresse o resultado da operação com o número de algarismos significativos adequado. 59,0 89,176,1 a) faz-se, primeiramente, a multiplicação (1,76x1,89 = 3,32640) de mantém-se todas as casas. b) faz-se a divisão (3,32640/0,59 = 5,637966) e mantem-se o menor número de algarismos significativo (dois), fazendo-se o arredondamento. Resultado = 5,6 66 67 3. Erros (Tipos de Erros Experimentais) 68 ERRAR É INEVITÁVEL Todas as medidas experimentais estão sujeitas a erros!! Erro ou incerteza? Erro de medição (EXATIDÃO): É o número que resulta da diferença entre a indicação de um sistema de medição (valor medido) e o valor verdadeiro do mensurando. Incerteza de medição (PRECISÃO): É o parâmetro, associado ao resultado de uma medição, que caracteriza a faixa dos valores que podem ser atribuídos ao mensurando. 69 O que se deseja é obter um resultado tão próximo quanto possível do valor verdadeiro mediante a aplicação correta do procedimento de medida. 70 Erro de Medição É de senso comum que qualquer experimento ao ser realizado deva ter suas medidas realizadas mais de uma vez. Devemos realizar as medições em duplicata, triplicata ou até mais vezes. Simplificando, é comum usar o termo replicata (uma tradução do inglês replicate) para qualquer número de medições. 71 Erro Absoluto valor real = valor verdadeiro ou mais provável Erro Absoluto = (valor medido – valor real) Erro Relativo Erro relativo (%) = (valor medido – valor real) x 100 valor real 72 Tipos de Erros Experimentais 1) Erros Grosseiros (evitáveis) 2) Erros Sistemáticos (ou determinados) 3) Erros Aleatórios (ou indeterminados) Os resultados experimentais estão sujeitos a vários tipos de ERROS, que podem ser designados de: 73 3.1. Erros Grosseiros 74 1) Erros Grosseiros É um erro ocasional e pode ser evitado. Normalmente, é responsável por resultados absurdos ou discrepantes em relação ao valor central ou valor verdadeiro. 75 1) Erros Grosseiros Exemplos: 1. Enganos na leitura de uma escala; 2. Erro de cálculo nas operações; 3. Emprego de teorias inadequadas; 4. Esquecer de colocar um indicador em uma solução; 5. Falha de energia; 6. Pane em equipamentos; 7. Percepção do uso de reagentes trocados; 8. Uso de reagentes com alto grau de impureza, etc. 76 3.2. Erros Sistemáticos ou Determinados 77 São aqueles que têm causas assinaláveis e valores definidos que, em princípio, podem ser medidos e seu efeito corrigido nos resultados. 2) Erros Sistemáticos ou Determinados 78 São erros unidirecionais, e que levam a um conjunto de resultados que apresente valores tendenciosos e que se distanciam do valor verdadeiro sempre no mesmo sentido (para mais ou para menos). 2) Erros Sistemáticos ou Determinados 79 É independente do número de medições feitas e não pode ser reduzido pelo aumento do número de análises sob condições constantes de medida. 2) Erros Sistemáticos ou Determinados 80 Exemplos: 1. Balança não tarada ou calibrada; 2. Pipeta não aferida; 2) Erros Sistemáticos ou Determinados 81 3.3. Erros Aleatórios ou Indeterminados 82 As vezes ocorrem em um sentido, outras vezes em outro, em relação ao valor verdadeiro. Os resultados das medições flutuam de um modo aleatório. 3) Erros Aleatórios ou Indeterminados 83 A origem dessas flutuações não é assinalável pois estas representam a soma de um conjunto de incertezas muito pequenas que não podem ser identificadas em sua origem. 3) Erros Aleatórios ou Indeterminados São flutuações devidas aos instrumentos, métodos de análises, condições ambientais e devidas ao próprio operador – não podem ser determinados. 84 O erro aleatório de um resultado analítico não pode ser compensado por correção, mas é reduzido pelo aumento do número de observações, embora esta não deva ser a primeira ação para a redução do valor do erro aleatório. 3) Erros Aleatórios ou Indeterminados 85 3) Erros Aleatórios ou Indeterminados São erros devidos a variações ao acaso, de causas não conhecidas exatamente, em geral irregulares e pequenas, e de difícil controle do operador. Exemplos: umidade, temperatura, iluminação, pureza dos reagentes etc. 86 4. Medidas de Posição ou Tendência Central 87 Média (Estatística paramétrica) Mediana (Estatística não paramétrica) Medidas de Posição ou Tendência Central 88 Média A média aritmética, usualmente abreviada para média, , é definida como a soma de todos os valores medidos, dividido pelo número, n, das medidas. x )( x n x n i ix 1 n = número de análises = valor da análise ix 89 90 Média )( x Nas operações que podem ser feitas com as médias aritméticas, estas somam-se e subtraem-se. Exemplo Se a média do conjunto A é igual a 17 e a média do conjunto B é igual a 15, determine a média de (A+B). Resposta: média (A+B) = 32 Essa propriedade é útil para verificar ou confirmar o resultado do cálculo da média de uma amostra ou variável, como também no desenvolvimento de provas matemáticas que apresentam a soma de desvios com relação à média. 91 Propriedades da Média Primeira propriedade A soma dos desvios de uma amostra ou variável é sempre igual a zero. 92 Propriedades da Média Segunda propriedade A soma dos quadrados dos desvios com relação à própria média de uma variável ou amostra é sempre um valor mínimo. mínimo 93 Como fazer isto no EXCEL??? Funções estatísticas do Excel SOMA(núm 1; núm 2;...;núm 30) A função estatística SOMA retorna a soma dos valores numéricos núm1; núm2;...;núm30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos ou assemelhados. 94 Exemplo SOMA(núm 1; núm 2;...;núm 30) 95 VAMOS FAZER NO EXCEL? 96 Funções estatísticas do Excel MÉDIA(núm 1; núm 2;...;núm 30) A função estatística MÉDIA retorna a média aritmética dos valores numéricos núm1; núm2;...;núm30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos ou assemelhados. 97 Exemplo MÉDIA(núm 1; núm 2;...;núm 30) 98 VAMOS FAZER NO EXCEL? Mediana (Med) É o valor que divide uma série ordenada de valores, de tal forma que 50% dos itens estão abaixo e, a outra metade, acima dela. Para um número ímpar de observações será o valor central da série ordenada. 99 Mediana (Med) Para um número par de observações será a média aritmética dos valores centrais da série ordenada. É utilizada quando os valores extremos são de pouca importância. 100 Posição da Mediana 2/)1( nMed Procedimento Colocar os resultados em ordem crescente Determinar a posição da mediana Verificar que valor corresponde à posição da mediana 1 2 3 101 VALORES 3,1 2,9 2,7 3,0 3,2 3,5 2,8 VALORES 2,7 2,8 2,9 3,0 3,1 3,2 3,5 Med = (7+1)/2 = 4 1 2 3 Exemplo 1 Posição da Mediana (Med) 102 VALORES 3,1 2,9 2,7 3,0 3,2 3,5 VALORES 2,7 2,9 3,0 3,1 3,2 3,5 Med = (6+1)/2 = 3,5 1 2 3 Mediana é o valor que se encontra entre aqueles das posições 3 e 4 = 3,05 Exemplo 2 Posição da Mediana (Med) 103 104 Funções estatísticas do Excel MED(núm 1; núm 2;...;núm 30) A função estatística MED retorna a mediana dos valores numéricos núm1; núm2;...;núm30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos ou assemelhados. Como fazer isto no EXCEL??? 105 Exemplo SOMA(núm 1; núm 2;...;núm 30) MED(núm 1; núm 2;...;núm 30) 106 VAMOS FAZER NO EXCEL? 107 MAS TAMBÉM EXISTEOUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL OUTRA FORMA DE FAZER NO EXCEL Dados Análise de dados Ferramentas de análise Estatística descritiva Medidas de Posição ou Tendência Central 108 Média Erro padrão Mediana Moda Desvio padrão Variância da amostra Curtose Assimetria Intervalo Mínimo Máximo Soma Contagem Nível de confiança(95,0%) Estatística Descritiva 109 OUTRA FORMA DE FAZER NO EXCEL EXCEL 110 VALORES 3,10 2,90 2,70 3,00 3,20 3,50 2,80 1. CALCULE A MÉDIA E A MEDIANA, USANDO O EXCEL, DO CONJUNTO DE DADOS A SEGUIR: EXCEL USAR AS FUNÇÕES MÉDIA, MED E A ESTATÍSTICA DESCRITIVA 111 Exercício 1 1. CALCULE A MÉDIA E A MEDIANA, USANDO O EXCEL, DO CONJUNTO DE DADOS A SEGUIR: EXCEL Exercício 2 VALORES 3,10 2,90 2,70 3,00 3,20 3,50 112 USAR AS FUNÇÕES MÉDIA, MED E A ESTATÍSTICA DESCRITIVA 5. Medidas de Dispersão 113 Consideremos os seguintes conjuntos de observações, referentes a três laboratórios A, B e C, que foram convidados a realizar análises de uma mesma amostra, usando a mesma técnica analítica. LABORATÓRIO A LABORATÓRIO B LABORATÓRIO C 4 1 2 5 1 2 5 1 5 5 9 8 6 9 8 9 Medidas de Dispersão 114 LABORATÓRIO A LABORATÓRIO B LABORATÓRIO C 4 1 2 5 1 2 5 1 5 5 9 8 6 9 8 9 Média 5 5 5 A média dos 3 laboratórios é a mesma!!! O desempenho dos 3 laboratórios é igual ? Medidas de Dispersão 115 LAB A LAB B LAB C 4 1 2 5 1 2 5 1 5 5 9 8 6 9 8 9 Média 5 5 5 No primeiro conjunto (LAB A) todos os dados estão próximos da média, no segundo (LAB B) estão bem afastados do valor central, e no terceiro (LAB C), há valores próximos e valores afastados Dizemos que o conjunto A é o menos disperso. Mas como quantificar essa dispersão? Através das estatísticas de dispersão em relação à média aritmética 116 Estas estatísticas são expressões que permitem quantificar essa dispersão, ou seja, o grau de afastamento dos valores das observações no que diz respeito à média da distribuição. Desvio padrão Absolutas Variância Relativa Coeficiente de variação 117 Desvio Padrão Variância Medidas de Dispersão Coeficiente de Variação ou Desvio Padrão Relativo 118 Desvio Padrão (s) Cada conjunto de resultados analíticos precisa estar acompanhado de uma indicação da precisão da análise. O conceito envolvido no cálculo do desvio padrão determina a amplitude, dentro da qual variam as medições, xi. 119 1 )( 1 2 n xx s n i i n-1 = número de graus de liberdade, isto é, a quantidade de comparações independentes que podem ser feitas entre as n unidades da amostra )( Desvio Padrão (s) O desvio padrão de um conjunto de dados experimentais é dado por: 120 Número de graus de liberdade É o número de desvios independentes )( )( ix )( xxi Exemplo: Leituras Desvios 4,2 3,8 4,1 4,0 3,9 0,2 -0,2 0,1 0 -0,1 0 x 20,0 4,0 121 122 A comparação de dois conjuntos de dados por meio do desvio-padrão somente é possível se as médias forem iguais. O conjunto de maior variabilidade é aquele com maior desvio-padrão. Desvio-padrão (s) 123 Exemplo Qual conjunto apresenta maior variabilidade? Conjunto A: Média = 15,5 e s = 3,389 Conjunto B: Média = 15,5 e s = 0,9258 Resposta: Quando as médias são iguais, o conjunto de maior variabilidade é conjunto que apresenta maior desvio-padrão, logo é o conjunto A. Desvio-padrão (s) 124 Nas operações que podem ser feitas com desvios-padrão, diferentemente da média aritmética, estes NÃO se somam nem se subtraem. Apenas se SOMAM VARIÂNCIAS. Ou seja, primeiro é necessário determinar as variâncias, somá-las para, então, extrair-se a raiz quadrada para retornar ao desvio-padrão resultante. Desvio-padrão (s) 125 Desvio-padrão (s) Exemplo PARA (n) IGUAIS ! 126 Funções estatísticas do Excel DESVPAD.A(núm 1; núm 2;...;núm 30) A função estatística DESVPAD retorna o desvio padrão da amostra dos valores numéricos núm1; núm2;...;núm30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos ou assemelhados. Como fazer isto no EXCEL??? 127 Exemplo DESVPAD.A(núm 1; núm 2;...;núm 30) 128 VAMOS FAZER NO EXCEL? 1 )( 1 2 2 n xx s n i i Variância (s2) A variância de um conjunto de dados experimentais é dado por: n-1 = número de graus de liberdade )( 129 130 Funções estatísticas do Excel VAR(núm 1; núm 2;...;núm 30) A função estatística VAR retorna a variância da amostra dos valores numéricos núm1; núm2;...;núm30. Cada um desses núm pode ser um intervalo de células de uma planilha contendo valores numéricos ou assemelhados. Como fazer isto no EXCEL??? 131 Exemplo VAR(núm 1; núm 2;...;núm 30) 132 VAMOS FAZER NO EXCEL? É definido como o quociente entre o desvio padrão e a média. Sua vantagem é caracterizar a dispersão dos dados em termos relativos a seu valor médio. %100(%) x s CV Coeficiente de Variação ou Desvio Padrão Relativo (CV) 133 134 Exemplo Qual conjunto apresenta maior variabilidade? Conjunto A: Média = 34,75 e s= 5,98 Conjunto B: Média = 15,76 e s= 6,04 Resposta: Quando as médias são diferentes, o conjunto de maior variabilidade é conjunto que apresenta maior CV ou DPR, logo é o conjunto B. Conjunto A _CV= 17,2% e Conjunto B_CV= 38,3% Coeficiente de Variação ou Desvio Padrão Relativo (CV) 135 Exemplo 136 VAMOS FAZER NO EXCEL? 137 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL Média Erro padrão Mediana Moda Desvio padrão Variância da amostra Curtose Assimetria Intervalo Mínimo Máximo Soma Contagem Nível de confiança (95,0%) EXCEL Estatística Descritiva 138 Exemplo Excel EXCEL Calcular o desvio padrão, a variância e o coeficiente de variação do conjunto de dados (15, 12, 10, 17, 16). 139 EXCEL 140 3. Os seguintes resultados foram obtidos na análise de replicatas de uma amostra de sangue, para determinação do teor de chumbo presente: 0,752 – 0,756 – 0,752 – 0,751 e 0,760 µg/L de Pb. Calcule o desvio padrão desse conjunto de dados. EXCEL Exercício 3 141 USAR A FUNÇÃO DESVPAD.A E A ESTATÍSTICA DESCRITIVA AMOSTRA No. DETERMINAÇÔES TEORES EM µg/L 1 3 1,80-1,58-1,64 2 4 0,96-0,98-1,02-1,10 3 2 3,13-3,35 4 6 2,06-1,93-2,12-2,16-1,89-1,95 5 4 0,57-0,58-0,64-0,49 6 5 2,35-2,44-2,70-2,48-2,44 7 4 1,11-1,15-1,22-1,04 28 4. O teor de mercúrio em amostras de sete peixes de uma Baía foi determinado por um método baseado na absorção da radiação emitida pelo elemento mercúrio no estado gasoso. Calcular uma estimativa global do desvio padrão do método. Exercício 4 142 Determinar: •As médias por amostra e a média global •Os desvios por amostra e o desvio global •As variâncias por amostra e a variância global EXCEL Exercício 4 143 USAR AS FUNÇÕES MÉDIA, DESVPAD.A, VAR.A E A ESTATÍSTICA DESCRITIVA 144 LISTA DE EXERCÍCIOS 1 6. Distribuição de Frequência 145 Representação do conjunto de dados Distribuições de freqüência - Freqüência relativa - Freqüência acumulada Representação gráfica - Histogramas 146 Representação gráfica de dados HISTOGRAMA CLASSE F R E Q Ü Ê N C IA 147 Histograma É um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva freqüência. CLASSE F R E Q Ü Ê N C IA O que é: 148 Para resumir e visualizar a forma da distribuição dos dados, a localização do valor central e a dispersão em torno desse valor. Histograma Para que serve: Usado para verificar a normalidade da distribuição de uma série de dados 149 Histograma Caracterização de uma distribuição: localização e dispersão Localização: Medida de tendência central (média / mediana / moda) 150 Histograma Da amostra A para B muda a tendência central, mas a variabilidade é constante; Da amostra A para C muda a variabilidade, mas a tendência central é constante; Da amostra B para C muda a tendência central e a variabilidade.151 Histograma Ao observar um histograma, note: 1) A forma, que deve ser simétrica 2) A dispersão, que deve ser pequena 3) A centralização, que deve estar na média 152 Histograma Tipos a) Histograma simétrico ou em forma de sino, tipo distribuição Normal 0 20 40 60 80 100 CLASSE F R E Q Ü Ê N C IA Característica: a freqüência é mais alta no centro e decresce gradualmente para as caudas de maneira simétrica (forma de sino). 153 Histograma Tipos b) Histograma assimétrico e com apenas um pico 0 20 40 60 80 100 CLASSE F R E Q Ü Ê N C IA Características: a frequência decresce bruscamente em um dos lados e de forma gradual no outro, produzindo uma cauda mais longa em um dos lados. 154 Histograma b) Histograma assimétrico e com apenas um pico Frequência maior para os menores valores e cauda maior à direita. Dados positivamente assimétricos (assimetria para a direita) –Média e mediana à direita da moda –Em geral, média à direita da mediana 155 Frequência maior para os maiores valores e cauda maior à esquerda. Dados negativamente assimétricos (assimetria para a esquerda) –Média e mediana à esquerda da moda –Em geral, média à esquerda da mediana Histograma b) Histograma assimétrico e com apenas um pico 156 Histograma Tipos c) Histograma tipo “despenhadeiro” 0 20 40 60 80 100 CLASSE F R E Q Ü Ê N C IA Característica: o histograma termina abruptamente de um ou dos dois lados, dando a impressão de faltar um pedaço na figura. 157 Histograma Tipos d) Histograma com dois picos 0 20 40 60 80 100 F R E Q Ü Ê N C IA CLASSE Característica: ocorrem dois picos e a freqüência é baixa entre eles. . 158 Histograma Tipos e) Histograma do tipo “platô” 0 10 20 30 40 50 60 70 80 F R E Q Ü Ê N C IA CLASSE Característica: classes centrais possuem aproximadamente a mesma frequência. F R E Q Ü Ê N C IA CLASSE 159 Histograma Tipos f) Histograma com uma pequena “ilha” isolada 0 20 40 60 80 100 F R E Q Ü Ê N C IA CLASSE Característica: algumas faixas de valores ficam isoladas da grande maioria dos dados, gerando barras ou pequenos agrupamentos separados. 160 Histograma Como fazer: 1) Organizar a tabela de distribuição de frequências 2) Contar a quantidade de valores coletados (n) 3) Determinar a amplitude R: R = Maior valor - Menor valor 4) Determinar o número de classes (k) 5) Determinar o intervalo de classe (H), dividindo o valor da amplitude R em um certo número de classes K H = R / K (arredondar o resultado) 161 Objetivo Destacar informações relevantes, mediante o resumo dos valores coletados em classes, categorias ou intervalos convenientes. Distribuição de Frequência Histograma Uma distribuição de frequência agrupa os dados por classes de ocorrência, resumindo a análise de conjunto de dados grandes. 162 1. Definir intervalos, classes ou categorias de agrupamento que sejam mutuamente excludentes e coletivamente exaustivas (para que os pontos do conjunto de dados tenham um, e só um, endereço possível; não pode haver pontos em comum nem vazios entre os espaços da distribuição); Construção Histograma 163 2. Traçar um quadro tabular no qual, mediante sinais convenientes, marcam-se os itens enquadráveis em cada classe – tais marcas servem para posterior contagem e cálculo da participação percentual das partes em relação ao total de dados 3. Resumir os resultados em uma tabela de freqüências e/ou gráfico. Histograma Construção 164 k = 1 + [3,222 x log(n)] k = número de classes O número de classes a ser utilizado será um número inteiro, próximo a k. Histograma Determinação do número de classes (k) Regra de Sturges (Regra do logaritmo) 165 EXISTEM OUTRAS FORMAS DE SE ESTIMAR k )ln(21 nk Determinação do número de classes Regra da raiz quadrada nk Regra da Potência de 2 k = menor valor inteiro tal que 2k ≥ n 166 Geralmente, o limite inferior do primeiro intervalo corresponde ao menor valor dos dados, e o superior, a esse valor acrescido do intervalo de classes (H) ou amplitude das classes. O limite inferior da próxima classe é o superior da anterior; o superior é esse valor acrescido da amplitude da classe. Repete-se o processo até atingir o teto dos dados. Intervalo e limites de classe ( a | b ) Histograma 167 A notação a | b indica o intervalo de valores da classe considerada, onde a é o limite inferior e b, o superior. A existência da barra lateral indica a inclusão do limite no intervalo; sua inexistência aponta a exclusão do referido valor. Histograma Intervalo e limites de classe ( a | b ) 168 Razão entre a frequência absoluta simples da classe (Fi) e o número total de observações. Frequência absoluta simples (Fi) Número de observações em cada classe. Frequência relativa simples (fir) Histograma 169 Corresponde a soma das frequências relativas simples (fir) de determinada classe com todas as anteriores. Frequência absoluta acumulada (Fa) Corresponde a soma das frequências de determinada classe com todas as anteriores. Frequência relativa acumulada (fa) Histograma 170 Tabela de pesos de recém nascidos vivos 2,522 2,150 2,500 1,900 3,000 2,450 3,300 2,900 2,450 2,400 2,720 3,300 3,550 3,600 3,750 3,400 3,200 2,920 3,400 3,450 3,125 3,250 3,000 3,200 3,150 2,400 3,200 2,720 3,400 3,120 2,250 3,200 4,100 3,300 3,200 3,120 2,800 2,900 1,570 2,120 3,220 3,720 3,200 2,900 2,500 3,400 4,600 2,000 3,800 2,450 3,000 2,800 3,450 2,500 2,900 3,200 1,720 2,720 2,700 2,700 3,725 2,900 3,100 3,600 3,200 2,700 2,750 2,480 2,900 3,100 2,890 2,950 3,150 2,500 4,100 3,150 4,200 3,900 3,700 3,200 3,110 2,480 2,800 2,300 2,400 2,800 2,100 2,500 2,120 2,780 3,520 3,800 2,900 2,950 2,700 2,700 4,450 2,480 3,150 3,155 Exemplo 171 Exemplo 1) Tamanho da amostra: n=100 2) Determinação da amplitude (R): R = Maior valor - Menor valor R = 4,600 - 1,570 = 3,030 3) Determinação do número de classes (k) k = 1 + [3,222 x log(n)] K= 7,444 ≈ 7 4) Determinação do intervalo de classe (H) H = R / K (arredondar o resultado) H = 3,030 / 7 ≈ 0,4 172 173 Como fazer isto no EXCEL??? 174 Exemplo da apostila 175 VAMOS FAZER NO EXCEL? Classe Frequência 1,5 2,0 2,5 3,0 3,5 4,0 4,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 3 16 31 34 11 4 1 Histograma Tabela de distribuição de frequências simples 176 Intervalo de 0,5 g manualmente CLASSE FREQUÊNCIAS SIMPLES FREQUÊNCIAS ACUMULADAS SIMPLES (Fi) RELATIVA (%) (fir) ABSOLUTA (Fa) RELATIVA (%) (fa) 1,5 2,0 3 (3/100)x100 = 3 3 (3/100)x100 = 3 2,0 2,5 16 (16/100)x100 = 16 (3+16) = 19 (19/100)x100 = 19 2,5 3,0 31 (31/100)x100 = 31 (19 + 31) = 50 (50/100)x100 = 50 3,0 3,5 34 (34/100)x100 = 34 (50 + 34) = 84 (84/100)x100 = 84 3,5 4,0 11 (11/100)x100 = 11 (84 + 11) = 95 (95/100)x100 = 95 4,0 4,5 4 (4/100)x100 = 4 (95 + 4) = 99 (99/100)x100 = 99 4,5 5,0 1 (1/100)x100 = 1 (99 + 1) = 100 (100/100)x100 = 100 TOTAL 100 100% 100 100% Tabela de distribuição de frequências 177 Histograma A PARTIR DA TABELA É POSSÍVEL FAZER Gráfico de frequências acumuladas 178 0 5 10 15 20 25 30 35 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 Classe F re q u ên ci a Histograma 179 180 ALGUÉM PODE ME DAR UM EXEMPLO DE HISTOGRAMA? https://covid.saude.gov.br/ 3 19 50 84 95 99 100 0 10 20 30 40 50 60 70 80 90 100 0 1 2 3 4 5 6 7 8 Classes fa Gráfico de frequências acumuladas 181 182 E DE FREQÜÊNCIA ACUMULADA ? https://covid.saude.gov.br/ 183 Funções estatísticas do Excel MAIOR (matriz; k-ésimo) A função estatística MAIOR retorna o k-ésimo maior valor da matriz ordenada de forma crescente. Para uma mesma matriz, o resultado dessa função dependerá do valor do argumento k-ésimo: Se k-ésimo-1, então o maior valor da matriz será o último valor da matriz ordenada de forma crescente. Se k-ésimo-2, então o maior valor da matriz será o penúltimo valorda matriz e assim sucessivamente, até o primeiro valor da matriz. 184 Funções estatísticas do Excel MENOR (matriz; k-ésimo) A função estatística MENOR retorna o k-ésimo menor valor da matriz ordenada de forma crescente. Para uma mesma matriz, o resultado dessa função dependerá do valor do argumento k-ésimo: Se k-ésimo-1, então o menor valor da matriz será o primeiro valor da matriz ordenada de forma crescente. Se k-ésimo-2, então o menor valor da matriz será o segundo valor da matriz ordenada e assim sucessivamente, até o último valor da matriz. 185 Exemplo 186 VAMOS FAZER NO EXCEL? 187 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL EXCEL Dados Análise de dados Ferramentas de análise Histograma Histograma 188 EXCEL 189 Refazer o exemplo do peso dos recém nascidos vivos usando o Excel EXCEL Exercício 5 190 191 LISTA DE EXERCÍCIOS 2 192 7. A Distribuição Normal A Curva Normal A distribuição normal, ou distribuição de Gauss, ou curva normal, é um dos mais importantes exemplos de uma distribuição contínua de probabilidades. m f(x) x 193 221 2 1 )( m x exf Existe uma função matemática que a descreve: A Curva Normal Onde: σ é o desvio padrão µ é o valor médio (na ausência de erros sistemáticos é o valor verdadeiro) 2 1 é o fator de normalização; padroniza a área sob a curva, de modo que seja sempre igual a 1, figura a seguir. 194 m3 2 32 68% 95,5% 99,7% Representação Equação ),(: 2mNx 2 2 2 2 1 m )( x eY Distribuição normal típica, obtida pela equação anterior 195 Propriedades da distribuição normal de probabilidades f(x) 0 quando x a curva em forma de sino, é simétrica ao redor da media (m. a área sob a curva vale 1 (probabilidade de x assumer qualquer valor real) existe um máximo em x = µ os valores menor e maior que µ ocorrem com igual probabilidade a configuração da curva é dada por 2 parâmetros µ e σ 196 197 7.1. Teste de Normalidade: Shapiro-Wilk Muitos testes são baseados na hipótese de que os dados obtidos seguem uma distribuição normal. Nem sempre isso acontece. Alguns conjuntos de dados podem não seguir uma distribuição normal, sendo necessários testes para verificar este desvio de normalidade. Testes de Normalidade 198 Os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal. Os principais testes de normalidade são: • Teste de Kolmogorov-Smirnov • Teste de Anderson-Darling • Teste de Shapiro-Wilk • Teste de Ryan-Joiner Testes de Normalidade 199 Teste bastante utilizado Limitação: 3 < n < 50 Teste de Shapiro-Wilk 200 Teste de Shapiro-Wilk O teste de Shapiro-Wilk, proposto em 1965, é baseado na estatística W dada por: Onde: - Xi são os valores da amostra ordenados (X1 é o menor). - ai são constantes geradas pelas médias, variâncias e covariâncias das estatísticas de ordem de uma amostra de tamanho n de uma distribuição normal. SQT SW W 2 20 XXSQT i 21 xsn ou iin XXaiSw 1 201 202 203 Teste de Shapiro-Wilk Para realizar o teste de Shapiro-Wilk, devemos: 1. Formular as Hipóteses: H0: A amostra provém de uma população Normal H1: A amostra não provém de uma população Normal 2. Estabelecer o nível de significância do teste (a), normalmente 0,05; 204 Teste de Shapiro-Wilk Para realizar o teste de Shapiro-Wilk, devemos: 3. Calcular a estatística de teste: • Ordenar as n observações da amostra: X1, X2, X3,...,Xn (Arranjar os valores em ordem crescente); • Formar as subtrações: iin XX 1 O índice i varia de 1 a ou de 1 a 2 n 2 1n conforme n seja par ou ímpar 205 Teste de Shapiro-Wilk Para realizar o teste de Shapiro-Wilk, devemos: • Formar os produtos: • Calcular a soma SW: • Calcular SQT: • Calcular W: 3. Calcular a estatística de teste: iin XXai 1 iin XXaiSw 1 20 XXSQT i ou 21 xsn SQT SW W 2 206 Para realizar o teste de Shapiro-Wilk, devemos: 4. Tomar a decisão: Rejeitar H0 ao nível de significância a, se W calculado < W tabelado. Teste de Shapiro-Wilk Compara-se o valor de W calculado com o W tabelado. Se W calculado > W tabelado aceita-se que os valores estão distribuídos de acordo com uma certa função de distribuição normal . 207 Teste de Shapiro-Wilk: Valores críticos de W 208 20 – 556 – 426 – 169 – 56 – 574 – 61 – 463 – 404 -192 – 116 – 452 – 135 – 422 – 186 – 400 – 351 – 207 – 379 – 389 – 204 – 211 – 362 – 213 – 373 – 214 – 286 – 277 – 219 – 334 – 227 – 337 – 294 – 245 – 235 – 326 – 321 – 244 – 322 – 240 – 276 – 286 – 250 – 291 22 2 44 i 1,285 n X X i 1,121 1 2 n XX S i 44n Teste de Shapiro-Wilk 209 i Xi X45-i X45-i - Xi ai ai(X45-i - Xi) 1 20 574 554 0,3872 214,5088 2 56 556 500 0,2667 133,3500 3 61 463 402 0,2323 93,3846 4 116 452 336 0,2072 69,6192 5 135 426 291 0,1868 54,3588 6 169 422 253 0,1695 42,8835 7 186 404 218 0,1542 33,6156 8 192 400 208 0,1405 29,2240 9 204 389 185 0,1278 23,6430 10 207 379 172 0,1160 19,9520 11 211 373 162 0,1049 16,9938 Teste de Shapiro-Wilk 210 i Xi X45-i X45-i - Xi ai ai(X45-i - Xi) 1 20 574 554 0,3872 214,5088 2 56 556 500 0,2667 133,3500 3 61 463 402 0,2323 93,3846 4 116 452 336 0,2072 69,6192 5 135 426 291 0,1868 54,3588 6 169 422 253 0,1695 42,8835 7 186 404 218 0,1542 33,6156 8 192 400 208 0,1405 29,2240 9 204 389 185 0,1278 23,6430 10 207 379 172 0,116 19,9520 11 211 373 162 0,1049 16,9938 Teste de Shapiro-Wilk 12 213 362 149 0,0943 14,0507 13 214 351 137 0,0842 11,5354 14 219 337 118 0,0745 8,7910 15 227 334 107 0,0651 6,9657 16 235 326 91 0,056 5,0960 17 240 322 82 0,0471 3,8622 18 244 321 77 0,0383 2,9491 19 245 294 49 0,0296 1,4504 20 250 291 41 0,0211 0,8651 21 276 286 10 0,0126 0,1260 22 277 286 9 0,0042 0,0378 SOMA = 787,2627 211 Teste de Shapiro-Wilk: Coeficiente an (W) para cálculo de W 212 6308721,1211441 22 snSQT 263,787SW 982,0 630872 263,787 2 calculadoW Conclusão: Na tabela de valores críticos de W, com 95% de confiança , temos Wtabelado = 0,944. Como então, não rejeitamos a hipótese de normalidade.tabeladocalculado WW Teste de Shapiro-Wilk SQT SW W 2 213 Teste de Shapiro-Wilk: Valores críticos de W 214 215 Teste de Ryan-Joiner • (https://www.youtube.com/watch?v=Uoctpjx2kZ8) Teste de Kolmogorov-Smirnof Teste de Anderson Darling • (https://www.youtube.com/watch?v=eNjre6tx 7eU) • (https://www.youtube.com/watch?v=nGqhsxZrGlM) Para ver em casa EXCEL Vamos usar o EXCEL? 216 EXCEL 217 Refazer o exemplo do teste de Shapiro-Wilk usando o Excel EXCEL Exercício 6 218 8. Grau de Confiança de Student (t) – Teste t-Student 219 Grau de Confiança de Student (t) A distribuição usada para amostras pequenas, em geral menor que 30 elementos, é conhecida como distribuição de Student ou grau de confiança de Student. 220 Através dos valores tabelados de t pode-se conhecer em que intervalo de confiança (IC) encontra-se a média da população. Grau de Confiança de Student (t) intervalo de confiança (IC) 221 n ts x n ts x m Onde: Grau de Confiança de Student (t) intervalo de confiança (IC) x 222 n ts x m µ = média verdadeira (intervalo da média da população); = média aritmética (média da população); n = número de elementos; s = desvio-padrão; t = função distribuição t de Student; ν = grau de liberdade (n-1). Representação: ICx Intervalo de confiança )(IC n ts IC t = t-Student (tabelado) 223 Grau de Confiança de Student (t) O t tabelado é determinado através do conhecimento do tamanho da amostra (n) e do nível de confiança com que se deseja determinar o intervalo em que está a média da população (µ). O nível mais usado é o de 95% de confiança. A partir do tamanho da amostra(n) obtém-se o grau de liberdade (ν). Para uma amostra com n elementos o grau de liberdade é igual a n-1 (ν = n-1). 224 Dez amostras são retiradas de um lote de um mineral e analisadas. O teor de óxido de cálcio apresentou uma média de 4,30% e um desvio- padrão estimado de 0,30%. Qual é o intervalo de confiança, no nível de 95%, da média do lote? Exemplo Grau de Confiança de Student (t) 225 Resposta do Exemplo x ν = n -1 = 10 -1 = 9 Para 95% de confiança ( = 0,05) t = 2,262 (tabela) BILATERAL = 4,30% s = 0,30% n = 10 226 n ts x m 10 30,0262,2 30,4 x m %21,0%30,4 m a 227 BILATERAL 228 Como fazer isto no EXCEL??? 229 Funções estatísticas do Excel INVT (probabilidade; graus_liberdade) A função estatística INVT retorna o t crítico da distribuição t referente aos argumentos probabilidade e graus_liberdade, considerando que a probabilidade se refere às duas caudas da distribuição. No caso de realizar cálculos com a função INVT em uma cauda da distribuição, o valor do argumento probabilidade deverá ser informado como o dobro do valor do problema, pois o procedimento de cálculo da função INVT divide a probabilidade informada por dois. 230 Exemplo INVT (probabilidade; graus_liberdade) 231 Exemplo 232 VAMOS FAZER NO EXCEL? EXCEL 233 Dez amostras são retiradas de um lote de aço e analisadas. O teor de carbono apresentou uma média de 6,30% e um desvio-padrão estimado de 0,030%. Qual é o intervalo de confiança, no nível de 95%, da média do lote? Grau de Confiança de Student (t) Exercício 7 234 Resposta do Exercício 7 x ν = n -1 = 10 -1 = 9 Para 95% de confiança ( = 0,05) t = 2,262 (tabela) = 6,30% s = 0,030% n = 10 235 a n ts x m 10 030,0262,2 30,6 x m %021,0%30,6 m 236 9. Teste F-Snedecor Teste F-Snedecor Aplicado para determinar se uma população apresenta maior variabilidade que outra. Usado para comparar duas variâncias, determinar se dois métodos, dois analistas ou instrumentos de laboratório diferem em precisão. 237 Através da distribuição F, de Snedecor, é possível verificar se as variâncias das populações a que pertencem as amostras podem ser consideradas iguais, com o nível de confiança desejado. Teste F-Snedecor 238 Teste de comparação de variâncias F-Snedecor 1. Calcular valor de F (Fcalc) 2. Comparar com valor de F tabelado (Ftab ) ETAPAS: 239 Hipóteses para o teste de F-Snedecor Hipótese nula Hipótese alternativa 2 2 2 10 : ssH 0: 2 2 2 10 ssH 2 2 2 11 : ssH 0: 22 2 11 ssH 240 2 2 m M calc s s F Condição: F tem que ser sempre ≥ 1 Se Fcalc > Ftab, H0 é rejeitada. Não se aceita a igualdade das variâncias. 2 M s = maior variância 2 m s = menor variância Teste de comparação de variâncias F-Snedecor Se Fcalc < Ftab, H0 é aceita. Aceita-se a igualdade das variâncias. 241 Exemplo Teste F-Snedecor O desvio-padrão de um conjunto de 11 determinações é sA = 0,210 e o desvio-padrão de outras 13 determinações é sB = 0,641. Existe alguma diferença significativa entre as precisões destes dois conjuntos de resultados? 242 Resposta do Exemplo F tabelado = 2,91 Logo, os desvios-padrão são significativamente diferentes no nível de confiança de 95%. Assim, a diferença entre os dois conjuntos de dados é altamente significativa. Se Fcalc > Ftab, H0 é rejeitada. Não se aceita a igualdade das variâncias. 243 2 2 210,0 641,0 calcF 0441,0 410881,0 calcF 32,9calcF 244 245 Como fazer isto no EXCEL??? 246 Funções estatísticas do Excel INVF (probabilidade; gl_numerador; gl_denominador) A função estatística INVF retorna o F crítico da distribuição F para uma dada probabilidade na cauda superior da distribuição F, e os graus de liberdade do numerador e do denominador, respectivamente, os argumentos gl_numerador e gl_denominador. No caso de realizar cálculos com a função INVF em duas caudas da distribuição, o valor do argumento probabilidade deverá ser informado como a metade do valor do problema, pois o procedimento de cálculo da função INVF multiplica a probabilidade informada por dois. 247 Exemplo INVF (probabilidade; gl_numerador; gl_denominador) 248 VAMOS FAZER NO EXCEL? 249 Vamos usar o EXCEL? Exemplo anterior 250 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL EXCEL Dados Análise de dados Ferramentas de análise Teste F: duas amostras para variâncias Teste F-Snedecor 251 252 Exemplo anterior 253 Usando a função do EXCEL 254 Usando a função do EXCEL corretamente 255 VAMOS FAZER NO EXCEL? EXCEL 256 Determinação da concentração de tiol em sangue de voluntários saudáveis e de voluntários com artrite reumatóide. Concentração de tiol SAUDÁVEL ARTRITE 1,84 1,92 1,94 1,92 1,85 1,91 2,07 2,81 4,06 3,62 3,27 3,27 3,76 Exercício 8 Existe alguma diferença significativa entre as variâncias destes dois conjuntos de resultados? 257 Teste F-Snedecor 379,33 0058,0 1936,0 calc F Ftab = 5,988 (bilateral) Fcalc > Ftab, então H0 é rejeitada; as variâncias são diferentes. Ftab = 4,39 (unilateral) Resposta do Exercício 8 258 259 10. Testes de Hipóteses 260 10. Testes de Hipóteses No teste de hipóteses são utilizadas duas hipóteses: A hipótese nula H0 é a hipótese sobre a qual devem ser obtidas evidências para rejeitá-la. A hipótese alternativa H1 é a hipótese sobre a qual devem ser obtidas evidências para aceitá-la. 261 10. Testes de Hipóteses A hipótese nula e a hipótese alternativa descrevem dois possíveis estados mutuamente excludentes, pois as duas hipóteses não podem ser aceitas ou rejeitadas ao mesmo tempo. 262 Testes de hipóteses em uma cauda (unicaudal) e nas duas caudas (bicaudal) 10. Testes de Hipóteses Um teste de hipótese em uma cauda da distribuição (unicaudal) é um teste no qual a hipótese alternativa H1 define a mudança em alguma direção da hipótese nula H0, incluindo na especificação um dos símbolos “≤” ou “≥”. 263 Testes de hipóteses em uma cauda (unicaudal) e nas duas caudas (bicaudal) 10. Testes de Hipóteses Um teste de hipótese em duas caudas da distribuição (bicaudal) é um teste no qual a hipótese alternativa H1 define uma mudança da hipótese nula H0 sem especificar nenhuma direção, incluindo na especificação o símbolo “≠”. Caso 1. Comparação de um valor medido com um valor “conhecido” Caso 2. Comparação de dois valores medidos e - Comparação entre medidas repetidas Caso 3. Teste t emparelhado para comparação de diferenças individuais – Comparação de médias de dados em pares HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) )( 1x )( 2x 264 Testes de Hipóteses (3 Casos) 265 10.1. Caso 1 – Comparação de um valor medido com um valor “conhecido” Caso 1. Comparação de um valor medido com um valor: tabelado conhecido de referência aceito como verdadeiro 266 Medimos uma grandeza várias vezes, obtendo um valor médio e um desvio-padrão. Precisamos agora comparar o nosso resultado com um determinado valor que é conhecido e aceito. A média que obtivemos não concorda exatamente com o valor que é aceito. Será que esta diferença é aceitável levando-se em conta o “erro experimental”? Caso 1. Comparação de um valor medido com um valor “conhecido” HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) 267 Valor médio encontrado = 5,0% 4,7% A concentração do conteúdo do frasco corresponde àquela do rótulo ? NaCl 5% p/v Aplicação 268 HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Caso 1. Comparação de um valor medido com um valor “conhecido” Intervalo de confiança (IC) Teste de hipótese )(x m 269 Nestecaso, calcula-se o intervalo de confiança de 95% para a resposta obtida e verificamos se esta faixa inclui a resposta verdadeira. Se a resposta verdadeira não estiver dentro do intervalo de confiança de 95%, os dois resultados são considerados estatisticamente diferentes. HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Caso 1. Comparação de um valor medido com um valor “conhecido” Intervalo de confiança (IC) 270 Hipóteses mxHo : Hipótese nula Hipótese alternativa 0: 1 mxH0: mxH o mxH : 1 Caso 1. Comparação de um valor medido com um valor “conhecido” Teste de hipótese 271 1. Calcular valor de t (tcalc) 2. Comparar com valor de t tabelado (ttab ) ETAPAS Se tcalc > ttab, então Ho é rejeitada e H1 deverá ser aceita. Caso 1. Comparação de um valor medido com um valor “conhecido” Teste de hipótese 272 s nx tcalc )( m Exemplo 1 Uma amostra de carvão foi adquirida como um Material de Referência Padrão, certificado pelo Instituto Nacional de Padrões e Tecnologia (NIST) dos EUA, contendo 3,19% m/m de enxofre. Você está testando um novo método analítico para verificar se o valor conhecido pode ser reproduzido. Os valores medidos são 3,29, 3,22, 3,30 e 3,23% m/m de enxofre, dando uma média de 3,26 e um desvio-padrão de 0,041. Sua resposta concorda com o valor conhecido? HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Intervalo de confiança (IC) Caso 1. 273 Resposta do Exemplo 1 (IC) = 3,26 e s = 0,041 n= 4 n-1 (graus de liberdade) = 3 t = 3,182 (95% confiança, tabela) O valor verdadeiro (3,19 % m/m) está fora do intervalo conhecido de 95% (3,20 até 3,32 % m/m) Portanto, o valor medido é considerado significativamente diferente do valor conhecido. x 274 06,026,3 m 4 041,0182,3 26,3 x m n ts x m m3 2 32 68% 95,5% 99,7% 3,26 = 3,19 ? Há evidências de erro sistemático ? Não há evidência de erro sistemático Exemplo 1 O erro sistemático faz com que a média de um conjunto de dados se afaste do valor verdadeiro (aceito). Afeta a EXATIDÃO. 275 276 Como fazer isto no EXCEL??? 277 Exemplo (IC) 278 VAMOS FAZER NO EXCEL? Resposta do Exemplo 1 (H0) = 3,26 e s = 0,041 n= 4 n-1 (graus de liberdade) = 3 t = 3,182 (95% confiança, tabela) O valor verdadeiro (3,19 % m/m) está fora do intervalo conhecido de 95% (3,20 até 3,32 % m/m) Portanto, o valor medido é considerado significativamente diferente do valor conhecido. x 279 06,026,3 m 4 041,0182,3 26,3 x m n ts x m 280 Como fazer isto no EXCEL??? 281 Exemplo H0 282 VAMOS FAZER NO EXCEL? Determinação de Ag por AAS em um material que contém 18,3% Ag Análises )( ix 17,9 18,3 18,1 2)( xxi 0,04 0,04 0 Desvios )( xxi -0,2 0,2 0 Caso 1. Exemplo 2 283 1,18x 2,0s 3,4)2;05,0( t 21n 3 2,03,4 x IC Teor (%) = 5,01,18 Resposta 1 do Exemplo 2 (IC) O valor verdadeiro (18,3 % Ag) está dentro do intervalo conhecido de 95% (17,6 até 18,6 % Ag) Portanto, o valor medido não é considerado significativamente diferente do valor conhecido. 18,1 = 18,3 ? 284 n ts x m m3 2 32 68% 95,5% 99,7% 18,1 = 18,3 ? Há evidências de erro sistemático ? Não há evidência de erro sistemático Exemplo 2 O erro sistemático faz com que a média de um conjunto de dados se afaste do valor verdadeiro (aceito). Afeta a EXATIDÃO. 285 286 Como fazer isto no EXCEL??? 287 Exemplo 2 usando IC 288 VAMOS FAZER NO EXCEL? Aplicando-se a equação abaixo: 289 041,0 4)26,319,3( calct s nx tcalc )( m 415,3414634146,3 calct Resposta 2 do Exemplo 2 (H0) ttabelado= 3,182 Como tcalculado (3,415) ≥ ttabelado (3,182), podemos afirmar que os resultados não são os mesmos no nível de confiança de 95%. Portanto, o valor medido é considerado significativamente diferente do valor verdadeiro no nível de confiança de 95%. Resposta 2 do Exemplo 2 Se tcalc > ttab, então Ho é rejeitada e H1 deverá ser aceita. 290 Determinação de Ag por AAS num material que contém 18,3% Ag 1,18x 2,0s n = 3 a = 0,05 7,1 2,0 3)1,183,18( calct 17,9 18,3 18,1 Análises ttab = 4,303 tcalc < ttab, então Ho pode ser aceita Resposta 2 do Exemplo 2 Portanto, o valor medido não é considerado significativamente diferente do valor conhecido. 291 292 Exemplo 2 usando H0 293 VAMOS FAZER NO EXCEL? 294 Comparação de duas médias Caso 2. Comparação de médias de duas amostras independentes Caso 3. Comparação de médias de duas amostras pareadas 295 10.2. Caso 2 – Comparação de dois valores medidos e Comparação entre medidas repetidas )( 1x )( 2x 296 10.2. Caso 2 – Comparação de médias de duas amostras independentes Medimos uma grandeza diversas vezes utilizando dois métodos distintos, que fornecem duas respostas diferentes, cada uma com seu desvio-padrão. Os dois resultados concordam entre si “dentro do erro experimental”? HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Caso 2. Comparação entre medidas repetidas 297 Amostras independentes B 1 ... m B x A 1 ... n A x Quando os dados são coletados de tal maneira que as observações não são relacionadas umas às outras. 298 Hipótese nula Hipótese alternativa 210 : xxH 0: 210 xxH 0: 211 xxH 211 : xxH Hipóteses Caso 2. Comparação entre medidas repetidas 299 210 : xxH Calcular t Comparar com t tabelado 300 210 : xxH Calcular t maneira 1 Comparar com t tabelado Calcular t maneira 2 2 2 2 1 ss 2221 ss 301 Teste F-Snedecor Qual teste usaremos para descobrir se existe ou não existe diferença significativa para a variância (s2) nos 2 conjuntos de dados? 302 210 : xxH Calcular t maneira 1 Comparar com t tabelado 2 2 2 1 ss 303 Cálculo de t e de quando as variâncias forem iguais 2 1 1 1 )21( nnag s xx calct )2( 21 nn sag = desvio padrão agrupado )2( ])1()1[( 21 2 22 2 11 nn snsn s ag 304 Determinação de boro em plantas MÉTODO 1: espectrofotométrico (M1) MÉTODO 2: fluorimétrico (M2) M1 M2 28,0 0,3 10 9 26,3 0,2 10 9 n s x Exemplo 305 Comparação das médias 210 : xxH 3,260,28: 0 H 0 210 xxH Comparação das variâncias 0: 2 2 2 10 ssH 004,009,0: 0 H 03,260,28: 0 H 2 2 2 10 : ssH 04,009,0: 0 H 306 Teste de comparação de variâncias F-Snedecor a = 0,05 25,2 04,0 09,0 calc F )(03,4 bilateralFtab Fcalc < Ftab, então as variâncias são iguais )(18,3 unilateralFtab 307 Cálculo do t-Student 21 21 11 )( nns xx t calc 9,14 10 1 10 125,0 )3,260,28( calct 25,0 ag s )(101,2 bilateralttab tcalc > ttab, então H0 é rejeitada; as médias são diferentes. 18)21010()2( 21 nn 308 )21010( ]04,0)110(09,0)110[( ags 309 Como fazer isto no EXCEL??? 310 Exemplo Determinação de boro em plantas 311 Exemplo Determinação de boro em plantas 312 VAMOS FAZER NO EXCEL? 313 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL EXCEL Dados Análise de dados Ferramentas de análise Teste t: duas amostras presumindo variâncias equivalentes Caso 2. Comparação entre medidas repetidas 2 2 2 1 ss 314 315 Como fazer isto no EXCEL??? 316 Este exemplo não dá para fazer com a função do EXCEL porque não temos os dados brutos 317 VAMOS FAZER NO EXCEL? EXCEL 318 Refazer o exemplo da determinação de boro em plantas usando o Excel EXCEL Exercício 9 Teste t: duas amostras presumindo variâncias equivalentes 319 210 : xxH Calcular t maneira 2 Comparar com t tabelado 2 2 2 1 ss 320 Cálculo de t e de quando as variâncias forem diferentes 2 2 2 1 2 1 21 )( n s n sxx tcalc 2 )1()1( 2 2 2 2 2 2 2 1 1 2 1 2 2 2 1 2 1 n n s n n s n s n s OBS.: O valor de calculado deve ser arredondado para o inteiro mais próximo 321 Determinação da concentração de tiol em sangue de voluntários saudáveis e de voluntários com artrite reumatóide Concentração de tiol SAUDÁVEL ARTRITE 1,84 1,92 1,94 1,92 1,85 1,91 2,07 2,81 4,06 3,62 3,27 3,27 3,76 Existe alguma diferença significativa entre as médias destes dois conjuntos de resultados? Exemplo 322 Comparação das médias as xxH : 0 0: 0 as xxH 0921,1465,3: 0 H SAUDÁVEIS ARTRITE ns = 7 na = 6 92,1 s x 47,3 a x 076,0 s s 440,0 a s 6 s 5 a 323 Comparação das variâncias 22 0 : as ssH 0: 22 0 as ssH 0)440,0()076,0(: 22 0 H Teste F-Snedecor 379,33 0058,0 1936,0 calc F Ftab = 5,988 (bilateral) Fcalc > Ftab, então H0 é rejeitada; as variâncias são diferentes. Ftab = 4,39 (unilateral) 324 Cálculo do t-Student 6 1936,0 7 0058,0 921,1465,3)( 22 a a s s as calc n s n s xx t 487,8 0323,00008,0 544,1 calct Stat t (Excel) 325 Cálculo do número de graus de liberdade 2 )1()1( 2222 222 a a a s s s a a s s n n s n n s n s n s 2 1048,1105,8 1091,10 48 4 xx x 5237,7 326 )(571,2 05,0 bilateralttab a tcalc > ttab, então H0 deve ser rejeitada; as médias são diferentes 327 328 Como fazer isto no EXCEL??? 329 Exemplo 330 VAMOS FAZER NO EXCEL? 331 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL EXCEL Dados Análise de dados Ferramentas de análise Teste t: duas amostras presumindo variâncias diferentes Caso 2. Comparação entre medidas repetidas 2 2 2 1 ss 332 333 Exemplo 334 VAMOS FAZER NO EXCEL? EXCEL 335 Refazer o exemplo da determinação da concentração de tiol de sangue usando o Excel EXCEL Exercício 10 Teste t: duas amostras presumindo variâncias diferentes 336 337 10.3. Caso 3 – Teste t emparelhado para comparação de diferenças individuais Comparação de médias de dados em pares 338 10.3. Caso 3 – Comparação de médias de duas amostras pareadas A amostra A é medida uma vez pelo método 1 e uma vez pelo método 2, que não fornecem exatamente o mesmo resultado. A seguir, uma amostra diferente, denominada B, é também medida uma vez pelo método 1 e uma vez pelo método 2. Novamente, os resultados não são exatamente iguais entre si. O procedimento é repetido para n amostras diferentes. Os dois métodos concordam entre si “dentro do erro experimental”? HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Caso 3. Comparação de Médias de Dados em Pares 339 Neste caso, usamos dois métodos diferentes para fazer medidas individuais em várias amostras diferentes. Nenhuma medida foi duplicada. Os dois métodos fornecem a mesma resposta “dentro do erro experimental”? HARRIS, Daniel C. Análise Química Quantitativa, 8ª edição. LTC Editora Capítulo 4 (4-3 Comparação entre Médias Utilizando o Teste t de Student) Caso 3. Comparação de Médias de Dados em Pares 340 Caso 3. Comparação de Médias de Dados em Pares Quando duas distribuições são dependentes e, a cada valor de uma delas corresponde apenas um valor na outra, e vice-versa, tem-se o que é chamado de dados em pares. Então, cria-se uma nova distribuição na qual cada elemento é a diferença entre os dois elementos de cada par das distribuições anteriores. 341 Amostras dependentes (em pares ou pareadas) n amostras Método A Método B 1 ... m B x 1 ... n A x Quando uma mesma amostra é analisada por dois métodos diferentes. 342 Amostras independentes Amostras em pares B 1 ... m B x A 1 ... n A x n amostras Método A Método B 1 ... m B x 1 ... n A x 343 Amostras independentes- Faz-se, primeiramente o teste F-Snedecor para verificar se as variâncias das amostras podem ser consideradas iguais. Amostras dependentes- A aplicação do teste F-Snedecor não é necessária. Aplicação do teste t-Student 344 Caso 3. Comparação de Médias de Dados em Pares Exemplo 1: Se oito amostras semelhantes são analisadas por dois métodos, para comparação dos métodos, tem-se oito pares de dados. Exemplo 2: Se cinco analistas usarem uma mesma amostra com dois equipamentos diferentes, para comparação de equipamentos, tem-se cinco pares de dados. 345 Caso 3. Comparação de Médias de Dados em Pares Para comparação de médias de dados em pares, é calculada a média e a variância da nova distribuição, constituída pelas diferenças entre os resultados de cada par. Testa-se, então, a média das diferenças, , com auxílio da distribuição t. O teste consiste na comparação de t tabelado com t calculado. dx 346 Caso 3. Comparação de Médias de Dados em Pares O valor de t calculado é obtido através da seguinte expressão: d dcalc s nxt 0 A média das diferenças ( ) tem a seguinte expressão: dx n i d d n x x i 1 n = número de pares 347 Caso 3. Comparação de Médias de Dados em Pares Se tcalc < ttab ou (ttab > tcalc), não há diferença entre os objetivos testados Se tcalc > ttab ou (ttab < tcalc), há diferença entre os objetivos testados Se tcalc > ttab, H0 é rejeitada Se tcalc < ttab, H0 é aceita 348 Hipóteses Hipótese nula Hipótese alternativa Caso 3. Comparação de Médias de Dados em Pares 0 diferença: 0 d xH 0: 1 d xH Média das diferenças ( )dx 349 Caso 3. Exemplo Na determinação do teor de ThO2 em minério de nióbio, columbita, oito amostras foram analisadas para testar dois métodos ligeiramente diferentes, com os resultados em %. Determinar se os métodos são iguais no nível de confiança a 0,05%. AMOSTRA MÉTODO 1 MÉTODO 2 d 1 0,20 0,18 0,02 2 0,14 0,15 -0,01 3 0,23 0,25 -0,02 4 0,12 0,10 0,02 5 0,21 0,20 0,01 6 0,15 0,13 0,02 7 0,27 0,23 0,04 8 0,20 0,21 -0,01 350 0: 0 d xH 0: 1 d xH 01,0 d x 02,0 d s 718 %5a 365,2tabt 22,1 02,0 8001,0 calct Como tcalc < ttab, H0 é aceita Determinação do teor de ThO2 usando o Excel 351 352 Como fazer isto no EXCEL??? 353 Exemplo 354 VAMOS FAZER NO EXCEL? 355 MAS TAMBÉM EXISTE OUTRA FORMA DE OBTER ESTES RESULTADOS NO EXCEL EXCEL Dados Análise de dados Ferramentas de análise Teste t: duas amostras em par para médias Caso 3. Comparação de Médias de Dados em Pares 356 357 Exemplo 358 VAMOS FAZER NO EXCEL? EXCEL 359 Refazer o exemplo da determinação do teor de ThO2 usando o Excel EXCEL Exercício 11 Teste t: duas amostras em par para médias 360 361 11. Análise de Variância (ANOVA) 362 O nome Análise de Variância é comumente chamado de ANOVA do inglês – ANalysis Of VAriance 363 Uma análise de variância permite que vários grupos sejam comparados a um só tempo, utilizando variáveis contínuas. O teste é paramétrico (a variável de interesse deve ter distribuição normal) e os grupos têm que ser independentes. 364 Análise de Variância (ANOVA) Análise de variância com um fator - one-way ANOVA. Análise de variância com dois fatores - two-way ANOVA. Análise de variância com mais de dois fatores - multi-way ANOVA (MANOVA – Análise de Variância Multivariada). 365 11.1. Análise de variância com um fator - one-way ANOVA. 366 Análise de variância com um fator – one-way ANOVA É avaliado apenas um fator (a) de interesse ou que influi na variável dependente. 367 Análise de Variância Medida: ijij ex m Quando existe efeito de um fator a ijjij eax m Variância total: ART SSSSSS 368SSA= soma dos quadradosdos desvios graças ao fator a SSR= soma dos quadrados dos resíduos ANOVA divide, basicamente, a variabilidade em variabilidade Entre Grupos e variabilidade Dentro dos Grupos, e compara as duas. Quanto maior for a primeira comparada à segunda, maior será a evidência de que existe variabilidade entre grupo. Como funciona a ANOVA? 369 Tabela da ANOVA com 1 fator A variabilidade presente em um ensaio é analisada com o auxílio de um quadro padrão denominado Tabela da Análise de Variância. 370 Fonte de variação Graus de liberdade Soma dos quadrados (SQ) – Sum of Squares (SS) Quadrados médios (QM) – Mean Square (MS) F entre colunas (A) nas colunas (resíduos) total k-1 n-k n-1 SSA SSR SST SSA/(k-1) SSR/(n-k) MSA/MSR Fa;k-1;n-k Os quadrados médios (MS) são obtidos dividindo as somas de quadrados (SS) pelos respectivos graus de liberdade. Tabela da ANOVA com 1 fator 371 k = número de colunas; n = (no linhas x no colunas) A = fator; R = resíduos; T = total Coluna 1 (Fontes de Variação) Nesta coluna são descritas as causas de variabilidade dos dados do experimento. O interesse do pesquisador está em conhecer a variabilidade entre os TRATAMENTOS. As outras fontes de variabilidade são agrupadas em RESÍDUO (correspondente à variabilidade existente Dentro dos Tratamentos). Tabela da ANOVA com 1 fator 372 Variabilidade Entre Tratamentos (entre colunas) – provocada pelos tratamentos e por outras fontes de variabilidade. Variabilidade Dentro de Tratamentos (nas colunas) – provocada por várias fontes de variabilidade exceto tratamentos. Coluna 1 (Fontes de Variação) Tabela da ANOVA com 1 fator 373 Coluna 2 (Graus de Liberdade) A cada fonte de variação está associado um número de graus de liberdade. Graus de Liberdade do tratamento (entre colunas): Graus de Liberdade do resíduo (nas colunas): )1( k )( kn Tabela da ANOVA com 1 fator 374 Coluna 3 (Soma dos Quadrados - SS) São as somas dos quadrados dos desvios calculadas para cada fonte de variação. Tabela da ANOVA com 1 fator 375 Variância Total (expressa somente pelos desvios) k j n i ijT XxSS 1 1 2)( k j n i k j jjjijT XxnxxSS 1 1 1 22 )()( SSR SSA SSR= soma dos quadrados dos resíduos SSA= soma dos quadrados dos desvios graças ao fator a X média global 376 SST= soma dos quadrados totais A soma dos quadrados dos desvios graças ao fator a (entre colunas): A soma dos quadrados dos resíduos (nas colunas): ATR SSSSSS RTA SSSSSS 377 A soma dos quadrados totais: ART SSSSSS Coluna 4 (Quadrados Médios – MS) São obtidos pela razão entre as Somas dos Quadrados (SS) e os seus respectivos graus de liberdade. Pode-se demonstrar que são estimativas de variâncias porque divide-se a soma dos quadrados pelo número de graus de liberdade. Tabela da ANOVA com 1 fator 378 O quadrado médio do tratamento (entre colunas): )1( k SS MS AA O quadrado médio do resíduo (nas colunas): )( kn SS MS RR Note que os quadrados médios (MS) são obtidos dividindo as somas dos quadrados (SS) pelos respectivos graus de liberdade. 379 SSA= soma dos quadrados dos desvios graças ao fator a SSR= soma dos quadrados dos resíduos É o valor obtido para a estatística do teste F, dado pela razão entre o quadrado médio do Tratamentos (MSA) e o quadrado médio do Resíduo (MSR). Coluna 5 (Valor da estatística F – Fcal) Tabela da ANOVA com 1 fator 380 R A calc MS MS F )1( k SS MS AA )( kn SS MS RR Coluna 5 (Valor da estatística F – Fcal) 381 SSA= soma dos quadrados dos desvios graças ao fator a SSR= soma dos quadrados dos resíduos MSA= quadrado médio de tratamento (entre colunas) MSR= quadrado médio de resíduo (nas colunas) Para testar as hipóteses é utilizada a estatística F de Snedecor, com (k – 1) graus de liberdade no numerador e (n – k) graus de liberdade no denominador. Se Fcalc > Fa;k-1;n-k rejeita-se H0 e conclui-se que existe pelo menos uma média que difere de outra. Tabela da ANOVA com 1 fator 382 Se Fcalc > Ftab, rejeitar H0. Neste caso, dizemos que existem diferenças estatisticamente significativas entre as médias. Se Fcalc < Ftab, não rejeitar H0. Neste caso, dizemos que não existem evidências estatísticas de que as médias sejam diferentes. 383 384 SUPOSIÇÕES: * Populações normalmente distribuídas * Populações tem mesma variância (ou mesmo desvio padrão) * Amostras são aleatórias e mutuamente independentes * As diferentes amostras são obtidas de populações classificadas em apenas uma categoria 385 O estatístico George E. P. Box mostrou que os resultados são confiáveis desde que o tamanho das Se as distribuições são fortemente não normais devemos utilizar outros métodos, por exemplo, o teste de Kruskal-Wallis. amostras seja igual (ou quase igual); a diferença entre as variâncias pode ser de tal ordem que a maior seja nove vezes a menor. 386 HIPÓTESE ALTERNATIVA: nem todas a médias populacionais são iguais, ou seja: Pelo menos uma média é diferente, isto é, existe efeito do tratamento. Não quer dizer que todas as médias sejam diferentes (alguns pares podem ser iguais) H0: m1 = m2 = m3 = ... mk H1: Nem todas as médias populacionais são iguais Hipóteses do ANOVA de um critério HIPÓTESE NULA: a média de todas as populações é igual, ou seja, o tratamento (fator) não tem efeito (nenhuma variação em média entre os grupos). 387 https://edisciplinas.usp.br/pluginfile.php/3260534/mod_resource /content/1/T%C3%B3pico_13.pdf 388 https://edisciplinas.usp.br/pluginfile.php/3260534/mod_resource /content/1/T%C3%B3pico_13.pdf 389 https://edisciplinas.usp.br/pluginfile.php/3260534/mod_resource /content/1/T%C3%B3pico_13.pdf Exemplo: Determinação dos teores de ferro, em mg/100g, em uma formulação para vitaminas e sais minerais. Os valores foram determinados por absorção atômica (AAS). Cada conjunto de dados foi obtido por um método diferente de preparo das amostras. Existe efeito significativo, no nível de confiança 0,05, em algum dos métodos empregados? 390 Exemplo Dry Micro ZZC SZC LTA ZZF SZF j 1 2 3 4 5 6 7 1 5,59 5,67 5,75 4,74 5,52 5,52 5,43 2 5,59 5,67 5,47 4,45 5,47 5,62 5,52 3 5,37 5,55 5,43 4,65 5,66 5,47 5,43 4 5,54 5,57 5,45 4,94 5,52 5,18 5,43 5 5,37 5,43 5,24 4,95 5,62 5,43 5,52 6 5,42 5,57 5,47 5,06 5,76 5,33 5,52 média 5,48 5,58 5,47 4,80 5,59 5,43 5,48 desvio 0,11 0,089 0,16 0,23 0,11 0,15 0,05 391 Determinação dos teores de ferro, em mg/100g, em uma formulação para vitaminas e sais minerais, determinada por AAS. Concentração de ferro em uma formulação, determinada por AAS 4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 0 1 2 3 4 5 6 7 8 C o n ce n tr aç ã o d e F er ro (n g /1 0 0g ) Métodos 392 DRY MICRO ZZC SZC LTA ZZF SZF Fonte de variação Graus de liberdade F entre colunas nas colunas total k-1=7-1= 6 n-k=42 – 7 = 35 n-1=42-1 = 41 SSA= 2,68342 SSR= 0,67608 SST= 3,35951 F0,05; 6; 35= 2,372 F0,001; 6; 35= 4,894 Tabela da ANOVA com 1 fator 393 Soma dos quadrados (SQ) – Sum of Squares (SS) Quadrados médios (QM) – Mean Square (MS) k = número de colunas; n = (no linhas x no colunas) SSA/(k-1)= 0,44724 SSR/(n-k)= 0,01932 MSA/MSR= 23,153 SSA= soma dos quadrados dos desvios graças ao fator a SSR= soma dos quadrados dos resíduos MSA= quadrado médio dos tratamentos (entre colunas) MSR= quadrado médio dos resíduos (nas colunas) 394 Resposta do Exemplo 35951,3)40,552,5()40,552,5()40,543,5(... ...)40,537,5()40,559,5()40,559,5( 222 222 k j n i ijT XxSS 1 1 2)( 40,5X SST= soma dos quadrados totais 395 k j n i k j jjjijT XxnxxSS 1 1 1 22 )()( SSR SSA 67608,0)48,552,5()48,552,5()48,543,5(... ...)43,547,5()43,562,5()43,552,5(... ...)59,566,5()59,547,5()59,552,5(... ...)80,465,4()80,445,4()80,474,4(... ...)47,543,5()47,547,5()47,575,5(... ...)58,555,5()58,567,5()58,567,5(...
Compartilhar