Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Profª. Leane Nunes Tratamento e Avaliação estatística de dados 2 Distribuição normal: função matemática que descreve a distribuição da população em termos de frequência dos resultados frente ao seu valor numérico Admite-se que os erros indeterminados ou aleatórios seguem a lei da distribuição normal (Distribuição de Gauss) Histograma Modelo de distribuição normal 3 μ Localiza o centro da distribuição σ Mede a largura da distribuição O gráfico apresenta uma região central com frequência maior e as extremidades com frequência menor Histograma 4 Réplica Volume Réplica Volume Réplica Volume Réplica Volume 1 9,988 14 9,971 27 9,982 40 9,978 2 9,973 15 9,982 28 9,991 41 9,986 3 9,986 16 9,983 29 9,981 42 9,982 4 9,980 17 9,988 30 9,969 43 9,977 5 9,975 18 9,975 31 9,985 44 9,977 6 9,982 19 9,980 32 9,977 45 9,986 7 9,986 20 9,994 33 9,976 46 9,978 8 9,982 21 9,992 34 9,983 47 9,983 9 9,981 22 9,984 35 9,976 48 9,980 10 9,990 23 9,981 36 9,990 49 9,984 11 9,980 24 9,987 37 9,988 50 9,979 12 9,989 25 9,978 38 9,971 13 9,978 26 9,983 39 9,986 Réplicas de dados de calibração de uma pipeta de 10 mL Não podemos usar as medidas individuais, mas sim a média do conjunto de medidas Como construir um histograma? 5 Intervalo de volume Número de intervalos % intervalo 1 9,969-9,971 3 6 2 9,972-9,974 1 2 3 9,975-9,977 7 14 4 9,978-9,980 9 18 5 9,981-9,983 13 26 6 9,984-9,986 7 14 7 9,987-9,989 5 10 8 9,990-9,992 4 8 9 9,993-9,995 1 2 Total = 50 Total = 100% ü Construir intervalos regulares ü Contar quantas medidas estão em cada intervalo Como construir um histograma? 6 Fr eq uê nc ia r el at iv a Intervalo de valores medidos, mL 9,969 9,971 9,972 9,974 9,975 9,977 9,978 9,980 9,981 9,983 9,984 9,986 9,987 9,989 9,990 9,992 9,993 9,995 A B 0 4 8 12 16 24 20 28 Histograma (A) para os dados da calibração da pipeta e curva gaussiana (B) para os mesmos dados Como construir um histograma? 7 População x Amostra População: Corresponde a um número elevado de medidas Amostra: subconjunto de medidas selecionadas a partir de uma população 8 Exemplo Determinação de glicose no sangue de uma pessoa A amostra deve ser suficientemente representativa para permitir fazer inferências válidas sobre a população População: todo o sangue do indivíduo Amostra: volume de sangue coletado População x Amostra 9 Cuidado!!! Não confunda amostra estatística com amostra analítica Três amostras analíticas analisadas no laboratório representa uma única amostra estatística 10 Intervalo de confiança (IC) É a faixa de valores entre os quais se espera que a média da população m esteja contida com uma certa probabilidade O Teor de K em uma amostra mineral é 7,25% ± 0,15% com 99,7% de probabilidade 11 IC quando σ é conhecido ou s → σ 683,0 2 1 1 22 == ò + - - dzeárea z p üAproximadamente 68,3 % dos valores estão compreendidos no intervalo µ ± 1s Intervalo de confiança (IC) 12 954,0 2 2 2 22 == ò + - - dzeárea z p 997,0 2 3 3 22 == ò + - - dzeárea z p 95,4 % dos valores estão compreendidos no intervalo µ ± 2s 99,7 % dos valores estão compreendidos no intervalo µ ± 3s Intervalo de confiança (IC) 13 üQuando σ é conhecido, o teste z é adequado para avaliação : N zx sµ ±= µ= Intervalo de confiança "𝒙= média amostral σ= desvio padrão populacional N = número de observações Z = valor tabelado de Z 14 Nível de confiança (%) Valor de z 50,0 0,67 68,0 1,00 80,0 1,28 90,0 1,64 95,0 1,96 95,4 2,00 99,0 2,58 99,7 3,00 99,9 3,29 Níveis de confiança para vários valores de z 15 Replicatas Concentração de glicose (mg/L) 1 1.108 2 1.122 3 1.075 4 1.099 5 1.115 6 1.083 7 1.100 Em um estudo experimental para controle da glicemia de pacientes diabéticos, 7 pacientes foram submetidos a uma dieta para redução controle da glicemia, o valor médio para o primeiro mês foi de 1.100,3 mg/L Considere s = 19 como uma boa estimativa de σ. Determine: 16 Determinar os intervalos de confiança de 80% e 95% para: (a) O primeiro registro (b) O valor médio (1.100,3) Lmg /3,24108.1 1 19*28,1 1.108 IC 80% ±=±= Lmg /2,37108.1 1 19*96,1 1.108 IC %59 ±=±= Lmg /2,93,100.1 7 19*28,1 1.100,3 IC 80% ±=±= Lmg /1,143,100.1 7 19*96,1 1.100,3 IC %59 ±=±= 17 ü Aplica-se o grau de confiança médio de Student (t) IC quando σ não for conhecido William Sealy Gosset (1876 – 1937) Test T de Student 𝜇 = �̅� ± 𝑡𝑠 𝑛 18 Graus de liberdade (N-1) 80% 90% 95% 99% 99,9% 1 3,08 6,31 12,7 63,7 637 2 1,89 2,92 4,30 9,92 31,6 3 1,64 2,35 3,18 5,84 12,9 4 1,53 2,13 2,78 4,60 8,61 5 1,48 2,02 2,57 4,03 6,87 6 1,44 1,94 2,45 3,71 5,96 7 1,42 1,90 2,36 3,50 5,41 8 1,40 1,86 2,31 3,36 5,04 9 1,38 1,83 2,26 3,25 4,78 10 1,37 1,81 2,23 3,17 4,59 15 1,34 1,75 2,13 2,95 4,07 20 1,32 1,73 2,09 2,84 3,85 40 1,30 1,68 2,02 2,70 3,55 60 1,30 1,67 2,00 2,62 3,46 ∞ 1,28 1,64 1,96 2,58 3,29 Valores de Tcrítico para cálculos de intervalo de confiança Test T de Student 19 Teste de hipóteses ü Utiliza-se testes de hipóteses para tirar conclusões sobre a média da população e sua proximidade do valor conhecido (µ0) Hipótese nula (H0) è considera que as quantidades numéricas que estão sendo comparadas são iguais µ=µ0 Hipótese alternativa (HA) è considera que as quantidades numéricas que estão sendo comparadas são contraditórias µ≠µ0 µ>µ0 µ<µ0 µ é a média populacional associada aos experimentos µ0 é o valor verdadeiro na ausência de erros sistemáticos 20 Teste t para uma Amostra Pequena Teste T 21 Um químico obteve os seguintes dados para o teor alcoólico de uma amostra de sangue: Replicatas % C2H5OH 1 0,084 2 0,089 3 0,079 Calcule o intervalo de confiança a 95% para a média, considerando, que os três resultados obtidos são a única indicação da precisão do método. 22 1. Calcule a média: 2. Calcule o desvio padrão �̅� = ∑! 𝑥! 𝑛 𝑠 = ∑!(�̅�−𝑥!)" 𝑛 − 1 𝑥 = 0,084 + 0,089 + 0,079 3 𝑥 = 0,084 𝑠 = 0,084 − 0,084 2 + 0,084 − 0,089 2 + 0,084 − 0,079 2 3 − 1 𝑠 = 0 + 0,000025 + 0,000025 2 𝑠 = 0,00005 2 𝑠 = 0,005 23 IC(95%) = 0,084 ± ",$% . %,%%' $ IC(95%) = 0,084 ± 0,012 % de C2H5OH Significa que existe uma chance de 95% de que a média real, 𝝁, esteja no intervalo de 𝟎, 𝟎𝟖𝟒 ± 𝟎, 𝟎𝟏𝟐 (0,072 a 0,096) 24 Comparação de média experimental com valor verdadeiro Comparação entre duas médias experimentais Comparação de diferenças individuais (Dados pareados) Teste T 25 1) Comparação de média experimental com valor verdadeiro ü O teste T pode ser utilizado para comparar um grupo de medidas com outro, visando decidir se são ou não “diferentes” Hipótese nula: os valores medidos de dois conjuntos de medidas são iguais ü A hipótese nula é rejeitada se existe uma chance menor que 5% de que a diferença observada surja devido a um erro aleatório ü Assim, há uma chance de 95% de que uma conclusão esteja correta Teste T Uma amostra de carvão foi adquirida como sendo um material padrão de referencia, certificado pelo instituto nacional de Padrões e Tecnologia (NIST) dos EUA, contendo 3,19% de enxofre. Visando validar um método para analise de enxofre, um químico analisou diferentes amostras deste material e obteve os seguintes resultados: 3,29; 3,22; 3,30 e 3,23 de enxofre. O método desenvolvido é válido? Teste T 27 ü Calculando o valor de T 𝑡()*(+*),- = �̅� − 𝑣𝑎𝑙𝑜𝑟 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜 𝑠 𝑛 𝑆𝑒 𝑡!"#!$#"%&˂ 𝑡'"()#"%& , " %+,)-).ç" .ã& é 2+3.+,+!"'+4" 𝑆𝑒 𝑡!"#!$#"%& ˃ 𝑡'"()#"%& , " %+,)-).ç" é 2+3.+,+!"'+4" TTab= (95%= 3,18) Teste T 28 2) Comparação entre duas médias experimentais ü Uma diferença nas médias de dois conjuntos de dados é verdadeira ou é o resultado de erros sistemáticos? ü Os resultados das análises de dois materiais permite afirmar se eles são diferentes ou idênticos? ü Resultados gerados por dois métodos analíticos diferentes para o mesmo analito permite compará-los? Teste T 29 2) Comparaçãoentre duas médias experimentais 𝑡!"#!$#"%& = �̅�' − �̅�( 𝑠'( 𝑛' − 1 + 𝑠(( 𝑛( − 1 𝑛' + 𝑛( − 2 𝑛'. 𝑛( 𝑛' + 𝑛( SCombinado �̅�' = 𝑚é𝑑𝑖𝑎 𝑝𝑎𝑟𝑎 𝑜 𝑝𝑟𝑖𝑚𝑒𝑖𝑟𝑜 𝑚é𝑡𝑜𝑑𝑜 �̅�( = 𝑚é𝑑𝑖𝑎 𝑝𝑎𝑟𝑎 𝑜 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑚é𝑡𝑜𝑑𝑜 𝑠'( = 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑜 𝑝𝑟𝑖𝑒𝑚𝑖𝑟𝑜 𝑚é𝑡𝑜𝑑𝑜 𝑠(( = 𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 𝑝𝑎𝑟𝑎 𝑜 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑚é𝑡𝑜𝑑𝑜 𝑛'𝑒 𝑛()( = 𝑑𝑜𝑖𝑠 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠, 𝑜 𝑔𝑟𝑎𝑢 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 é 𝑛 − 2 Onde: Resultados obtidos de formas diferentes para uma mesma situação è os desvios padrão de ambos devem ser similares! Teste T 30 Dois barris de vinho foram analisados quanto ao seu teor de álcool para se determinar se eles eram provenientes de fontes distintas. Com base em seis análises, o teor médio do primeiro barril foi estabelecido como 12,61% de etanol. Quatro análises do segundo barril forneceram uma média de 12,53% de álcool. As dez análises geraram um desvio padrão combinado scomb de 0,070%. Os dados indicam uma diferença entre os vinhos em um NC de 95%? Teste T 31 ü É utilizado para analisar pares de dados coletados da mesma amostra com concentrações diferentes do analito, utilizando-se dois métodos distintos 3) Comparação de diferenças individuais (Dados pareados) 𝑡!"#!$#"%& = �̅� 𝑠𝑑 𝑛 𝑡!"#!$#"%& = �̅� ∑(𝑑' − �̅�)( 𝑛 − 1 𝑛 �̅� = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑑𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑑𝑜𝑠 𝑚é𝑡𝑜𝑑𝑜𝑠 𝑑!= valor individual da diferença entre os métodos Sd=desvio padrão das diferenças ü É conveniente construir uma tabela com os dados dos dois métodos e realizar os cálculos para cada par de medidas Teste T 32 Cada amostra possui um teor diferente de colesterol Amostra Método A Método B Diferença individual Paciente 1 1,46 1,42 0,04 Paciente 2 2,22 2,38 -0,16 Paciente 3 2,84 2,67 0,17 Paciente 4 1,97 1,80 0,17 Paciente 5 1,13 1,09 0,04 Paciente 6 2,35 2,25 0,10 Media das diferenças (d) Média= 1,995 Média=1,935 A-B =0,06 Considere o teor de colesterol em seis grupos de plasma de sangue humano medidos por duas técnicas diferentes: Os resultados que seguem confirmam uma diferença entre os dois métodos em um nível de confiança de 95%? Teste T 33 Onde: �̅� = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑑𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑑𝑜𝑠 𝑚é𝑡𝑜𝑑𝑜𝑠 𝑑!= valor individual da diferença entre os métodos (0,04-0,06)2 + (-0,16-0,06) 2 + (0,17- 0,06)2 + (0,17- 0,06)2 +(0,04- 0,06)2 + (0,10- 0,06)2 6−1𝑠𝑑= 𝑡!"#!$#"%& = �̅� ∑(𝑑' − �̅�)( 𝑛 − 1 𝑛 𝑡()*(+*),- = %,%. %,/0 6=1,22 𝑆𝑒 𝑡()*(+*),-(/,00)˂ 𝑡3)45*),-(0,'6) , ) ,!75859ç) 9ã- é =!>9!7!()3!?) = 0,12 𝑡!"#!$#"%& = �̅� 𝑠𝑑 𝑛 𝑡#$%#&%$'( = �̅� 𝑠𝑑 𝑛 Teste T 34 ü É utilizado para avaliar a variância ou o desvio padrão ü O teste estatístico F é definido como a razão entre duas variâncias 𝐹!"#!$#"%& = 𝑠56 𝑠66 ü O desvio padrão maior é sempre o numerador de modo que 𝐹 ≥ 1 𝐻%: 𝜎/0 = 𝜎00 𝐻): 𝜎/0 ≠ 𝜎00 𝐻): 𝜎/0 > 𝜎00 𝐻): 𝜎/0 < 𝜎00 Test F- Comparação da precisão 35 Graus de liberdade (Denominador) 2 3 4 5 6 10 12 20 ∞ 2 19,00 19,16 19,25 19,30 19,33 19,40 19,41 19,45 19,50 3 9,55 9,28 9,12 9,01 8,94 8,79 8,74 8,66 8,53 4 6,94 6,59 6,39 6,26 6,16 5,96 5,91 5,80 5,63 5 5,79 5,41 5,19 5,05 4,95 4,74 4,68 4,56 4,36 6 5,14 4,76 4,53 4,39 4,28 4,06 4,00 3,87 3,67 10 4,10 3,71 3,48 3,33 3,22 2,98 2,91 2,77 2,54 12 3,89 3,49 3,26 3,11 3,00 2,75 2,69 2,54 2,30 20 3,49 3,10 2,87 2,71 2,60 2,35 2,28 2,12 1,84 ∞ 3,00 2,60 2,37 2,21 2,10 1,83 1,75 1,57 1,00 Graus de liberdade (numerador) Tabela 3 : Valores de Fcrítico para cálculos de intervalo de confiança Para 5 determinações 5-1= 4 Para 5 determinações 5-1= 4 Test F- Comparação da precisão 36 ü Se 𝐹#$%#&%$'( > 𝐹)$*+%$'( então a diferença é significativa, rejeita-se a igualdade das variâncias e os dois resultados são considerados diferentes ü Se 𝐹#$%#&%$'(˂ 𝐹)$*+%$'( a diferença não é significativa, aceita-se a igualdade das variâncias 𝐹!"#!$#"%& > 𝐹*"+,#"%& então os desvios padrão são diferentes Test F- Comparação da precisão 37 O Diretor de um Laboratório de Certificação de Análises, está decidindo se deve ou não contratar um estagiário recentemente introduzido na Empresa. Para decidir a contratação, optou por aplicar um teste, determinando que o estagiário e um Analista Sênior, desenvolvessem um trabalho analítico, analisando o teor de potássio em uma mesma amostra de tecido orgânico, seguindo o mesmo procedimento analítico e empregando a mesma instrumentação e acessórios. Determinação Analista Sênior Estagiário 1 1,38 1,28 2 1,33 1,36 3 1,34 1,35 4 1,35 1,40 5 1,30 1,31 Há diferenças significativas, quanto à precisão, nos resultados obtidos pelos dois analistas? Para 5 determinações 5-1= 4 Test F- Comparação da precisão 38 Usado para decidir se um resultado suspeito deve ser mantido ou rejeitado 𝑄()*(+*),- = 𝑥@ − 𝑥A 𝑓 valormenorvalormaior próximomaisvalorsuspeitovalor Qcalc - - = | xq é o resultado questionado xp é o vizinho mais próximo f é a faixa de valores dos resultados Test Q- Detecção de erros grosseiros 39 Q crítico (Qcrit) è depende do nível de confiança adotado Número de Observações 90% de confiança 95% de confiança 99% de confiança 3 0,941 0,970 0,994 4 0,765 0,829 0,926 5 0,642 0,710 0,821 6 0,560 0,625 0,740 7 0,507 0,568 0,680 8 0,468 0,526 0,634 9 0,437 0,493 0,598 10 0,412 0,466 0,568 Test Q- Detecção de erros grosseiros 40 Considere 5 resultados: 12,53; 12,56; 12,47; 12,67; 12,48. O valor 12,67 é um valor ruim? 12,47 12,48 12,53 12,56 12,67 Variação=0,11 Intervalo=0,20 𝑄()*(+*),- = %,// %,0% =0,55 𝑆𝑒 𝑄#$%#&%$'(˂ 𝑄)$*+%$'( , ( -$%(. +/ 0&+1)ã( 3('+ 1+. /$4)!'( No de observações Q90% 3 0,94 4 0,76 5 0,64 6 0,56 7 0,51 8 0,47 9 0,44 10 0,41 valormenorvalormaior próximomaisvalorsuspeitovalor Qcalc - - = | Test Q- Detecção de erros grosseiros
Compartilhar