Baixe o app para aproveitar ainda mais
Prévia do material em texto
05/10/2017 1 UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA Porque estudar estatística? • Examinar os tipos gerais de erros que podem ser encontrados em métodos analíticos. • Aprender a descrever a confiabilidade dos resultados • Discutir técnicas de comparação de dados experimentais a outros valores Porque estudar estatística? Dados com qualidade desconhecida são inúteis A confiabilidade pode ser avaliada: • Experimentos planejados para revelar a presença de erros podem ser realizados. • Padrões de composição conhecida podem ser analisados e os resultados podem ser comparados com as composições conhecidas. • A calibração de equipamentos normalmente aumenta a qualidade dos dados. Erros em análises químicas Aleatórios ou indeterminado • Afetam a precisão da medida • Variações aleatórias de dados experimentais • Estão presentes em todas as medidas experimentais Sistemáticos ou determinados • Afetam a exatidão da medida • Representado por um viés constante • É possível eliminá-los FONTES ERROS SISTEMÁTICOS Pessoais e operacionais São erros que independem de propriedades físicas e químicas do sistema ou de equipamentos e reagentes químicos, mas dependem do conhecimento e da habilidade do analista. Exemplos: - manter copo de béquer destampado durante as análises; - não regular o nível da balança analítica; - derramar soluções durante transferências; - deixar ebulir, promovendo a projeção de volumes da amostra. ERROS DETERMINADOS Instrumentos e reagentes São erros determinados ocasionados pela inadequada operação do instrumento analítico (instalação, condições de uso, calibração etc.) e pureza dos reagentes químicos. Exemplos: - aparelhos como pipetas, buretas e balões volumétricos sem calibração ou com calibração vencida; - impurezas em reagentes sólidos podem comprometer a massa medida. - Impurezas em reagentes líquidos podem atuar como interfentes. 05/10/2017 2 ERROS DETERMINADOS Erros de método A escolha do método deve ser cuidadosa e o procedimento deve ser rigorosamente observado. Exemplos: - uso de indicador inadequado; - aplicação do método a faixas de concentração inadequadas; - uso de soluções-padrão para volumetria com concentração inadequada. IDENTIFICAÇÃO DE ERROS DETERMINADOS Utilização de amostras em branco, ou seja, que não contêm o analito a ser determinado, devem ser analisadas usando-se o método escolhido, em paralelo às amostras. Utilização de diferentes métodos analíticos para determinar um mesmo analito em determinada amostra. A análise estatística dos dados deve reproduzir resultados equivalentes, do contrário, existem erros determinados. IDENTIFICAÇÃO DE ERROS DETERMINADOS Amostras de materiais de referência certificados (MCR). Este método deve reproduzir o valor certificado. (IPT – Instituto de Pesquisas Tecnológicas; NIST – National Institute of Standards and Technology). Amostras idênticas do mesmo material podem ser analisadas por analistas diferentes em laboratórios diferentes, utilizando- se os mesmos métodos ou diferentes métodos, desde que validados e reconhecidos. Divergências de resultados além do erro aleatório esperado indicam erros sistemáticos. ERROS INDETERMINADOS OU ALEATÓRIOS Considere que os erros determinados são conhecidos e estão corrigidos ou eliminados. Ainda assim, os resultados obtidos para repetidas medidas sofrerão flutuações devido aos erros indeterminados. São intrínsecos ao processo analítico e devem ser estimados por meio do tratamento estatístico de dados. MÉDIA É obtida pela divisão da soma das réplicas de medidas pelo número de medidas do conjunto: Caracterização de medidas e resultados Determinação do valor mais representativo MEDIANA É o resultado central quando as réplicas de dados são organizadas de acordo com uma sequência crescente ou decrescente de valores Caracterização de medidas e resultados No caso de dados ordenados de amostras de tamanho n, se n for impar, a mediana será o elemento central . Se n for par, a mediana será o resultado da media simples entre os elementos e (n +1) 2 n e n + 1 2 2 Determinação do valor mais representativo Em casos ideais, a média e a mediana são idênticas 05/10/2017 3 MEDIANA Erros em química analíticaErros em química analítica Estimativa do valor real de uma medida Média aritmética n i i 1 X X n Mediana: usada para estimar o valor real de uma série de dados quando a dispersão é grande Determinação de iodato (mg/Kg) em amostras de sal Analista 1, mg/Kg 58,3 60,1 59,4 58,9 59,7 Analista 2, mg/Kg 58,6 59,9 70,2 58,7 59,5 Média = 59,3 Mediana = 59,4 Média = 61,4 Mediana = 59,5 Exatidão e Precisão Exatidão: proximidade entre o resultado e seu valor real (aceito como real). Erro Absoluto = Xi – Xr Xi = valor medido e Xr = valor real Erro Relativo = (Xi – Xr) x 100 % Xr 1 2 3 4 Descrevem os efeitos dos erros Exatidão e Precisão Precisão: descreve a proximidade entre as medidas, ou seja, a proximidade entre os resultados que foram obtidos exatamente da mesma forma. Termos que descrevem a precisão de uma série de dados (função do desvio da média): Termo Fórmula Observações Desvio padrão, s n 2 i i 1 (X X) s n 1 Emprega-se s para n ≤ 20, sendo o denominador igual a n -1. Para n > 20 emprega-se σ e denominador é n. Coeficiente de variação ( ou RSD), CV sCV 100(%) X A precisão de um conjunto de dados de réplicas pode ser expressa como: desvio-padrão (s); Desvio-padrão relativo (DPR); Coeficiente de variação (CV); Variância (S2) ERROS EM DADOS EXPERIMENTAIS PRECISÃO Dois conceitos: Repetibilidade é a CONCORDÂNCIA entre os resultados de medidas repetidas de um mesmo método, efetuadas sob as mesmas condições. Reprodutibilidade é o grau de CONCORDÂNCIA entre os resultados de ensaios realizados com uma mesma amostra em diferentes laboratórios. PRECISÃO ANALÍTICA 05/10/2017 4 MEDIDAS DE DISPERSÃO A média e a mediana fornecem uma estimativa do valor verdadeiro; A dispersão de medidas individuais fornece uma estimativa da variabilidade das medidas individuais em relação à medida da tendência central. Caracterização de medidas e resultados MEDIDAS DE DISPERSÃO Caracterização de medidas e resultados DESVIO PADRÃO Descreve a dispersão de medidas individuais ao redor da média: 1 2 n xixs )( Erros em química analíticaErros em química analítica Variância = S2 MEDIDAS DE DISPERSÃO Caracterização de medidas e resultados VARIÂNCIA É outra maneira comum de medida de dispersão: Erros em química analíticaErros em química analítica I II III Valor verdadeiro ou mais provável EXATIDÃO E PRECISÃO I Exato e Preciso II Inexato e Preciso III Inexato e impreciso Erros em química analíticaErros em química analítica Exemplo A – Valor médio = 49,1 % Valor verdadeiro = 49,1 +- 0,1 % 49,0 49,1 49,2 49,3 49,4 49,0 49,1 49,2 49,3 49,4 Exemplo B – Valor médio = 49,4 % Valor verdadeiro = 49,1 +- 0,1 % Erros em química analíticaErros em química analítica Exato e impreciso Inexato e preciso ERRO ABSOLUTO é a diferença entre o valor medido e o valor verdadeiro ou mais provável. Informa se existe desvio positivo (a maior) ou negativo (a menor) entre o valor medido e o valor verdadeiro ou mais provável. i vE x x E = erro absoluto Xi = valor medido Xv = valor verdadeiro ou mais provável ERROS SISTEMÁTICOS EXATIDÃO 05/10/2017 5 ERRO RELATIVO é o erro absoluto dividido pelo valor verdadeiro ou mais provável, expresso empercentagem. .100%i v v x xEr x Er = erro relativo Xi = valor medido Xv = valor verdadeiro ou mais provável EXATIDÃO ERROS SISTEMÁTICOS Erros em Química Analítica É possível realizar uma análise química totalmente livre de erros ou incertezas? Resultados de 6 determinações de Fe em uma solução padrão contendo 20,00 mg/L de Fe (III). Faixa: 19,4 – 20,3 mg/L Cada medida é influenciada por muitas incertezas dispersão dos resultados Incertezas nunca podem ser completamente eliminadas, uma vez que o valor real de uma medida é sempre desconhecido. A grandeza provável de um erro em uma medida geralmente pode ser determinada os limites podem ser definidos, dentro dos quais encontra-se o valor real a um dado nível de probabilidade Aplicando o Coeficiente de Variação (CV) Determinação enzimática de glicose em sangue Média = 50 mg/L s = 2 mg/L 50 ± 2 mg/L CV = 4 % SITUAÇÃO 1 Média = 10 mg/L s = 2 mg/L 10 ± 2 mg/L CV = 20 % SITUAÇÃO 2 Dados obtidos por métodos volumétricos clássicos CVtolerável = 0,2 % Aula de pesagem DESCRIÇAO Média Mediana Desvio padrão Coeficiente de variação (%) Massa do resíduo(g) 0,0001 0,0001 0,0002 200,0 Massa da sílica (g) 0,3603 0,3461 0,0390 10,9 Igor Sanches DESCRIÇAO Média Mediana Desvio padrão Coeficiente de variação (%) Massa do resíduo(g) 0,0008 0,0004 0,0013 161,1 Massa da sílica (g) 0,7553 0,7566 0,0081 1,1 Lucas Aguiar DESCRIÇAO Média Mediana Desvio padrão Coeficiente de variação (%) Massa do resíduo(g) 0,0001 0,0001 0,0001 100 Massa da sílica (g) 0,4990 0,5000 0,0013 0,26 Jamile Serra Classificação de Erros 1 - Erro determinado ou sistemático Tem valor definido, pode ser associado a uma causa, sendo da mesma ordem de grandeza para medidas em replicatas realizadas da mesma forma. TIPO EXEMPLO 1. Erro de método reações incompletas reações secundárias solubilidade dos precipitados baixa sensibilidade de um indicador. 2. Erro instrumental pesos e aparelhagem volumétrica mal calibrados deslocamento do ponto zero da balança analítica por variações de temperatura. 3. Erro operacional 3.1 Técnica 3.2 Pessoais amostras não representativas perdas mecânicas de amostra durante sua decomposição lavagem excessiva de precipitados calcinação de precipitados à temperaturas impróprias esfriamento incompleto de material para pesagem. dificuldade em distinguir cores tendências para estimar leituras em uma escala. Classificação de Erros 1- Detecção do erro determinado ou sistemático TIPO DE ERRO DETECÇÃO Instrumental Calibração periódica (resposta do instrumento muda com o tempo devido ao uso, corrosão, manipulação errada, etc.). Pessoal Treinamento, cuidado, autodisciplina. Método 1.Análise de amostras de referência1 2. Análise independente2 3.Determinações em branco3 4. Variação no tamanho da amostra4 Notas: 1 Materiais que contém um ou mais analitos com níveis de concentração exatamente conhecida; 2 Se não se dispõe de padrões de referência, um segundo método analítico independente pode ser usado em paralelo validação estatística; 3 Branco (ausência do analito) - revelam erros devido a contaminantes e interferentes provenientes de reagentes e/ou recipientes usados na análise; 4 Quando o tamanho da amostra aumenta, o efeito de um erro constante diminui. 05/10/2017 6 Classificação de Erros 2 - Erro indeterminado, casual ou aleatório inevitáveis devido às incertezas inerentes às medidas físicas ou químicas usadas nos métodos; fontes não identificadas ou medidas (tão pequenas que não podem ser identificadas individualmente). Leitura Bureta – 50,00 mL 0.02 mL Valor lido: 5,17 mL Faixa: 5,15 – 5,19 mL Análise volumétrica Classificação de Erros 2.1.Fontes de erro aleatório Distribuição de freqüência para medidas contendo: A) 4 incertezas aleatórias; B) 10 incertezas aleatórias; C) Número muito grade de incertezas aleatórias. Curva gaussiana ou curva normal de erros Um pouco de história No século XVIII, astrônomos e outros cientistas observaram que medidas repetidas de mensurações como a distância à lua variavam como na figura, quando coletadas em grande número. Esta forma gráfica era associada aos erros de mensuração, daí o nome de “Distribuição normal dos erros” e depois “Distribuição normal” Também é conhecida por “Distribuição Gaussiana”, em função do modelo matemático desenvolvido por Karl F. Gauss para este comportamento. Distribuição Normal Distribuição normal 0,00 0,05 0,10 0,15 0,20 25 40 55 70 85 10 0 11 5 Peso da população adulta n = 5000 µ = 75 kg s = 12 kg 0,00 0,05 0,10 0,15 0,20 133 137 141 145 149 153 157 161 165 169 Altura de universitários n = 3000 µ = 152 cm s = 5 cm 0,00 0,05 0,10 0,15 29, 5 29, 6 29, 7 29, 8 29, 9 30 30, 1 30, 2 30, 3 30, 4 30, 5 Comprimento de uma régua n = 1000 µ = 30cm s = 0,15cm 0 0,05 0,1 0,15 0,2 19 7 21 5 23 3 25 1 26 9 28 7 30 5 Pessoas num restaurante µ = 250 por dia s = 20 por dia Distribuição Normal - Exemplos Curva normal típica Média = µ Desvio padrão = média Forma de uma boca de sino 50% 50% Área sob a curva = 1 (0,5 + 0,5) Distribuição Normal ERROS INDETERMINADOS OU ALEATÓRIOS Lei de Distribuição de Gauss O valor médio ocorre no ponto central de distribuição de frequência; Existe uma distribuição simétrica de desvios em torno do ponto máximo, ou seja, do valor médio. Existe um decaimento exponencial na distribuição de frequência à medida que o desvio aumenta. z = representa o desvio de um resultado da média da população em relação ao desvio padrão. 05/10/2017 7 Distribuição Normal O desvio padrão mede a largura da curva gaussiana, quanto maior for mais larga é a curva. 1. A curva normal tem a forma de sino 2. É simétrica em relação a média 3. Prolonga-se de - a + (apenas em teoria) 4. Fica completamente especificada por sua média e seu desvio padrão; há uma distribuição normal para cada par (média e desvio padrão) 5. A área total sob a curva é considerada 100% ou igual a 1 6. A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos 7. A probabilidade de uma variável aleatória normalmente distribuída tomar exatamente determinado valor (pontual) é zero (característica da distribuição contínua) 8. A área sob a curva entre a média e um ponto arbitrário é função do número de desvios padrões entre a média e aquele ponto Distribuição Normal - Características ERROS INDETERMINADOS OU ALEATÓRIOS Lei de Distribuição de Gauss 68,3 % de probabilidade que a incerteza aleatória de qualquer medida não ultrapasse 1. ERROS INDETERMINADOS OU ALEATÓRIOS Lei de Distribuição de Gauss Existe 95,4 % de chances que a incerteza aleatória de qualquer medida não ultrapasse 2. ERROS INDETERMINADOS OU ALEATÓRIOS Lei de Distribuição de Gauss 99,7% de chances que a incerteza aleatória de qualquer medida não ultrapasse 3. Limite de Confiança (LC) Limite de Confiança: definem um intervalo em torno da média (x) , o qual inclui o valor real ( ) a uma dada probabilidade (nível de confiança). Áreas sobre a curva gaussiana para valores de t t sX n LC = 05/10/2017 8 Intervalo de confiança (IC) Uma das melhores maneiras de indicar a confiabilidade é fornecer o intervalo de confiança em um nível de 90% ou 95% Tratamento e Avaliação Estatística de Dados Lembre-se de que o número de graus de liberdade para pequenos conjuntos de dados é igual a N-1 e não N. Tratamento e Avaliação Estatísticade Dados Limite de Confiança (LC) Resultados, % 0,084 0,089 0,079 0,081 0,087 Média = 0,084 % s = 0,004 Determinação do teor de álcool (%) no sangue de motoristas LC95= 0,084 ± (0,004 x 2,78) / 2,24 LC95 = 0,084 ± 0,005 Intervalo de Confiança = 0,079 – 0,089 LC90= 0,084 ± (0,004 x 2,13) / 2,24 LC90 = 0,084 ± 0,004 Intervalo de Confiança = 0,080 – 0,088 95% 90% t90 = 2,13 t95 = 2,78 n – 1 = graus de liberdade Média, s e LC são medidas que indicam a PRECISÃO TRATAMENTO ESTATÍSTICO DE DADOS REJEIÇÃO DE DADOS – TESTE Q Em que situação um dado analítico deve ser rejeitado? TRATAMENTO ESTATÍSTICO DE DADOS REJEIÇÃO DE DADOS – TESTE Q Somente quando o analista identificar algum problema evidente durante a realização da análise química, que resulte em perdas do analito. TRATAMENTO ESTATÍSTICO DE DADOS REJEIÇÃO DE DADOS – TESTE Q Em qualquer outra situação ou condição, a rejeição de um dado experimental deve ser decidida com base em testes estatísticos. O teste Q é uma ferramenta estatística para esse fim! 05/10/2017 9 TRATAMENTO ESTATÍSTICO DE DADOS REJEIÇÃO DE DADOS – TESTE Q Teste Q Q = valor suspeito – valor mais próximo maior valor – menor valor Se o valor de Q calculado for maior que o valor de Q tabelado, o dado pode ser rejeitado. Caso contrário, o dado será considerado estatisticamente válido. Teste Q : Critério de rejeição de valores suspeitos para cálculo da média a um determinado nível de confiança : Rejeição de Valores – Teste Q Critério: Se Qexp. Qcrítico (tabelado) para um número de resultados (n) de 3 a 10 , o valor suspeito deve ser rejeitado. Rejeição de Valores – Teste Q Resultados, µg/L 78,24 73,37 75,61 73,08 74,42 Determinação do teor Hg (µg/L) na urina de garimpeiros Substituindo 78,24 por 85,20 no conjunto de dados. 95% Q95 = 0,710 Q95 = 0,710 Qexp = (|78,24 – 75,61|) / (|78,24 – 73,08|) Qexp = 0, 509 Média = 74,94 µg/L s = 2,09 Qexp = (|85,20 – 75,61|) / (|85,20 – 73,08|) Qexp = 0, 791 Média = 74,03 µg/L s = 1,08
Compartilhar