Baixe o app para aproveitar ainda mais
Prévia do material em texto
Precisão (precision) vs Exatidão (accuracy) Boa precisão – Baixa exatidão Boa exatidão – Baixa precisão Precisão (precision) vs Exatidão (accuracy) Exatidão de uma medida: dá o grau de proximidade da medida de uma quantidade em relação ao seu valor verdadeiro. Precisão de uma medida (reprodutibilidade ou repitibilidade): dá o grau com que medidas repetitivas, realizadas nas mesmas condições, dão o mesmo valor. precisão F re q u ên ci a d o s va lo re s Valor de referência exatidão Valores obtidos nas medidas D is tr ib u iç ã o d e p ro b a b il id a d e 5 4 3 2 1 Erro Absoluto Erro Relativo ta xxE é a média dos valores obtidos de x é o valor da medida aceito como verdadeiro (referência) x tx %100 t t r x xx E A Exatidão se expressa em termos de erro absoluto ou erro relativo Fatores que contribuem para o erro em medidas Erros aleatórios ou indeterminados – Er (r de randômico = aleatório) Erros sistemáticos ou determinados – Es Erros grosseiros (falta de cuidado e atenção durante as medidas, etc.) sra EEE medida medida medida Absorb Absorb Absorb Média = 0,482 Desv. pad = 0,0056 Tabela 1. Dados de uma série de 50 determinações de absorbância de uma mesma amostra de Fe(III) contendo SCN- As diferenças nos valores obtidos se devem a erros aleatórios Note que existem valores que se repetem os quais oscilam em torno de um valor médio. A melhor forma de vermos a distribuição dos erros aleatórios é agruparmos os valores por faixa de absorbância. Intervalo de Absorbância Valores de absorbância dentro do intervalo y Frequência y/N 0,469 a 0,471 3 0,06 0,472 a 0,474 1 0,02 0,475 a 0,477 7 0,14 0,478 a 0,480 9 0,18 0,481 a 0,483 13 0,26 0,484 a 0,486 7 0,14 0,487 a 0,489 5 0,1 0,490 a 0,492 4 0,08 0,493 a 0,495 1 0,02 N = 50, número total de medidas Tabela 2. Distribuição de frequência dos dados que aparecem na Tabela 1 A – Histograma que mostra a distribuição dos 50 resultados (por faixa de valores de absorbância) conforme mostrado na Tabela 2. B – Curva Gaussiana que contém alguns dados com a mesma média e desvio padrão dos dados mostrados em A. = média A B P o rc en ta g em d o n .o d e m ed id as Valores de absorbância obtidos - + = desvio padrão é a média dos valores obtidos para um conjunto pequeno de medidas é a média dos valores obtidos para um conjunto infinito de medidas Erros aleatórios ou indeterminados – Er - Distribuição gaussiana Características de uma distribuição gaussiana de valores medidos: 1. O resultado que se observa com maior frequência é a média, , do conjunto de dados. 2. Os resultados se agrupam de forma simétrica ao redor da média. 3. É mais frequente observar pequenos desvios em relação à media do que grandes desvios. 4. Na ausência de erros sistemáticos, a média se aproxima do valor verdadeiro. Qual a diferença entre e ? x x xEr Quando N (número de medidas) > 20, x Ex.1: Calcular o erro aleatório para o segundo dado da Tabela acima. Pode-se considerar a média, 0,482, como sendo um valor muito próximo do verdadeiro, em função de N = 50. xEr 002,0482,0480,0 rE medida medida medida Absorb Absorb Absorb Média = 0,482 Desv. pad = 0,0056 Ex.2: Calcular o erro aleatório para a média dos três primeiros valores da Tabela acima 003,0482,0485,0 rE 3 486,0480,0488,0 x 485,0x medida medida medida Absorb Absorb Absorb Média = 0,482 Desv. pad = 0,0056 Erro sistemático – Es 1. tem um valor definido, 2. sua causa pode ser determinada, 3. tem o mesmo valor e sinal para qualquer réplica de medida realizada nas mesmas condições 4. sempre se caracteriza por uma tendência ou viés (bias) A B F re q u ên c ia r e la ti v a , d N /N viés Tipos de erros sistemáticos: • Instrumental • Pessoal • De método Erro sistemático instrumental Depende dos instrumentos e equipamentos utilizados na análise Ex.: uma balança analítica descalibrada vai medir a massa de substâncias ou objetos sempre com um certo erro fixo (para cima ou para baixo). Obs. – Importância da calibração e aferição de todos os equipamentos e instrumentos de medida na realização de determinações quantitativas. Erro sistemático pessoal Depende da forma como o químico trabalha, do nível de conhecimento dos conceitos e variáveis envolvidas na análise, bem como do nível de atenção durante a execução da mesma. Exs.: a cor visualizada pelo químico na determinação do ponto de viragem de um indicador, o acerto do menisco numa bureta para leitura de volume, etc. Erro de método Depende do comportamento químico e/ou físico das substâncias, solventes e reagentes empregados na análise. Exs.: perda de volume por volatilidade, reação incompleta. Como evitar: uso de padrões Tratamento estatístico de erros aleatórios Média de uma população de dados, Desvio padrão da população, Variância da população, 2 Como as variâncias são aditivas, os estatísticos preferem definir a precisão em termos de variância 1 2, 2 2, e 3 2 são as variâncias de cada fonte de erro Os químicos preferem usar o desvio padrão como medida da precisão, pois tem a mesma unidade da medida. Tratamento estatístico de erros aleatórios Média de um conjunto finito de dados, Desvio padrão da amostra, s Variância da amostra, s2 Quando z = 2, RSD é expresso em percentual Quando z = 3, RSD é expresso em partes por mil x N - 1 = número de graus de liberdade: a variância na amostra tem N-1 graus de liberdade pois ela é computada a partir de N valores randômicos menos apenas um parâmetro estimado, a média. Desvio padrão relativo (DPR ou RSD) Coeficiente de variação (CV) Alternativa para cálculo do desvio padrão da amostra, s Classe número de alunos Nota média Desvio padrão Coeficiente de variação Azul nA 40 4 4/40 = 0,1 Verde nV 5 4 4/5 = 0,8 Coeficiente de variação (CV) CV é uma medida padronizada da dispersão de uma distribuição de probabilidade. No caso da Classe Azul: CV = 0,1 ou 10% significa que na primeira distribuição, em média, os desvios em relação à média atingem 10% do valor desta. No caso da Classe Verde: CV = 0,8 ou 80% significa que na segunda distribuição, em média, os desvios em relação à média atingem até 80% do valor desta. Dados de concentração de SO2 observados próximo a uma fábrica de papel. Calcular: (a) a média, (b) o desvio padrão absoluto, (c) o coeficiente de variação (b) F re q u ên ci a r el a ti v a , d N /N Desvio em relação à média, x- A lei do erro normal Em estatística gaussiana assume-se que os resultados de medidas replicadas que contenham erros aleatórios se distribuem de acordo com a lei do erro normal A Figura ao lado mostra duas curvas de erro normal, para um conjunto A de dados, obtidos pelo método A e um conjunto B, obtido por um outro método. Considerando-se que a média corresponde ao valor verdadeiro, qual dos métodos é mais preciso e qual o mais exato? A lei do erro normal Pode-se expressar o desvio em relação à média em unidades de desvio padrão: F re q u ên ci a r el a ti v a , d N /N Areas sob a curvade erro normal A área sob a curva de erro normal é dada pela integral da equação: Onde erf(b) = função erro: A fração da população entre qualquer limite especificado é dado pela área sob a curva entre esses pontos limites. Por ex.: a área entre z = -1 e z = +1 é dada por: Significado: 68,3% dos resultados apresentam desvios em relação à média que são menores ou iguais ao desvio padrão, ou seja, estão dentro do intervalo de . 68,3% Pode-se dizer que existe 68,3% de probabilidade que o erro aleatório associado a uma medida seja menor que 1 Entre z = -1 e z = +1 Entre z = -2 e z = +2 95,5% Pode-se dizer que existe 95,5 % de probabilidade que o erro aleatório associado a uma medida seja menor que 2 Entre z = -3 e z = +3 100% Pode-se dizer que existe 100% de probabilidade que o erro aleatório associado a uma medida seja menor que 3 Erro padrão de uma média As grandezas de probabilidade para uma distribuição gaussiana que foram vistas anteriormente se referem ao erro provável de uma única medida. Vamos considerar agora um conjunto de amostras, cada uma contendo N dados. Se calcularmos a média para cada conjunto, a dispersão nos valores das médias será tanto menor quanto maior for o valor de N. O desvio padrão das médias é dado por m N m No caso da estimativa do desvio padrão da média da amostra usa-se a expressão E rr o r el a ti v o e m s ,% Na maioria dos casos pode-se assumir que s = quando N 20 Bom para se fazer uma boa estimativa de s em experimentos de curta duração e com pouco consumo de reagentes Ponderação de dados Nos casos de medidas que demandam muito tempo e consumo de reagentes, pode-se fazer uso da ponderação dos desvios padrões de conjuntos de amostras com dados acumulados ao longo do tempo. 100,0ps ppm de Hg Número de exemplares Número de amostras Conc. de Hg ppm N i xx 1 2)( Dados sobre a determinação do teor de Hg em sete amostras de peixe Soma da soma dos quadrados = 0,2196 Ex.: Calcular o desvio padrão (ponderado) para os dados da tabela abaixo Na ausência de erros sistemáticos, pode-se encontrar o intervalo ao redor da média , determinada experimentalmente, dentro do qual espera-se encontrar a média da população, , com certo grau de probabilidade. Esse intervalo é chamado de intervalo de confiança Intervalos de confiança quando s é uma boa aproximação para x F re q u en ci a r el a ti v a , d N /N -0 ,6 7 + 0, 67 50% F re q u en ci a r el a ti v a , d N /N -1 ,9 6 + 1, 96 95% Expressão geral para o intervalo de confiança, IC, da média verdadeira baseada na medida de um único valor de x pode se obtida rearranjando-se a eq. Intervalo de confiança para uma única medida zx O IC para é dado por: Raramente se usa esse procedimento. O mais comum é usar um valor médio para um número N de medidas. Neste caso, N z x Nível de Confiança/% z 50 0,67 68 1,00 80 1,28 90 1,64 95 1,96 95,4 2,00 99 2,58 99,7 3,00 99,9 3,29 O IC para é dado por: Valores de z para cada nível de confiança 04,067,1 3 10,067,0 67,1%50 IC 11,067,1 3 10,096,1 67,1%95 IC Número de exemplares Número de amostras Conc. de Hg ppm N i xx 1 2)( Dados sobre a determinação de teor de Hg em sete amostras de peixe Soma da soma dos quadrados = 0,2196 Calcular os intervalos de confiança de 50% e 95% para o valor da média de 1,67 ppm de Hg no caso do exemplar 1 100,0ps ppm de Hg N z x O IC para é dado por: Número de exemplares Número de amostras Conc. de Hg ppm N i xx 1 2)( Dados sobre a determinação de teor de Hg em sete amostras de peixe Soma da soma dos quadrados = 0,2196 Quantas medidas replicadas do exemplar 1 seriam necessárias para diminuir o intervalo de confiança de 95% para 0,07 ppm? Intervalos de confiança quando é desconhecido Quando o número de dados é reduzido (experimentos muito longos ou que demandam muito gasto de reagentes) não se pode assumir que s é uma boa aproximação de . Neste caso, um único conjunto de resultados (medidas) deve fornecer a média e uma estimativa da precisão. Usamos t no lugar de z (parâmetro t de student) Para a média de N medidas: s x t Ns x t / N ts x O IC para é dado por: Valores de t para vários níveis de probabilidade Graus de liberdade Valor de t para o intervalo de confiança Um químico obteve os seguintes dados na determinação de álcool em sangue: 0,084%, 0,089% e 0,079%. Calcule o intervalo de confiança para 95% para a média sabendo-se que: a) Não se conhece a precisão do método. b) De experimentos anteriores sabe-se que s = 0,006%. Valores de t para vários níveis de probabilidade Graus de liberdade Valor de t para o intervalo de confiança t = 4,30 para 2 graus de liberdade (N-1) e 95% de IC. N ts x O IC para é dado por: a) s = 0,005 IC (95%) para é: 3 005,030,4 084,0 012,0084,0 b) O valor de = 0,006, logo 3 006,096,1 084,0 007,0084,0 IC (95%) para é: A tendência ou viés é característica de erros sistemáticos. Quando a média para um conjunto finito de medidas, , diverge de , o valor verdadeiro ou de referência, pode-se estimar se esta diferença se deve a um erro aleatório ou a um erro de método (sistemático). Isto pode ser feito comparando-se a diferença com a diferença que se esperaria para um determinado IC Prova para tendência ou viés x N st x Se , é provável a existência de viés. Se , nada se pode dizer sobre a existência de viés. N st x N z x Se o valor de é conhecido usa-se a expressão: Exemplo Uma amostra de gasolina, que se sabia previamente apresentava um teor de enxofre de 0,123%, foi analisada por um novo método. Os resultados de quatro análises feitas para esta amostra usando o novo método deram em % de S: 0,112; 0,118; 0,115; 0,119. Dizer se estes dados indicam a presença de viés (ou tendência). Como , é provável a existência de viés. Valores de t para vários níveis de probabilidade Graus de liberdade Valor t para o intervalo de confiança x N st 0,116-0,123 = -0,007 0,005 N st x Cálculo para 95% de nível de confiança Qual seria o resultado para 99% de nível de confiança? Considere que, no exemplo anterior, se soubesse que o desvio padrão para um conjunto significativo de medidas fosse 0,0032% de S. Indique a existência de viés para 99% de nível de confiaça. s = x 0,007 Como 0,007 > 0,00413, a probabilidade de existência de viés é de 99%. Testes de rejeição de dados – Teste Q Que critério adotar para rejeitar um valor experimental que parece estar discrepante dos demais? Valores críticos de Q para 90% de nível de confiança Propagação de incertezas nas medidas Numa análise quantitativa, até se chegar ao resultado final, várias medidas são necessárias. Por exemplo, na determinação da concentração de ácido clorídrico com solução padrão de NaOH as seguintes etapas envolvendo medidas estão envolvidas: 1) Massa do padrão primário (KHFt) usado na padronizaçãoda solução de NaOH 2) Volume de NaOH gasto durante a titulação 3) Volume de HCl pipetado para análise 4) Volume de NaOH gasto na titulação Sabemos que 1 mol de KHFt é neutralizado por 1 mol de NaOH E que 1 mol de HCl é neutralizado por 1 mol de NaOH NaOH KHFt KHFt VNaOH MM m NaOHHCl VNaOHVHCl NaOHKHFt KHFt VMM m NaOH HCl NaOH V VNaOH HCl Como se propagam os erros de cada medida experimental até o resultado final? Propagação de erros nos cálculos Tipo de cálculo Multiplicação ou divisão Exponencial Logarítmo Antilogarítmo Adição ou subtração Exemplo* Estimativa de desvio padrão de x * p, q, e r são variáveis experimentais cujas estimativas de desvio padrão são sp, sq e sr, respectivamente Algarismos significativos São os algarismos necessários para expressar o valor de uma grandeza determinada experimentalmente ou um resultado calculado, de modo que a incerteza esteja associada apenas ao último algarismo. 0,0234 ou 0,234 ou 0,000234, ou 0,00234 – todos têm apenas 3 algarismos significativos 1,200 0,003 – o valor 1,200 é resultado de uma medida, cuja incerteza está na última casa depois da vírgula, portanto, são 4 algarismos significativos. 2,24 + 0,1231 = 2,36, resultado da soma tem o número de algarismos significativos do valor com menor número de algarismos significativos (o mesmo vale para a subtração) 2,00 x 0,1111 = 0,222, resultado do produto tem o número de algarismos significativos do valor com menor número de algarismos significativos (o mesmo vale para a divisão)
Compartilhar