Buscar

Aula Estatística em Q.A.2 - Joel Rubin

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 46 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Precisão (precision) vs Exatidão (accuracy) 
Boa precisão – Baixa exatidão 
Boa exatidão – Baixa precisão 
Precisão (precision) vs Exatidão (accuracy) 
Exatidão de uma medida: dá o grau de proximidade da medida de uma quantidade em 
relação ao seu valor verdadeiro. 
Precisão de uma medida (reprodutibilidade ou repitibilidade): dá o grau com que 
medidas repetitivas, realizadas nas mesmas condições, dão o mesmo valor. 
precisão F
re
q
u
ên
ci
a 
d
o
s 
va
lo
re
s Valor de 
referência 
exatidão 
Valores obtidos nas medidas 
D
is
tr
ib
u
iç
ã
o
 d
e
 p
ro
b
a
b
il
id
a
d
e
 
5 4 3 2 1 
Erro Absoluto 
Erro Relativo 
ta xxE 
é a média dos valores obtidos de x 
é o valor da medida aceito como verdadeiro (referência) 
x
tx
%100


t
t
r
x
xx
E
A Exatidão se expressa em termos de erro absoluto ou erro relativo 
Fatores que contribuem para o erro em medidas 
Erros aleatórios ou indeterminados – Er (r de randômico = aleatório) 
Erros sistemáticos ou determinados – Es 
Erros grosseiros (falta de cuidado e atenção durante as medidas, etc.) 
sra EEE 
medida medida medida Absorb Absorb Absorb 
Média = 0,482 
Desv. pad = 0,0056 
Tabela 1. Dados de uma série de 50 determinações de absorbância 
de uma mesma amostra de Fe(III) contendo SCN- 
As diferenças nos valores obtidos se devem a erros aleatórios 
Note que existem valores que se repetem os quais oscilam em torno de um valor médio. 
A melhor forma de vermos a distribuição dos erros aleatórios é agruparmos os valores 
por faixa de absorbância. 
Intervalo de 
Absorbância 
Valores de absorbância 
dentro do intervalo 
 y 
Frequência 
y/N 
0,469 a 0,471 3 0,06 
0,472 a 0,474 1 0,02 
0,475 a 0,477 7 0,14 
0,478 a 0,480 9 0,18 
0,481 a 0,483 13 0,26 
0,484 a 0,486 7 0,14 
0,487 a 0,489 5 0,1 
0,490 a 0,492 4 0,08 
0,493 a 0,495 1 0,02 
N = 50, número total de medidas 
Tabela 2. Distribuição de frequência dos 
dados que aparecem na Tabela 1 
A – Histograma que mostra a distribuição dos 50 resultados (por faixa de 
valores de absorbância) conforme mostrado na Tabela 2. 
B – Curva Gaussiana que contém alguns dados com a mesma média e desvio 
padrão dos dados mostrados em A. 
 = média  
A 
B 
P
o
rc
en
ta
g
em
 d
o
 n
.o
 d
e 
m
ed
id
as
 
Valores de absorbância obtidos 
- + 
 = desvio padrão 
 é a média dos valores obtidos para um conjunto pequeno de medidas 
 é a média dos valores obtidos para um conjunto infinito de medidas 
Erros aleatórios ou indeterminados – Er - Distribuição gaussiana 
Características de uma distribuição gaussiana de valores medidos: 
 
1. O resultado que se observa com maior frequência é a média, , do conjunto de 
dados. 
2. Os resultados se agrupam de forma simétrica ao redor da média. 
3. É mais frequente observar pequenos desvios em relação à media do que grandes 
desvios. 
4. Na ausência de erros sistemáticos, a média se aproxima do valor verdadeiro. 
Qual a diferença entre e ? 
x
x
 xEr
 Quando N (número de medidas) > 20, 
x
Ex.1: Calcular o erro aleatório para o segundo dado da Tabela acima. 
Pode-se considerar a média, 0,482, como sendo um valor muito próximo do verdadeiro, 
em função de N = 50. 
 xEr 002,0482,0480,0 rE
medida medida medida Absorb Absorb Absorb 
Média = 0,482 
Desv. pad = 0,0056 
Ex.2: Calcular o erro aleatório para a média dos três primeiros valores da Tabela acima 
003,0482,0485,0 rE
3
486,0480,0488,0 
x
485,0x
medida medida medida Absorb Absorb Absorb 
Média = 0,482 
Desv. pad = 0,0056 
Erro sistemático – Es 
1. tem um valor definido, 
2. sua causa pode ser determinada, 
3. tem o mesmo valor e sinal para qualquer réplica de medida realizada nas mesmas 
condições 
4. sempre se caracteriza por uma tendência ou viés (bias) 
A B 
F
re
q
u
ên
c
ia
 r
e
la
ti
v
a
, 
d
N
/N
 viés 
Tipos de erros sistemáticos: 
• Instrumental 
• Pessoal 
• De método 
Erro sistemático instrumental 
Depende dos instrumentos e equipamentos utilizados na análise 
Ex.: uma balança analítica descalibrada vai medir a massa de substâncias ou objetos 
sempre com um certo erro fixo (para cima ou para baixo). 
 
Obs. – Importância da calibração e aferição de todos os equipamentos e 
instrumentos de medida na realização de determinações quantitativas. 
Erro sistemático pessoal 
Depende da forma como o químico trabalha, do nível de conhecimento dos conceitos e 
variáveis envolvidas na análise, bem como do nível de atenção durante a execução da 
mesma. 
Exs.: a cor visualizada pelo químico na determinação do ponto de viragem de um indicador, 
o acerto do menisco numa bureta para leitura de volume, etc. 
Erro de método 
Depende do comportamento químico e/ou físico das substâncias, solventes e reagentes 
empregados na análise. 
Exs.: perda de volume por volatilidade, reação incompleta. 
Como evitar: uso de padrões 
Tratamento estatístico de erros aleatórios 
Média de uma população de dados,  
Desvio padrão da população,  
Variância da população, 2 
Como as variâncias são aditivas, os estatísticos 
preferem definir a precisão em termos de variância 
1
2, 2
2, e 3
2 são as variâncias de cada fonte de erro 
Os químicos preferem usar o desvio padrão como medida da precisão, pois 
tem a mesma unidade da medida. 
Tratamento estatístico de erros aleatórios 
Média de um conjunto finito de dados, 
Desvio padrão da amostra, s 
Variância da amostra, s2 
Quando z = 2, RSD é expresso em percentual 
Quando z = 3, RSD é expresso em partes por mil 
x
N - 1 = número de graus de liberdade: a variância na amostra tem N-1 
graus de liberdade pois ela é computada a partir de N valores 
randômicos menos apenas um parâmetro estimado, a média. 
Desvio padrão relativo (DPR ou RSD) 
Coeficiente de variação (CV) 
Alternativa para cálculo do desvio padrão da 
amostra, s 
Classe 
número de 
alunos 
Nota média 
Desvio 
padrão 
Coeficiente de 
variação 
Azul nA 40 4 4/40 = 0,1 
Verde nV 5 4 4/5 = 0,8 
Coeficiente de variação (CV) 
CV é uma medida padronizada da dispersão de uma distribuição de probabilidade. 
No caso da Classe Azul: CV = 0,1 ou 10% significa que na primeira 
distribuição, em média, os desvios em relação à média atingem 10% do valor 
desta. 
No caso da Classe Verde: CV = 0,8 ou 80% significa que na segunda 
distribuição, em média, os desvios em relação à média atingem até 80% do 
valor desta. 
Dados de concentração de SO2 observados próximo a uma fábrica de papel. 
Calcular: (a) a média, (b) o desvio padrão absoluto, (c) o coeficiente de variação 
(b) 
F
re
q
u
ên
ci
a
 r
el
a
ti
v
a
, 
d
N
/N
 
Desvio em relação à média, x- 
A lei do erro normal 
Em estatística gaussiana assume-se 
que os resultados de medidas 
replicadas que contenham erros 
aleatórios se distribuem de acordo 
com a lei do erro normal 
A Figura ao lado mostra duas curvas 
de erro normal, para um conjunto A 
de dados, obtidos pelo método A e 
um conjunto B, obtido por um outro 
método. Considerando-se que a 
média corresponde ao valor 
verdadeiro, qual dos métodos é mais 
preciso e qual o mais exato? 
A lei do erro normal 
Pode-se expressar o desvio em 
relação à média em unidades de 
desvio padrão: 
F
re
q
u
ên
ci
a
 r
el
a
ti
v
a
, 
d
N
/N
 
Areas sob a curvade erro normal 
A área sob a curva de erro normal é dada pela integral da equação: 
Onde erf(b) = função erro: 
A fração da população entre qualquer limite especificado é dado pela área sob a curva 
entre esses pontos limites. Por ex.: a área entre z = -1 e z = +1 é dada por: 
Significado: 68,3% dos resultados apresentam desvios em relação à 
média que são menores ou iguais ao desvio padrão, ou seja, estão 
dentro do intervalo de . 
68,3% 
Pode-se dizer que existe 68,3% de probabilidade que o erro 
aleatório associado a uma medida seja menor que 1 
Entre z = -1 e z = +1 
Entre z = -2 e z = +2 
95,5% 
Pode-se dizer que existe 95,5 % de probabilidade que o erro 
aleatório associado a uma medida seja menor que 2 
Entre z = -3 e z = +3 
100% 
Pode-se dizer que existe 100% de probabilidade que o erro 
aleatório associado a uma medida seja menor que 3 
Erro padrão de uma média 
As grandezas de probabilidade para uma distribuição gaussiana que foram vistas 
anteriormente se referem ao erro provável de uma única medida. 
Vamos considerar agora um conjunto de amostras, cada uma contendo N dados. Se 
calcularmos a média para cada conjunto, a dispersão nos valores das médias será tanto 
menor quanto maior for o valor de N. 
O desvio padrão das médias é dado por m 
N
m

 
No caso da estimativa do desvio padrão da 
média da amostra usa-se a expressão 
E
rr
o
 r
el
a
ti
v
o
 e
m
 s
,%
 
Na maioria dos casos pode-se assumir que s =  quando N  20 
Bom para se fazer uma boa estimativa de s em experimentos de 
curta duração e com pouco consumo de reagentes 
Ponderação de dados 
Nos casos de medidas que demandam muito tempo e 
consumo de reagentes, pode-se fazer uso da ponderação 
dos desvios padrões de conjuntos de amostras com dados 
acumulados ao longo do tempo. 
100,0ps
ppm de Hg 
Número de 
exemplares 
Número de 
amostras 
Conc. de Hg 
ppm  
N
i xx
1
2)(
Dados sobre a determinação do teor de Hg em sete amostras de peixe 
Soma da soma dos quadrados = 0,2196 
Ex.: Calcular o desvio padrão (ponderado) para os dados da tabela abaixo 
Na ausência de erros sistemáticos, pode-se encontrar o intervalo ao redor da média , 
determinada experimentalmente, dentro do qual espera-se encontrar a média da 
população, , com certo grau de probabilidade. 
 
Esse intervalo é chamado de intervalo de confiança 
Intervalos de confiança quando s é uma boa aproximação para  
x
F
re
q
u
en
ci
a
 r
el
a
ti
v
a
, 
d
N
/N
 
-0
,6
7
 
+
0,
67

 
50% 
F
re
q
u
en
ci
a
 r
el
a
ti
v
a
, 
d
N
/N
 
-1
,9
6
 
+
1,
96

 
95% 
Expressão geral para o intervalo de confiança, IC, da média verdadeira baseada na 
medida de um único valor de x pode se obtida rearranjando-se a eq. 
Intervalo de confiança para uma única medida 
zx
O IC para  é dado por: 
Raramente se usa esse procedimento. O mais 
comum é usar um valor médio para um 
número N de medidas. Neste caso, 
N
z
x


Nível de 
Confiança/% 
z 
50 0,67 
68 1,00 
80 1,28 
90 1,64 
95 1,96 
95,4 2,00 
99 2,58 
99,7 3,00 
99,9 3,29 
O IC para  é dado por: 
Valores de z para cada 
nível de confiança 
04,067,1
3
10,067,0
67,1%50 

IC
11,067,1
3
10,096,1
67,1%95 

IC
Número de 
exemplares 
Número de 
amostras 
Conc. de Hg 
ppm  
N
i xx
1
2)(
Dados sobre a determinação de teor de Hg em sete amostras de peixe 
Soma da soma dos quadrados = 0,2196 
Calcular os intervalos de confiança de 50% e 95% para o valor da média de 1,67 ppm de 
Hg no caso do exemplar 1 
100,0ps
ppm de Hg 
N
z
x


O IC para  é dado por: 
Número de 
exemplares 
Número de 
amostras 
Conc. de Hg 
ppm  
N
i xx
1
2)(
Dados sobre a determinação de teor de Hg em sete amostras de peixe 
Soma da soma dos quadrados = 0,2196 
Quantas medidas replicadas do exemplar 1 seriam necessárias para diminuir o intervalo de 
confiança de 95% para 0,07 ppm? 
Intervalos de confiança quando  é desconhecido 
Quando o número de dados é reduzido (experimentos muito longos ou que demandam 
muito gasto de reagentes) não se pode assumir que s é uma boa aproximação de . 
 
Neste caso, um único conjunto de resultados (medidas) deve fornecer a média e uma 
estimativa da precisão. Usamos t no lugar de z (parâmetro t de student) 
Para a média de N medidas: 
s
x
t


Ns
x
t
/


N
ts
x 
O IC para  é dado por: 
Valores de t para vários níveis de probabilidade 
Graus de 
liberdade 
Valor de t para o 
intervalo de confiança 
Um químico obteve os seguintes dados na determinação de álcool em 
sangue: 
0,084%, 0,089% e 0,079%. Calcule o intervalo de confiança para 95% 
para a média sabendo-se que: 
a) Não se conhece a precisão do método. 
b) De experimentos anteriores sabe-se que s   = 0,006%. 
Valores de t para vários níveis de probabilidade 
Graus de 
liberdade 
Valor de t para o 
 intervalo de confiança 
t = 4,30 para 2 graus de liberdade (N-1) e 
95% de IC. 
N
ts
x 
O IC para  é dado por: 
 a) s = 0,005 
IC (95%) para  é: 
3
005,030,4
084,0


012,0084,0 
b) O valor de  = 0,006, logo 
3
006,096,1
084,0


007,0084,0 
IC (95%) para  é: 
A tendência ou viés é característica de erros sistemáticos. 
Quando a média para um conjunto finito de medidas, , diverge de , o valor 
verdadeiro ou de referência, pode-se estimar se esta diferença se deve a um erro 
aleatório ou a um erro de método (sistemático). 
 
Isto pode ser feito comparando-se a diferença 
 
com a diferença que se esperaria para um determinado IC 
Prova para tendência ou viés 
x
N
st
x

 
Se , é provável a existência de viés. 
Se , nada se pode dizer sobre a existência de viés. 
N
st
x

 
N
z
x




Se o valor de  é conhecido usa-se a expressão: 
Exemplo 
Uma amostra de gasolina, que se sabia previamente apresentava um teor de enxofre 
de 0,123%, foi analisada por um novo método. Os resultados de quatro análises feitas 
para esta amostra usando o novo método deram em % de S: 0,112; 0,118; 0,115; 
0,119. Dizer se estes dados indicam a presença de viés (ou tendência). 
Como , é provável a 
 
existência de viés. 
Valores de t para vários níveis de probabilidade 
Graus de 
liberdade 
Valor t para o 
 intervalo de confiança 
x
N
st

0,116-0,123 = -0,007 0,005 
N
st
x

 
Cálculo para 95% de nível de confiança 
Qual seria o resultado para 99% de nível de confiança? 
Considere que, no exemplo anterior, se soubesse que o desvio padrão para um 
conjunto significativo de medidas fosse 0,0032% de S. Indique a existência de viés para 
99% de nível de confiaça. s =  
x
0,007 
Como 0,007 > 0,00413, a probabilidade de existência de viés é de 99%. 
Testes de rejeição de dados – Teste Q 
Que critério adotar para rejeitar um valor experimental que parece 
estar discrepante dos demais? 
Valores críticos de Q para 90% de nível de confiança 
Propagação de incertezas nas medidas 
Numa análise quantitativa, até se chegar ao resultado final, várias medidas são 
necessárias. Por exemplo, na determinação da concentração de ácido clorídrico 
com solução padrão de NaOH as seguintes etapas envolvendo medidas estão 
envolvidas: 
1) Massa do padrão primário (KHFt) usado na padronizaçãoda solução de NaOH 
2) Volume de NaOH gasto durante a titulação 
3) Volume de HCl pipetado para análise 
4) Volume de NaOH gasto na titulação 
Sabemos que 1 mol de KHFt é neutralizado por 1 mol de NaOH 
E que 1 mol de HCl é neutralizado por 1 mol de NaOH 
  NaOH
KHFt
KHFt VNaOH
MM
m

    NaOHHCl VNaOHVHCl 
 
NaOHKHFt
KHFt
VMM
m
NaOH


   
HCl
NaOH
V
VNaOH
HCl


Como se propagam os erros de cada medida experimental até o resultado final? 
Propagação de erros nos cálculos 
Tipo de cálculo 
Multiplicação ou divisão 
Exponencial 
Logarítmo 
Antilogarítmo 
Adição ou subtração 
Exemplo* Estimativa de desvio padrão de x 
* p, q, e r são variáveis experimentais cujas estimativas de desvio padrão são sp, sq e sr, respectivamente 
Algarismos significativos 
São os algarismos necessários para expressar o valor de uma grandeza determinada 
experimentalmente ou um resultado calculado, de modo que a incerteza esteja associada 
apenas ao último algarismo. 
0,0234 ou 0,234 ou 0,000234, ou 0,00234 – todos têm apenas 3 algarismos significativos 
1,200  0,003 – o valor 1,200 é resultado de uma medida, cuja incerteza está na última 
casa depois da vírgula, portanto, são 4 algarismos significativos. 
2,24 + 0,1231 = 2,36, resultado da soma tem o número de algarismos significativos do 
valor com menor número de algarismos significativos (o mesmo vale para a subtração) 
2,00 x 0,1111 = 0,222, resultado do produto tem o número de algarismos significativos do 
valor com menor número de algarismos significativos (o mesmo vale para a divisão)

Outros materiais