Tratamento estatístico de dados

•

UNB

3

0

3

0

Fernanda Barros Nunes

25.03.2016

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 76 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Química Analítica Qualitativa e Quantitativa

352 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

TRATAMENTO E ANÁLISE
ESTATÍSTICA DE DADOS
Determinação de incerteza, validação de métodos e testes de
significância
QUÍMICA ANALITICA 2
Profa. Valéria R. Bellotto
VALIDAÇÃO: é o processo onde se verifica se
um procedimento analítico rende resultados
aceitáveis para a finalidade que se propõe.
ERROS EM ANÁLISE QUÍMICA
Medidas experimentais sempre apresentam algumas variações, logo
nenhuma conclusão pode ser tirada com certeza absoluta.

A estatística fornece ferramentas que possibilitam ACEITAR CONCLUSÕES
COM UMA GRANDE PROBABILIDADE DE ESTAREM CORRETAS E REJEITAR
CONCLUSÕES QUE SEJAM IMPROVÁVEIS.
Se um experimento é repetido várias vezes, e se os erros são puramente
aleatórios, então os resultados tendem a se agrupar simetricamente em
torno de um valor médio.

Quanto mais vezes o experimento for repetido, mais os resultados se
aproximam de uma curva idealmente suave, chamada DISTRIBUIÇÃO
GAUSSIANA.
CURVA GAUSSIANA
Gráfico de barras e curva Gaussiana descrevendo o tempo de vida de um conjunto
hipotético de lâmpadas elétricas (fonte: Harris, 2007)
DESVIO PADRÃO DA POPULAÇÃO
DESVIO PADRÃO DA AMOSTRA
n-1 é o número de graus de liberdade
Usado normalmente como estimativa da incerteza das medidas
Incerteza da medida em métodos clássicos
Em métodos clássicos a incerteza pode ser obtida
por cálculos de propagação de erro e pelo desvio
padrão de resultados obtidos por meio de replicatas
autênticas. No caso de mreplicatas, obtêm-se sxo por:

1
)(
1
2





m
xx
s
m
i
i
xo

(1)

onde
x
é a média das concentrações e xié o valor
individual de cada replicata.
Incerteza para uma estimativa da concentração
utilizando uma curva analítica
Métodos de regressão utilizam uma curva analítica
para estimar a concentração da espécie de interesse.
Nestes casos, obtêm-se sxo por:






n
i
i
xy
xo
xxb
yy
nmb
s
s
1
22
2
0
)(
)(11
(2)

onde, b é o coeficiente angular, n é o número de
padrões utilizados na construção da curva, m o número
de replicatas (amostras),
0
y
é a média do valor da
medida instrumental para a amostra, y é a média das
medidas instrumentais para os padrões da curva
analítica,
x
é a média das concentrações dos
padrões e xi a concentração do padrão i. O valor det95,ν
é tabelado da distribuição t-Student com νgraus de
liberdade.
Para uma curva de adição de padrão o valor de m é
igual a 1 e o valor de yoé igual a zero, pois não existe
medida instrumental para a amostra. Assim, a
incerteza é calculada como:





n
i
i
xy
xo
xxb
y
nb
s
s
1
22
2
)(
1
(3)

Para as equações (2) e (3), sy/x é o desvio-padrão
dos resíduos da curva analítica:
2
)ˆ(
1
2





n
yy
s
n
i
ii
xy

(4)
ondeyi e
iyˆ
são os valores instrumentais medidos e
estimados pela curva analítica, respectivamente.

DESVIO PADRÃO COMBINADO
Se temos vários subconjuntos de dados, podemos ter uma estimativa melhor do
desvio padrão da população pela combinação dos dados do que usando cada
conjunto individualmente.
O desvio padrão combinado é uma média ponderada das estimativas individuais.
INTERVALO DE CONFIANÇA
A estatística permite estabelecer um intervalo ao redor da média X
determinada experimentalmente, no qual se espera que a média μ
esteja contida com uma certa probabilidade.
Este intervalo é conhecido como intervalo de confiança e é
calculado a partir do desvio padrão.

A amplitude do intervalo de confiança depende de quão bem o
desvio padrão da amostra (s) estima o desvio padrão da população
(σ).
INTERVALO DE CONFIANÇA
INTERVALO DE CONFIANÇA
INTERVALO DE CONFIANÇA
INTERVALO DE CONFIANÇA
Determinação de IC quando σ é conhecido ou quando s é uma
boa estimativa de σ
IC para μ = x ± z σ
Com estimativa da média com uma única medida
Usando a média experimental ( x) de N medidas como estimativa do melhor valor de μ
IC para
INTERVALO DE CONFIANÇA
Determinação de IC quando σ não é conhecido - isto ocorre
quando se tem um pequeno conjunto de dados
O valor de s calculado a de um pequeno conjunto de dados pode ser
bastante incerto. Assim, intervalos de confiança mais amplos são
necessários, quando precisamos utilizar um valor de s, calculado com
um pequeno número de medidas, como estimativa de σ.
usamos Em lugar de z
Com estimativa da média com uma única medida
INTERVALO DE CONFIANÇA
Usando a média experimental ( x) de N medidas como estimativa do
melhor valor de μ
O intervalo de confiança para a média experimental ( x) de N réplicas de medidas
pode ser calculado a partir de t pela equação:
IC para
TESTES DE HIPÓTESES
Servem de base para a tomada de decisões em trabalhos
científicos e de engenharia.
Testes usados com maior frequência em química analítica,
comparação:
1- média de um conjunto de dados experimentais com o valor
verdadeiro ;
2- média com valor previsto ou de corte (limite);
3- média ou desvio padrão de dois ou mais conjuntos de dados.

E ainda, detecção de erros grosseiros.
TESTES DE HIPÓTESES
Hipótese nula (H0): postula que duas ou mais quantidades
observadas são iguais.

Hipótese alternativa (Ha): uma ou mais quantidades observadas
são diferentes.

Normalmente, trabalha-se com probabilidade de 95%. Isto é, se
a diferença observada for maior ou igual à diferença que
ocorreria 5 vezes em 100, devido à fatores aleatórios (nível de
significância de 0,05), a hipótese nula é rejeitada e a diferença é
considerada significativa.

Nível de confiança (NC) é a probabilidade de que a média
verdadeira esteja localizada em um certo intervalo.

Nível de significância é a probabilidade de um resultado estar
fora do intervalo de confiança

TESTES DE HIPÓTESES
TESTES DE HIPÓTESES
Pode-se adotar outros níveis de significância, dependendo da
exatidão desejada no julgamento – 0,01 (1%) ou 0,001 (0,1%).

Nível de significância na forma de fração: α ex.: 0,05

Nível de confiança (NC) = (1- α) x 100% ex.: 95%

TESTES DE HIPÓTESES
Apresentar a hipótese nula (H0):
H0: μ=μ0
Formular o teste estatístico:
Para grandes amostras (z): 0

Para pequenas amostras (t):

Comparação de uma média de um valor experimental com
um valor conhecido
0
TESTES DE HIPÓTESES
Determinar a hipótese alternativa (Ha):

Teste de duas caudas
Para Ha : μ≠μ0 , rejeitar H0 se z (ou t) ≥ zcrit ( ou tcrit) ou z (ou t)≤ - zcrit ( ou - tcrit)
Para NC=95% a probabilidade é de 0,025 de cada lado

Teste de uma cauda
Para Ha : μ>μ0 , rejeitar H0 se z (ou t) ≥ zcrit ( ou tcrit)

Para Ha : μ<μ0 , rejeitar H0 se z (ou t) ≤- zcrit ( ou -tcrit)

Para NC=95% a probabilidade é de 0,05 somente de um lado, e a
probabilidade total em ambas as caudas é de 10%.
Comparação de uma média de um valor experimental com
um valor conhecido
Exemplo:
Uma classe de 30 alunos determinou a energia de ativação de
uma reação química como 27,7 kcal/mol (valor médio), com
um desvio padrão de 5,2 kcal/mol.

Pergunta-se: os dados estão de acordo com o valor de 30,8
kcal/mol descrito na literatura em um nível de confiança de
95% ?
Teste de duas caudas
H0= x =μ0
Para Ha : x ≠μ0 , rejeitar H0 se z ≥ zcrit ou z ≤ - zcrit
Para NC=95% a probabilidade é de 0,025 de cada lado0 = 27,7 – 30,8 = -3,26
5,2 √30
zcrit = -1,96 z= - 3,26

como z ≤ - zcrit

Rejeitamos a hipótese nula ao nível de confiança de 95%.

Conclusão: a média obtida pelos estudantes é realmente diferente da média
descrita na literatura e não apenas resultado de erros aleatórios.

Zcrit
Comparação de duas médias experimentais- Teste t para
diferença de médias
TESTES DE HIPÓTESES
Se as variâncias forem iguais:
O número de graus de liberdade para encontrar o valor crítico de t
na tabela é N1+N2-2
Teste t para dados pareados
TESTES DE HIPÓTESES
Exemplo de aplicação: comparação de dois métodos empregando as mesmas
amostras.

Os testes t pareados usam o mesmo tipo de procedimento que o teste t
normal, exceto que são analisados pares de dados.
O desvio padrão agora é o desvio padrão da diferença nas médias.
A hipótese nula é H0: μd =Δ0 em que Δ0 é um valor específico da diferença a ser
testado, frequentemente zero.
Erros nos Testes de Hipóteses
TESTES DE HIPÓTESES
Em um nível de confiança de 95 %, por exemplo, existem 5% de chance de
rejeitarmos a hipótese nula, embora ela possa ser verdadeira.

O erro que resulta da rejeição de H0 quando esta é verdadeira é chamado
ERRO TIPO I
Em algumas áreas da ciência, um erro tipo 1 é chamado de falso negativo.

Outro tipo de erro possível consiste em aceitar H0 quando ela é falsa. Esse
erro é denominado de ERRO TIPO II (β) e é denominado de falso positivo em
algumas situações.

Quando se pensa em erros dos testes de hipótese é importante se considerar
as consequências de cometer erros tipo I ou tipo II.
Se for muito mais provável que o erro tipo I tenha consequências mais sérias
que um erro tipo II, é aconselhável escolher uma valor pequeno para α.
ANÁLISE DE VARIÂNCIA (ANOVA)
TESTES DE HIPÓTESES
É usada para se testar se existe diferença nas médias de mais de dois conjunto de dados
- comparação múltipla.

Exemplos típicos da aplicação da ANOVA:

1- Existe diferença nos resultados de cinco análises para determinar cálcio por meio de
um método volumétrico?
2- Quatro solventes com composições diferentes terão influência no rendimento de
uma síntese química?
3- Os resultados da determinação de manganês realizada por três métodos analíticos
distintos são diferentes?
O teste estatístico básico usado pela ANOVA é o F. Aqui , um valor grande de F,
comparado com o valor crítico descrito nas tabelas, pode fornecer a razão para rejeitar
H0.
TESTES DE HIPÓTESES
TESTE F
- Usado para comparação de variâncias (ou desvio padrão) de duas populações
(comparação de precisão).

- Usado para se testar se existe diferença nas médias de mais de dois conjunto de dados
- comparação múltipas na análise de regressão linear.

O teste F está baseado na hipótese nula de que as variâncias das duas populações
consideradas sejam iguais, H0 : σ1
2 = σ2
2 .

O teste estatístico F, que é definido como a razão entre as duas variâncias das amostras
(F= s1
2 / s2
2 ), é calculado e comparado com o valor crítico de F em um determinado
nível de confiança. A hipótese nula é rejeitada se o teste estatístico difere muito de 1.
Maior variância sempre no numerador
DETECÇÃO DE ERROS GROSSEIROS
TESTE Q
Existem situações quando um conjunto de dados contém um resultado anômalo que
parece estar fora da faixa definida pelos erros aleatórios associada ao procedimento.

O teste Q é um teste estatístico simples, amplamente utilizado para se decidir se um
resultado suspeito deve ser mantido ou rejeitado.

Neste teste, o valor absoluto da diferença entre o resultado questionável xq e seu
vizinho mais próximo xp é dividido pela faixa f do conjunto inteiro para dar a grandeza
Q.
Essa razão é comparada com o valor crítico Q crit (tabela
a seguir).
Se Q for maior que Q crit , o valor questionável deve ser
eliminado (rejeitado), com o grau de confiança
indicado.