Baixe o app para aproveitar ainda mais
Prévia do material em texto
Físico-Química III Responsável pelo Conteúdo: Prof. Dr. Paulo Cezar Frangiosa Revisão Textual: Prof. Me. Luciano Vieira Francisco Introdução à Química Estatística Introdução à Química Estatística • Conhecer os conceitos mais importantes desta ciência e suas aplicações na Química; • Interpretar os diversos tipos de erro que afetam uma medida analítica; • Estudar as distribuições de frequências mais utilizadas em estatística aplicadas à Química; • Elucidar os testes de significância mais comuns, comparando-os. OBJETIVOS DE APRENDIZADO • A Estatística no Nosso Dia a Dia; • Tipos de Erros em Medidas Experimentais; • Erros Determinados ou Sistemáticos; • Tratamento Estatístico de Erros Aleatórios; • Intervalos de Confiança; • Regressão Linear. UNIDADE Introdução à Química Estatística A Estatística no Nosso Dia a Dia É praticamente impossível não nos depararmos, durante o nosso dia, com infor- mações em forma de gráficos, diagramas ou tabelas. Alguns de nós têm dificuldade em entender essas informações, uma vez que não são capazes de interpretar corre- tamente o que está descrito. Mas não há como fugirmos desta realidade: a estatística está presente em praticamente todas as áreas do conhecimento humano, impactan- do diretamente as ações que tomamos diariamante. Ela fornece aos cientistas as fer- ramentas estatísticas adequadas a uma interpretação crítica dos dados analíticos, por um lado, e disponibiliza ao cidadão uma maneira mais simples para compreender essa enxurrada de informações, por outro. No passado, lembra Moita (2010), as incertezas da vida humana eram marcadas a ferro e fogo em todas as culturas, principalmente quando o ser humano não com- preendia os fenômenos da natureza. Recorria-se normalmente aos deuses, orácu- los ou mesmo sonhos miraculosos como forma imediata para interpretar os fatos. A incerteza é condição própria da natureza humana, seja no passado ou atualmente. O que mudou foi a forma como avaliamos tais incertezas e as ferramentas disponí- veis naquele momento. De fato não há medida sem erros a ela associados, e esperar obter uma medida com certeza absoluta seria humanamente impossível. Assim, todas as áreas do conhecimento humano nos bombardeiam diariamente com dados e estatísticas. Atividades como a empresarial, bancária, econômica, mé- dica, política, agrícola, esportiva, de pesquisa, entre tantas outras, dependem desta ferramenta para sobreviverem. No ramo empresarial, a estatística colabora na medida em que possibilita a cons- trução de ferramentas que embasam a tomada de decisões e estimativas, facilitando o trabalho do empresário em organizar, dirigir e controlar melhor sua empresa, gerando melhores resultados. Por meio de programas de qualidade específicos para cada setor, eliminam-se desperdícios, ajustes de processos são minimizados, possibi- litando tomadas de decisões mais rápidas e, no conjunto, resultam em um aumento da satisfação do consumidor final. Pessoas utilizam a economia praticamente todos os dias, seja quando fazemos uma compra, em aplicações financeiras, em empréstimos ou financiamento de imóveis e veículos. Para tanto, utilizamo-nos de dados estatísticos para nos certificarmos que tomamos as melhores decisões econômicas e, a partir deste momento, tornamo-nos, também, uma estatística! Índices econômicos como oscilações do dólar, variações da bolsa de valores, tudo isso nos impacta diretamente. Na política, a estatística encontra-se presente, por exemplo, à época das eleições, quando analisamos antecipadamente as intenções de voto para os candidatos, seja por regiões, estados, faixa etária e gênero dos eleitores. Encerrada a votação, para quantificação dos resultados das urnas, uma enxurrada de dados e estatísticas nos são mostrados, em tempo real. Maravilha não é mesmo? 8 9 A estatística atua como uma interface para a área médica, auxiliando na identifi- cação dos problemas típicos de pesquisa clínica: o estudo da associação entre a ex- posição a um fator e o eventual desenvolvimento de uma doença; a comparação de opções terapêuticas e o estudo de fatores de prognóstico para pacientes submetidos a um dado tratamento. Modelagem de casos de dengue no Estado do Rio de Janeiro, malária no Amazonas, e mais recentemente a pandemia do corona vírus que se es- palhou por vários países nos cinco continentes, para citar apenas alguns exemplos, servem para melhorar as previsões espaço-temporais da incidência das doenças. Com estes dados, os responsáveis pela saúde nos estados e países podem alocar verbas de acordo com a expectativa do número de casos que eles vão apresentar. Neste panorama, destaca-se a Química como sendo uma ciência predominante- mente experimental. Muitas das atividades desempenhadas pelo profissional químico se desenvolvem em um laboratório, utilizando-se de medidas experimentais. E como não há medida sem erro, é necessário o apoio da ciência Estatística para o tratamen- to adequado dos resultados, por exemplo, para medidas de absorbância de amostras de águas de rios obtidas em um espectrofotômetro, ou ainda nos resultados obtidos na determinação de chumbo contido em amostra de sangue. Tipos de Erros em Medidas Experimentais Você é capaz de se lembrar de valores numéricos que aparecem no seu cotidiano? Nossa vida está repleta de números: massa de um pacote de farinha, temperatura corporal, distância até a praia, acompanhamento da perda de peso em uma dieta, média semestral desta dis- ciplina. A pergunta que se faz é: essas e outras medidas são precisas ou contêm incertezas? A rotina do profissional em Química não é diferente. Frequentemente, ele se de- para com medidas experimentais e várias operações matemáticas são utilizadas para interpretá-las. Todas elas contêm incertezas, que podem ser divididas em dois tipos: • Erros determinados ou sistemáticos (Es): aqueles que levam a resultados maiores ou menores que os valores reais; • Erros indeterminados ou aleatórios (Ea): aqueles que levam a variações em torno da média. O erro na média de um conjunto de repetições de medidas é, consequentemente, resultado da soma dos dois tipos de erros, sou seja: a s E E E= + (1) A ideia agora é discutir as incertezas nas medidas experimentais, que resultam das quatro operações matemáticas básicas, bem como os tipos de erros envolvidos nes- sas medidas e seus efeitos, bem como ferramentas para evitar ou avaliar esses erros. 9 UNIDADE Introdução à Química Estatística Algarismos Significativos Interessante se faz introduzir o conceito de algarismos significativos por meio do exemplo da Figura 1, que traz um lápis ajustado ao zero de uma régua com escala em centímetros e a outra extremidade do objeto não está coincidindo com nenhum traço. Obviamente a sensibilidade e precisão de todo instrumento de medida está limitada à sua fabricação e, muitas vezes, a leitura do valor de uma grandeza é inter- mediária a dois traços consecutivos da escala, como no caso em discussão. L medida cm Figura 1 – Algarismos significativos Fonte: Adaptado de Freepik Observa-se que o valor deste comprimento é 6 cm mais alguns décimos de cen- tímetro, mas não podemos afirmar com certeza o seu valor, apenas estimá-lo. Se duas pessoas apresentassem como resultado desta medida os valores 6,4 cm e 6,5 cm, notaríamos que houve concordância com relação ao algarismo 6, chamado de “verdadeiro” ou “exato”. Em contrapartida, os algarismos 4 e 5 são denominados “duvidosos”, por apresentarem uma incerteza devido à perícia do observador e à sensibilidade do instrumento. Por algarismos significativos entende-se tanto os algarismos exatos de uma medida como os algarismos duvidosos. Qualquer grandeza física escalar pode ser escrita na forma: ( )aA a s u= ± (2) Onde “a” é seu valor numérico, “sa” é a sua incerteza e “u” é a sua unidade. A medida de uma grandeza física ou química é sempre aproximada, por mais habilitado que seja o analista e por mais preciso que seja oequipamento utilizado. Esta limitação reflete-se no número de algarismos que usamos para representar as medidas, ou seja, devemos utilizar apenas os algarismos que temos certeza de esta- rem corretos, admitindo-se apenas o uso de um algarismo duvidoso. Analisemos a situação apresentada na Figura 2, que mostra a pesagem, em balança semianalítica, de uma substância química. O resultado da pesagem foi 357,43 g, de modo que os algarismos 3, 5, 7 e 4 são corretos ou verdadeiros, enquanto que e o algarismo 3 é duvidoso: 10 11 Figura 2 – Pesagem de substância química Fonte: Divulgação | Ohaus® Algumas observações devem ser feitas: • Os zeros são significativos somente se fizerem parte do número e não são sig- nificativos quando são indicativos da ordem de grandeza. Desta forma, os zeros situados a esquerda de outros dígitos não são significativos. Se quisermos repre- sentar 15 mg em gramas, escreveremos 0,015 g, que continua a ter apenas dois algarismos significativos. Analogamente, os valores 0,2125, 0,02125, 0,002125 e 0,0002125 têm, todos, quatro algarismos significativos, independente do núme- ro de zeros que existem à esquerda; • Zeros colocados à direita de outros dígitos somente são significativos se fizerem parte do resultado de uma medida. Se indicarem apenas a ordem de grandeza de um número, não são significativos. Por exemplo, se uma determinada pesa- gem fornece como resultado cinco gramas, e a análise foi feita com uma balança que fornece uma precisão de 0,1 g, deve-se representá-la por 5,0 g, 5.000 mg (miligramas) ou ainda 5.000.000 μg (microgramas); • O número de algarismos significativos independe do número de casas decimais. Assim, quando se quer expressar uma massa de 12,5521 g (quatro casas decimais) em miligramas, deve-se representá-la por 12552,1 mg (apenas uma casa decimal); • Arredondamento: Quando precisarmos fazer arredondamento de alguma medida, seguiremos a seguinte regra: se o último algarismo significativo for menor ou igual a 5 este é desprezado; quando o último algarismo significativo for maior que 5, soma- mos 1 unidade ao algarismo significativo anterior. Exemplificando, o valor 5,324 cm é arredondado para 5,32 cm, enquanto que 5,327 cm é arredondado para 5,33 cm. Algarismos Significativos em Cálculos Raramente um resultado experimental fornece diretamente a informação deseja- da pelo químico, tornando-se necessário realizar alguma operação matemática, como soma, subtração, divisão ou multiplicação. Quando isso ocorre, a incerteza no resultado do cálculo deve expressar as incertezas associadas a cada uma das medidas empregadas. Analisemos algumas situações que podem ocorrer no trabalho do profissional em química. veja a seguir. 11 UNIDADE Introdução à Química Estatística Adição e Subtração Uma amostra pesou 2,1 g numa balança cuja sensibilidade é 0,1 g e outra 0,1142 g quando pesada em uma balança analítica. Calcular a massa total das amostras, nestas condições: 2,1 0,1142 2,2142 xxx + O resultado a ser tomado deve ser 2,2 g, uma vez que o valor 2,1 apresenta a maior incerteza absoluta, na primeira casa decimal. Um pedaço de polietileno pesou 5,8 g numa balança cuja incerteza 0,1 g. Um pe- daço deste corpo foi retirado e pesado em uma balança analítica cuja massa medida foi de 2,6791 g. Calcular a massa do polietileno restante. 5,8 2,6791 3,1209 xxx - A massa do polietileno restante é 3,1 g. Importante! Adição e subtração: o resultado apresenta o número de casas decimais igual ao da medida com menor número de casas decimais. Multiplicação e Divisão a) Calcular a quantidade dos números de moles “n” existentes em 0,303 g de KCl. 0,303 74,5513 0,004064n N M n= ® = = A massa do sal possui três algarismos significativos e a massa molar apresenta seis algarismos significativos, portanto, o resultado deve apresentar apenas três alga- rismos significativos: 0,004064 = 0,00406 = 4,06.10-3. Importante! O resultado da operação deve apresentar o mesmo número de algarismos significati- vos da medida de menor certeza, ou seja, daquela que tem o menor número de alga- rismos significativos. 12 13 Precisão e Exatidão De acordo com Holler (2009), precisão e exatidão são dois termos extensiva- mente empregados nas discussões sobre a confiabilidade dos resultados. A Figura 3 ilustra um alvo onde são desferidos tiros por quatro pessoas diferentes. Imaginando se tratar de uma competição esportiva, em qual dos atiradores você apostaria? Exato e preciso Exato mas não preciso Preciso mas não exato Não preciso e não exato Centro do Alvo Repetitivo Exato Centro do Alvo Não Repetitivo Exato Centro do Alvo Repetitivo Inexato Centro do Alvo Não Repetitivo Inexato Figura 3 – Diferença entre precisão e exatidão Obviamente você deve ter apostado no atirador cujo alvo está mostrado no lado superior esquerdo! De fato, ele foi exato e preciso! Vamos então às definições. • Precisão: parâmetro que descreve a reprodutibilidade dos resultados, ou seja, a concordância entre os valores numéricos para duas ou mais médias replicadas ou entre medidas que foram feitas exatamente nas mesmas condições. Desta- cam-se três termos com significância estatística muito utilizados para descrever a precisão de um conjunto de repetições de dados analíticos: desvio padrão, variância e coeficiente de variação; • Exatidão: parâmetro que descreve quão correto é um resultado experimental, sendo definida como a proximidade entre o valor medido e o valor aceito ou ver- dadeiro. É um termo relativo e depende da necessidade do cientista e da dificul- dade do problema analítico enfrentado. Exemplificando, podemos colocar duas situações distintas: se um determinado método de análise forneceu um resultado para a concentração de mercúrio com exatidão de +/ –10%, ou uma parte por bilhão, em amostras de tecido de peixe que contêm 10 partes por bilhão do metal, consideraríamos uma exatidão razoável; por outro lado resultados que estão dentro de +/ –10% da quantidade correta de mercúrio em um minério que contém 15% do metal seriam considerados de inaceitável exatidão! A exatidão é expressa em termos do erro absoluto ou do erro relativo. O erro absoluto da média x de um pequeno conjunto de repetições de medidas é dado por: v E x x= - (3) 13 UNIDADE Introdução à Química Estatística Onde xv é o valor aceito no mundo real como sendo verdadeiro, para a quanti- dade medida. Uma vez que, dependendo das grandezas envolvidas, o erro absoluto pode não ser muito significativo, devemos empregar o erro relativo, Er: 100%v r v x x E x - = ´ (4) Tanto os erros absolutos quanto os erros relativos são expressos por um sinal: um sinal positivo indica que o resultado medido é maior do que seu valor verdadeiro, enquanto que um sinal negativo indica a situação oposta. Imaginemos que foram realizadas pesagens de uma amostra de NaCl para pre- paração de uma solução, utilizando-se três balanças diferentes, denominadas “a”, “b” e “c”. Em cada balança, repetiu-se cinco vezes a pesagem, sendo os resultados mostrados na Figura 4: (a) (b) (c) 16 17 18 19 20 21 22 Medidas precisas e exatas Xv (valor verdadeiro) Medidas precisas mas inexatas Medidas imprecisas e inexatas Figura 4 – Resultados experimentais obtidos por três métodos distintos (a, b, c) Fonte: Reprodução Considerando 17,60vx g= como o valor verdadeiro da massa da amostra analisada, podemos chegar a algumas conclusões importantes sobre a precisão e a exatidão. a) Qual é o erro absoluto obtido na balança “a”, sabendo-se que o valor médio x das determinações foi 17,60 g? 17,60 17,60 0,00 v E x x g= - = - = b) Qual é o erro absoluto da balança “b”, sabendo-se que o valor médio x das determinações foi 20,50 g? 20,50 17,60 2,90 v E x x g= - = - = c) Se a pressão medida em determinado experimento foi tal que P = 20 kg/cm2 e o erro absoluto cometido na leitura for de 5 kg/cm2, teremos um erro relativo tal que: 14 15 100% 5 20 0,25 25%v r v x x E ou x - = ´= = Importante! Enquanto o erro absoluto é independente do menor ou do maior valor da grandeza a medir, o erro relativo é grandemente dependente desse valor, revelando a precisão da medida feita. Erros Determinados ou Sistemáticos A maior preocupação dos profissionais em química que realizam uma medição é, naturalmente, a de tomar todas as precauções para minimizar os erros durante o experimento. Apesar disso, todas as medições analíticas são afetadas por um erro experimental devido a inevitáveis imperfeições nos aparelhos de medida ou às limita- ções referentes aos sentidos do analista, tais como a visão, audição, para citar apenas os mais importantes. Holler (2009) ensina que os erros sistemáticos apresentam um valor definido e uma causa determinável, sendo da mesma grandeza para repetições de medidas realizadas do mesmo modo. Para se evitar os erros sistemáticos, é preciso que haja um vasto estudo no momento anterior à realização da análise da amostra, devendo-se selecionar métodos analíticos adequados para a quantificação do analito, bem como o uso de reagentes que apresentem grau de pureza adequado ao método que o analista experiente empregará. Obedecidas estas condições prévias, os erros determina- dos podem ser minimizados, porém, dificilmente eliminados! A ideia é, então, avaliar e descontar tais erros, de modo que os resultados finais obtidos sejam bem próximos ao valor verdadeiro. Os erros sistemáticos podem ser de três tipos: instrumental, pessoal e de método. • Amostra: porção representativa da espécie ou composto a ser analisado; • Analito: componente da amostra que se deseja fazer uma determinação; • Interferente: é uma espécie que causa erro na análise pelo aumento ou diminuição da quantidade medida; • Matriz: são todos os demais componentes da amostra na qual o analito está contido; • Método: conjunto de operações e técnicas para analisar o composto de interesse; • Análise: mecanismo pelo qual são obtidas informações químicas ou físicas a respeito dos constituintes de uma amostra. 15 UNIDADE Introdução à Química Estatística Erros Instrumentais São causados pelo comportamento não ideal do instrumento usado para a aná- lise, que pode apresentar algum defeito ou estar descalibrado. Um exemplo clássico é a balança que, se não estiver calibrada, levará a resultados maiores ou menores do que o valor verdadeiro. É comum também ocorrer erros por falta de calibração de buretas, pipetas e balões volumétricos devido a defeitos de fabricação ou de uso inadequado dos mesmos. Isso faz com que os volumes contidos ou dispensados se- jam maiores ou menores do que os indicados nesses aparelhos. Nesses dois casos, a calibração de forma adequada resolveria o problema. Aparelhos eletrônicos, tais como o pHmetro e o espectrofotômetro também estão sujeitos a erros e precisam ser constantemente calibrados. Os erros sistemáticos instrumentais são facilmente detectados e corrigidos por calibração com padrões apropriados, de modo que fazer calibrações periódicas dos instrumentos é sempre desejável. Propiciam uma detecção antecipada dos fenôme- nos do desgaste, corrosão ou o tratamento inadequado dos equipamentos. Erros Pessoais Moita (2010) nos lembra que os erros pessoais estão associados ao analista, que pode não ter a habilidade necessária para a manipulação de um equipamento, seja para uma simples observação do menisco no ajuste do volume de uma bureta, pipeta ou balão volumétrico, ou ainda pela observação errônea da cor de uma solução, pois é necessário fazer a detecção da cor correta do ponto final de uma titulação. Com o objetivo de minimizar tais erros, o operador deve ser treinado para essas obser- vações e manipulações antes de iniciar a análise das amostras. A Figura 5 ilustra a leitura de volumes de soluções em provetas graduadas. Você concorda com as leitu- ras dos analistas? 11155555 115555 50000 45555 4000000 333555555 33300000000 22255555 22200000 5000 45555 444400000 3335555 33300000 22255555 222000 Volume = 37.3 mL Volume = 41.5 mL Figura 5 – Leitura de volumes de soluções em provetas graduadas Fonte: Reprodução Uma fonte quase universal de erro pessoal é o de pré-julgamento. A maioria de nós, não importa quão honestos sejamos, tem a tendência natural de estimar as leituras já sabendo, antecipadamente, qual deve ser o resultado da análise, seja por 16 17 ter alguma informação prévia sobre a amostra, ou por já ter realizado uma análise anterior semelhante. Assim, o analista força os resultados posteriores a coincidir com aquele que supõe que seja correto. A maioria dos erros pessoais pode ser minimi- zada pelo cuidado e pela autodisciplina, devendo o analista supor que seja sempre a primeira análise que está realizando, ou seja, não conhece a concentração do analito na amostra, por exemplo. Erros de Método Os erros de método são frequentemente introduzidos pelo comportamento não ideal, físico e químico, dos reagentes e da reação na qual uma análise é baseada. Ao se escolher um método, supõe-se que apenas o analito responda a esse método, sem considerar que podem existir outras espécies presentes na amostra (interferentes) que também reagem da mesma forma que o analito ou apresentam uma propriedade físico-química semelhante a ele. Desta forma, o resultado da análise não representará apenas o analito, mas também o interferente, levando a um valor maior que o valor verdadeiro para todas as replicatas. Para materiais simples, os padrões podem ser, às vezes, preparados por meio de misturas de quantidades conhecidas de compostos puros. Quando os materiais que estão sendo analisados são muito complexos, recorre-se a institutos ou empresas onde se comercializa uma variedade de materiais padrão de referência, especifica- mente preparados para a validação de métodos analíticos. Como exemplo, podemos citar o National Institute of Technology and Standards (Nist). Outro exemplo é o uso de um indicador inadequado em uma titulação, que pode levar a resultados analíticos maiores ou menores que o valor verdadeiro. O ideal seria um conhecimento prévio da constante de equilíbrio da reação, de modo que a escolha do indicador seja mais adequada. Tratamento Estatístico de Erros Aleatórios Quando mencionamos análise estatística de dados experimentais, o primeiro pa- râmetro que nos vem à mente é a média aritmética dos valores obtidos. É claro que esta informação é muito importante, porém é insuficiente. Devemos, portanto, considerar outras características importantes e, dentre elas, o desvio padrão “s” e o Coeficiente de Variação “CV” destacam-se. Função Gaussiana Na curva de distribuição normal gaussiana, a probabilidade será definida pela área de um intervalo escolhido sob análise. O cálculo da área envolve complexos cálculos algébricos, exigindo o uso de cálculo numérico. Felizmente, tais cálculos já foram parametrizados pelos estatísticos. Lembrando que a área total sob a curva é de 100%, de modo que podemos analisar a Figura 6: 17 UNIDADE Introdução à Química Estatística µ -4σ +4σ -3σ +3σ -4σ +2σ -1σ +1σ 68,26% 95,44% 99,73% 99,994% Figura 6 – Curva de Gauss Fonte: Acervo do conteudista A interpretação desta curva gaussiana nos diz que o intervalo compreendido entre a “média (μ) – 1 desvio-padrão (σ)” e a “média (μ) + 1 desvio-padrão (σ)” tem área (probabilidade) de 68,26%, e assim sucessivamente, até uma probabilidade de 99,994% para +/- 4σ. Uma característica importante da distribuição normal é que, quanto maior a amos- tragem, mais uniformemente as ocorrências se distribuem à medida que se afastam da média central. A medida desta uniformidade é o “desvio padrão”, um valor que quantifica a dispersão dos eventos sob distribuição normal, ou seja, a média das dife- renças entre o valor de cada evento e a média central. Histograma Um histograma é um método estatístico que mede determinada realidade con- creta. Por exemplo, pode ser útil para indicar o número de pessoas entre28 e 35 anos de idade de um país, a divisão de uma população segundo os diferentes grupos étnicos ou a distribuição de salários de funcionários de uma empresa. Os diferentes valores manipulados num histograma são registrados em coordenadas em forma de diagrama, tornando possível medir os intervalos de cada objeto de estudo. Assim, sempre que medidas analíticas são repetidas com uma mesma amostra, ob- tém-se uma dispersão de dados, tal como a mostrada na Tabela 1, resultado da presença de erros aleatórios ou indeterminados. Ela mostra valores de medidas de absorbância ob- tidas por um espectrofotômetro para 50 repetições de medidas de soluções avermelha- das obtidas pelo tratamento idêntico de amostras aquosas contendo 10 ppm de Fe (III). Tabela 1 – Repetições de medidas de absorbância Análise Absorbância Análise Absorbância Análise Absorbância 1 0,488 18 0,475 35 0,476 2 0,480 19 0,480 36 0,490 3 0,486 20 0,494 37 0,488 4 0,473 21 0,492 38 0,471 5 0,475 22 0,484 39 0,486 6 0,482 23 0,481 40 0,478 7 0,486 24 0,487 41 0,486 18 19 Análise Absorbância Análise Absorbância Análise Absorbância 8 0,482 25 0,478 42 0,482 9 0,481 26 0,483 43 0,477 10 0,490 27 0,482 44 0,477 11 0,480 28 0,491 45 0,486 12 0,489 29 0,481 46 0,478 13 0,478 30 0,469 47 0,483 14 0,471 31 0,485 48 0,480 15 0,482 32 0,477 49 0,483 16 0,483 33 0,476 50 0,479 17 0,488 34 0,483 – – Dados listados em ordem obtida Média 0,482 Máximo 0,494 – – Mediana 0,482 Mínimo 0,469 – – Desvio Padrão 0,0056 Faixa 0,025 – – Fonte: HOLLER, 2009 Ao passo que o número de medidas aumenta, obtém-se um histograma cuja curva apresenta formato contínuo, identificada como a curva B na Figura 7. Observe que o histograma não é perfeitamente simétrico, porém, a grande maioria das medi- das de absorbância encontra-se em torno do valor médio de 0,482, apresentando um número reduzido de medidas muito maior ou muito menor que o valor médio. A inspeção visual do histograma com a distribuição da variável em questão indica que a variável estudada tem uma distribuição próxima à distribuição normal. Po rce nt ag em de m ed id as μ A B 0% 0,469 0,471 0,472 0,474 0,475 0,477 0,478 0,480 0,481 0,483 0,484 0,486 0,487 0,489 0,490 0,492 0,493 0,495 5% 10% 15% 20% 25% 30% Figura 7 – (A) Histograma mostrando a distribuição das absorbâncias; (B) Curva gaussiana para os dados com mesma média e mesmo desvio padrão Fonte: Adaptado de HOLLER, 2009 Observe que nem toda distribuição tende a ser simétrica em torno da média. Um exemplo é a distribuição dos números sorteados da Mega-Sena. A distribuição, neste caso, é uniforme, pois todos os sessenta números têm a mesma chance de ocorrer. Distribuição T de Student Moita (2010) esclarece que a distribuição normal permanece sendo um modelo te- órico para uma série de medidas que se distribuem em torno de uma média, porém, 19 UNIDADE Introdução à Química Estatística quando desejamos utilizar esta distribuição teórica para obter propriedades estatísticas do sistema, esbarrarmos nas limitações dos sistemas analíticos. As pequenas quantidades de medidas obtidas nos sistemas químicos fogem dos pressupostos teóricos da curva nor- mal para o qual o valor de N deve ser muito grande ou infinito. Um conjunto de outras distribuições, baseado na mesma curva normal, foi desenvolvido para quando o valor de N é pequeno. Esta família de distribuições é denominada distribuição t de Student e tem uma fórmula matemática um pouco mais complicada que a curva normal. Aplicações Estatísticas O Quadro 1 nos mostra um resumo das fórmulas constantemente utilizadas quan- do se pretende avaliar estatisticamente qualquer tipo de dado experimental. Como vimos, tais fórmulas são extremamente úteis na determinação de erros absolutos ou relativos, médias das populações de dados, variância e desvio padrão das medidas de uma determinada análise química, bem como ferramentas para a construção de histogramas. Quadro 1 – Fórmulas estatísticas importantes Número de medidas N Valor da i-ésima medida i x Média da população (ou referência) m Erro absoluto vE x x= - Erro relativo vr v x x E x - = Média aritmética 1 2 1... n in i xx x x x n n =+ + += = å Média ponderada 1 1 2 2 1 2 1 1 ... ... n n p n n i ii p n ii x p x p x p M p p p x p M p = = + + + = + + + = å å Variância 2 22 12 1 ( )( ) 1 1 i nn iii x nxx x s n n == -- = = - - åå 20 21 Desvio padrão 2( ) 1 i x x s n å - = - Coefi ciente de variação 100%CV s x= × Função de distribuição normal 2 2 ( ) 2 2 1 ( ) 2 x f x e m s ps - - = Suponhamos, por exemplo, que os seguintes resultados foram obtidos nas repeti- ções de determinação de chumbo contido em uma amostra de sangue: 0,752, 0756, 0,752, 0,751 e 0,760 ppm de Pb. Para calcular a média, desvio padrão e o coeficiente de variação para os dados, procederíamos da seguinte forma: Etapa 1: tabular os dados obtidos nas análises Tabela 2 Amostra ix 2 i x 1 0,752 0,565504 2 0,756 0,571536 3 0,752 0,565504 4 0,751 0,564001 5 0,760 0,577600 – 3,771ixå = 2 2, 844145 i xå = Etapa 2: calcular a média aritmética dos dados por meio desta equação: 1 2 1 ... 3,771 5 0,7542 n n i i x x x x x ppm Pb n n =+ + + å= = = = Etapa 3: calcular o desvio padrão, s: 2( ) 2,844145 2,8440882 0,0000568 1 5 1 4 0,00377 i x x s n s ppmdePb å - - = = = = - - = Etapa 4: calcular o Coeficiente e Variação, CV: 0,00377 100% 100% 0,5% 0,7542 CV s x= × = ´ = 21 UNIDADE Introdução à Química Estatística Intervalos de Confiança Holler (2009) ensina que, na maioria das situações que nos deparamos em análi- ses químicas, o valor verdadeiro da média, “μ”, não pode ser determinado em razão do grande número de medidas que seria necessário. Felizmente, por meio da estatís- tica, é possível estabelecer um valor ao redor da média “x ” determinado experimen- talmente, dentro do qual se espera encontrar a média da população “μ” com certo grau de probabilidade. Trata-se do intervalo de confiança. O intervalo de confiança é importante para indicar a margem de incerteza (ou imprecisão) frente a um cálculo efetuado, e utiliza a amostra do estudo para estimar o tamanho real do resultado na população de origem. Importante! Quanto mais estreito for o intervalo de confiança, maior é a probabilidade de a por- centagem da população de estudo representar o número real da população de origem, resultando em uma certeza maior! O tamanho do intervalo de confiança é calculado a partir da estimativa do desvio padrão da amostra, desde que seja conhecido. Se consideramos o parâmetro “z” como o desvio da média normalizada ao desvio padrão da população, conforme ilustrado na Figura 7, a partir da qual construiu-se a Tabela 3, podemos escrever: x z m s - = (5) Sendo “z” uma boa estimativa de σ! Por exemplo, se temos um resultado “x” a partir de um conjunto de dados com um desvio padrão “σ”, podemos considerar que 90 vezes em 100 a média verdadeira “μ” cairá no intervalo de 1,64x s± . Tabela 3 – Níveis de confiança para vários valores de z Nível de confiança, % z 50 0,67 68 1,00 80 1,28 90 1,64 95 1,96 95,4 2,00 99 2,58 99,7 3,00 99,9 3,29 Fonte: HOLLER, 2009 Podemos escrever uma equação geral para o intervalo de confiança IC baseada no valor da média experimental x para “N” medidas como: 22 23 z IC x N s = ± (6) Analisemos a situação em que um químico obteve os seguintes dados para a porcentagem de álcool contido em uma amostra de sangue: % etanol (C2H5OH) = {0,084, 0,089 e 0,079}. Sabe-se que, a partir da experiência prévia com centenas de amostras, o valor de z = 0,005% de etanol, que é uma boa estimativa de σ. Se quisermos calcular o IC a 80 e 95% para a média, procederíamos como se segue: • Etapa 1: calcular a média aritmética dos dados por meio da equação: 1 2 1 ... 0, 084 0,089 0,079 , 0,084% 3 n in i xx x x x x n n =+ + + + += = = =å • Etapa 2: aplicar na fórmula de IC, utilizando-se os valores de “z” da Tabela 4.1,28 0,0050 80% 0,084 0,084 0,004% 3 1,96 0,0050 95% 0,084 0,084 0,006% 3 IC IC ´ = ± = ± ´ = ± = ± Regressão Linear Calibração de um Método Instrumental A maioria dos métodos analíticos baseia-se em uma curva analítica na qual uma quantidade média “y” (variável dependente) é representada em um gráfico como uma função de uma concentração conhecida “x” (variável independente) de uma série de padrões. Suponhamos que desejemos determinar a concentração de isoctano em amostras de hidrocarbonetos. A Figura 8 representa uma curva analítica típica cons- truída a partir de análises cromatográficas para concentrações variáveis de soluções de isoctano. Neste exemplo, temos a ordenada “y” como sendo a área sob a curva do pico cromatográfico e a abscissa “x” como sendo a concentração de isoctano em mol%. A situação em análise ilustra um caso típico de curva de calibração! Importante! Para um correto uso da regressão linear, é necessário definir qual será a variável depen- dente e qual será a independente. A variável dependente da sua análise é a medida que dependerá de uma outra variável, geralmente é o que você deseja descobrir ou predizer. Já a variável independente (a medida não depende de nenhuma outra variável) é o fator que se suspeita impactar a variável dependente. 23 UNIDADE Introdução à Química Estatística Resíduo = yi – (mxi + b) 0 0 0,5 y, Ár ea do pi co , u ni da de s a rb itr ár ia s x, Concentração de isoctano, mol % 1,0 1,0 2,0 3,0 4,0 y x 5,0 1,5 2,0 Figura 8 – Curva de calibração para determinação de isoctano em uma mistura de hidrocarbonetos Fonte: Adaptado de HOLLER, 2009 Observamos que o gráfico se aproxima de uma linha reta, mas nem todos os dados situam-se sobre a reta, resultado dos erros aleatórios já comentados. A regres- são linear entra justamente nesse ponto: ela fornece um meio de se obter a melhor linha reta que contempla todos os pontos. Feito isso, poderemos usar o resultado da função dessa linha para estimar valores futuros, ou seja, o que acontecerá com “y” baseado no valor de “x”? Consideraremos aqui apenas o método dos mínimos quadrados, básico para dados bidimensionais. Método dos Mínimos Quadrados Duas considerações são feitas no uso do método dos mínimos quadrados: a) Existe uma relação verdadeiramente linear entre a resposta medida “y” e a concentração analítica do padrão “x”, de modo que podemos escrever o modelo de regressão da seguinte forma: y ax b= + (7) Em que “b” é o intercepto em “y” (o valor de y quando x for igual a zero) e “a” é a inclinação da linha. b) Consideramos que qualquer desvio e pontos individuais da linha reta é decor- rente de erros na medida, ou seja, não há erros nos valores de “x” ou concentrações. 24 25 • Uma questão surge: traçar uma reta observando apenas esses pontos torna-se uma tarefa subjetiva, ou seja, obter os valores de “a” e “b” fica na dependência do analista que está realizando o procedimento, podendo variar de um para ou- tro. Pensando justamente nisso, criou-se o método dos mínimos quadrados, por meio do qual o mesmo conjunto de pontos experimentais resultará na mesma reta, independentemente de quem está fazendo o tratamento de dados. Considerando uma regressão linear simples, os coeficientes “a” e “b” podem ser calculados pelas equações que se encontram na Figura 9: 2 2 ( ) ( ) ( ) y b x n x y xy n x x n − ⋅ − − ∑ ∑ ∑ ∑∑ ∑∑ a = b = Figura 9 – Valores da inclinação da reta (a) e do intercepto (b) Se voltarmos ao exemplo mostrado na Figura 8, que representa a curva analítica para a determinação cromatográfica de isoctano em uma mistura de hidrocarbonetos e, por exemplo, uma área de pico de 2,65 fosse obtida para uma determinada amos- tra analisada, como calcularíamos a porcentagem molar de isoctano? A resposta pode ser obtida empregando-se a Equação 7, que vimos anteriormente: y ax b= + que, rearranjada, resulta em ( )x y b a= - . Os valores de “a” e “b” são obtidos diretamente a partir da reta vista na Figura 8, ou por meio das equações mostradas da Figura 9 sendo que, em cada caso, a con- centração desconhecida é encontrada a partir do rearranjo da equação dos mínimos quadrados para a linha que fornece: x = (y – 0,2567) / 2,0925 e como y = 2,65, resulta em: x = (2,65 – 0,2567) / 2,0925 = 1,144 mol% Coeficiente de Correlação Para uma reta ser usada como curva de calibração, o coeficiente de correlação linear, “r” deve ser maior ou igual a 0,999, lembrando que tal valor não pode ser aproximado para r = 1, pois daria uma ideia errônea de que todos os pontos esta- riam sobre a reta. A Figura 10 mostra uma reta cujo valor de r é +1. Nesta situação 25 UNIDADE Introdução à Química Estatística hipotética, todos os pontos experimentais encontram-se perfeitamente alinhados, com inclinação positiva, e diz-se que há uma perfeita correlação positiva entre as variáveis x e y. r = 1 Va riá ve l y 12 10 8 6 4 2 1 2 3 4 5 6 Variável x Figura 10 – Correlação linear perfeita Fonte: Reprodução Para qualquer aplicação analítica da reta faz-se necessário o conhecimento dos valores de “a” e “b” da Equação 7. Sendo xi e yi os valores individuais para as vari- áveis “x” e “y”, para cada ponto, e x e y as respectivas médias de cada variável, o coeficiente de correlação linear “r” pode ser calculado por: 1 2 2 1 1 ( )( ) ( ) ( ) n i i i n n i i i i x x y y r x x y y = = = - - = é ù é ù ê ú ê ú- -ê ú ê ú ë û ë û å å å (8) 26 27 Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Livros Estatística sem mistérios BUNCHAFT, G.; KELLNER, S. R. O. Estatística sem mistérios. v. I. 2. ed. Petrópolis, RJ: Vozes, 1998. Estatística básica BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva 2006. Leitura Estatística aplicada à química: dez dúvidas comuns https://bit.ly/3iEYRef Instituto Brasileiro de Geografia e Estatística (IBGE) https://bit.ly/32B0C6C 27 UNIDADE Introdução à Química Estatística Referências ATKINS, P. W. Princípios de Química: questionando a vida moderna e o meio. 5. ed. Porto Alegre, RS: Bookman, 2012. ________; DE PAULA, J. Físico-Química. v. 1. 9. ed. Rio de Janeiro: LTC, 2012a. ________. Físico-Química. v. 2. 9. ed. Rio de Janeiro: LTC, 2012b. BROWN, L. S. Química geral aplicada à engenharia. 3. ed. São Paulo: Cengage Learning, 2014. FIOROTTO, N. R. Físico-Química: propriedades da matéria, composição e trans- formações. São Paulo: Erica, 2014. HOLLER, F. J.; SKOOG, D. A.; CROUCH, S. R. Princípios de análise instrumental. 6. ed. Porto Alegre, RS: Bookman, 2009. KOTZ, J. C.; TREICHEL JR, P. Química geral e reações químicas. v. 2. 4. ed. Rio de Janeiro: Cengage Learning, 2002. MOITA, G. C.; MOITA NETO, J. M. Estatística aplicada à Química. Teresina, PI: EDUFPI, 2010. MOORE, W. J. Physical chemistry. 4th ed. London: Prentice-Hall, 1963. RUSSEL, J. B. Química geral. v. 1. 2. ed. São Paulo: Makron Books, 1994. TRO, N. J. Química – uma abordagem molecular. v. 2. 3. ed. Rio de Janeiro: LTC, 2017. 28
Compartilhar