Baixe o app para aproveitar ainda mais
Prévia do material em texto
Alexandre Schuler Décima Edição 2010 Alexandre Ricardo Pereira Schuler Departamento de Engenharia Química Universidade Federal de Pernambuco CCCCONTROLE ONTROLE ONTROLE ONTROLE EEEESTATÍSTICOSTATÍSTICOSTATÍSTICOSTATÍSTICO Décima Edição 2010 Controle Estatístico - Introdução - Alexandre R. P. Schuler. SUMÁRIO CAPÍTULO 1 – INTRODUÇÃO, 1 1.1. Histórico, 1 1.2. Definições fundamentais, 1 1.3. Objetivos, 2 1.4. Erros e Incertezas em Química Analítica, 3 CAPÍTULO 2 – OPERAÇÕES COM NÚMEROS EXPERIMENTAIS, 9 2.1. Generalidades, 9 2.2. Regras de arredondamento, 9 2.3. Algarismos significativos, 10 2.4. Operações com números experimentais, 10 CAPÍTULO 3 – O USO DE GRÁFICOS EM QUÍMICA ANALÍTICA, 12 3.1. Introdução, 12 3.2. Gráficos de Calibração, 12 3.3. Interpolação e Extrapolação, 13 3.4. Determinação do Ponto de Inflexão, 14 3.5. Regressão Linear, 15 3.6. Gráficos de Barras, 19 CAPÍTULO 4 – FUNDAMENTOS DA ESTATÍSTICA, 20 4.1. Probabilidade, 20 4.2. Distribuição de probabilidade, 22 4.3. Distribuição binomial, 23 4.4. Distribuição de Poisson, 25 4.5. Distribuição hipergeométrica, 25 4.6. Probabilidade Estatística, 26 4.7. Erros estatísticos, 26 4.8. Distribuição gaussiana, 27 4.9. Estimativa do valor médio, 29 4.10. Estimativa da dispersão, 30 CAPÍTULO 5 – CONTROLE DE QUALIDADE ANALÍTICA, 31 5.1. Introdução, 31 5.2. Parâmetros e Testes Estatísticos, 31 5.3. Estatística Simplificada, 38 Controle Estatístico - Introdução - Alexandre R. P. Schuler. 5.4. Número Ideal de Medições, 38 5.5. Diferença Máxima Permitida entre duas medições, 40 5.6. Avaliação estatística de um método analítico, 42 5.7. Avaliação estatística de uma amostra, 46 5.8. Avaliação estatística na preparação de soluções, 47 5.9. Confiabilidade analítica, 49 5.10. A expressão do resultado analítico, 49 5.11. Laboratórios de referência, 50 CAPÍTULO 6 – GRÁFICOS DE CONTROLE, 51 6.1. Finalidades, 51 6.2. Especificação, 51 6.3. O tamanho da amostra, 53 6.4. Procedimentos de amostragem, 54 6.5. Frequência de amostragem, 55 6.6. Capacidade de um processo e de uma máquina, 56 6.7. Tipos de gráfico de Controle, 57 CAPÍTULO 7 – INSPEÇÃO DA QUALIDADE, 6 8 7.1. Inspeção completa versus inspeção por amostragem, 68 7.2. Inspeção de atributos e inspeção de variáveis, 68 7.3. Não-conformidade, 69 7.4. Níveis de risco, 69 7.5. Números e percentuais de aceitação e de rejeição, 70 7.6. A Curva Característica de Operação, 70 CAPÍTULO 8 – PLANOS DE INSPEÇÃO, 73 8.1. Introdução, 73 8.2. Tamanho do Lote, 73 8.3. Nível de Inspeção, 74 8.4. Regime de Inspeção, 74 8.5. Tamanho da Amostra, 74 8.6. Procedimentos de Amostragem, 75 8.7. Escolha do Plano de Amostragem, 79 CAPÍTULO 9 – GESTÃO PARA A QUALIDADE, 82 9.1. Introdução, 82 9.2. Modelos de Gestão, 82 9.3. Estrutura Básica dos Modelos de Gestão, 83 Controle Estatístico - Introdução - Alexandre R. P. Schuler. BIBLIOGRAFIA CONSULTADA, 97 APÊNDICE 1 – AVALIAÇÃO DO FINAL DA REGIÃO LINEAR, 99 APÊNDICE 2 – AUXÍLIO DO COMPUTADOR, 111 APÊNDICE 3 – DESENHANDO GRÁFICOS NO COMPUTADOR, 115 APÊNDICE 4 – APROXIMANDO A BINOMIAL DA GAUSSIANA, 117 APÊNDICE 5 – ENTENDENDO A ESTATÍSTICA, 122 APÊNDICE 6 – TESTE DE NORMALIDADE, 130 APÊNDICE 7 – METROLOGIA, 137 APÊNDICE 8 – VALIDAÇÃO DE MÉTODOS ANALÍTICOS, 139 APÊNDICE 9 – QUANTIFICANDO A CAPACIDADE DE UM PROCESSO, 142 APÊNDICE 10 – GC: ESTUDO DE CASOS, 145 APÊNDICE 11 – GC’s: UMA ANÁLISE MAIS DETALHADA, 148 APÊNDICE 12 – MAIS DETALHES SOBRE A CCO, 165 APÊNDICE 13 – UMA PLANILHA EXCEL PARA CCO, 172 APÊNDICE 14 – AS SETE FERRAMENTAS DA QUALIDADE, 174 APÊNDICE 15 – ANÁLISE DE VARIÂNCIA, 179 APÊNDICE 16 – TQM versus GEIQ, 185 APÊNDICE 17 – TABELAS ÚTEIS, 187 ÍNDICE DE ASSUNTOS, 194 Controle Estatístico - Introdução - Alexandre R. P. Schuler. PREFÁCIO Tudo começou com um curso de extensão, oferecido para estudantes e técnicos das indústrias da Região Metropolitana do Recife. No início era uma pequena apostila, com cerca de vinte páginas. Com a criação da disciplina Controle Estatístico de Qualidade para o curso de engenharia química e mais tarde da disciplina Controle Estatístico para o curso de química industrial, o presente texto foi crescendo gradativamente (atualizado a cada semestre letivo). Hoje chega a cerca de duzentas páginas, enriquecido com exercícios de aplicação (num volume suplementar, intitulado Caderno de Exercícios), extraídos, em sua grande maioria, das provas realizadas ao longo desses anos, todos eles resolvidos. Mas, como no controle estatístico, nunca se chega ao fim. O Autor pretende estar sempre atualizando o texto, solicitando para esse fim sugestões e a crítica construtiva de seus Leitores, ao mesmo tempo em que espera que a leitura seja útil para aqueles que se iniciam no controle estatístico, em qualquer uma de suas inúmeras aplicações. Entretanto, é altamente recomendado o aprofundamento de cada detalhe através da leitura adicional dos importantes textos citados nas Referências Bibliográficas, os quais serviram de base para a construção deste livro. O Autor recomenda fortemente a leitura do livro de Paul G. Hoel (Matemática Estatística, Ref. 20), que apresenta uma elegante dedução para a maioria das equações empregadas ao longo do presente livro. Os Capítulos 1 a 4 discutem as bases estatísticas para os demais capítulos. O Capítulo 5 trata do Controle de Qualidade Analítica. O Capítulo 6 trata do Controle de Processos, com ênfase nos Gráficos de Controle. Os Capítulos 7 e 8 tratam da Inspeção de Qualidade e o Capítulo 9 da Gestão da Qualidade. Finalmente, os Apêndices 1 a 16 trazem informações complementares aos diversos temas abordados neste livro e o Apêndice 17 traz um conjunto de tabelas que auxiliam na resolução da maioria dos problemas relacionados com o texto. Para facilitar, essas tabelas também se encontram no suplemento Caderno de Exercícios, que acompanha o livro texto. A intenção do Autor com os inúmeros apêndices foi compactar o texto básico (Capítulos 1 a 9), de modo a tornar sua leitura mais agradável e objetiva. Boa leitura! Alexandre Schuler Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 1 1 - INTRODUÇÃO 1.1. Histórico O conceito de controle estatístico de qualidade foi introduzido na década de 1920 por Shewhart, que na época era o responsável pela inspeção de componentes para centrais telefônicas produzidas pela empresa americana Bell Telephone. Desde aquela época e até o início da 2a Guerra Mundial, menos de 20 empresas americanas haviam adotado a idéia de Shewhart1. Foi o Japão o primeiro país a adotar, em larga escala, os conceitos próprios do controle estatístico. Em pesquisa realizada em 1977, Saniga e Shirland (Ref. 5) verificaram que apenas cerca de 70% das empresas americanas empregavam métodos de controle estatístico e ainda assim, utilizando apenas as técnicas mais simples, como a "amostragem simples" e o "gráfico da média". Segundo pesquisa não oficial, realizada em 1990, cerca de 80% das empresas brasileiras não utilizavam a informática e 54% das empresas entrevistadas desconheciam totalmente o assunto. 1.2. Definições fundamentais Qualidade – Qualidade é algo difícil de definir. Para os propósitos deste livropode significar “adequação ao uso” ou ainda “atender a alguma especificação” ou “atender às expectativas do consumidor”. Universo - São todos os indivíduos de uma população2, entendendo-se por indivíduo um item de produção ou uma grandeza desse item; e por população todas as peças de um dado lote ou da produção anual, por exemplo. Amostra - É uma pequena porção do universo, tomada a partir de critérios pré-estabelecidos, na esperança de ser representativa daquele. Média - É o valor numérico que melhor representa uma população, em termos quantitativos. Normalmente é a média aritmética dos indivíduos que a compõem. 1 Alguns das referências citadas no final do livro fazem uma boa revisão histórica. É interessante conhecer. 2 As expressões “indivíduo” e “população” são provenientes do uso mais extensivo da Estatística na área das ciências sociais. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 2 Dispersão - É o grau de espalhamento dos diversos indivíduos de uma população (ou de uma amostra). Desvio padrão - É uma forma de expressar quantitativamente a dispersão. Amplitude – Outra forma de expressar a dispersão, amplitude é a diferença entre o valor maior e o valor maior, dentre um conjunto de valores numéricos. Frequência - É o número de indivíduos com igual valor numérico da propriedade medida, numa população ou numa amostra. Outros termos que serão empregados ao longo deste texto terão sua definição quando da primeira citação. 1.3. Objetivos O controle estatístico é exercido com várias finalidades. Inicialmente há necessidade de ser mais bem entendido o significado da palavra "controle". O controle pode ser definido como uma atividade caracterizada pelo ajuntamento de certa quantidade de informações com o objetivo de compreender um determinado fenômeno. Aí, tem-se o controle analítico. A interpretação dessas informações à luz da Estatística denomina-se controle estatístico, e pode levar à decisão de se exercer influência sobre o fenômeno, visando alterações em seu comportamento. Ao conjunto de ações que alteram um fenômeno, dá-se o nome de controle operacional. Nesta monografia, toda a atenção será dirigida para o segundo tipo de controle, o Controle Estatístico, o qual pode ser: a) Controle Estatístico de Qualidade b) Controle Estatístico de Processo O Controle Estatístico de Processo ou Controle Estatístico de Fabricação tem como objetivo acompanhar passo a passo o processo de fabricação de um determinado produto. Evidentemente, essa atitude, por avaliar antes de se chegar ao produto final, tem uma componente preventiva e por isso mesmo tem um reflexo positivo sobre os custos de fabricação. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 3 Controle Estatístico de Qualidade, numa indústria que realiza o Controle de Processo, tem um caráter mais de confirmação. Sua maior importância, portanto, decorre da utilização por parte do comprador do produto, com a finalidade de evitar eventuais problemas em seu próprio processamento, em função de características indesejáveis no produto em questão. Finalmente, o Controle Estatístico de Qualidade é utilizado com o objetivo de avaliar a precisão e a exatidão (ver a seguir) com que estão sendo realizadas as diversas técnicas analíticas, de modo a garantir a confiabilidade dos dados experimentais, sob pena de ocorrerem falsas interpretações que consequentemente conduzem a decisões errôneas. Isso pode ocorrer em um Laboratório Industrial, mas também em qualquer outro laboratório, como por exemplo, um Laboratório de Análises Clínicas. Nesse caso particular (Laboratórios), dá-se o nome de Controle de Qualidade Analítica. 1.4. Erros e Incertezas em Química Analítica 1.4.1. Precisão e exatidão Quando alguém se propõe a repetir várias vezes uma determinada medição, os resultados individuais não serão numericamente iguais, mas estarão dispersos dentro de um determinado intervalo. Entende-se por precisão o grau de dispersão de um conjunto de resultados da medição de uma mesma grandeza: quanto maior a dispersão, menor será a precisão, ou seja, maior será a incerteza da medida. Por outro lado, o valor verdadeiro da grandeza poderá (ou não) estar incluído nesse conjunto de resultados, ou seja, mesmo havendo uma grande precisão na medição, o resultado poderá ser bastante diferente do valor verdadeiro (real). Nesse caso, diz-se que a medição foi inexata. Portanto, exatidão pode ser entendida como o grau de aproximação entre a medição experimental e o valor real. A avaliação da precisão e da exatidão é o objetivo geral do controle de qualidade analítica. A Figura 1.1 exemplifica: o conjunto de dados (a) é preciso e inexato; o conjunto de dados (b) é impreciso e inexato e o conjunto de dados (c) é preciso e exato. A quarta possibilidade (d) sugere um conjunto impreciso e exato. Mas deve ser enfatizado que isso é apenas uma Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 4 coincidência. De fato, é difícil aceitar que algo impreciso seja exato. Futuramente (Capítulo 4) esse assunto será melhor explorado. Figura 1.1 – Diferença entre precisão e exatidão. 1.4.2. Origem dos erros experimentais Os erros de medição (precisão e exatidão) podem agora ser melhor discutidos. Os erros são classificados genericamente como erros indeterminados ou erros estatísticos, quando a sua ocorrência obedece a uma distribuição aleatória (ou estatística), como será visto mais adiante (Capítulo 4) e estão relacionados com a precisão do procedimento de medição. Os erros estatísticos não são dotados de sinal, isto é, tanto podem ser positivos, como negativos. Eles não podem ser evitados ou corrigidos, tão somente minimizados. Ao lado dos erros estatísticos, ocorrem outros, denominados erros determinados, que ao contrário dos primeiros, são dotados de sinal, ou seja, ou são positivos, ou são negativos. Os erros determinados podem ser quantificados e, portanto, corrigidos. Exemplo de um erro determinado, também denominado erro sistemático, é a leitura feita com um instrumento que não esteja devidamente calibrado. O resultado será sempre inferior (ou sempre superior) ao valor real. O erro sistemático está relacionado com a exatidão da medição. Os erros sistemáticos podem ser de dois tipos: aditivos e proporcionais. Se no decorrer de um procedimento analítico um material é submetido à lavagem com um volume fixo de água, a perda por solubilização, qualquer que seja a quantidade de precipitado, será constante3. Essa perda é um erro aditivo. Por outro lado, numa titulação com uma solução cuja concentração indicada é diferente da real, a magnitude do erro dependerá do volume gasto na titulação, resultando em um erro proporcional. 3 Admitindo-se que a temperatura do experimento é constante. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 5 1.4.3. Incerteza Na seção anterior foram discutidos os conceitos de precisão e exatidão. Modernamente, por ter havido muita confusão no emprego desses termos (muita gente ainda confunde precisão com exatidão), os órgãos normalizadores (ver Apêndices 7 e 8), a expressão erro estatístico foi substituída por incerteza, enquanto que a expressão erro sistemático foi substituída por erro. 1.4.4. Medições usadas em Química Analítica 1.4.4.1. Classificação Os métodos analíticos são classificados em dois tipos gerais: a) métodos químicos (via úmida); b) métodos físico-químicos (instrumentais) Inerentes a cada método, os erros podem ser de três tipos: 1. Grosseiro2. Do operador 3. Do instrumento O erro grosseiro, devido à falta de atenção ou de treinamento adequado, será objeto de estudo no capítulo 5. O erro do operador aqui referido é o erro decorrente de características físicas do operador. Por exemplo, numa titulação a detecção do ponto de viragem é feita com auxílio do olho humano. Portanto, dependendo da acuidade visual do operador, esse ponto poderá ser observado com maior ou menor antecedência. Quanto aos erros dos instrumentos, serão discutidos aqui, especificamente, os erros de leitura, que estão relacionados com a precisão (incerteza) do instrumento. Em qualquer medição que se faça fatalmente será cometido um erro, seja grande ou pequeno, devido a limitações do instrumento, do método Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 6 empregado, ou do próprio analista. Tome-se como exemplo a medição de uma grandeza linear, a ser realizada com auxílio de uma régua (Figura 1.2.a) graduada em centímetros (menor divisão igual a 1 cm). Com ela se pode ler 87 cm. Com uma imagem ampliada dessa régua (e do objeto) poder-se-ia observar que o comprimento é ligeiramente maior que 87 cm. De fato, com outra régua (Figura 1.2.b), graduada em décimos de centímetro (0,1 cm), obter-se-ia, por exemplo, 87,2 cm, mas fazendo uma ampliação dessa nova situação poderia ser observado que o comprimento real é algo maior (ou menor) que 87,2 cm. (a) (b) Figura 1.2. Medição de uma grandeza linear. Na realidade, a leitura será sempre uma aproximação (ou arredondamento) do valor verdadeiro, ou seja, uma estimativa do mesmo. Consequentemente, o último algarismo será sempre duvidoso. 1.4.4.2. Erro absoluto O erro de um instrumento, como compreendido no parágrafo anterior, é igual à menor divisão de sua escala. Vale dizer que se trata aqui do erro máximo, total (isto é, indeterminados + determinados) e absoluto. Por outro lado, o erro relativo (agora não é propriamente do instrumento, mas da medição realizada com ele) é igual ao erro absoluto dividido pela grandeza da medida. No exemplo acima, o erro relativo da régua (a) é: 2,3%ou 023,0 cm 87 cm 1 X 2 1ε == Para a medição realizada com a segunda régua (b) fica: 0,23%ou 0023,0 cm 87,2 cm 0,1 X 2 2ε == Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 7 1.4.4.3. Pesagem Numa pesagem, normalmente é preciso pesar inicialmente o recipiente (tarar) e depois o conjunto (material + recipiente). Por diferença obtém-se o peso do material. O erro máximo relativo associado à pesagem de 10g de um material, com uma balança de 1g será: 20%ou 2,0 10 1 x 2 2 ==ε Pergunta: Por que o erro absoluto é multiplicado por 2 (nos dois exemplos)? 1.4.4.4. Medição de volume Na medição de um volume o erro máximo é calculado do mesmo modo. Se o instrumento é uma pipeta graduada ou uma bureta, o erro absoluto será também multiplicado por dois. Excetuam-se, obviamente, as pipetas de uma marca, os balões volumétricos, etc. A Tabela 1.1 mostra o erro absoluto (εabs) de vários recipientes usados em medição de volume. O erro relativo é calculado dividindo-se o erro absoluto pelo volume medido. Tabela 1.1 - Erro absoluto4 (incerteza) de vários recipientes. RECIPIENTE CAPACIDADE (mL) εabs (mL) RECIPIENTE CAPACIDADE (mL) εabs (mL) 25 0,050 5 0,015 Bureta 50 0,100 Pipeta graduada 10 0,025 1 0,010 25 0,050 2 0,020 50 0,075 5 0,014 100 0,120 10 0,019 250 0,180 25 0,031 500 0,350 Pipeta volumétrica (1 marca) 50 0,037 Balão volumétrico 1000 0,500 4 Esta tabela é apenas ilustrativa. Cada fabricante deve explicitar a incerteza de seu produto. Vidraria de laboratório acompanhada dessa informação é bem mais cara e é identificada como vidraria certificada (ver Apêndice 7). Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 8 Resposta à pergunta da página anterior: O erro é multiplicado por 2 (dois) porque na realidade são realizadas duas leituras. De acordo com a teoria da propagação dos erros, o erro total é a soma dos erros de cada operação. O Leitor verá mais detalhes nas Seções 5.6, 5.7 e 5.8. Como visto nos exemplos anteriores, isso acontece também na pesagem5 e na medição de volume em pipetas de duas marcas, por exemplo. 5 As balanças modernas de laboratório possuem o recurso da tara, em que a balança é zerada antes e após a colocação do recipiente. Nesse caso, deve ser considerada apenas uma leitura e o erro não é multiplicado por 2. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 9 2. OPERAÇÕES COM NÚMEROS EXPERIMENTAIS 2.1. Generalidades Como visto no capítulo anterior, a precisão de uma medição depende do instrumento empregado. Para que um resultado não seja expresso com um número que sugira uma precisão maior que a precisão real, alguns conhecimentos básicos devem ser considerados. 2.2. Regras de arredondamento Quando é preciso fazer arredondamento em um resultado numérico (ver seção seguinte), procede-se como a seguir: I. Se o último algarismo for menor que 5, mantém-se o penúltimo algarismo; II. Se o último algarismo for maior que 5, acrescenta-se uma unidade ao penúltimo algarismo; III. Se o último algarismo for igual a 5: a) mantém-se o penúltimo se este for par, ou b) acrescenta-se uma unidade se este for ímpar. OBS 1: Se o 5 a ser arredondado não é o último algarismo, o procedimento da regra III.a só é válido se os algarismos seguintes ao 5 eram zeros. Se, entretanto, o algarismo 5 precedia algarismos diferentes de zero, a regra III.b deve ser obedecida, mesmo quando o algarismo a ser mantido for par. Exemplos: 2,324 � 2,32 2,478 � 2,48 3,725 � 3,72 3,715 � 3,72 4,2652 � 4,27 4,2153 � 4,22 OBS 1: Não são permitidos arredondamentos sucessivos. Para ter apenas um algarismo depois da vírgula, o número 9,3453 é arredondado para 9,3. Não se deve fazer 9,3453 � 9,35 � 9,4. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 10 2.3. Algarismos significativos Quando um número representa um resultado experimental, fala-se em algarismos significativos. Algarismo significativo é todo e qualquer algarismo de um número, exceto os zeros anteriores ao primeiro algarismo diferente de zero, os quais são usados apenas para indicar a posição da vírgula. Exemplos: Número Algarismos significativos No de algarismos significativos 2,14 todos 3 0,013 1 e 3 2 20,710 todos 5 Para se operar com números experimentais, é preciso ter em mente que: a) O último algarismo é duvidoso; b) Após o último algarismo não se põem zeros; c) O número que possui o menor número de algarismos significativos é o menos preciso. 2.4. Operações com números experimentais Soma ou subtração: 2,719 2,324 14,32 1,13 17,04 3,45 Observação: Os valores mais precisos devem ser arredondados até se igualarem ao de menor número de algarismos significativos após a vírgula. eliminar arredondar Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 11 Multiplicação ou divisão: 3,137 x 7,2 = 22,5864 � 23 15, 3 7 8 ÷ 2,4 = 6,4075 � 6,4 Obs.: Arredondar apenas no final6, deixando o resultado com o mesmo número de algarismos significativos que o número de menor precisão. O exemplo a seguir ilustra o que foi discutido: Para determinar o fatorde uma solução de HCl 0,1M foi realizada uma titulação com 2,500 g (balança com sensibilidade de 0,001 g) de carbonato de sódio, empregando-se uma bureta de 50 mL (consultar a Tabela 1.1; página 7). Foram gastos 48,2 mL da solução. Existe mais de um modo de cálculo, mas todos resultam na seguinte divisão: f = 48,2/47,177 = 1,0218 � 1,02 Esse exemplo mostra que o costume de sempre representar f com quatro dígitos após a vírgula é totalmente errôneo. Caso a bureta empregada tivesse dois algarismos após a vírgula, seria então possível escrever um fator com quatro algarismos significativos, mas não necessariamente quatro algarismos significativos após a vírgula. 6 Se os cálculos forem realizados no Excel, lembrar de somente programar arredondamento na célula onde ficar o resultado final. 7 O número 47,12 é obtido a partir da estequiometria da reação. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 12 3. O USO DE GRÁFICOS EM QUÍMICA ANALÍTICA 3.1. Introdução O uso de gráficos em Química Analítica é bastante disseminado, em razão de suas múltiplas utilidades. O gráfico auxilia na compreensão de um fenômeno, na ordenação de informações experimentais e na sua visualização imediata. Os exemplos apresentados a seguir constituem uma lista não exaustiva, mas demonstram de uma maneira clara a sua importância. 3.2. Gráficos de Calibração Na Química Analítica, muitas vezes a concentração de um material é determinada em função de uma grandeza física ou físico-química, como pH, absorvância, condutividade elétrica ou térmica, etc. Nesses casos, emprega-se a relação C = f(x), onde C é a concentração e x é a grandeza medida. Na maioria das vezes, essa relação pode ser representada graficamente. Se a relação não é linear, é preferível retificar a curva experimental. Tais gráficos são denominados “Curvas de Calibração” (Apêndice 1). Uma outra concepção para as curvas de calibração é a correção de valores experimentais para valores padronizados. Talvez o exemplo mais comum para este enfoque seja a curva de calibração do termômetro de um aparelho para determinação do ponto de fusão (Figura 3.1). Este gráfico é construído registrando-se na abscissa o valor experimental, obtido com aquele termômetro, para o ponto de fusão de uma série de padrões (substâncias puras e que apresentam um ponto de fusão bem definido). Na ordenada é registrado o ponto de fusão “real”, obtido da literatura (de um “Handbook”, por exemplo). O ponto de fusão de um desconhecido é então “corrigido”, procurando na ordenada o valor correspondente àquele encontrado experimentalmente e selecionado na abscissa. Na construção de um gráfico, deve-se ter em conta que: a) O número de pontos não deve ser muito pequeno, principalmente se não se tem certeza a respeito da linearidade da correlação8 dos pontos, especialmente nas 8 Ver Seção 3.5, página 20. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 13 proximidades de um máximo (ou mínimo) ou de um ponto de inflexão (Seção 3.4). No caso de uma reta, serão suficientes 5 a 6 pontos. b) Além do erro da leitura de x no instrumento, existem os erros na preparação dos padrões (ver Seção 5.8). c) O gráfico mais legível é aquele cuja reta forma um ângulo de 45o com os eixos. Esse ângulo pode ser conseguido com uma adequada seleção das escalas, mas observando o item (d) abaixo. d) A precisão na leitura do gráfico é limitada pelo papel: com um papel milimetrado, o erro absoluto é de 0,25 mm. É preciso, portanto, selecionar uma escala cuja precisão, em unidades de y (e de C), não seja maior (nem menor) que a real. P o n t o d e f u s ã o r e a l ( c o r r i g i d o ) Ponto de fusão experimental Figura 3.1 – Gráfico de calibração. 3.3. Interpolação e Extrapolação Gráficas e Numéricas Num gráfico C = f (x), denomina-se interpolação a determinação de um valor dentro do intervalo conhecido (C1 < Cx < Cn), mas diferente de qualquer um dos valores de Ci utilizados na construção do gráfico (Figura 3.1). Nos casos onde a relação é linear, o erro na interpolação é mínimo, sendo função apenas dos erros citados na seção anterior. A = ε.c.b A b s o r v â n c i a Concentração Figura 3.2 – Comportamento da lei de Beer. Ao contrário da interpolação, a extrapolação é a determinação de um valor de Ci maior que Cn ou menor que C1. A extrapolação deve ser feita Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 14 com maior precaução, posto que a suposta linearidade talvez esteja sendo obedecida apenas no trecho C1–Cn. Um exemplo disso é a curva de absorção colorimétrica com soluções concentradas (Fig. 3.2). Observa-se que acima de uma determinada concentração, a lei de Beer não é obedecida. Na interpolação (ou extrapolação) numérica, faz-se uso de uma tábua de logaritmos, ou mais simplesmente, da equação 3.1 (ver Figura 3.3). A interpolação numérica é, evidentemente, mais precisa que a interpolação gráfica. Figura 3.3 – Interpolação gráfica. 1 12 112 y xx )x'x)(yy( 'y + − −− = (Equação 3.1) 3.4. Determinação do Ponto de Inflexão Curvas com ponto de inflexão (Fig. 3.4) são comuns a vários fenômenos físicos e físico-químicos. A determinação do ponto de inflexão é importante em muitos casos, como na titulação potenciométrica. No ponto de inflexão a derivada primeira e a derivada segunda são iguais a zero. Figura 3.4 – Curva com ponto de inflexão. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 15 Graficamente, o ponto de inflexão é determinado traçando-se uma tangente à curva ou, mais simplesmente, uma reta como se vê na Fig. 3.4, onde as áreas A e A’ são iguais. Alguns instrumentos, como o espectrômetro de ressonância magnética nuclear, fazem essa operação automaticamente. Com esses instrumentos, numa primeira corrida é traçada a curva “a” (Fig. 3.5), sendo a curva “b” traçada numa segunda corrida. Como a curva “b” é a integral de “a”, a altura do patamar (h) é uma medida da área relativa do “pico” (curva “a”). Uma perpendicular passando pelo máximo da curva “a” corta a curva “b” pelo seu ponto de inflexão. Figura 3.5 – Ponto de inflexão. 3.5. Regressão Linear Como foi visto, o emprego de gráficos é muitas vezes bastante útil. Também foi visto que cinco pontos são suficientes para se construir uma reta. Entretanto, devido aos erros estatísticos, dificilmente os cinco pontos estarão, todos, exatamente sobre esta reta (Figura 3.6a). É necessário, portanto, procurar a melhor reta, que é a reta que, simultaneamente, corresponde a um desvio mínimo de cada ponto. Mais exatamente, o trabalho consiste em procurar uma reta que corresponda a um valor mínimo para a soma dos quadrados dos desvios. É o método dos mínimos quadrados. Quando não é exigida uma alta precisão, esta tarefa pode ser realizada graficamente, como mostra a Figura 3.6. Procura-se a metade da distância entre o ponto 1 e o ponto 2 (marca-se a); procura-se a metade da distância entre a e o ponto 3 (marca-se b); etc. A última marca é representada por um X e é um dos pontos da reta (Figura 3.6b). Repete-se a operação no sentido contrário, até o outro ponto X (Figura 3.6c). A melhor reta passa por esses dois pontos X (Figura 3.6d). A Figura 3.6e é uma reprodução da Figura 3.6d realizada com auxílio do software Origin (Apêndice 2). Controle Estatístico – Apêndice 9 - Alexandre R.P. Schuler. 16 Figura 3.6 – Método gráfico dos mínimos quadrados. O método numérico é mais preciso e consiste em resolver um sistema de equações, onde a e b são os coeficientes da equação de regressão (a melhor reta chama-se reta de regressão e este procedimento é denominado Regressão Linear). A equação da reta é: ŷ = a.x + b Onde: a = (Σx Σy - nΣx.y)/[(Σx)2 - nΣx2] (Equação 3.2a) b = (Σy - aΣx) / n (Equação 3.2b) Os valores de ŷ são conhecidos como valores de regressão9. Para facilitar os cálculos, é construído o Quadro 3.1. Se a equação ŷ = ax + b representa a relação entre um resultado experimental (x) e o valor verdadeiro (y), como no caso da calibração de um termômetro (página 12), a regressão linear permite verificar a existência de erros sistemáticos, identificando-os e quantificando-os. Ponto no x y x*y x2 1 x1 y1 x1.y1 x12 2 x2 y2 x2.y2 x22 ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• N xn yn xn.yn xn2 Totais Σxi Σyi Σ(xi.yi) Σxi2 Quadro 3.1 - Ordenação dos dados para aplicação do método dos mínimos quadrados. 9 Os valores de regressão somente têm significado se a incerteza dos valores dos “x” for pelo uma ordem de grandeza inferior à incerteza dos valores de “y”. Nesse caso, eles correspondem a uma “correção” (ajuste) dos valores experimentais de y. { Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 17 Em conclusão, a regressão linear elimina automaticamente os erros estatísticos (através do método dos mínimos quadrados) e mede os erros sistemáticos aditivos (coeficiente linear, b) e os erros proporcionais (coeficiente angular, a). Para fins práticos, no caso, por exemplo, de uma curva de calibração de um termômetro (Figura 3.1), é usual estabelecer10 que: a) se b < 0 + 0,04 não existe erro aditivo e b) se a < 1 + 0,04 não existe erro proporcional. Coeficiente de regressão A correlação entre dois grupos de dados pode ser direta (quando ambos crescem numa proporção direta), ou inversa, quando, aumentando um deles, ocorre diminuição do outro (são inversamente proporcionais). É possível também avaliar quantitativamente o grau (ou intensidade) da correlação. Para tanto, calcula-se o coeficiente de regressão (também conhecido como índice de correlação ou coeficiente de correlação). O coeficiente de regressão (r) é calculado com auxílio da equação (3.3): 2/12 i 2 i 2 i i iiii ]})y( - yn][)x(-x{[n yx - .yxn r 2 ΣΣΣΣ ΣΣΣ = (Equação 3.3) NOTA: Evidentemente, é possível aproveitar o quadro proposto para o cálculo dos coeficientes da reta de regressão, bastando acrescentar uma coluna contendo os valores de yi2. Se o valor de r for negativo, tem-se uma correlação inversa e se r for positivo, tem-se uma correlação direta. Entende- se por uma boa correlação aquela cujo valor de r se aproxima da unidade (+1 ou –1). A intensidade de uma correlação pode ser avaliada pelo valor absoluto de r, conforme mostrado no Quadro 3.2. Valor de r Interpretação até 0,19 insignificante 0,20 a 0,39 Fraca 0,40 a 0,69 moderada 0,70 a 0,89 Forte 0,90 a 1,00 muito forte Quadro 3.2 – Comparação entre r e grau de correlação. 10 Uma correta avaliação estatística (Capítulos 4 e 5 e Apêndice 1) deve substituir essa afirmação empírica. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 18 Esses valores são bastante arbitrários, servindo apenas como uma orientação inicial. De fato, o valor de r também depende de n. O quadro 3.3 apresenta valores críticos para r. Dentro desse critério, se encontrado, por exemplo, r = 0,60 para um experimento realizado de modo a construir uma reta com dez pontos, isso deve ser interpretado como correspondendo a uma correlação fraca. Mas na realidade tudo vai depender do fenômeno em estudo e do objetivo do estudo. Por exemplo, em cromatografia é muito comum um coeficiente de regressão superior a 0,99. Assim, um resultado inferior (por exemplo, r = 0,97), certamente indicará algum problema no instrumento ou talvez algum erro na preparação das amostras ou ainda que não se esteja operando na faixa linear do equipamento (ver Figura 3.2, na página 13 e o próximo parágrafo). O coeficiente de regressão somente deve ser considerado quando se tratar, de fato, de um comportamento linear. Mais ainda: alguns fenômenos somente apresentam um comportamento linear em uma faixa finita de valores. Em espectrofotometria e em cromatografia, por exemplo, acima de uma determinada concentração, a relação desta com a leitura do instrumento deixa de ser linear. Nesse caso, é útil o cálculo do coeficiente de regressão para verificar quando termina a linearidade (o Apêndice 1 traz uma análise mais aprofundada sobre o assunto). Caso contrário, amostras com concentrações mais altas seriam quantificadas erroneamente (seria encontrada uma concentração menor que a real), resultando em um erro grosseiro. Número de pares de dados (x,y) Valor Crítico de r 5 0,88 6 0,82 7 0,76 8 0,71 9 0,67 10 0,64 11 0,61 12 0,58 Quadro 3.3 – Valores Críticos do Coeficiente de Correlação r Coeficiente de determinação O coeficiente de determinação (r2) mede a proporção da variabilidade de uma variável que é explicada pela variabilidade de outra. Considere-se, por exemplo, que o coeficiente de correlação para um par x,y seja 0,97. Neste caso, 94% Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 19 (0,972) da variabilidade de y são explicados pela variabilidade de x. O restante, 4%, é determinado por outros fatores desconhecidos. Mais adiante (Capítulo 5 e Apêndice 8) serão apresentados mais detalhes sobre essa importante questão. 3.6. Gráficos de Barras Os gráficos de barras (horizontais ou verticais) são empregados para mostrar a importância relativa dos vários itens de um conjunto, como, por exemplo, o número de notas acima de 8 numa turma de 20 estudantes (Figura 3.7). Os grupos 1 a 5 correspondem, respectivamente, aos seguintes intervalos de notas: 8 - 10; 6 - 8,9; 4 - 5,9; 2 - 3,9 e 0 - 1,9. O gráfico de barras muitas vezes é empregado para registrar uma distribuição de frequências (ver seção 4.2). Nesse caso as barras são unidas (sem espaçamento) e o gráfico é denominado histograma. Nos próximos capítulos serão apresentadas outras aplicações dos histogramas. Os Apêndices 2 e 3 discutem alguns softwares que podem desenhar esses e outros tipos de gráficos, os quais calculam automaticamente os coeficientes da equação e o coeficiente de correlação. 1 2 3 4 5 0 2 4 6 8 N ú m e r o d e e s t u d a n t e s Intervalos de notas Figura 3.7 – Um histograma. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 20 4. FUNDAMENTOS DA ESTATÍSTICA 4.1. Probabilidade Na Seção 1.2 foi definido o conceito de população. Neste capítulo a população, em termos quantitativos, vai ser representada por n. Quando uma experiência qualquer (particularizando para os objetivos do livro, uma análise química) é realizada, alguns resultados numéricos podem ser encontrados. Exemplificando: Se a concentração de um analito é X, onde X é um número dentro do intervalo X ± Z, apenas valores dentro desse intervalo podem ser encontrados. Ao conjunto desses valores possíveis dá-se o nome de espaço amostral. O resultado de cada experimento (leitura ou determinação) denomina-se evento. Do mesmo modo, é denominado evento favorávelaquele pertencente ao espaço amostral e evento desfavorável aquele que não pertence ao espaço amostral. O número de eventos favoráveis, x, encontrados após n leituras, onde 0 ≤ x ≤ n é de suma importância para o químico e é o objeto da discussão que se segue. Entende-se por probabilidade, no conceito clássico, a relação P = x/n, onde x é um número conhecido, igual ou inferior a n, que é finito, sendo x o número de eventos favoráveis, dentre n eventos quaisquer. Os eventos podem ser classificados em vários tipos11: a) Eventos equiprováveis são aqueles que possuem igual probabilidade de ocorrerem. Exemplo 1: Ao ser lançada para o alto, uma moeda tem 50% de chance de cair com a cara para cima e 50% de chance de cair com a coroa para cima. Exemplo 2: Ao se lançar um dado para o alto, cada face tem a mesma chance de cair virada para cima (1/6 ≅ 16,7%). Exemplo 3: Ao se retirar uma carta de um baralho, a probabilidade de ser um ás é 4/52 = 7,7%. b) Eventos com probabilidade condicional são aqueles em que a chance do segundo evento ocorrer depende da ocorrência do segundo evento. 11 Os exemplos mostrados a seguir pretendem explicar os vários casos (tipos) aqui descritos. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 21 Considere-se P+ a probabilidade de um evento positivo (cara, no exemplo anterior). É fácil observar que à medida que n cresce, P+ decresce. Exemplo 4: No Exemplo 1 foi observado que ao se lançar uma moeda para o alto, há 50% de probabilidade de dar cara. Se, por hipótese, na primeira tentativa der cara, a probabilidade de dar de novo cara na segunda tentativa é menor; na terceira tentativa, é menor ainda, etc. Matematicamente essa propriedade é expressa como: P = 1/2 X 1/2 = 1/4 = 0,25 = 25% (para duas tentativas) Em outras palavras, se n = 2, como podem ocorrer quatro situações (cara/cara, cara/coroa, coroa/cara e coroa/coroa), cada uma delas com iguais chances de ocorrer, fica: Pcara/cara = 1/4 = 25% Exemplo 5: A probabilidade de ser retirado um ás numa primeira tentativa é 4/52 (número de ases dividido pelo número total de cartas de um baralho) e a probabilidade de outro ás ser retirado na segunda tentativa é 4/52 x 3/51 = 0,45%. Neste caso, os ases são retirados sem reposição. Exemplo 6: Se o primeiro ás voltasse para o baralho (experimento com reposição), o segundo evento seria do tipo independente e a probabilidade de ocorrer seria 4/52 x 4/52 = 0,59%, como no exemplo 4. c) Eventos independentes são aqueles que ocorrem de um modo totalmente independente. Exemplo 7: No lançamento de dois dados, a probabilidade de se obter o 1 em um dado e o 5 no outro dado é o produto das duas probabilidades: 1/6 X 1/6 = 1/36 = 2,8%. d) Eventos mutuamente exclusivos são assim denominados quando a realização de um exclui a realização do outro. Exemplo 8: No lançamento de uma moeda, a probabilidade de se obter cara é 1/2 = 50% (ver Exemplo 1). Exemplo 9: Em um lote de 100 peças existem 5 defeituosas. Ao se retirar uma peça, a probabilidade de se obter uma peça defeituosa é P1 = 5/100 = 5%. Logo, a probabilidade de se obter uma peça sem defeito é P2 = 95/100 = 95%. Observe- se que P1 + P2 = 100%. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 22 4.2. Distribuição de Probabilidade Examinando a produção de um dia numa fábrica de veículos, os inspetores de qualidade encontraram os seguintes resultados: No de defeitos por veículo (d) No de veículos (v) 1 42 2 9 3 5 4 3 5 1 15 60 O título da segunda coluna do quadro pode ser substituído pela expressão frequência, com o significado atribuído na Seção 1.2 (página 2). Na última linha estão os totais. Por outro lado, se esse dia é representativo de um período maior de produção (um mês, um ano, etc.), essa tabela passa a representar uma distribuição de probabilidades (os valores na segunda coluna correspondem à probabilidade de ocorrência de veículos com determinado número de defeitos; P = v/Σv): No de defeitos por veículo (d) Probabilidade (P) 1 0,70 2 0,15 3 0,08 4 0,05 5 0,02 15 1,00 A construção dessa tabela implica em uma relação matemática entre o número de defeitos (valores da variável experimental) e os valores da outra variável (probabilidade). Essa relação pode ser traduzida através de uma função onde os valores di formam o domínio da função e os valores Pi o seu conjunto imagem. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 23 Quando a grandeza medida é uma variável contínua (ex.: uma massa ou a pureza de um produto), os valores do domínio da função apresentam uma distribuição contínua de probabilidade. Por outro lado, quando a grandeza pode assumir apenas alguns valores (como no exemplo acima: número de defeitos), diz-se que se trata de uma variável discreta. Nesse caso, os valores do domínio da função apresentam uma distribuição discreta de probabilidade. Tais distribuições discretas podem ser representadas por modelos matemáticos, dos quais, como úteis para o Controle Estatístico, destacam-se a distribuição binomial, a distribuição de Poisson e a distribuição hipergeométrica. 4.3. Distribuição Binomial A distribuição binomial descreve um fenômeno do tipo eventos mutuamente exclusivos (Seção 4.1.d; página 21). Nesse caso, as restrições são: a) O teste é dicotômico (sim ou não, cara ou coroa, sucesso ou insucesso, etc.); seus dois possíveis resultados são mutuamente excludentes; b) Os testes repetidos são independentes (um resultado não afeta os demais); c) As probabilidades de sucesso (P) e de insucesso (Q) são constantes, sendo P + Q = 100%. A equação que descreve a distribuição binomial é: (Equação 4.1) Onde: x = número de eventos favoráveis ≤ n = número total de eventos. n! = 1 x 2 x 3 x ... x (n-1) x n P = probabilidade de algo ocorrer Q = probabilidade de algo não ocorrer = 1 – P Exemplo 10: Recalcular o exemplo 4 (probabilidade de dar cara 2 vezes em 2 lançamentos de uma moeda) utilizando a equação 4.1. xnx x QP xnx nP −⋅⋅ − = )!(! ! Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 24 Resposta: Nesse caso, x = 2, n = 2, P = 0,5 (pois P = Q e P + Q = 1). Resolvendo, fica: %2525,0 2 1 2 1 )!22(!2 !2 222 == ⋅ ⋅ − = − xP Exemplo 11: Calcular a probabilidade de dar cara 5 vezes em 12 lançamentos de uma moeda. Resposta: Nesse caso, x = 5, n = 12, P = 0,5. Resolvendo, fica: %18,0 2 1 2 1 )!512(!5 !12 5125 = ⋅ ⋅ − = − xP Exemplo 12: Recalcular o Exemplo 3 com auxílio da equação 4.1. A probabilidade de ser selecionado um ás (x = 1) numa única tentativa (n = 1) é: %7,7077,0 52 48 52 4 )!11(!1 !1 111 == ⋅ ⋅ − = − xP Exemplo 13: Calcular a probabilidade de ser selecionado, numa única tentativa (n = 1), o ás de espada (x = 1): %9,1019,0 52 51 52 1 )!11(!1 !1 111 == ⋅ ⋅ − = − xP Exemplo 14: Em um lote de produção de tamanho N = 1000, admite-se que há 4% de itens defeituosos. Foram retirados desse lote n = 50 itens12, sem reposição. Calcular a probabilidade de serem encontrados x = 2 itens defeituosos: a) Probabilidade de nenhum item defeituoso: ( ) ( ) %0,13130,004,0104,0)!050(!0 !50 0200 ==−⋅⋅ − = − xP b) Probabilidade de um defeituoso:( ) ( ) %0,27270,004,0104,0)!150(!1 !50 1201 ==−⋅⋅ − = − xP 12 A rigor, a distribuição binomial somente pode ser empregada quando a relação n/N é igual ou menor que 0,1. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 25 b) Probabilidade de dois defeituosos: ( ) ( ) %6,27276,004,0104,0)!250(!2 !50 2202 ==−⋅⋅ − = − xP Resultado: P = 13,0 + 27,0 + 27,6 = 67,6% Como pode ser facilmente observado com base neste último exemplo, nos casos em que vários itens são retirados de um conjunto com n itens, sem reposição, a probabilidade de sucesso (o que quer que isso signifique) na retirada do n-ésimo item é dada por um somatório: (Equação 4.2) 4.4. Distribuição de Poisson No lugar da distribuição binomial pode ser empregada a distribuição de Poisson, cuja expressão matemática é mostrada na equação 4.3. De fato, a distribuição de Poisson é aplicável a eventos raros, ou seja, é necessário um n muito grande13 para que se possa observar um sucesso. Portanto, a rigor, a distribuição de Poisson é uma aproximação da distribuição binomial (que por sua vez pode ser considerada uma aproximação da distribuição normal ou gaussiana; Seção 4.8). (Equação 4.3) A constante e da equação 4.3 vale 2,718 e m = n.P. 4.5. Distribuição Hipergeométrica A distribuição hipergeométrica é aplicada quando n/N > 0,1. Nesse caso, emprega-se a equação 4.4: 13 Além de exigir um n muito grande, a distribuição e Poisson exige um p pequeno e, como a distribuição binomial, uma relação n/N≤ 0,1. xnx nx x x QP xnx nP − = = ⋅⋅ − =∑ 0 )!(! ! ∑ = = = nx x m x x xe mP 0 )!.( Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 26 (Equação 4.4) Onde: (Equação 4.5) Obs.: O Apêndice 12 apresenta uma detalhada discussão da aplicação desses modelos de distribuição à Inspeção de Qualidade. 4.6. Probabilidade Estatística O conceito de probabilidade estatística é diferente do conceito clássico de probabilidade, o qual sugere, por exemplo, que em cada conjunto de treze tentativas de se selecionar um ás, uma (e somente uma) será favorável, com certeza. Entretanto, na primeira série de tentativas, poderão ser selecionados dois ases; na segunda, talvez nenhum; etc. O valor médio, X , que é o número total de eventos favoráveis (obtenção de um ás), x, dividido pela quantidade de séries de treze tentativas (n) não é necessariamente igual a 1/13; mas, no limite (n→∞ ), X é igual a 1/13, ou seja: 13/1Lim n = →∞ 4.7. Erros Estatísticos Os erros estatísticos (ou indeterminados), já definidos na seção 1.4.2, são medidos como desvios do valor verdadeiro (µ): (Equação 4.6) O termo xi representa genericamente os diversos valores individuais obtidos na medição de µ, os quais, na ausência de erros determinados (ver seção 1.4.2), distribuem-se simetricamente em torno de µ. d xi i= −µ ! )!(! )]!()[()!( )!( )!(! !)( N nNn xnDNdn DN xDx D xf −• −−−− − • − = ∑ = = = nx 0x )x( )x(fF Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 27 Não considerando a magnitude do desvio, observam-se alguns elementos do conjunto xi aos quais estão associados desvios positivos (di > 0), enquanto outros apresentam desvio negativo (di < 0). 4.8. Distribuição Gaussiana Os modelos de distribuição vistos nas seções anteriores representam uma aproximação para a distribuição Gaussiana dos erros estatísticos14. A distribuição Gaussiana é, portanto, o caso limite, quando n→ ∞ . A Fig. 4.1 mostra a curva que representa a distribuição Gaussiana dos erros estatísticos. Sempre admitindo a inexistência de erros determinados, o valor de xi que tem maior frequência (maior probabilidade de ocorrência) é igual a µ (valor verdadeiro) e os diversos valores de xi são distribuídos simetricamente em torno de µ. A distância do ponto de inflexão (a) ao máximo da curva, expressa em unidades de x, é o desvio padrão (σ; página 32), que é usado como medida da dispersão de xi e, portanto, da precisão (ou incerteza). A Equação 4.7 é a expressão analítica da curva de distribuição, onde F(x) é a função de distribuição normal. (Equação 4.7) A função de probabilidades dessa curva (que mede a frequência, cujos valores são registrados na ordenada) é: (Equação 4.8) Figura 4.1 – Curva de distribuição Gaussiana. 14 Na realidade, a distribuição normal é aplicável a variáveis contínuas, enquanto que as demais são aplicáveis a variáveis discretas. ∫ ∞− −− ≤ == o oo x x xxx dxeFP 2 2 2 )( )()( 2 1 σ µ piσ 2 2 2 )( )( 2 1 σ µ piσ −− = x x ef Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 28 A equação 4.8 pode ser modificada fazendo σ µ)( − = x z (Equação 4.9) Essa modificação corresponde a uma simples mudança de escala15 e resulta na distribuição normal reduzida (Equação 4.10): (Equação 4.10) A curva da Fig. 4.1 tem as seguintes propriedades: � µ é o valor de xi de maior frequência e, portanto: (Equação 4.11) � Quanto maior for o desvio di, menor será a frequência de xi; � A curva é simétrica, isto é: a) O total de desvios positivos é igual ao total dos desvios negativos; b) O total de desvios positivos de uma determinada magnitude é igual ao total de desvios negativos de mesma magnitude. Figura 4.2a – Diferentes exatidões Figura 4.2b – Diferentes precisões 15 O parâmetro zσ é de fato uma medida de x (ou µ) em unidades de desvio padrão, ou seja, z mede a quantidade de desvios padrão existentes no intervalo |x - µ| (ver exercícios de nos 1.1 a 1.5 do Caderno de Exercícios, do Autor). 2 2 2 1)( zezf −= piσ lim n x n i →∞ = Σ µ Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 29 As Fig. 4.2.a e 4.2.b ilustram as duas principais aplicações da distribuição Gaussiana. Na Fig. 4.2.a, sendo µ1 ≠ µ2, conclui-se que as duas curvas referem-se a diferentes populações. Em termos práticos: a) se são dois métodos analíticos diferentes aplicados a uma mesma amostra, um dos métodos está dotado de erro sistemático (erro), ou, mais genericamente, ambos estão dotados de erros sistemáticos de diferentes magnitudes; portanto, a exatidão de um é estatisticamente diferente da exatidão do outro; b) se é o mesmo método, aplicado a amostras diferentes, estas diferem em teor16. Na Fig. 4.2.b, chega-se à conclusão inversa da anterior, em relação à exatidão. Por outro lado, os valores de σ sendo diferentes, a precisão (incerteza) não é a mesma, em cada caso, ou seja: um conjunto de valores (σ maior) é menos preciso (mais disperso) que o outro. 4.9. Estimativa do Valor Médio Foi dito anteriormente que o valor médio é igual a µ quando n tende para infinito (Equação 4.11), na ausência de erros sistemáticos. Entretanto, na prática, n é muito pequeno: normalmente efetuam-se duas a três medições em paralelo. Nessas condições, nem ao menos é possível traçar a curva, quanto mais aceitar que o valor médio seja igual a µ. Neste texto o valor médio será representado por X . Assim: X x n i = ≠ Σ µ X é a média aritmética dos n valores de xi. Entretanto,X pode ser considerado uma estimativa de µ. Quando n é realmente muito pequeno, em vez de X é empregada a mediana, M17. É que no cálculo da média, todos os valores de xi são utilizados e nos casos onde n é muito pequeno, a influência dos valores extremos x1 e xn, que poderão estar dotados de erros (desvios) muito grandes, é grande o bastante para tornar X muito diferente de µ. Por outro lado, a mediana não sofre influência desses erros, posto que: 16 Nesse momento, o Leitor deve se reportar ao Apêndice 4, para melhor compreender como se chega a essa importante conclusão. 17 Para determinar a mediana, é necessário colocar todos os valores, independentemente de repetição, em ordem crescente numérica. Ex.: Os valores 2, 4, 2, 1, 1, 3, 5 são assim ordenados: 1, 1, 2, 2, 3, 4, 5. A mediana é 2. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 30 a) Se n é ímpar, M é o valor central; b) Quando n é par, M é a média aritmética dos dois valores centrais. Uma diferença muito grande entre X e M indica a existência de erros grosseiros. Entretanto, usando a mediana, algumas informações a respeito do fenômeno são perdidas. É por isso que, na medida em que n cresce, a eficiência de M como estimativa de µ decresce: N 2 3 4 5 6 7 8 9 10 ∞ Eficiência de M 1,00 0,74 0,84 0,70 0,78 0,68 0,74 0,67 0,72 0,64 O exemplo analisado a seguir mostra a importância da mediana. Uma solução padrão contendo 10,025% de zinco foi analisada por um método titulométrico. Foram realizadas quatro medições, obtendo-se os resultados a seguir, à esquerda. Foram calculadas a média (X ), a mediana (M) e a amplitude (R), que é a diferença xn-x1. A diferença grande observada entre M e X pode ser atribuída a um erro grosseiro (consumo da solução titulante após a viragem; valor realçado em amarelo). Foi realizada uma nova leitura, encontrando-se 10,045. Este valor entrou em substituição ao dado suspeito (10,460). Novos valores foram calculados para X , M e R (dados da direita). Desta vez, a diferença entre X e M foi bem menor (o R também diminuiu bastante). 4.10. Estimativa da Dispersão Ao se realizar repetidas leituras de uma mesma grandeza, encontram-se valores (indivíduos, itens) que diferem entre si, numericamente, em maior ou menor grau. Essa dispersão (ver definição na página 2) pode ser medida através da amplitude (R = valor maior – valor menor). No próximo capítulo serão conhecidas outras estimativas para a dispersão. Desse modo, a medição de uma propriedade (por exemplo, uma concentração) a partir de um conjunto de dados (vale dizer: leituras repetidas de uma mesma amostra) fica completamente definida com o conhecimento dos parâmetros valor médio e dispersão. A dispersão mede a incerteza na estimativa do valor médio. X= M = R = Xi 10,018 10,025 10,030 10,460 10,133 10,028 0,442 X’= M’= R’= Xi 10,018 10,025 10,030 10,045 10,030 10,028 0,027 Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 31 5. CONTROLE DE QUALIDADE ANALÍTICA 5.1. Introdução A confiabilidade de uma análise é algo de extrema importância, independente de seu objetivo. No caso particular de seu uso como ferramenta (fonte de informação) para o Controle de um Processo Industrial, uma falha analítica pode levar à decisão de interferir desnecessariamente no processo, acarretando problemas de grandes proporções (grande prejuízo financeiro). Essa tomada de decisão (interferir no processo) precisa de informações bastante confiáveis. Procedimentos de laboratório confiáveis são o resultado de um trabalho que se costuma denominar de Controle de Qualidade Analítica. 5.2. Parâmetros e Testes Estatísticos Para se realizar uma avaliação estatística de um conjunto de dados experimentais, torna-se necessário, preliminarmente, realizar duas operações (na ordem indicada): 1) Verificar se algum dos dados é dotado de erro grosseiro; 2) Verificar se o conjunto de dados obedece18 a uma distribuição normal ou equivalente (Poisson, etc.). 5.2.1. Eliminação de Erros Grosseiros. O Teste Q. Na Seção 4.9 foi observado que uma diferença entre a média e a mediana pode indicar a existência de um erro grosseiro. Aplicação do teste Q para aqueles dados resultaria em rejeição do valor 10,460. O emprego do teste Q é realizado do seguinte modo: o valor de Q calculado é comparado com o tabelado, para um dado número de medições (n). Logicamente, os valores suspeitos são x1 e xn. Assim, calculam-se Q1 e Qn: 18 Esse tipo de avaliação denomina-se Teste de Normalidade e está discutido no Apêndice 6. Em princípio, um teste estatístico somente deve ser realizado após confirmação de que o conjunto de dados tem distribuição normal. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 32 R xxQ 121 − = (Equação 5.1.a) R xxQ nnn 1− − = (Equação 5.1.b) Nas equações acima, R é a amplitude. Se Q1 ou Qn for maior que o valor tabelado (Tabela 5.1), o dado correspondente (x1 ou xn) deve ser excluído. No exemplo em discussão, o valor de Qcalc = Qn = 0,973 e o Qtab (para n = 4) vale 0,941 (para P = 95%; ver obs. 3b na página 36). A amplitude é uma estimativa um tanto grosseira da dispersão. Os gráficos de barras verticais das Figuras 5.1a e 5.1b demonstram claramente a incapacidade da amplitude em mostrar as diferenças entre os dois conjuntos de dados abaixo (A e B). Em ambos, a amplitude é a mesma, mas os gráficos mostram que as duas distribuições são diferentes. A 10,1 10,2 10,3 10,3 10,3 10,4 10,4 10,4 10,4 10,4 10,5 10,5 10,5 10,6 10,7 B 10,1 10,2 10,3 10,3 10,4 10,4 10,4 10,4 10,4 10,4 10,4 10,5 10,5 10,6 10,7 Figura 5.1 – Distribuição de frequência dos dados A (a) e B (b) Para melhor representatividade emprega-se o desvio padrão: n d 2i∑ =σ (Equação 5.2) onde di = |xi - µ| e n é o número de dados. Esse é o desvio padrão da população. Entretanto, quando se trabalha com uma amostra, o desvio padrão é substituído por sua estimativa, s: 10,0 10,1 10,2 10,3 10,4 10,5 10,6 10,7 0 1 2 3 4 5 6 7 8 9 10 F r e q ü ê n c i a Valores de Xi 10,0 10,1 10,2 10,3 10,4 10,5 10,6 10,7 0 1 2 3 4 5 6 7 8 9 10 F r e q ü ê n c i a Valores de Xi (a) (b) Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 33 1-n X-x s 2 i∑ = (Equação 5.3a) A equação 5.3a fornece o desvio padrão de n leituras de uma única replicata (alíquota ou porção da amostra). Quando várias replicatas são analisadas, a equação 5.3b (desvio padrão de uma média; sm) deve ser aplicada. ns/ sm = (Equação 5.3b) Como medida da dispersão (ou incerteza) também são empregados o coeficiente de variação (CV = s/X ) e a variância (s2). O conceito de desvio padrão também é aplicado a curvas de calibração (Seção 3.2). Podem ser calculados os desvios padrão dos coeficientes da reta de regressão (coeficiente angular, a e coeficiente linear, b) e da própria reta (r). Além disso, é possível também determinar o desvio padrão da leitura de uma amostra feita com auxílio da reta de regressão (sc), onde N é o número de pontos da reta. O exemplo a seguir ilustra a situação. Exemplo 1: Uma amostra foi analisada por um instrumento cujo sinal éproporcional à concentração do analito. A partir de cinco soluções de diferentes concentrações do analito obteve-se a curva representada pelo Quadro 5.1 e pela Figura 5.2. Determinar a concentração da amostra (Ca) e seu respectivo desvio padrão sabendo que a intensidade do seu sinal foi 2,65 (leitura única). Figura 5.2 – Curva de Calibração Ponto % Analito Sinal 1 0,35 1,09 2 0,80 1,78 3 1,08 2,60 4 1,38 3,03 5 1,75 4,01 Quadro 5.1 – Dados para construção da Curva de Calibração. 2-N xxa yy s 2 i 22 i r −Σ−−Σ = 2 i 2 2 c r c xxa yy N 1 n 1 a s s −Σ − ++= 2 i 2 r a xx s s −Σ = 2 i 2 i rb x )x(N 1 ss Σ Σ − = 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 r = 0,994; r2 = 0,988 S i n a l Concentração Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 34 Aplicação do método dos mínimos quadrados forneceu os seguintes valores para os parâmetros da reta: a = 2,09; b = 0,26 e sr = 0,14. Aplicando o valor 2,65 à equação da reta e calculando o desvio padrão sc de acordo com a correspondente equação, fica: Ca = 1,14 ± 0,07%. Tabela 5.1 - Valores máximos de Q, para uso da Equação 5.1. P(%) n - 1 90 95 99 3 0,886 0,941 0,988 4 0,679 0,765 0,889 5 0,557 0,642 0,760 6 0,482 0,560 0,698 7 0,434 0,507 0,637 8 0,330 0,390 0,550 9 0,275 0,320 0,490 10 0,230 0,270 0,435 5.2.2. Intervalo de Confiança Denomina-se intervalo de confiança a faixa compreendida entre µ + zσ e µ - zσ, estes denominados limites de confiança. Por exemplo, para z = 3, 99,73% dos valores de x estão no intervalo µ + 3σ (vide Tabela 5.2). Quando se utiliza s em vez de σ e X em vez de µ, o coeficiente z é substituído por t. Para t = 3 (vide Tabela 5.3), exprimindo de outra forma o mesmo que foi dito para z, há aproximadamente 99% de probabilidade de µ estar na faixa X + 3s, se foram realizadas 14 determinações. Se o número de determinações for reduzido para 4, a probabilidade cai para 95% e se n for igual a 3, P = 90 %, aproximadamente. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 35 t X n s = − µ Tabela 5.2 - Valores da integral f (xi) = P (probabilidade de frequência), para alguns valores de z, onde z = (xi - µ)/σ Z .0 .2 .4 .6 .8 0 0,0000 0,1585 0,3108 0,4515 0,5763 1 0,6827 0,7699 0,8385 0,8904 0,9281 2 0,9545 0,9722 0,9836 0,9907 0,9959 3 0,9973 - - - - OBS: Os algarismos das colunas correspondem ao segundo algarismo significativo de z. Por exemplo: P = 0,9836 corresponde a z = 2,4. O Apêndice 6 apresenta uma ampliação desta tabela e os cálculos envolvidos na sua construção. 5.2.3. Teste t A principal e mais direta aplicação da distribuição Gaussiana foi desenvolvida em 1908, pelo químico inglês William Sealey Gosset (1876-1937), sob o pseudônimo de Student (estudante em inglês). O teste t é empregado para avaliação da exatidão de um procedimento analítico. O coeficiente t, definido na seção anterior, pode ser calculado, a partir dos dados experimentais, com auxílio das equações 5.4 ou 5.5. Como pode ser notado, a Equação 5.4 permite avaliar a exatidão com que X estima o valor de µ, posto que, com auxílio da Tabela 5.3, pode ser verificado se a diferença X - µ é (ou não) maior que a permitida, para um dado valor de n. Em outras palavras, se t calculado (tcalc) é maior que t tabelado (ttab), deve-se concluir que houve um desvio maior que o estatisticamente permitido. O valor de t tabelado é procurado na Tabela 5.3 para (n - 1). É sugerido ao leitor comparar esse tipo de interpretação com aquele empregado para o teste Q. (Equação 5.4) A Equação 5.5, por outro lado, permite avaliar duas médias. Utilizando a Tabela 5.3 do mesmo modo que no caso anterior, é possível decidir se: a) trata-se de amostras diferentes (em teor), ou não, quando é o mesmo método aplicado a duas amostras. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 36 b) trata-se de métodos analíticos de diferente exatidão (ou não), quando são dois métodos aplicados à mesma amostra. (Equação 5.5a) (Equação 5.5b) Obs. 1 - Quando é utilizada a Equação 5.5a, procura-se na Tabela 5.3 o valor correspondente a 2n-2, onde n é o número de medições em paralelo realizadas com cada método. Obs. 2 - Quando n é o mesmo, utiliza-se a Equação 5.5b; quando n é diferente, utiliza-se a Equação 5.5a. Obs. 3 - Nos dois casos (eq 5.4 e Equação 5.5), a interpretação é feita do seguinte modo: a) localiza-se t calculado na Tabela 4.3. b) observa-se19 que: - se P 99% ≥ → a diferença é altamente significativa. - se 95% P < 99% ≤ → a diferença é significativa (ainda). - se P < 95% → a diferença é estatisticamente insignificante. 5.2.4. Teste F O teste F, em contraposição ao teste t, é empregado para avaliação da precisão relativa de dois métodos analíticos. O parâmetro s é uma medida da precisão. Entretanto, o simples conhecimento do valor numérico de s é de pouco auxílio para o analista, enquanto que o cálculo de F, a partir da equação: 19 Na prática é costume considerar apenas a coluna central (P = 95%). Neste caso, se tcalc > ttab, conclui-se que a diferença é significativa. Caso contrário (tcalc ≤ ttab), a diferença não é significativa. 2-nn 1)s-(n1)s-(n n 1 n 1 xx t 21 2 22 2 11 21 21 + + + − = 1-n ss xx t 2 2 2 1 21 + − = Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 37 F s s A 2 B 2= (Equação 5.6) onde sA > sB, permite avaliar a precisão relativa de A e B. O raciocínio é semelhante ao aplicado no teste t. Se o valor de F calculado for maior que o de F tabelado, (Tabela 5.4), para um dado número de determinações, é possível afirmar com 95% de segurança que o método A (maior valor de s) é menos preciso que B. William Sealey Gosset William Sealey Gosset nasceu no dia 13 de junho de 1876 in Canterbury (Inglaterra) e foi educado em Winchester. Estudou Química e Matemática e foi como químico que obteve um emprego em 1899 na Cervejaria Guinness em Dublin (Escócia). Como parte de seu trabalho, ele tinha que resolver problemas de custo de fabricação e para tal, aproveitando seus conhecimentos de matemática, inventou o teste t para amostras pequenas. Este e outros trabalhos estatísticos foram publicados com o pseudônimo de Student, daí algumas pessoas referirem-se ao "teste do estudante". Um detalhe interessante: um acidente de trânsito (ele bateu com o carro num poste) levou-o a um repouso forçado que durou três meses, o que permitiu o desenvolvimento de seu trabalho sobre o teste t. Em 1935 Gosset foi transferido para uma recém construída destilaria Guinness em Londres. Student morreu em 16 de outubro de 1937, em Beaconsfield (Inglaterra). Tabela 5.3 - Valores máximos de t para vários níveis de significância P(%) P(%) n – 1 90 95 99 n – 1 90 95 99 1 6,314 12,706 63,657 13 1,771 2,160 3,012 2 2,920 4,303 9,925 14 1,761 2,145 2,977 3 2,353 3,182 5,841 15 1,753 2,131 2,947 4 2,132 2,776 4,608 16 1,746 2,120 2,921 5 2,015 2,571 4,032 17 1,740 2,110 2,891 6 1,943 2,447 3,707 18 1,734 2,101 2,878 7 1,895 2,365 3,499 19 1,729 2,093 2,861 8 1,860 2,306 3,355 20 1,725 2,086 2,845 9 1,833 2,262 3,250 25 1,708 2,060 2,787 10 1,812 2,228 3,169 30 1,697 2,042 2,750 11 1,796 2,201 3,106∞ 1,645 1,960 2,576 12 1,782 2,179 3,055 Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 38 Tabela 5.4 - Valores máximos de F. (n - 1) PARA O MÉTODO A (numerador) 1 2 3 4 5 6 7 8 9 10 1 161/4052 200/4999 216/5403 225/5625 230/5764 234/5859 237/5928 239/5981 242/6056 242/6056 2 18,5/98,5 19,0/99,0 19,2/99,2 19,2/99,2 19,3/99,3 19,3/99,3 19,4/99,4 19,4/99,4 19,4/99,4 19,4/99,4 3 10,1/34,1 9,6/30,8 9,3/29,5 9,1/28,7 8,9/28,9 8,9/27,9 8,9/27,7 8,8/27,5 8,8/27,2 8,8/27,2 4 7,7/21,2 6,9/18,0 6,6/16,7 6,4/16,0 6,2/15,5 6,2/15,2 6,1/15,0 6,0/14,8 6,0/14,5 6,0/14,5 5 6,6/16,3 5,8/13,3 5,4/12,1 5,2/11,4 5,1/11,0 5,0/10,7 4,9/10,5 4,8/10,3 4,8/10,1 4,7/10,1 6 6,0/13,7 5,1/10,9 4,8/9,8 4,5/9,2 4,4/8,8 4,3/8,5 4,2/8,3 4,2/8,1 4,1/7,9 4,1/7,9 7 5,6/12,2 4,7/9,6 4,4/8,4 4,1/7,8 4,0/7,5 3,9/7,2 3,8/7,0 3,7/6,8 3,6/6,6 3,6/6,6 8 5,3/11,3 4,5/8,6 4,1/7,6 3,8/7,0 3,7/6,6 3,6/6,4 3,5/6,2 3,4/6,0 3,4/5,8 3,4/5,8 9 5,1/10,6 4,3/8,0 3,9/7,0 3,6/6,4 3,5/6,1 3,4/5,8 3,3/5,6 3,2/5,5 3,1/5,3 3,1/5,3 10 5,0/10,0 4,1/7,6 3,7/6,6 3,5/6,0 3,3/5,6 3,2/5,4 3,1/5,2 3,1/5,1 3,0/4,8 3,0/4,8 ( n - 1 ) p a r a o m é t o d o B ( d e n o m i n a d o r ) 12 4,8/9,3 3,9/6,9 3,5/6,0 3,3/5,4 3,1/5,1 3,0/4,8 2,9/4,6 2,8/4,5 2,8/4,4 2,8/4,3 Observação: Em cada quadrícula, o primeiro número corresponde a 95% de Probabilidade e o segundo número a 99% de Probabilidade. 5.3. Estatística Simplificada Foi visto anteriormente (Seção 4.9, p. 29) que quando n é muito pequeno utiliza-se a mediana (M), em lugar da média, X , para se estimar o valor verdadeiro, µ. Nesses casos, é útil empregar-se a amplitude (R = xn-x1) para avaliação da precisão, em lugar do desvio padrão. Mais exatamente, a precisão é avaliada através da equação 5.7: sR = Kn.R (Equação 5.7) onde sR é uma segunda estimativa do desvio padrão, Kn é uma constante que varia com n (ver Tabela 5.5) e R é a amplitude (do inglês “Range”). A última coluna da Tabela 5.5 mostra a eficiência de sR na estimativa de σ. Na prática, a estatística simplificada é aplicada quando n ≤ 10. 5.4. Número Ideal de Medições Um número muito pequeno de medições pode conduzir a erros excessivamente grandes. Por outro lado, um número muito grande de medições exigirá um tempo de análise maior que o necessário, sem, contudo, trazer vantagens concretas em termos de exatidão e/ou precisão. A cada método Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 39 analítico corresponde um número ideal de medições (ou repetições) em paralelo. Quando um método novo vai ser empregado, o analista deve inicialmente verificar qual é esse número, o que pode ser feito com auxílio das equações 5.8a e 5.8b. Tabela 5.5 - Valores de Kn para uso da Equação 5.7. n Kn eficiência* 2 0,8862 1,00 3 0,5908 0,99 4 0,4857 0,98 5 0,4299 0,96 6 0,3946 0,93 7 0,3698 0,91 8 0,3512 0,89 9 0,3367 0,87 10 0,3249 0,85 (*) eficiência de sR na estimativa de σ. 5.8b) (eq. 100 L e 5.8a) (eq. n t.s R µ ∆ ==∆ O exemplo mostrado a seguir ilustra o raciocínio a ser empregado. Duas amostras foram analisadas com 8 repetições (8 replicatas20), calculando-se21 a segunda estimativa do desvio padrão (sR; Equação 5.7). Os dados são organizados no Quadro 5.2, para facilitar a interpretação. Na última coluna é indicada a diferença entre o valor de L atual e o da linha anterior. No momento em que a diferença (vale dizer, a diminuição na dispersão dos valores, ou ainda o aumento na precisão) fica (a critério do analista) desprezível, este adota o número anterior como sendo o número ideal de medições. No caso da amostra A, este número é 3, enquanto que no caso B vale 2; conclui-se daí que o número ideal de medições depende, entre outros fatores, da concentração da amostra. 20 Essa informação é muito importante. O Autor sugere que nesse momento seja consultado o Apêndice 8. 21 O valor de t é obtido da Tabela 5.3, para cada valor de n. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 40 AMOSTRA A 1,04 1,03 0,98 1,02 0,96 1,02 1,03 1,05 AMOSTRA B 15,10 14,90 14,95 15,05 14,94 15,02 14,97 14,99 s sR A R B = =0 029 0 065, , e amostra A: µ = 1% amostra B: µ = 15% n √n t ∆ L Diferença ∆ L Diferença 2 1,414 12,706 0,260 26,0 - 0,584 3,9 - 3 1,732 4,303 0,072 7,2 18,8 0,161 1,1 2,8 4 2,000 3,182 0,046 4,6 2,6 0,103 0,7 0,4 5 2,236 2,776 0,036 3,6 1,0 0,081 0,5 0,2 6 2,449 2,571 0,030 3,0 0,6 0,068 0,4 0,1 Quadro 5.2 - Determinação do número ideal de medições. A Figura 5.3 mostra a diminuição do erro com o número de repetições. Número ideal de repetições 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 2 4 6 8 número de repetições e r r o r e l a t i v o p e r c e n t u a l conc 1% conc 15% Figura 5.3 – Variação do erro em função do número de repetições. 5.5. Diferença Máxima Permitida entre duas Medições A diferença máxima permitida entre duas medições em paralelo, para um dado método, é determinada realizando-se um número m de grupos de medições. Os grupos podem ser de dois (pares), três ou mais (n). A partir da amplitude das medições de cada grupo, Ri, é calculada a amplitude média, R , pela equação 5.9. Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 41 R 1 m Ri= Σ (Equação 5.9) A diferença entre duas medições pode ser aceitável, ou não, a depender do desvio padrão previamente avaliado a partir de um grande número de medições realizadas com uma solução padrão. A relação Rmáx = a.σ (Equação 5.10.a) onde a é encontrado na Tabela 5.6, na prática não é utilizada porque não se conhece o valor de σ. Entretanto, σ pode ser estimado a partir de sua estimativa (s; Equação 5.7) ou da segunda estimativa, sR = Kn.R . A segunda estimativa é mais indicada porque n é muito pequeno (normalmente empregam-se pares de dados; logo, n = 2). Fazendo b = a.Kn, fica: R b.Rmáx = (Equação 5.10.b) Para a determinação de Rmáx, o analista tem que utilizar uma solução padrão ou uma amostra, tomando muitas alíquotas (replicatas, m), analisá-las e agrupá-las (o tamanho do grupo é n). De posse dos dados, é só calcular a amplitude em cada grupo, Ri e em seguida, a partir da equação 4, calcular a média das amplitudes. Depois, basta aplicar a Equação 5.b para obter o valor de Rmax. Ao analisar uma amostra qualquer, não será necessário realizar uma terceira medição, caso a diferença entre as duas primeiras seja igual ou menor que Rmáx. Tabela 5.6 - Valores de a e de b para vários valores de n, com P = 95%. n a b 2 2,77 2,46 3 3,31 1,96 4 3,63 1,76 5 3,86 1,66 Controle Estatístico – Apêndice 9 - Alexandre R. P. Schuler. 42 5.6. Avaliação Estatística de um Método Analítico Inicialmente torna-se necessário definir o que se entende por “Método Analítico”: um conjunto de operações efetuadas com o objetivo de determinar uma característica (normalmente física ou química) de um dado material. Por essa definição, a “incerteza global do método”, que é o somatório das incertezas de todas as operações, pode variar grandemente, de um laboratório para outro, ao contrário do que se costuma apregoar. O exemplo mostrado a seguir, não pretendendo (nem conseguiria!) mostrar todos os fatores que
Compartilhar