Baixe o app para aproveitar ainda mais
Prévia do material em texto
Como a estatística pode ajudar ... Porque ter a mente boa não é o bastante; o principal é aplicá-la bem. As maiores almas são capazes tanto das maiores virtudes quanto dos maiores vícios, e aqueles que marcham lentamente podem avançar muito mais, se seguirem o caminho certo, do que os que correm porém dele se afastam. Descartes, Discurso sobre o método, parte I Referência: Benício de Barros Neto, Ieda Spacino Scarminio, Roy Edward Bruns. “Como fazer experimentos: Pesquisa e desenvolvimento na ciência e na indústria”. Bookman, 4ª edição, 2010. Exemplo prático Um químico deseja obter o rendimento máximo em uma reação que é controlada apenas por duas variáveis: - a temperatura - a concentração de um determinado reagente Nomenclatura - RESPOSTA: é a propriedade de interesse rendimento - FATORES: variáveis que influencia a resposta temperatura concentração - SUPERFÍCIE DE RESPOSTA: função que descreve a influência dos fatores na resposta resposta = f(temperatura, concentração) - NÍVEIS: o pesquisador deve escolher quais valores dos fatores dão maior resposta Como descobrir o nível para cada fator - fixa um fator e varia-se o outro fator - Varia-se todos os fatores ao mesmo tempo INTERAÇÃO: as variáveis podem-se influenciar mutuamente. A estatística pode ajudar - A resolver problemas em que é necessário estudar várias propriedades aos mesmo tempo sendo que estas são afetadas por um grande número de fatores experimentais - Como estudar o efeito de todos esses fatores sobre todas as propriedades, minimizando o trabalho e o custo dos experimentos? - Como melhorar a qualidade do produto resultante? - Que fatores experimentais devem-se controlar para que a qualidade do produto seja assegurada? Pesquisas para essas respostas - Levam tempo - Envolvem pessoal qualificado - Custo alto - Gastos com reagentes - Gastos com pessoal - Analises química - Análises físicas O conhecimento da estatística proporciona - Resolver esses problemas de forma racional e econômica - Usar planejamento experimental - Extrair o máximo de informação útil - Minimizar o número de experimentos Diferença entre modelo empírico e modelo mecanístico - Modelo mecanístico ou global Ex. mecânica newtoniana - Modelo empírico ou local Ex. As variáveis investigadas influenciam no sistema. Estatística - Analisar dados - Planejar os experimentos para obter os dados Erros - Considere o exemplo: Para determinar a [ácido acético] no vinagre: - Preparar a solução do padrão primário; - Utilizá-la para padronizar a solução de hidróxido de sódio; - Realizar a titulação. Não se pode esquecer que cada uma dessas etapas evolve várias operações básicas, como pesagens, diluições e leitura de volume. Suponha duas amostras com teor esperado de 4%: - Teor encontrado na amostra A: 3,80% - Teor encontrado na amostra B: 4,20% Erro grosseiro: esquecer de colocar o indicador Erro sistemático: indicador impróprio, padrão adulterado, balança descalibrada, pipeta mal aferida, paralaxe, etc. Tente identificar e eliminar todos os erros sistemáticos Para quaisquer duas ou mais medidas é de se esperar que tenhamos resultados idênticos? Observe 20 medidas obtidas para esse sistema na Tabela 01: Tabela 01 - Resultados obtidos para vinte titulações realizadas para um mesmo lote de vinagre Número da Titulação Concentração / % Número da Titulação Concentração / % 1 3,91 11 3,96 2 4,01 12 3,85 3 3,61 13 3,67 4 3,83 14 3,83 5 3,75 15 3,77 6 3,91 16 3,51 7 3,82 17 3,85 8 3,70 18 4,04 9 3,50 19 3,74 10 3,77 20 3,97 Figura 01 - Utilizando um gráfico observe a distribuição das medidas Figura 02 - Utilizando um gráfico observe a concentração da distribuição das medidas em torno de um valor central O que se percebe? 1 - Os valores não são idênticos mas flutuam em torno de um valor intermediário. 2 – A flutuação em torno do valor central ocorre aparentemente ao acaso. 3 – Parece que a amostra está mesmo fora da especificação, já que a maioria dos valores determinados encontra-a abaixo de 4%. Erros aleatórios São erros devidos a causas não justificadas e difíceis de se determinar, ou seja aqueles que ocorrem ao acaso. Esta é uma características que temos que conviver e para a qual utilizamos a estatística como ferramenta de avaliação. EXERCÍCIO 1: Pense num experimento simples e procure identificar alguns dos fatores que impedem que se obtenham resultados rigorosamente sem erros. Como tratar estatisticamente os erros aleatórios: Admita a hipótese que se trata de uma distribuição gaussiana, ou normal. Quantos caroços há em um quilo de feijão? Para resolver esta questão você pode: - Contar um a um - Usar a estatística (por exemplo, pese um feijão e divida o quilo pelo peso de um feijão) Tente adivinhar quantos caroços existem em um quilo de feijão preto. É óbvio que este não é o método recomendado para resolver nosso problema (a não ser que você tenha poderes parapsicológicos), mas seu palpite servirá para um teste estatístico, mais adiante. EXERCÍCIO 2: Experimento 1 Pesou-se de forma aleatória dois feijões retirados de um pacote de um quilo de feijão preto: - Peso do primeiro feijão: 0,1188 g - Peso do segundo feijão: 0,2673 g - Se todos os caroços de feijão fossem iguais ao primeiro, em um quilo de feijão haveria: n = 1000 g 0,1188 g ≅ 8.418 caroços - Se todos os caroços de feijão fossem iguais ao segundo, em um quilo de feijão haveria: n = 1000 g 0,2673 g ≅ 3.741 caroços Qual desses valores seria possível aceitar? O correto seria usar a média - Que seria possível dividindo o peso do quilo de feijão pelo número de feijões contido nele, mas não conhecemos o número de feijões em um quilo. - Se examinarmos os feijões contidos em um quilo concluiremos que há caroços maiores e caroços menores, mas a maioria tem mais ou menos o mesmo tamanho. Assim, podemos restringir o número de feijões para o nosso cálculo considerando um intervalo de tamanho e definindo o tamanho de nossa população. POPULAÇÃO – em estatística é o conjunto de todos os valores possíveis numa dada situação. - Com o conhecimento de todos os pesos individuais de cada um dos feijões contidos no quilo seria possível conhecer a média populacional verdadeira, mas isto é inviável. Dessa forma, podemos considerar fazer uma estimativa. Isto é a partir de uma amostra da população. POPULAÇÃO Qualquer coleção de indivíduos ou valores, finita ou infinita AMOSTRA Uma parte da população, normalmente selecionada com o objetivo de se fazer inferência sobre a população. O conjunto de todas as concentrações que podem, em princípio, ser obtidas na titulação de uma amostra constitui uma população finita ou infinita? EXERCÍCIO 3: Para que a amostra seja uma representação realista, não tendenciosa, da população completa, é necessário que seus elementos sejam escolhidos de forma rigorosamente aleatória. AMOSTRA REPRESENTATIVA Apresenta as características relevantes da população na mesma proporção em que ela ocorrem na própria população AMOSTRA ALEATÓRIA Apresenta N valores ou indivíduos obtidos de tal forma que todos os possíveis conjuntos de N valores na população tenham a mesma chance de ser escolhidos Tabela 02 - Pesos de 140 caroços extraídos aleatoriamente de um pacote de um quilo de feijão preto Tabela 03 - Distribuição em intervalos dos pesos de 140 caroços extraídos aleatoriamente de um pacote de um quilo de feijão preto. FREQUÊNCIA RELATIVA Corresponde ao númerode unidades ou indivíduos contidos em certo um intervalo dividido pelo número total de unidades ou indivíduos numa amostra. É preferível analisar a distribuição dos pesos dos dados ou indivíduos em termos de frequência, porque as distribuições estatísticas teóricas são distribuições de frequência, não de número absoluto de investigações. Conhecendo-se as frequências, pode-se determinar as probabilidades de que certos valores de interesse venham a ser observados. Com essas probabilidades pode-se então testar hipóteses sobre a população. EXERCÍCIO 4: Use os dados da Tabela 03 para confirmar que 54,3% dos caroços observados têm peso entre 0,18 e 0,24 g. Figura 03 – Histograma dos pesos de 140 caroços extraídos aleatoriamente de um pacote de 1 Kg de feijão preto Quando temos um conjunto de dados para analisar, desenhar um gráfico é uma das primeiras coisas que devemos fazer. Esta é uma regra geral da estatística, equivale ao velho ditado que diz que uma imagem vale mais que mil palavras. As principais características de um histograma são: - localização do conjunto de observações numa certa região. - dispersão, ou espalhamento, ao longo dessa região. Construa um histograma para os dados da Tabela 1. A literatura em geral recomenda que o número de barras seja aproximadamente igual a raiz quadrada do número total de observações. Prefira um número ímpar, o que permitirá observar possíveis simetrias. EXERCÍCIO 5: Média amostral: É uma medida da localização ou tendência central. Soma total dos valores do conjunto dividida pelo número total dos valores. Média aritmética: Desvio padrão Medida do espalhamento das observações em torno da média. Calcula-se a diferença de cada valor individual em relação à média. Dividindo-se a soma dos quadrados de todos os desvios por N-1 obtém- se a variância. Variância amostral Desvio padrão amostral EXERCÍCIO 6: Calcule a média e o desvio padrão dos dez primeiros valores da Tabela 2. (de 0,1188 a 0,1409) Na amostra de 140 caroços de feijão, os limites do intervalo definido por um desvio padrão em torno da média são 0,2024 +/- 0,0363, ou 0,1661 g e 0,2387 g. A região compreendida entre esses dois valores corresponde a 66,6% da área total do histograma, o que significa que nela caem dois terços de todas as observações. A região definida por dois desvios padrão, tendo como limites 0,1298 g e 0,2750 g detém 96,6% da área total. Dentro de certas suposições, que serão discutidas adiante, esses intervalos podem ser utilizados para testar hipóteses a respeito da população. EXERCÍCIO 7: Calcule a média e o desvio padrão do conjunto de valores da Tabela 2 e determine os limites do intervalo definido por dois desvios padrão em torno da média. Compare o intervalo de confiança dado no texto para os valores da titulação.
Compartilhar