Baixe o app para aproveitar ainda mais
Prévia do material em texto
FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 1 Prezado aluno, Esta apostila é a versão estática, em formato .pdf, da disciplina online e contém todas as informações necessárias a quem deseja fazer uma leitura mais linear do conteúdo. Os termos e as expressões destacadas de laranja são definidos ao final da apostila em um conjunto organizado de texto denominado NOTAS. Nele, você encontrará explicações detalhadas, exemplos, biografias ou comentários a respeito de cada item. Além disso, há três caixas de destaque ao longo do conteúdo. A caixa de atenção é usada para enfatizar questões importantes e implica um momento de pausa para reflexão. Trata-se de pequenos trechos evidenciados devido a seu valor em relação à temática principal em discussão. A galeria de vídeos, por sua vez, aponta as produções audiovisuais que você deve assistir no ambiente online – aquelas que o ajudarão a refletir, de forma mais específica, sobre determinado conceito ou sobre algum tema abordado na disciplina. Se você quiser, poderá usar o QR Code para acessar essas produções audiovisuais, diretamente, a partir de seu dispositivo móvel. Por fim, na caixa de Aprenda mais, você encontrará indicações de materiais complementares – tais como obras renomadas da área de estudo, pesquisas, artigos, links etc. – para enriquecer seu conhecimento. Aliados ao conteúdo da disciplina, todos esses elementos foram planejados e organizados para tornar a aula mais interativa e servem de apoio a seu aprendizado! Bons estudos! FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 2 Introdução O começo de uma solução bem-sucedida de um problema que envolva estatísticas está diretamente associado à correta prática da coleta de dados em campo. Um modelo corretamente desenvolvido, alimentado por dados ou parâmetros não representativos da realidade em questão, acaba sendo inútil para o desenvolvimento de uma solução. Esta aula apresenta os princípios e métodos que orientam a correta coleta e o tratamento de dados para modelagem e solução de problemas de natureza probabilística e também apresenta os métodos de amostragem que podem ser úteis na modelagem para solução desses problemas. Objetivo: 1. Definir os princípios e métodos para coleta e tratamento de dados. 2. Identificar os métodos de amostragem úteis na modelagem e solução de problemas. FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 3 Conteúdo Coleta de Dados A coleta de dados começa com a escolha adequada das variáveis de entrada do sistema a ser analisado. Os dados são divididos em: Dados de entrada São os valores coletados em campo. Dados de saída São os valores processados de acordo com o modelo probabilístico selecionado para tratar um determinado problema. A coleta dos dados da amostra de uma população pode ser feita da seguinte maneira: Primeiro, marcamos uma linha imaginária na entrada do estabelecimento. Quando um cliente ultrapassá-la, é o momento de anotar o tempo atual do cronômetro, zerá-lo e dispará-lo novamente para a próxima coleta. Dessa maneira, é possível registrar os dados colhidos em uma tabela para que os mesmos sejam tratados. Atenção Na construção de uma amostra, deve-se ter atenção aos seguintes cuidados práticos: • O tamanho da amostra deve estar entre 100 e 200 observações; • Amostras com menos de 100 observações podem comprometer a identificação do melhor modelo probabilístico; FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 4 • Amostras com mais de 200 observações não trazem ganhos significativos ao estudo; • Coletar e anotar as observações na mesma ordem em que o fenômeno está ocorrendo, para permitir a análise de correlação; • Avaliar se existe alguma suspeita de que os dados mudam em função do horário ou do dia da coleta. A coleta deve ser refeita em outros horários e dias; • Na modelagem de dados, vale a regra: toda suspeita deve ser comprovada ou descartada estatisticamente. Tratamento dos Dados Utilizando as ferramentas da estatística descritiva, podemos explorar um conjunto de dados, de modo a compreendermos melhor um determinado fenômeno. Essa é a fase em que extraímos as medidas da variável aleatória em estudo: De posição (média, mediana, moda etc.). De dispersão (variância, amplitude etc.). A tabela a seguir resume as principais medidas de posição e dispersão obtidas a partir dos dados coletados no exemplo do banco: FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 5 Ao observarmos a tabela, podemos notar um valor atípico. Com a média aritmética de 15,02 e a mediana 6, o valor 730 destoa do conjunto. Será que esse valor foi digitado de forma errada, foi originado de um erro operacional na coleta ou é um dado que realmente ocorreu? É conveniente considerar o valor discrepante ou seria aconselhável eliminar o dado do conjunto? O procedimento para filtrar anomalias de dados na coleta é chamado de identificar outliers ou, simplesmente, os pontos fora da curva. Iremos estudá-los a seguir. Pontos fora da curva As razões mais comuns para o surgimento de pontos fora da curva são algum erro na coleta de dados ou um evento raro e totalmente inesperado. Vejamos: Erro na coleta de dados Quando o levantamento de dados é feito por meio manual, este tipo de ponto fora da curva é o mais comum. Exemplo: Imagine que, durante a coleta de dados no banco, houve uma troca de pesquisadores. Quando o primeiro passou o cronômetro para o segundo, o cronômetro e a planilha não foram corretamente atualizados, o que resultou em um valor de 730 segundos entre um cliente e outro. Falhas em equipamentos de coleta de dados, problemas na conversão de arquivos, máquinas que suspendem FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 6 o serviço temporariamente por defeito, entre outros, são causadores clássicos de outliers. Quando descobrimos um outlier desse tipo, o mais correto é retirá-lo da amostra. Eventos raros Este é o tipo de outlier mais difícil de lidar. Nada impede que situações totalmente atípicas ocorram na nossa coleta de dados. A tabela a seguir compara o impacto de retirarmos ou não o outlier identificado, o valor 730, de nosso exemplo. Apesar de se tratar apenas de um valor em uma amostra de 100 valores no total, as distorções na média e na variância são significativas. Inferência Para o tratamento dos dados, além do cálculo dos outliers, é conveniente dispor os dados em classes e obter a distribuição de frequências em um histograma. Dessa maneira, é possível identificar visualmente o padrão que indica a distribuição dos dados. Com isso, conseguimos julgar quais valores devem ser eliminados pelo cálculo de outliers. Para agrupar os dados em classes é necessário calcular: O tamanho da classe; A quantidade de classes; Os limites de início e fim de cada classe; FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 7 A frequência (quantos valores se enquadram em cada uma delas). A definição do número de classes pode ser feita, por exemplo, pelo cálculo da raiz quadrada do número de elementos, no caso, 100 (10 classes), ou pela chamada regra de Sturges, que adota um número de classes igual a: Em que n é o número de observações na amostra: Para que cada classe seja definida é necessário calcular o seu tamanho (h). Isso é feito dividindo-se a amplitude da amostra pelo número de classes escolhido. Para o exemploque acabamos de ver, podemos escolher o número de classes igual a 10. Descartando o único valor realmente discrepante, 730, a amplitude da amostra é 28 (30-2). Assim: FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 8 Atenção Vejamos a distribuição das classes de frequências do exemplo do banco: Vejamos o histograma a seguir: Observando a distribuição de frequências no histograma, é possível inferir que esta se assemelha a uma distribuição exponencial. FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 9 Análise exploratória dos dados de uma amostra Suponha que a média e a variância de uma população X que desejamos estudar não são conhecidas. Retiramos uma amostra de n elementos e estimamos esse parâmetro. Vejamos as fórmulas que devemos utilizar: Atenção Uma fórmula operacional mais simples para o cálculo do estimador da variância é: FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 10 Referências FREIRE, P. Pedagogia da autonomia: saberes necessários à prática educativa. São Paulo: Paz e Terra, 2007. LEITE, M. S. Diversidade e saberes no ensino superior, 2005. PIMENTA, S. G.; ANASTASIOU, L. G. C. Do ensinar à Ensinagem. In: Docência no Ensino Superior, vol. I. São Paulo: Cortez, 2002. p. 201 a 243. RIBEIRO, M. L. O Ensino Universitário: um olhar sobre as representações de estudantes de Licenciatura, 2008. FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 11 Exercícios de fixação Questão 1 Considere a tabela a seguir que contém dados de uma amostra com suas respectivas frequências absolutas. O estimador da variância da população é: a) 112,47 b) 129,11 c) 130,14 d) 138,12 e) 143,57 Questão 2 Utilizando a lei de Struges, calcule o número de classes para uma amostra contendo 300 dados. a) 12 b) 11 c) 8 d) 10 e) 9 FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 12 Questão 3 Considere a tabela a seguir contendo dados de uma amostra e obtenha os limites inferior e superior para identificação de outliers moderados. a) 245,45 e 496,12 b) 268,26 e 462,83 c) 277,52 e 465,72 d) 254,75 e 480,75 e) 285,38 e 479,36 Questão 4 Considere a tabela a seguir que sumariza estatísticas obtidas em várias provas realizadas por uma turma. Em qual prova essa turma teve o melhor desempenho? a) Inglês b) Lógica c) Economia d) Estatística e) Matemática FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 13 Questão 5 Considere a tabela a seguir contendo dados de uma amostra e obtenha os limites inferior e superior para identificação de outliers extremos. a) 145,4 e 596,1 b) 170,0 e 565,5 c) 187,5 e 565,7 d) 154,7 e 580,7 e) 185,3 e 579,3 Questão 6 Foi observado que as alturas de 3.000 estudantes são normalmente distribuídas com média 172,72cm e desvio-padrão 7,62cm. Se forem obtidas 80 amostras com reposição de 25 estudantes cada uma, qual será a média esperada da distribuição amostral das médias? a) 168,57 cm b) 170,13 cm c) 167,34 cm d) 172,72 cm e) 169,38 cm FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 14 Questão 7 Foi observado que as alturas de 3.000 estudantes são normalmente distribuídas com média 172,72cm e desvio-padrão 7,62cm. Se forem obtidas 80 amostras com reposição de 25 estudantes cada uma, qual será o desvio-padrão esperado da distribuição amostral das médias? a) 7,62 cm b) 1,524 cm c) 3,45 cm d) 2,456 cm e) 5,76 cm Questão 8 Uma prévia eleitoral mostrou que certo candidato recebeu 46% dos votos. Em uma seção eleitoral determine qual o desvio-padrão obtido para uma amostra constituída de 1.000 pessoas selecionadas ao acaso entre a população votante. a) 0,0147 b) 0,0232 c) 0,0158 d) 0,0213 e) 0,0138 Questão 9 As lâmpadas do fabricante A têm duração média de 1.400 horas, com um desvio- padrão de 200 horas, enquanto as do fabricante B têm duração média de 1.200 horas, com um desvio-padrão de 100 horas. Se forem ensaiadas amostras FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 15 aleatórias de 125 lâmpadas, qual o desvio-padrão da distribuição amostral das diferenças das médias? a) 19 b) 21 c) 22 d) 25 e) 20 Questão 10 As medidas de duas distâncias são 27,3m e 15,6m, com os desvios-padrão de 0,16m e 0,08m, respectivamente. Determine a média e o desvio-padrão da soma das distâncias. a) 40,8m e 0,23m b) 42,9m e 0,18m c) 41,5m e 0,21m d) 42,8m e 0,19m e) 41,9m e 0,18m FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 16 Aula 7 Exercícios de fixação Questão 1 - B Justificativa: Questão 2 - E Justificativa: K=1+3,22 log10300=1+3,22 x 2,477121=8,97 ≈ 9 classes. Questão 3 - D Justificativa: Para obtermos os limites precisamos calcular Q1-1,5A e Q3+1,5A. Ordenando os dados, do menor para o maior, identificamos Q1=339,5 e Q3=396. A = Q3-Q1=56,5. Logo: Q1-1,5A=254,75 e Q3+1,5A=480,75 Questão 4 - A Justificativa: O melhor desempenho foi na disciplina Inglês, pois além de obter a melhor média, também obteve a menor dispersão. FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 17 Questão 5 - B Justificativa: Para obtermos os limites precisamos calcular Q1-3A e Q3+3A. Ordenando os dados, do menor para o maior, identificamos Q1=339,5 e Q3=396. A=Q3-Q1=56,5. Logo: Q1-3A=170 e Q3+3A=565,5. Questão 6 - D Justificativa: Como a população é muito grande em relação a amostra, podemos considerar o caso de população infinita com amostragem com reposição, então: Questão 7 - B Justificativa: Como a população é muito grande em relação a amostra, podemos considerar o caso de população infinita com amostragem com reposição, então: Questão 8 - C Justificativa: N=1.000, p=0,54 e q=0,46 Questão 9 - E Justificativa: NA=NB=125, σ_A=100 e σ_B=200. Questão 10 - B Justificativa: FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 18 FUNDAMENTOS DA MAT. FINANCEIRA E ESTAT. APLICADA 19 Beniamin Achilles Bondarczuk é Doutor em Engenharia de Produção pelo Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia da Universidade Federal do Rio de Janeiro (COPPE-UFRJ), Mestre em Engenharia de Sistemas e Computação e Graduado em Engenharia Mecânica e de Automóveis pelo Instituto Militar de Engenharia (IME). Foi professor do IME e de várias Instituições de Ensino Superior (IES) no Rio de Janeiro, em cursos de Graduação e Pós-Graduação. Atualmente, é Oficial do Exército e trabalha com pesquisa, desenvolvimento e avaliação de produtos de defesa. Currículo Lattes: http://lattes.cnpq.br/3689092970048757.
Compartilhar