Prévia do material em texto
Disciplina Probabilidade e Estatística Patrícia Mascarenhas Dias Apresentação Nome: Patrícia Mascarenhas Dias ➢ Formação: Matemática Ano: 2002 Universidade de Formiga Apresentação Nome: Patrícia Mascarenhas Dias ➢ Formação: Matemática Ano: 2002 Universidade de Formiga ➢ Mestre em Modelagem Matemática e Computacional Ano 2011 Centro Federal de Educação Tecnológica de Minas Gerais – CEFET Apresentação Nome: Patrícia Mascarenhas Dias ➢ Formação: Matemática Ano: 2002 Universidade de Formiga ➢ Mestre em Modelagem Matemática e Computacional Ano 2011 Centro Federal de Educação Tecnológica de Minas Gerais – CEFET ➢ Doutoranda em Modelagem Matemática e Computacional Centro Federal de Educação Tecnológica de Minas Gerais – CEFET Apresentação • Nome: Patrícia Mascarenhas Dias • Email: patricia.dias@uemg.br • Local de Trabalho: ➢ Universidade do Estado de Minas Gerais – UEMG – Desde 2012 Disciplinas Lecionadas: Cálculo I, II e III, GAAL, Matemática Discreta, Probabilidade e Estatística, Métodos Numéricos e Computacionais ➢ EE Joaquim Nabuco – Desde 2016 Leciono desde 2003 mailto:patricia.dias@uemg.br Distribuição das Aulas Engenharia de Produção Engenharia Civil Engenharia da Computação (Mat) Engenharia da Computação (Not) 5ª Feira 5ª Feira Sexta-feira Sábado 7:00 às 9:30 9:45 às 12:15 9:45 às 12:15 7:00 às 9:30 511 504 516 520 Ementas • EMENTA Engenharia da computação: Probabilidade. Variáveis aleatórias discretas e contínuas unidimensionais e bidimensionais. Distribuições de probabilidades discretas (Poisson e binomial) e contínuas (normal e exponencial). Introdução aos processos estocásticos. Correlação e auto correlação. • EMENTA Engenharia Civil e Produção: Probabilidade. Distribuições de probabilidade: binominal, normal, Poisson. Distribuição de frequência – tabelas e gráficos. Medidas de tendência central. Medidas de dispersão. Amostragem. Distribuição amostral. Testes de hipóteses. Objetivos Geral Adquirir conhecimentos específicos no cálculo das probabilidades e suas variáveis, auxiliando na determinação de estatísticas. Específicos ➢ Estabelecer o significado de um experimento estatístico identificando as variáveis a serem estudadas; ➢ Desenvolver a capacidade crítica e analítica do aluno através de discussão. ➢ Ao final do curso, os alunos devem estar aptos a interpretar e analisar corretamente informações que envolvem probabilidade e estatística. Além disso, devem resumir e fazer uma primeira análise em um conjunto de dados. METODOLOGIA DE ENSINO • Aulas expositivas em sala; • Estudos de caso; • Trabalhos individuais AVALIAÇÃO DO PROCESSO DE ENSINO E APRENDIZAGEM Provas individuais para avaliar o domínio do conteúdo e capacidade de raciocínio lógico. AVALIAÇÃO DO PROCESSO DE ENSINO E APRENDIZAGEM Provas individuais para avaliar o domínio do conteúdo e capacidade de raciocínio lógico. Cronograma das Provas Engenharia de Produção Engenharia Civil Engenharia da Computação (Mat) Engenharia da Computação (Not) 26/03 26/03 27/03 28/03 14/05 14/05 22/05 23/05 02/07 02/07 03/07 04/07 RECURSOS NECESSÁRIOS • Quadro, datashow, computadores com acesso à Internet Bibliografias • BIBLIOGRAFIA BÁSICA: CRESPO, A. A. Estatística fácil. 18. ed. São Paulo: Saraiva, 2006. FONSECA, J. S.; MARTINS, G. A. Curso de estatística. 6. ed. São Paulo: Atlas, 2008. MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo: Universidade de São Paulo, 2004. • BIBLIOGRAFIA COMPLEMENTAR: ANDERSON, David Ray. Estatística aplicada à administração e economia. 2. ed. São Paulo: Cengage Learning, 2008. BRUNI, Adriano Leal. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007. CASTANHEIRA, Nelson. Estatística aplicada a todos níveis. Curitiba: IBPEX Ltda, 2003. COSTA NETO, Pedro Luiz de Oliveira. Estatística. 2.ed. São Paulo: Edgard Blücher, 2002. VIEIRA. S. Elementos de estatística. 4. Ed. São Paulo: Atlas, 2006. Introdução a estatística e análise de dados Patrícia Mascarenhas Dias Método Estatístico • Método é o conjunto de procedimentos dispostos ordenadamente para se chegar a um desejado fim. Dos métodos científicos pode-se destacar: • Método Experimental: consiste em manter constantes todas as causas (fatores, componentes, variáveis), menos uma, e variar essa última para descobrir seus efeitos, caso existam. • Método Estatístico: diante da impossibilidade de manter as causas constantes, registram-se os resultados dessas variações procurando determinar a influência (os efeitos) de cada uma delas. • A Estatística é parte da Matemática Aplicada que fornece métodos de coleta, organização, descrição, análise e interpretação de dados, úteis nas tomadas de decisão. • Estatística Descritiva: coleta, organização e descrição dos dados. • Estatística Indutiva ou Inferencial: análise e interpretação dos dados. Permite obter conclusões que transcendam os dados obtidos inicialmente, objetivo essencial da Estatística. • Probabilidade: útil para analisar situações que envolvem o acaso. Ex: a decisão de parar de imunizar pessoas com mais de vinte anos contra determinada doença. Método Estatístico(Pesquisa) Exemplos: • Indústrias realizam pesquisa entre os consumidores para o lançamento de um novo produto • As pesquisas eleitorais fornecem elementos para que os candidatos direcionem a campanha • A pesquisa é composta basicamente de 5 fases Método Estatístico(Pesquisa) A pesquisa é composta basicamente de 5 fases: ➢ 1a Coleta de Dados ➢ 2a Crítica dos Dados ➢ 3a Apuração dos Dados ➢ 4a Exposição dos Dados ➢ 5a Análise dos Resultados Método Estatístico(Pesquisa) ➢ 1a Coleta de Dados Após definirmos cuidadosamente o problema que se quer pesquisar, damos início á coleta dos dados numéricos necessários à sua descrição. A coleta pode ser direta ou indireta. Método Estatístico(Pesquisa) A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários. Método Estatístico(Pesquisa) A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários. Classificação da Coleta Direta Contínua Periódica Ocasional Método Estatístico(Pesquisa) A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. Método Estatístico(Pesquisa) ➢ 2a Crítica dos Dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou certo vulto, que possam influir sensivelmente nos resultados. Método Estatístico(Pesquisa) ➢ 3a Apuração dos Dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação Pode ser manual ou eletrônica. Método Estatístico(Pesquisa) ➢ 4a Exposição dos Dados Através de tabelas ou gráficos, tornando mais fácil seu exame e aplicação de um cálculo estatístico Método Estatístico(Pesquisa) ➢ 5a Análise dos Resultados Após a apresentação dos dados devemos calcular as medidas típicas convenientes para fazermos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, e tirarmos desses resultados conclusões e previsões.Algumas Definições • População: em Estatística, a palavra população tem significado muito mais amplo do que no vocabulário leigo. Para o estatístico, todos os valores que uma variável pode assumir, nos elementos de um conjunto, constitui uma população. • Amostra: é um subconjunto finito de uma população. • Amostragem: É o processo de colher amostras. Nesse processo, cada elemento da população passa a ter a mesma chance de ser escolhido. Dentre os processos de amostragem pode-se destacar três: amostragem casual ou aleatória simples, amostragem proporcional estratificada e amostragem sistemática. Tipos de amostragem Amostragem casual ou aleatória simples: Este tipo de amostragem é equivalente a um sorteio lotérico. A Amostragem Aleatória Simples é constituída de elementos retirados ao acaso da população. Então todo elemento da população tem probabilidade fixa de ser amostrado. Por isso é que a esse tipo de amostragem tende a produzir amostras representativas. Geralmente são considerados aleatórios os seguintes processos: • A chegada de carros a um posto de pedágio • As chamadas telefônicas numa grande mesa de operação • A chegada de clientes aos caixas de um supermercado Tipos de amostragem Amostragem proporcional estratificada: É comum termos populações que se dividam em subpopulações (estratos) e como cada estrato pode ter um comportamento diferente do outro, a amostra deve considerar a existência desses estratos e a sua proporção em relação à população. Exemplo: supondo que uma sala de aula seja composta de 54 meninos e 36 meninas. Determine uma amostra de 9 pessoas: Sexo População Cálculo Proporcional Regra de três simples Amostra Masculino 54 Feminino 36 Total 90 Tipos de amostragem Amostragem proporcional estratificada: É comum termos populações que se dividam em subpopulações (estratos) e como cada estrato pode ter um comportamento diferente do outro, a amostra deve considerar a existência desses estratos e a sua proporção em relação à população. Exemplo: supondo que uma sala de aula seja composta de 54 meninos e 36 meninas. Determine uma amostra de 9 pessoas: Sexo População Cálculo Proporcional Regra de três simples Amostra Masculino 54 54 x 9 / 90 = 5,4 Feminino 36 36 x 9 / 90 = 3,6 Total 90 9 Tipos de amostragem Amostragem proporcional estratificada: É comum termos populações que se dividam em subpopulações (estratos) e como cada estrato pode ter um comportamento diferente do outro, a amostra deve considerar a existência desses estratos e a sua proporção em relação à população. Exemplo: supondo que uma sala de aula seja composta de 54 meninos e 36 meninas. Determine uma amostra de 9 pessoas: Sexo População Cálculo Proporcional Regra de três simples Amostra Masculino 54 54 x 9 / 90 = 5,4 5 Feminino 36 36 x 9 / 90 = 3,6 4 Total 90 9 9 Tipos de amostragem Amostragem Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir um sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A Amostragem Sistemática é constituída de elementos retirados da população segundo um sistema preestabelecido. Tipos de amostragem Exemplo de Amostragem Sistemática: Aplicar um questionário de satisfação sobre os serviços prestados por uma agência bancária em 10 clientes de um banco de dados de 100 pessoas. Para encontrarmos os pontos onde faremos as coletas sistemáticas das amostras, podemos seguir os seguintes passos: 1º calcular a razão 𝐾 = 𝑁/𝑛 𝑁=100 e 𝑛=10 Tipos de amostragem Exemplo de Amostragem Sistemática: Aplicar um questionário de satisfação sobre os serviços prestados por uma agência bancária em 10 clientes de um banco de dados de 100 pessoas. Para encontrarmos os pontos onde faremos as coletas sistemáticas das amostras, podemos seguir os seguintes passos: 1º calcular a razão 𝐾 = 𝑁/𝑛 𝑁=100 e 𝑛=10 2º Sortear um número de 01 a K. Tipos de amostragem Exemplo de Amostragem Sistemática: Aplicar um questionário de satisfação sobre os serviços prestados por uma agência bancária em 10 clientes de um banco de dados de 100 pessoas. Para encontrarmos os pontos onde faremos as coletas sistemáticas das amostras, podemos seguir os seguintes passos: 1º calcular a razão 𝐾 = 𝑁/𝑛 𝑁=100 e 𝑛=10 2º Sortear um número de 01 a K. 3º Obter a amostra: número sorteado, número sorteado + R, número sorteado + 2R, número sorteado + 3R, ... Estatística Descritiva • Tipos de Variáveis Variáveis Qualitativas - referem-se a dados não numéricos. Exemplos dessas variáveis são o sexo das pessoas, a cor, o grau de instrução. Variáveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala numérica. Exemplos: idade de pessoas, preço de produtos, peso de recém nascidos. Estatística Descritiva – Variáveis Qualitativas São variáveis qualitativas nominais: Turma (A ou B), sexo (F ou M), cor dos olhos, campo de estudo, etc. 17 São variáveis qualitativas ordinais: Tamanho (pequeno, médio ou grande), Classe social (baixa, média ou alta), etc. Estatística Descritiva – Variáveis Quantitativas Podem-se dividir em dois tipos variáveis quantitativas discretas e variáveis quantitativas contínuas. VARIÁVEIS DISCRETAS: quando seus valores forem expressos por números inteiros. Número de irmãos, de alunos numa sala de aula, de defeitos num carro novo, etc. VARIÁVEIS CONTÍNUAS: quando seus valores forem expressos em intervalos Altura, peso, comprimento, espessura, velocidade, etc. Classificação das variáveis Resumo da Classificação das variáveis. Distribuição de Frequência Uma distribuição de freqüência é um método de grupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o número ou a percentagem de observações em cada classe. O número ou percentagem numa classe chama-se freqüência de classe. Uma distribuição de freqüência pode ser apresentada sob forma gráfica ou tabular. Tipos de frequências Frequência simples ou absoluta (f): São os valores que realmente representam o número de dados de cada classe. Tipos de frequências Frequência relativa (fr): São os valores das razões entre as frequências simples e a frequência total. Normalmente calcula-se a frequência relativa para efeito de comparação com outros grupos ou conjunto de dados. Convém notar que, quando estivermos comparando dois grupos com relação às frequências de ocorrência dos valores de uma dada variável, grupos com um número total de dados maior tendem a ter maiores frequências de ocorrência dos valores da variável. Dessa forma, o uso de frequência relativa vem resolver este problema. Tipos de frequências Frequência acumulada (F): É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Normalmente utilizamos esse tipo de frequência quando tratamos de variáveis qualitativas ordinais ou quantitativas em geral. Tipos de frequências Freqüência acumulada relativa (Fr): É o total das frequências relativas de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Como no caso anterior utilizamos esse tipo de frequência quando tratamos de variáveis qualitativas ordinais ou quantitativas em geral. Tabelas e Gráficos Os dados depois de tratados podem ser apresentados em tabelas. Existem normas nacionais para a organização de tabelas, ditadas pela ABNT. Essas normas não serão tratadas aqui, mas convém saber que as tabelas devem ter os seguintes componentes: Título: Precede a tabela e explica, em poucas palavras, o dado em estudo. Se for o caso, indica o tempo e o lugar a que os dados se referem. Cabeçalho: Especifica o conteúdo de cada coluna Coluna Indicadora: Especifica em cada linha os valores que os dados podem assumir. Corpo da tabela:Apresenta a frequência dos dados. Fonte: Especifica a entidade, o pesquisador ou pesquisadores que forneceram os dados, quando esses não foram coletados por você. Tabelas e Gráficos - Exemplo Séries Estatísticas a) Séries históricas (cronológicas, temporais) - descrevem os valores da variável, em determinado local, em função do tempo Exemplo: Ano Total(1) Analfabeta(1) Taxa de Analfabetismo 1900 9.728 6.348 65,3 1920 17.564 11.409 65 1940 23.648 13.269 56,1 1950 30.188 15.272 50,6 1960 40.233 15.964 39,7 1970 53.633 18.100 33,7 1980 74.600 19.356 25,9 1991 94.891 18.682 19,7 2000 119.533 16.295 13,6 Tabela – Analfabetismo na faixa de 15 anos ou mais - Brasil - 1900/2000 Fonte: IBGE, Censo Demográfico. Nota: (1) Em milhares Séries Estatísticas b) Séries geográficas (espaciais, territoriais ou de localização) - descrevem os valores da variável, em um determinado instante, em função da região Séries Estatísticas c) Séries Específicas (categóricas) - descrevem os valores da variável, em um determinado instante e local, segundo especificações. Séries Estatísticas d) Séries Conjugadas - Tabela de Dupla Entrada. É a união de duas séries em uma só tabela. Exercícios de População e Amostra 1) Uma universidade apresenta o seguinte quadro relativo aos seus alunos do curso de Matemática. Obtenha uma amostra proporcional estratificada de 100 alunos. Série Qtde Amostra 1a 85 2a 70 3a 80 4a 75 Total 100 Exercícios de População e Amostra 2) Uma cidade X apresenta o seguinte quadro relativo às suas escolas de 1o grau Obtenha uma amostra proporcional estratificada de 120 estudantes Escola Homens Mulheres Total Amostra Homens Mulheres Total A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 120 Exercícios de População e Amostra 3) Utilizando a tabela de números aleatórios, obtenha uma amostra de 10 pessoas de uma sala de aula com 85 alunos, utilize a 10a e a 11a coluna para começar o sorteio. Gráficos Estatísticos Os gráficos também são uma forma de apresentação dos dados coletados na pesquisa. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil: Simplicidade Clareza Veracidade Gráfico de Linhas Os gráficos de linhas são muito utilizados para mostrar a evolução durante um certo período (séries temporais). O gráfico permite visualizar muito bem o crescimento, o decréscimo ou a estabilidade do objeto a ser analisado. Gráfico de Linhas Os gráficos de linhas são muito utilizados para mostrar a evolução durante um certo período (séries temporais). O gráfico permite visualizar muito bem o crescimento, o decréscimo ou a estabilidade do objeto a ser analisado. Gráfico de Linhas Comparativas Gráfico de Barras No geral, é usado para comparar as freqüências de mesma variável em um determinado momento. Freqüência é o número de vezes que cada resposta ou cada intervalo de resposta aparece na tabela do pesquisador, a qual pode ter sido feita por amostragem. Gráfico de Barras No geral, é usado para comparar as freqüências de mesma variável em um determinado momento. Freqüência é o número de vezes que cada resposta ou cada intervalo de resposta aparece na tabela do pesquisador, a qual pode ter sido feita por amostragem. Gráfico de “Pizza” ou de Setores O gráfico de setores também é muito usado e faz enxergar melhor as partes do todo (representadas em porcentagens). Para ser traçado, é necessário saber que o círculo todo tem 360° , o que corresponde a 100%. De acordo com a pesquisa, o círculo será repartido, efetuando-se uma regra de três simples. Gráfico de “Pizza” ou de Setores O gráfico de setores também é muito usado e faz enxergar melhor as partes do todo (representadas em porcentagens). Para ser traçado, é necessário saber que o círculo todo tem 360° , o que corresponde a 100%. De acordo com a pesquisa, o círculo será repartido, efetuando-se uma regra de três simples. Gráfico Pictorial - Pictograma O gráfico de pictorial tem por objetivo despertar a atenção do público em geral, muito desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados. Distribuição de Frequência para Variáveis Quantitativas Discretas Exemplo: Considere os seguintes dados relativos ao número de acidentes diários num grande estacionamento, durante um período de 50 dias. Nº de acidentes diários num estacionamento, durante 50 dias 0 – 0 – 0 – 1 – 1 – 2 – 2 – 2 – 2 – 2 3 – 3 – 3 – 3 – 3 – 3 – 4 – 4 – 4 – 4 4 – 4 – 4 – 4 – 4 – 5 – 5 – 5 – 5 – 5 5 – 5 – 6 – 6 – 6 – 6 – 6 – 6 – 6 7 7 – 7 – 7 – 7 – 7 – 8 – 8 – 8 – 8 – 9 Distribuição de Frequência para Variáveis Quantitativas Discretas Exemplo: Considere os seguintes dados relativos ao número de acidentes diários num grande estacionamento, durante um período de 50 dias. Distribuição de Frequência para Variáveis Quantitativas Discretas Exemplo: Considere os seguintes dados relativos ao número de acidentes diários num grande estacionamento, durante um período de 50 dias. Distribuição de Frequência para Variáveis Quantitativas Discretas Exemplo: Considere os seguintes dados relativos ao número de acidentes diários num grande estacionamento, durante um período de 50 dias. Distribuição de Frequência para Variáveis Quantitativas Contínuas Exemplo: Considere os dados brutos que representam a safra, em alqueires, por árvore, para um conjunto de 40 pessegueiros. Safra atual em (alqueire/ árvore) para 40 Pessegueiros 11,1 - 12,5 - 32,4 - 7,8 - 21,0 - 16,4 - 11,2 - 22,3 - 4,4 - 6,1 - 27,5 - 32,8 - 18,5 - 16,4 - 15,1 - 6,0 - 10,7 - 15,8 - 25,0 - 18,2 - 12,2 - 12,6 - 4,7 - 23,5 14,8 - 22,6 - 16,0 - 19,1 - 7,4 - 9,2 - 10,0 - 26,2 - 3,5 - 16,2 - 14,5 - 3,2 - 8,1 - 12,9 - 19,1 - 13,7 Distribuição de Frequência para Variáveis Quantitativas Contínuas Exemplo: Considere os dados brutos que representam a safra, em alqueires, por árvore, para um conjunto de 40 pessegueiros. Construção do Rol – Ordem Crescente 3,2 - 3,5 - 4,4 - 4,7 - 6 - 6,1 - 7,4 - 7,8 - 8,1 - 9,2 - 10,0 - 10,7 - 11,1 - 11,2 - 12,2 - 12,5 - 12,6 - 12,9 - 13,7 - 14,5 - 14,8 - 15,1 - 15,8 - 16,0 - 16,2 - 16,4 - 16,4 - 18,2 - 18,5 - 19,1 - 19,1 - 21,0 - 22,3 - 22,6 - 23,5 25,0 - 26,2 - 27,5 - 32,4 - 32,8 Distribuição de Frequência para Variáveis Quantitativas Contínuas Cálculo da Amplitude Total 𝑅 = 𝑀𝑎𝑖𝑜𝑟 𝑀𝑒𝑑𝑖𝑑𝑎 − 𝑀𝑒𝑛𝑜𝑟 𝑀𝑒𝑑𝑖𝑑𝑎 Distribuição de Frequência para Variáveis Quantitativas Contínuas Calcular o número de intervalos (K) 𝑘 = 𝑛 Onde 𝑛 é número de dados Distribuição de Frequência para Variáveis Quantitativas Contínuas Cálculo da amplitude da Classe ℎ = 𝑅 𝑘 Distribuição de Frequência para Variáveis Quantitativas Contínuas Construção da Tabela Distribuição de Frequência para Variáveis Quantitativas Contínuas Construção da Tabela