Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIÊNCIAS E TECNOLOGIA AGROALIMENTAR - CAMPUS POMBAL DISCIPLINA: ESTATÍSTICA BÁSICA NOTAS DE AULA ESTATÍSTICA BÁSICA Prof. MSc. Carlos Sérgio Araújo dos Santos POMBAL - PB NOVEMBRO de 2013 Sumário 1 Introdução Geral p. 9 1.1 A Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 9 1.2 Estatística Descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 10 1.3 A Natureza da Estatística (Classificação das variáveis . . . . . . . . . . . p. 10 1.4 Fases do Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . p. 11 1.5 Pesquisas e Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 1.6 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 13 1.7 Tabelas Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14 1.8 Elementos de uma Tabela . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14 1.9 Representação esquemática . . . . . . . . . . . . . . . . . . . . . . . . . p. 15 1.10 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 15 1.10.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 15 1.10.2 Distribuição de frequência sem intervalos de classe . . . . . . . . p. 16 1.10.3 Distribuição de frequência com intervalos de classe . . . . . . . . p. 16 1.10.4 Elementos de uma Distribuição de Frequência . . . . . . . . . . . p. 17 1.10.5 Método Prático para construção de uma distribuição de frequências com classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 18 1.10.6 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . p. 18 1.11 Representação Gráfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 19 1.12 Gráficos utilizados para a análise de uma distribuição de freqüência . . . p. 20 1.12.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20 1.12.2 Polígono de Freqüências . . . . . . . . . . . . . . . . . . . . . . . p. 20 1.12.3 Ogivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21 1.12.4 Gráfico por linha . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 21 1.12.5 Gráfico por colunas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 22 1.12.6 Diagrama por Superfície em Setores . . . . . . . . . . . . . . . . . p. 22 2 Análise Exploratória de Dados p. 24 2.1 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24 2.1.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24 2.1.2 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 26 2.1.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 28 2.2 Quartis, Decis e Percentis (ou Centis) . . . . . . . . . . . . . . . . . . . . p. 31 2.3 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31 2.3.1 Primeiro Quartil: Q1 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 31 2.3.2 Segundo Quartil: Q2 ou Md . . . . . . . . . . . . . . . . . . . . . p. 32 2.3.3 Terceiro Quartil: Q3 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 32 2.4 Decis Di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33 2.4.1 Primeiro Decil: D1 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33 2.4.2 Segundo Decil: D2 . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33 2.5 Percentis ou Centis Ci . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 34 2.5.1 Vigésimo Centil: C20 . . . . . . . . . . . . . . . . . . . . . . . . . p. 34 2.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 35 2.6.1 Desvio - Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 36 2.6.2 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37 2.6.3 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . p. 39 2.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40 3 Probabilidade: Espaço amostral e eventos p. 45 3.1 Experimentos Aleatórios . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45 3.1.1 Tipos de fenômenos . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45 3.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45 3.3 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 46 3.4 Classe dos eventos aleatórios . . . . . . . . . . . . . . . . . . . . . . . . p. 46 3.5 Operações com eventos Aleatórios . . . . . . . . . . . . . . . . . . . . . p. 47 3.6 Propriedades das operações . . . . . . . . . . . . . . . . . . . . . . . . . p. 49 3.7 Partição de um Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . p. 50 3.8 Eventos Mutuamente Exclusivos ou Disjuntos . . . . . . . . . . . . . . . . p. 51 3.9 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52 4 Probabilidade: Definições p. 53 4.1 Definição Clássica de Probabilidade . . . . . . . . . . . . . . . . . . . . . p. 53 4.2 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . p. 53 4.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54 4.3 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55 4.4 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . p. 55 4.5 Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 56 4.6 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 57 4.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 59 5 Variáveis Aleatórias discretas p. 62 5.1 Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 62 5.2 Esperança de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 64 5.3 Variância de uma Variável Aleatória Discreta . . . . . . . . . . . . . . . . p. 65 5.4 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 66 5.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68 6 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discre- tas p. 70 6.1 Distribuição de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70 6.2 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 71 6.2.1 Média e Variância de uma v.a. com Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 72 6.3 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73 6.4 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 76 7 Variáveis Aleatórias contínuas p. 78 7.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 78 7.2 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . p. 79 7.3 Esperança de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . p. 80 7.4 Variancia de uma Variável Aleatória Contínua . . . . . . . . . . . . . . . . p. 80 7.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 81 8 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Contínuas p. 83 8.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 83 8.2 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 84 8.2.1 Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 85 8.2.2 Distribuição Normal Padrão . . . . . . . . . . . . . . . . . . . . . . p. 85 8.3 Exercícios . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . p. 88 9 Teoria da Amostragem p. 90 9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90 9.2 Parâmetros e Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 90 9.3 Técnicas de amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91 9.4 Conceitos Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 91 9.5 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 92 9.5.1 As Amostras Probabilísticas . . . . . . . . . . . . . . . . . . . . . p. 92 9.5.2 Amostragem Aleatória Simples . . . . . . . . . . . . . . . . . . . . p. 93 9.5.3 Amostragem Aleatória Estratificada . . . . . . . . . . . . . . . . . p. 93 9.5.4 Amostragem por Conglomerados . . . . . . . . . . . . . . . . . . . p. 94 9.5.5 Amostragem Sistemática . . . . . . . . . . . . . . . . . . . . . . . p. 94 9.6 Amostragem Não-probabilística . . . . . . . . . . . . . . . . . . . . . . . p. 94 9.7 Erros no processo de amostragem . . . . . . . . . . . . . . . . . . . . . . p. 94 9.8 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . p. 95 9.9 Distribuição Amostral das Proporções . . . . . . . . . . . . . . . . . . . . p. 96 9.10 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 98 10 Teoria da Estimação p. 100 10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100 10.2 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100 10.3 Propriedades dos estimadores . . . . . . . . . . . . . . . . . . . . . . . . p. 101 10.3.1 Justeza e não-tedenciosidade . . . . . . . . . . . . . . . . . . . . p. 101 10.3.2 Consistência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 101 10.3.3 Eficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 102 10.3.4 Suficiência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103 10.4 Estimação Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103 10.4.1 Intervalo de Confiança para Média com variância (populacional) conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 103 10.4.2 Intervalo de Confiança para Média com variância (populacional) desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 105 10.4.3 Intervalo de Confiança para proporção populacional . . . . . . . . p. 106 10.4.4 Intervalo de Confiança para Variância . . . . . . . . . . . . . . . . p. 107 10.5 Intervalo de Confiança para a diferença de médias de duas Populações . p. 108 10.5.1 As variâncias σ21 e σ 2 2 (populacionais) são conhecidas . . . . . . . p. 108 10.5.2 As variâncias σ21 e σ 2 2 são desconhecidas mas σ 2 1 = σ 2 2 . . . . . . . p. 109 10.6 Intervalo de Confiança para Diferença de Proporções . . . . . . . . . . . p. 110 10.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 112 11 Testes de Hipóteses p. 118 11.1 Hipótese Nula e Hipótese Alternativa . . . . . . . . . . . . . . . . . . . . . p. 118 11.2 Região Crítica do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 118 11.3 Erros do Tipo I e erros do Tipo II . . . . . . . . . . . . . . . . . . . . . . . p. 119 11.4 Teste da hipótese para média populacional µ . . . . . . . . . . . . . . . . p. 120 11.4.1 σ conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120 11.4.2 σ desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 120 11.5 Teste para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 121 11.6 Teste de hipótese para variância . . . . . . . . . . . . . . . . . . . . . . . p. 122 11.7 Teste da hipótese da igualdade de duas médias . . . . . . . . . . . . . . p. 123 11.7.1 σ21 e σ 2 2 conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 124 11.7.2 σ21 e σ 2 2 desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . p. 124 11.8 Teste de hipótese da diferença entre proporções . . . . . . . . . . . . . . p. 125 11.9 Teste da razão de variâncias . . . . . . . . . . . . . . . . . . . . . . . . . p. 125 11.10Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 128 12 Correlação e Regressão Linear Simples p. 134 12.1 Correlação Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . p. 134 12.1.1 Relação entre variáveis . . . . . . . . . . . . . . . . . . . . . . . . p. 134 12.1.2 Medida de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . p. 134 12.2 Regressão Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 136 12.2.1 Pressuposições . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 137 12.2.2 Método de estimação dos parâmetros α e β . . . . . . . . . . . . . p. 138 12.3 Decomposição da variância total . . . . . . . . . . . . . . . . . . . . . . . p. 140 12.4 Análise de Variância da Regressão . . . . . . . . . . . . . . . . . . . . . p. 141 12.5 Coeficiente de determinação . . . . . . . . . . . . . . . . . . . . . . . . . p. 143 12.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 144 Referências p. 145 9 1 Introdução Geral 1.1 A Estatística Para algumas pessoas, a Estatística não é senão um quadro de colunas mais ou menos longas de números que dizem respeito à população, à indústria ou ao comércio, como se vê frequentemente em revistas; para outras, ela dá gráficos mostrando a vari- ação no tempo de um fato econômico ou social, a produção ou os números relativos aos negócios de uma empresa, assim como se encontra nos escritórios de empresas privadas. A utilização da Estatística é cada vez mais acentuada em qualquer atividade profis- sional da vida moderna. Nos mais diversificados ramos de atuação, as pessoas estão frequentemente expostas à Estatística, utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método estatístico proporciona àqueles que dele necessita. A razão pela qual consideramos a Estatística uma ferramenta importante para tomada de decisões está no fato de que ela não deve ser considerada como um fim em si própria, mas como um instrumento fornecedor de informações que subsidiarão, em consequência, a tomada de melhores decisões, baseadas em fatos e dados. Podemos considerar a Estatística como a ciência que se preocupa com a coleta, or- ganização, descrição, análise e interpretação dos dados experimentais, ou oriundos de estudos observacionais visando a tomada de decisões. Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica- mente em duas partes: A Estatística Descritiva, que se preocupa com a organização e descrição dos dados experimentais, e a Estatística Indutiva, que cuida da sua análise e interpretação. 10 1.2 Estatística Descritiva Principalmente em pesquisa social, o analista defronta-se amiúde com a situação de dispor de tantos dados que se torna difícil absorver completamente a informação que está procurando investigar. É extremamente difícil captar intuitivamente todas as informações que os dados contêm. É necessário, portanto, que as informações sejam reduzidas até o ponto em que se possa interpretá-las mais claramente. Em outras palavras, é indispen- sável resumí-las, através do uso de certas medidas-sínteses, mais comumentes conheci- das como estatística descritiva ou simplesmente estatísticas. Por conseguinte, a estatística descritiva é um número que sozinho descreve uma característica de um conjunto de dados. Trata-se, portanto, de um número-resumo que possibilita reduzir os dados a proporções mais facilmente interpretáveis. Em um sentidomais amplo, a Estatística Descritiva pode ser interpretada como uma função cujo objetivo é a observação de fenômenos de mesma natureza, a coleta de dados numéricos referentes a esses fenômenos, a organização e a classificação desses dados observados e a sua apresentação através de gráficos e tabelas, além do cálculo de coefi- cientes (estatísticas) que permitem descrever resumidadamente os fenômenos. 1.3 A Natureza da Estatística (Classificação das variáveis Variável é uma característica de uma unidade que será medida a partir daquela unidade da amostra. Podemos descrever dois tipos de variáveis para estudo: Variáveis Qualitativas: Podem ser separados em diferentes categorias, atributos, que se distinguem por alguma característica não numérica. como nos seguintes exemplos: a) População: alunos de uma universidade Variável: sexo (masculino ou feminino). b) População: moradores de uma cidade Variável: tipo de habitação (casa, aparta- mento, barraco, etc.). c) População: peças produzidas por uma máquina Variável: qualidade (perfeita ou defeituosa). d) População Brasileira Variável: cor da pele (branca, preta, amarela, vermelha, parda). 11 Variáveis Quantitativas: Quando suas medidas consistem em números que repre- sentam contagens ou medidas. Pode ser subdivida em: 1 - quantitativa discreta: pode assumir apenas valores pertences a um conjunto enu- merável; 2 - quantitativa contínua: pode assumir qualquer valor em um certo intervalo de vari- ação. Alguns exemplos de variáveis quantitativas discretas são: a) População: habitações de uma cidade. Variável: número de banheiros. b) População: casais residentes em uma cidade. Variável: número de filhos. c) População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos por unidade. d) População: Bolsa de valores de São Paulo. Variável: número de ações negociadas. 1.4 Fases do Método Estatístico O método estatístico abrange as seguintes fases: a) Definição do Problema Consiste na: - formulação correta do problema; - examinar outros levantamentos realizados no mesmo campo (revisão da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) b) Planejamento Determinar o procedimento necessário para resolver o problema: 12 - Como levantar informações; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma, Custos, etc. c) Coleta ou levantamento dos dados Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). d) Apuração dos dados ou sumarização Consiste em resumir os dados, através de uma contagem e agrupamento. É um tra- balho de coordenação e de tabulação. Apuração: manual, mecânica e eletrônica. e) Apresentação dos dados É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. Esta apresentação pode ser: Tabular (apresentação numérica) Gráfica (apresentação geométrica) f) Análise e interpretação dos dados É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o pesquisador a resolver seu problema. 13 1.5 Pesquisas e Dados Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra- menta a ser utilizada. Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem. Dados Estatísticos: Dados são observações documentadas ou resultados da medição. Os dados podem ser obtidos pela percepção através dos sentidos (por exemplo obser- vação) ou pela execução de um processo de medição. Antes de iniciar a análise de uma base de dados, é preciso determinar corretamente que tipo de dados está disponível. Disso depende o tipo de análise a ser feito e a ferra- menta a ser utilizada. Dados primários: são aqueles que não foram antes coletados, estando ainda em posse dos pesquisados, e que são coletados com o propósito de atender às necessi- dades específicas da pesquisa em andamento. As fontes básicas de dados primários são: pesquisado, pessoas que tenham informações sobre o pesquisado e situações similares. Dados secundários: são aqueles que já foram coletados, tabulados, ordenados e, às vezes, até analisados e que estão catalogados à disposição dos interessados. As fontes básicas de dados secundários são: a própria empresa, publicações, governos, Instituições não governamentais e serviços padronizados de informações de marketing. 1.6 Conceitos básicos População: Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Uni- verso, podendo ser finita ou infinita. Amostra: É um subconjunto da população e deverá ser considerada finita, a amostra 14 deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. Amostragem: É o processo de retirada de informações dos "n"elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). Censo: é a coleção de dados relativos a todos elementos da população. Estatística: é uma medida numérica que descreve uma característica da amostra. Parâmetro: é a medida numérica que descreve uma característica da população. Estatística Descritiva: envolve a organização e sumarização dos dados através de metodologias simples. Estatística Inferencial: é a parte da estatística que envolve a análise e interpretação da amostra. 1.7 Tabelas Estatísticas Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis po- dem assumir, para que tenhamos uma visão global da variação das mesmas. Tabela: é uma maneira de apresentar de forma resumida um conjunto de dados 1.8 Elementos de uma Tabela 1) Título: O título deve responder as seguintes questões: - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fenômeno (local)); - Quando? (A época em que se verificou o fenômeno (tempo)). 2) Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. 15 3) Corpo: parte da tabela composta por linhas e colunas. 4) Linhas: parte do corpo que contém uma seqüência horizontal de informações. 5) Colunas: parte do corpo que contém uma seqüência vertical de informações. 6) Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas. 7) Casa ou Célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. 8) Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colo- cadas as notas de natureza informativa (fonte, notas e chamadas). 9) Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. 10) Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada - esclarecer minúcias em relação a uma célula). 1.9 Representação esquemática 1.10 Distribuição de Frequências 1.10.1 Conceitos Dados Brutos: é a relação de elementos que não foram numericamente organizados. 16 Ex : 45, 41, 42, 41, 42, 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Rol: é uma lista em que os valores estão dispostos em uma determinada ordem, cres- cente ou decrescente. Ex : 41, 41, 41, 42, 42, 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Tabela de Frequências: são representaçõesnas quais os valores se apresentam em correspondência com suas repetições. 1.10.2 Distribuição de frequência sem intervalos de classe É a simples condensação dos dados conforme as repetições de seu valores. Exemplo: Tabela 1: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 ∑13 i=1 fi (fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 A soma das frequências é sempre igual ao número total de valores observados. k∑ i=1 fi = n 1.10.3 Distribuição de frequência com intervalos de classe Quando o tamanho da amostra é elevado é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Exemplo: 17 Tabela 2: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi 1 41 ` 45 7 2 45 ` 49 3 3 49 ` 53 4 4 53 ` 57 1 5 57 ` 61 5 Total ∑5 i=1 fi 20 1.10.4 Elementos de uma Distribuição de Frequência Frequência Simples Absoluta: é o número de observações correspondentes a uma classe ou valor individual. É simbolizada por fi. Amplitude TotalAt: É a diferença entre o maior e o menor valor observado da variável em estudo. Ex: na tabela anterior At = 60− 41 = 19. Classe: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 ` 53 é a terceira classe, em que i = 3. Limites de Classe: são os extremos de cada classe. O menor número é o limite inferior de classe (li) e o maior número, limite superior de classe(Li). Ex: em 49 ` 53, l3 = 49 e L3 = 53. O símbolo ` representa um intervalo fechado à esquerda e aberto à direita. Amplitude do Intervalo de Classe: é obtida através da diferença entre o limite su- perior e inferior da classe e é simbolizada por hi = Li − li. Ex: na tabela anterior hi = 53− 49 = 4. Ponto Médio de Classe xi: é o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 ` 53 o ponto médio x3 = (53 + 49)/2 = 51, ou seja x3 = (L3 + l3)/2. 18 1.10.5 Método Prático para construção de uma distribuição de fre- quências com classe 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude total At. 3 - Calcule o número de classes através da "Regra de Sturges". k = 1 + 3, 3 log n em que k é o número de classes e n é o número total de observações 4 - Calcule a amplitude do intervalo de classe h = At k . No nosso exemplo: At = 19 e k = 5, logo h = 3, 8. Utilizaremos então h = 4 1.10.6 Tipos de Frequências Frequência Simples Absoluta fi: é o número de repetições de um valor individual ou de uma classe de valores da variável. Frequência Simples Relativa fri: representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações. fri = fi∑k i=1 fi = fi n Em termos percentuais tem-se fri = fi n · 100 Exemplo: Frequência Absoluta Acumulada "Abaixo de"Fi: é a soma da frequência simples 19 Tabela 3: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi fri Frequências relativas percentuais 1 41 ` 45 7 0,35 35% 2 45 ` 49 3 0,15 15% 3 49 ` 53 4 0,20 20% 4 53 ` 57 1 0,05 5% 5 57 ` 61 5 0,25 25% Total ∑5 i=1 fi 20 1,00 100% absoluta dessa classe ou desse valor com as frequências simples absolutas das classes ou dos valores anteriores. Exemplo: Tabela 4: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi Fi 1 41 ` 45 7 7 2 45 ` 49 3 7 + 3 = 10 3 49 ` 53 4 7 + 3 + 4 = 14 4 53 ` 57 1 7 + 3 + 4 + 1 = 15 5 57 ` 61 5 7 + 3 + 4 + 1 + 5 = 20 Total ∑5 i=1 fi 20 − Frequência Absoluta Acumulada "Acima de"Fi: é a soma da frequência simples absoluta dessa classe ou desse valor com as frequências simples absolutas das classes ou dos valores posteriores. Exemplo: 1.11 Representação Gráfica Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da variável em questão. 20 Tabela 5: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi Fi 1 41 ` 45 7 5 + 1 + 4 + 3 + 7 = 20 2 45 ` 49 3 5 + 1 + 4 + 3 = 13 3 49 ` 53 4 5 + 1 + 4 = 10 4 53 ` 57 1 5 + 1 = 6 5 57 ` 61 5 5 Total ∑5 i=1 fi 20 − 1.12 Gráficos utilizados para a análise de uma distribuição de freqüência 1.12.1 Histograma São os gráficos mais importantes na estatística inferencial. Quando os dados são valores de uma variável medida numa escala intervalar/proporcional, uma tabela de fre- quências para cada uma das classes mostra a distribuição de valores dessa variável. Esta distribuição pode ser representada graficamente num histograma. 1.12.2 Polígono de Freqüências Unindo por linhas retas os pontos médios das bases superiores dos retângulos do his- tograma, obtém-se outra representação dos dados, denominada Polígono de Frequências. 21 1.12.3 Ogivas A Ogiva tem por finalidade a representação gráfica das tabelas de frequências acumu- ladas. 1.12.4 Gráfico por linha É a representação gráfica de uma série estatística por meio de uma linha poligonal. é um dos mais importantes gráficos; representa observações feitas ao longo do tempo, em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries históricas ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de tempo. 22 1.12.5 Gráfico por colunas É a representação de uma série estatística por intermédio de retângulos em posições verticais. Este tipo de gráficos proporciona comparar grandezas. 1.12.6 Diagrama por Superfície em Setores É a representaçao gráfica de uma série estatística por intermédio de superfícies seto- riais. É utilizado quando se pretende comparar os valores de uma série com a sua soma total. A representaçao é feita tomando como figura básica um círculo que é dividido em se- 23 tores. O quociente entre a soma dos valores da série e a área do círculo deve ser o mesmo que entre cada valor da variável dependente e a respectiva área do setor representativo. Porém em virtude da proporcionalidade das áreas dos setores de um círculo com seus ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a estes ângulos. 24 2 Análise Exploratória de Dados 2.1 Medidas de Posição As medidas de posição, também chamada de medidas de tendência central, possuem três formas diferentes para três situações distintas: • MÉDIA • MODA • MEDIANA 2.1.1 Média Existem dois tipos de média: • POPULACIONAL, representada pela letra grega µ. • AMOSTRAL, representada por x¯. 1 - Média: (Dados não agrupados) Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável X. A média aritmética da variável aleatória X é definida por, x¯ = x1 + x2 + . . .+ xn n = ∑n i=1 xi n 25 Exemplo: Suponha o conjunto de dados que representa o peso ao nascer de bez- erros da raça Nelore: 51, 40, 46, 48, 54, 56, 44, 43, 55 e 57. Determinar a média aritmética simples deste conjunto de dados. x¯ = 51 + 40 + 46 + 48 + 54 + 56 + 44 + 43 + 55 + 57 10 = 494 10 = 49, 4 2 - Média: (Dados agrupados em uma distribuição de frequência por valores simples) Usa-se a média aritmética dos valores x1, x2, . . . , xn ponderados pelas respectivas frequências absolutas: f1, f2, . . . , fn. Assim x¯ = x1f1 + x2f2 + . . .+ xnfn n = ∑n i=1 xifi n Exemplo: Tabela 6: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60 ∑13 i=1 fi (fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 xifi 123 84 43 44 45 92 100 51 52 54 57 116 120 981 Portanto: x¯ = 981 20 = 49, 05 3 - Média: (Dadosagrupados em uma distribuição de frequência por classes) Usaremos a média aritmética dos pontos médios x1, x2, . . . , xn de cada classe, pon- derados pelas respectivas frequências absolutas: f1, f2, . . . , fn. Assim x¯ = x1f1 + x2f2 + . . .+ xnfn n = ∑n i=1 xifi n Exemplo: 26 Tabela 7: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi xi xifi 1 41 ` 45 7 43 301 2 45 ` 49 3 47 141 3 49 ` 53 4 51 204 4 53 ` 57 1 55 55 5 57 ` 61 5 59 295 Total ∑5 i=1 fi 20 − 996 Portanto: x¯ = 996 20 = 49, 80 2.1.2 Moda É o valor mais frequente da distribuição. 1 - Moda (Mo): (Dados não agrupados) Sejam os elementos x1, x2, . . . , xn de uma amostra, o valor da moda para este tipo de conjunto de dados é simplesmente o valor com maior frequência. Exemplo: Obter a moda dos seguintes conjuntos de valores: X = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8}, Moda de X: Mo = 6. Y = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6}, Moda de Y : Mo1 = 2 e Mo2 = 5. W = {1, 2, 3, 4, 5} Moda de W : amodal 2 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por valores simples) Para este tipo de distribuição, a identificação da moda é facilitada pela simples ob- servação do elemento que apresenta maior frequência. 27 Tabela 8: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60 ∑13 i=1 fi (fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 Exemplo: Portanto, se a maior frequência é fi = 3, logo Mo = 41. 3 - Moda (Mo): (Dados agrupados em uma distribuição de frequência por classes) Para dados agrupados em classes, temos diversos métodos para o cálculo da moda. Utilizaremos aqui o Método de Czuber denotado a seguir: Método de Czuber Procedimento: – Identifica-se a classe modal (aquela que possuir maior frequência) CLASSE (Mo). – Utiliza-se a fórmula: Mo = li + h · ∆1 ∆2 + ∆1 em que: li = Limite inferior da classe modal. ∆1 = fmo − fant (frequência modal − frequência anterior) ∆2 = fmo − fpost (frequência modal − frequência posterior) h = amplitude da classe modal Exemplo: Determinar a moda, pelo método de Czuber, usando os dados do exemplo tem-se que: Classe (Mo): 41 ` 45 li = 41 28 Tabela 9: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi 1 41 ` 45 7 2 45 ` 49 3 3 49 ` 53 4 4 53 ` 57 1 5 57 ` 61 5 Total ∑5 i=1 fi 20 h = 4 ∆1 = fmo − fant = 7− 0 = 7 ∆2 = fmo − fpost = 7− 3 = 4 Mo = 41 + 4 · 7 7 + 4 = 43, 54 2.1.3 Mediana Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou seja, é o elemento que divide a distribuição em 50% de cada lado. 1 - Mediana (Md): (Dados não agrupados) Sejam os elementos x1, x2, . . . , xn de uma amostra, portanto "n"valores da variável X. A mediana da variável aleatória X é definida através do Elemento Mediano EMd, – O número de observações é ímpar, então o valor da mediana será o valor local- izado na posição EMd = n+12 ; – O número de observações é par, então o valor da mediana será a média entre o valor da posição EMd = n2 e o seu valor consecutivo. Exemplo 1: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a mediana deste conjunto de dados. 29 Como n = 5, então o valor da mediana estará localizado na posição EMd = 5+12 = 3. Portanto, Md = 8 Exemplo 2: Suponha o conjunto de tempo de serviço de seis funcionários: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste conjunto de dados. Como n = 6, então o valor da mediana estará localizado na posição EMd = 62 = 3 e na posição consecutiva obtendo uma média aritmética desses valores. Portanto, Md = 8 + 10 2 = 9 2 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por valores simples) Quando os valores da variável estiverem já tabulados, o procedimento a ser adotado será praticamente idêntico ao anterior. Deve-se verificar se o número de observações é ímpar ou par, para o cálculo do elemento mediano. Em seguida acrescenta-se uma coluna à tabela de frequências original, onde serão determinadas as frequências acumuladas. Exemplo: Tabela 10: Distribuição do número de alunos em 20 turmas da UFCG i 1 2 3 4 5 6 7 8 9 10 11 12 13 Total Dados (xi) 41 42 43 44 45 46 50 51 52 54 57 58 60 ∑13 i=1 fi (fi) 3 2 1 1 1 2 2 1 1 1 1 2 2 20 (Fi) 3 5 6 7 8 10 12 13 14 15 16 18 20 - Portanto: EMd = 20 2 = 10, logo, Md = 46+50 2 = 48 3 - Mediana (Md): (Dados agrupados em uma distribuição de frequência por classes) Procedimento: – Calcula-se o elemento mediano EMd 30 – Pela Fi identifica-se a classe que contém o valor da mediana - CLASSE(Md) – Utiliza-se a fórmula: Md = li + h · EMd − Fant fMd em que: li = Limite inferior da classe mediana; Fant = Frequência acumulada anterior à classe mediana; h = Amplitude da classe mediana; fMd = Frequência absoluta simples da classe mediana. Exemplo: Tabela 11: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi Fi 1 41 ` 45 7 7 2 45 ` 49 3 10 3 49 ` 53 4 14 4 53 ` 57 1 15 5 57 ` 61 5 20 Total ∑5 i=1 fi 20 − Portanto: EMd = 20 2 = 10 CLASSE(Md) = 45 ` 49 Md = 45 + 4 · 10− 7 3 = 45 + 4 = 49 31 2.2 Quartis, Decis e Percentis (ou Centis) Há uma série de medidas de posição semelhantes na sua concepção à mediana, embora não sejam medidas de tendência central. Como se sabe, a mediana divide a distribuição em duas partes iguais quanto ao número de elementos de cada parte. Já os quartis permitem dividir a distribuição em quatro partes iguais quanto ao número de elementos cada uma; os decis em dez partes e os centis em cem partes iguais. Para simbolizar cada uma dessas medidas separatrizes, faremos: Qi = quartis i = 1, 2, 3 Di = decis i = 1, 2, 3, . . . , 9 Ci = centis i = 1, 2, 3, . . . , 99 Assim, para dividir uma série ordenada de valores em quatro partes iguais, pre- cisamos de três separatrizes (quartis); para dividi-la em dez, iremos recorrer a nove separatrizes (decis); em cem, recorremos a noventa e nove separatrizes (centis). O gráfico a seguir ilustra melhor o que foi dito em relação aos quartis e decis: 2.3 Quartis 2.3.1 Primeiro Quartil: Q1 Definição: Dado um conjunto ordenado (ordem crescente) de valores, o primeiro quartil, Q1, é o valor que divide o conjunto em duas partes tais que um quarto ou 32 vinte e cinco por cento dos valores sejam menores d que ele e três quartos ou setenta e cinco por cento dos restantes sejam maiores. O elemento que indica a ordem ou posição do primeiro quartil é determinado, para dados agrupados em classes, pela seguinte expressão: EQ1 = n 4 em que n é o número de valores do conjunto, ou número de observações. 2.3.2 Segundo Quartil: Q2 ou Md Definição: Dado um conjunto ordenado de valores, o segundo quartil ou mediana é o valor que divide em duas partes iguais quanto ao número de elementos, isto é, cinquenta por cento ou dois quartos dos valores do conjunto são menores, e os dois quartos restantes sao maiores do que ele. O elemento mediano é calculado, como veremos, através da seguinte expressão: EQ2 = 2n 4 = n 2 2.3.3 Terceiro Quartil: Q3 Definição: Dado um conjunto ordenado (ordem crescente) de valores, o terceiro quar- til é o valor que divide o conjunto em duas partes tais que setenta e cinco por cento ou tres quartos dos valores sejam menores e vinte e cinco por cento ou um quarto sejam maiores do que ele. O elemento que indica a ordem em que n encontra o terceiro quartil é calculado, para dados tabulados, como segue: EQ3 = 3n 4 Genericamente, para determinar a ordem ou posição do quartil a ser calculado, us- aremos a seguinte expressão:33 EQi = in 4 em que i indica o número do quartil a ser calculado e n o número de elementos ou observações da amostra. 2.4 Decis Di A definição dos decis obedece ao mesmo princípio da dos quartis, com a modifi- cação da porcentagem de valores que ficam aquém e além do decil que se pretenda clacular. Assim, por exemplo: 2.4.1 Primeiro Decil: D1 O primeiro decil de um conjunto ordenado (ordem crescente) de valores é o valor que divide um conjunto em duas partes tais que dez por cento ou um décimo dos valores sejam menores e nove décimos ou noventa por cento sejam maiores do que ele. O elemento que indica a posição do segundo decil é calculado pela seguinte expressão: ED1 = n 10 2.4.2 Segundo Decil: D2 Trata-se do valor que divide o conjunto em duas partes, tais que vinte por cento ou dois décimos dos valores sejam menores e oitenta por cento ou oito décimos dos valores sejam maiores; para saber a ordem do segundo decil, usamos a expressão: ED2 = 2n 10 De especial interesse é o quinto decil, que divide o conjunto em duas partes, tais que cinco décimos ou cinquenta por cento dos valores sejam menores e cinco décimos ou cinquenta por cento dos valores restantes maiores do que ele. Assim sendo, o quinto 34 decil é igual ao segundo quartil, que por sua vez é igual à mediana. O elemento que indica a ordem do quinto decil é igual ao elemento mediano, ou seja: ED5 = 5n 10 = n 2 = 2n 4 Podemos, então, afirmar que Md = D5 = Q2 De uma forma geral, para calcular os decis, recorreremos à seguinte expressão que define a ordem em que o decil se encontra: EDi = in 10 em que n indica o número de valores observados e i o número que identifica o decil a ser calculado. 2.5 Percentis ou Centis Ci Neste caso, cada parte em que foram subdivididos os valores do conjunto, através dos noventa e nove centis, contará com um centésimo ou um por cento dos valores do conjunto. O elemento que definirá a ordem do centil, em uma distribuição de frequências de val- ores tabulados agrupados em classes, será encontrado pelo emprego da expressão: ECi = in 100 em que i é o número indicador do centil e n é o número total de observações. É oportuno lembrar que os centis englobam todos os decis e quartis. Assim, por exemplo: 2.5.1 Vigésimo Centil: C20 O vigésimo centil é igual ao segundo decil, por que 35 EC20 = 20n 100 = 0, 2n = ED2 = 2n 10 = 0, 2n A fórmula de cálculo dos centis será: Ci = l + h ECi − Fant fCi Exemplo:Na Tabela abaixo figuram os dados correspondentes ao consumo de elet- ricidade de 80 usuários. Calcular as seguintes medidas: Tabela 12: Distribuição do consumo de eletricidade i Classes fi 1 5 ` 25 4 2 25 ` 45 6 3 45 ` 65 14 4 65 ` 85 26 5 85 ` 105 14 6 105 ` 125 8 7 125 ` 145 6 8 145 ` 165 2 Total ∑13 i=1 fi 80 a) Trigésimo centil: C30 b) Décimo quinto centil: C15 c) Nono Decil: D9 d) Septuagésimo quinto centil: C75 e) Primeiro quartil: Q1 2.6 Medidas de Dispersão As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. Consideraremos três medidas de dispersão: 36 – DESVIO-PADRÃO – VARIÂNCIA – COEFICIENTE DE VARIAÇÃO 2.6.1 Desvio - Padrão Mede o grau de dispersão dos dados numéricos em torno de um valor médio. 1 - Desvio - padrão S: (Dados Brutos) Seja o seguinte conjunto de números x1, x2, . . . , xn. O desvio-padrão ou média quadrática dos desvios ou afastamentos em relação à média desse conjunto será definido por: S = √∑n i=1(xi − x¯)2 n− 1 Exemplo: Calcular o desvio-padrão do conjunto 10, 12, 13, 20, 25, 34, 45. sabe-se que x¯ = 22, 714 S = √√√√ 1 7− 1 7∑ i=1 (xi − 22, 714)2 = √ 1 6 [(10− 22, 714)2 + . . .+ (45− 22, 714)2] S = √ 1 6 × 1007, 43 = 12, 958 2 - Desvio - padrão S: (Dados Tabulados) Quando os valores vierem dispostos em uma tabela de frequências, o cálculo do desvio-padrão se fará através da seguinte fórmula: 37 S = √∑n i=1(xi − x¯)2fi n− 1 Exemplo: Tabela 13: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi xi (xi − x¯) (xi − x¯)2 (xi − x¯)2fi 1 41 ` 45 7 43 -6,8 46,24 323,68 2 45 ` 49 3 47 -2,8 7,84 23,52 3 49 ` 53 4 51 1,2 1,44 5,76 4 53 ` 57 1 55 5,2 27,04 27,04 5 57 ` 61 5 59 9,2 84,64 423,20 Total ∑5 i=1 fi 20 − − − 803,20 como x¯ = 49, 80, portanto: S = √ 803, 20 20− 1 = √ 42, 27 = 6, 5 2.6.2 Variância A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da média. A fórmula da variância poderá ser calculada de duas formas: – POPULACIONAL, representada letra grega σ2 – AMOSTRAL, representada por S2 1- Variância: (Dados não agrupados) σ2 = ∑n i=1(xi − µ)2 N ou S2 = ∑n i=1(xi − x¯)2 n− 1 38 Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a variância deste conjunto de dados. como x¯ = 7, 8 S2 = (3− 7, 8)2 + (7− 7, 8)2 + (8− 7, 8)2 + (10− 7, 8)2 + (11− 7, 8)2 5− 1 = S2 = 38, 4 4 = 9, 7 2 - Variância: (Dados Tabulados) Quando os valores vierem dispostos em uma tabela de frequências, o cálculo da variância se fará através da seguinte fórmula: σ2 = ∑n i=1(xi − µ)2fi N ou S2 = ∑n i=1(xi − x¯)2fi n− 1 Exemplo: Tabela 14: Distribuição do número de alunos em 20 turmas da UFCG i Classes fi xi (xi − x¯) (xi − x¯)2 (xi − x¯)2fi 1 41 ` 45 7 43 -6,8 46,24 323,68 2 45 ` 49 3 47 -2,8 7,84 23,52 3 49 ` 53 4 51 1,2 1,44 5,76 4 53 ` 57 1 55 5,2 27,04 27,04 5 57 ` 61 5 59 9,2 84,64 423,20 Total ∑5 i=1 fi 20 − − − 803,20 39 como x¯ = 49, 80 e S = 6, 5, portanto S2 = 803, 20 19 = 42, 27 2.6.3 Coeficiente de Variação Trata-se de uma média relativa à dispersão, útil para a comparação e observação em termos relativos do grau de concentração em torno da média de séries distintas.É dado por: CV = S x¯ · 100 Classificação da distribuição quanto à dispersão: – Dispersão Baixa: CV ≤ 15% – Dispersão Média: 15% < CV < 30% – Dispersão Alta: CV ≥ 30% Exemplo:1 Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então: Sexo Masculino: CV = 1.500 4.000 · 100 = 37, 5% Sexo Feminino: CV = 1.200 3.000 · 100 = 40% 40 2.7 Exercícios 1. Classifique as seguintes variáveis como Qualitativas ou Quantitativas (discretas ou contínuas). a) Número de computadores em um laboratório de informática b) Renda familiar c) Volume de Petróleo extraído por hora de uma jazida d) Grupo Sanguíneo e) Qualidade de uma peça produzida f) Intenção de voto para presidente (possíveis respostas são os nomes dos can- didatos, além de "nao sei") g) Precipitação pluviométrica h) Magnitude de um sismo, na escala Richter i) Tipo de grão de híbrido de milho j) Número de vargens por planta 2. Os dados abaixo referem-se a resistência à ferrugem de 32 híbridos de milho recomendados para a região de Chapecó, SC, safra 1987/88 Tabela 15: Distribuição de frequências da resistência à ferrugem de 32 híbridos de milho recomendados para a região de Chapecó, SC, safra 1987/88 Resistência à ferrugem fi r 10 mr 6 ms 9 s 7 Obtenha as frequências relativas fri e construa um gráfico de barras para rep- resentar esses dados. 3. As fases principais do método estatístico são: a) Coleta dos dados, amostragem, apresentação tabular e apresentação gráfica e definição dos problemas. b) Amostragem, apresentação tabular, apuração dos dados, interpretação dosdados e planejamento. 41 c)Definição do problema, planejamento, coleta dos dados, apuração, apresen- tação dos dados, análise e interpretação dos dados. 4. Os dados abaixo referem-se a 12 áreas plantadas de soja na safra de verão em milhões de hectares. 9,7 11,5 13,2 10,7 13,2 9,7 11,6 9,8 13,0 10,4 11,3 13,2 Determine: a) a média, a moda e a mediana das áreas plantadas de soja. b) O desvio padrão, a variância e o coeficiente de variação. 5. Dada a tabela abaixo Tabela 16: Produção agrícola na Paraíba em milhões de Reais, 2004-2009 Ano Produção em mil- hões de R$ 2004 4,5 2005 5,3 2006 4,9 2007 5,1 2008 6,8 2009 7,1 Construa um gráfico mais apropriado para os dados da tabela. 6. Os dados abaixo relacionados representam o número de focos de incêndios de- tectados por satélite entre os Estados da Paraíba e Pernambuco nos primeiros 16 dias de Novembro de 2010. 13 18 9 10 6 11 10 14 10 11 15 12 14 8 13 7 Calcular a Média, a Moda, a Mediana, o Desvio padrão, a variância e coeficiente de variação de forma direta (sem construir tabela) dos dados acima. 7. Os dados abaixo referem-se ao consumo de água, em m3, de 40 famílias de baixa renda de uma determinada cidade no mês de Julho de 2011. 42 Faixa de consumo fri 10 ` 15 0,10 15 ` 20 0,15 20 ` 25 0,30 25 ` 30 0,25 30 ` 35 0,15 35 ` 40 0,05 a) Obtenha as frequências simples absolutas e construa o histograma. b) Calcule a média, a variância e o desvio padrão. c) Calcule a mediana e a moda d) Qual o percentual de famílias que consumiram pelo menos 25 m3 de água? 8. Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio padrão das notas de sua disciplina, conforme abaixo. Qual a turma com menor variabilidade? Justifique adequadamente. Turma A B C Média 6,5 8,0 8,0 Desvio Padrao 2,2 1,7 2,0 9. Quarenta alunos da UFCG foram questionados quanto ao número de livros lidos no ano anterior. Foram registrados os seguintes valores: 4 2 1 0 3 1 2 0 2 1 0 2 1 1 0 4 3 2 3 5 8 0 1 6 5 3 2 1 6 4 3 4 3 2 1 0 2 1 0 3 a) Organize os dados em uma tabela adequada. b) Qual o percentual de alunos que leram menos do que 3 livros. c) Qual o percentual de alunos que leram 4 ou mais livros. d) Calcule a média, a moda e a mediana e) Calcule o desvio padrão, a variância e o coeficiente de variação. 10. (UFPB - 2011)A tabela a seguir apresenta a quantidade exportada de certo produto, em milhares de toneladas, no período de 2000 a 2009. 43 Considerando os dados apresentados na tabela, identifique as afirmativas cor- retas: I. A quantidade exportada, de 2006 a 2008, foi crescente. II. A média da quantidade exportada, de 2003 a 2006, foi de 53 mil toneladas. III. A moda da quantidade exportada, de 2000 a 2009, foi de 52 mil toneladas. IV. A média da quantidade exportada, de 2000 a 2004, foi maior que a média de 2005 a 2008. V. A mediana da quantidade exportada, de 2000 a 2009, foi de 51 mil toneladas. 11. (UFPB - 2002) O gráfico ao lado mostra a porcentagem de acertos nas questões de um concurso onde havia 12000 inscritos. Com base nos dados apresen- tados, determine a quantidade de candidatos que acertou pelo menos duas questões. 12. Complete a tabela e indique a mediana da amostra. 44 xi fi Fi fri 1 2 0,025 2 12 3 58 4 0,2 5 13. De um exame final de Estatística, aplicado a 50 alunos da UFCG em 2011 resultaram as seguintes notas: 4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2 5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9 8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3 9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,8 9,9 Construa uma tabela de distribuição de frequências com intervalo de classe por meio da regra de Sturges. Calcule a média, a moda, a mediana, o desvio padrão e o coeficiente de variação das notas após os dados estarem tabulados por classe. 45 3 Probabilidade: Espaço amostral e eventos 3.1 Experimentos Aleatórios 3.1.1 Tipos de fenômenos Fenômenos determinísticos: são aqueles em que os resultados são sempre os mes- mos, qualquer que seja o número de ocorrências verificadas. Fenômenos aleatórios: são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Exemplos: – Lançamento de uma moeda honesta; – Lançamento de um dado; – Retirada de uma carta de um baralho completo com 52 cartas; – Determinação da vida útil de um componente eletrônico. 3.2 Espaço Amostral Define-se espaço amostral (Ω) ao conjunto de todos os resultados possíveis de um experimento. Nos exemplos citados anteriormente, os espaços amostrais são: 46 Ω = {c, r} ; Ω = {1, 2, 3, 4, 5, 6} ; Ω = {Ao, . . . , Ko, Ap, . . . , Kp, Ac, . . . , Kc, Ae, . . . , Ke} ; Ω = {t ∈ </t ≥ 0}. 3.3 Eventos Chamamos de evento (E) a qualquer subconjunto do espaço amostral Ω de um ex- perimento aleatório. Qualquer que seja o evento E, se E ⊂ Ω, então E é um evento de Ω. – Se E = Ω, E é chamado evento certo – Se E ⊂ Ω e E é um conjunto unitário, E é chamado evento elementar. – Se E = φ, E é chamado evento impossível. 3.4 Classe dos eventos aleatórios Definição: é o conjunto formado de todos os eventos (subconjuntos) do espaço amostral. Para efeito de exemplo, consideremos o espaço amostral finito: Ω = {e1, e2, e3, e4}. A classe dos eventos aleatórios é: F (Ω) = φ {e1}, {e2}, {e3}, {e4} {e1, e2}, {e1, e3}, {e1, e4}, {e2, e3}, {e2, e4}, {e3, e4} {e1, e2, e3}, {e1, e2, e4}, {e1, e3, e4}, {e2, e3, e4} {e1, e2, e3, e4} 47 Genericamente, se o número de pontos amostrais de um espaço amostral é n, então o número de eventos de F é 2n. 3.5 Operações com eventos Aleatórios Considere um espaço amostral finito Ω = {e1, e2, . . . , en}. Sejam A e B dois eventos de F (Ω). As seguintes operações são definidas. União Definição: A∪B = {ei ∈ Ω/ei ∈ A ou ei ∈ B}, i = 1, . . . , n. Portanto, o evento união é formado pelos pontos amostrais que pertençam a pelo menos um dos conjuntos. Figura 1: A ∪B Observações: 1) A ∪B = B ∪ A 2) A ∪ A = A 3) A ∪ φ = A 4) Se A ⊂ B ⇒ A ∪B = B (em particular A ∪ Ω = Ω) 48 Intersecção Definição: A ∩ B = {ei ∈ Ω/ei ∈ A e ei ∈ B}, i = 1, . . . , n. Portanto, o evento intersecção é formado pelos pontos amostrais que pertença simultâneamente aos eventos A e B. Figura 2: A ∩B Observações: 1) A ∩B = B ∩ A 2) A ∩ A = A 3) A ∩ φ = φ 4) Se A ⊂ B ⇒ A ∩B = A (em particular A ∩ Ω = A) 5) (A ∩B) ∩ C = A ∩ (B ∩ C) Complementação Definição: Ω − A = A¯ = Ac = {ei ∈ Ω/ei /∈ A} , i = 1, . . . , n. O complemento de um evento A é, portanto, o evento contendo todos os resultados no espaço amostral Ω que não pertençam a A. Observações: 1) (Ac)c = A 2) A ∪ Ac = Ω 3) φc = Ω 4) A ∩ Ac = φ 49 Figura 3: A¯ = Ac 5) Ωc = φ Exemplo: Lançam-se duas moedas. Sejam A: saída de faces iguais e B: saída de cara na primeira moeda. Determinar os eventos: A ∪B, A ∩B, Ac, Bc, (A ∪B)c, (A ∩B)c, Ac ∩Bc, Ac ∪Bc, B − A, A−B, Ac ∩B e Bc ∩ A. 3.6 Propriedades das operações Sejam A, B e C eventos associados a um espaço amostral Ω. As seguintes pro- priedades são válidas: a) IDEMPOTENTES A ∩ A = A A ∪ A = A b) COMUTATIVAS A ∪B = B ∪ A A ∩B = B ∩ A c) ASSOCIATIVAS A ∩ (B ∩ C) = (A ∩B) ∩ C A ∪ (B ∪ C) = (A ∪B) ∪ C 50 d) DISTRIBUTIVAS A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C) e) ABSORÇÕES A ∪ (A ∩B) = A A ∩ (A ∪B) = A f) IDENTIDADES A ∩ Ω = A A ∪ Ω = Ω A ∩ φ = φ A ∪ φ = A g) COMPLEMENTARES Ωc = φ φc = Ω A ∩ Ac = φ A ∪ Ac = Ω (Ac)c = A h) "LEIS DAS DUALIDADES"ou "LEIS DE MORGAN" (A ∩B)c = Ac ∪Bc (A ∪B)c = Ac ∩Bc 3.7 Partição de um Espaço AmostralDefinição: Dizemos que os eventos A1, A2, . . . , An formam uma partição do espaço amostral Ω se: a) Ai 6= φ, i = 1, . . . , n 51 Figura 4: Partição de um Espaço Amostral. b) Ai ∩ Aj = φ para i 6= j c) ∪ni=1Ai = Ω 3.8 Eventos Mutuamente Exclusivos ou Disjuntos Definição: Dois eventos ditos mutuamente exclusivos ou disjuntos se A e B não puderem ocorrer juntos, ou seja, a realização de um exclui a realização do outro. Segue que A e B são disjuntos se A ∩B = φ. Figura 5: Eventos Mutuamente Exclusivos ou Disjuntos. 52 3.9 Exercícios 1. Quais das seguintes relações são verdadeiras? (a)(A ∪B) ∩ (A ∪ C) = A ∪ (B ∩ C). (b) (A ∪B) = (A ∩B) ∪B. (c) A ∩B = A ∪B. (d) (A ∪B) ∩ C = A ∩B ∩ C. (e) (A ∩B) ∩ (B ∩ C) = φ. 2. Lançam-se três moedas. Enumerar o espaço amostral e os eventos: (a) faces iguais; (b) cara na primeira moeda; (c) coroa na segunda e terceira moedas. 53 4 Probabilidade: Definições 4.1 Definição Clássica de Probabilidade Dado um experimento aleatório, sendo Ω o seu espaço amostral, vamos admitir que todos os elementos de Ω tenham a mesma chance de acontecer, ou seja, que Ω é um conjunto equiprovável. Define-se probabilidade de um evento A (A ⊂ Ω) ao número real P (A), tal que: P (A) = número de resultados favoráveis a A número de resultados possíveis = n(A) n(Ω) 4.2 Definição Axiomática de Probabilidade Para um dado experimento, é necessário atribuir para cada evento A no espaço amostral Ω um número P (A) que indica a probabilidade de A ocorrer. Para satis- fazer a definição matemática de probabilidade, este número P (A) deve satisfazer três axiomas específicos: Axioma 1: Para qualquer evento A, P (A) ≥ 0. Axioma 2: P (Ω) = 1. Axioma 3: Para qualquer sequência finita de eventos disjuntos A1, A2, . . . , An P ( n⋃ i=1 Ai ) = n∑ i=1 P (Ai) 54 4.2.1 Propriedades P.1 - P (φ) = 0 P.2 - Para qualquer sequência infinita de eventos disjuntos A1, A2, . . . P ( ∞⋃ i=1 Ai ) = ∞∑ i=1 P (Ai) P.3 - Para qualquer evento A, P (Ac) = 1− P (A) P.4 - Para qualquer evento A, 0 ≤ P (A) ≤ 1. P.5 - Se A ⊂ B, então P (A) ≤ P (B). P.6 - Para qualquer evento dois eventos A e B P (A ∪B) = P (A) + P (B)− P (A ∩B) P.7 - Se os eventos A1, A2, . . . , An formam uma partição do espaço amostral, então: n∑ i=1 P (Ai) = 1 Exemplo 1: Considere o lançamento de dois dados, sendo os eventos A = {soma dos números igual a 9}, B = {número do primeiro dado maior ou igual a 4} e C = {soma dos números menor ou igual a 4}. Enumere os elementos de A, B, C, A∩B e A ∩ C. Obtenha P (A ∪B) e P (A ∪ C) 55 4.3 Eventos Independentes Suponha que dois eventos A e B ocorram independentes um do outro no sentido que a ocorrência ou não de um deles tenha nenhuma relação e nenhuma influência na ocorrência ou na não ocorrencia do outro. Nessas condições P (A ∩B) = P (A) · P (B) Definição: Dois eventos são independentes se P (A ∩B) = P (A) · P (B). Problema Sejam A e B eventos tais que P (A) = 0, 2, P (B) = P , P (A ∪ B) = 0, 6. Calcular P considerando A e B: a) Mutuamente exclusivos; b) independentes. Resolução a) P (A∩B) = 0 como P (A∪B) = P (A) +P (B)−P (A∩B) vem 0, 6 = 0, 2 + p− 0 ∴ P = 0, 4 b) P (A ∩B) = P (A) · P (B) = 0, 2 · P como P (A ∪B) = P (A) + P (B)− P (A ∩B) vem 0, 6 = 0, 2 + P − 0, 2P ∴ 0, 4 = 0, 8P logo, P = 0, 5 4.4 Probabilidade Condicional Se A e B são dois eventos, a probabilidade de A ocorrer, depois B ter aconte- cido, é representada por P (A/B) (Probabilidade de A dado B) e é denominada probabilidade condicional de A, depois de B ter ocorrido. É portanto natural definir-se a probabilidade condicional P (A/B) como a proporção 56 da probabilidade total P (B) que é representada pela probabilidade P (A ∩ B). Por- tanto, tem-se a seguinte definição P (A/B) = P (A ∩B) P (B) , dado P (B) > 0 Se P (B) = 0 a P (A/B) não é definida ou, equivalentemente P (B/A) = P (A ∩B) P (A) , dado P (A) > 0 Se P (A) = 0 a P (B/A) não é definida. Tiramos da definição da probabilidade condicional o chamado TEOREMA DO PRO- DUTO: Sejam A ⊂ Ω e B ⊂ Ω. Então, P (A ∩ B) = P (B) · P (A/B) ou P (A ∩ B) = P (A) · P (B/A). Exemplo: Um grupo de 86 pessoas está assim formado: Escolhendo-se, ao acaso, uma pessoa do grupo, qual a probabilidade de que seja: a) Uma mulher que fez o curso de medicina ? b) Uma pessoa que fez o curso de medicina ? c) Um engenheiro dado que seja homem ? d) Não ser médico dado que não seja homem ? 4.5 Probabilidade Total Seja Ω o espaço amostral de um experimento, e considere K eventos A1, A2, . . . , Ak em Ω tal que A1, A2, . . . , Ak sejam disjuntos e ⋃k i=1 Ai = Ω. Diz-se, então, que estes 57 eventos formam uma partição de Ω. Se os eventosA1, A2, . . . , Ak formam uma partição de Ω, eB é qualquer outro evento em Ω, então: B = (A1 ∩B) ∪ (A2 ∩B) ∪ . . . ∪ (Ak ∩B) Como os K eventos do lado direito da equação anterior são disjuntos: P (B) = k∑ i=1 P (Ai ∩B) Mas P (Aj ∩B) = P (Aj) · P (B/Aj) em que j = 1, 2, . . . , k. Então P (B) = k∑ i=1 P (Aj) · P (B/Aj) Exemplo: Uma urna contém 3 bolas brancas e 2 amarelas. Uma segunda urna contém 4 bolas brancas e 2 amarelas. Escolhe-se, ao acaso, uma urna e dela retira- se, também ao acaso, uma bola. Qual a probabilidade de que seja branca? 4.6 Teorema de Bayes Sejam os eventos j = 1, 2, . . . , k que formam uma partição do espaço amostral Ω tal que P (Aj) > 0 para todo j = 1, 2, . . . , k e seja B qualquer evento tal que P (B) > 0. Então, para i = 1, 2, . . . , k, temos: P (Aj/B) = P (Aj)P (B/Aj)∑k i=1 P (Ai) · P (B/Ai) (4.1) Prova: Pela definição de probabilidade condicional, 58 P (Aj/B) = P (Aj ∩B) P (B) O numerador da equação (1) é igual a P (Aj ∩ B) e o denominador é igual a P (B) (pela fórmula para probabilidade total). Exemplo: Em uma fábrica de parafusos, as máquinas A, B e C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4 e 2 por cento, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e se verifica ser defeituoso. Qual será a probabilidade de que o parafuso venha da máquina A? Da B? Da C? 59 4.7 Exercícios 1. Dez fichas numeradas de 1 até 10 são misturadas em uma urna. Duas fichas, numeradas (X, Y ), são extraídas da urna, sucessivamente e sem reposição. Qual é a probabilidade de que seja X + Y = 10? (R= 4/45) 2. Considere o conjunto de números inteiros {1, 2, 3, . . . , 19, 20}, e, por meio de um sorteio aleatório, retire um número. Se o número sorteado for ímpar, qual a probabilidade de o número sorteado ser o número 13? ( R = 1/10) 3. A probabilidade de que o aluno A resolva determinado problema é 2/3 e a prob- abilidade de que o aluno B o resolva é 4/5. Se ambos tentarem independen- temente a resolução, qual a probabilidade do problema ser resolvido? ( R = 14/15) 4. Numa festa beneficente, foram vendidos 20 números em uma "rifa", e serão sorteados dois prêmios. Qual a probabilidade de uma pessoa que tenha adquirido quatro números ganhar os dois prêmios? (R = 3/95) 5. Um lote é formado por 10 animais sadios, quatro com problemas menores e dois com problemas graves. Todos os animais são numerados e é feita a escolha de um animal ao acaso. Ache a probabilidade de que: a) ele não tenha problemas; (R =5/8) b) ele não tenha problemas graves; (R = 7/8) c) ele ou seja sadio ou tenha problemas graves. (R = 3/4) 6. Duas bolas vão ser retiradas sem reposição de uma urna que contém 2 bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade de que ambas a) sejam verdes? (R = 1/6) b) sejam da mesma cor? ( R = 5/18) 7. Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas(uma após a outra). Achar a probabilidade de que: a) nenhuma seja vermelha. (R= 14/55) b) exatamente uma seja vermelha. (R = 28/55) c) todas sejam da mesma cor. (R= 4/55) 8. Numa população composta por 200 animais de duas raças X e Y , os animais podem ser fecundos e não fecundos. Vinte por cento dos animais da raçaX são 60 fecundos; trinta por cento dos animais da raça Y sao não fecundos e setenta e cinco por cento dos animais são da raça X. Escolhe-se um animal ao acaso. Determine a probabilidade desse animal: a) ser da raça Y dado que é fecundo; (R = 0,55) b) ser não fecundo dado que é da raça Y .( R = 0,30) 9. Uma indústria produz determinado tipo de peça em três máquinas M1,M2 e M3. A Máquina M1 produz 40% das peças, enquanto M2 e M3 produzem 30% cada uma. As porcentagens de peças defeituosas produzidas por essas máquinas são respectivamente iguais a 1%, 4% e 3%. Se uma peça é sele- cionada aleatóriamente da produção total, qual é a probabilidade dessa peça ser defeituosa? (R = 0,025) 10. A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas e 8 azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha é extraída. Qual a probabilidade de ter saído cara no lançamento? (R = 3 4 ) 11. Num certo colégio, 4% dos homens e 1% das mulheres têm mais de 1,75 de altura. 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso e tem mais de 1,75 m. Qual a probabilidade de que seja homem? ( R = 8 11 = 0, 7272) 12. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20 terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a probabilidade de: a) A ganhar todas a três; (R = 1 8 ) b) duas partidas terminarem empatadas; (R = 5 72 ) c) A e B ganharem alternadamente. (R = 5 36 ) 13. Em uma prova caíram dois problemas. Sabe-se que 132 alunos acertaram o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas um problema. Qual a probabilidade de que um aluno, escolhido ao acaso: a) não tenha acertado nenhum problema? ( R = 37 124 ) b) tenha acertado apenas o segundo problema? (R = 21 124 ) 14. São retiradas, com reposição, duas cartas de um baralho com 52 cartas. Qual a probabilidade de que as duas sejam de ouros? (R = 1 16 ) 61 15. Um lote de certo tipo de peças é formado de 9 peças boas, 2 com pequenos defeitos e uma com defeito grave. Uma dessas peças é escolhida ao acaso. Determine a probabilidade de que a peça escolhida: a) não tenha defeito; ( R = 3 4 ) b) não tenha defeito grave. (R = 11 12 ) 16. Suponha que A e B sejam eventos independentes associados a um experi- mento. Se a probabilidade de A ou B ocorrerem for igual a 0, 6, enquanto a probabilidade da ocorrência de A for igual a 0, 4, determine a probabilidade da ocorrência de B. (R = 0,33) 17. As probabilidades de que dois eventos independentes ocorram são p e q, re- spectivamente. Qual a probabilidade: a) de nenhum desses eventos ocorra? (R = (1− p)(1− q)) b) de que pelo menos um desses eventos ocorra? ( R = (p+ q − pq)) 62 5 Variáveis Aleatórias discretas 5.1 Variáveis Aleatórias Definição: Considere um experimento para o qual o espaço amostral é denotado por Ω. Define-se variável aleatória como uma função que associa um valor real a cada elemento do espaço amostral. X : Ω −→ < Representa-se as variáveis aleatórias por letras maiúsculas e suas ocorrências por letras minúsculas. Exemplo Suponha o experimento "lançar três moedas". Seja X: número de ocorrências da face cara . O espaço amostral do experimento é: Ω = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r, r)} Se X é o número de caras, X assume os valores 0, 1, 2 e 3. 63 Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X (isto é, o seu contradomínio), for finito ou infinito enumerável, denominamos X de variável aleatória discreta. Definição: Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será formado por um número finito ou enumerável de valores x1, x2, . . .. A cada possível resultado xi, associaremos um número p(xi) = P (X = xi), i = 1, 2, 3, . . ., denominado probabilidade de xi. Os números p(xi) devem satisfazer às seguintes condições: a) p(xi) ≥ 0, b) ∑∞ i=1 p(xi) = 1 A função p definida acima, é denominada função de probabilidade da variável aleatória X. A coleção de pares [xi, p(xi)], i = 1, 2, . . ., é denominada distribuição de probabilidade. Exemplo Lançam-se dois dados. Seja a v.a. X: soma das faces. Determinar a distribuição de probabilidade da variável aleatória X. 64 5.2 Esperança de uma Variável Aleatória Discreta Suponha que uma variável aleatória X possua uma distribuição discreta cuja função é p(x). A esperança de X, denotada por E(X), é um número definido por: µ = E(X) = ∑ x x · p(x) Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1 e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) = 0, 2. Então: E(X) = −2 · (0, 1) + 0 · (0, 4) + 1 · (0, 3) + 4 · (0, 2) = 0, 9 Propriedades da Esperança P1. Se a é uma constante qualquer E(a) = a P2. Se a é uma constante qualquer E(aX) = a · E(X) P3. SeX1, X2, . . . , Xn são n variáveis aleatórias tais queE(Xi) existe (i = 1, 2, . . . , n), então E(X1 +X2 + . . .+Xn) = E(X1) + E(X2) + . . .+ E(Xn). P4. Se X1, X2, . . . , Xn são n variáveis aleatórias independentes tais que E(Xi) ex- iste (i = 1, 2, . . . , n), então 65 E ( Πni=1Xi ) = Πni=1E(Xi) 5.3 Variância de uma Variável Aleatória Discreta Definição: Suponha que X é uma v.a. com média µ = E(X). A variância de x, representada por V (X) é definida por V (X) = E[(x− µ)2] V (X) = E(X2)− [E(X)]2 Variáveis Aleatórias Discretas Suponha que uma v.a. X possua uma distribuição discreta, cuja função é p(x). Então V (X) = ∑ x (x− µ)2 · p(x) = ∑ x x2 · p(x)− µ2 Exemplo: Suponha que uma v.a. X possa assumir somente quatro valores: -2, 0, 1 e 4, e que P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) = 0, 2. Como visto anteriormente, E(X) = 0, 9. Então V (X) = ∑ x(x − µ)2 · p(x) = (−2 − 0, 9)2 · (0, 1) + (0 − 0, 9)2 · (0, 4) + (1 − 0, 9)2 · (0, 3) + (4− 0, 9) · (0, 2) = 3, 09 Propriedades da Variância P1. V (c) = 0 se e somente se c for uma constante. P2. V (aX) = a2V (X). sendo a constante 66 P3. V (aX + b) = a2V (X). com a e b constantes P4. V (X ± Y ) = V (X) + V (Y )± 2cov(X, Y ). 5.4 Função de Distribuição Acumulada Definição: A função de distribuição da variável aleatória X, representada por Fx ou simplesmente F , é definida por: FX(x) = P (X ≤ x) =xi≤x P (xi) Observações: a) A função de distribuição de X é também frequentemente chamada de função de distribuição acumulada de X. b) A função FX(x) é não-decrescente quando x aumenta, isto é, se x1 < x2, então FX(x1) ≤ FX(x2). c) 0 ≤ F (x) ≤ 1 d) P (a < X ≤ b) = F (b)− F (a) e) P (a ≤ X ≤ b) = F (b)− F (a) + P (X = a) f) P (a < X < b) = F (b)− F (a)− P (X = b) g) Para qualquer valor de x P (X > a) = 1− F (a) Teoremas a) Se X for uma variável aleatória discreta, FX(x) = ∑ j P (xj) 67 onde o somatório é estendido a todos os índices j que satisfaçam a condição xj ≤ x Exemplo Suponhamos que a v.a. X tome os três valores 0,1, e 2, com probabilidades 1/3, 1/6 e 1/2, respectivamente. Então: O gráfico de F está apresentado na Figura abaixo 68 5.5 Exercícios 1. Suponha que 0,4; 0,3; 0,2 e 0,1, respectivamente, sejam as probabilidades de que nenhum, um dois ou três problemas com energiaafetarão certa subdivisão durante dado ano. Determine a média e a variância da variável aleatória X que representa o número de problemas com energia que afeta essa subdivisão. 2. As probabilidades de que haja 0, 1, 2, 3 ou 4 partes defeituosas em uma máquina quando três partes são amostradas da linha de produção são, respec- tivamente: 0,05; 0,20; 0,40; 0,25 e 0,10. Determinar: a) o número médio de partes defeituosas; b) a variância V (X) ; c) F (X) e esboçar seu gráfico. d) P (2 < X ≤ 4). 3. A função de probabilidades da variável aleatória X é: P (X) = 1 5 , para X = 1, 2, 3, 4, 5. a) Calcule E(X) e V (X) b) Calcule P (X ≥ 2) e P (X < 4) c) Determine F (X) e esboce seu gráfico. 4. Suponha que a duração X de uma ligação telefônica, em minutos, seja dada pela seguinte distribuição de probabilidades: X 1 2 3 4 P (X) 0,2 0,5 0,2 0,1 a) Determine P (X ≤ 3) e P (2 ≤ X ≤ 3). b) Calcule E(X) e V (X). c) Obtenha F (X) e esboçe seu gráfico. 5. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposição. Seja X: número de bolas brancas, determinar a distribuição de probabilidades de X. 6. Fazer o exercício anterior considerando extração com reposição. 69 7. Um jogo consiste em se retirar, ao acaso, uma bola de uma caixa contendo 5 bolas brancas, 3 pretas e 2 vermelhas. Se a bola selecionada for branca ganha- se R$ 10,00 e se for preta ou vermelha perdem-se, respectivamente, R$ 5,00 e R$ 15,00. Qual é o lucro médio do jogo? 8. Calcule a esperança e a variância de g(X) = 2X + 3, onde X é a variável aleatória com distribuição de probabilidade X 0 1 2 3 P (X) 1/4 1/8 1/2 1/8 70 6 Distribuições Teóricas de Probabilidades de Variáveis Aleatórias Discretas 6.1 Distribuição de Bernoulli Consideremos uma única tentativa de um experimento aleatório. Podemos ter sucesso ou fracasso nessa tentativa. Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com p + q = 1, ou seja, q = 1− p. Seja X : número de sucessos em uma única tentativa do experimento. X assume o valor 0 que corresponde ao fracasso, com probabilidade q, ou o valor 1, que corre- sponde ao sucesso, com probabilidade p. P (X = 0) = q e P (X = 1) = p Nessas condições a variável aleatória X tem distribuição de BERNOULLI, e sua função de probabilidade é dada por: P (X = x) = px · q1−x A esperança da distribuição de Bernoulli é E(X) = p e sua variância é V (X) = pq Exemplo: Uma urna contém 15 bolas brancas e 25 bolas vermelhas. Uma bola é 71 retirada da urna e a variável aleatória X anota o número de bolas brancas obtidas. Calcule a média e a variância de X e determinar P (X). Solução: X = 0→ q = 25 40 = 5 8 X = 1→ p = 15 40 = 3 8 P (X = x) = (3 8 )x(5 8 )1−x E(X) = p = 3 8 V (X) = pq = 3 8 · 5 8 = 15 64 6.2 Distribuição Binomial Consideremos n tentativas independentes de um mesmo experimento aleatório. Cada tentativa admite apenas dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, p + q = 1. As probabilidades de sucesso e fracasso são as mesmas para cada tentativa. Seja X: número de sucessos em n tentativas. Determinaremos a função de probabilidades da variável X, isto é, P (X = k). Logo, P (X = k) = ( n k ) pkqn−k A variável X tem distribuição binomial, com parâmetros n e p, e indicaremos pela notação X ∼ B(n, p) 72 Exemplo: Será extraida uma amostra de 5 indivíduos de uma grande população, onde 60% são do sexo feminino. Qual a probabilidade de: a) exatamente 3 dos indivíduos escolhidos ser do sexo feminino? b) pelo menos um dos indivíduos ser do sexo feminino? c) ao menos 3 (uma maioria) ser do sexo feminino ? Solução: Se X é a v.a. que representa o número de indivíduos que são do sexo femi- nino, temos que X segue uma distribuição binomial, cuja probabilidade de "sucesso" (ser do sexo feminino) em cada tentativa é 0,60. Portanto, a) P (X = 3) = ( 5 3 ) (0, 6)3(0, 4)2 = 0, 3456 b) A probabilidade que pelo menos um dos indivíduos ser do sexo feminino é dada por 1− P (X = 0) = 1− ( 5 0 ) (0, 6)0(0, 4)5 = 1− 0, 0102 = 0, 9898 c) A probabilidade que ao menos 3 (uma maioria) ser do sexo feminino é dada por P(X = 3) + P(X = 4) + P(X = 5), ou seja: ( 5 3 ) (0, 6)3(0, 4)2 + ( 5 4 ) (0, 6)4(0, 4)1 + ( 5 5 ) (0, 6)5(0, 4)0 = 0, 6826 6.2.1 Média e Variância de uma v.a. com Distribuição Binomial Se X ∼ B(n.p)→ P (X = k) = (n k ) pkqn−k então E(X) = n · p e V (X) = n · p · q Exemplo: Em 100 lances de uma moeda honesta, determeine a média e a variância do número de caras. 73 p = 1 2 e q = 1 2 logo, E(X) = np = 100 · 1 2 = 50 V (X) = npq = 100 · 1 2 · 1 2 = 25 6.3 Distribuição de Poisson Seja X uma v.a. com distribuição discreta, e suponha que X assuma valores inteiros não negativos. É dito que X possui uma distribuição de Poisson com média λ onde (λ > 0) se a função de probabilidade de X é dada por: P (X = k) = e−λλk k! k = 0, 1, 2, 3, . . . em que X o número de sucessos no intervalo Observação:O símbolo e representa uma constante que é aproximadamente igual a 2,7183. O seu nome é uma homenagem ao matemático suiço I. Euler, e constitui a base do chamado logaritmo natural. A distribuição de Poisson é muito usada na distribuição do número de: 1. carros que passam por um cruzamento por minuto, durante uma certa hora do dia; 2. erros tipográficos por página, em um material impresso; 3. defeitos por unidade (m2, m3, m, etc.) por peça fabricada; 4. mortes por ataque de coração por ano, numa cidade. É aplicada também em problemas de filas de espera em geral, e outros. A esperança E(X) = λ e a variância V (X) = λ. 74 A v.a. de Poisson tem um amplo range de aplicações em uma grande variedade de áreas, porque se emprega como uma aproximação para uma v.a. binomial com parâmetros (n, p) quando n é grande e p é pequeno. Supondo que X é uma v.a. binomial com parâmetros (n; p) então λ = np. Exemplo 1: Se a probabilidade de um indivíduio sofrer uma reação nociva, resultante de ter tomado um certo soro é 0,001, determinar a probabilidade de que, entre 2000 indivíduos: a) exatamente três sofrerem a reação; Solução Seja X a v.a. que representa o número de pessoas que sofrem a reação nociva após injerir o soro. Então, P (X = k) = e−λλk k! k = 0, 1, 2, 3, . . . onde λ = 2000 · 0, 001 = 2. Logo, P (X = 3) = e−223 3! = 0, 18 b) mais do que dois sofrerem a reação. P (X ≥ 3) = 1− P (X ≤ 2) = 1− [P (X = 0) + P (X = 1) + P (X = 2)] = 1− [e −220 0! + e−221 1! + e−222 2! ] = 0, 323 Exemplo 2: Numa central telefônica chegam 300 telefonemas por hora. Qual a probabilidade de que: a) num minuto não haja nenhum chamado X: número de chamadas por minuto λ = 5 75 P (X = 0) = e−550 0! = 0, 006738 b) em 2 minutos haja 2 chamados dois minutos λ = 10 P (X = 2) = e−10102 2! = 0, 002270 76 6.4 Exercícios 1. Retira-se uma bola de uma urna contendo 30 bolas brancas e 20 verdes. Qual a probabilidade dessa bola ser verde? 2. Seja X ∼ Bernoulli(p) Mostre que E(X) = p e V (X) = pq, q = 1− p 3. A probabilidade de que certo tipo de componente sobreviverá a um teste de choque é de 3/4. Determine a probabilidade de que exatamente dois dos próxi- mos quatro componentes testados sobrevivam. (R = 27/128) 4. Uma grande rede varesjista compra certo tipo de equipamento eletrônico de um fabricante. O fabricante indica que a taxa de equipamentos com defeito é de 3%. O inspetor da rede seleciona 20 ítens de um carregamento. Qual é a probabilidade de que haja pelo menos um ítem defeituoso entre esses 20? (R = 0,4562) 5. De acordo com a publicação
Compartilhar