Baixe o app para aproveitar ainda mais
Prévia do material em texto
Adriana Speggiorin e André Espindola Probabilidade e Estatística 36 CAPÍTULO 5 ANÁLISE DE CONJUNTOS DE DADOS AGRUPADOS INTRODUÇÃO No capítulo anterior foram apresentados os métodos mais úteis para resumir dados, quando se tratava de análise de pequenos conjuntos de dados (dados não agrupados). Quando se lida com grandes conjuntos de dados, pode-se obter uma boa visualização e todas as informações necessárias, agrupando os dados em certo número de classes, intervalos ou categorias. Este capítulo trata primeiramente dos agrupamentos de dados (distribuição de frequências) e na sequência serão tratados os métodos mais úteis para descrever estes dados: medidas de tendência central, medidas de dispersão e coeficiente de variação. Distribuição de Frequências (D.F) A distribuição de frequências é um resumo, em forma de tabela, que mostra a frequência (ou o número) de observações em cada uma das diversas classes não sobrepostas. Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. Ao sintetizar os dados eles podem ser mais facilmente entendidos e interpretados Como visto no capítulo 1 as variáveis podem ser qualitativas e quantitativas. O objetivo desse capítulo será demonstrar como realizar o agrupamento de dados quantitativos. As três etapas necessárias para definir as classes para uma distribuição de frequências com dados quantitativos são: 1) Determinar o número de classes não sobrepostas. 2) Determinar a extensão (tamanho) de cada classe. 3) Determinar os limites de cada classe. Exemplo 5.1: Serão demonstradas essas etapas para os dados de estaturas, medidas em centímetros, de 40 alunos do colégio A. Dados brutos 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Rol (dados organizados em ordem crescente) 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Antes de iniciarmos a resolução é necessário introduzirmos alguns conceitos básicos. Para exemplificar cada conceito serão utilizados os dados do exemplo 5.1: a) Número total de observações: representa-se por n quando se trata de amostra e N quando se trata de população. b) Limite inferior de observação: é o menor valor encontrado no rol. Adriana Speggiorin e André Espindola Probabilidade e Estatística 37 c) Limite superior de observação: é o maior valor do conjunto. d) Intervalo de observação ou amplitude de observação (H): é a diferença entre os limites de observação. e) Número de classes ( k ): As classes são formadas especificando-se os intervalos que serão usados para agrupar as observações no conjunto de dados. Tabela das estaturas i Variável frequência fi Classe Estatura (cm) Número de alunos 1 2 3 4 5 6 150 |---- 154 154 |---- 158 158 |---- 162 162 |---- 166 166 |---- 170 170 |---- 174 ------ TOTAL f) Largura (ou amplitude) das classes: Recomenda-se que a largura seja a mesma para cada uma das classes. Construindo as classes com a mesma largura, reduzem-se as chances de interpretações inapropriadas pelo usuário. é a diferença entre o limite inferior da classe seguinte e o limite inferior da classe em questão. g) Limites de classe: Os limites de classe precisam ser escolhidos de modo que cada uma das observações pertença a somente uma classe. O limite inferior (li) de classe é o menor valor possível dos dados da respectiva classe. O limite superior (Li) de classe é o maior valor possível dos dados da respectiva classe. h) Ponto médio da classe 2 infinf questãoemclassedaLposteriorclassedaLxi : é a média aritmética entre os extremos da classe. i) Frequência relativa ( fr ): é a razão entre a frequência e o número de observações. Pode, ainda, ser escrita em percentual. j) Frequência acumulada ( F ): é o número de vezes em que a variável é observada desde a 1ª classe até a classe em observação, inclusive . A frequência acumulada da última classe é igual ao número de observações. k) Frequência acumulada relativa ( Fr ): é a razão entre a frequência acumulada e o número de observações. A frequência acumulada relativa da última classe é igual a 1. OBSERVAÇÕES: 1) Ao agrupar os valores das variáveis em intervalos, ganha-se em simplicidade mas perde-se em pormenores. 2) A escolha dos intervalos é arbitrária e a familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um pequeno número de classes, perde-se informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 5 a 15 classes com a mesma amplitude. Adriana Speggiorin e André Espindola Probabilidade e Estatística 38 Exemplo 5.1 (Continuação): Considerando, então a D.F. dada, pode-se montar a seguinte tabela Distribuição de frequências para dados de estatura (i) Variável Frequência (fi) (freq. absoluta) Frequência Relativa (fri) Frequência Acumulada (Fi) Frequência Acumulada Relativa (Fri) Ponto médio (xi) Classe Estatura (cm) Número de alunos ------ Número de alunos ------ Estatura (cm) 1 2 3 4 5 6 Total ------ ------ ------ ------ Considerando a tabela com as diversas frequências responda: a) Quantos alunos têm estatura abaixo de 166 cm? b) Quantos alunos têm estatura igual ou superior a 170 cm? c) Quantos alunos têm estatura abaixo de 162 cm? d) Qual o percentual de alunos que têm estatura entre 162, inclusive, e 166 cm? e) Qual o percentual de alunos que têm estaturas não inferior a 162 cm? EXERCÍCIOS: 1) As notas obtidas por 50 alunos de uma classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 Complete a distribuição de frequências a seguir: (i) Notas Número de alunos ( fi ) ponto médio ( xi ) 1 0 |---- 2 2 2 |---- 4 3 4 |---- 6 4 6 |---- 8 5 8 |---- 10 ------- ------- fi = 50 ------- Adriana Speggiorin e André Espindola Probabilidade e Estatística 39 Responda: a) Qual a amplitude de observação? b) Qual a amplitude do segundo intervalo de classe? c) Qual o número de classes da distribuição? d) Qual o limite superior da classe de ordem 2? e) Qual o limite inferior da quarta classe? 2) Dão-se, a seguir, as notas obtidas por 48 estudantes em um teste: 37 54 62 70 79 87 39 54 62 71 80 88 42 56 63 72 81 91 45 57 64 75 82 92 48 58 66 76 83 93 49 59 67 78 84 94 50 60 67 78 85 94 52 60 67 79 85 96 Agrupe essas notas em uma distribuição com 7 classes. 3) Os pesos, em kg, de 80 alunos de uma universidade estão relacionados abaixo. Organizar os dados em forma de uma D.F com 8 classes e iniciar com o limite inferior da primeira classe em 45. 49 53 61 66 72 79 84 90 93 98 49 54 61 66 73 80 85 90 93 99 49 56 61 67 74 80 86 90 9499 50 56 62 68 74 80 87 91 94 100 50 58 63 68 75 82 88 92 95 101 50 59 64 70 76 83 89 92 96 102 51 60 65 70 76 83 89 92 97 102 52 60 66 72 78 83 89 93 97 105 4) Em uma fábrica foram testadas 400 lâmpadas; a duração delas aparece na distribuição por frequências abaixo: DURAÇÂO (em horas) NÚMERO DE LÂMPADAS 600 |---- 700 700 |---- 800 800 |---- 900 900 |---- 1000 1000 |---- 1100 1100 |---- 1200 14 46 58 76 68 62 1200 |---- 1300 48 1300 |---- 1400 22 1400 |---- 1500 6 TOTAL 400 Adriana Speggiorin e André Espindola Probabilidade e Estatística 40 Complete a tabela com a frequência relativa, a frequência acumulada, a frequência acumulada relativa e o ponto médio. A seguir, responda: a) Qual a amplitude de cada classe? b) Qual a porcentagem de lâmpadas com durabilidade inferior a 1.000 horas? c) Qual a porcentagem de lâmpadas com durabilidade de 1.200 horas ou mais? Representação gráfica de uma distribuição de frequências Uma distribuição de frequências pode ser representada graficamente pelo histograma, pelo polígono de frequências simples e pelo polígono de frequências acumulada: O HISTOGRAMA é a representação gráfica mais comum de uma distribuição de frequências e é formado por um conjunto de retângulos (justapostos quando a variável for contínua), que tem: a) a base sobre o eixo horizontal com o centro no ponto médio e largura igual a amplitude do intervalo de classes; b) a área proporcional à soma das frequências. Pode-se construir um histograma para cada tipo de frequência. Sendo que o histograma das frequências simples possui o mesmo desenho que o das relativas, assim como o histograma das frequências acumuladas tem o mesmo desenho que o das relativas acumuladas, em ambos os casos a diferença está na escala vertical. Exemplo 5.2: Histograma baseado na D.F das alturas dos alunos do exemplo 5.1. O POLÍGONO DE FREQUÊNCIAS SIMPLES é um gráfico obtido ligando-se os pontos médios dos topos dos retângulos de um histograma. Para realmente obter um polígono (linha fechada), deve-se ligar os extremos da linha aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Exemplo 5.3: Polígono de Frequência simples baseado na D.F das alturas dos alunos do exemplo 5.1. Histograma de Frequência 0 2 4 6 8 10 12 150 - 154 154 - 158 158 - 162 162 - 166 166 - 170 170 - 174 x f Histograma de Frequência Relativa 0 0,05 0,1 0,15 0,2 0,25 0,3 150 - 154 154 - 158 158 - 162 162 - 166 166 - 170 170 - 174 x f Adriana Speggiorin e André Espindola Probabilidade e Estatística 41 0 2 4 6 8 10 12 148 152 156 160 164 168 172 176 fre qu ên cia estatura (cm) O POLÍGONO DE FREQUÊNCIAS ACUMULADAS é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Exemplo 5.4: Polígono de Frequência Acumulada baseado na D.F das alturas dos alunos do exemplo 5.1. 0 5 10 15 20 25 30 35 40 45 150 154 158 162 166 170 174 fre qu ên cia estatura (cm) Exemplo 5.5: Resistência à compressão (psi) Frequência (nº de peças) 80 ≤ x < 100 4 100 ≤ x < 120 5 120 ≤ x < 140 7 140 ≤ x < 160 12 160 ≤ x < 180 19 180 ≤ x < 200 17 200 ≤ x < 220 9 220 ≤ x < 240 4 240 ≤ x < 260 2 Adriana Speggiorin e André Espindola Probabilidade e Estatística 42 0 4 8 12 16 20 EXERCÍCIO 1) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes: Área (m2) Número de Lotes 300 |----- 400 14 400 |----- 500 46 500 |----- 600 58 600 |----- 700 76 700 |----- 800 68 800 |----- 900 62 900 |----- 1000 48 1000 |----- 1100 22 1100 |----- 1200 6 Com referência a essa tabela determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a frequência da quarta classe; g) a frequência relativa da sexta classe; h) a frequência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700 m2 ; j) o número de lotes cuja área é igual ou ultrapassa 800 m2; k) a percentagem dos lotes cuja área não atinge 600 m2; l) a percentagem dos lotes cuja área seja maior ou igual a 900 m2; m) a percentagem dos lotes cuja área é de 500m2 , no mínimo, mas inferior a 1000m2; n) a classe do 72º menor lote; o) até que classe estão incluídos 60% dos menores lotes. Respostas a) 900 m² b) 800 m² c) 1000 m² d) 950 m² e) 100 m² f) 76 lotes g) 0,155 h) 262 lotes i) 194 lotes j)138 lotes k) 29,5% l) 19% m) 78% n) terceira o) quinta 80 100 120 140 160 180 200 220 240 260 Resistência à compressão (psi) F r e q u ê n c i a Adriana Speggiorin e André Espindola Probabilidade e Estatística 43 MEDIDAS DE TENDÊNCIA CENTRAL (a partir da D.F.) No passado, deu-se considerável atenção à descrição de dados agrupados, porque, de modo geral, era vantajoso agrupar os dados antes de calcular várias medidas estatísticas. Hoje as condições são outras, pois os cálculos necessários podem ser feitos em questão de segundos por um computador. Mas alguns dados (cifras do governo e distribuição de medidas contínuas, por exemplo) só são acessíveis em forma de distribuições de frequências. MÉDIA O agrupamento de dados acarreta alguma perda de informação. Cada elemento perde sua identidade, por assim dizer; sabemos apenas quantos elementos há em cada classe; por isso, teremos aproximações. Nesse caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: Onde: xi é o ponto médio da classe. Exemplo 5.6: Consideremos a distribuição: (i) Variável fi xi (cm) xi . fi Classe Estatura (cm) Nº de alunos Ponto médio 1 2 3 4 5 6 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174 4 9 11 8 5 3 ------ ------ = ------ = Resolução: Por questão de praticidade, abrimos uma coluna para os pontos médios e outra para os produtos xi . fi. Neste caso teremos: i ii f fx x . EXERCÍCIOS: 1) Determine o preço médio de aparelhos eletrodomésticos montados por uma pequena empresa Preço por unidade (R$) 50 60 80 90 Nº de unidades montadas 8 5 4 3 Adriana Speggiorin e André Espindola Probabilidade e Estatística 44 2) Calcule a média aritmética da distribuição de frequências abaixo: NOTAS Número de alunos 0 |---- 2 2 |---- 4 4 |---- 6 6 |---- 8 8 |---- 10 5 8 14 10 7 ------ = 3) A distribuição a seguir apresenta os dados relativos ao número de notebooks defeituosos encontrados em 34 lotes produzidos no mês de janeiro. Determinar o número médio de notes defeituosos por lote. Nº de notebooksNº de lotes 0 2 1 6 2 10 3 12 4 4 ------ = 34 4) A tabela a seguir é uma distribuição de frequência que mostra o preço de livros comercializados em uma certa livraria. Determinar o preço médio dos livros baseados nesta amostra. Preço (R$) Nº de livros 29,90 27 34,90 24 35,90 19 39,90 22 42,90 13 49,00 12 Respostas: 1) 64,50 2) 5,3 3) 2,3 4) 37,18 Adriana Speggiorin e André Espindola Probabilidade e Estatística 45 MEDIANA Nesse caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para isso, inicialmente vamos determinar a classe na qual se acha a mediana - chamaremos de classe mediana. Tal classe será aquela correspondente à frequência acumulada imediatamente superior a 2 if . Exemplo 5.7: Voltando ao exemplo das estaturas dos alunos de uma escola. Determine a estatura mediana. (i) Variável Frequência ( fi ) Frequência acumulada ( Fi ) Classe Estatura ( cm) Número de alunos Número de alunos 1 150 |----- 154 4 4 2 154 |----- 158 9 13 3 158 |----- 162 11 24 4 162 |----- 166 8 32 5 166 |----- 170 5 37 6 170 |----- 174 3 40 ------ ------ = 40 ------ Temos: Ponto mediano: P = aluno f oi 20 2 40 2 A mediana é, então, calculada pela seguinte fórmula: Onde: li = limite inferior da classe mediana. h = amplitude de classe. P = ponto mediano. ( fi / 2) F(ant) = frequência acumulada da classe anterior à classe mediana. fi = frequência simples da classe mediana. Cálculo da mediana: Adriana Speggiorin e André Espindola Probabilidade e Estatística 46 Exemplo 5.8: Calcule a média e a mediana da distribuição de frequência abaixo: Variável Frequência ( fi ) Frequência acumulada (Fi) Valor ( R$) Nº de notas Nº de notas 450 |----- 550 8 550 |----- 650 10 650 |----- 750 11 750 |----- 850 16 850 |----- 950 13 950 |----- 1050 5 1050 |----- 1150 1 ------ = Devido às condições impostas na obtenção da fórmula da mediana, fica evidente que o valor obtido pela fórmula é um valor aproximado do verdadeiro valor da mediana da série. De modo geral, todas as medidas calculadas para uma variável contínua serão valores aproximados para estas medidas, uma vez que ao agruparmos os dados segundo uma variável contínua, há perda de informações quanto à identidade dos dados. MODA A classe que apresenta a maior frequência é denominada classe modal. Obs: Podemos determinar a moda como sendo o ponto médio da classe modal. Exemplo 5.9: As alturas dos alunos de uma escola estão representadas na tabela abaixo. Calcule a altura modal. Classe Estatura ( m ) Número de alunos 1 1,10 |--- 1,20 12 2 1,20 |--- 1,30 21 3 1,30 |--- 1,40 32 4 1,40 |--- 1,50 24 5 1,50 |--- 1,60 8 6 1,60 |--- 1,70 3 ------- ------ = Exemplo 5.10: As velocidades das motocicletas estão representadas na tabela abaixo. Calcule a velocidade modal. Classe Velocidade (km / h) Número de motocicletas 1 50 |-- 60 6 2 60 |-- 70 9 3 70 |-- 80 11 4 80 |-- 90 22 5 90 |-- 100 16 6 100 |-- 110 4 7 110 |-- 120 2 ------ Total 70 Adriana Speggiorin e André Espindola Probabilidade e Estatística 47 MEDIDAS DE DISPERSÃO (OU DE VARIABILIDADE) Variância A variância amostral para dados agrupados é calculada pela seguinte fórmula: Desvio padrão para dados agrupados Como o desvio padrão é a raiz quadrada positiva da variância, temos, para dados agrupados: Exemplo 5.11: Calcular a variância e o desvio padrão das seguintes D.F’s (representam amostras) a) Variável Frequência Ponto médio ( xi ) Estaturas ( cm) Número de alunos cm 150 |--154 4 154 |--158 9 158 |--162 11 162 |--166 8 166 |--170 5 170 |--174 3 ------ = 40 ------ Adriana Speggiorin e André Espindola Probabilidade e Estatística 48 b) Notas Nº de alunos Ponto médio ( xi ) 0 |--- 2 8 2 |--- 4 12 4 |--- 6 16 6 |--- 8 10 8 |--- 10 4 ------ = 50 ------ EXERCÍCIOS: 1) Calcular a variância e o desvio padrão da distribuição dos QI de uma amostra dos alunos de uma escola de ensino fundamental. QI Número de alunos 60 |--- 70 1 70 |--- 80 6 80 |--- 90 12 90 |---100 20 100|---110 18 110|---120 10 120|---130 3 Total 70 2) Calcule a variância e o desvio padrão para a distribuição do consumo de energia elétrica de uma amostra de 54 notas famílias de 4 pessoas emitidas na mesma data, selecionadas em um bairro da cidade. classe Consumo (kW/h) Número de famílias 1 0 |----- 50 10 2 50 |----- 100 28 3 100 |----- 150 12 4 150 |----- 200 2 5 200 |----- 250 1 6 250 |----- 300 1 Respostas 1) s² = 180,12 s = 13,4 3) s² = 2446,7 s = 49,5 Adriana Speggiorin e André Espindola Probabilidade e Estatística 49 COEFICIENTE DE VARIAÇÃO O coeficiente de variação é uma medida adimensional, útil para comparar resultados de amostras cujas unidades podem ser diferentes. É definido como o quociente entre o desvio padrão e a média e, em geral, é expresso em percentual. 100. x s CV Exemplo 5.12: Dois processos, medindo a espessura de materiais diferentes, obtiveram os seguintes resultados: 1 - Folha de aço: média = 2,49 mm; desvio padrão = 0,12 mm 2 - Chapa de madeira: média = 3,75 mm; desvio padrão = 0,15 mm Qual dos dois processos é relativamente mais preciso? CV1 = CV2 = CURVAS DE FREQUÊNCIAS Como, em geral, os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha poligonal (contorno do polígono de frequência) tende a se transformar numa curva - a curva de frequências - mostrando a verdadeira natureza da distribuição da população. Podemos dizer, então, que, enquanto o polígono de frequência nos dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. Curvas em forma de sino Caracterizam-se pelo fato de apresentarem um valor máximo em torno da região central. São muitos os fenômenos que oferecem distribuições em forma de sino: a estatura de adultos, o peso de adultos, a inteligência medida em testes. As curvas em forma de sino podem ser simétricas ou assimétricas. a) SIMÉTRICA: Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos equidistantes desse ponto terem a mesma frequência. b) ASSIMÉTRICA: Na prática, não encontramos distribuições perfeitamente simétricas. Assim, as curvas correspondentes a tais distribuições apresentam a cauda de um lado mais alongada que do outro . Se a cauda mais alongada fica à direita, a curva é chamada assimétrica positiva. Se a cauda se alonga à esquerda, a curva é assimétrica negativa.Adriana Speggiorin e André Espindola Probabilidade e Estatística 50 Adriana Speggiorin e André Espindola Probabilidade e Estatística 51 CAPÍTULO 6 PROBABILIDADE MODELO PROBABILÍSTICO Qual ocorrência parece ter maior probabilidade: ser atingido por um raio ou ganhar na loteria? As origens da matemática da probabilidade remontam ao século XVI. As aplicações iniciais referiam-se quase todas a jogos de azar. Os jogadores ricos aplicavam o conhecimento da teoria das probabilidades para planejar estratégias de apostas. Mesmo hoje ainda há muitas aplicações que envolvem jogos de azar, tais como os diversos tipos de loterias, os cassinos de jogos, as corridas de cavalos e os esportes organizados. Todavia, a utilização das probabilidades ultrapassou de muito o âmbito desses jogos. Hoje os governos, as empresas, as organizações profissionais incorporam a teoria das probabilidades em seus processos diários de deliberações. Independentemente de qual seja a aplicação em particular, a utilização das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um evento futuro. Assim é que, em muitos casos, pode ser impossível afirmar por antecipação o que ocorrerá; mas é possível dizer o que pode ocorrer. Por exemplo, se jogarmos uma moeda para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa. Além disso, mediante determinada combinação de julgamentos, experiências e dados históricos, em geral é possível dizer quão provável é a ocorrência de determinado evento futuro. Há numerosos exemplos de tais situações no campo dos negócios e do governo. A previsão da procura de um produto novo, o cálculo dos custos de produção, a compra de apólices de seguro, a contratação de um novo empregado, o preparo de um orçamento, a avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso. As probabilidades são úteis porque auxiliam a desenvolver estratégias. Assim é que alguns motoristas parecem demonstrar uma tendência para correr à grande velocidade se acham que há pouco risco de ser apanhados; os investidores sentem-se mais inclinados a aplicar seu dinheiro se as chances de lucro são boas; e um cidadão carregará capa ou guarda-chuva se houver grande probabilidade de chover. Analogamente, uma empresa pode sentir-se inclinada a investir em novo equipamento se há boa chance de recuperar o dinheiro; ou contratar um novo funcionário que pareça promissor. O ponto central em todas essas situações é a probabilidade de quantificar quão provável é determinado evento. Vimos anteriormente que a análise de um conjunto de dados por meio de técnicas numéricas e gráficas permite que tenhamos uma boa ideia da distribuição desse conjunto. Em particular, a distribuição de frequências é um instrumento importante para avaliarmos a variabilidade das observações de um fenômeno aleatório. A partir dessas frequências observadas podemos calcular medidas de posição e variabilidade, como média, mediana, desvio padrão, etc. Essas frequências e medidas calculadas a partir dos dados são estimativas de quantidades desconhecidas, associadas, em geral, a populações das quais os dados foram extraídos na forma de amostras. Em particular, as frequências (relativas) são estimativas de probabilidades de ocorrências de certos eventos de interesse. Com suposições adequadas, e sem observarmos diretamente o fenômeno aleatório de interesse, podemos criar um modelo teórico que reproduza de maneira razoável a distribuição de frequências, quando o fenômeno é observado diretamente. Tais modelos são chamados modelos probabilísticos. Adriana Speggiorin e André Espindola Probabilidade e Estatística 52 FUNDAMENTOS Se medirmos a resistência à compressão de um corpo de prova de concreto, estaremos conduzindo um experimento. Entretanto, em repetições diárias de medidas, os resultados poderão diferir levemente, devido a pequenas variações que não estejam controladas em nosso experimento, incluindo variações climáticas (temperatura e umidade), leves variações dos instrumentos de medição, pequenas variações na composição química dos componentes do concreto. Consequentemente, diz-se que esse experimento tem um componente aleatório. Em alguns casos, as variações aleatórias são tão pequenas que podem ser ignoradas. No entanto, a variação está quase sempre presente e sua magnitude pode ser tanta que as conclusões importantes do nosso experimento podem não ser óbvias. Experimento Um experimento é qualquer processo que permite ao pesquisador fazer observações. Experimento aleatório É o experimento que pode fornecer diferentes resultados muito embora seja repetido toda vez da mesma maneira. Espaço Amostral Espaço amostral, S, é qualquer conjunto, de todos os resultados possíveis do experimento em questão. Evento Um evento é uma coleção de resultados de um experimento. É, portanto, um subconjunto do espaço amostral. Exemplo 6.1 No experimento aleatório de lançar uma moeda, com lados 0 e 1, há dois possíveis pontos amostrais: 0 e 1. Então, o espaço amostral para esse experimento é S={0, 1}. Exemplo 6.2 Seja um experimento para testar um artigo produzido por uma fábrica. Da linha de produção é retirado um artigo e classificado como bom (B) ou defeituoso (D). O espaço amostral do experimento é S={B, D} Exemplo 6.3 A partir do exemplo 6.2, considere o experimento que consiste em retirar três artigos da linha de produção. O espaço amostral do experimento é S={(B,B,B) , (B,B,D) , (B,D,B) , (B,D,D) , (D,B,B) , (D,B,D) , (D,D,B) , (D,D,D)} Exemplo 6.4 Numa linha de produção conta-se o número de peças defeituosas num intervalo de uma hora. S={0, 1, 2, 3, ..., k }, onde k=nº de peças produzidas em uma hora Exemplo 6.5 Considere o experimento que consiste em retirar uma lâmpada de um lote e medir seu “tempo de vida” antes de queimar. Um espaço amostral conveniente é }0:{ ttS isto é, o conjunto de todos os números reais não negativos. Se A indicar o evento “o tempo de vida da lâmpada é inferior a 20 horas”, então }200:{ tIRtA . Esse é um exemplo de um espaço amostral contínuo, contrastando com os anteriores, que são discretos. Adriana Speggiorin e André Espindola Probabilidade e Estatística 53 Exemplo 6.6 Queremos estudar as frequências de ocorrência das faces de um dado. Um procedimento seria lançar o dado certo número de vezes, n, e depois contar o número s de vezes em que ocorre a face em questão. As proporções n s determinam a distribuição de frequências do experimento realizado. Lançando o dado um número diferente de vezes da anterior, teríamos outra distribuição de frequências, mas com um padrão que esperamos ser muito próximo do anterior. Mas o modelo teórico (ou probabilístico) para o experimento é dado na tabela a seguir: Face 1 2 3 4 5 6 Total Frequência teórica 1/6 1/6 1/6 1/6 1/6 1/6 1 )( )( )( Sn An AP Notação para Probabilidades P denota uma probabilidade. A, B, C denotam eventos específicos. P(A) denota a probabilidade de ocorrência do evento A. Lei dos Grandes Números Se repetirmos um experimento um grande número de vezes, a probabilidade pela frequência relativa de um eventotende para a probabilidade teórica. Definição Clássica de Probabilidade Intuitivamente, probabilidade de um evento, é uma medida de ele ocorrer. Suponha que um experimento tenha n eventos simples diferentes, cada um dos quais com a mesma chance de ocorrer. Se o evento A pode ocorrer em s dentre as n maneiras, então NÚMERO DE ELEMENTOS DO EVENTO A NÚMERO DE ELEMENTOS DO ESPAÇO AMOSTRAL Adriana Speggiorin e André Espindola Probabilidade e Estatística 54 Eventos Complementares Em uma dada observação ou experimento, um evento deve ocorrer ou não ocorrer. Esses eventos são chamados eventos complementares. Por isso, a probabilidade da ocorrência mais a probabilidade da não ocorrência será sempre igual a 1. Se A é um evento então denotamos seu complementar por A’. Segue, então P(A’) = 1 – P(A) Exemplo 6.7: Numa urna têm-se três bolas amarelas, cinco bolas vermelhas e duas bolas azuis. Ao retirarmos, aleatoriamente, uma bola, a probabilidade dela ser azul é logo, a probabilidade dela ser amarela ou vermelha é Eventos Mutuamente Excludentes Dois ou mais eventos são mutuamente excludentes, ou disjuntos, se os mesmos não podem ocorrer simultaneamente. Isto é, a ocorrência de um evento automaticamente impede a ocorrência do outro evento (ou eventos). Exemplo 6.8: Em um estudo do comportamento do consumidor, um analista classifica as pessoas que entram em uma loja de equipamentos de som de acordo com o sexo (‘masculino’ ou ‘feminino’) e de acordo com a idade (‘menos de 30’ ou ‘30 ou mais’). Os dois eventos, ou classificações, ‘masculino’ e ‘feminino’ são mutuamente excludentes, uma vez que qualquer pessoa dada deveria ser classificada em uma categoria ou em outra. Da mesma forma, os eventos ‘menos de 30’ e ’30 ou mais’ são também mutuamente excludentes. Contudo, os eventos ‘masculino’ e ‘menos de 30’ não são mutuamente excludentes, porque uma pessoa aleatoriamente escolhida poderia ter ambas as características. A expressão da Probabilidade Sendo P(A) a probabilidade de um evento ocorrer, tem-se que o menor valor que um enunciado de probabilidade pode ter é 0 (indicando que o evento é impossível) e o maior é 1 (indicando que o evento certamente irá ocorrer – evento certo). Então Adriana Speggiorin e André Espindola Probabilidade e Estatística 55 REGRAS DA ADIÇÃO As regras da adição são utilizadas quando desejamos determinar a probabilidade P(A ou B) de ocorrer o evento A ou o evento B (ou ambos) como resultado de um experimento. A palavra- chave aqui é a conjunção ou. Na linguagem da teoria dos conjuntos, isto é conhecido como união de A e B e a probabilidade é designada por )( BAP . O diagrama de Venn ilustra visualmente a regra da adição: EVENTOS MUTUAMENTE EXCLUDENTES EVENTOS NÃO MUTUAMENTE EXCLUDENTES Exemplo 6.9: Ao retirar uma carta de um baralho, os eventos “ás” e “rei” são mutuamente excludentes. A probabilidade de tirar um ás ou um rei numa única tentativa é: Podemos representar a probabilidade da ocorrência conjunta por )( BeAP . Em linguagem de teoria dos conjuntos isto é chamado de intersecção de A e B, e a probabilidade é indicada por )( BAP . Então, a regra da adição para eventos é : )()()()( BeAPBPAPBouAP Exemplo 6.10: Ao retirar uma carta de um baralho, os eventos “ás” e “espadas” não são mutuamente excludentes. A probabilidade de retirar um ás ou espada (ou ambos) em uma só tentativa é 13 4 52 16 52 1 52 13 52 4 )()()()( EeAPEPAPEouAP A B E INTERSECÇÃO DOS EVENTOS A E B. Adriana Speggiorin e André Espindola Probabilidade e Estatística 56 Exemplo 6.11: Ao retirar uma carta de um baralho, os eventos “ás” e “rei” são mutuamente excludentes. A probabilidade de retirar um ás ou um rei numa única tentativa é: 13 2 52 8 52 0 52 4 52 4 E)eAP(P(E)P(A)E)ouP(A Exemplo 6.12: Uma pesquisa relativa à leitura de determinados jornais regionais (A e B) apontou os seguintes resultados: - cada pessoa entrevistada havia lido pelo menos um dos jornais; - 22 pessoas leram o jornal A; - 18 pessoas leram o jornal B; - 10 pessoas, os jornais A e B. Qual a probabilidade de, ao sortearmos um entrevistado, ele ter lido o jornal A? E somente o jornal B? E ambos os jornais? Não ter lido qualquer jornal? Exemplo 6.13: a) Se um dos 2072 indivíduos da tabela a seguir é escolhido aleatoriamente, determine a probabilidade de se obter alguém que fez uso de um placebo ou estava no grupo de controle. Teste de Seldane Seldane Placebo Grupo de controle Total Dor de cabeça Não-dor de cabeça 49 732 49 616 24 602 122 1950 Total 781 665 626 2072 b) Escolhido aleatoriamente um dos 2072 indivíduos da tabela acima, determine a probabilidade de obter alguém que tenha usado Seldane ou que não teve dor de cabeça. Adriana Speggiorin e André Espindola Probabilidade e Estatística 57 REGRAS DA MULTIPLICAÇÃO As regras de multiplicação se relacionam com a determinação da probabilidade da ocorrência conjunta de A e B. Temos, então, a intersecção de A e B, sendo a probabilidade designada por )( BAP . Existem duas variações da regra de multiplicação, conforme os eventos sejam independentes ou dependentes. )(.)()()( BPAPBAPBeAP Exemplo 6.14: Uma moeda é lançada duas vezes. A probabilidade de que ambos os resultados sejam “cara” é: 4 1 2 1 2 1 )( xcaraecaraP Exemplo 6.15 Na extração de duas cartas de um baralho bem misturado, determine a probabilidade de que a primeira carta seja um ás e a segunda seja um rei. (Admita que a primeira carta extraída não seja reposta antes da extração da segunda carta.) 00603,0 51 4 52 4 )( xreieásP Exemplo 6.16: Deve-se inspecionar uma grande remessa de caixas de chocolate. Os registros indicam que 2% das caixas acusam conteúdo inferior ao estipulado. Escolhidas duas caixas aleatoriamente, qual a probabilidade de ambas acusarem conteúdo inferior, admitindo-se que a remessa inspecionada é semelhante às anteriores? 0004,0)02,0(.)02,0()( sdeficienteambasP Exemplo 6.17: Teste de Seldane Seldane Placebo Grupo de controle Total Dor de cabeça Não-dor de cabeça 49 732 49 616 24 602 122 1950 Total 781 665 626 2072 Ao sortear-se uma pessoa, qual a probabilidade de ela ter feito uso de placebo e não ter tido dor de cabeça? (procura-se a frequência que se encontra na intersecção entre a coluna “placebo” e a linha “não dor de cabeça” e divide pelo total) A PROBABILIDADE DE “AO MENOS UM” * “Ao menos 1” é equivalente a “1 ou mais”. * O complemento de “obter ao menos 1 item de determinado tipo” é “não obter item daquele tipo”. Adriana Speggiorin e André Espindola Probabilidade e Estatística 58 Exemplo 6.18: Baseados no exemplo 6.2, qual a probabilidade de, ao retirarmos três peças da linha de produção, ao menos uma ter defeito? A probabilidade de “ao menos uma ter defeito” tem como complemento “as três peças boas” P(ao menos uma com defeito) = 1 – P(três boas)P(A) = 1 – P(A’) Considerando P(Boa) = 4 3 P(A) = 1 – P(B e B e B) P(A) = 1 - 4 3 4 3 4 3 xx P(A) = 1 – 64 27 P(A) = 0,578 PROBABILIDADE CONDICIONAL Se A e B são eventos e P(B) > 0, então a probabilidade condicional de A dado B, escrita como P(A|B), é ( | ) ( | ) ( ) Observa-se que o que acontece no cálculo de probabilidade condicional é que B se torna o espaço amostra. A intuição é que nosso espaço amostral original S, foi atualizado para B. Exemplo 6.19: Componentes complexos são montados em uma fábrica que usa duas linhas de montagem diferentes: A1 e A2. A linha A1 usa equipamentos mais antigos que A2, de forma que é mais lenta e um pouco menos confiável. Suponha que, em determinado dia, a linha A1 tenha montado 8 componentes, dos quais 2 foram identificados como defeituosos (D) e, 6 como não defeituosos (ND), ao passo que a linha A2 produziu 1 defeituoso e 9 não defeituosos. Essas informações estão resumidas na tabela a seguir: Condição D ND Linha A1 2 6 A2 1 9 Selecionado 1 componente aleatoriamente, qual a probabilidade de ser da linha A1, dado que é defeituoso? ( | ) EXERCÍCIOS 1) Quais dos valores abaixo não podem ser probabilidades? 0 0,0001 -0,2 3/2 2/3 2 2,0 Adriana Speggiorin e André Espindola Probabilidade e Estatística 59 2) Dado um experimento aleatório, deixar cair o dado e verificar o número da face voltada para cima. a) Qual é a probabilidade de ocorrer um número par na face superior? b) Qual é a probabilidade de ocorrer um número menor ou igual a 6 na face superior ? c) Qual é a probabilidade de ocorrer um número 4 na face superior? d) Qual é a probabilidade de ocorrer um múltiplo de 3? e) Qual é a probabilidade de ocorrer um número maior ou igual a 2? f) Qual é a probabilidade de ocorrer um número maior que 6 na face superior? 3) Um baralho contém 4 “valetes” e 48 outras cartas. A probabilidade de se obter um valete em uma única retirada, ao acaso, de uma carta é 4) Antes de incluir a cobertura para certos tipos de problemas dentais em apólices de seguro-saúde para empregados adultos, uma companhia de seguros deseja determinar a probabilidade de ocorrer tais problemas, para estabelecer a taxa de seguro. Portanto, o estatístico coletou dados para 10000 adultos na faixa de idade adequada e observou que 100 pessoas tiveram o problema dental particular no ano passado. Qual a probabilidade de ocorrência dessa doença? 5) Determine a probabilidade de obter o total 4 no arremesso de um par de dados. 6) Um estudo de hábitos de fumantes compreende 200 casados (54 dos quais fumam), 100 divorciados (38 dos quais fumam) e 50 adultos que nunca se casaram (11 dos quais fumam). Escolhido aleatoriamente 1 indivíduo dessa amostra, determine a probabilidade de obter alguém divorciado ou fumante. 7) Joga-se um par de dados equilibrados: a) Qual a probabilidade de ambas as faces serem seis? b) Qual a probabilidade de ambas as faces serem dois? c) Qual a probabilidade de ambas as faces serem números pares? 8) Na jogada de um par de dados, qual é a probabilidade de ambas as faces terem o mesmo valor? 9) Faça o exercício 8 no caso da jogada de três dados. 10) As falhas de diferentes máquinas são independentes umas das outras. Se há quatro máquinas e, se suas respectivas probabilidades de falha são 1%, 2%, 5% e 10% em determinado dia, calcule as probabilidades: a) de todas falharem em determinado dia. b) de nenhuma falhar. c) ao menos uma falhar. 11) Numa escola de ensino fundamental, 30% dos estudantes são do primeiro ciclo, 35% do segundo, 20% do terceiro e os restantes, do quarto ciclo. Um dos estudantes ganhou uma bolsa de estudos. Determine as seguintes probabilidades: a) de o estudante ser do quarto ciclo. b) de ser do primeiro ou do segundo ciclo. c) de não ser do quarto ciclo. 12) As probabilidades de 0, 1, 2, 3, 4, 5, 6 ou 7 acidentes num dia de semana entre 13 e 18 horas são, respectivamente, 0,08, 0,15, 0,20, 0,25, 0,18, 0,07, 0,04 e 0,01. Determine as seguintes probabilidades para um dia qualquer da semana naquele horário: a) menos de 3 acidentes. b) 3 ou menos acidentes. c) exatamente 3 acidentes. d) nenhum acidente. e) mais de 7 acidentes. Adriana Speggiorin e André Espindola Probabilidade e Estatística 60 13) Uma fábrica de louças tem um processo de inspeção com quatro etapas. A probabilidade de uma peça defeituosa passar numa etapa de inspeção sem ser detectada é de aproximadamente 20%. Com base nesta cifra, determine a probabilidade de uma peça defeituosa passar por todas as quatro etapas de inspeção sem ser detectada. Qual seria a probabilidade, se se acrescentasse uma quinta etapa de inspeção, com 50% de probabilidade de detectar peças defeituosas? 14) Os dados da tabela a seguir resumem resultados de um estudo de 1000 mortes, selecionadas aleatoriamente, de homens com idade de 45 a 64 anos. Causa da morte Câncer Doença Cardíaca Outros Fumante Não fumante 135 55 310 155 205 140 a) Se, dos 1000 indivíduos, 1 é selecionado aleatoriamente, determine a probabilidade de se obter um fumante. b) Se, dos 1000 indivíduos, 1 é selecionado aleatoriamente, determine a probabilidade de se obter um fumante ou alguém que tenha morrido em consequência de doença cardíaca. c) Escolhidos aleatoriamente dois indivíduos, determine a probabilidade de ambos terem morrido de câncer. d) Escolhidos aleatoriamente um indivíduo, determine a probabilidade de obter um não fumante que tenha morrido de câncer. e) Escolhidos aleatoriamente três indivíduos diferentes, determine a probabilidade de serem todos fumantes. f) Escolhido aleatoriamente um indivíduo, determine a probabilidade de se tratar de um fumante, dado que morreu de câncer. (probabilidade condicional) g) Escolhido aleatoriamente um indivíduo, determine a probabilidade de obter alguém que tenha morrido de câncer, dado que se tratava de um fumante. (probabilidade condicional) 15) Um vendedor de automóveis deseja impressionar os possíveis compradores com o número de combinações diferentes possíveis. Um modelo pode ser dotado de três tipos de motor, dois tipos de transmissão, cinco cores externas e duas internas. Quantas são as escolhas possíveis? 16) Um cardápio oferece cinco tipos de carne ou peixe, três de salada, dois de batatas e quatro de vegetais. Quantos “pratos” são possíveis de serem formados, com um tipo de cada um? 17) De quantas maneiras podemos formar um comitê de três pessoas dentre cinco? 18) Suponha que 2% dos rolos de tecido de algodão e 3% dos rolos de tecido de náilon contenham falhas. Dos rolos utilizados por uma confecção, 70% são de algodão e 30% são de náilon. Qual a probabilidade de um rolo selecionado aleatoriamente, usado pela confecção, contenha falhas? Adriana Speggiorin e André Espindola Probabilidade e Estatística 61 19) Discos de plástico de policarbonato, provenientes de dois fornecedores, são analisados quanto à resistência a arranhões. Os resultados estão resumidos a seguir: Resistência a arranhões Fornecedor 1 Fornecedor 2 Alta 38 43 Baixa 12 7 Qual a probabilidade de um disco selecionado aleatoriamente: a) ter alta resistência a arranhões? b) ser do fornecedor 2? c) ter baixa resistência e ser do fornecedor 1? d) ter alta resistência,dado que é proveniente do fornecedor 2? (probabilidade condicional) RESPOSTAS 2) a) 0,5 b) 1 c) 0,167 d) 0,333 e) 0,833 f) 0 3) 0,077 4) 0,01 5) 0,083 6) 0,471 7) a) 0,028 7) b) 0,028 7) c) 0,25 8) 0,167 9) 0,0278 10) a) 0,000001 b) 0,829 c) 0,171 11) a) 0,15 b) 0,65 c) 0,85 12) a) 0,43 b) 0,68 c) 0,25 d) 0,08 e) 0,02 13) a) 0,0016 b) 0,0008 14) a) 0,65 b) 0,805 c) 0,036 d) 0,055 e) 0,274 f) 0,711 g) 0,208 15) 60 16) 120 17) 10 18) 2,3% 19) a) 0,81 b) 0,5 c) 0,12 d) 0,86
Compartilhar