Baixe o app para aproveitar ainda mais
Prévia do material em texto
INTRODUÇÃO Histórico Toda Ciência tem suas raízes na história do homem, com a Matemática, que é considerada “A Ciência que une a clareza do raciocínio à síntese da linguagem”, não foi diferente, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário e empírico. A Estatística é um ramo da Matemática que também teve sua origem de forma semelhante. Desde a Antiguidade vários povos já registravam o número de habitantes, de nascimento, de óbitos, faziam estimativas de riquezas individuais e sociais, etc. Na idade média colhiam-se informações, geralmente com a finalidade tributária. A partir do século XVI começaram a surgir as primeiras análises de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século XVII, com Godofredo Achenwall, o estudo de tais fatos foi adquirindo proporções verdadeiramente científicas, dando origem a estatística, propriamente dita. Formou-se assim uma ferramenta que através da observação de partes (amostras), chega-se a conclusões sobre um todo (população). Método Estatístico MÉTODO: é um meio mais eficaz para atingir determinada meta. Entre os Métodos Científicos destacamos o método experimental e o método estatístico. Método Experimental: Consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Método Estatístico: diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, o nível geral de preços, etc. O que é Estatística? A Estatística é parte da Matemática Aplicada que fornece métodos de coleta, organização, descrição, análise e interpretação de dados, úteis nas tomadas de decisão. Como se Classifica a Estatística? Estatística Descritiva: Coleta , organização e descrição dos dados. Estatística Indutiva ou Inferencial: Análise e interpretação dos dados. Permite obter conclusões sobre os dados obtidos inicialmente, que é o objetivo essencial da Estatística. Probabilidade: Útil para analisar situações que envolvem o acaso. Ex: a decisão de parar de imunizar pessoas com mais de vinte anos contra determinada doença. Fases da Pesquisa Estatística Coleta de Dados Após planejamento e determinação das características mensuráveis do objeto em estudo, inicia-se a coleta de dados. Esta pode ser direta ou indireta. A coleta direta é feita sobre registros diversos: nascimento, casamento, óbitos, importação, registros escolares; ou ainda quando os dados são coletados diretamente pelo pesquisador através de questionários (ex: censo). A coleta direta pode ser: contínua; periódica (censos); ocasional. A coleta indireta é uma coleta feita sobre dados colhidos de uma coleta direta (ex: mortalidade infantil) Crítica dos Dados Os dados coletados devem ser observados, à procura de falhas e imperfeições, a fim de não causarem erro nos resultados. Exemplo: Perguntas tendenciosas. O tráfego contribui em maior ou menor grau do que a indústria para a poluição atmosférica? Resposta: 45 % para o tráfego e 32 % para a indústria. A indústria contribui em maior ou menor grau do que o tráfego para a poluição atmosférica? Resposta: 24 % para o tráfego e 57 % para a indústria. Preservação da auto-imagem. Em uma pesquisa telefônica 94 % dos entrevistados disseram que lavam as suas mãos após usar o banheiro, mas a observação em banheiros públicos, esse percentual cai para 68 %. Más Amostras. As pessoas devem ser escolhidas aleatoriamente para a pesquisa, como por exemplo, numa pesquisa de opinião na rua, deve-se entrevistar somente quem pisou em uma determinada marca pré-determinada na calçada. Más perguntas. A pergunta deve conter o linguajar próprio do entrevistado. Geralmente, se o entrevistado não entender a pergunta, ele responderá qualquer coisa, pois tem vergonha de perguntar novamente ou questionar a pergunta. Apuração dos Dados É o processamento dos dados obtidos Exposição dos Dados Através de tabelas ou gráficos, tornando mais fácil seu exame e aplicação de um cálculo estatístico. Análise dos Resultados Através de métodos de estatística indutiva ou inferencial obtêm-se conclusões e revisões de um todo através do exame de apenas uma parte desse todo. Variáveis Qualitativas e Quantitativas Variável é o conjunto de resultados possíveis de um fenômeno. Variável Qualitativa Quando seus valores são expressos por atributos: sexo, cor da pele, etc. Variável Quantitativa Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica, trata-se, portanto da estatística de variável e se dividem em: Variável Discreta: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística no 1º semestre de 2009: mar = 48 , abr = 45 , mai = 42 , jun = 38. Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R, dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar à temperatura atual do seu corpo. Exemplos - Cor dos olhos dos alunos: qualitativa Índice de liquidez nas indústrias capixabas: quantitativa contínua Produção de café no Brasil: quantitativa contínua Número de defeitos em aparelhos de TV: quantitativa discreta Comprimento dos pregos produzidos por uma empresa: quantitativa contínua O ponto obtido em cada jogada de um dado: quantitativa discreta Precisão e Arredondamento A precisão da medida será automaticamente indicada pelo número de decimais com que se escrevem os valores da variável. Ex: 1,80 m indica uma medição com precisão de centésimos. O arredondamento indica o número de dígitos significativos que se deseja obter, ou seja, os valores inferiores à precisão solicitada podem ser desconsiderados. De acordo com resolução do IBGE , para arredondar um número prosseguimos da seguinte maneira: Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica inalterado o último algarismo a permanecer, ou seja, arredonda-se por falta. Ex: 53,24 passa a 53,2 ; 17,3452 passa a 17,3 . Quando o primeiro algarismo a ser abandonado é 6, 7, 8, ou 9, aumenta-se de uma unidade o último algarismo a permanecer, ou seja, arredonda-se por excesso. Ex: 42,87 passa a 42,9 ; 25,08 passa a 25,1; 53,99 passa a 54,0 Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: a) Se ao 5 seguir em qualquer casa um algarismo diferente de 0, aumenta-se de uma unidade o último algarismo a permanecer, ou seja, arredonda-se por excesso. Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7. b) Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar, ou seja, arredonda-se para o par mais próximo. Ex: 24,75 passa a 24,8 24,65 passa a 24,6 ; 24,7500 passa a 24,8 ; 24,6500 passa a 24,6 . Exercícios: Arredonde deixando número inteiro: � 2,38 = 24,65 = 0,351 = 4,24 = 328,35 = 2,97 = 6,829 = 5,55 = 89,99 = � Arredonde deixando uma casa decimal: � 2,38 = 24,65 = 0,351 = 4,24 = 328,35 = 2,97 = 6,829 = 5,55 = 89,99 = � Classifique as seguintes variáveis em: i) Qualitativa; ii) Qualitativa discreta; iii) Quantitativa contínua; iv) Quantitativadiscreta; v) Qualitativa contínua.� a) Cor dos olhos � b) Número de filhos de um casal: � c) Peso de um indivíduo: � d) Altura de um indivíduo: � e) Número de alunos de uma escola: � f) Valor obtido na face superior de um dado: � g) Sexo: � h) Comprimento de um seguimento de reta: � i) Área de um Círculo: � j) Quantidade de livros de uma biblioteca: � k) Salário dos Empregados de uma empresa: � l) Estado Civil: � m) Profissão: � n) Volume de água contido numa piscina: � O que é Estatística? Como podemos classificar a estatística? Quais as fases do método estatístico? Qual a diferença entre método científico, experimental e estatístico? AMOSTRAGEM – MÉTODOS PROBABILISTICOS A Amostragem através de métodos probabilísticos exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra. Amostragem Casual Ou Aleatória Simples É o processo mais elementar e frequentemente utilizado. É equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, ou utilizando tabelas de números aleatórios. Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa das estaturas de 90 alunos de uma escola: 1º) Numeramos os alunos de 1 a 90. 2º) Escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. Amostragem Proporcional Estratificada Quando a população se divide em estratos (sub-populações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. SEXO POPULACÃO 10 % AMOSTRA MASC. 54 5,4 5 FEM. 36 3,6 4 TOTAL 90 9,0 9 Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São, portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios, tomando-se 5 meninos e 4 meninas. Amostragem Sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. Exemplos: Os prontuários médicos de um hospital; Os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. Solução: Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse a amostra seria: Exercícios: População ou universo é: a) Um conjunto de pessoas; b) Um conjunto de elementos quaisquer c) Um conjunto de pessoas com uma característica comum; d) Um conjunto de elementos com pelo menos uma característica em comum; e) Um conjunto de indivíduo de um mesmo município, estado ou país. Uma parte da população retirada para analisá-la denomina-se: a) Universo; b) Parte; c) Pedaço; d) Dados Brutos; e) Amostra. Diga qual tipo de variáveis estamos trabalhando nos casos abaixo: Nº de inscrições no Seguro Social Nº de passageiros no ônibus da linha Rio-São Paulo Peso Médio dos Recém Nascidos Altitude acima do nível do mar O tempo gasto para uma pessoa fazer uma viagem de carro de Brasília até Belo Horizonte é de aproximadamente 8:00h a uma velocidade média de 93,75km/h. Suponha que existem N = 1.000 fichas de pacientes das quais uma amostra aleatória de n = 20 deve ser selecionada. Determine quais fichas devem ser escolhidas na amostra de tamanho n = 20. Diga que tipo de amostragem você usou e como foram selecionadas as fichas. O que é população e amostra? Quais e como são os processos de amostragem? Em uma escola existem 250 alunos, sendo 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 27 na 7 ª e 31 na 8ª. Obtenha uma amostra de 40 alunos e preencha o quadro abaixo. SÉRIES POPULAÇÃO CÁLCULO PROPORCIONAL AMOSTRA 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 35 32 30 28 35 32 27 31 35x40/250 = 5,6 5,12 4,8 4,48 5,6 5,12 4,32 4,96 6 5 5 4 6 5 4 5 Total 250 40 Obtenha uma amostra de 10 notas pertencentes a uma sala de aula com 50 notas organizadas em ordem crescente. Depois disso, calcule a média aritmética das notas. 1,7 2,9 3,8 4,6 5,0 6,0 6,3 7,1 7,9 8,7 2,3 3,5 3,9 4,6 5,3 6 6,4 7,6 8,0 8,9 2,2 3,5 4,3 4,8 5,5 6 6,7 7,6 8,0 9,0 2,6 3,7 4,5 5,0 5,7 6 6,9 7,8 8,2 9,0 2,8 3,8 4,6 5,0 5,8 6 7,0 7,9 8,5 9,5 SÉRIES ESTATÍSTICAS TABELAS: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. Normas Para Construção de Tabelas Estatística Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas. Elementos de uma Tabela: Título da Tabela; Corpo da Tabela; Rodapé. EXEMPLO: TABELA 1 – PRODUÇÃO DE CAFÉ BRASIL – 1991 A 1995 Anos Produção (1.000 t) 1991 1992 1993 1994 1995 2.535 2.666 2.122 3.750 2.007 TOTAL 13.080 Fonte: IBGE TÍTULO DA TABELA: Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando? e Onde?, localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração. CORPO DA TABELA: É o conjunto de Linhas e Colunas que contém informações sobre a variável em estudo. Cabeçalho da Coluna – Parte superior da tabela que especifica o conteúdo das colunas; Coluna Indicadora – Parte da tabela que especifica o conteúdo das linhas; Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as linhas; Casa ou Célula – espaço destinado a um só número; Total – deve ser SEMPRE destacado de alguma forma; Laterais da tabela – não devem ser fechadas. Caso as feche, passa a ser chamada de “QUADRO”. Número – preferencialmente utilizar separador de 1000 (por exemplo: 1.854.985 ao invés de 1854985). Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as chamadas, localizadas, de preferência, no rodapé. Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos; Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de uma tabela; Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica. SINAL CONVENCIONAL: A substituição de uma informação da tabela poderá ser feita pelos sinais abaixo: a) - dado numérico igual a zero; b) ... quando não temos os dados; c) ? quando temos dúvida na informação; d) 0 quando o valor for muito pequeno. SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. São aquelas em que a variável descrita apresenta variação discreta. Podem ser do tipo temporal, geográfica ou específica. Série Temporal ou histórica: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) sãoelementos fixos. Esta série também é chamada de histórica ou evolutiva. TABELA 2 – ABC VEÍCULOS LTDA. VENDAS NO 1º BIMESTRE DE 1996 PERÍODO UNIDADES VENDIDAS JAN/96 FEV/96 20.000 10.000 TOTAL 30.000 . Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. TABELA 3 – ABC VEÍCULOS LTDA. VENDAS NO 1º BIMESTRE DE 1996 FILIAIS UNIDADES VENDIDAS São Paulo Rio de Janeiro 13.000 17.000 TOTAL 30.000 Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. TABELA 4 – ABC VEÍCULOS LTDA. VENDAS NO 1º BIMESTRE DE 1996 MARCA UNIDADES VENDIDAS FIAT GM 18.000 12.000 TOTAL 30.000 Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal. TABELA 5 – ABC VEÍCULOS LTDA. VENDAS NO 1º BIMESTRE DE 1996 FILIAIS JANEIRO/96 FEVEREIRO/96 São Paulo Rio de Janeiro 10.000 12.000 3.000 5.000 TOTAL 22.000 8.000 Normas Para Construção de Gráficos Estatístico Os gráficos estatísticos têm como objetivo representar os resultados de forma simples, clara e verdadeira, além de demonstrar a evolução do fenômeno em estudo e observar a relação entre os valores da série. Para a confecção de figuras ou gráficos estatísticos, usaremos as seguintes convenções: Largura do gráfico: depende do número de colunas e do espaço a ser utilizado. Altura: aproximadamente da largura. Escala: aproximadamente o valor dado por . Gráficos em Colunas Conjunto de retângulos dispostos verticalmente separados por um espaço. Exemplo: Represente usando gráfico em colunas os valores descritos na tabela 6. TABELA 6 – NÚMERO DE ÓBITOS, SEGUNDO REGIÕES.BRASIL, 1996 E 1999. Região F Fa Fr Fr , a F% Norte 16117 16117 0,0493 0,04933 4,93 Nordeste 69811 85928 0,2137 0,26299 21,37 Sudeste 170050 255978 0,5205 0,78346 52,05 Sul 48921 304899 0,1497 0,93319 14,97 Centro-Oeste 21830 326729 0,0668 1,00000 6,68 BRASIL 326729 ------- 1,0000 ------ 100,00 Histograma de Frequência: Conjunto de retângulos dispostos verticalmente não separados por espaço. Exemplo: Represente usando o gráfico histograma de frequência para a proporção dos óbitos ocorridos em cada região do Brasil, como descritos na tabela 6. Gráfico em Linha Poligonal: Para a construção desse gráfico, marcam-se os valores e depois os liga formando uma linha poligonal. Exemplo: Represente os valores descritos na tabela 6 usando gráfico em linha poligonal. Ogiva Crescente: Esse gráfico é utilizado para indicar a frequência acumulada dos valores. Exemplo: Represente o número de óbitos acumulados entre as regiões do Brasil, como descrito na tabela 6. Gráfico em Setor Circular (Pizza): É a representação dos dados através de um círculo, por meio de setores. Muito utilizado quando pretendemos comparar cada valor da série com o total. Forma de cálculo: Total 360º Parte xº Exemplo: Represente usando o gráfico em setores para indicar a proporção dos óbitos ocorridos em cada região do Brasil, como descritos na tabela 6. Gráfico com Dupla Entrada: Podemos representar no mesmo gráfico mais de uma entrada de valores, possibilitando assim uma melhor análise entre ambas. Construir gráficos de dupla entrada, usando os dados descritos na tabela 7. TABELA 7 – NÚMERO DE ÓBITOS, SEGUNDO SEXO E REGIÕES. BRASIL, 1996 E 1999. REGIÃO Masculino Feminino F Fa Fr Fr , a F% F Fa Fr Fr , a F% Norte 10857 10857 0,0485 0,0485 4,85 5260 5260 0,0512 0,0512 5,12 Nordeste 46242 57099 0,2065 0,2550 20,65 23569 28829 0,2293 0,2805 22,93 Sudeste 118774 175873 0,5304 0,7853 53,04 51276 80105 0,4989 0,7793 49,89 Sul 33113 208986 0,1479 0,9332 14,79 15808 95913 0,1538 0,9331 15,38 Centro-Oeste 14958 223944 0,0668 1,0000 6,68 6872 102785 0,0669 1,0000 6,69 BRASIL 223944 1,0000 100,00 102785 1,0000 100,00 Gráfico em Colunas Ogiva Crescente Gráfico em Colunas Exercícios: Represente a série abaixo usando o gráfico de colunas (dupla entrada) e também com gráfico em linhas poligonal: COMÉRCIO EXTERIOR – BRASIL – 1984-93 ANOS QUANTIDADE (1.000 t) EXPORTAÇÃO IMPORTAÇÃO 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 141.737 146.351 133.832 142.378 169.666 177.033 168.095 165.974 167.295 182.561 53.988 48.870 60.597 61.975 58.085 57.293 57.184 63.278 68.059 77.813 FONTE: Min. Indústria, Comércio e Turismo Represente a tabela usando o gráfico em colunas: � PRODUÇÃO BRASILEIRA DE PETRÓLEO BRUTO 1991-93 ANOS QUANTIDADE(1.000 m3) 1991 1992 1993 36.180,4 36.410,5 37.164,3 � Represente a tabela usando o gráfico em linha poligonal: ENTREGA DE GASOLINA PARA CONSUMO BRASIL – 1988-91 ANOS VOLUME (1.000 m3) 1988 1989 1990 1991 9.267,7 9.723,1 10.121,3 12.345,4 Represente as tabelas por meio de gráficos em setores: ÁREA TERRESTRE – BRASIL REGIÕES RELATIVA (%) Norte Nordeste Sudeste Sul Centro-Oeste 45,25 18,28 10,85 6,76 18,86 TOTAL 100,0 Represente as tabelas por meio de gráficos em colunas múltiplas e ogiva crescente. MATRICULAS NAS ESCOLAS DE 1º GRAU MUNICÍPIO “X” – 1998-99 ESCOLAS ANOS 1998 1999 A B C D E F 147 201 330 377 420 475 286 305 393 492 604 527 FONTE: “Y” Represente as tabelas por meio de gráficos em colunas múltiplas: PROPORÇÃO DOS DOMICÍLIOS POR CONDIÇÃO DE OCUPAÇÃO – 1990-91 ANOS NATUREZA PRÓPRIOS (%) ALUGADOS (%) CEDIDOS (%) 1990 1991 62,7 70,3 22,9 16,5 14,4 13,2 FONTE: IBGE DISTRIBUIÇÃO DE FREQUÊNCIAS Podemos observar que a estatística tem como objetivo encontrar leis de comportamento para todo o conjunto, por meio da sintetização dos dados numéricos sob a forma de tabelas, gráficos e medidas. A essas tabelas estatísticas chamamos de distribuição de frequências, que é o arranjo dos valores e suas respectivas frequências (nº de vezes de aparecimento). Elementos de uma Distribuição de Frequências DADOS BRUTOS: São aqueles que ainda não foram numericamente organizados. ROL: É um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. DADOS ABSOLUTOS: são resultantes de uma coleta direta, sem outra manipulação senão a contagem. DADOS RELATIVOS: são resultantes de comparações, há um tratamento matemático dos dados para uma melhor interpretação. AMPLITUDE TOTAL (At): É a diferença entre o maior e o menor valor observado. FREQUÊNCIA ABSOLUTA (Fi): É o número de vezes que o elemento aparece na população (amostra), ou o número de elementos pertencentes a uma classe. NÚMERO DE CLASSES (K): Não há fórmula exata para o número de classes, deve-se usar o número de classe mais adequada, que pode ser dado ou pela fórmula de Sturges: AMPLITUDE DA CLASSE (h): Os valores mais adequados para a amplitude de classe são: h=(1, 2, 3, 4, 5, 10 ou múltiplos de 10), ou adequado pela fórmula de Sturges. LIMITE DE CLASSES: São os extremos das classes, quando estas são representadas por variáveis contínuas, representado por: 10 |–| 12: valores entre 10 e 12; 10 –| 12 : valores de 10 a 12, excluindo o 10; 10 |– 12 : valores de 10 a 12, excluindo o 12. Obs.: Neste curso iremos utilizar a última representação. PONTO MÉDIO DA CLASSE (x): É a média aritmética entre o limite superior e o inferior da classe. FREQUÊNCIA SIMPLES ACUMULADA ( Fi ): É a soma das frequências dos valores inferiores ou iguais ao valor dado. FREQUÊNCIA RELATIVA SIMPLES ( fri ): A frequência relativa de um valor é dada por, fr , e será este valor dividido pelo somatório de todos os valores da amostra. FREQUÊNCIA PERCENTUAL ( F % ): É dado pela frequênciarelativa multiplicado por 100. FREQUÊNCIA RELATIVA ACUMULADA ( Fri ): É a soma das frequências relativas dos valores inferiores ou iguais ao valor dado. Exemplo: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados constitui-se nos dados brutos a seguir: 24 23 22 28 35 21 23 23 33 34 24 21 25 36 26 22 30 32 25 26 33 34 21 31 25 31 26 25 35 33 Colocando em ordem crescente (ROL) o arranjo dos dados brutos obtém-se: A Amplitude Total é a diferença entre o maior e o menor valor observado, deste modo, temos: At = A Distribuição de Frequências para esse arranjo de valores, com h = 3 será: VALORES fi x Fi fri Fri F% 21 |– 24 24 |– 27 27 |– 30 30 |– 33 33 |– 36 36 |– 39 8 22,5 8 8/30 = 0,267 8/30 = 0,267 26,7 30 ----- ---- 1,000 ------ 100,0 O histograma e o polígono de frequências são: O polígono de frequência acumulada Um dado foi lançado 50 vezes e foram registrados os seguintes resultados: 5 4 6 1 2 5 3 1 3 3 4 4 1 5 5 6 1 2 5 1 3 4 5 1 1 6 6 2 1 1 4 4 4 3 4 3 2 2 2 3 6 6 3 2 4 2 6 6 2 1 calcule: A amplitude amostral; As frequências absolutas das classes; As frequências relativas; Os pontos médios das classes; As frequências acumuladas; Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivíduos de uma faculdade: 151 152 154 155 158 159 159 160 161 161 161 162 163 163 163 164 165 165 165 166 166 166 166 167 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 171 172 172 172 173 173 173 174 174 174 175 175 175 175 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 180 181 181 181 182 182 182 183 184 185 186 187 188 190 190 calcule: A amplitude amostral; O número de classes; A amplitude de classes; As frequências absolutas das classes; As frequências relativas; Os pontos médios das classes; As frequências acumuladas; O histograma e o polígono de frequência; O polígono de frequência acumulada; Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinado município do Estado: Determinar o número de classes mais adequado, pela regra de Sturges; Construir a tabela de frequências absolutas simples; Determinar as frequências absolutas acumuladas; Determinar as frequências simples relativas. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe. 162 163 148 166 169 154 170 166 164 165 159 175 155 163 171 172 170 157 176 157 157 165 158 158 160 158 163 165 164 178 150 168 166 169 152 170 172 165 162 164 Calcular a amplitude total. Admitindo-se 6 classes, qual a amplitude do intervalo de classe? Construir uma tabela de frequência das alturas dos alunos. Determinar os pontos médios das classes. DADOS: Pesos (Kg) dos 190 funcionários da empresa ‘X’: Li=45 Kg ; h = 5 Kg; Ls = 85 Kg; F: 3; 15; 21; 32; 46; 39; 25; 9 Organizar a série estatística; Completar a série com as colunas dos Pm, Fa, Fr, e F% Identificar: A frequência absoluta da 5ª classe; A classe da maior frequência; A frequência total; O limite superior da 4ª classe. � Qual é o percentual de peso incluídos na classe 55 ⌐ 70; Qual é o percentual de pesos maiores ou iguais a 60 Kg; Qual é o percentual de pesos inferiores a 65 Kg; Qual é o percentual de pesos maiores ou iguais a 77 Kg; Qual é a classe do 18º funcionário? E a do 100º? Representar a série graficamente através de Histograma de Frequências; Representar a série graficamente através de Polígono de Frequências; Representar graficamente as frequências acumuladas da série, através do gráfico Ogiva Crescente. As notas obtidas por 50 alunos de uma classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 Organizar uma distribuição de frequências para variável contínua com h=2; Responda: Qual a amplitude amostral? Qual a amplitude da distribuição? Qual é o nºde classes da distribuição? Qual é o limite inferior da quarta classe? Qual a amplitude do segundo intervalo de classe? MEDIDAS DE POSIÇÃO Até agora os estudos das distribuições de frequências efetuados nos permite localizar a maior e menor concentração dos valores de uma distribuição. No entanto, para destacar as tendências características necessita-se de elementos típicos da distribuição que são as Medidas de Posição e as Medidas de Variabilidade ou Dispersão. As medidas de posição nos orientam quanto a posição da distribuição em relação ao eixo horizontal. As medidas mais importantes são as medidas de tendência central (os dados tendem a se agrupar em torno de valores centrais). Dentre elas destacam-se: A média aritmética A mediana A moda Outras medidas de posição são as separatrizes que são: A mediana Os quartis Os percentis Média Aritmética É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. Onde são os valores da variável e n o número de valores. 1ª SITUAÇÃO: Dados não agrupados Sejam os elementos de uma amostra, portanto “n” valores da variável x. A média aritmética da variável aleatória de x é definida por, ou simplesmente, onde n é o número de elementos do conjunto. Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a média aritmética simples deste conjunto de dados. Interpretação: o tempo médio de serviço deste grupo de funcionários é de 7,8 anos. 2ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores discretos Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética dos valores , ponderados pelas respectivas frequências absolutas: . Assim Exemplo: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis obtendo a seguinte tabela: � � VEÍCULOS NEGOCIADOS NÚMERO DE VENDEDORES 1 2 3 4 1 3 5 1 TOTAL 10 26 Portanto: Interpretação: em média, cada vendedor negociou 2,6 veículos. 3ª SITUAÇÃO: Dados agrupados em uma distribuição de frequências contínua Quando os dados estiverem agrupados numa distribuição de frequência usaremos a média aritmética dos pontos médios de cada classe, ponderados pelas respectivas frequências absolutas: . Desta forma, o cálculo da média passa a ser igual ao da 2ª situação. Assim Exemplo: � A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina: ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 TOTAL 58 --- Portanto, Interpretação: o desempenho médio deste grupo de alunos foi de 62,24 pontos nesta disciplina. Moda Dentre as principais medidas de posição, destaca-se a moda. É o valor mais frequente da distribuição. 1ª SITUAÇÃO: Dados não agrupados Sejam os elementos de uma amostra, o valor da moda para este tipo de conjunto de dados é simplesmente o valor com maior frequência. Exemplos: � Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 8 e 11. Determinar a moda deste conjunto de dados. distribuição unimodal ou modal Interpretação: o tempo de serviço com maior freqüência (moda) é de 8 anos. Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 3, 7, 8, 8 e 11. Determinar a moda deste conjunto de dados. distribuição bimodal Interpretação: os tempos de serviço com maior frequência foram de 3 e 8 anos. Suponha o conjuntode tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a moda deste conjunto de dados. Não existe Mo = > distribuição amodal Interpretação: não existe o tempo de serviço com maior frequência. 2ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores discretos Para este tipo de distribuição, a identificação da moda é facilitada pela simples observação do elemento que apresenta maior frequência. Exemplo: � Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedor de uma agência de automóveis obtendo a seguinte tabela: VEÍCULOS NEGOCIADOS NÚMERO DE VENDEDORES 1 2 3 4 1 3 5 1 TOTAL 10 Portanto, se a maior freqüência é , logo Mo = 3. Interpretação: A quantidade de veículos comercializados no dia com maior frequência foi de 3 veículos. 3ª SITUAÇÃO: Dados agrupados em uma distribuição de frequências contínua Para dados agrupados em classes, temos diversas fórmulas para o cálculo da moda. A fórmula que utilizaremos será a Fórmula de Czuber. Procedimento: a) Identifica-se a classe modal (aquela que possuir maior freqüência) – CLASSE(Mo). b) Utiliza-se a fórmula: em que: limite inferior da classe modal e h = amplitude da classe modal Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina: ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 TOTAL 58 Classe Mo = > 55 |– 65 Interpretação: O escore com maior freqüência entre o grupo de 58 alunos foi de 61 pontos. � Mediana Construído o ROL, o valor da mediana é o elemento que ocupa a posição central, ou seja, é o elemento que divide a distribuição em 50% de cada lado: 1ª SITUAÇÃO: Dados não agrupados Sejam os elementos de uma amostra, portanto “n” valores da variável x. A mediana da variável aleatória de x é definida por, Exemplos: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar a mediana deste conjunto de dados. Como n = 5, então o valor da mediana estará localizado na posição . Portanto, Md = 8 Interpretação: 50% dos funcionários possuem até 8 anos de tempo de serviço, ou, 50% dos funcionários possuem no mínimo 8 anos de tempo de serviço. Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10, 11 e 13. Determinar a mediana deste conjunto de dados. Como n = 6, então o valor da mediana estará localizado na posição e . Portanto, Interpretação: 50% dos funcionários possuem até 9 anos de tempo de serviço, ou, 50% dos funcionários possuem no mínimo 9 anos de tempo de serviço. 2ª SITUAÇÃO: Dados agrupados em uma distribuição de frequências por valores discretos Quando os dados estiverem agrupados numa distribuição de freqüência identificaremos a mediana dos valores pela posição da mediana através da freqüência absoluta acumulada – Fa. Exemplo: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis, obtendo a seguinte tabela: VEÍCULOS NEGOCIADOS NÚMERO DE VENDEDORES 1 2 3 4 1 3 5 1 1 4 9 10 TOTAL 10 --- Portanto: Interpretação: 50% dos vendedores comercializaram no máximo 3 veículos, ou então, metade dos vendedores comercializaram pelo menos 3 veículos. 3ª SITUAÇÃO: Dados agrupados em uma distribuição de frequências contínua Procedimento: Calcula-se a posição da mediana: Pela identifica-se a classe que contém o valor da mediana – CLASSE (Md) Utiliza-se a fórmula: onde: = Limite inferior da classe mediana n = Tamanho da amostra ou número de elementos = Freqüência acumulada anterior à classe mediana h = Amplitude da classe mediana = Freqüência absoluta simples da classe mediana Exemplo: A tabela a seguir representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina: � ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 5 17 35 49 55 58 TOTAL 58 --- Portanto, POS(Md) = 29 CLASSE (Md) = 55 |– 65 Interpretação: 50% dos alunos obtiveram escore máximo de 61,67 pontos, ou então, metade dos alunos obtiveram escore maior que 61,67 pontos. Exercícios Considerando os conjuntos de dados: 3; 5; 2; 6; 7; 10; 12; 9; 5; 7; 2; 5 14,5; 19,5; 13,5; 10,7; 9,8; 7,0 Calcular a média, a moda e a mediana. � Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros. Qual a produção média de leite da vaca na semana? Qual o valor mediano? As notas de um estudante em seis exames foram 8,4; 9,1; 7,2; 6,8; 8,7 e 7,8. Determinar: A mediana das notas. A média das notas. Calcular a média, a moda e a mediana dos valores descritos nas tabelas: X F 3 4 5 6 7 8 3 6 9 8 6 4 Σ 36 � X F 39 41 45 46 50 53 3 9 15 13 8 5 Σ PESOS (Kg) F 40 ⌐ 45 45 ⌐ 50 50 ⌐ 55 55 ⌐ 60 60 ⌐ 65 65 ⌐ 70 70 ⌐ 75 75 ⌐ 80 5 9 13 17 17 13 9 5 Σ � X F 150 155 162 169 174 180 5 3 12 23 18 9 Σ O consumo de energia elétrica e o número de usuários são mostrados na seguinte tabela. Calcular a média, a moda e o valor mediano de consumo. Consumo (Kwh) Número de usuários 5 ⌐ 25 25 ⌐ 45 45 ⌐ 65 65 ⌐ 85 85 ⌐ 105 105 ⌐ 125 125 ⌐ 145 145 ⌐ 165 4 6 14 26 14 8 6 2 Σ 80 � MEDIDAS SEPARATRIZES Quartis Os quartis dividem um conjunto de dados em quatro partes iguais. Assim, Onde: = 1º quartil, deixa 25% dos elementos. = 2º quartil, coincide com a mediana, deixa 50% dos elementos. = 3º quartil, deixa 75% dos elementos. Procedimento: Calcula-se a posição do quartil: Pela Fa identifica-se a classe que contém o valor do quartil – CLASSE(Qi) Utiliza-se a fórmula: onde: = Limite inferior da classe quartílica; n = Tamanho da amostra ou número de elementos; = Freqüência acumulada anterior à classe quartílica; h = Amplitude da classe quartílica; = Freqüência absoluta simples da classe quartílica. Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o primeiro e o terceiro quartil. ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 5 17 35 49 55 58 TOTAL 58 --- Portanto, POS(Q1) = 58/4 = 14,5 CLASSE (Q1) = 45 |– 55 Interpretação: 25% dos alunos obtiveram escore máximo de 52,92 pontos, ou então, 75% dos alunos obtiveram escore maior que 52,92 pontos. POS(Q3) = = 43,5 CLASSE (Q3) = 65 |– 75 Interpretação: 75% dos alunos obtiveram escore máximo de 71,07 pontos, ou então, 25% dos alunos obtiveram escore maior que 71,07 pontos. � Decis São valores que divide a série em dez partes. Procedimento: Calcula-se a posição do Decil: Pela Fa identifica-se a classe que contém o valor do Decil – CLASSE(Di) Utiliza-se a fórmula: onde: = Limite inferior da classe do decil; n = Tamanho da amostra ou número de elementos; = Freqüência acumulada anterior à classe do decil; h = Amplitude da classe do decil; = Freqüência absoluta simples da classe do decil. A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o sexto decil. ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 5 17 35 49 55 58 TOTAL 58 --- Portanto, POS(D6) = = 34,8 CLASSE (D6) = 55 |– 65 Interpretação: 60% dos alunos obtiveram escore máximo de 64,89 pontos, ou então, 40% dos alunos obtiveram escore maior que 64,89 pontos. Percentis São as medidas que dividem a amostra em 100 partes iguais. Procedimento: Calcula-se a posição do Percentil:Pela Fa identifica-se a classe que contém o valor do Percentil – CLASSE(Pi) Utiliza-se a fórmula: onde: = Limite inferior da classe do percentil; n = Tamanho da amostra ou número de elementos; = Freqüência acumulada anterior à classe do percentil; h = Amplitude da classe do percentil; = Freqüência absoluta simples da classe do percentil. A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. Calcule o percentil de ordem 23. ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 5 17 35 49 55 58 TOTAL 58 --- Portanto, POS(P23) = = 13,34 CLASSE(P23) = 45 |– 55 Interpretação: 23% dos alunos obtiveram escore máximo de 51,95 pontos, ou então, 77% dos alunos obtiveram escore maior que 51,95 pontos. � Exercícios: Considere a seguinte tabela: CLASSES 2,75 |– 2,80 2,80 |– 2,85 2,85 |– 2,90 2,90 |– 2,95 2,95 |– 3,00 3,00 |– 3,05 3,05 |– 3,10 3,10 |– 3,15 3,15 |– 3,20 3,20 |– 3,25 2 3 10 11 24 14 9 8 6 3 TOTAL 90 Identificar os seguintes elementos da tabela: Frequência simples absoluta da quinta classe. Frequência total. Limite inferior da sexta classe. Limite superior da quarta classe. Amplitude do intervalo de classe. Amplitude total. Ponto médio da terceira classe. Número total de classe. Frequência absoluta acumulada além da sexta classe. Porcentagem de valores iguais ou maiores que 2,95. Para os valores descritos na tabela anterior calcular: D2, D7 e D9 Q1 e Q3 P17, P33, P62, P79 � Responda as questões abaixo: I) Média, Mediana e Moda são medidas de : a) ( ) Dispersão b) ( ) posição c) ( ) assimetria d) ( ) curtose II) Na série 10, 20, 40, 50, 70, 80 a mediana será: a) ( ) 30 b) ( ) 35 c) ( ) 40 d) ( ) 45 III) 50% dos dados da distribuição situa-se: a) ( ) abaixo da média c) ( ) abaixo da moda b) ( ) acima da mediana d) ( ) acima da média � MEDIDAS DE DISPERSÃO As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. Consideraremos quatro medidas de dispersão: Desvio–médio, Variância, Desvio Padrão e Coeficiente de Variação. Desvio–Médio O desvio-médio analisa a média dos desvios em torno da média. O desvio em torno da média é definido como 1ª SITUAÇÃO: Dados não agrupados Sejam os elementos de uma amostra, portanto “n” valores da variável x, com média igual a . O desvio-médio da variável aleatória de x é, onde n é o número de elementos do conjunto. Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-médio deste conjunto de dados. como então, Interpretação: em média, o tempo de serviço deste grupo de funcionários se desvia em ______ anos em torno dos 7,8 anos de tempo médio de serviço. � 2ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples Quando os dados estiverem agrupados numa distribuição de freqüência usaremos o desvio-médio dos valores , ponderados pelas respectivas freqüências absolutas: , como no cálculo da média aritmética. Assim: Exemplo: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio será: VEÍCULOS NEGOCIADOS NÚMERO DE VENDEDORES 1 2 3 4 1 3 5 1 TOTAL 10 Interpretação: em média, a quantidade de veículos negociado de cada vendedor possuiu uma distância de 0,68 em torno dos 2,6 veículos comercializados em média por vendedor. � 3ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes Quando os dados estiverem agrupados numa distribuição de freqüência usaremos o desvio-médio dos pontos médios , de cada classe, ponderados pelas respectivas freqüências absolutas: . Desta forma, o cálculo do desvio-médio passa a ser igual ao da 2ª situação. Assim: Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. O cálculo do desvio-médio será: ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 TOTAL 58 ------ Interpretação: Em média, a nota de cada aluno deste grupo teve um distanciamento de 10,29 pontos em torno do desempenho médio deste grupo de alunos, que foi de 62,24 pontos nesta disciplina. � Variância e Desvio–Padrão A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da média. A fórmula da variância poderá ser calculada de duas formas: POPULACIONAL, representada letra grega AMOSTRAL, representada por 1ª SITUAÇÃO: Dados não agrupados Sejam os elementos , portanto “n” valores da variável x, com média igual a . A variância da variável aleatória de x é, ou Exemplo: Suponha o conjunto de tempo de serviço de cinco funcionários: 3, 7, 8, 10 e 11. Determinar o desvio-padrão deste conjunto de dados. (fazer a série estatística) Interpretação: encontramos então uma variância para o tempo de serviço de anos2. Para eliminarmos o quadrado da unidade de medida, extraímos a raiz quadrada do resultado da variância, que chegamos a uma terceira medida de dispersão, chamada de DESVIO-PADRÃO: POPULACIONAL, representada letra grega AMOSTRAL, representada por Portanto, o desvio-padrão do exemplo foi de anos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno da média, encontraremos a concentração da maioria (aproximadamente 68,3%) dos dados. 2ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por valores simples Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a variância dos valores , ponderados pelas respectivas freqüências absolutas: . Assim: ou Exemplo: Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agência de automóveis como mostra a tabela abaixo. O cálculo do desvio-médio, variância e desvio padrão para este caso será: VEÍCULOS NEGOCIADOS NÚMERO DE VENDEDORES 1 2 3 4 1 3 5 1 TOTAL 10 Interpretação: Portanto, o desvio-padrão do exemplo foi de veículos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno da média, encontraremos a concentração da maioria dos veículos negociados por vendedor. 3ª SITUAÇÃO: Dados agrupados em uma distribuição de frequência por classes Quando os dados estiverem agrupados numa distribuição de freqüência usaremos a variância dos pontos médios de cada classe, ponderados pelas respectivas freqüências absolutas: . Desta forma, o cálculo da variância passa a ser igual ao da 2ª situação. Assim, ou Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. O cálculo do desvio-médio, variância e desvio padrão para este caso será: ESCORES ALUNOS 35 |– 45 45 |– 55 55 |– 65 65 |– 75 75 |– 85 85 |– 95 5 12 18 14 6 3 TOTAL 58 ------ ------ � Interpretação: Portanto, o desvio-padrão do exemplo foi de pontos. Ou seja, se calcularmos um intervalo utilizando um desvio-padrão em torno do escore médio de 62,24 pontos, encontraremos a concentração da maioria dos alunos dentro deste intervalo de pontuação. Coeficiente de Variação Trata-se de uma média relativa à dispersão, útil para a comparação e observação em termos relativos do grau de concentração em torno da média de séries distintas. É dada por: ou Classificação da distribuição quanto à dispersão: DISPERSÇÃO BAIXA: DISPERSÇÃO MÉDIA: 15% < CV < 30% DISPERSÇÃO ALTA: Exemplo: Numa empresa o salário médiodos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Determinar quanto a homogeneidade da população dos funcionários masculinos e femininos. � Interpretação: Logo, podemos concluir que o salário das mulheres apresenta maior dispersão relativa que a dos homens, desta forma, dizemos que a distribuição de salário das mulheres é menos homogênea que a distribuição de salários dos homens. Exercícios Calcular a amplitude total, o desvio médio, a variância e o desvio padrão dos valores abaixo: 3; 7; 4; 5; 4; 8; 3 20; 31; 15; 40; 50 1; 3; 4; 8 12; 10; 20; 13; 15 � 9; 9; 9; 9 3; 7; 9; 5 2,4; 1,6; 3,8; 4,1; 3,4 � Calcular a variância e o desvio padrão dos dados tabulados: � Valores (x) 5 6 8 10 11 � Idades (x) F 16 17 19 20 21 3 7 15 8 2 35 � Pesos (Kg) F 40 ⌐ 45 45 ⌐ 50 50 ⌐ 55 55 ⌐ 60 60 ⌐ 65 65 ⌐ 70 2 5 10 17 6 3 43 Comparar quanto a homogeneidade as amostras A, B e C � Amostra A Pesos (Kg) F 40 42 45 47 48 2 7 10 8 3 30 � Amostra B Estaturas (cm) F 145 148 152 163 165 169 1 4 7 10 6 2 30 � Amostra C QUANTIDADES 100 |– 150 150 |– 200 200 |– 250 250 |– 300 300 |– 350 350 |– 400 15 17 18 20 16 12 TOTAL � Com base nas distribuições i, ii e iii, comparar quanto a homogeneidade as seguintes distribuições: Pesos (kg): 50 kg ; 100 kg2; Salários (u.m.): 520 u.m. ; 50 u.m.; Estaturas (cm): 161,6 cm; 151,29 cm2; � As idades dos alunos do 1º ano do curso de Engenharia Ambiental são: (3,0) 17 20 19 21 20 20 21 18 20 19 19 22 23 18 23 25 21 24 19 18 25 17 18 22 24 19 20 22 19 23 � Organizar a distribuição de frequências Calcular o desvio médio; Calcular a idade modal e mediana; Calcular o desvio padrão.(1,0) � Calcular a moda, a mediana, o 3º decil, o 82º centil, o desvio padrão e o coeficiente de variação dos valores descritos na AMOSTRA abaixo: CUSTOS (R$) F 450 ⌐ 550 550 ⌐ 650 650 ⌐ 750 750 ⌐ 850 850 ⌐ 950 950 ⌐ 1050 1050 ⌐ 1150 11 14 17 20 13 10 8 Σ � Complete a tabela a seguir: CLASSE F Pm = x Fa Fr 62 |--- 65 12 36 66,5 84 126 225 300 0,02 0,06 0,15 TOTAL Calcular as estaturas média, modal e mediana de bebês conforme a tabela abaixo. Depois disso, calcular também o desvio médio, o 75º centil, a variância, o desvio padrão e seu coeficiente de variação. ESTATURAS (cm) F 50 |--- 54 54 |--- 58 58 |--- 62 62 |--- 66 66 |--- 70 70 |--- 74 4 9 11 8 5 3 TOTAL 40 � Numa empresa o salário médio dos funcionários do sexo masculino é de R$ 4.000,00, com um desvio padrão de R$ 1.500,00, e os funcionários do sexo feminino é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Indique qual classe de salários e mais homogênea. Uma nova ração foi fornecida a suínos recém desmamados e deseja-se avaliar sua eficiência. A ração tradicional dava um ganho de peso ao redor de 3,5 kg em um mês. A seguir, apresentamos os dados referentes ao ganho, em quilos, para essa nova ração, aplicada durante um mês em 200 animais nas condições acima. Construa o histograma Determine o 1º , 2º e 3º quartis. Você acha que a nova ração é mais eficiente que a tradicional? Justifique. Determinar seu coeficiente de variação. Ganho de Peso (Kg) F 1,0 |---- 2,0 2,0 |---- 3,0 3,0 |---- 4,0 4,0 |---- 5,0 5,0 |---- 6,0 6,0 |---- 7,0 45 83 52 15 4 1 TOTAL 200 � Como parte de uma avaliação médica em uma empresa, foi medida a frequência cardíaca dos funcionários de um determinado setor. Frequência Cardíaca (bpm) F 60 |---- 65 65 |---- 70 70 |---- 75 75 |---- 80 80 |---- 85 85 |---- 90 90 |---- 95 95 |---- 100 11 35 68 20 12 10 1 3 TOTAL Obtenha o histograma de frequências; Frequências cardíacas que estejam abaixo de 62 ou acima de 92 requerem acompanhamento médico. Qual é a porcentagem de funcionários nestas condições? Uma frequência ao redor de 72 batidas por minuto é considerada padrão. Você acha que de modo geral esses funcionários se encaixam nesse caso? � Calcule a moda, a média, a mediana, o desvio padrão e o coeficiente de variação para a seguinte distribuição. Salário (R$) F 450 |--- 550 550 |--- 650 650 |--- 750 750 |--- 850 850 |--- 950 950 |--- 1050 1050 |--- 1150 8 10 11 16 13 5 1 TOTAL 64 � PROBABILIDADE Introdução O cálculo das probabilidades pertence ao campo da Matemática Aplicada, entretanto a maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou probabilística. O conhecimento dos aspectos fundamentais do cálculo das probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial. Experimento Aleatório São fenômenos que, mesmo repetido várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. Exemplo: Da afirmação "é provável que o meu time ganhe a partida hoje" pode resultar: - vitória - derrota - empate Portanto, o resultado final pode ter três possibilidades. No lançamento de uma moeda, pode aparecer face cara (C) ou face coroa (R) voltada para cima. Espaço Amostral É o conjunto universo ou o conjunto de resultados possíveis de um experimento aleatório. No experimento aleatório "lançamento de uma moeda" temos o Espaço Amostral S{cara, coroa}. No experimento aleatório "lançamento de um dado" temos o Espaço Amostral S{1, 2, 3, 4, 5, 6}. No experimento aleatório "dois lançamentos sucessivos de uma moeda" temos o Espaço Amostral: S{(C,C) , (C,R) , (R,C) , (R,R)} Obs: cada elemento do Espaço Amostral que corresponde a um resultado recebe o nome de ponto amostral. No primeiro exemplo: cara (C) pertence ao Espaço Amostral {cara, coroa}. Eventos de um Espaço Amostral É qualquer subconjunto do Espaço Amostral de um experimento aleatório. Se considerarmos S como Espaço Amostral e E como evento: Assim, qualquer que seja E, se E S (E está contido em S), então E é um evento de S. Se E = S , E é chamado de evento certo. Se E S e E é um conjunto unitário, E é chamado de evento elementar. Se E = Ø , E é chamado de evento impossível. Se E1 E2 = S e E1 E2 = E1 e E2 são eventos complementares. Exercícios: No lançamento de um dado temos S = {1,2,3,4,5,6}. Formule os eventos definidos pelas sentenças: Obter um número par na face superior do dado: Obter um número menor ou igual a 6 na face superior: Obter o número 4 na face superior: Obter um número maior que 6 na face superior: No lançamento de duas moedas (uma de 10 centavos e outra de 5 centavos) Qual é o Espaço Amostral? Formule os eventos definidos pelas sentenças: Obter uma cara: Obter pelo menos uma cara: Obter apenas um cara: Obter no máximo duas caras: Obter uma cara e uma coroa: Obter uma cara ou uma coroa: � Conceito de Probabilidade Chamamos de probabilidade de um evento (sendo que A está contido no Espaço Amostral S ) o número real P(A), tal que é o quociente entre o número de casos favoráveis de n(A) sobre o número total de casos n(S). OBS: Quando todos os elementos do Espaço Amostral tem a mesma chance de acontecer, o Espaço Amostral é chamado de conjunto equiprovável. Exemplos: No lançamento de uma moeda qual a probabilidade de obter cara em um evento A? No lançamento de um dado qual a probabilidade de obter um número par em um evento A? No lançamento de um dado qual a probabilidade de obter um número menor ou igual a 6 em um evento A? No lançamento de um dado qual a probabilidade de obter um número maior que 6 em um evento A ? � Eventos Complementares Dois eventos e de um Espaço Amostral , são eventoscomplementares se: e Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: Exemplos: Sabemos que a probabilidade de tirar o nº 4 no lançamento de um dado é p=______. logo, a probabilidade de não tirar o nº 4 no lançamento de um dado é ou q =___________. Calcular a probabilidade de um piloto de automóveis vencer uma dada corrida, onde as suas "chances", segundo os entendidos, são de "3 para 2". Calcule também a probabilidade dele perder. OBS: O termo "3 para 2" significa : De cada 5 corridas ele ganha 3 e perde 2. Seja S = {a,b,c,d} . Consideremos a seguinte distribuição de probabilidades: P(a) = 1/8 ; P(b) = 1/8 ; P(c) = 1/4 e P(d) = x . Calcule o valor de x : Três cavalos C1, C2 e C3 disputam um páreo, onde só se premiará o vencedor. Um conhecedor dos 3 cavalos afirma que as "chances" de C1 vencer são o dobro das de C2,e que C2 tem o triplo das "chances" de C3. Calcule as probabilidades de cada cavalo vencer o páreo: Um experimento aleatório consiste no lançamento de um dado. Determinar a probabilidade de ocorrer: Um número par; Um número maior que 1; Um número múltiplo de 3; Um número divisível pela unidade; Um número divisível por 7. � Um experimento aleatório consiste no lançamento simultâneo de duas moedas. Determinar a probabilidade de ocorrer: Faces iguais; Nenhuma face cara; Três faces cara. Um experimento aleatório consiste no lançamento simultâneo de três moedas. Determinar a probabilidade de ocorrer: Três faces cara; Duas faces cara; Pelo menos uma faces cara; No máximo uma face cara. � Um experimento aleatório consiste no lançamento simultâneo de dois dados. Determinar a probabilidade de ocorrer: 1 2 3 4 5 6 1 2 3 4 5 6 Espaço Amostral: Números iguais; Números iguais com soma 9; Números cujas somas seja 12; Números cujas somas não seja 12; Números múltiplos de 3 em ambos os dados; A soma ser par; A soma ser múltiplo de 3; A soma ser número primo; O produto ser menor que 10; O produto ser um número maior que 5 e menor que 10; O produto ser no máximo 20; O produto ser múltiplo de 4; O produto ser no mínimo 15; O primeiro ser par e o segundo ser maio que 4; Os dois dados mostrem apenas 3 ou 4 ou ambos; Não apareçam 3 nem 4; Apenas o 1º dado mostra menos que 3 pontos. � Eventos Exclusivos Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: Observe que neste caso, , pois os eventos são exclusivos. Exemplo: No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ? Adição de Probabilidades � Obs: Na probabilidade da união de dois eventos A e B, quando há elementos comuns, devemos excluir as probabilidades dos elementos comuns a A e B (elementos de A B ) para não serem computadas duas vezes. Assim subtraímos sua interseção. Exemplo: Um número é escolhido ao acaso entre os 20 primeiros inteiros positivos. Determinar a probabilidade de que o nº escolhido seja divisível: Por 4; Por 6; Por 4 e por 6; Por 4 ou por 6; Por 5 e por 7; Por 5 ou por 7. Retirando-se uma carta de um baralho de 52 cartas, qual a probabilidade da carta retirada ser ou um ÁS ou uma carta de COPAS ? � Eventos Independentes Dois ou mais eventos são independentes quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Quando temos n eventos independentes, por exemplo, a probabilidade da ocorrência simultânea de ambos é igual ao produto das probabilidades individuais. Desta forma, Exemplo: Quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Então qual seria a probabilidade de obtermos, simultaneamente, o nº 4 no primeiro dado e o nº 3 no segundo dado? � Probabilidade Condicional Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido é definida por: , ou seja, é chamada probabilidade condicional de B. Neste caso, os eventos são dependentes e definidos pela fórmula: ou Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS ? Obs: No exemplo anterior se a 1ª carta retirada voltasse ao baralho o experimento seria do tipo com reposição e seria um evento independente. O resultado seria: � Exercícios: Qual a probabilidade de sair o ás de ouro quando retiramos uma carta de um baralho de 52 cartas? Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? Qual a probabilidade de sair o um REI ou um ÁS quando retiramos 1 carta de um baralho de 52 cartas ? Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas e 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? � Dois dados são lançados simultaneamente. Determine a probabilidade de a soma ser 10 ou maior que 10. Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: Ela não tenha defeitos graves; Ela não tenha defeitos; Ela seja boa ou tenha defeitos graves. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma DAMA e um REI, não necessariamente nessa ordem? � Duas cartas são retiradas de um baralho sem haver reposição. Qual a probabilidade de ambas serem COPAS ou ESPADAS ? Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta? Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas. Qual a probabilidade de que a 1ª seja branca e a 2ª seja preta? Duas bolas são retiradas (sem reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes. Qual a probabilidade de que ambas sejam verdes? Qual a probabilidade de que ambas sejam da mesma cor? � Duas bolas são retiradas (com reposição) de uma urna que contém 2 bolas brancas e 3 bolas pretas e 5 bolas verdes. Qual a probabilidade de que ambas sejam verdes? Qual a probabilidade de que ambas sejam da mesma cor? No lançamento simultâneo de dois dados, qual é a probabilidade de: A soma ser par e o produto ser 12; A soma ser par ou o produto ser 12. � Em uma urna contém 5 bolas, numeradas de 1 a 5, respectivamente. Determinar a probabilidade de: Em três retiradas sucessivas e sem reposição, retirar as bolas 1, 2 e 3, respectivamente, nesta ordem. Em três retiradas sucessivas e com reposição, retirar as bolas 1, 2 e 3, respectivamente, nesta ordem. Em três retiradas sucessivas e sem reposição, retirar as bolas 1, 2 e 3, em qualquer ordem de aparecimento. Em três retiradas sucessivas e com reposição, retirar as bolas 1, 2 e 3, em qualquer ordem de aparecimento. Uma carta é retirada ao acaso de um baralho de 52 cartas. Qual a probabilidade de que a carta retirada seja uma dama ou uma carta de copas? � Probabilidades Binomiais Seja um evento do Espaço Amostral e o seu complementar. Assim, a probabilidade de e ocorrer pode ser definida por: O Espaço Amostral para um evento serepetindo vezes pode ser expresso pelos termos do binômio , onde para cada termo deste binômio, o valor do expoente de representa o número de vezes que o evento se repete, ou seja, o número de vezes que ocorre sucesso. A probabilidade de ocorrer um evento exatamente vezes em provas é que corresponde ao termo geral do binômio dado por: onde Exemplos de Probabilidades binomiais: No lançamento simultâneo de 3 moedas, determinar a probabilidade de ocorrer: Faces iguais; Nenhuma face cara; Pelo menos duas faces cara. � Resolver o exercício anterior utilizando probabilidades binomiais. Para uma moeda, temos: Ocorrer face Cara (Sucesso) p = Não ocorrer face Cara (Insucesso) q = Assim, para uma moeda, temos Para três moedas, temos: � No lançamento simultâneo de 5 moedas, determinar a probabilidade de ocorrer: Faces iguais ; 3 faces Cara; No máximo 3 faces Cara 2 faces Coroa; Pelo menos 2 faces Coroa. � Num determinado colégio 60% dos estudantes fumam cigarros. Escolhe-se 8 estudantes ao acaso para darem sua opinião sobre o fumo. Determinar a probabilidade de: Nenhum ser fumante; Todos serem fumantes; No máximo 2 serem fumantes; Pelo menos a metade ser fumante. � Jogando-se 5 dados, determinar a probabilidade de ocorrer: Um múltiplo de 3, quatro vezes; Um múltiplo de 3, pelo menos quatro vezes; Um não múltiplo de 3, duas vezes; Um múltiplo de 3, todas as vezes. No lançamento simultâneo de 12 moedas, determinar a probabilidade de ocorrer 8 faces cara. � Dois times de futebol, A e B, de mesmo nível, jogam entre si 6 vezes. Encontre a probabilidade de o time A vencer 4 jogos. Um atirador normalmente acerta no máximo 25% dos disparos que efetua. Se der 8 tiros qual a probabilidade dele acertar: Exatamente 3 tiros; No máximo 2 tiros; No mínimo 6 tiros. � Em certo país a proporção é de 600 mulheres em cada 1000 habitantes. Qual é a probabilidade de entre 10 irmãos haver 6 do sexo masculino. Sabe-se que dos 30 alunos de uma classe 25 não estão satisfeitos com o livro texto adotado. Se for tomada uma amostra de 7 alunos, qual a probabilidade de que estejam insatisfeitos: 5 alunos; No mínimo 3 alunos; No máximo 4 alunos; Entre 3 e 7 alunos (3 e 7 inclusos). � Uma moeda é lançada 11 vezes seguidas. Determinar a probabilidade de aparecerem 7 faces cara Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 4 peças, calcule: A probabilidade de ambas serem defeituosas; A probabilidade de ambas não serem defeituosas; A probabilidade de ao menos três ser defeituosa. Lança-se simultaneamente 10 dados. Determinar a probabilidade de: Em 7 deles aparecerem um ponto maior que 4. Em 4 deles aparecer um ponto maior que 4. � Teorema da Probabilidade Total Seja um conjunto de eventos mutuamente exclusivos cuja união forma o Espaço Amostral ou seja . Seja B outro evento qualquer no mesmo Espaço Amostral, tal que P(B) > 0. Então: Usando o Teorema do Produto: Onde, é a probabilidade de B ocorrer, depois de A ter acontecido. Assim, temos: Que é o Teorema da Probabilidade Total. Exemplo: Segundo especialistas esportivos, a probabilidade de que um time vença o próximo jogo é estimada em 0,70 se não chover, e só de 0,50 se chover. Se os registros meteorológicos anunciam uma probabilidade de 0,40 de chover na data do jogo, qual será então a probabilidade desse time ganhar o próximo jogo? � Você entra num torneio de xadrez no qual sua probabilidade de vencer é de 0,3 contra metade dos jogadores – tipo 1 0,4 contra um quarto dos jogadores – tipo 2 0,5 contra um quarto dos jogadores – tipo 3 Você joga com um jogador escolhido ao acaso. Qual é sua probabilidade de vencer? R: 0,38 = 38% Segundo especialistas esportivos, a probabilidade do Corinthians vencer o próximo jogo é estimada em 0,90 se não chover, e de 0,70 se chover. Se os registros meteorológicos anunciam uma probabilidade de 0,60 de chover na data do jogo, qual será então a probabilidade do timão ganhar o próximo jogo? � Teorema de Bayes A partir do Teorema do Produto, temos: Assim substituindo e , vem Exemplos: Certo professor da UNICENTRO 4/5 das vezes vai trabalhar usando um fusca e usando um carro importado nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casa antes das 23 horas e quando usa o carro importado só chega em casa antes das 23 horas em 60% das vezes. Ontem o professor chegou em casa após às 23 horas. Qual a probabilidade de que ele, no dia de ontem, tenha usado o fusca? � Uma empresa produz circuitos em três fábricas, denotadas por I, II e III. A fábrica I produz 40% dos circuitos, enquanto a II e III produzem 30% cada uma. As probabilidades de que um circuito produzido por essas fábricas não funcione são 0,01; 0,04 e 0,03 respectivamente. Escolhido ao acaso um circuito da produção conjunta das três fábricas, qual a probabilidade do circuito não funcionar? Suponha que o circuito escolhido ao acaso seja defeituoso. Determine qual a probabilidade do circuito ter sido fabricado por I. � Certo aluno da UNICENTRO 3/4 das vezes vai estudar usando ônibus e vai de carona nas demais vezes. Quando ele usa o ônibus, 35 % das vezes ele chega em casa depois das 23 horas e quando vai de carona só chega em casa antes das 23 horas em 0,55 das vezes. Ontem o aluno chegou em casa antes das 23 horas. Qual a probabilidade em percentual de que ele, no dia de ontem, tenha usado o ônibus? R: 78 % Uma determinada peça é manufaturada por 3 fábricas: A, B e C. Sabe-se que A produz o dobro de peças que B e que B e C produzem o mesmo número de peças. Sabe-se ainda que 2% das peças produzidas por A e por B são defeituosas, enquanto que 4% das produzidas por C são defeituosas. Todas as peças produzidas são misturadas e colocadas em um depósito. Se do depósito for retirada uma peça ao acaso, qual a probabilidade de que ela seja defeituosa? � Suponha-se que no exercício anterior, uma peça é retirada do depósito e se verifica que é defeituosa. Qual a probabilidade de que tenha sido produzida pela fábrica A? ou B? ou ainda C? Três máquinas, A, B e C produzem 50%, 30% e 20%, respectivamente do total de peças de uma fábrica. As percentagens de produção defeituosa destas máquinas são 3%, 4% e 5%. Se uma peça é selecionada aleatoriamente, ache a probabilidade de ela ser defeituosa. Suponha agora que uma peça selecionada aleatoriamente seja defeituosa. Encontre a probabilidade de ela ter sido produzida pela máquina A, por B e também por C. � Sr Ray Moon Dee, ao dirigir-se ao trabalho, usa um ônibus ou o metrô com probabilidade de 0,2 e 0,8, nessa ordem. Quando toma o ônibus, chega atrasado 30% das vezes. Quando toma o metrô, atrasa-se 20% dos dias. Qual a probabilidade de o Sr Ray Moon Dee Chegar atrasado ao trabalho? E se o Sr Ray Moon Dee Chegar atrasado ao trabalho em determinado dia, qual a probabilidade dele haver tomado um ônibus? Em certo colégio, 5% dos homens e 2% das mulheres têm mais que 1,80m de altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mulher? � Exercícios Auxiliares (UnB-DF) Se a família Silva tiver 5 filhos e a família Oliveira tiver 4, qual a probabilidade de que todos os filhos dos Silva sejam meninas e todos os dos Oliveira sejam meninos? a) 1/325 b) 1/512 c) 1/682 d) 1/921 e) 1/1754 Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá no máximo 2 defeituosas. Se a caixa contém 18 peças e a experiência tem demonstrado que esse processo de fabricação produz 5% de defeituosas, qual a probabilidade de que uma caixa satisfaça a garantia? Se a probabilidade de um indivíduo acusar reação negativa à injeção de determinado soro é 0,001, determine a probabilidade de que, em 2000 indivíduos: Exatamente 3 acusem reaçãonegativa; Mais de 2 indivíduos acusem reação negativa. � A experiência mostra que, de cada 400 lâmpadas, 2 se queimam ao serem ligadas. Qual a probabilidade de que, numa instalação de: 600 lâmpadas, no mínimo 3 se queimem? 900 lâmpadas, exatamente 8 se queimem? Supondo lançamentos INDEPENDENTES de um dado honesto. Qual a probabilidade de que no vigésimo quinto lançamento ocorra a face 4 pela quinta vez? Um atirador normalmente acerta 90% dos disparos que efetua. Se der 9 tiros qual a probabilidade de: Acertar 6 tiros; Acertar no mínimo 7 tiros; Errar 3 tiros; Errar no máximo 2 tiros. � Dos estudantes de um colégio, 41% fumam cigarro. Escolhem-se seis ao acaso para darem sua opinião sobre o fumo. Determine a probabilidade de nenhum dos seis ser fumante. P(x) = 4,22% Determine a probabilidade de todos os seis fumarem. P(x) = 0,48% Um fabricante de lajotas suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita é correta, determine a probabilidade de que, numa amostra de nove lajotas: Haja ao menos uma defeituosa. P(x) = 16,63% Não haja nenhuma defeituosa. P(x) = 83,37% � Sabe-se que, dos 30 alunos de uma classe, 25 não estão satisfeitos com o livro texto adotado. Se for tomada uma amostra de 5 alunos, qual a probabilidade de que estejam insatisfeitos: 4 alunos; P(x) =40,34%. no mínimo 2; P(x) = 99,64% no máximo 3 alunos; P(x) = 20,26% entre 2 e 5 alunos. P(x) = 56,86% Em uma urna contém 30% de bolas brancas. Determinar a probabilidade de na retirada sucessiva de 13 bolas, 7 serem brancas. � DISTRIBUIÇÃO DE PROBABILIDADES Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os resultados de um espaço amostral. Mostra a proporção das vezes em que a variável aleatória tende a assumir cada um dos diversos valores. Variável Aleatória: Resultado possível de um experimento aleatório. Principais tipos de distribuições: Distribuições Discretas ou Descontínuas – dados podem ser contados. Binomial Poisson Multinomial Geométrica Hipergeométrica Distribuições Contínuas – dados que não podem ser contados ou valores muito grandes. Uniformes Normais Exponencial Distribuições Discreta de Probabilidades A cada valor de uma variável aleatória discreta pode ser atribuída uma probabilidade. Ao enumerar cada valor da variável aleatória com a sua probabilidade correspondente, forma-se uma distribuição de probabilidade. Dessa forma, uma distribuição de probabilidade discreta é o conjunto de todos os valores que podem ser assumidos pela variável aleatória discreta, com as respectivas probabilidades. Exemplo: DISTRIBUIÇÃO DOS RESULTADOS DE UM JOGO DE DADO x F Fr = F/n F% = Fr . 100 P(x) = Fr = F/n 1 2 3 4 5 6 1 1 1 1 1 1 1/6 = 0,1667 1/6 = 0,1667 1/6 = 0,1667 1/6 = 0,1667 1/6 = 0,1667 1/6 = 0,1667 16,67 16,67 16,67 16,67 16,67 16,67 0,1667 0,1667 0,1667 0,1667 0,1667 0,1667 TOTAL 6 1 100 1 � Média, Variância e Desvio Padrão A Média ou Esperança Matemática de uma distribuição discreta de probabilidades é dada por: A Variância de uma distribuição discreta de probabilidades é dada por: O Desvio Padrão da distribuição de probabilidades é dado por: A média e a variância de uma distribuição de probabilidades são chamadas de Parâmetros da Distribuição e indica-se por Calcular os parâmetros da distribuição, considerando uma distribuição de freqüência e uma distribuição de probabilidades. DISTRIBUIÇÃO DOS RESULTADOS DE UM JOGO DE DADO x F x . F 1 1 2 1 3 1 4 1 5 1 6 1 TOTAL 6 � Organizar a distribuição de probabilidades e calcular os parâmetros da distribuição para os dados abaixo. IDADE DOS ALUNOS DA TURMA ‘X’ 17 20 19 21 20 20 19 21 18 20 19 22 23 18 21 19 21 21 18 20 19 21 17 23 20 22 17 22 18 20 Idade (x) F 17 18 19 20 21 22 23 TOTAL � Um experimento aleatório consiste no lançamento simultâneo de 2 dados. Organizar a distribuição de freqüências e calcular os parâmetros da distribuição, considerando: : a diferença em módulo entre os pontos; x F 0 1 2 3 4 5 TOTAL : a soma dos pontos. X F 2 3 4 5 6 7 8 9 10 11 12 TOTAL � Um jogador A aposta R$ 100,00 com B e lança dois dados. Se sair soma 8, recebe R$ 100,00; Se sair soma 9, recebe R$ 125,00 Se sair soma 10, recebe R$ 150,00; Se sair soma 11 ou 12, recebe R$ 200,00 Nos demais casos, A perde a aposta. Qual a esperança de lucro do jogador A? E o desvio padrão? x ( ) TOTAL � Um vendedor espera vender um automóvel em 5 dias. A expectativa de que venda no primeiro dia é 50%. No segundo dia é 30%, no terceiro dia 10% e no quarto e quinto dia 5% em ambos. Seu lucro é de R$ 3.000,00 se vender no primeiro dia e diminui 40% a cada dia de demora para vender o carro. Calcular o valor esperado de lucro pelo vendedor nesta venda e seu desvio padrão. x ( ) TOTAL Um produto deve ser lançado no mercado no próximo ano. A expectativa do departamento de venda de que o produto seja bem sucedido é de 80%. Nesse caso, o lucro esperado é de R$ 1.000,00. Se isso não acontecer, o prejuízo deve chegar a R$ 500,00. Calcule o lucro médio, a variância e o desvio padrão. x ( ) TOTAL � O tempo em minutos necessário para um operário processar uma certa peça é 2, 3, 4, 5, 6 ou 7, com probabilidade e 10%, 10%, 30%, 20%, 20% e 10% respectivamente.calcular o tempo médio de processamento. x ( ) TOTAL No exercício anterior, para cada peça processada o operário ganha um fixo de R$ 2,00, mas se ele processa a peça em menos de 6 minutos ganha R$ 0,50 por minuto poupado. Calcular a quantia média ganha por peça. x ( ) TOTAL � Uma máquina fabrica placas de papelão que podem apresentar nenhum, 1, 2, 3 ou 4 defeitos com a probabilidade de 90%, 5%, 3%, 1% e 1%, respectivamente.o preço de venda de uma peça perfeita é de R$ 10,00 e a medida que apresenta defeitos o preço cai 50% para cada defeito apresentado. Determinar o preço médio de vendas dessas placas, o desvio padrão e o coeficiente de variação. Defeitos x ( ) 0 1 2 3 4 TOTAL Um jogador A aposta R$ 40,00 com B e lança quatro moedas. Se sair faces iguais, recebe R$ 40,00; Se sair uma face cara, recebe R$ 80,00; Se sair duas faces caras, recebe R$ 100,00 Nos demais casos A perde a aposta. Qual a esperança de lucro do jogador A? e o desvio padrão? x ( ) TOTAL � Distribuição Binomial Vamos imaginar fenômenos cujos resultados só podem ser de dois tipos, um dos quais é considerado como sucesso e o outro insucesso. Este fenômeno pode ser repetido tantas vezes quanto se queira (n vezes), nas mesmas condições. As
Compartilhar