Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
FUNDAÇÃO DE ESTUDOS SOCIAIS DO PARANÁ ESTATÍSTICA APLICADA ALUNO: ( 100 ) ( Marco Antônio Santoro Bara ) Nota sobre o autor Marco Antônio Santoro Bara é Bacharel em Administração de Empresas pela FESP (Fundação de Estudos Sociais do PR), é Licenciado em Matemática pela UFPR (Universidade Federal do PR) é pós-graduado em Matemática Superior pela FUSVE-RJ, é pós-graduado em EaD pela FESP, é mestre em Administração na área de Finanças pela UFRGS e doctor of Philosophy in Business Administration pela Flórida Christian University. Certificou-se junto a Case Western Reserve University em parceria com a UNINDUS (Universidade da Indústria da FIEP) no curso de Investigação Apreciativa (I.A.), metodologia utilizada no Fórum Paraná Futuro 10. É professor universitário das disciplinas: Matemática Financeira, Cálculo Diferencial e Integral, Lógica Matemática e Estatística na FESP (Fundação de Estudos Sociais do PR); lecionou ainda: Geometria Analítica, Matemática Financeira na Escola Técnica da UFPR (Universidade Federal do PR) nos cursos presenciais e lecionou ainda em parceria com o ITDE a disciplina de estatística no módulo à distância; lecionou por mais de 10 anos: Matemática Financeira, Pesquisa Operacional no UNICENP (Centro Universitário Positivo). Além da experiência em sala de aula como professor, atuou também na indústria, durante 5 anos na Nestlé Industrial e Comercial na área Administrativa – Financeira e atualmente é sócio proprietário da Mbara Empreendimentos Imobiliários LTDA, sócio proprietário da ENZE Curitiba – Distribuidora de Cosméticos e ainda é funcionário do Banco do Brasil. Dedico este material didático aos meus filhos Ana Paula e Rodrigo Augusto. ESTATÍSTICA 1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA Etimologicamente a palavra estatística vem de “status” expressão latina que significa: ”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemães seguidos pela Itália, França, Inglaterra e ainda por outros países. Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de causas”. Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta, organização, redução e apresentação de dados, análise dos mesmos e a obtenção de conclusões válidas e tomadas de decisões a partir de tais análises. Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados. No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de decisão. 1.1 POR QUE ESTUDAR ESTATÍSTICA? O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é possível que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatística. Essa é uma razão, esperamos que ao final deste trabalho o leitor encontre suas próprias razões. 1.2 A NATUREZA DOS DADOS Os dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem quando se fazem mensurações ou se restringem observações. Estatística descritiva: Trata-se da descrição e resumo dos dados. Probabilidade: É um estudo que envolve o acaso. Inferência: É a análise e interpretação de dados amostrais (Amostragem). Modelos: São versões simplificadas (abstrações) de algum problema ou situação real. 1.3 TIPOS DE DADOS Quantitativos Contínuos Discretos Qualitativos Nominais Por postos As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura onde se usa a mensuração. As variáveis discretas assumem valores inteiros de dados discretos são os resultados da contagem de números de itens. Ex.: alunos da sala de aula, número de defeitos num carro novo, acidentes de uma fábrica. Os dados nominais surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. Atuam dentro das variáveis “Qualitativas”, às quais devemos associar a valores numéricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrível, mau), etc. Os dados por postos consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª, 3ª colocadas. TABELA 1: A mesma população pode originar diferentes tipos de dados. TIPOS DE DADOS POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO Alunos de administração idade/peso N. de classes Homens/Mulheres 3º grau 1.4 TIPOS DE LEVANTAMENTOS Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais: CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos os registros civis dos fatos vitais (nascimento, óbitos e casamentos). PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenseamento, feito no Brasil a cada dez anos. A realização de um Censo Demográfico representa o desafio mais importante para um instituto de estatística, sobretudo em um país de dimensões continentais como o Brasil, com 8 514 215,3 km2, composto por 27 Estados e 5 507 municípios existentes na data de referência da pesquisa, abrangendo um total de 54 265 618 de domicílios pesquisados (dados do IBGE sobre o Censo de 2000). OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigação cientifica. Os dados ainda podem ser classificados em: primários e secundários. DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados ao seu estudo, parte para a realização de um inquérito, isto é, os dados são levantados diretamente na população no momento da investigação. DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de trabalho utiliza-se de dados já existentes, arquivados, registrados ou publicados. Podem ser, até mesmo, dados gerados pelo Departamento de Estatística de Populações da Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). 1.5 PLANEJAMENTO DE EXPERIMENTOS 1- Definição do problema: Um Estudo ou Uma Análise 2- Formular plano adequado para coleta de dados 3- Organizar os dados 4- Analisar e interpretar os dados 5- Relatar as conclusões EXERCÍCIOS 1- Identifique os seguintes exemplos em termos de tipos de dados: a- 17 gramas b- 3 certos, 2 errados c- 25 segundos d- 25 alunos na classe e- tamanho de camisa f- Km/litro g- O mais aprazível h- O mais lento i- 5 acidentes no mês de maio 2.0 AMOSTRAGEM AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo de uma parcela dos itens de uma população, enquanto que o censo requer o estudo de todos os itens. Restrições ao Censo: · Custo · Populações infinitas · Dificuldade nos critérios (Precisão) · Produtos de testes Destrutivos (fósforos, munições) · Tempo despendido (atualização) · Tipos de informações mais restritivas Casos de exceção: · Populações pequenas · Amostras grandes em relação à população · Se exige precisão completa · Se já são disponíveis informações completas 2.1 DEFINIÇÕES: POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável comum observável. População é a totalidade dos elementos de um conjunto com uma dada característica, no qual se deseja fazer um determinado estudo. AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos estatísticos. A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a população, com base em resultados verificados em amostras retiradas dessa população. Entretanto não basta que saibamos descrever convenientemente os dados da amostra para que possamos executar, com êxito, um trabalho estatístico completo. Antes de tudo é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por processos adequados. · O que é necessário garantir, em suma, é que a amostra seja “Representativa” da população. Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade em termos: · Qualitativos: Amostras que representem todas as subpopulações, quando for o caso. · Quantitativos: Que possua quantidade de dados suficientes para representar a população. Na indústria onde amostras são frequentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem são mais simples de resolver. Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexidade dos problemas de amostragem são normalmente bastante grandes. Inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte, ou a amostra, dele. A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o fundamento da teoria de inferência. · Amostragem é o ato de retirar amostra, isto é, a ação. · Amostra é a quantidade de dados especificados para representar a população. Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer “quão próxima” está a amostra da população, em termos de representatividade. Amostragem não aleatória não apresenta esta característica. Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a mesma oportunidade de ser incluído na amostra. Nas Populações discretas uma amostra aleatória é aquela em que cada item da população tem a mesma chance de ser incluído na amostra. Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo. Populações finitas: é quando, temos constituído por números finitos, ou fixos de elementos, medidas ou observações. Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção. Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número infinito de elementos. Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilístico. 2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS (RANDÔMICOS) As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,. ,9. Esses números podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem. A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10. Portanto todas as combinações são igualmente prováveis. Conceitualmente, poderíamos construir uma tabela de números aleatórios numerando dez bolinhas com os algarismos de 0 a 9, colocando-as numa urna, misturando bem e extraindo uma de cada vez, com reposição, anotando os valores obtidos. A título de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser: Estimar a frequência de compras; Determinar o valor médio de cada compra; Registrar as queixas contra o sistema. 2.3 OUTROS PLANOS DE AMOSTRAGEM Amostragem probabilística versus Amostragem não probabilística. Os planos de amostragem probabilística são delineados de tal modo que se conhece a probabilidade de todas as combinações amostrais possíveis. Em razão disso, pode-se determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do erro amostral. A amostragem aleatória é um exemplo da amostragem probabilística. A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral não pode ser estabelecida com precisão, consequentemente, não é possível nenhuma estimativa do erro amostral. A verdade é que, sempre que possível, deve-se usar a amostragem probabilística. 2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA) Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem aleatória pode dar resultados totalmente não representativos, ao passo que uma pessoa familiarizada com a população pode especificar quais os itens mais representativos da população. Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem como voluntários para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatória do público em geral, e seria perigoso tentar tirar conclusões gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaboração de um plano de amostragem aleatório para validar os resultados básicos. Os perigos inerentes à pesquisa médica, bem como outro tipo de pesquisa, frequentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntários. Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de tempo notou-se o aumento das chances de adquirirem câncer de mama, doenças cardíacas etc. 2.5 AMOSTRAGEM PROBABILÍSTICA SISTEMÁTICA ESTRATIFICADA CONGLOMERADO AMOSTRAGEM SISTEMÁTICA ( K= N /n )É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtém-se dividindo o tamanho da população pelo tamanho da amostra. onde: N= Tamanho da População n= Tamanho da Amostra EX. N= 200 e n=10 então K=200/10 = 20 Significa que será escolhido um item a cada sequência de 20 de uma lista. Para iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9º, 29º, 49º, 69º .., etc. AMOSTRAGEM ESTRATIFICADA Pressupõe a divisão da população em subgrupos Homogêneos (Estratos), procedendo então a amostragem de cada subgrupo. Ex.: Para se fazer o inventário do estoque, é comum termos 10% dos itens representarem cerca de 60% do valor total enquanto que os 90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20). AMOSTRAGEM POR CONGLOMERADO Pressupõe a disposição dos itens de uma população em subgrupos heterogêneos (subpopulações) representativos da população global. Neste caso cada conglomerado pode ser encarado como uma mini população. Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Subgrupos: sexo, educação, faixa etária, poder aquisitivo, região da habitação, etc.) RESUMO A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de apenas parte dela. Fatores como custo, ensaios destrutivos e populações infinitas, tornam a amostragem preferível a um estudo completo (Censo) da população. Naturalmente espera-se que a amostra seja representativa da população da qual foi extraída. Potencialmente, este objetivo é atingido quando a amostragem é aleatória. Para populações discretas o termo “Aleatório” significa que cada item da população tem a mesma chance de participar na amostra. No caso de populações contínuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores é igual à proporção de valores naquele intervalo. As amostras aleatórias podem ser obtidas: · Através de um processo de mistura, como o embaralhamento de cartas; · Pela utilização de um processo mecânico (Misturadores); · Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma lista. Em certas condições, podem ser mais eficientes variantes da amostragem aleatória simples, tais como amostragem sistemática (periódica), estratificada (subgrupos Homogêneos), ou amostragem por aglomerados (subgrupos convenientes e heterogêneos). A principal vantagem da amostragem aleatória é que se pode determinar o grau de variabilidade amostral, o que é essencial na inferência estatística. Para a amostragem não probabilística falta esta característica. 3.0 ANÁLISE EXPLORATÓRIA DE DADOS Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos. De modo geral, podemos dizer que a essência da ciência é a observação e que seu objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram obtidos. 4.0 DISTRIBUIÇÃO DE FREQUÊNCIA Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações. Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros. Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma. Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa XYZ. Ver resultados anotados na tabela abaixo. TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa XYZ. Nº ESTADO CIVIL GRAU DE INSTRUÇÃO Nº DE FILHOS SALÁRIO (X SAL. MIN) IDADE ANOS MESES REGIÃO DE PROCEDÊNCIA 1 solteiro 1º grau --- 4 26 03 interior 2 casado 1º grau 1 4,56 32 10 capital 3 casado 1º grau 2 5,25 36 05 capital 4 solteiro 2º grau - -- 5,73 20 10 outro 5 solteiro 1º grau --- 6,26 40 07 outro 6 casado 1º grau 0 6,66 28 00 interior 7 solteiro 1º grau --- 6,86 41 00 interior 8 solteiro 1º grau --- 7,39 43 04 capital 9 casado 2º grau 1 7,59 34 10 capital 10 solteiro 2º grau - -- 7,44 23 06 outro 11 casado 2º grau 2 8,12 33 06 interior 12 solteiro 1º grau --- 8,46 27 11 capital 13 solteiro 2º grau - -- 8,74 37 05 outro 14 casado 1º grau 3 8,95 44 02 outro 15 casado 2º grau 0 9,13 30 05 interior 16 solteiro 2º grau - -- 9,35 38 08 outro 17 casado 2º grau 1 9,77 31 07 capital 18 casado 1º grau 2 9,8 39 07 outro 19 solteiro superior --- 10,53 25 08 interior 20 solteiro 2º grau - -- 10,76 37 04 interior 21 casado 2º grau 1 11,06 30 09 outro 22 solteiro 2º grau - -- 11,59 34 02 capital 23 solteiro 1º grau --- 12,00 41 00 outro 24 casado superior 0 12,79 26 01 outro 25 casado 2º grau 2 13,23 32 05 interior 26 casado 2º grau 2 13,6 35 00 outro 27 solteiro 1º grau --- 13,85 46 07 outro 28 casado 2º grau 0 14,69 29 08 interior 29 casado 2º grau 5 14,71 40 06 interior 30 casado 2º grau 2 15,99 35 10 capital 31 solteiro superior --- 16,22 31 05 outro 32 casado 2º grau 1 16,61 36 04 interior 33 casado superior 3 17,26 43 07 capital 34 solteiro superior --- 18,75 33 07 capital 35 casado 2º grau 2 19,40 48 11 capital 36 casado superior 3 23,30 42 02 interior TABELA 2: Frequência e porcentagem da amostra de 36 empregados da empresa XYZ, segundo o grau de instrução. GRAU DE INSTRUÇÃO TABULAÇÃO FREQUÊNCIA f FREQ. RELATIVA fR (%) 1º grau I I I I I I I I I I I I 12 33,33 2º grau I I I I I I I I I I I I I I I I I I 18 50,00 superior I I I I I I 6 16,67 TOTAL 36 100 TABELA 3: Frequência e porcentagem dos 2000 empregados (População) da empresa XYZ (Censo x Probabilidade) GRAU DE INSTRUÇÃO FREQUÊNCIA f FREQ. RELATIVA fR % CENSO FREQ. RELATIVA fR % PROVÁVEL 1º grau 650 32,50 33,33 2º grau 1020 51,00 50,00 superior 330 16,50 16,67 TOTAL 2000 100 100 TABELA 4: Frequência e porcentagens dos 36 empregados (Amostra) da empresa XYZ. CLASSES DE SALÁRIOS FREQUÊNCIA f FREQ. RELATIVA fR (%) 4 |----- 8 10 27,78 8 |----- 12 12 33,33 12 |----- 16 8 22,22 16 |----- 20 5 13,89 20 |----- 24 1 2,78 TOTAL 36 100 TABELA 5: Frequências e porcentagem dos empregados da empresa XYZ, segundo Nº de filhos. Nº DE FILHOS FREQÜÊNCIA f FREQ. RELATIVA fR (%) 0 4 20 1 5 25 2 7 35 3 3 15 5 1 5 TOTAL 20 100 5.0 APRESENTAÇÃO GRÁFICA A apresentação gráfica dos dados e respectivos resultados de sua análise pode também ser feita sob forma de figuras, em geral gráficos ou diagramas. Gráficos devem ser autoexplicativos e de fácil compreensão, de preferência sem comentários inseridos. Os gráficos devem ser simples, atrair a atenção do leitor e inspirar confiança. 5.1 DIAGRAMA DE ORDENADAS Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir de pontos equidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam proporcionais às frequências. Ex. Considerando a tabela abaixo: CLASSES DE SALÁRIOS FREQUÊNCIA f FREQ. RELATIVA fR (%) 4 |----- 8 10 27,78 8 |----- 12 12 33,33 12 |----- 16 8 22,22 16 |----- 20 5 13,89 20 |----- 24 1 2,78 TOTAL 36 100 Frequências 12 10 8 6 4 2 0 4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I 24 Salários 5.2 ( SALÁRIOS )DIAGRAMA DE BARRAS/COLUNAS A mesma distribuição acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da área da figura geométrica, já que a vista repousa melhor sobre uma superfície do que sobre uma linha. Ex. Considerando a tabela abaixo: CLASSES DE SALÁRIOS FREQUÊNCIA f FREQ. RELATIVA fR (%) 4 |----- 8 10 27,78 8 |----- 12 12 33,33 12 |----- 16 8 22,22 16 |----- 20 5 13,89 20 |----- 24 1 2,78 TOTAL 36 100 14 12 10 8 6 4 2 0 4 |----- 8 8 |----- 12 12 |----- 16 16 |----- 20 20 |----- 24 5.4 DIAGRAMA DE SETORES CIRCULARES Outra opção seria através de setores circulares, na qual se divide a área total de um círculo em subáreas (setores) proporcionais as frequências. Ex. Considerando a tabela abaixo: CLASSES DE SALÁRIOS FREQUÊNCIA f FREQ. RELATIVA fR (%) 4 |----- 8 10 27,78 8 |----- 12 12 33,33 12 |----- 16 8 22,22 16 |----- 20 5 13,89 20 |----- 24 1 2,78 TOTAL 36 100 ( Salários 2.78 13.89 27.78 22.22 33.33 1 2 3 4 5 ) 5.5 DIAGRAMA LINEAR No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas constituindo- se desta forma o diagrama linear. Ex. Considerando a tabela abaixo: CLASSES DE SALÁRIOS FREQUÊNCIA f FREQ. RELATIVA fR (%) 4 |----- 8 10 27,78 8 |----- 12 12 33,33 12 |----- 16 8 22,22 16 |----- 20 5 13,89 20 |----- 24 1 2,78 TOTAL 36 100 ( Salários 14 12 10 8 6 4 2 0 4 |----- 8 8 |----- 12 12 |----- 16 16 |----- 20 20 |----- 24 ) 6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS A análise estatística de dados relativos a uma amostra de uma população, requer uma aglutinação organizada de informações, conforme regras cuja prática demonstrou serem eficientes. O agrupamento destes dados em subgrupos é feito com base nos seguintes conceitos: Amplitude total (AT): é a diferença entre a medida máxima e a medida mínima. Número de classes (d): é o número de divisões que estipulamos para a Amplitude Total. Normalmente pode-se usar d ≈ √ n onde n é o número de itens na amostra. (Classe: é o intervalo de variação das medidas.) Amplitude do intervalo de classe (AI): é a diferença entre os valores máximos e mínimos de cada classe. ( AI = AT / d )Amplitude do intervalo de cada classe OBS.: Normalmente, usa-se um número mínimo de 5 e no máximo 20 classes, de preferência de mesma amplitude. As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos: 0 I 10 intervalo aberto & fechado, para significar que o intervalo compreende os valores da variável maiores do que 0 (exclusive) e até 10 (inclusive); 0 I 10 intervalo fechado & aberto, para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (exclusive); 0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10. 0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (inclusive). TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS Para a facilidade e metodização do processo de análise estatística, monta-se uma tabela que agrupe as informações obtidas, da forma de Tabela de Frequências. Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma amostra de 100 pacotes extraídos parcialmente de um processo automático de empacotamento. TABELA 6 AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO 1 207 21 220 41 210 61 210 81 217 2 213 22 204 42 214 62 220 82 211 3 210 23 213 43 219 63 213 83 213 4 215 24 211 44 215 64 217 84 218 5 201 25 214 45 217 65 214 85 213 6 210 26 217 46 213 66 219 86 213 7 212 27 224 47 218 67 214 87 218 8 204 28 211 48 214 68 215 88 216 9 209 29 220 49 215 69 223 89 206 10 212 30 209 50 212 70 217 90 212 11 215 31 214 51 221 71 213 91 207 12 216 32 208 52 211 72 218 92 213 13 221 33 217 53 218 73 207 93 215 14 219 34 214 54 205 74 210 94 212 15 222 35 209 55 220 75 208 95 223 16 225 36 212 56 203 76 214 96 210 17 215 37 208 57 216 77 211 97 226 18 218 38 215 58 222 78 205 98 224 19 213 39 211 59 206 79 215 99 214 20 216 40 216 60 221 80 207 100 215 No caso da amostra de pacotes de manteiga acima, temos: AT = 226 – 201 = 25 gramas Temos d √100 10 classes, porém deve-se utilizar sempre que possível número ímpar de classes, no caso podemos usar 9 classes. Amplitude do intervalo de cada classe 2,78 (aprox. 3) Isto é: AI = 25/9 = 2,78 ( AI adotado = 3 e AT adotado = 27 (começa um antes do menor e termina um depois do maior valor) ) TABELA 7 FREQ FREQ. RELATIVA % FREQ. ACUMULADA FREQ. ACUM. REL. % CLASSE TABULAÇÃO f fR F FR 1 200 I--- 203 I 1 1 1 1 2 203 I--- 206 I I I I 4 4 5 5 3 206 I--- 209 I I I I I I I I I I 10 10 15 15 4 209 I--- 212 I I I I I I I I I I I I I I I 15 15 30 30 5 212 I--- 215 I I I I I I I I I I I I I I I I I I I I I I I I I 25 25 55 55 6 215 I--- 218 I I I I I I I I I I I I I I I I I I I I I 21 21 76 76 7 218 I--- 221 I I I I I I I I I I I I I 13 13 89 89 8 221 I--- 224 I I I I I I I 7 7 96 96 9 224 I--- 227 I I I I 4 4 100 100 Σ 100 100% Onde: Frequência (f) = número de vezes que as medidas ocorrem no intervalo de classes Frequência Relativa (fR) = porcentagem da frequência de cada classe em relação ao total de elementos. ( f R = (f / n).100 ) Frequência acumulada (F) = soma das frequências até o intervalo de classe considerado. Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55 Frequência acumulada relativa (FR) = soma das frequências relativas até o intervalo considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15 7.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL Como o próprio nome indica, a medida de tendência central visa a determinar o centro da distribuição. Esta determinação, porém, não é bem definida daí parece razoável chamarmos de “tendência central”. São medidas de tendência central: · MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( x̅ ); · MEDIANA (md); · MODA (mo). 7.1 MÉDIA ARITMÉTICA SIMPLES 7.1.1 PARA UMA LISTA Esta é a situação mais simples: para se calcular a média, basta somarmos todos os elementos da lista e dividirmos o resultado pelo número de elementos. ( x ̅ = Σ x i / n ) Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10. x̅ = 8+3+5+12+10 = 38 = 7,6 5 5 7.1.2 PARA DADOS TABULADOS Outra possibilidade é calcular a média quando os dados vêm dispostos em uma tabela na qual é informada a frequência absoluta simples fi de cada elemento xi. O total de elementos n é obtido somando todas as frequências absolutas simples fi. ( x ̅ = Σ (x i . f i ) / n ) Exemplo: Calcular a média aritmética do conjunto descrito a seguir: xi fi 1 2 2 3 3 1 x̅ = (1 . 2 + 2. 3 + 3 . 1) / (2+3+1) x̅ = 11 / 6 x̅ = 1,83 7.1.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA ( x ̅ = Σ (PM i . f i ) / n )Neste caso, os dados estão agrupados em classes e devemos calcular a média a partir da distribuição de frequência correspondente, apresentada em forma de tabela. Cada classe tem um ponto médio PM que é igual à metade da soma de seus limites inferior e superior. Exemplo: Calcular a média do conjunto descrito pela distribuição de frequência a seguir: xi fi 0 |----- 3 2 3 |----- 6 5 6 |----- 9 7 9 |----- 12 4 12 |----- 15 3 x̅ = (1,5 . 2 + 4,5 . 5 + 7,5 . 7 + 10,5 . 4 + 13,5 . 3) / (2+5+7+4+3) x̅ = 160,5 / 21 x̅ = 7,64 7.2 MÉDIA ARITMÉTICA PONDERADA ( x ̅ = Σ(x i .f i ) / Σ f i ) onde: fi = frequência dos dados xi Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem com as frequências 3, 2, 4 e 1, respectivamente. Números x = 5, 8, 6, 2 Frequências f = 3, 2, 4, 1 x̅ = 5.3+8.2+6.4+2.1 = 57 = 5,7 3+2+4+1 10 7.3 MEDIANA (md) 7.3.1 PARA UMA LISTA Esta é a situação mais simples: para se calcular a mediana, basta ordenar os elementos da lista e localizar o elemento que está ao centro da lista, isto é, para o qual há o mesmo número de ocorrências antes e depois. Obs.: se o número de elementos for par, basta localizar os dois elementos medianos e calcular média aritmética entre eles. Exemplo-1: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 ,6} Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,10} md = 5 Exemplo-2: Qual é a mediana do conjunto {10, 7, 5, 1, 3, 4 , 6, 9 } Basta ordenar e localizar o elemento mediano: {1,3,4,5,6,7,9,10} md = (5+6) / 2 md = 5,5 7.3.2 PARA DADOS TABULADOS No caso de cálculo da mediana quando estamos trabalhando com dados tabulados determinamos o valor mais provável dessa distribuição a partir de: Posição da md = (Frequência acumulada total + 1) = FA + 1 2 2 Exemplo: Qual a mediana do conjunto descrito pela tabela abaixo: xi fi FA 10 3 3 13 4 7 16 6 13 17 5 18 25 1 19 Como n = 19 , a posição central é (n+1) / 2, logo 20 /2 , isto é 10° posição. Portanto a mediana é md = 16 {10,10,10,13,13,13,13,16,16,16,16,16,16,17,17,17,17,17,25} Ou seja, a posição da MEDIANA é definida por n+1 2 -ésimo elemento quando ”n” é ímpar e temos um número inteiro que dá a posição da mediana. Quando temos o meio do caminho entre dois números inteiros, isto é, ”n” é par, a mediana será a média deles. Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88. (a) n+1 = 15+1 = 8 , e a mediana é o valor do 8° elemento; 2 2 (b) n+1 = 45+1 = 23 , e a mediana é o valor do 23° elemento; 2 2 (c) n+1 = 88+1 = 44,5 , e a mediana é a média do valor do 44° e o 2 2 45°elemento. Ou seja, quando n é par procuramos duas posições: n 2 e n +1 2 7.3.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIA Neste caso, os dados estão agrupados em classes e devemos calcular a mediana a partir da distribuição de frequência correspondente, apresentada em forma de tabela. Ao contrário dos itens anteriores, não precisamos nos preocupar se há um número ímpar ou par de elementos. Basta encontrar a classe mediana e aplicar a fórmula para o cálculo da mediana para distribuição de frequências. No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga temos: Posição da md = (Frequência acumulada total ) = FA 2 2 md = FA = 100 = 50, e a mediana é o valor do 50° elemento 2 2 ( 50° valor ) F 0 1 5 15 30 55 76 89 96 100 X 200 203 206 209 212 215 218 221 224 227 (55 – 30) (55 – 50) (215 – 212) Δ ou (55 – 30) (50 – 30) (215 – 212) Δ Δ = 5 x 3 = 0,6 25 portanto a mediana será 215 - Δ logo, md = 215 - 0,6 = 214,4. Δ = 20 x 3 = 2,4 25 portanto a mediana será 212 + Δ logo, md = 212 + 2,4 = 214,4. Assim, para encontrarmos a mediana para dados agrupados em classes podemos formalizar os passos anteriores na seguinte equação: Md = linf + h. n/2 - Fant fmed onde: n/2 = metade da quantidade de dados h = amplitude da classe mediana linf = limite inferior da classe da mediana fmed = frequência absoluta da classe da mediana Fant = frequência acumulada da classe anterior a da mediana Voltando ao exemplo, temos: 1º Passo: da tabela 7 - página 18, temos as frequências acumuladas já calculadas; 2º Passo: n = 100 => n/2 = 100/2 = 50 => localização da classe mediana: 5ª classe, isto é, classe 212 I--- 215; 3º Passo: encontrar na tabela: linf , fmed e Fant : linf = 212 fmed = 25 Fant = 30 4º Passo: substituir os dados na equação: md = linf + h. n/2 - Fant fmed md = 212+ 3. 50 – 30 25 = 212 + 3. 0,8 = 212 + 2,4 = 214,4 md = 214,4 7.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS) Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente. O cálculo dessas divisões é semelhante ao da mediana, isto é: Quartis: Qi = linf + h. i.n/4 - FQi-1 fQi onde i = 1,2,3 Decis: ( i.n/10 - F Di-1 f Di )Di = linf + h. onde i = 1,2,3, ..., 8,9. Centis: Ci = linf + h. i.n/100 - FCi-1 fCi onde i = 1,2,3,...,98,99. Onde: h = amplitude da classe linf = limite inferior da classe da quartílica, decílica ou percentílica fQi , fDi , fCi = frequências das classes quartílica, decílica e percentílica, respectivamente FQi-1 , FDi-1 , FCi-1 = frequências acumuladas da classe anterior à classe quartílica, decílica ou percentílica. Voltando ao exemplo anterior, temos: i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados: Q1 = linf + h. 1.n/4 - FQi-1 fQi = 209 + 3. 100/4 – 15 = 15 209 + 3 . 0,67 = 211 ii) Para o 3º Quartil: Q3 = linf + h. 3.n/4 - FQi-1 fQi = 215 + 3 . 3.100/4 – 55 21 215 + 3. 0,95 = 217,85 iii) Para o 8º Decil: D8 = linf + h. 8.n/10 - FDi-1 fDi = 218 + 3. 8.100/10 - 76 13 218 +3. 0,31 = 218,93 iv) Para o 15º Centil: : C15 = linf + h. 15.n/100 - FCi-1 fCi = 206 + 3. 15.100/100 - 5 10 = 209 OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a sequência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será: Posição: 3.n/4 = 3.13/4 = 9,75 A posição 9,75ª será aproximada pela inteira imediatamente posterior a ela, ou seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para encontrar os decis e centis de uma série de dados não agrupados em classes. 7.4 MODA ( mo ) 7.4.1 PARA UMA LISTA Em um conjunto de números a moda é o valor que ocorre com maior frequência, isto é, o valor mais comum. Exemplos: 1) 2, 2, 3, 7, 8, 8, 8, 9, 10 moda=8 2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 moda = Ф (não existe moda) 3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9 moda = 4 e 8 7.4.2 PARA DADOS TABULADOS Para se determinar a moda quando os dados vêm dispostos em uma tabela, deve-se procurar qual elemento tem a maior frequência absoluta simples. Exemplo: Qual a moda do conjunto descrito abaixo? xi fi 10 3 13 4 16 5 17 7 25 2 mo = 17 , pois aparece 7 vezes. 7.4.3 PARA DISTRIBUIÇÃO DE FREQUÊNCIAS Na verdade, o cálculo da moda para uma distribuição de frequências é apenas aproximado, haja vista não sabermos exatamente como os dados estão distribuídos dentro de cada classe. Para o exemplo do exercício das distribuições de frequências dos pacotes de manteiga (onde os dados são tabulados agrupados em classes) uma forma de estimar o valor da moda é pela Estimativa de Pearson (para dados tabulados agrupados em classes): ( m o = 3. m d – 2. x ̅ ) Voltando ao exemplo, temos: mo = 3.214,4 – 2. 214,49 => mo = 214,22 onde a média foi calculada da forma: x̅ = 201,5 . 1 + 204,5 .4 + 207,5 .10 + 210,5 .15 + 213,5 .25 + 216,5 .21 + 219,5 . 13 + 222,5. 7 + 225,5. 4 1 + 4 + 10 + 15 + 25 + 21 + 13 + 7 + 4 x̅ = 214,49 O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma indicação de que os três parâmetros de tendência central (média, mediana e moda) estejam muito próximos. Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria dos casos: mo = linf + h. a . a + p onde: linf = limite inferior da classe modal. a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como classe anterior aquela que precede à classe modal. p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem logo após a classe modal). h = amplitude da classe modal. O primeiro passo é a determinação da classe modal, aquela com maior fi. No nosso exemplo é 212 I--- 215 pois temos 25 elementos nesta classe. mo = 212 + 3. ( 25 - 15 ) . (25-15) + (25-21) mo = 212 + 3 . 10 . 10 + 4 mo = 212 + 3 . 0,7143 mo = 212 + 2,14 mo = 214,14 EXERCÍCIOS 1-) Qual a média aritmética dos números ímpares menores do que 10? R: 5 2-) Calcule a média aritmética do conjunto descrito a seguir: xi fi 1 3 2 4 3 1 4 2 R: 2,2 3-) Calcular a média do conjunto descrito pela distribuição de frequências a seguir: xi fi 0,0 |----- 2,0 15 2,0 |----- 4,0 25 4,0 |----- 6,0 13 6,0 |-----8,0 37 8,0 |-----10,0 10 R: 5,04 4-) Calcular a mediana do conjunto {5,3,7,1,9} R: 5 5-) Calcular a mediana do conjunto {1,1,3,5,6,9,23,24} R: 5,5 6-) Calcular a mediana do conjunto descrito pela tabela a seguir: xi fi 100 3 135 6 160 5 175 7 250 2 R: 160 7-) Calcular a mediana do conjunto descrito pela tabela a seguir: xi fi 10 3 15 6 16 5 21 7 23 3 R: 16 8-) Calcular a mediana do conjunto descrito pela distribuição de frequência a seguir: xi fi 0,0 |----- 2,0 15 2,0 |----- 4,0 25 4,0 |----- 6,0 16 6,0 |-----8,0 34 8,0 |-----10,0 10 R: 5,25 9-) Calcular a moda do conjunto { 5,3,7,1,5,2,9} R: 5 10-) Calcular a moda do conjunto descrito pela tabela a seguir xi fi 100 3 135 6 160 5 175 7 250 2 R: 175 11-) Calcular a moda, pelo método de Czuber, do conjunto descrito pela distribuição de frequência a seguir: xi fi 0,0 |----- 2,0 15 2,0 |----- 4,0 25 4,0 |----- 6,0 16 6,0 |-----8,0 34 8,0 |-----10,0 28 R: 7,5 12-) Calcule os quartis da tabela abaixo: Classes fi 50 |----- 54 10 54 |----- 58 23 58 |----- 62 28 62 |----- 66 20 66 |----- 70 12 70 |----- 74 7 Total 100 ( Decil: 3, 7 e 9 Centil: 13, 33 e 80 )R: Q1 = 56,61 , Q2 = 60,43 , Q3 = 64,8 8.0 TIPOS DE DISTRIBUIÇÃO As distribuições de frequência podem se apresentar de diversas formas conforme as figuras a seguir: 8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO A distribuição é simétrica quando os valores se distribuem igualmente em torno da média A) Normal B) Alongada C) Achatada Distribuições simétricas A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média Caso especial de uma distribuição simétrica Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que distribuem-se em forma de sino. Distribuições Assimétricas A distribuição das frequências apresenta valores menores num dos lados: CURVA ASSIMÉTRICA À DIREITA (ASSIMETRIA POSITIVA) CURVA ASSIMÉTRICA À ESQUERDA (ASSIMETRIA NEGATIVA) 8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que corresponde à frequência máxima. Sob o critério da moda as distribuições classificam-se em: A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem frequência máxima ela é denominada modal. mo B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas. mo mo D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas modas mo mo mo 9.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO) As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual os valores numéricos de uma distribuição tendem a se distanciar em torno de um valor médio. Em todos os casos, o valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o valor da medida (amplitude, desvio- padrão, variância). 9.1 AMPLITUDE TOTAL (AT) É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das observações. AT = Xmax – Xmin Embora exista simplicidade de cálculo, existem duas restrições ao seu uso generalizado: 1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor não se modifica mesmo que os valores das observações variem, desde que conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos valores externos (max e min), não sendo afetada pelos valores internos. 2- Depende do número de observações na amostra. Em geral o valor da amplitude cresce quando cresce o tamanho da amostra. 9.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di) O desvio di em relação à média de um conjunto de dados é a diferença do valor xi e a média aritmética x̅ do conjunto, isto é: di = (xi - x̅ ) Exemplos : 1-) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7 Onde x̅ = 3+4+5+6+7 = 5 5 xi di 3 -2 4 -1 5 0 6 1 7 2 ∑ di = 0 2-) Calcular os desvios di para a seguinte distribuição : xi fi di 82 5 -4,6 85 10 -1,6 87 15 0,4 89 8 2,4 90 4 3,4 ∑ fi = 42 ∑ di = 0 Onde x̅ = 82 .5.+ 85. 10 + 87. 15 + 89 . 8 + 90. 4 5 + 10 + 15 + 8 + 4 x̅ = 86,6 (3) Calcular os desvios di para a seguinte distribuição : Classes xi (PM) fi di di . fi 35 |----- 45 40 2 -22,91 -45,82 45 |----- 55 50 13 -12,91 -167,83 55 |----- 65 60 20 -2,91 -58,20 65 |----- 75 70 10 7,09 70,90 75 |----- 85 80 7 17,09 119,63 85 |----- 95 90 3 27,09 81,27 ∑ fi = 55 ∑ di = 12,55 ∑ di. fi = 0 Onde x̅ = 40 .2 + 50 .13 + 60 .20 + 70 .10 + 80 .7 + 90 .3 2 + 13 + 20 + 10 + 7 + 3 x̅ = 3460 / 55 x̅ = 62,91 9.3 DESVIO MÉDIO ( d̅ ) O desvio médio d̅ é a média aritmética dos módulos dos desvios, isto é: d̅ = ∑ di = ∑ xi - x̅ n n Para uma distribuição de frequências (simples ou por classes), teremos: d̅ = ∑ di . fi = ∑ xi - x̅ .fi n n Exercício 13-) Calcular o desvio médio para os exemplos (1), (2) e (3) anteriores. 9.4 VARIÂNCIA ( ou s2) Variância da população é a soma dos quadrados dos desvios de cada observação em relação à média de “x” e divide-se por N. Indica-se a Variância da População por σ². Podemos fazer a mesma analogia com a Variância da Amostra dada por S². ( σ² = ∑ (x i - µ) 2 . f i N )Variância para uma população: onde é a média populacional e N é o tamanho da população. ( s 2 = ∑ (x i - x ̅ ) 2 .f i n - 1 )Variância para uma amostra: Onde x̅ é a média amostral e n é o tamanho da amostra. As equações anteriores para e s2 representam uma maneira de cálculo dessas medidas. Podemos também utilizar as seguintes equações: ( σ² = ∑ f i (x i ) 2 – N. µ 2 N ) ( s 2 = ∑ f i (x i ) 2 – n. x ̅ 2 n - 1 ) Como medida de dispersão, a Variância tem a desvantagem de apresentar como unidade de medida o quadrado da unidade de medida dos dados. Se os dados estão em metros, a Variância fica em metros quadrados. O desvio padrão por sua vez, fica com valor na mesma da unidade da variável. Obs: A variância sendo uma média de uma soma de quadrados é sempre maior ou igual a 0. Ela será nula se os valores dos dados são constantes. 9.5 DESVIO PADRÃO ( ou s) É a medida que determina a variação dos valores observados em torno da média da distribuição, e representa a distância do ponto de inflexão da curva até a linha da média. A partir da variância podemos calcular o desvio padrão como segue: Desvio padrão da população: =√ Desvio padrão da amostra: s = √s2 9.6 COEFICIENTE DE VARIAÇÃO (cv) ( cv = )O coeficiente de variação cv é a razão entre o desvio padrão e a média aritmética. Esta medida é adimensional e geralmente é expressa em porcentagens. A equação para o seu cálculo é: Para população ( cv = s x ̅ )Para amostra Exercícios 14-) (ICMS/MG) As alturas do jogadores de basquete da seleção brasileira são: 1,98m; 2,04m; 2,06m; 2,02m e 2,05m. A média de altura dessa seleção e m, é de: a) 2,01 b) 2,02 c) 2,03 d) 2,04 e) 2,05 15-) (TTN) Assinale a alternativa correta, considerando a série: 8,5,14,10,8 e15. a) A média aritmética é 10 e a mediana é 12. b) A amplitude total é 7 e a moda é 8. c) A mediana é 9 e a amplitude total é 10. d) A média aritmética é 1 e a amplitude total é 7. e) A mediana é 12 e a amplitude total é 7. 16-) (ICMS/MG) Na série composta de notas de Estatística: 4,5,7,8,5,5,6,8,6. A média aritmética simples, a mediana e a moda são, respectivamente: a) 6,5 e 4 b) 6,6 e 5 c) 6,6 e 6 d) 6,5 e 5 e) 7,6 e 5 17-) (ICMS/MG) Dados os conjuntos de valores: A = {1,1,2,3,4,5,5,8,8,8,9,10} B = {6,7,8,9,10,11,12} C = {1,2,4,4,4,4,5,8,9,9,9,9,10} Em relação a moda, afirmamos que: I- A é unimodal, e a moda é 8 II- B é unimodal, e a moda é 9 III- C é bimodal, e as modas são 4 e 9. Então, em relação as afirmativas, é correto dizer que: a) Todas são verdadeiras b) Todas são falsas c) Somente I e II são verdadeiras d) Somente I e III são verdadeiras e) Somente II e III são verdadeiras 18-) (AFRF/05) Para dados agrupados representados por uma curva de frequências, as diferenças entre os valores da média, da mediana e da moda são indicadores da assimetria da curva. Indique a relação entre essas medidas de posição para uma distribuição negativamente assimétrica. a) A média apresenta o maior valor e a mediana se encontra abaixo da moda. b) A moda apresenta o maior valor e a média se encontra abaixo da mediana. c) A média apresenta o menor valor e a mediana se encontra abaixo da moda. d) A média, a mediana e a moda são coincidentes. e) A moda apresenta o menor valor e a mediana se encontra abaixo da média. 19-) (TRF/06) Considere a seguinte distribuição das frequências absolutas dos salários mensais em R$, referente a 200 trabalhadores de uma indústria (os intervalos são fechados à esquerda e abertos à direita). Classes de Salários Frequências Absolutas De R$ 400 até R$ 500 50 De R$ 500 até R$ 600 70 De R$ 600 até R$ 700 40 De R$ 700 até R$ 800 30 De R$ 800 até R$ 900 10 Sobre essa distribuição de salários é correto afirmar que: a) O salário modal encontra-se na classe de R$800 até R$900 b) O salário mediano encontra-se na classe de R$600 até R$700 c) O salário modal encontra-se na classe de R$600 até R$700 d) O salário modal encontra-se na classe de R$700 até R$800 e) O salário mediano encontra-se na classe de R$500 até R$600. 20-) (ICMS/MG) O quadro abaixo nos mostra a distribuição dos erros cometidos por 20 alunos numa prova de português. O valor do desvio médio dessa distribuição é: N0 DE ERROS (xi) N0 DE ALUNOS (fi) 1 2 2 6 3 5 4 4 5 3 a) 1,0 b) 1,5 c) 2,0 d) 2,5 e) 3,0 Gabarito 14 -- C 15 -- C 16 -- B 17 -- D 18 – B e C 19 -- E 20 – A 21-) (TRF) Considere os seguintes conjuntos de observações referentes a cinco diferentes variáveis: T: 10;10;10;10;10;8 V: 10;10;10;10;8;8 X: 10;10;10;8;8;8 Y: 10;10;8;8;8;8 Z: 10;8;8;8;8;8 O conjunto de observações que apresenta a maior variabilidade, medida pelo desvio padrão, é o referente à variável: a) Y b) T c) V d) X e) Z 22-) (AFRF/02) Numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de frequências abaixo: Classes Frequência (f) 29,5 |----- 39,5 4 39,5 |----- 49,5 8 49,5 |----- 59,5 14 59,5 |----- 69,5 20 69,5 |----- 79,5 26 79,5 |----- 89,5 18 89,5 |----- 99,5 10 Assinale a opção que corresponde ao desvio absoluto médio. a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0 23-) (AFRF/09) Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um curso preparatório. Com relação a essa amostra, marque a única opção correta: 29,27,25,39,29,27,41,31,25,33,27,25,25,23,27,27,32,26,24,36,32,26,28,24,28, 27,24,26,30,26,35,26,28,34,29,23,28. a) A média e a mediana das idades são iguais a 27. b) A moda e a média das idades são iguais a 27. c) A mediana das idades é 27 e a média é 26,08. d) A média das idades é 27 e o desvio padrão é 1,074. e) A moda e a mediana das idades são iguais a 27. 24-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 2 4 |----- 6 6 6 |----- 8 5 8 |----- 10 4 10 |----- 12 3 25-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 11 4 |----- 6 10 6 |----- 8 11 8 |----- 10 4 10 |----- 12 4 26-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 4 |----- 6 8 6 |----- 8 10 8 |----- 10 20 10 |----- 12 30 12 |----- 14 20 27-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 7 4 |----- 6 9 6 |----- 8 18 8 |----- 10 10 10 |----- 12 6 28-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 9 4 |----- 6 12 6 |----- 8 6 8 |----- 10 2 10 |----- 12 1 29-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 4 |----- 6 6 6 |----- 8 8 8 |----- 10 12 10 |----- 12 10 12 |----- 14 4 30-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 45 |----- 55 3 55 |----- 65 7 65 |----- 75 4 75 |----- 85 5 85 |----- 95 1 31-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 9 |----- 19 10 19 |----- 29 20 29 |----- 39 40 39 |----- 49 20 49 |----- 59 10 32-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 50 |----- 60 15 60 |----- 70 20 70 |----- 80 30 80 |----- 90 20 90 |----- 100 15 33-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 20 |----- 30 10 30 |----- 40 20 40 |----- 50 25 50 |----- 60 20 60 |----- 70 10 34-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 50 |----- 58 10 58 |----- 66 15 66 |----- 74 25 74 |----- 82 24 82 |----- 90 16 90 |----- 98 10 35-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 6 4 |----- 6 10 6 |----- 8 14 8 |----- 10 6 10 |----- 12 4 36-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 20 4 |----- 6 15 6 |----- 8 35 8 |----- 10 20 10 |----- 12 10 37-) Calcular, média, moda, mediana, quartil 1 e 3, decil 1 e 9 , variância, desvio padrão, desvio médio absoluto, coeficiente de variação e variância relativa: Classe f 2 |----- 4 5 4 |----- 6 5 6 |----- 8 10 8 |----- 10 30 10 |----- 12 20 12 |----- 14 25 14 |----- 16 5 38-) (PUC-SP) O histograma abaixo apresenta a distribuição de frequência das faixas salariais numa pequena empresa. Com os dados disponíveis, pode-se concluir que a média desses salários é , aproximadamente: a) R$ 420,00 b) R$ 536,00 c) R$ 562,00 d) R$ 640,00 e) R$ 708,00 39-) Numa escola, o professor de educação física mediu as alturas de 100 alunos do sexo masculino e construiu a seguinte distribuição de frequências: Alturas (em cm) Número de estudantes 150 |----- 158 5 158 |----- 166 15 166 |----- 174 48 174 |----- 182 25 182 |----- 190 7 Pede-se: a) Variância b) Desvio padrão c) Histograma 40-) Qual a Variância e o Desvio Padrão para a distribuição da seguinte tabela? Número de pessoas Idade 5 22 3 14 6 18 1 28 4 21 8 20 a) 7,85 e 3 respectivamente b) 8,15 e 2,9 respectivamente c) 8,5 e 3,1 respectivamente d) 8,75 e 2,5 respectivamente e) 8,06 e 2,8 respectivamente GABARITO 21 D 22 E 23 E 24 Média = 7 Moda = 5,6 Mediana = 6,8 Q1 = 5 Q3 = 9 D1 = 4 D9 = 10,66 Variância = 6 Desvio padrão = 2,45 Desvio médio = 2 Coeficiente de variação = 0,3499 Variância relativa = 0,1224 25 Média = 6 Moda = 3,83 e 6,25 Mediana = 5,8 Q1 = 3,82 Q3 = 7,63 D1 = 2,72 D9 = 10 Variância = 6,4 Desvio padrão = 2,53 Desvio médio = 2,15 Coeficiente de variação = 0,4216 Variância relativa = 0,1778 26 Média = 10 Moda = 11 Mediana = 10,4 Q1 = 8,4 Q3 = 11,87 D1 = 6,16 D9 = 13,12 Variância = 5,91 Desvio padrão = 2,43 Desvio médio = 2,05 Coeficiente de variação = 0,2431 Variância relativa = 0,0591 27 Média = 6,96 Moda = 7,06 Mediana = 7 Q1 = 5,22 Q3 = 8,7 D1 = 3,42 D9 = 10,33 Variância = 5,68 Desvio padrão = 2,38 Desvio médio = 1,81 Coeficiente de variação = 0,3424 Variância relativa = 0,1172 28 Média = 5,27 Moda = 4,67 Mediana = 5 Q1 = 3,64 Q3 = 6,5 D1 = 2,66 D9 = 8 Variância = 4,2 Desvio padrão = 2,05 Desvio médio = 1,57 Coeficiente de variação = 0,3889 Variância relativa = 0,1513 29 Média = 8,9 Moda = 9,33 Mediana = 9 Q1 = 7 Q3 = 10,8 D1 = 5,33 D9 = 12 Variância = 5,79 Desvio padrão = 2,41 Desvio médio = 1,93 Coeficiente de variação = 0,2704 Variância relativa = 0,0731 30 Média = 67 Moda = 60,71 Mediana = 65 Q1 = 57,85 Q3 = 77 D1 = 51,66 D9 = 83 Variância = 131 Desvio padrão = 11,45 Desvio médio = 10 Coeficiente de variação = 0,1708 Variância relativa = 0,0292 31 Média = 34 Moda = 34 Mediana = 34 Q1 = 27 Q3 = 42 D1 = 19,5 D9 = 49,5 Variância = 120 Desvio padrão = 10,95 Desvio médio = 8 Coeficiente de variação = 0,3175 Variância relativa = 0,1008 32 Média = 75 Moda = 75 Mediana = 75 Q1 = 65 Q3 = 85 D1 = 56,66 D9 = 93,33 Variância = 160 Desvio padrão = 12,65 Desvio médio = 10 Coeficiente de variação = 0,1680 Variância relativa = 0,0284 33 Média = 45 Moda = 45 Mediana = 45 Q1 = 35,625 Q3 = 54,375 D1 = 28,5 D9 = 61,5 Variância = 141,18 Desvio padrão = 11,88 Desvio médio = 9,41 Coeficiente de variação = 0,2640 Variância relativa = 0,0697 34 Média = 74,08 Moda = 73,27 Mediana = 74 Q1 = 66 Q3 = 82,5 D1 = 58 D9 = 90 Variância = 132,47 Desvio padrão = 11,51 Desvio médio = 9,68 Coeficiente de variação = 0,1554 Variância relativa = 0,0241 35 Média = 6,6 Moda = 6,66 Mediana = 6,57 Q1 = 4,8 Q3 = 8 D1 = 3,33 D9 = 10 Variância = 5,44 Desvio padrão = 2,33 Desvio médio = 1,88 Coeficiente de variação = 0,3534 Variância relativa = 0,1249 36 Média = 6,7 Moda = 7,14 Mediana = 6,85 Q1 = 4,66 Q3 = 8,5 D1 = 3 D9 = 10 Variância = 6,11 Desvio padrão = 2,47 Desvio médio = 1,99 Coeficiente de variação = 0,3689 Variância relativa = 0,1361 37 Média = 10 Moda = 9,33 Mediana = 10 Q1 = 8,33 Q3 = 12,4 D1 = 6 D9 = 13,6 Variância = 8,6 Desvio padrão = 2,93 Desvio médio = 2,4 Coeficiente de variação = 0,2933 Variância relativa = 0,0860 38 E 39 Variância = 55,07 Desvio Padrão = 7,42 40 E 10.0 PROBABILIDADE O problema fundamental da estatística consiste em trabalhar com o acaso e a incerteza. Chama-se probabilidade de um acontecimento a razão entre o número de casos favoráveis ao mesmo e o número total de acontecimentos possíveis. As leis da hereditariedade foram a primeira grande aplicação das probabilidades na área de biociências. Hoje conhecemos muitas aplicações: ocorrência de mutações, risco de doenças, chance de sobrevivência, distribuição e interação de espécies, etc. A aplicação mais importante, entretanto, é feita na estatística. Nenhuma observação e nenhuma experiência podem ser precisamente planejadas e analisadas sem algum método estatístico. Mesmo se mantivermos as condições experimentais mais constantes possíveis, a repetição de uma observação ou uma experiência dificilmente resulta sempre exatamente igual. Sempre existem flutuações. Portanto, todas as conclusões baseadas em dados empíricos (baseado apenas na experiência, e não no estudo) são necessariamente encaradas com incerteza. Tentamos expressar o grau de incerteza em termos de probabilidades. Então, um pesquisador afirma “significância ao nível de cinco por cento”, ele admite a possibilidade de uma afirmativa errônea. Antes da compreensão de alguns métodos estatísticos é necessário um conhecimento básico sobre probabilidades. Quando se considera uma população limitada de P indivíduos, a probabilidade de cada um ser escolhido, ao acaso, é de 1/P. Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o número de casos igualmente possíveis”. Por exemplo, se jogarmos uma moeda “não viciada” para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa. Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou 50%. Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o acontecimento favorável como “P” e o não favorável como “Q”, temos as razões: P= ½ e Q = ½ Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P) A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que indica a chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A), maior é a chance de ocorrência do evento A, e quanto mais próxima de Zero, menor é a chance de ocorrência do evento A. ( A um evento impossível atribui-se a probabilidade Zero . Um evento certo tem probabilidade 1 . ) As probabilidades podem ser expressas, inclusive por valores decimais, frações e porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5. Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade mediante determinada combinação de julgamento, experiência ou dados históricos, para predizer Quão Provável é a ocorrência de determinado evento futuro. Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. A previsão da aceitação de um novo produto, o cálculo dos custos de produção, a contratação de um novo empregado, o preparo do orçamento, a avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso. 10.1 ESPAÇO AMOSTRAL E EVENTOS Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52 cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos eventos podemos classificá-los em: ( A )ESPAÇO AMOSTRAL COMPLEMENTO MUTUAMENTE EXCLUSIVOS NAO SÃO MUTUAMENTE EXCLUSIVOS Cartas vermelhas e cartas pretas ( A B )Não se interceptam cartas de copas e cartas de paus ( A B )Cartas de copas e figuras, tem elementos em comum. ( A B C D )COLETIVAMENTE EXAUSTIVOS Cartas de paus, ouro, copas e espadas 10.2 TRÊS ORIGENS DA PROBABILIDADE Há três maneiras diferentes de calcular ou estimar probabilidades, O método Clássico, quando o espaço amostral tem resultados igualmente prováveis. O método Empírico, que se baseia na frequência relativa de ocorrência de um evento num grande número de provas repetidas; e o método Subjetivo, que utiliza estimativas pessoais baseadas num certo grau de crença. OBJETIVO SUBJETIVO CLÁSSICO EMPÍRICO Opinião Pessoal (resultados igualmente prováveis) O Método Clássico (dados históricos) Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas) usualmente apresentam resultados igualmente prováveis. ( P (cada resultado) = 1 . N ° de resultados possíveis )Nestes casos temos: Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, então a probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou 1,92%. Da mesma forma a probabilidade de termos uma cara no lançamento de uma moeda é ½ ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%. No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4, 5 ou 6 de 1/6 ou de 16,66%. De forma geral vale também a expressão: ( P(A) = Número de resultados associados ao evento A Número total de resultados possíveis ) Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é: P (dama) = 4 damas = 4 . = 1 . = 7,69% 52 cartas 52 13 Analogamente, a probabilidade de obter número ímpar no lance de um dado é: P(ímpar) = 3 faces . = 3 . ou 50% 6 faces possíveis 6 A MATEMÁTICA DA PROBABILIDADE Muitas aplicações de estatística exigem a determinação da probabilidade de combinações de eventos. Há duas categorias de eventos de interesse, A e B, no espaço amostral. Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos os eventos. Em outras situações, podemos querer a probabilidade de ocorrência de A ou B, P(A ou B). Cálculo da Probabilidade da ocorrência de dois eventos “independentes” P(A e B) Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B) Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas as faces serem cara? É razoável admitir que os resultados das duas moedas sejam independentes um do outro. Além disso, para moedas equilibradas, P(cara)= ½ . Logo P(cara e cara) será: 1ª moeda 2ªmoeda ½ x ½ = ¼ ou 25% Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente exclusivos” P(A ou B ocorrerá) Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de qualquer um deles é a soma de suas probabilidades individuais. Para dois eventos A e B temos: P(A ou B) = P(A) + P(B) Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 . + 1 . = 2 . = 33,33% 6 6 6 Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente exclusivos” P(A ou B ou ambos ocorrerão) Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho de 52 cartas. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”, os eventos não são mutuamente exclusivos. Assim devemos excluir a probabilidade de intersecção. Então temos: P(paus) = 13 . , P(dez)= 4 ., P( dez de paus) = 1 ., 52 52 52 P(paus ou dez, ou ambos) = P(paus) + P(dez) - P(dez de paus) = 13 . + 4 .- 1 . = 16 . = 30,77% 52 52 52 52 NAIPE ( ♣ K ♣ Q ♣ J ♣ 10 ♣ 9 ♣ 8 ♣ 7 ♣ 6 ♣ 5 ♣ 4 ♣ 3 ♣ 2 ♣ A ) ( ♦ J ♦ 10 ♥ 10 ♠ 10 )PAUS OUROS COPAS ESPADA PRETA VERMELHA VERMELHA PRETA ♣ K ♣ Q ♣ J · K · Q · J ♥ K ♥ Q ♥ J ♠ K ♠ Q ♠ J ♣ 10 ♦ 10 ♥ 10 ♠ 10 ♣ 9 ♦ 9 ♦ 8 ♦ 7 ♦ 6 ♦ 5 ♦ 4 ♦ 3 ♦ 2 ♦ A ♥ 9 ♥ 8 ♥ 7 ♥ 6 ♥ 5 ♥ 4 ♥ 3 ♥ 2 ♥ A ♠ 9 ♠ 8 ♠ 7 ♠ 6 ♠ 5 ♠ 4 ♠ 3 ♠ 2 ♠ A ♣ 8 ♣ 7 ♣ 6 ♣ 5 ♣ 4 ♣ 3 ♣ 2 ♣ A Resumindo: P (A e B), para eventos independentes (Multiplicação) P(A) x P(B) P (A ou B), para eventos mutuamente exclusivos (Soma) P(A) + P(B) P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos P(A) + P(B) - P(A interseção B) 10.3 ALGUMAS PROPRIEDADES Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste item detalharemos tais regras, conhecidas como propriedades da probabilidade. Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja: 0 P(A) 1 Se considerarmos o espaço amostral, S, e o conjunto vazio, , como eventos, temos: P(S) = 1 (evento certo) P() = 0 (evento impossível) Arranjo com Repetição Todos os elementos podem aparecer repetidos em cada grupo de p elementos. Fórmula: Ar(m,p) = mp. Exemplo: Seja C={A,B,C,D}, m=4 e p=2. Os arranjos com repetição desses 4 elementos tomados 2 a 2 são 16 grupos que onde aparecem elementos repetidos em cada grupo. Todos os agrupamentos estão no conjunto: ( A r ={ A A , A B,A C , A D , B A , B B , BC, B D ,CA, C B , C C ,CD,DA,DB ,D C ,DD} ) Permutação com Repetição Se em um dado conjunto um elemento é repetido a vezes, outro elemento é repetido b vezes e assim sucessivamente, o número total de permutações que podemos obter é dada por: A resolução do exemplo com o uso da fórmula é: Exemplos Quantos anagramas podemos obter a partir das letras da palavra PARAR? Como a palavra PARAR possui 5 letras, mas duas delas são repetidas duas vezes cada, na solução do exemplo vamos calcular P5(2, 2): Portanto: O número de anagramas que podemos formar a partir das letras da palavra PARAR é igual 30. Possuo 4 bolas amarelas, 3 bolas vermelhas, 2 bolas azuis e 1 bola verde. Pretendo colocá-las em um tubo acrílico translúcido e incolor, onde elas ficarão umas sobre as outras na vertical. De quantas maneiras distintas eu poderei formar esta coluna de bolas? ( 10 )Neste caso de permutação com elementos repetidos temos um total de 10 bolas de quatro cores diferentes. Segundo a repetição das cores, devemos calcular P (4, 3, 2): Então: Eu poderei formar esta coluna de bolas de 12600 maneiras diferentes. Combinação com Repetição Todos os elementos podem aparecer repetidos em cada grupo até p vezes. Fórmula: Cr(m,p)=C(m+p-1,p) Exemplos: 1) De quantos modos podemos comprar 4 salgadinhos em uma lanchonete que oferece 7 opções de escolha de salgadinhos? R: 210 2) Podendo escolher entre 5 tipos de queijo e 4 marcas de vinho, de quantos modos é possível fazer um pedido num restaurante, com dois queijos e 3 garrafas de vinho? R = 300 Exercícios 41-) Joga-se uma vez: um dado equilibrado, determine a probabilidade de obter: a) Um 6 b) 5 ou 6 ou 7 c) Um número par d) Um número menor que quatro 42-) Há 50 bolas numa urna, distribuídas da seguinte maneira: 20 azuis, 15 vermelhas, 10 laranjas e 5 verdes. Misturaram-se as bolas e escolhe-se uma. Determine a probabilidade de a bola escolhida ser: a) Verde b) Azul c) Azul ou verde d) Não vermelha e) Vermelha ou verde f) Amarela g) Não amarela 43-) Um baralho tem 52 cartas divididas igualmente entre 4 naipes: ouros, copas, paus e espadas. Os naipes paus e espadas são de cor preta. Os naipes de ouros e copas de cor vermelha. Cada naipe possui 13 cartas: A (ás),2,3,4,5,6,7,8,9,10, J (valete),Q(dama) e K(rei). Extrai-se uma só carta de um baralho de 52 cartas. Determine a probabilidade de obter: a) Um valete b) Uma figura c) Uma carta vermelha d) Uma carta de ouros e) Um dez de paus f) Um nove vermelho ou um oito preto g) Um nove ou um valete h) Uma carta de ouros ou uma dama 44-) (BRDE/01) Observa-se que 10% dos projetos que chegam a uma agência de financiamento apresentam informações incorretas. Qual a probabilidade de que, de três projetos escolhidos aleatoriamente, nenhum deles apresente informação incorreta? a) Zero b) 0,001 c) 0,270 d) 0,300 e) 0,729 45-) (TCE-RS/12) Segundo o controle de qualidade de uma empresa, a probabilidade do seu produto apresentar falha é de 0,10. Três pessoas compram o produto. A probabilidade de somente duas dessas pessoas terem comprado o produto com falha é: a) 0,001 b) 0,009 c) 0,027 d) 0,243 e) 0,810 46-) Lança-se uma moeda 5 vezes, qual a probabilidade de ocorrer 3 caras e duas coroas? a) 31,25% b) 25% c) 40% d) 37,50% e) 50% 47-) Dentre doze candidatos que participaram de um teste, quatro reprovaram. Se três dos candidatos fossem selecionados, aleatoriamente, um após o outro, qual a probabilidade de que todos esses alunos tivessem sido aprovados? a) 14/55 b) 8/55 c) 8/27 d) 27/55 e) 16/27 48-) Um juiz deve analisar 12 processos de reclamações trabalhistas, sendo 4 de médicos, 5 de professores e 3 de bancários. Considere que inicialmente, o juiz selecione aleatoriamente um grupo de 3 processos para serem analisados. Com base nessas informações, assinale a alternativa do valor mais próximo da probabilidade de que, nesse grupo: I- Todos os processos sejam de bancários a) 1,25% b) 0,45% c) 25% d) 7,5% e) 12,5% II- Pelo menos um dos processos seja de professor a) 16% b) 54% c) 84% d) 75% e) 44% 49-) (UFRJ) Para testar a eficácia de uma campanha de anúncio do lançamento de um novo sabão S, uma agência de propaganda realizou uma pesquisa com 2000 pessoas. Por uma falha da equipe, a agência omitiu os dados dos campos x,y,z e w no seu relatório sobre a pesquisa, conforme mostra a tabela abaixo: Número de pessoas que: Adquiriram S Não adquiriram S Total Viram o anúncio x y 1500 Não viram o anúncio 200 z 500 Total 600 w 2000 Suponha que uma dessas 2000 pessoas entrevistadas seja escolhida ao acaso e que todas as pessoas tenham a mesma probabilidade de serem escolhidas. Determine a probabilidade de que essa pessoa tenha visto o anúncio da campanha e adquirido o sabão S. 50-) No lançamento simultâneo de dois dados, qual a probabilidade de: a) Se obter soma 8? b) Ocorrer soma 12? c) Ocorrer soma 1? GABARITO 41) a) 1/6 b) 1/3 c) 1 /2 d) 1 /2 42) a) 1/10 b) 2/5 c) 1 /2 d) 7/10 e) 2/5 f) 0 g) 1 43) a) 1/13 b) 3/13 c) 1 /2 d) 1 /4 e) 1/52 f) 1/13 g) 2/13 h) 4/13 44) E 45) C 46) A 47) A 48) I: B II: C 49) 1/5 50) a) 5/36 b) 1/36 c) 0 10.4 PROBABILIDADE CONDICIONAL (TEOREMA DE BAYES) Seja E um espaço amostral finito e não-vazio e A um evento não-vazio de E. Suponhamos que o evento A tenho ocorrido e que queiramos saber qual a probabilidade de ocorrer um outro evento B não-vazio de E. Essa nova probabilidade é indicada por P(B│A) e dizemos que ela é “a probabilidade de B condicionada ao fato de que A já ocorreu”, ou simplesmente, que é a probabilidade condicional de B em relação a A. Temos, nesse caso, uma mudança do espaço amostral. A probabilidade de B será em relação ao espaço amostral A e o elemento procurado de B deverá pertencer a B∩A; portanto, a nova probabilidade é: ( P(B│A) = P(B∩A) P(A) ) Por outro lado, P(B│A) = P(B∩A) P(B∩A) = P(A) . P(B│A) P(A) Como B∩A = A∩B, então P(A∩B) = P(B) . P(A│B) Podemos escrever então: ( P(A∩B) = P(B) . P(A│B) = P(A) . P(B│A) ) Exemplos: 1-) Uma urna contém 8 bolas amarelas e 6 bolas verdes. Qual é a probabilidade de retirarmos 2 bolas sucessivamente, sem reposição, sendo a primeira verde e a segunda amarela? P(V) = 6/14 = 3/7 P(A│V) = 8/13 Logo, P(V∩A) = P(V) . P(A│V) = (3/7) . (8/13) = 24/91 2-) Retira-se, ao acaso, um valete de um baralho comum, de 52 cartas. Sem reposição da carta extraída, qual é a probabilidade de, numa segunda retirada, sair outro valete? P(A)= 4/52 = 1/13 P(B│A) = 3/51 = 1/17 Logo, P(A∩B) = P(A) . P(B│A) = (1/13) . (1/17) = 1/221 Exercícios: 51-) (TCE-RS/12) Dois professores corrigem a prova de redação de um concurso público. O professor A corrige o dobro de provas do que o professor B. Sabe-se que 60% das provas corrigidas pelo professor A tiveram nota superior a 7, enquanto apenas 20% das provas corrigidas pelo professor B tiveram nota superior a 7. Se um candidato teve conceito não superior a 7, a probabilidade de sua prova ter sido corrigida pelo professor A é: a) 0,85571 b) 0,75000 c) 0,33333 d) 0,50000 e) 0,25000 52-) Os arquivos levantados pelo censo da cidade A em 1998 revelaram que, apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150, enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a porcentagem dos homens nessa população. Um pesquisador do censo, acaba de se encontrar com uma pessoa com QI acima de 150. Calcule a probabilidade desta pessoa ser do sexo feminino. a) 70% b) 18% c) 28% d) 46% e) 72% 53-) Os arquivos levantados pelo censo da cidade A em 1998 revelaram que, apenas 20% dos homens possuem QI (coeficiente de inteligência) acima de 150, enquanto que essa incidência nas mulheres é de 70%. Estima-se em 90% a porcentagem dos homens nessa população. Calcule a probabilidade de sortear uma pessoa do sexo feminino com QI acima de 150. a) 70% b) 18% c) 28% d) 46% e) 72% 54-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves, enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o cinto. A polícia acaba de ser chamada para investigar um acidente em que houve um indivíduo gravemente ferido. Calcule a probabilidade de ela estar usando o cinto no momento do acidente. a) 18% b) 14% c) 56,25% d) 43,75% e) 72% 55-) A probabilidade de Márcio chegar em casa tarde para jantar é 25%. Por outro lado, a probabilidade do jantar atrasar é 10%. Se não há qualquer relacionamento entre os atrasos de Márcio e os atrasos do jantar, qual a probabilidade de ocorrerem ambos os atrasos? a) 25% b) 10% c) 3% d) 5% e) 2,50% 56-) Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam cinto de segurança, apenas 20% sofrem ferimentos graves, enquanto que essa incidência é de 70% entre as vítimas que não utilizam o cinto de segurança. Estima-se em 90% a porcentagem dos motoristas que usam o cinto. Calcule a probabilidade de um indivíduo estar usando o cinto no momento do acidente e ficar gravemente ferido. a) 18% b) 14% c) 56,25% d) 43,75% e) 72% 57-) Uma grande empresa possui dois departamentos: um de artigos femininos e outro de artigos masculinos. Para o corrente ano fiscal, o diretor da empresa estima que as probabilidades de os departamentos de artigos femininos e masculinos obterem uma margem de lucro de 10% são iguais a 30% e 20% respectivamente. Além disso, ele estima em 5,1% a probabilidade de ambos os departamentos obterem uma margem de lucro de 10%. No final do ano fiscal, o diretor verificou que o departamento de artigos femininos obteve uma margem de lucro de 10%. Desse modo, a probabilidade de o departamento de artigos masculinos ter atingido a margem de lucro de 10% é igual a: a) 17% b) 20% c) 25% d) 24% e) 30% 58-) Uma companhia preocupada coma sua produtividade costuma oferecer cursos de treinamento a seus operários. A partir da experiência, verificou-se que um operário, recentemente admitido, que tenha frequentado o curso de treinamento te 82% de probabilidade de cumprir sua quota de produção. Por outro lado, um operário, também recentemente admitido, que não tenha frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade de cumprir com sua quota de produção. Dos operários recentemente admitidos, 80% frequentaram o curso de treinamento. Selecionando-se, aleatoriamente, um operário recentemente admitido na companhia, a probabilidade de que ele não cumpra sua quota de produção é: a) 11,70% b) 27,40% c) 35% d) 83% e) 85% 59-) Uma companhia preocupada coma sua produtividade costuma oferecer cursos de treinamento a seus operários. A partir da experiência, verificou-se que um operário, recentemente admitido, que tenha frequentado o curso de treinamento te 82% de probabilidade de cumprir sua quota de produção. Por outro lado, um operário, também recentemente admitido, que não tenha frequentado o mesmo curso de treinamento, tem apenas 35% de probabilidade de cumprir com sua quota de produção. Dos operários recentemente admitidos, 80% frequentaram o curso de treinamento. O presidente da companhia acaba de se encontrar com um operário recentemente admitido que cumpriu sua cota de produção. Calcule a probabilidade de que ele não tenha frequentado o curso de treinamento. a) 9,64% b) 65,60% c) 7,50% d) 73,70% e) 85,70% 60-) Os arquivos levantados pelo censo da cidade de São Paulo em 1998 revelaram que, apenas 40% das mulheres possuem casa própria, enquanto que essa incidência nos homens é de 80%. Estima-se em 70% a porcentagem das mulheres nessa população. Um pesquisador do censo de 1998 de São Paulo, acaba de se encontrar com uma pessoa que possui casa própria. Calcule a probabilidade aproximadamente desta pessoa ser do sexo feminino. a) 18,4% b) 24% c) 28% d) 52% e) 53,8% GABARITO 51) D 52) C 53) A 54) E 55) E 56) A 57) A 58) B 59) A 60) E Distribuição As distribuições são modelos matemáticos que tem por objetivo resolver certos problemas probabilísticos. As principais distribuições são as seguintes: 1) Distribuição Binomial 2) Distribuição Multinomial variáveis descontínuas 3) Distribuição Hipergeométrica (no ponto) 4) Distribuição de Poisson 5) Distribuição Normal variável contínua (no intervalo) 1. Distribuição Binomial Se p é a probabilidade de um evento acontecer em uma tentativa única (denominada probabilidade de um sucesso) e q = 1 – p é a de que o evento não ocorra em qualquer tentativa única (denominada probabilidade de insucesso), então a probabilidade do evento ocorrer exatamente X vezes, em N tentativas (isto é, de que haja X sucessos e N – X insucessos), é dada por: ( P (X) = ∁ N,X .p X . q N-X ) ( ∁ N,X = N!_ X! . (N-X)! ) Exemplo: A probabilidade de obter exatamente 2 caras em 6 lances de moeda não viciada é: Solução: n = 2 P(2) = ∁ 6,2 .(1/2)2. (1/2)6-2 P(2) = 6! . . (1/4).(1/16) P(2) = 15/64 P(2) = 23,44% 2! . 4! Exercícios de sala: 1) Jogando-se um dado 3 vezes, qual a probabilidade de se obter a face 5, apenas uma vez? 34,72% 2) A probabilidade de obter ao menos 4 caras em 6 lances de uma moeda não viciada é: 34,38% 3) A probabilidade de que um presumível cliente aleatoriamente escolhido faça uma compra é de 20%. Se um vendedor visita 6 presumíveis clientes, a probabilidade de que ele fará exatamente 4 vendas será igual a: 1,54% 4) Devido as altas taxas de juros, uma firma informa que 30% de suas contas a receber encontram-se vencidas. Se um contador escolhe aleatoriamente uma amostra de 5 contas, determinar a probabilidade de cada um dos dos seguintes eventos: a) Nenhuma das contas está vencida. 16,81% b) Exatamente 2 contas estão vencidas. 30,8% c) A maioria das contas estão vencidas. 16,31% d) Exatamente 20% das contas estão vencidas. 36,01% Exercícios do trabalho. 1) Sorteando-se uma família com 5 crianças. Determinar a probabilidade de que ela esteja composta por: a) Exatamente um menino. 15,63% b) No máximo 1 menino. 18,75% c) No mínimo 1 menino. 96,88% d) Ao menos duas meninas. 81,25% 2) Na venda de um certo produto tem-se 2 opções: a) Cobrar R$ 1,00 por peça, sem inspeção; b) Classificar o lote em produto de primeira e de segunda, mediante a seguinte inspeção: retiramos 5 peças do lote e se não encontrarmos mais que uma defeituosa, o lote será de primeira qualidade; sendo de segunda qualidade o lote que não satisfizer tal condição. O preço de venda é R$ 1,20 por peça do lote de primeira e R$ 0,80 por peça do lote de segunda. Sabendo-se que cerca de 10% das peças produzidas são defeituosas, analisar qual das duas opções é a mais vantajosa para o vendedor. R: segunda opção é mais vantajosa para o vendedor. 3) Em uma prova de múltipla escolha, com 5 opções das quais só uma é verdadeira. Calcule a chance de um aluno acertar 3 das 25 questões, sabendo-se que o mesmo nada sabe do assunto. 13,57% Algumas Propriedades da Distribuição Binomial MÉDIA µ = N.p VARIÂNCIA N.p.q DESVIO PADRÃO √N.p.q No problema anterior,
Compartilhar