Baixe o app para aproveitar ainda mais
Prévia do material em texto
Manual de Estatística Aplicada à Administração Pública Universidade Católica de Moçambique Centro de Ensino á Distância Direitos de autor Todos os direitos dos autores deste módulo estão reservados. A reprodução, a locação, a fotocópia e venda deste manual, sem autorização prévia da UCM-CED, são passíveis a procedimentos judiciais. Elaborado por: Luís Cipriano Herculano Quepe, Natural da Beira – Sofala, Doutorando em Filosofia de Negócios, terminou o curso de Mestrado em Economia e Gestão na Universidade Católica de Moçambique, Faculdade de Economia e Gestão Beira em 2007 Trabalha como Coordenador do Curso de Economia e Gestão, docente de Métodos Quantitativos na Faculdade de Economia e Gestão - Beira da Universidade Católica de Moçambique. Universidade Católica de Moçambique Centro de Ensino à Distância 825018440 23311718 Moçambique Fax: 23326406 E-mail: eddistsofala@ucm.ac.mz Agradecimentos Agradeço a colaboração dos seguintes indivíduos e/ou pessoa colectiva na elaboração deste manual: Por ter financiado a elaboração deste Módulo Ao Centro de Ensino à Distância da UCM. Pela avaliação/revisão do Conteúdo Ao Fernando Alfredo Muchanga. / Universidade Católica de Moçambique i Índice Visão geral 1 Bem-vindo a Estatística Aplicada .................................................................................. 1 Objectivos do curso ....................................................................................................... 1 Quem deveria estudar este módulo ................................................................................ 1 Como está estruturado este módulo................................................................................ 2 Ícones de actividade ...................................................................................................... 2 Habilidades de estudo .................................................................................................... 3 Precisa de apoio? ........................................................................................................... 3 Unidade 01 5 Estatística - Introdução .................................................................................................. 5 Introdução ............................................................................................................ 5 Estatística - conceito ...................................................................................................... 5 É uma disciplina cujo objecto de estudo é a recolha, compilação, análise e interpretação de dados. 5 Divide-se em dois grandes grupos: 5 Estatística Descritiva e 5 Estatística Indutiva ou Inferência Estatística. 5 Estatística Descritiva ............................................................................................ 5 Estatística Indutiva ou Inferência Estatística ......................................................... 5 População ou Universo ......................................................................................... 5 Censo ................................................................................................................... 6 Amostra ............................................................................................................... 6 Variável ............................................................................................................... 6 Classificação das variáveis ............................................................................................ 7 Variáveis Quantitativas ........................................................................................ 7 Variável quantitativa de rácio ............................................................................... 7 Variável quantitativa de intervalo ......................................................................... 7 Variável quantitativa discreta ou contínua ............................................................ 8 Variáveis Qualitativas .......................................................................................... 8 Variável qualitativa ordinal .................................................................................. 8 Variável qualitativa nominativa ............................................................................ 8 Unidade 02 9 Processo de amostragem ................................................................................................ 9 Introdução ............................................................................................................ 9 2.1.0. Processo de amostragem ...................................................................................... 9 Amostragem ......................................................................................................... 9 ii Índice Objectivo geral na extracção de uma amostra ....................................................... 9 Amostra com reposição ........................................................................................ 9 Amostra sem reposição ....................................................................................... 10 Métodos de Amostragem .................................................................................... 10 Amostragem Aleatória........................................................................................ 10 Amostragem Aleatória Simples .......................................................................... 10 Amostragem Aleatória Sistemática ..................................................................... 10 Amostragem Aleatória Estratificada ................................................................... 11 Amostragem não Aleatória ................................................................................. 11 Tipos de Amostras não Aleatória ........................................................................ 11 Tamanho de amostra .......................................................................................... 11 Tarefas 01 .......................................................................................................... 13 Unidade 03 15 Representação de Dados Estatístico. Intervalos entre classes. ...................................... 15 Introdução .......................................................................................................... 15 3.1.0. Representação de dados Estatísticos ................................................................... 16 Dados Brutos ...................................................................................................... 16 São aqueles que ainda não foram numericamente organizados. Exemplo: Conjunto das alturas de 100 estudantes do sexo masculino tirado de uma lista alfabética do registo da universidade;16 Dados Agrupados ............................................................................................... 16 São dados organizados e resumidos em forma de intervalos. 16 Rol ..................................................................................................................... 16 É um arranjo de dados numéricos brutos por ordem crescente ou decrescente de grandeza. 16 Amplitude Total ................................................................................................. 16 Frequência Absoluta (Fi) .................................................................................... 16 Frequência Relativa (Fr) .....................................................................................17 Frequência Relativa Percentual (fr) ..................................................................... 17 Frequência Acumulada (fa) ................................................................................. 17 Distribuição de frequência .................................................................................. 17 Quadro de frequências ou tabela de frequências. .......................................................... 18 Dados não agrupados .......................................................................................... 19 Dados agrupados ................................................................................................ 19 Intervalos de classes .................................................................................................... 20 Intervalo de Classe é um símbolo que define uma classe, como 81 - 100 da tabela anterior. .............................................................................................................. 20 Os números extremos, 81 e 100, são denominados limites de classe. O número menor, 81, é o limite inferior da classe e o maior, 100 é o limite superior. .......... 20 Limite real Superior de classe é obtido adicionando-se o limite superior de um intervalo de classe ao limite inferior da classe seguinte e dividindo-se a soma por 2. ........................................................................................................................ 20 Regras gerais para elaborar uma distribuição de frequências ............................... 21 / Universidade Católica de Moçambique iii Unidade 04 22 Representação gráfica de Dados Estatístico. ................................................................ 22 Introdução .......................................................................................................... 22 Tipos de representações gráficas de dados ................................................................... 22 Representação Stem-and-Leaf (folhas e caule) .................................................... 22 Representação por meio de diagrama de barras ................................................... 23 Representação por meio de diagrama circular ..................................................... 24 Representação por meio de polígono de frequências ........................................... 25 Representação gráfica das frequências acumuladas ............................................. 25 Representação por meio de Histograma .............................................................. 26 Histograma com amplitudes iguais ..................................................................... 26 Histograma com amplitudes diferentes ............................................................... 27 Polígono de frequência para dados agrupados ..................................................... 27 Polígono de frequência acumuladas .................................................................... 27 Curvas de frequências......................................................................................... 28 Tarefas 02 .......................................................................................................... 29 Unidade 05 33 Medidas de tendência central ....................................................................................... 33 Introdução .......................................................................................................... 33 Medidas de tendência central ....................................................................................... 33 A Média para dados não agrupados .................................................................... 33 A Média para dados não agrupados com frequências absoluta ............................ 34 A Média para dados agrupados ........................................................................... 35 Propriedades da média ........................................................................................ 35 Mediana para dados não agrupados .................................................................... 35 Mediana para dados agrupados ........................................................................... 36 Moda para dados não agrupados ......................................................................... 37 Moda para dados agrupados ............................................................................... 38 Relação média, mediana e moda .................................................................................. 38 Tarefas 03 .......................................................................................................... 39 Unidade 06 43 Medidas de dispersão .................................................................................................. 43 Introdução .......................................................................................................... 43 Medidas de dispersão .................................................................................................. 43 Variação ou dispersão......................................................................................... 43 Amplitude total .................................................................................................. 43 Desvio médio ..................................................................................................... 44 A Variância ........................................................................................................ 44 Desvio padrão .................................................................................................... 45 Coeficiente de variação ...................................................................................... 47 Tarefas 04 .......................................................................................................... 48 iv Índice Unidade 07 53 Teorias de probabilidades ............................................................................................ 53 Introdução .......................................................................................................... 53 Introdução as teorias de probabilidades........................................................................ 53 Experiência ........................................................................................................ 54 Espaço Amostral ................................................................................................ 54 Eventos .............................................................................................................. 55 Definição de Probabilidades ........................................................................................ 55 Teoria Clássica das Probabilidades ..................................................................... 55 Limitações da definição clássica das probabilidades ........................................... 56 Definição Frequencista de probabilidades ........................................................... 57 Definição Subjectiva de probabilidades .............................................................. 57 Propriedades das probabilidades ......................................................................... 58 Probabilidade Condicional.................................................................................. 58 Regra da Multiplicação das probabilidades ......................................................... 59 Eventos Independentes ....................................................................................... 59 Tarefas 05 .......................................................................................................... 61 Unidade 08 65 Variáveis aleatorias discretas (VAD) e Distribuição Binomial ..................................... 65 Introdução ..........................................................................................................65 Variável aleatória ........................................................................................................ 65 Variáveis Aleatórias Discretas ............................................................................ 65 Função densidade da variável aleatória x ............................................................ 66 Propriedades da Média e Variância ..................................................................... 68 Experimento Binomial ................................................................................................. 68 gTarefas 06 ........................................................................................................ 70 Unidade 09 74 Variáveis aleatorias continuas ...................................................................................... 74 Introdução .......................................................................................................... 74 Variável aleatória Contínua ......................................................................................... 74 Distribuição de probabilidade continua ............................................................... 74 Propriedades da função densidades da probabilidade .......................................... 74 Valor Esperado e Desvio padrão de v.a.c. ........................................................... 75 Distribuição normal ou curva normal ........................................................................... 76 Característica da distribuição normal .................................................................. 76 Propriedades das probabilidades ......................................................................... 78 Tarefas 07 .......................................................................................................... 80 Visão geral Bem-vindo a Estatística Aplicada Neste módulo procura-se em primeiro lugar familiarizar os estudantes apresentando tarefas e suas respectivas resoluções que na sua maioria serão acompanhadas pelas respectivas explicações o que facilitará ao estudante perceber como é que se chegou a uma determinada solução da tarefa. Objectivos do curso Quando terminar o estudo de Estatística Aplicada será capaz de: Objectivos Interpretar e usar correctamente os conceitos básicos da estatística; Aplicar a fórmula de Yamane na extracção de uma amonstra; Distinguir os dados estatístico quanto ao tipo e determinar as respectivas frenquencias; Usar a representação gráfica e tabular de frequências; Usar as medidas de tendência Central e de dispersão de uma amostra para estudar o comportamento de uma população; Usar a definição frequencista e clássica para determinar a probabilidade da ocorrencia de um acontecimento; Determinar a probabilidade da ocorrencia de um acontecimento em variáveis discretas ou contínuas; Quem deveria estudar este módulo Este Módulo foi concebido para todos aqueles que terminar as cadeiras curriculares do 1ºano do curso de Administração Pública com maior destaque para a cadeira de Matemática. 2 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Como está estruturado este módulo Todos os módulos dos cursos produzidos por UCM - CED encontram-se estruturados da seguinte maneira: Páginas introdutórias Um índice completo. Uma visão geral detalhada do módulo, resumindo os aspectos-chave que você precisa conhecer para completar o estudo. Recomendamos vivamente que leia esta secção com atenção antes de começar o seu estudo. Conteúdo do módulo O módulo está estruturado em unidades. Cada unidade incluirá uma introdução, objectivos da unidade, conteúdo da unidade incluindo actividades de aprendizagem. Outros recursos Para quem esteja interessado em aprender mais, apresentamos uma lista de recursos adicionais para você explorar. Estes recursos que inclui livros, artigos ou sites na internet podem serem encontrados na pagina de referencias bibliográficas. Tarefas de avaliação e/ou Auto-avaliação Tarefas de avaliação para este módulo encontram-se no final de três ou quatro unidades. Sempre que necessário, inclui-se na apresentação dos conteúdos algumas actividades auxiliares que irão lhe ajudar a perceber a exposição dos restantes conteúdos. Comentários e sugestões Esta é a sua oportunidade para nos dar sugestões e fazer comentários sobre a estrutura e o conteúdo do módulo. Os seus comentários serão úteis para nos ajudar a avaliar e melhorar este módulo. Ícones de actividade Ao longo deste manual irá encontrar uma série de ícones nas margens das folhas. Estes ícones servem para identificar diferentes partes do processo de aprendizagem. Podem indicar uma parcela específica de texto, uma nova actividade ou tarefa, uma mudança de actividade, etc. Neste módulo destacamos particularmente a marca ( ) que foi usada para indicar as tarefas auxiliares que ajudarao-te a perceber os conteudos expostos. Habilidades de estudo Para suceder-se bem neste módulo precisará de um pouco mais da sua dedicação e concentração. A maior dica para alcançar o sucesso é não ignorar os textos que são apresentados como explicação para se chegar a solução da tarefa. Precisa de apoio? Em caso de dúvidas ou mesmo dificuldades na percepção dos conteúdos ou resolução das tarefas procure contactar o seu professor/tutor da cadeira ou ainda a coordenação do curso acessando a plataforma da UCM-CED Curso de Licenciatura em Administração Pública. Unidade 01 Estatística - Introdução Introdução Nesta unidade pretende-se dar a noção do conceito da estatística como ciência e a sua subdivisão. Tambem vai-se proceder a classificação das variáveis quanto a natureza. Estatística - conceito É uma disciplina cujo objecto de estudo é a recolha, compilação, análise e interpretação de dados. Divide-se em dois grandes grupos: Estatística Descritiva e Estatística Indutiva ou Inferência Estatística. Estatística Descritiva É o ramo da estatística que procura somente descrever os aspectos importantes de um conjunto de elementos. Estatística Indutiva ou Inferência Estatística É o ramo da estatística que consiste no uso das características de uma amostra para fazer generalizações sobre as características da população onde se obteve tal amostra. População ou Universo É o conjunto de elementos sobre o qual incide o estudo estatístico; a população deve ser definida claramente e em termos daquilo que se pretende conhecer. 6 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Censo É o estudo de todos os elementos de uma população. Amostra É um subconjunto finito da população (razões para escolha de uma amostra: dimensão excessiva da população, economia e tempo). Variável É a característica estatística que se observa ou se estuda nos elementos da população; Exemplos 1.1 1. O gestor de produção de uma fábrica pretende ter uma ideia da percentagem de peças defeituosas que a fábrica produz em determinado período de tempo. A população em estudo é constituída por todas as peças produzidas pela fábrica durante aquele período. Exemplos 1.2 2. Num estudo de mercado para construção de um centro comercial, interessa estudar o rendimento familiar mensal dos habitantes de uma certa cidade. A população é constituída pelas famílias daquela cidade e; A variável ou característica estatística é o rendimento familiar mensal. Exemplos 1.3 3. Uma determinada empresa pretende realizar um inquérito aos seus trabalhadores, onde lhes é pedido para classificarem a qualidade de serviço do centro social, segundo a seguinte escala: fraco, razoável, bom ou muito bom. Os trabalhadores da empresa constituem a população em estudo,a característica estatística é a opinião acerca da qualidade de serviço do centro social. Classificação das variáveis Conforme a natureza dos dados as variáveis podem ser: Quantitativas ou Qualitativas. Variáveis Quantitativas São as que podem assumir valores numéricos que representam quantidade. Há dois tipos de variáveis quantitativas: Rácio e Intervalo. Variável quantitativa de rácio É uma variável quantitativa medida numa escala, tal que se pode estabelecer rácios entre os seus valores com algum significado e está definido o valor zero. Exemplo: Em cada dez moçambicanas uma é contabilista. Variável quantitativa de intervalo É uma variável quantitativa na qual rácios não têm qualquer significado. Exemplo: A temperatura (em graus centigrados) é uma variável de intervalo. Não faz sentido dizer que uma temperatura de 60ºC corresponde ao dobro de aquecimento em relação a temperatura de 30ºC. E uma temperatura de 0ºC, não significa que não houve temperatura. Ainda sobre variáveis quantitativas, podemos classifica-las em Discretas ou Contínuas. 8 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Variável quantitativa discreta ou contínua Uma variável que pode assumir teoricamente qualquer valor entre dois dados, chama-se variável contínua; de outro modo denomina-se variável discreta. Exemplos 1. O número de crianças, em uma família, que pode assumir qualquer um dos valores 0, 1,2,3,...., mas não pode ser 2.5 ou 3.4582! por isso é uma variável discreta. 2. A altura de um individuo que pode ser 1.65 metros, 1.6662,... conforme a precisão da medida, é uma variável contínua. Variáveis Qualitativas São aquelas que expressam qualidade das características estatísticas. Exemplo: A qualidade de serviço prestado por um centro social. Há dois tipos de variáveis qualitativas: Ordinal e Nominativa. Variável qualitativa ordinal É uma variável qualitativa na qual a ordem e o ranking das categorias fazem sentido. Exemplo, Estudantes podem ser solicitados a avaliar a efectividade dos professores, ordenando nas categorias de, excelente, bom, médio ou mau. Aqui uma categoria é superior que a categoria imediatamente a seguir. Variável qualitativa nominativa É a variável qualitativa na qual a ordem não faz qualquer sentido. Por exemplo, estado civil Solteiro, casado, divorciado, viúvo Unidade 02 Processo de amostragem Introdução Nesta unidade vamos aprender os diferentes processos de estratificaçao de uma amonstra. Tambem iremos estudar as vantagens de cada um dos processos na avaliaçao do comportamento de uma determinada populaçao. Objectivos No fim desta unidade deves ser capaz de: Saber a intenção de extracção de uma amostra; Distinguir os processos de amostragem e conhecer as vantagens de cada um deles. 2.1.0. Processo de amostragem Amostragem É o processo de selecção de uma amostra a ser pesquisada. Objectivo geral na extracção de uma amostra Obter uma representação “honesta” da população que conduza a estimativas das características da população com “boa” precisão relativamente aos custos de amostragem, isto é, obter uma amostra representativa da população. A amostra pode ser com ou sem reposição: Amostra com reposição Em que cada elemento da população pode ser escolhido mais de uma vez. 10 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Amostra sem reposição Se cada elemento da população não pode ser escolhido mais de uma vez. Amostra sem reposição é melhor, porque dá-nos uma visão mais clara da população. Métodos de Amostragem Existem dois grandes grupos de métodos para seleccionar amostras: Os Métodos aleatórios também chamado Amostragem Aleatória e; Os métodos não aleatórios ou Amostragem não Aleatória. Amostragem Aleatória É caracterizada por todos os elementos da população poderem ser seleccionados de acordo com uma probabilidade pré-definida e em que se podem avaliar objectivamente as estimativas das propriedades da população obtidas a partir da amostra. Métodos de amostragem aleatórias: Amostragem aleatória simples, Amostragem sistemática e Amostragem estratificada. Amostragem Aleatória Simples De um modo geral para seleccionarmos uma amostra aleatória devemos ter em primeiro, a lista ou quadro completo de todas as unidades da população. Isto para facilitar a enumeração da população. Este tipo de amostra é muito dispendioso, e muitas vezes impraticável por exigir a listagem e enumeração de toda a população, daí ser poucas vezes adoptado. Mas se a população for pequena ou se existirem listas com elementos da população, este método mostra-se ser bastante útil. Exemplo da selecção de 2 trabalhadores entre 15 (anexo). Amostragem Aleatória Sistemática Quando não é possível enumerar as unidades da população, neste caso escolhe-se todos os n múltiplos membros. Amostragem Aleatória Estratificada Quando dividimos a população em subgrupos ou extractos específicos diferentes uns dos outros, mas que juntos formam a população. Exemplo 1.3: Estratificação Uma certa empresa é composto por 320 motoristas, 80 ajudantes e 40 mecânicos. Pretendemos seleccionar uma comissão de 11 trabalhadores de modo a obter a representatividade de todos os trabalhadores da empresa. Amostragem não Aleatória É um método de carácter pragmático ou intuitivo. Uma clara inconveniência deste método é o facto da inclusão de um elemento da população na amostra ser determinado por um critério subjectivo, normalmente uma opinião pessoal; um outro incoveniente é que existe elementos da população que não têm possibilidade de ser escolhidas. Tipos de Amostras não Aleatória Amostra intencional; Amostra por quotas; Amostra por conveniência Amostra “snowball” Tamanho de amostra Fórmulas de extracção de amostra (Yamane, 1967) Para determinar o tamanho da amostra, podemos usar a fórmula geral de Yamane (1967). N – Número total da população n – Tamanho da amostra e – Nível de significância 21 eN Nn 12 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Maior tamanho da população, menor percentagem da população necessita se para ter um tamanho da amostra representativo. Tarefas 01 1. Defina a População. De quatro exemplos de população que poderá ser estudado em uma pesquisa. 2. Abaixo apresenta-se uma lista de variáveis. Indica quais são as Variáveis Qualitativas e as Quantitativas justificando a sua resposta. Valor monetário indicado na factura de uma certa empresa; O lucro líquido da empresa Mcel em 2007: O mercado de acções onde uma empresa negocia as suas acções; A dívida externa de Moçambique; O meio de comunicação usado por uma empresa para publicidade de um produto; A taxa de inflação média de 2007. 3. Indique quais das seguintes variáveis são Discretas ou Continuas: Números de acções vendidas diariamente na bolsa de valores de Moçambique; Vida média das válvulas de televisão produzidas por uma determinada companhia; Comprimentos de 100 parafusos produzidos por uma fábrica; As cores dos autocarros da Transportes Públicos Beira; A altura média dos estudantes da UCM – CED; Número de sapato do Sr. Caetano. 4. Explica o significado de cada um dos seguintes termos: Estatística Descritiva; Inferência Estatística; Amostra; Censo; Amostragem com reposição; Amostragem estratificada. 5. Explica com um exemplo prático porque a amostragem sem reposição é preferível do que a amostragem com reposição? 14 Módulo de Estatística AplicadaBeira, Janeiro de 2012 6. Suponha que pretende elaborar uma pesquisa na cidade da Beira, com o tema: Impacto sócio económico das Micro finanças no sector Informal, durante 2005 - 2007. Diga qual seria a fórmula apropriada para extracção do tamanho da amostra? Porque? e diga os passos para esta pesquisa. 7. Os estudantes da UCM – CED, pretendem conduzir uma pesquisa com o tema Impacto de micro crédito no sector informal, eles apresentaram uma população de 1276 vendedores que beneficiaram de crédito fornecidos pelos Bancos Procredit e a Socremo, respectivamente, para a representatividade da sua amostra consideram ao 5% de nível de significância. Usando a regra de Yamane (1967), determina o tamanho da amostra? 8. A MOZILIMPA apresentou a seguinte relação dos trabalhadores em sector de actividades. Sector de actividades Número de trabalhadores Recursos Humanos 34 Financeiro 67 Produção 452 Administração 134 Total 687 Calcule o tamanho de amostra na abordagem de Yamane (1967), considerando o nível de significância de 5%. Qual será o processo de amostragem de modo a obedecer a representatividade da população e efectua a amostragem. 9. Segundo o Instituto Nacional de Estatística, o censo de 2005 apresentou 13987 famílias na cidade da Beira. Os estudantes da UCM – CED curso de Administração Pública, pretendem analisar o rendimento médio das famílias nesta cidade, qual será a amostra representativa, dando o nível de significância de 5%. Unidade 03 Representação de Dados Estatístico. Intervalos entre classes. Introdução Nesta unidade teremos a chance de aprender a encontrar a amplitude e frequencias de dados agrupados e não agrupados. Ainda nesta unidade vamos determinar os limites inferior e superior de uma determinada classe assim como usar a regra prática para determinaçao do numero de classes. Objectivos No fim desta unidade deves ser capaz de: Distinguir dados agrupados de nao agrupados; Determinar a amplitude total dentro de um rol de dados. Calcular as frequencias de dados estatístico e a sua respectiva distribuição. Determinar os limites superior e inferior de uma classe de intervalos assim como ponto médio. 16 Módulo de Estatística Aplicada Beira, Janeiro de 2012 3.1.0. Representação de dados Estatísticos Dados Brutos São aqueles que ainda não foram numericamente organizados. Exemplo: Conjunto das alturas de 100 estudantes do sexo masculino tirado de uma lista alfabética do registo da universidade; Dados Agrupados São dados organizados e resumidos em forma de intervalos. Rol É um arranjo de dados numéricos brutos por ordem crescente ou decrescente de grandeza. Amplitude Total É a diferença entre o maior e o menor número do rol. Exemplo: Consideremos os seguintes dados 1, 5,4,1,3,2,2,1 Dados Brutos 1, 1, 1, 2, 2, 3, 4, 5 Rol 5 - 1 = 4 Amplitude Total Frequência Absoluta (Fi) é o número de vezes que um sucesso (evento) acontece. n nF ii Frequência Relativa (Fr) é a proporção do número de sucessos (eventos) em relação ao total de sucessos. Frequência Relativa Percentual (fr) Frequência Acumulada (fa) é aquela que vai-se acumulando; Distribuição de frequência é o arranjo tabular dos dados com as respectivas frequências. 100* fX ffr fX fFr 18 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Quadro de frequências ou tabela de frequências. Exemplo: Os dados que se seguem são relativos às vendas (em contos) de 30 vendedores da MundoLar durante o mês de Outubro passado. 120 130 80 100 110 100 90 70 140 120 140 110 100 100 110 70 90 90 130 150 160 80 70 120 100 110 110 80 100 120 Dados não agrupados Dados agrupados 20 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Intervalos de classes Intervalo de Classe é um símbolo que define uma classe, como 81 - 100 da tabela anterior. Os números extremos, 81 e 100, são denominados limites de classe. O número menor, 81, é o limite inferior da classe e o maior, 100 é o limite superior. Limite real Superior de classe é obtido adicionando-se o limite superior de um intervalo de classe ao limite inferior da classe seguinte e dividindo-se a soma por 2. Limite real inferior da classe é obtido adicionando-se o limite inferior do intervalo ao limite superior da classe anterior e dividindo-se a soma por 2. Amplitude do intervalo de classe é a diferença entre os limites reais superior e inferior. Os intervalos de classe podem ter a mesma amplitude ou amplitudes diferentes dependendo da natureza dos fenómenos a estudar. Ponto médio é o ponto intermediário do intervalo de classe e é obtido somando-se o limite inferior ao superior e dividindo-se a soma por 2. Assim, o ponto médio do intervalo 81 - 100 é 90.5. Regras práticas para determinação do nº de classes: nº de classes ≈ onde n é o número de dados (usualmente empregue quando n é maior que 25). n Regras gerais para elaborar uma distribuição de frequências 1. Obter a amplitude dos dados (diferença entre o maior e o menor número dos dados); 2. Determinar o número de classes com recurso à formula; N° de classes ≈ ; 3. Obter a Amplitude de cada Intervalo de Classe: 30 Classes de Intervalo de Numero otalAmplitudeTClasse de Intervalo do Amplitude 22 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Unidade 04 Representação gráfica de Dados Estatístico. Introdução Nesta unidade vamos ver a representação gráfica de dados estatísticos. Objectivos No fim desta unidade deves ser capaz de: Tipos de representações gráficas de dados Stem-and-Leaf; Diagrama de barras; Diagrama circular; Histograma; Polígono de frequências Polígono de frequências acumuladas ou Ogivas Representação Stem-and-Leaf (folhas e caule) É uma representação de dados quantitativos na forma gráfica, que ajuda a visualizar a forma da distribuição dos dados. Um Stem and Leaf básico contém duas colunas separadas por uma linha vertical. A coluna da esquerda contém os stems e a coluna da direita contém os leaves. Para construir um Stem-and Leaf, as observações devem estar organizadas na ordem crescente de grandeza. Exemplo: 54,56,57,59,63,64,66,68,68,68,72,72,75,76,81,84,88,106 5 4 6 7 9 6 3 4 6 8 8 8 7 2 2 5 6 8 1 4 8 10 6 Chave:5| 4 = 54 Representação por meio de diagrama de barras É uma representação gráfica para variáveis discretas, que consiste em marcar num sistema de eixos coordenados, no eixo do X, o valor das classes e nesses pontos barras verticais de altura igual à frequência absoluta ou relativa. Nota: de preferência utilizar as frequências relativas, pois para comparar diagramas de barras de amostras diferentes, temos a garantia de que a soma das barras é igual a 1. Diagrama de barras 0 1 2 3 4 5 6 7 70 80 90 100 110 120 130 140 150 160 Vendas Fr eq ue nc ia a bs ol ut a 24 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Representação por meio de diagrama circular Como o nome sugere esta representação é constituída por um circulo, em que se apresentam vários sectores circulares, tantos quanto as classes consideradas na tabela de frequências da amostra em estudo. Os ângulos dos sectores são proporcionais às frequências das classes. Por exemplo uma classe com uma frequência relativa igual a 0.20, terá no diagrama circular um sector comum ângulo igual a 360*0.20 = 72 graus. È uma representação essencialmente para dados qualitativos. Exemplo: Categoria profissional dos funcionários de uma repartição pública. Representação das frequências num diagrama circular 47% 29% 17% 7% 47% 29% 17% 7% Representação por meio de polígono de frequências Um polígono é um gráfico de linha em que as frequências são colocadas sobre perpendiculares levantadas nos pontos médios. Pode se também obtê-lo ligando-se todos os pontos médios dos topos dos rectângulos de um histograma. Representação gráfica das frequências acumuladas polígono de frequencias para dados não agrupados 0 1 2 3 4 5 6 7 70 80 90 100 110 120 130 140 150 160 Vendas Fr eq ue nc ia a bs ol ut a polígono de frequencias para dados não agrupados 0 1 2 3 4 5 6 7 70 80 90 100 110 120 130 140 150 160 Vendas Fr eq ue nc ia a bs ol ut a Representação grafica das frequencias acumuladas -Ogivas 0 0,2 0,4 0,6 0,8 1 1,2 70 80 90 100 110 120 130 140 150 160 Vendas fre qu en ci as re la tiv as ac um ul ad as Representação grafica das frequencias acumuladas -Ogivas 0 0,2 0,4 0,6 0,8 1 1,2 70 80 90 100 110 120 130 140 150 160 Vendas fre qu en ci as re la tiv as ac um ul ad as 26 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Representação por meio de Histograma No histograma tomamos rectângulos justapostos, cada um com base proporcional á amplitude da classe respectiva e a altura é dada por: hi = ni / (ai+1 – ai) = (para frequências absolutas) hi = fi / (ai+1 – ai) = (para frequências relativas) Onde hi = é a altura; ni = frequência absoluta da classe ai+1 = limite superior da classe ai = limite inferior da classe Um histograma com amplitudes iguais consiste em um conjunto de rectângulos que tem: 1. As bases sobre o eixo horizontal (eixo das abcissas) com o centro no ponto médio e as larguras iguais as amplitudes dos intervalos de classe; 2. As áreas proporcionais às frequências das classes. No caso de histogramas com amplitudes diferentes, a altura de cada rectângulo deixa de ser proporcional à frequência da célula correspondente, passando a ser proporcional a frequência por unidade da amplitude da célula. Histograma com amplitudes iguais Histograma 10% 20% 36,70% 20% 10% 3,30% 0% 5% 10% 15% 20% 25% 30% 35% 40% 1 Vendas Fr eq u~ en ci as 60 - 80 80 - 100 100 - 120 120 - 140 140 - 160 160 - 180 Histograma com amplitudes diferentes Polígono de frequência para dados agrupados Polígono de frequência acumuladas Histograma c' amplitudes diferentes 2 3 4 1 3 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 Temperaturas Fr eq ./a m p. c el ul as 9,5 -12,5 12,5 -15,5 15,5 - 20,5 20,5 - 30,5 30,5 - 50,5 Polígono de frequências para dados agrupados 0 2 4 6 8 10 12 60 - 80 80 - 100 100 - 120 120 - 140 140 - 160 160 - 180 vendas Fr eq .A bs ol ut as Series1 Representação grafica das frequencias acumuladas -Ogivas 0 0,2 0,4 0,6 0,8 1 1,2 70 80 90 100 110 120 130 140 150 160 Vendas fre qu en ci as r el at iv as ac um ul ad as 28 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Curvas de frequências Curvas de frequência aparecem, na prática, sob diversas formas características, os tipos de curvas comuns são: Curvas de frequência simétrica ou em forma de sino Caracterizam se pelo facto das observações equidistantes do ponto central máximo terem a mesma frequência; Curvas de frequência moderadamente assimétrica A cauda da curva de um lado da ordenada máxima é mais longa do que do outro lado. Se o ramo mais alongado fica à direita, a curva é dita desviada para direita, ou assimétrica positiva, enquanto que, se ocorre o inverso, diz-se que a curva é desviada para esquerda ou assimétrica negativa. Tarefas 02 1. As Taxas de inflação média os anos 1997 a 2007 foram os seguintes: 17%; 45%; 38%; 27%; 6%; 48%; 11%; 57%; 34%; 22% 1. Apresente em Rol o crescimento da taxa de inflação média nos anos 1997 a 2007. 2. Determine a Amplitude Total das taxas média de inflação. 2. Segundo uma pesquisa realizada em 2007 na cidade do Dondo, apresentaram a seguinte informação: Número de Filhos dependentes (X) Frequências Observada 0 32 1 46 2 50 3 40 4 16 5 8 a) Represente a tabela de frequência relativa. b) Represente a tabela de frequência acumulada. c) Apresenta o diagrama de barra. 3. A Direcção da Agricultura do Distrito de Nhamatanda apresentou uma amostra de 49 camponeses, em função do rendimento médio do ano 2007 da produção de milho. 30.8 30.9 32.0 32.3 32.6 31.7 30.4 31.4 32.7 31.4 30.6 32.5 30.8 31.2 31.8 31.6 30.3 32.8 30.6 31.9 32.1 31.3 32.0 31.7 32.8 33.3 32.1 31.5 31.4 31.5 30 Módulo de Estatística Aplicada Beira, Janeiro de 2012 31.3 32.5 32.4 32.2 31.6 31.0 31.8 31.0 31.5 30.6 32.0 30.4 29.8 31.7 32.2 32.4 30.5 31.1 30.6 Em função da tabela determine: a) Ilustra esta situação no sistema Steam and Leaf. b) Faça a tabulação de Frequências. 4. Uma pesquisa social no Bairro da Manga (na cidade da Beira), apresentou os seguintes dados referentes ao número de filhos por famílias: 1 2 3 2 2 2 2 3 2 6 2 1 1 0 1 2 1 2 2 1 2 4 a) Apresente a tabela da distribuição de frequências b) Faça a apresentação do diagrama circular, que conclusão se pode tirar em torno dos dados apresentados. 5. A Tabela abaixo mostra a distribuição de frequências dos salários semanais dos 65 trabalhadores da empresa Mafuia Comercial, em Meticais. Salários (Meticais) Numero de Empregados 5000 – 5999 5 6000 – 6999 12 7000 – 7999 13 8000 – 8999 17 9000 – 9999 6 10000 – 10999 9 11000 – 11999 2 Com base na informação da tabela determine: 5. Faça a apresentação tabular das frequências absolutas, frequências acumuladas, frequências relativas, amplitude de intervalo de classes, pontos médios, intervalos de classes. 6. Efectue as seguintes situações: Histograma; Polígono de frequências e Ogiva. 6. Uma amostra da UCM – CED apresentou os pontos médios de uma distribuição de frequências de pesos dos estudantes são: 64; 68.5; 73; 77.5; 82; 86.5 e 91 quilos. Determine: Amplitude do intervalo de classe. Os limites reais de classe Os limites reais de classes, admitidos se que os pesos foram determinados com precisão ate meio quilo. Represente graficamente os resultados. 7. A menor nota do teste de Macroeconomia no universo de 150 estudantes é 5.18 valores e a maior é 7.44 valores. Determine: Intervalos de classe. Limites reais de Intervalo de classe. Pontos médios que podem ser usados na formação de distribuição de frequência dessas notas. (Hint: apresente 5 ou 6 intervalos de classes}. 8. Na tabela seguinte estão relacionados os pesos de 40 trabalhadores do sexo masculino da Mobeira, SARL. 69 75 72 74.5 73 70 68 76 84 69 81.5 77 73 71 67.5 70 32 Módulo de Estatística Aplicada Beira, Janeiro de 2012 80.5 67.5 75 72.5 82 66 62.5 78.5 79 73.5 74 72 63 88 59.5 82.5 86.5 73.5 76.5 67.5 72.5 71 78 64 Usando a informação da tabela apresente: Tabulação de frequências. Construa um histograma. Construa um polígono de frequências. 8. Dada a distribuição dos salários da empresa Mobilandia, SARL. Salários (X, mil Meticais) Frequências 45 – 50 10 50 – 60 6 60 – 64 5 64 – 75 4 75 – 95 15 Construao Histograma e Polígono de frequências acumuladas. Unidade 05 Medidas de tendência central Introdução Na unidade 5, vamos abordar aspectos relacionados com parametros que nos ajudao a caracterizar os dados em estudo tais como a média, moda e mediana. Para além disso vamos ver a distribuição simétrica onde abordaremos aspectos da relaçao entre a média , moda e mediana. Objectivos No fim desta unidade deves ser capaz de: Saber interpretar as medidas de tendencia central; Relacionar as medidas de tendecias centrais Medidas de tendência central São chamados Medidas de Tendência Central às medidas que representam os fenómenos pelos seus valores médios, em torno dos quais tendem a concentrarem-se os dados. Três medidas de tendência central mais conhecidas são: a Média, a Mediana e a Moda. A Média para dados não agrupados É um valor típico ou representativo de um conjunto de dados. Como esse valor típico tende a se localizar em ponto central dentro de um conjunto de dados ordenados em rol, a média é denominada medida de tendência central. os valores distintos de um conjunto de n dados, a média aritmética representa-se por e é dado por: nX .......... X X X Seja 3,2,1, X 34 Módulo de Estatística Aplicada Beira, Janeiro de 2012 A Média para dados não agrupados com frequências absoluta Se os números ocorrem com frequências a média aritmética é dada por : Exemplo: A tabela de frequências que se segue é relativa ao número de pneus produzidos por dia na fábrica MABOR, para uma amostra de 30 dias. Apartir dos dados da tabela podemos calcular a media usando a segunda formula uma vez que temos as respectivas frequencias absolutas, isto é: 933,23 30 718 ... .... 21 2211 X fff fXfXfX f fX X n nn i ii A Média para dados agrupados Exemplo: Dada a tabela abaixo, calcule a média aritmética Propriedades da média 1. A soma algébrica dos desvios de um conjunto de números em relação a média aritmética é igual a zero. Isto é, 2. A soma dos quadrados dos desvios de um conjunto de números Xj, em relação a qualquer número a, é um mínimo quando a = X e somente neste caso. 3. Se f1 números têm média m1, f2 números têm média m2,....fk têm média mk, a média de todos os números. Mediana para dados não agrupados Trata-se do valor que divide o conjunto de dados, ordenados por ordem crescente, em duas partes iguais. Isto é, como o próprio nome indica, é o ponto mediano de um conjunto de dados ordenados em ordem crescente. 625.20 40 825 i im f fX X 0 XXi 0 XX i k21 kk2211 f...........ff mf.......mfmfX 36 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Sejam x1, x2, ....xn são n observações ordenadas por ordem crescente de grandeza e que constituem o conjunto de dados em análise. Exemplo: Dado o Rol: 2, 3, 4, 6, 7, 9, 12 (impar) Exemplo: Para os dados 3, 5, 6, 7, 8, 10. (Par) a mediana é : Mediana para dados agrupados Observação: A classe mediana é o primeiro intervalo que tem a frequência acumulada maior que n dividido por 2. imparfor n o se, 2 1nMediana imparfor n o se, 2 1nMediana parfor n o se1, 2 X 2 XMediana nn parfor n o se1, 2 X 2 XMediana nn 64 2 17 2 1 PosicaonMediana a 5.6 2 76 2 1 22 1 22 4366 XXXXXXMediana nn mediana. classe da Frequencia - mediana. classe da Amplitude - h (antes). mediana classe a ate acumulada Frequencia - s.observacoe de numeroou totalfrequenciaou dados de Numero - n mediana. aconter que o e, isto media, classe dainferior real Limite - : *2 )1( )1( mediana medina mediana mediana medina mediana f f L Onde h f fn LMediana Exemplo de mediana para dados agrupados Moda para dados não agrupados A moda é o valor mais frequente num conjunto de dados. Exemplo para dados não agrupados: a. {2, 3, 4, 4, 5} Mo = 4 (já que a moda é única então diz-se que a distribuição é Unimodal); b. {2, 2, 3 4, 4, 5} Mo = 2 e 4 (distribuição Bimodal) Havendo mais de 2 valores modais, a distribuição diz Multimodal. Quando os dados estão agrupados em classe, a classe modal é aquela que tem maior frequência por unidade de amplitude. 75.155* 40 50 2 120 5.14 *2 )1( Mediana h f fn LMediana mediana medina mediana 38 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Moda para dados agrupados Observação: A classe modal é o intervalo que tem maior frequência Exemplo da moda para dados agrupados: Relação média, mediana e moda As distribuições de frequências podem ser Simétricas ou não Simétricas. Considerando apenas distribuições Unimodais, temos: a. Distribuições simétricas: b. Distribuições assimétricas positivas: a cauda direita é mais longa e menos abrupta do que a esquerda. c. Distribuições assimétricas negativas: a cauda esquerda é mais longa e menos abrupta do que a direita. Nas distribuições assimétricas os valores extremos da cauda mais longa puxam a média para o lado direito. A mediana, como divide a área em duas partes iguais, para compensar a redução de área no lado abrupto, afasta-se também da moda, mas menos do que a média. posterior. frequencia a relacao em modal frequencia da excesso o e - moda. aanterior frequencia a relacao em modal frequencia da excesso o e - : * 2 1 21 1 mod d d Onde h dd dLimiteModa al 4375.21* 97 72* 21 1 mod h dd dLimiteModa al ModaMedianaMedia MediaMedianaModa ModaMedianaMedia Tarefas 03 o Determinar a média, a mediana e a moda dos conjuntos de números: a. 7; 4; 10; 9; 15; 12; 7 b. 8; 11; 4; 3; 2; 5; 10; 6; 4; 10. o Uma variável aleatória X é discreta, com uma distribuição caracterizada pelo seguinte: Média = Moda =10 Tabela de frequências relativas X C 0 d F 0.2 0.3 0.5 o Determinar os valores numéricos de c e d. o Os Salários mensais de quatro trabalhadores do Departamento de Pesquisa & Investigação da empresa “Sunsol” são, (em meticais): 15 000; 19 000; 29 500; e 95 000. Determinar o Salário Médio dos referidos trabalhadores. Poder-se-ia dizer que essa média é típica dos salários? Explica a sua resposta. o Seja X o número de acidentes que ocorre num mês nesta fábrica. A distribuição de frequências de X é dada por: X 1 2 3 4 Freq. Relativas 0.41 0.33 K L Determine o valor de K e L de modo que o número esperado de acidentes num mês seja 1.95. o Consideremos a distribuição salarial de 16 colaboradores de uma certa empresa que ocupam o mesmo cargo. Salários (em milhares de Meticais) 70 74 82 91 95 Número de funcionários 3 6 10 3 1 40 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Calcule a média aritmética, a moda e a mediana. O que pode concluir quanto assimetria da distribuição? o Num torneio de basquetball, realizado na cidade da Beira, participaram três equipas e cada equipa fez cinco jogos. Na tabela seguinte estão representados os resultados por jogo e por equipa. Equipas I jogo II Jogo III jogo IV jogo V jogo Ferroviário da Beira 45 77 54 99 78 Estrela Vermelha de Maputo 85 90 44 80 46 Académica de Maputo 95 101 65 88 55 a. Suponha que você pretende juntar-se a uma das três equipas de basquetball.,se ordenar cada equipa pela média dos seus resultados, que equipa irá se juntar? b. No lugar de considerar a média dos resultados, se usar a mediana dos resultados de cada equipa para tomar a sua decisão, que equipa irá se juntar? c. Suponha que você é treinador da Académica e está sendo entrevistado acerca do desempeno do seu team por um jornal local. Seria melhor para reportar a média ou a mediana dos resultados? o Uma nova Universidade que está a se estabelecer na cidade da Beira, pretende pagar aos seus docentes um salário anual de 170 000, 00 meticais. O administrador da universidade quer comparar este salário com os salários pagos por outras universidades. Para fazer este estudo, o administrador seleccionou aleatoriamente uma amostra de 14 docentes dentre milhares de docentes de diferentes Universidades. Cada docente da amostra foi questionado acerca do seu salário referente aos anos anteriores. Os 14 salários expressos em 1.000 MT, são dados abaixo: 127 241 132 154 171 141 121 161 192 138 177 152 146 144 o Calcula a média e a mediana e explica porque as duas medidas são diferentes? o Qual das duas medidas melhor representa a tendência central? Explica a sua resposta. o Como é a mediana da amostra de salários pode se comparar com o salário de 180 000 MT proposto? Será que esta proposta de salário é suficientemente competitiva? Comente a sua resposta. o Dada a distribuição dos salários da empresa Mobilandia, SARL. Salários (X, mil Meticais) Frequências 45 – 50 10 50 – 60 6 60 – 64 5 64 – 75 4 75 – 95 15 Faça o estudo da assimetria desta distribuição de frequências. 42 Módulo de Estatística Aplicada Beira, Janeiro de 2012 o A partir da tabela apresentada, determine a Media, Moda e Mediana da distribuição. Intervalos Frequências (fi) 10 – 20 10 20 – 30 20 30 – 40 35 40 – 50 40 50 – 60 25 o A Direcção da Agricultura do Distrito de Nhamatanda apresentou uma amostra de 49 camponeses, em função do rendimento médio do ano 2007 da produção de milho. 30.8 30.9 32.0 32.3 32.6 31.7 30.4 31.4 32.7 31.4 30.6 32.5 30.8 31.2 31.8 31.6 30.3 32.8 30.6 31.9 32.1 31.3 32.0 31.7 32.8 33.3 32.1 31.5 31.4 31.5 31.3 32.5 32.4 32.2 31.6 31.0 31.8 31.0 31.5 30.6 32.0 30.4 29.8 31.7 32.2 32.4 30.5 31.1 30.6 Em função da tabela faça o estudo da assimetria. Unidade 06 Medidas de dispersão Introdução Tal como vimos na unidade 5, nesta unidade vamos abordar aspectos relacionados com parametros que tambem nos ajudarao a caracterizar os dados estatisticos tais como a variança e o desvio padrão. Objectivos No fim desta unidade deves ser capaz de: Saber interpretar as medidas de dispersão; Medidas de dispersão Variação ou dispersão É o grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio. Dispõe-se de várias medidas de dispersão, sendo as mais comuns a Amplitude Total, o Desvio Médio, a Variância e o Desvio Padrão. Amplitude total É a diferença entre o maior e o menor elemento de um conjunto de dados. Exemplo: A amplitude total do conjunto 2, 3, 3, 5, 5, 5, 8, 10, 12 Amplitude Total : 12-2 =10 44 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Desvio médio Seja um conjunto de N números, X1, X2, ..., XN é definido por: Onde: é a média aritmética dos números. é o valor absoluto do desvio de Xj em relação X. (o valor absoluto de um número é o próprio número, sem o sinal que lhe é associado). Exemplo: Determinar o desvio médio do conjunto de números 2, 3, 6, 8, 11. A Variância Dado um conjunto de dados, a variância é definida como o quadrado do desvio padrão e, é denotado por: s2 ou δ2 . n XX i Medio Desvio X XX i 8.2 5 61168666362 6 5 118632 oDesvioMedi X i im i ii i f fxX f xXf n xX 2 2 2 2 2 2 Agrupados Dados sFrequencia com Agrupados Nao Dados sFrequencia sem Agrupados Nao Dados Exemplo: Desvio padrão É a raiz quadrada da variância e denota-se por σ ou s. Exemplo: Variância e desvio padrão para dados não agrupados. Seja: {5, 10, 15, 20, 25} X = 15 i im i ii i f fxX f xXf n xX 2 2 2 Agrupados Dados sFrequencia com Agrupados Nao Dados sFrequencia sem Agrupados Nao Dados 46 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Exemplo: Variância e Desvio Padrão para dados agrupados 07.750 50 5 250 sFrequencia sem Agrupados Nao Dados 2 2 n xXm 070.34275.9 4275.96225.61 20 1421 Agrupados Dados 2 2 i im f fxX Coeficiente de variação A variação ou dispersão real, determinada a partir do desvio padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta. Entretanto, uma variação ou dispersão de 10 cm, na medida de uma distância de 1000 metros, é inteiramente diferente, quanto ao efeito, da mesma variação de 10 cm em uma distância de 20 metros. A medida desse efeito é proporcionada pela dispersão relativa, denominada por Coeficiente de variação. %100*Variacao de eCoeficient %100*Variacao de eCoeficient X Media aoDesvioPadr 48 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Tarefas 04 1. Determinar a Amplitude Total dos conjuntos de dados abaixo: a) 7; 4; 10; 9, 15, 12, 7. b) 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7. 2. Determinar o Desvio Médio absoluto dos cojuntos de números abaixo: a) 10, 25, 35, 15 e 50 b) c) 3. Calcular a Variancia e Desvio Padrão dos seguintes números: 5, 10, 15, 20, 25. 4. Somando-se 5 a cada um dos números do conjunto 3, 6, 2, 7, 5, obtém-se um outro cojunto de números. a) Mostrar que os dois conjutos têm o mesmo desvio padrão, mas médias diferentes; b) Qual é a relação entre as médias? 5. Consideremos a tabela abaixo que mostra a distribuição, em toneladas, das cargas máximas suportadas por certos cabos fabricados por uma companhia : determinar o Coeficiente de Variação. X 10 - 14 15 - 19 20 - 24 25 - 29 F 3 1 2 4 X 10 25 35 15 50 F 2 1 3 1 2 Carga Máxima (toneladas) Número de Cabos 9.3 – 9.7 2 9.8 – 10.2 5 10.3 – 10.7 12 10.8 – 11.2 17 11.3 – 11.7 14 11.8 – 12.2 10 6. Um fábrica de aluminio apresentou a seguintes escala de producao: Categorias de Aluminio Escala de Produção 462 98 480 75 498 50 516 42 534 30 Determinar o Coeficente de Variação. 7. A tabela abaixo apresenta uma distribuição de frequência dos graus de um exame final de matemática. Grau 90-100 80-89 70 -79 60-69 50-59 Número de Estudantes 9 32 43 21 11 50 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Determine: a) Desvio Medio. b) Desvio Absoluto e Relativo, interprete os resultados. 8. Em um exame final de Estatística, o grau médio de um grupo de 150 estudantes foi 78 e o desvio padrão 8,0. Em Matemática, entretanto, o grau médio do grupo foi 73 e o desvio padrão 7,6. Em que disciplina foi maior: a) A Dispersão Absoluta; b) A Dispersão Relativa? 9. Seja X o número de acidentes que ocorre num mês nesta fábrica. A distribuição de frequências de X, sabendo que a media é igual a 1.95. X 1 2 3 4 Frequências RelativasK L 0.16 0.1 Determine: a) O valor de K e L de modo que o número esperado de acidentes num mês seja 1.95. b) O Desvio médio e o Coeficiente de Variação. 10. Como forma a controlar custos, uma empresa pretende estudar o montante que a sua forçade vendas gasta para entreter clientes. A seguir está indicadauma amostra de seis despesas de entretenimento, extraídas do relatório de despesas submetido pelos vendedores, (em milhares de Meticais). 157 132 109 145 125 139 142 160 a) Calcule a Média e o Desvio Padrão. b) Se um membro da força de venda submeter uma despesa de entretenimento decliente de 190.000, oo mts, deverá ser considerada excessivamente alta (com possibilidade de ser investigada)?. Explica a sua resposta. 11. Dada a distribuição dos salários da empresa Mobilandia, SARL. Salários (X, mil Meticais) Frequências 45 – 50 10 50 – 60 6 60 – 64 5 64 – 75 4 75 – 95 15 a) Apresente o Histograma para esta estrutura de dados. b) Faça o estudo da assimetria desta distribuição de frequências. c) Determine o Coeficiente de Variação. 12. Considere as distribuições A e B dos salários em duas empresas. Salários (em milhares de meticais) 0 - 6 6 – 12 12 - 18 18 - 24 24 - 30 Número de trabalhadores 4 7 18 7 4 Salários (em milhares de deMeticais) 0 - 6 6 -12 12 - 18 18 - 24 24 - 30 Número de trabalhadores 13 17 20 17 13 Faça o estudo da dispersão salarial em cada uma das empresas, recorrendo ao desvio padrão. 52 Módulo de Estatística Aplicada Beira, Janeiro de 2012 13. A variancia de uma distribuição simétrica é 9. Sabendo que o coeficiente de dispersão é 12, qual é o valor da moda. 14. Qual dos dois conjuntos de dados tem maior dispersão, A (em unidade monetárias) ou B ( em metros) A = {1, 2, 6, 9, 13} B= {1.03, 2.976, 5.931, 12.652} Unidade 07 Teorias de probabilidades Introdução Nesta unidade teremos a oportunidade de aprender alguns conceitos basicos sobre teoria de probabilidades tais como espaço amostral e eventos assim como o conceito das probabilidades. Objectivos No fim desta unidade deves ser capaz de: Determinar o espaço amostral de um determinado evento; Definir a probabilidade da ocorrencia de um determinado acontecimento; Usar correctamente as propriedades das probabilidades na resolução de tarefas; Introdução as teorias de probabilidades Usamos o conceito de probabilidades quando lidamos com incertezas. Intuitivamente, a probabilidade de um evento é o número que mede a chance do evento ocorrer. Exemplos: 1. Um investidor que compra acções, sabe que o ganho que vai obter com elas está sujeito a um certo grau de incerteza, portanto a probabilidade será o número que mede a chance do ganho ocorrer. 2. O gestor de uma cadeia de lojas que toma a decisão de abrir uma nova loja numa determinada cidade, não consegue saber à partida se a loja vai ter o sucesso pretendido; aqui a probabilidade será o número que mede a chance de sucesso da nova loja. 54 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Tal como a decisão de comprar acções ou de abrir uma nova loja, também fazer inferências acerca de uma população com base nos dados de uma amostra envolve um certo grau de incerteza. É importante dispor de uma medida do grau de incerteza de um fenómeno aleatório. Essa medida chama se probabilidade. Experiência Uma experiência é um processo de observação onde intervém o acaso, isto é, cujos resultados são incertos, não sendo portanto possível saber qual é o resultado antes de realizar a experiência. Exemplos de experiências: 1. Um analista financeiro observa a cotação na bolsa das acções de uma determinada empresa para saber se esta subiu ou não; 2. O lançamento de um dado e registo do número de pontos obtidos; 3. Um gestor de produção observa uma linha de produção durante uma hora e conta o número de peças defeituosas. Espaço Amostral É o número total de resultados possíveis de uma experiência aleatória. É o conjunto que possui todos eventos que podem ocorrer no exercício (casos possíveis). Exemplos de Espaço Amostral: 1. Lançamento de uma moeda ao ar: Espaço Amostral = {Face, Coroa} 2. Lançamento de um dado: Espaço Amostral = {1, 2, 3, 4, 5, 6}; 3. Um gestor de produção observa uma linha de produção durante uma hora e conta o número de peças defeituosas: Espaço Amostral = {0, 1, 2, 3, 4, 5, 6, ….} 4. Um casal que pretende ter 2 filhos: Espaço Amostral ={ MM, MF, FM, FF}. Isto é, MM Ambos rapazes; MF Primeiro rapaz e a seguir rapariga; FM Primeira rapariga e a seguir rapaz e finalmente FF Ambas raparigas. Eventos É um subconjunto de um espaço amostral (casos favoráveis). Por exemplo se considerarmos o espaço amostral do nascimento de dois filhos, o evento do casal ter pelo menos uma rapariga consiste no espaço amostral de MF, FM e FF. Definição de Probabilidades Teoria Clássica das Probabilidades A probabilidade de um evento A ocorrer é definido como sendo a razão entre número de resultados favoráveis do evento A, e número total de resultados possíveis. Suponha que um evento A possa acontecer de m maneiras diferentes, em um total de n modos possíveis, então a probabilidade da ocorrência do evento A (também designado por sucesso) é dado por: Onde: n mAPadeProbabilid 56 Módulo de Estatística Aplicada Beira, Janeiro de 2012 m – número de casos favoráveis a ocorrência de A n – número de casos possíveis p – probabilidade de sucesso de A Exemplo: A probabilidade de aparecimento de uma face com um número par no lançamento de um dado equilibrado/honesto. Acontecimento A: sair uma face com numero par Número de resultados favoráveis a A = {2, 4, 6}. Como o dado é honesto, os 6 resultados são igualmente possíveis, daí que: P(A) = m/n = 3/6 = 0.5 Obs: A probabilidade de um evento é um número compreendido entre 0 e 1. Se o evento não pode ocorrer, sua probabilidade é 0. Se a sua ocorrência é certa, sua probabilidade é 1. Limitações da definição clássica das probabilidades A definição clássica de probabilidades tem algumas limitações tais como: Só pode ser aplicada se o número de resultados possíveis da experiência aleatória for finito; Só pode ser aplicada se os resultados forem igualmente prováveis. Esta definição também não permite dar resposta às seguintes questões: Qual é a probabilidade de uma fábrica produzir num dia 20 unidades; Qual é a probabilidade de sair uma face no lançamento de uma moeda não honesta (equilibrada); Qual é a probabilidade de uma pessoa seleccionada ao acaso ser hipertensa; Qual é a probabilidade de uma peça que sai de uma linha de produção ser defeituosa? Definição Frequencista de probabilidades A probabilidade de ocorrência do evento A é definida como sendo o valor para que tende a frequência relativa de A num grande número de repetições da experiência. Vamos admitir que realizamos uma determinada experiência aleatória n vezes, em idênticas condições, e que o acontecimento A se realiza m vezes. Seja fA a frequência relativa da ocorrência de A, isto é, Suponhamos que depois de examinarmos uma moeda damos conta que não é equilibrada, isto é, que os acontecimentos: “saída de face (F) e saída de coroa (C)” não são igualmente prováveis. Seja p a probabilidade do acontecimento F: p = P(F). Podemos aproximar o valor de p, realizando um grande número de lançamentos a frequência relativa aproximar se ia de 0.5 Definição Subjectiva de probabilidades Uma probabilidade subjectiva surge quando uma pessoa atribui um grau decredibilidade a um certo acontecimento aleatório, baseado na sua intuição ou no seu conhecimento empírico. Exemplos de probabilidades subjectivas n mfA 58 Módulo de Estatística Aplicada Beira, Janeiro de 2012 1. O senhor João é um Benfiquista e acha que a probabilidade de o Benfica ganhar o campeonato nesta época é superior a 0.8 2. A Maria sabe que 15% dos alunos de Estatística têm uma nota superior a 14, no entanto ela acredita que vai tirar uma nota superior a 14 com probabilidade de 0.75. Propriedades das probabilidades 1. Toda a probabilidade é um número que varia entre 0 à 1, sendo assim a probabilidade do evento A ocorrer 0 ≤ P(A) ≤ 1; 2. A probabilidade de não ocorrência do evento A, denominado insucesso é igual a P(Ā) =1– P(A); q = 1 - p 3. A probabilidade da ocorrência da reunião de dois eventos A ou B (ou ambos) é: P(AUB) = P(A) +P(B) – P(AпB) 4. A probabilidade da ocorrência da reunião de dois eventos mutuamente exclusivos (A ou B) é igual a soma das probabilidades dos eventos. P(A U B) = P(A)+P(B) Probabilidade Condicional Sejam A e B dois acontecimentos associados a uma experiência aleatória com espaço amostral. Se a P(B) ≠ 0, a probabilidade condicional de A dado B, denota-se por P(A\B), onde P(B) ≠ 0 e é dado por: Trata-se da probabilidade de ocorrência do evento A sabendo que o evento B já ocorreu. De forma análoga, se P(A) ≠ 0. BP BAPBAP / 0 para ,/ A AP ABPABP Exemplos: 1. Suponhamos que dispomos da informação de que ao lançar um dado saiu uma face com número par de pontos, isto é, realizou-se o acontecimento. A Ξ “saída de face com um nº par de pontos” = {2, 4, 6} Qual será a probabilidade de ocorrência do acontecimento B correspondente a saída de uma face com mais de 5 pontos? B Ξ “saída de face com mais de 5 pontos” = {6} P(B\A) = P( B∩A)/ P(A) =P{ 6} /P{2,4,6} = (1/6)/ (3/6) = 1/3 Regra da Multiplicação das probabilidades Uma consequência imediata da probabilidade condicional é a regra da multiplicação das probabilidades, a qual expressa a probabilidade da intersecção em termos da probabilidade individual dos eventos e da probabilidade condicional. Sejam A e B dois eventos associados a uma experiência aleatória com espaço de resultados Ω. A probabilidade da sua intersecção pode ser derivada da probabilidade condicional através de: P(A∩B) = P(A\B) P(B) se P(B) ≠ 0 P(B∩A) = P(B\A) P(A) se P(A) ≠ 0 Generalizando a regra da multiplicação a n acontecimentos vem: P(A1 ∩ A2 ∩ ...∩ An) = P(A1)P(A2\A1)P(A3\A1∩A2) .......P(An\A1∩ ...An-1) Eventos Independentes Sejam A e B dois acontecimentos ou eventos associados a uma experiência aleatória com espaço de resultados Ω. Estes acontecimentos dizem-se independentes se e só se P(A∩B) = P(A) X P(B) 60 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Da regra da multiplicação segue que: P(A\B) = P(A) se P(B) > 0 P(B\A) = P(B) se P(A) >0 Tarefas 05 1. Lançam-se ao acaso 2 moedas. a. Escreva o espaço amostral. b. Represente os eventos: A= {sair uma face}; B ={sair pelo menos uma face} 2. Quatro pessoas entram num supermercado, cada uma delas vai fazer compras (C) ou não vai fazer compras (N). a) Desenhe o diagrama de árvore que ilustra o espaço amostral de todas as possíveis decisões de compra. b) Escreva os espaços amostrais que representam cada um dos seguintes eventos: 1. Exactamente três pessoas vão fazer compras. 2. Duas ou menos pessoas vão fazer compras. 3. Uma ou mais pessoas vão fazer compras. 4. Todas as quatro pessoas vão tomar a mesma decisão. c) Assumindo que os eventos referidos na parte b do número anterior são todos igualmente prováveis, calcule a probabilidade de cada um deles. 3. Suponha que um casal planeia ter três filhos. Assumindo que os eventos abaixo são igualmente prováveis, calcule a probabilidade: a) Todos os filhos serem do mesmo género. b) Exactamente dois dos três filhos serem meninas c) Nenhum dos três filhos ser menina. 4. Um dado é lançado ao ar, qual é a probabilidade de aparecer um número impar? 62 Módulo de Estatística Aplicada Beira, Janeiro de 2012 5. Determinar a probabilidade de se jogar um dado e se obter o número 3 ou um número ímpar. 6. Numa classe de 60 aluno, 40 estudam só matemática, 10 estudam só física e 5 estudam física e matemática. Determinar a probabilidade de um aluno que estuda Matemática também estudar física. 7. Joga se um dado, determinar a probabilidade de se obter o número 2 ou 3? 8. Joga se dois dados, determinar a probabilidade de se obter o número 6 no somatório dos resultados nos dois dados. 9. Um dado é atirado duas vezes ao ar. Determine a probabilidade de obter um número menor que 3 em ambos lançamentos. 10. Uma moeda é lançada no ar de seguida atira se um dado. Qual é a probabilidade de obter cara na moeda e um número par no dado. 11. Dois estudantes atiram a um alvo. A probabilidade da Celma atingir o alvo é de 1/2 e a probabilidade de não atingir o alvo é de 1/3. A Elsa atirou primeiro seguida da Helena. a) Qual é a probabilidade de ambas acertarem o alvo. b) Somente uma acertar o alvo; c) Nenhuma delas acertar o alvo 12. A probabilidade de um trabalhador chegar atrasado ao serviço é de 1/20. Calcule a probabilidade do trabalhador estar atrasado em duas manhãs consecutivas: a) Duas vezes; b) Uma vez. 13. Se os eventos A e b são independentes e P(A) =0.3 e P(B) =0.5, determine: a) P(A ∩ B); c) P(A U B); b) Será que os eventos A e B são mutuamente exclusivos. 14. Dois eventos A e B tais que a P(A) = 2/3, P(A/B) =2/3 e P(B) = 1/4. Determine: a) P(B/A); b) P(A∩B). 15. A probabilidade de João esperar no semáforo quando vai à faculdade é de 0.25. Achar a probabilidade em duas manhãs consecutivas esperar pelo menos uma vez. 16. Se P(A) = 0.4 e P(A∩ B) = 0.7. Qual é a P(B) se: a) A e B são independentes? b) A e b são mutuamente exclusivos? 64 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Unidade 08 Variáveis aleatorias discretas (VAD) e Distribuição Binomial Introdução Nesta unidade vamos abordar aspectos relacionados com a distinçao entre variaveis discretas e cntinuas assim como a funçao densidade de variaveis aleatorias discretas. Para alem disso veremos a média ou valor esperado para variaveis continuas, variança e desvio padrão para variaveis discretas assim como a distribuiçao binomial. Objectivos No fim desta unidade deves ser capaz de: Distinguir variaveis aleatórias discretas das continuas; Caracterizar uma função densidade de probabilidades; Usar as propriedades da distribuiçao binomial no calculo de probabilidades. Variável aleatória É uma Variável que assume valores numéricos determinados pelo resultado de uma experiência, onde cada valor numérico corresponde a um e somente um resultado da experiência. Exemplo: Número X de nascimentos ocorridos durante uma semana no Hospital Central da Beira. O resultado pode ser 0, 1, 2, ........, n. Quando os possíveis valores da Variável Aleatória, podem ser contados ou listados, dissemos que são Variáveis Aleatórias Discretas (V.A.D.). Variáveis Aleatórias Discretas Podem assumir um número finito de valores possíveis ou os valores possíveis podem ser contados ou listados em sequência. 66 Módulo de Estatística Aplicada Beira, Janeiro de 2012 Exemplo:
Compartilhar