Prévia do material em texto
1 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Introdução à Estatística As estatísticas aparecem nos jornais, nos noticiários de TV, nos relatórios das empresas, nos relatórios dos serviços de saúde etc. Entendê-las, é uma necessidade para um indivíduo que vive em sociedade. As estatísticas facilitam a compreensão dos fatos através de dados referentes a amostras numerosas, como podemos ver nos seguintes exemplos: 1) Verificar se um programa de TV tem ou não audiência; 2) Conferir se um determinado tratamento surte o efeito desejado e mesmo avaliar os efeitos colaterais; 3) Analisar o desempenho dos alunos de uma escola no fim do ano letivo. Os exemplos são numerosos e voltaremos a eles no transcorrer das aulas. Definição Estatística é uma ciência através da qual se obtém informações de dados numéricos. Ela trata do conjunto de métodos utilizados para a obtenção desses dados, sua organização em tabelas e gráficos e a análise e interpretação desses dados. A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de, por exemplo, uma empresa, o conhecimento de seus problemas e a formulação de soluções para tais problemas. Organização dos dados estatísticos Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa variável. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo. Tabelas: Uma tabela deve apresentar a seguinte estrutura: - cabeçalho 2 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ - corpo - rodapé O cabeçalho deve conter o suficiente para que sejam respondidas as questões: - O que está representado? - Onde ocorreu? - Quando ocorreu? O corpo da tabela é representado por colunas e subcolunas dentro dos quais serão registrados os dados numéricos e informações. O rodapé é reservado para observações pertinentes à tabela, bem como para o registro e identificação da fonte dos dados. Exemplo: PRODUÇÃO DA COMPANHIA ALFA – junho/2015 PRODUTOS QUANTIDADE (%) A 32,4 B 21,6 C 43,2 D 10,8 Fonte: Departamento de Marketing da Companhia Distribuição de frequências: 1. Conceitos fundamentais: População: é um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. Amostra: considerando-se a impossibilidade, na maioria das vezes, do tratamento de todos os elementos da população, retira-se uma amostra, ou seja, a amostra é um subconjunto finito de uma população. Variável: é qualquer característica de uma população que se está interessado em pesquisar. As variáveis podem ser: a) Qualitativas: se os valores tomados não são números. Exemplos: sexo, estado civil, cor dos olhos etc. 3 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ b) Quantitativas: se os valores tomados são números. Exemplos: altura, peso, preço de produto etc. As variáveis quantitativas subdividem-se em: Discretas: se os valores associados são números inteiros. Exemplos: número de filhos, número de sócios de um clube etc. Contínuas: se os valores associados são números reais. Exemplos: altura, peso etc. Exemplo: Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma pesquisa sobre a preferência de compra em relação à cor (branco, vermelho ou azul); preço; número de portas e estado de conservação (novo ou usado). Foram consultados 210 clientes. Diante essas informações, responda: a) Qual é a população estatística e qual é a amostra dessa pesquisa? b) Quais são as variáveis e qual é o tipo de cada uma? 2. Representação da Amostra: Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma. Vamos ver uma maneira de dispor os dados através de tabelas: 2.1. Frequência absoluta e frequência absoluta acumulada: Consideremos o quadro seguinte, que nos mostra as notas de 20 alunos do quarto semestre do curso de Matemática da Uninove: 1 8 4 9 6 6 9 10 2 3 8 4 9 6 5 5 6 9 8 7 Esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva ou dados brutos. 4 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ O primeiro passo será colocar esses dados em ordem crescente (ou decrescente). Dessa maneira, obtemos uma nova tabela, denominada rol: A diferença entre o maior e o menor valor da amostra denomina-se amplitude total, amplitude do rol ou Range e será denotada com a letra R. No exemplo acima, temos: R = A partir desses dados, podemos elaborar uma tabela onde na primeira coluna aparecerão os valores da variável estatística (xi) que, nesse caso, são as notas; na segunda coluna aparecerá o número de vezes que cada valor se repete, essa coluna é chamada frequência absoluta que representaremos por Fi. Assim, N = nº de elementos da população = F(1) + F(2) + F(3) + ... + F(10) = 20. Que pode também ser escrito por: 20FN 10 1i i == = Observação: O símbolo Σ (somatório) é usado para escrever abreviadamente expressões que envolvem adição. Assim, indicamos a adição dos termos Fi, com i variando de 0 até n (nIN*), com: = n 0i iF Na terceira coluna, chamada frequência absoluta acumulada (Fac), aparecerão os valores obtidos adicionando a cada frequência absoluta os valores das frequências anteriores: 5 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ notas (xi) Fi Fac total Usando a frequência acumulada, podemos fazer algumas observações como: • 11 alunos obtiveram nota menor que 7,0 nessa turma, ou • 20 – 11 = 9 alunos obtiveram nota 7,0 ou acima de 7,0 nessa turma etc. 2.2. Frequência relativa e frequência relativa acumulada: Chama-se frequência relativa (fi) do valor da variável, o quociente entre a frequência absoluta (Fi) e o número de elementos da população estatística: fi = N Fi No exemplo acima, temos: 6 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ notas (xi) Fi Fac fi 1 1 1 2 1 2 3 1 3 4 2 5 5 2 7 6 4 11 7 1 12 8 3 15 9 4 19 10 1 20 total 20 Geralmente, colocamos a frequência relativa na forma de porcentagem, o que facilita a interpretação. Para colocar as frequências relativas na forma de porcentagem, é só multiplicar por 100 o valor decimal encontrado: notas(xi) Fi Fac fi fac 1 1 1 2 1 2 3 1 3 4 2 5 5 2 7 6 4 11 7 1 12 8 3 15 9 4 19 10 1 20 total 20 Observando essa tabela, podemos dizer: • 5% dos alunos obtiveram nota 7,0 • 55% dos alunos obtiveram nota inferior a 7,0 x100 7 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ • 100% - 55% = 45% dos alunos obtiveram nota igual ou superior a 7,0 Distribuição de frequências com dados agrupados em intervalos de classes: Quando aparecem muitos valores diferentes para a variável em estudo, torna-se inviável colocar na tabela uma linha para cada valor. Nesses casos, agrupamos os valores da variável em intervalos, sendo que, chamamos esses intervalos de classes. Logo a tabela denomina-se de distribuição de frequências com intervalosde classes. Exemplo: Suponhamos termos feito uma coleta de dados relativos às idades de 30 pessoas, que compõem uma amostra dos alunos de uma faculdade “A”: 24 23 22 28 35 21 23 33 34 34 21 25 36 26 22 30 32 25 26 33 34 21 31 25 26 25 35 33 31 31 Elaborando o rol, temos: 21 21 21 22 22 23 23 24 25 25 25 25 26 26 26 28 30 31 31 31 32 33 33 33 34 34 34 35 35 36 E, organizando estes dados em uma tabela conforme já conhecemos, temos: Idades (xi) Fi 21 3 22 2 23 2 24 1 25 4 26 3 28 1 30 1 31 3 32 1 8 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 33 3 34 3 35 2 36 1 Total 30 Como esta tabela fica com muitas linhas, podemos resumi-la numa tabela com intervalos de classes: Elementos de uma distribuição de frequências com dados agrupados em intervalos de classes: Range, amplitude total ou amplitude amostral (R): é a diferença entre o maior e o menor valor da amostra. No exemplo dado: R = Número de classes (k): Não há uma fórmula exata para o cálculo do número de classes. As mais usadas são: 1ª) K = 5 para n 25 ou K n para n 25 2ª)Fórmula de Sturges: K 1 + 3,22 . log n No exemplo dado: n = 30, logo, K = Amplitude das classes (h): é a medida do intervalo que define a classe. h R : K No exemplo dado: Observação: Quando os resultados acima não são exatos, devemos arredondá- los para o maior inteiro. 9 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Limites de classes: são os extremos de cada classe (li |---- Li) li – limite inferior da classe (onde começa o intervalo) Li – limite superior da classe (onde termina o intervalo) As classes são obtidas a partir do menor valor, fazendo a adição de h. No exemplo dado temos: Observação: 21 |---- 24. Compreende todos os valores de 21 a 24, excluindo o 24. Pontos médios das classes (Xi): é a média aritmética entre o limite superior e o limite inferior da classe. Exemplo: 33 |---- 36 Xi = Assim, para montar a tabela de distribuição de frequências com intervalos devemos seguir os itens abaixo: 1º) Calcular a amplitude total; 2º) Saber quantas classes ou quantos intervalos terá a tabela; 3º) Calcular qual será a amplitude do intervalo ou qual a diferença entre o li e o Li. Voltando ao exemplo, temos: Idades de 30 alunos da Faculdade “A” Classes Fi Fac fi fac (%) xi Total 10 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exercícios propostos: 1. Foi feita uma coleta de dados relativos às alturas, em centímetros, de 20 pessoas que compõem uma amostra dos alunos de uma faculdade “A”: 168 168 163 164 160 160 164 166 169 169 166 168 162 165 165 164 168 166 161 168 Determine: a) o rol b) a amplitude total c) a tabela de distribuição de frequências (sem intervalos de classes) 2. A tabela a seguir contém informações sobre estado civil, grau de instrução, número de filhos, salário, idade (medida em anos e meses) e procedência de 36 funcionários da seção de orçamentos de uma companhia. Nº Estado Civil Grau de Instrução Nº de filhos Salário (em reais) Idade Anos Meses Região de procedência 1 solteiro E.Fundam. - 400 26 03 Interior 2 casado E.Fundam. 1 456 32 10 Capital 3 casado E.Fundam. 2 525 36 05 Capital 4 solteiro E. Médio - 573 20 10 Outro 5 solteiro E.Fundam. - 626 40 07 Outro 6 casado E.Fundam. 0 666 28 00 Interior 7 solteiro E.Fundam. - 686 41 00 Interior 8 solteiro E.Fundam. - 739 43 04 Capital 9 casado E. Médio 1 744 34 10 Capital 10 solteiro E. Médio - 759 23 06 Outro 11 casado E. Médio 2 812 33 06 Interior 12 solteiro E.Fundam. - 846 27 11 Capital 13 solteiro E. Médio - 874 37 05 Outro 14 casado E.Fundam. 3 895 44 02 Outro 15 casado E. Médio 0 913 30 05 Interior 16 solteiro E. Médio - 935 38 08 Outro 11 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 17 casado E. Médio 1 977 31 07 Capital 18 casado E.Fundam. 2 980 39 07 Outro 19 solteiro Superior - 1053 25 08 Interior 20 solteiro E. Médio - 1076 37 04 Interior 21 casado E. Médio 1 1106 30 09 Outro 22 solteiro E. Médio - 1159 34 02 Capital 23 solteiro E.Fundam. - 1200 41 00 Outro 24 casado Superior 0 1279 26 01 Outro 25 casado E. Médio 2 1323 32 05 Interior 26 casado E. Médio 2 1360 35 00 Outro 27 solteiro E.Fundam. - 1385 46 07 Outro 28 casado E. Médio 0 1469 29 08 Interior 29 casado E. Médio 5 1471 40 06 Interior 30 casado E. Médio 2 1599 35 10 Capital 31 solteiro Superior - 1622 31 05 Outro 32 casado E. Médio 1 1661 36 04 Interior 33 casado Superior 3 1726 43 07 Capital 34 solteiro Superior - 1875 33 07 Capital 35 casado E. Médio 2 1940 48 11 Capital 36 casado Superior 3 2330 42 02 Interior Determine: a) Qual é a população estatística? Qual é a amostra? b) Classificar as variáveis (qualitativa; quantitativa discreta ou quantitativa contínua). c) Construir as tabelas de distribuição de frequências das variáveis: 1. estado civil 2. grau de instrução 3. número de filhos 4. região de procedência 12 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 3. A pesquisa abaixo foi feita com 20 alunos de uma escola. As variáveis estudadas foram: idade (em anos), peso (em quilogramas) e altura (em centímetros): 14 a; 49.0 kg; 173 cm 14 a; 49.0 kg; 174 cm 14 a; 46.5 kg; 166 cm 14 a; 46.5 kg; 165 cm 16 a; 53.0 kg; 178 cm 15 a; 48.0 kg; 163 cm 15 a; 50.0 kg; 175 cm 14 a; 48.5 kg; 169 cm 14 a; 51.0 kg; 168 cm 16 a; 50.0 kg; 170 cm 15 a; 49.0 kg; 170 cm 14 a; 52.0 kg; 175 cm 14 a; 44.0 kg; 162 cm 14 a; 46.0 kg; 172 cm 15 a; 51.0 kg; 176 cm 15 a; 47.0 kg; 169 cm 14 a; 48.3 kg; 168 cm 14 a; 51.0 kg; 173 cm 16 a; 52.0 kg; 179 cm 14 a; 49.0 kg; 166 cm a) para a variável idade, determine: i) o rol ii) a tabela de distribuição de frequências sem intervalos b) para as variáveis peso e altura, determine: i) o rol ii) a amplitude total iii) o número de classes iv) a amplitude das classes v) a tabela de distribuição e frequências com dados agrupados em intervalos de classes 13 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Representações gráficas É comum vermos em jornais, revistas etc. os resultados numéricos referentes a uma pesquisa apresentados por meio de gráficos. Os gráficos mostram de forma visual, simples e clara, os dados e informações que contêm. A escolha do gráfico mais apropriado dependerá do conjunto de dados a serem organizados e ficará a critério do analista. 1. Gráfico de colunas Nesse tipo de gráfico, usamos retângulos com bases de mesma medida e alturas com comprimentos proporcionais às frequências de cada dado. Os retângulos são representados em um sistema de coordenadas cartesianas onde os valores distintos da variável são colocados no eixo horizontal e as frequências são colocadas no eixo vertical. 1.1. Dados agrupados sem intervalos Consideremos a seguinte tabela: PRODUÇÃO DE PEÇAS DA COMPANHIA ALFA PRODUTOS (xi) QUANTIDADE (%) (fi) A 32,4 B 21,6 C 43,2 D 10,8 Com esses dados, podemos fazer um gráfico de colunas onde os retângulos são separados por distâncias iguais: 14 Estatística Profª Maira Mendias Lauro __________________________________________________________________________1.2. Dados agrupados com intervalos (HISTOGRAMA) Consideremos a seguinte tabela: Classes Fi 0 |---- 2 3 2 |---- 4 6 4 |---- 6 8 6 |---- 8 5 8 |---- 10 2 Com esses dados, podemos fazer um gráfico de colunas onde os retângulos são justapostos, esse gráfico recebe o nome de histograma: Observe que não colocamos o zero do eixo horizontal na origem do sistema cartesiano por uma questão de clareza da representação gráfica. 2. Gráfico de linhas Os gráficos lineares são utilizados com a finalidade de oferecer uma impressão visual nítida de variações numéricas, sob a forma de “subidas e descidas” de uma linha. 15 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 2.1. Dados agrupados sem intervalos Para o exemplo citado acima temos: 2.2. Dados agrupados com intervalos (POLÍGONO DE FREQUÊNCIAS) Para o exemplo citado acima temos: O polígono de frequências é um gráfico de linhas, onde as frequências são marcadas sobre retas perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classes. Obs.: Sempre sobrepor o polígono de frequências ao histograma construído. 16 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 3. Gráfico de setores O gráfico de setores é um círculo dividido em partes (setores). É utilizado principalmente quando se pretende comparar cada valor com o total. Tal gráfico deve ser construído de modo que a área de cada setor seja proporcional à respectiva frequência, ou seja, o ângulo de cada setor deve ser proporcional à frequência que representa, uma vez que a área do setor é diretamente proporcional ao ângulo que o define. Lembrando que uma circunferência completa tem 360º, podemos calcular por meio de uma regra de três simples o ângulo central de cada setor: total ----- 360º parte ----- xº No nosso exemplo temos: PRODUTOS QUANTIDADE GRAUS GRAUS ACUMULADOS A 32,4 B 21,6 C 43,2 D 10,8 TOTAL Com o auxílio de um transferidor, fazemos a demarcação dos setores: 17 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exercícios propostos: 1. Construir os gráficos de colunas, linhas e setores das tabelas abaixo: a) Vendas da Cia Beta Ano Vendas (em milhões) 2008 10 2009 13 2010 17 2011 16 2012 19 2013 23 Fonte: Departamento de Vendas da Cia b) Nº de acidentes por dia na Rodovia X em janeiro de 2015 Nº de acidentes por dia Nº de dias 0 10 1 7 2 4 3 5 4 3 5 2 Fonte: Dersa 18 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 2. Construir o histograma e o polígono de frequências da tabela abaixo: Estaturas (cm) Fi 150 |---- 155 3 155 |---- 160 9 160 |---- 165 17 165 |---- 170 31 170 |---- 175 36 175 |---- 180 180 |---- 185 40 20 3. Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve os seguintes dados: 10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20 a) Monte a tabela de distribuição de frequência com intervalos. b) Construa o histograma e o polígono de frequências. 19 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Medidas de tendência central: média aritmética Vimos a sintetização dos dados sob a forma de tabelas e gráficos. Dessa forma podemos localizar a maior concentração de valores de uma dada distribuição. Contudo, muitas vezes, queremos resumir ainda mais esses dados, apresentando um ou alguns valores que sejam “representativos” da série toda. Usualmente, empregam-se as seguintes medidas de posição central: média, moda e mediana, em torno dos quais tendem a concentrarem-se os dados. Estudaremos agora os diferentes tipos de médias: Média aritmética ( )x : 1º caso: dados não agrupados A média aritmética dos valores x1, x2, x3, ... , xn é o quociente entre a soma desses valores e o seu número total n. n x...xx x n21 +++ = ou simplesmente x = n x i (onde n é o nº de elementos do conjunto) Exemplo: Determinar a média aritmética dos valores: 3, 7, 8, 10 e 11. 2º caso: Dados agrupados sem intervalos Se os elementos x1, x2, x3, ... , xn apresentam, respectivamente, frequências F1, F2, F3, ... , Fn, então: n Fx xtesimplesmenou n xF...xFxF x iinn2211 = +++ = Exemplo: Dada a amostra: 2, 5, 5, 5, 5, 6, 6, 6, 8, 8. 20 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Construindo a tabela de distribuição de frequências, temos: xi Fi xiFi Total Então a média será: 3º caso: Dados agrupados com intervalos Quando os dados estão agrupados, aceita-se, por convenção, que as frequências se distribuem uniformemente ao longo da classe e que, portanto, o seu ponto médio (xi) é o valor representativo do conjunto. Então: n Fx x ii = Exemplo: Classe Fi xi xiFi 2 |---- 5 1 5 |---- 8 10 8 |---- 11 8 11 |---- 14 1 Total Interpretação: O valor médio encontrado é o valor em torno do qual os elementos desta série se concentram. 21 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exercícios propostos: 1. Calcule a média aritmética para as tabelas abaixo: a) xi Fi 2 1 3 4 4 3 5 2 Total (Resposta: 3,6) b) xi Fi 17 3 18 18 19 17 20 8 21 4 Total (Resposta: 18,84) 2. O salário de 40 funcionários de um escritório está distribuído segundo o quadro abaixo. Calcule o salário médio desses funcionários. salários(R$) nº de funcionários 400 |---- 500 12 500 |---- 600 15 600 |---- 700 8 700 |---- 800 3 800 |---- 900 2 (Resposta: 570) 22 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exercícios complementares: 1) Calcule a média aritmética das séries abaixo: a) 1, 2, 8, 10, 12, 16, 21, 30 (Resposta: 12,5) b) 5, 6, 6, 10, 11, 11, 20 (Resposta: 9,86) c) 3, 4, 7, 8, 9, 23, 12, 15 (Resposta: 10,12) 2) Uma imobiliária gerencia o aluguel de residências particulares, segundo o quadro abaixo. Calcule o aluguel médio. aluguel(R$) nº de casas 0 |---- 200 30 200 |---- 400 52 400 |---- 600 28 600 |---- 800 7 800 |---- 1000 3 (Resposta: 335) Medidas de tendência central: moda e mediana Apesar de ser bastante utilizada a média aritmética nem sempre é a medida mais adequada para se analisar um agrupamento de dados. Veja o exemplo: Numa certa empresa com 200 empregados, os salários são os seguintes: Salário (x salário mínimo) nº de empregados 1 100 2 30 3 30 4 5 5 25 10 5 25 3 40 2 23 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Calculando o salário médio desses empregados, obtemos 3 salários mínimos. Esse número está correto do ponto de vista aritmético, mas não é representativo da condição salarial da maioria dos empregados. Afinal, 130 (65% do total) deles, ganham menos do que esse valor.Por outro lado, de acordo com a tabela, 5 empregados (2.5%) ganham mais do que 20 salários mínimos, o que “puxa” a média para cima. Nesse caso, é mais conveniente usarmos outro tipo de medida como valor representativo do salário dos empregados. É o que veremos agora! Moda (Mo): Dada uma coleção de números, a moda é o valor que ocorre com maior frequência. Assim, no exemplo acima, o salário mais frequente é o salário mínimo que é recebido por 100 empregados, isto é, 1 salário mínimo. Observações: 1.) Existem casos em que a moda não existe – os valores não se repetem ou todos os valores têm a mesma frequência (distribuição amodal). 2.) Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser bimodal, trimodal etc. 1º Caso: Dados não agrupados: É o valor de maior frequência em um conjunto de dados ou que aparece mais vezes. Exemplo: 7, 8, 8, 9, 10, 10, 10, 12, 15. Exemplo: 3, 5, 8, 10, 12 e 13 Exemplo: 2, 2, 5, 5, 8, 9 24 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 2º Caso: Dados agrupados sem intervalos Basta identificar o elemento de maior frequência. Exemplo: xi Fi 0 2 2 4 3 5 4 3 6 1 3º Caso: Dados agrupados com intervalos Nesse caso, consideramos como moda o valor compreendido entre os limites da classe modal, ou seja, aquela que apresenta a maior frequência. Tal valor é dado por: Mo = hl 21 1 i + + onde: il = limite inferior da classe modal 1 = diferença entre a frequência (Fi) da classe modal e a imediatamente anterior 2 = diferença entre a frequência (Fi) da classe modal e a imediatamente posterior. h = amplitude da classe Exemplo: Dada a tabela: Classe Fi 0 |----- 10 1 10 |----- 20 3 20 |----- 30 6 30 |----- 40 2 25 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 1º Passo: Identifica-se a classe modal (aquela que possui maior frequência). 2º Passo: Aplica-se a fórmula. il = 1 = 2 = h = Mediana ( )x~ : Dada uma coleção de números colocados em ordem crescente, a mediana ( x~ ) é o valor que divide a amostra em duas partes iguais: 0 50% 100% x~ (50% dos valores da série são valores menores ou iguais a x~ e 50% dos valores da série são valores maiores ou iguais a x~ ) 1º caso: Dados não agrupados Quando temos um número ímpar de elementos, dispostos em ordem crescente, a mediana é definida como sendo o elemento central, de ordem 2 1n + . Se a coleção tiver um número par de elementos, também dispostos em ordem crescente, a mediana é definida como a média aritmética dos dois valores centrais, de ordens .1 2 n e 2 n + 26 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exemplos: 1.) Dada a amostra: 5, 13, 10, 2, 18, 15, 6, 16 e 9 2.) Dada a amostra: 2, 6, 7, 10, 12, 13, 18 e 21 2º caso: Dados agrupados sem intervalos Basta considerar a frequência acumulada e localizar a mediana procedendo da mesma forma que no caso anterior. Exemplos: 1.) Dada a distribuição: xi Fi 12 1 14 2 15 1 16 2 17 1 20 2 Total 9 27 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 2.) Dada a distribuição: xi Fi Fac 7 6 10 12 15 15 20 24 23 9 Total 66 3º caso: Dados agrupados com intervalos Nesse caso, devemos inicialmente localizar a classe mediana. Para isso seguimos os seguintes passos: 1º Passo: Calculamos a ordem 2 n . Independente se n é par ou ímpar. 2º Passo: Pela Fac identificamos a classe que contém a mediana (classe Md). 3º Passo: Utilizamos a fórmula: h. F f 2 n lx~ Md i − += Onde: il = limite inferior da classe mediana n = tamanho da amostra ou número de elementos =f soma das frequências anteriores à classe mediana h = amplitude da classe mediana FMd = frequência da classe mediana 28 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Exemplo: Dada a tabela: Classe Fi Fac 3 |---- 6 2 2 6 |---- 9 5 7 9 |---- 12 8 15 12 |---- 15 3 18 15 |---- 18 1 19 Total 19 1º Passo: Calcula-se 2 n . 2º Passo: Identifica-se a classe mediana pela Fac. 3º Passo: Aplica-se a fórmula. il = =f h = FMd = Interpretação: 50% dos valores da série são valores menores ou iguais à mediana e 50% dos valores da série são valores maiores ou iguais à mediana. Exercícios propostos: 1. Calcule a moda das distribuições abaixo: a) xi Fi 2 1 3 7 4 2 5 2 Total (Resposta: 3) 29 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ b) Xi Fi 17 3 18 18 19 17 20 8 21 4 Total (Resposta: 18) 2. A distribuição abaixo representa o consumo em Kg de um produto colocado em oferta em um supermercado. Calcule a moda: consumo nº de clientes 0 |---- 1 12 1 |---- 2 15 2 |---- 3 21 3 |---- 4 32 4 |---- 5 20 (Resposta: 3,48) 3. Calcule a mediana das distribuições abaixo: a) xi Fi 2 5 4 20 5 10 6 10 8 2 Total (Resposta: 4) b) 30 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ xi Fi 17 3 18 18 19 4 20 3 21 2 Total (Resposta: 18) 4. Determine o valor mediano da distribuição a seguir que representa os salários dos funcionários selecionados em uma empresa: salários (R$) nº funcionários 200 |---- 400 2 400 |---- 600 6 600 |---- 800 10 800 |---- 1000 5 (Resposta: 670) Exercícios complementares: 1) Calcule a moda para as séries abaixo: a) 2, 2, 3, 4, 5, 5, 5, 7 (Resposta: 5) b) 3, 4, 4, 5, 9, 12, 12 (Resposta: 4 e 12) c) 5, 7, 9, 11, 13 (Resposta: não existe) 2) A distribuição abaixo representa o número de acidentes de trabalho por dia em uma indústria Petroquímica, verificados durante um mês. Calcule a moda: nº de acidentes nº de dias 0 |----2 20 2 |---- 4 6 4 |---- 6 3 6 |---- 8 1 (Resposta: 1,18) 31 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 3) Calcule a mediana das sequencias abaixo: a) 2, 5, 8, 10, 12, 15, 18, 20, 21, 25 (Resposta: 13,5) b) 7, 3, 10, 4, 5, 7, 8 (Resposta: 7) 4) Uma loja de departamentos selecionou um grupo de 54 notas fiscais, durante um dia e obteve o seguinte quadro. Calcule a mediana. consumo nº notas 0 |---- 50 10 50 |---- 100 28 100 |---- 150 12 150 |---- 200 2 200 |---- 250 2 (Resposta: 80,36) 5) A distribuição de frequências nos fornece, por faixa etária, a frequência com que ocorre determinada doença, para um grupo de 100 pessoas estudadas, com idades entre 16 e 48 anos. Calcule a média, a moda e a mediana. Idade Fi 16 |---- 20 9 20 |---- 24 18 24 |---- 28 26 28 |---- 32 14 32 |---- 36 10 36 |---- 40 9 40 |---- 44 8 44 |---- 48 6 Total (Resposta: média = 29,48; moda = 25,6; mediana = 27,54) 32 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Medidas de dispersão “Se uma pessoa comeu dois sanduiches e outra não comeu nenhum, em média cada uma comeu um sanduiche.” Essa frase,que tem relação com a Estatística, não agradaria muito aquele que ficou com fome. Ao fazer a média, há sempre informação que se perde. A média, apesar de ser uma medida muito utilizada em Estatística, é muitas vezes insuficiente para caracterizar aceitavelmente uma distribuição. A moda e a mediana também são medidas que nem sempre são suficientes para caracterizar um conjunto de dados. Em alguns casos, temos que recorrer a outros parâmetros que são chamados medidas de dispersão. As medidas de dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno da média. Servem para medir a representatividade da média. Exemplo: Sejam as séries: a) 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 b) 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 c) 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 Esses dados possuem a mesma média 13. No entanto, são sequencias completamente distintas do ponto de vista da variabilidade de dados. Na série “c” não se tem dispersão. Comparando-se as séries “a” e “b”, percebe-se que “a” apresenta maior dispersão em torno da média do que “b”. Isso indica que necessitamos de outro tipo de medida para distinguir e comparar os três conjuntos de dados. O critério frequentemente usado para tal fim é aquele que mede a maior ou menor dispersão dos dados em torno da média e as medidas mais usadas são: o desvio médio, a variância, o desvio padrão e o coeficiente de variação. 33 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ 1. Desvio Médio (Dm): É a análise dos desvios em torno da média. Calculamos inicialmente a média da amostra ( x ). Em seguida identificamos a distância de cada elemento da amostra para sua média: (xi - x ) Finalmente, calculamos o desvio médio: |di| = |xi - x |, logo o desvio médio será n Fxx ou n Fd iiii − onde xi é a variável, x a média e n o número de dados da amostra. Dessa forma, o desvio médio é a média aritmética dos valores absolutos dos desvios. Exemplo: Dada a amostra: xi Fi xiFi |di|=|xi - x | |di|Fi 2 5 3 4 5 4 6 2 7 3 Total 18 2. Variância (Var): É a média aritmética dos quadrados dos desvios. Logo: n Fidi Var 2 = Exemplo: No caso da tabela acima, temos: 34 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ xi Fi xiFi |di|=|xi - x | di2 di 2Fi 2 5 10 2,17 3 4 12 1,17 5 4 20 0,83 6 2 12 1,83 7 3 21 2,83 Total 18 75 3. Desvio Padrão (Dp): Como para calcular a variância trabalhamos com os quadrados dos desvios, podemos ter uma incompatibilidade em relação às unidades dos valores da variável considerada. Para contornar esse problema, temos o desvio padrão que é a raiz quadrada da variância: Dp = Var Exemplo: No caso da tabela acima, temos: Resumindo: a distribuição possui média 4,17. Isto é, seus valores estão em torno de 4,17 e seu grau de concentração é de 1,72, medido pelo desvio médio e de 1,86, medido pelo desvio padrão. 4. Coeficiente de variação (CV): O desvio padrão por si só não nos diz muita coisa; para contornar esta dificuldade, usamos o coeficiente de variação. Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É expresso em porcentagens e dado por: CV = x Dp . 100 (onde Dp é o desvio padrão e x a média da distribuição) 35 Estatística Profª Maira Mendias Lauro __________________________________________________________________________ Diz-se que a distribuição possui pequena variabilidade (dispersão) quando o CV der até 15%; média dispersão quando estiver acima de 15% até 30% e grande dispersão quando superar 30%: Baixa dispersão: CV 15% Média dispersão: 15%