Baixe o app para aproveitar ainda mais
Prévia do material em texto
Medidas Descritivas Unidade I - Aula 04 Disciplina: Cálculo das Probabilidades e Estatística I Professor: ELMIRO 2015-1 UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE CIÊNCIA EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATÍSTICA Introdução Vimos anteriormente que é possível sintetizar um conjunto de dados sob a forma de tabelas, gráficos e distribuições de frequências. Podemos, e na maioria das vezes, temos o interesse de apresentar esse conjunto de dados através de medidas descritivas únicas que sintetizem as características destes dados. Para tanto utilizamos um grupo de medidas estatística que representam um conjunto de dados de forma condensada. São ela as medidas de posição e de dispersão. Continuação 1. Medidas de posição Aqui, vamos aprender o cálculo de medidas que possibilitem representar um conjunto de dados (valores de uma variável quantitativa, isto é, informações numéricas), relativos à observação de determinado fenômeno de forma reduzida. Estes índices estatísticos são as Medidas de posição e, dentre as mais importantes, citamos as Medidas de Tendência Central, que recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendência central, destacamos: a Média aritmética ou Média; a Moda; a Mediana. Continuação 1. Média aritmetica (ou simplesmente Média) Definição: Dado um conjunte de dados constituída de N elementos, X1, X2, ..., XN sua média, denotada por , mede o valor médio do conjunto de dados, é expressa na mesma unidade, e definida por: A média aritmética de X é dada por: Continuação... Para dados agrupados por valor a média é calculada por: onde: fi representa a frequência da classe i Obs.: A expressão acima é usada tanto no caso de distribuição de frequências por valores, como para dados agrupados em classes. No segundo caso, o xi representa o ponto médio da classe i. Exemplo1: Calcule a média para a seguinte conjunto de dados: 3, 7, 8, 10, 11. n fx X ii Continuação... Exemplo 2: Calcule a média para as distribuições de frequancia abaixo xi fi 2 8 3 2 5 4 8 6 20 ALTURAS (m) fi 1,52 I---- 1,57 4 1,57 I---- 1,62 14 1,62 I---- 1,67 10 1,67 I---- 1,72 14 1,72 I---- 1,77 16 1,77 I---- 1,82 5 1,82 I----I1,87 10 TOTAL 73 Continuação... Propriedades da Média. A soma algébrica dos desvios de um conjunto de números em relação a média aritmética é zero. Quando somamos ou subtraímos uma constante aos valores de uma variável, a média fica aumentada ou diminuída dessa constante. Quando multiplicamos ou dividimos todos os valores de uma variável por uma constante, a média fica multiplicada ou dividida por essa constante. Continuação... Média ponderada Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente a mesma importância ou o mesmo peso. No entanto, existem casos onde as ocorrências têm importância relativa diferente. Nestes casos, o cálculo da média deve levar em conta esta importância relativa ou peso relativo. Exemplo: As aplicações mais comuns no mercado financeiro são: Poupança, Certificado de Depósito Bancário (CDB), Recibo de Depósito Bancário (RDB) e os Fundos de Investimento. Uma multinacional decide aplicar parte do seu lucro em três diferentes aplicações no período de um ano. Segue abaixo o montante aplicado em cada uma das aplicações no período. Qual foi a rentabilidade média (em percentual) da empresa com as aplicações no final do período? Continuação... Tipos de Aplicações Valor das Aplicações Rentabilidade Poupança R$ 250.000,00 7% CDB R$ 100.000,00 11% RDB R$ 80.000,00 12% Continuação... VANTAGENS E DESVANTAGENS DO USO DA MÉDIA 1. É uma medida de tendência central que por uniformizar os valores de um conjunto de dados, não representa bem os conjuntos que revelam tendências extremas. Ou seja, é grandemente influenciada pelos valores extremos (grandes) do conjunto. 2. Não pode ser calculada para distribuições de frequências com limites indeterminados (indefinidos). 3. É o promédio mais conhecido e de maior emprego. 4. É facilmente calculável. 5. Pode ser tratada algebricamente (ver propriedades). 6. Serve para compararmos conjuntos semelhantes. 7. É particularmente indicada para séries (conjuntos) que possuem os valores simétricos em relação a um valor médio e de frequência máxima. 8. Depende de todos os valores do conjunto de dados. , Continuação... 2. Moda É o valor (ou valores) mais frequente na distribuição de valores, e será denotado por MO. • Se todos os valores se repetem a mesma quantidade de vezes, dizemos que não há moda, ou seja, a distribuição é amodal; (figura a) • Se um valor ocorre com mais frequência, dizemos que a distribuição é unimodal; (figura b) • Se dois valores se repetem a mesma quantidade de vezes e com mais frequência, dizemos que a distribuição é bimodal. (figura c) • Se mais de dois valores se repetem a mesma quantidade de vezes e com a mesma frequência, dizemos que a distribuição é multimodal. Continuação... Exemplo: Determine a moda dos seguintes conjuntos de dados abaixo a) 2, 2, 3, 3, 5, 5, 8, 8 Não existe moda. b) 2, 2, 3, 5, 5, 5, 8, 8 Mo = 5 c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5 Cálculo da Moda para valotres em distribuiçao de frequência por intervalo Em uma distribuição de frequências com dados agrupados em classes, denominamos classe modal à que possui a maior frequência, e, conseqüentemente, será esta classe que conterá a moda. Exercício... FÓRMULA de CZUBER (interpretação geométrica através de Histograma) onde: Lmo : limite inferior da classe modal hmo : amplitude da classe modal 1 = fmodal - fanterior 2 = fmodal - fposterior momo hLMo 21 1 Continuação... Exemplo: Determinar a ALTURA MODAL para a distribuição de frequência abaixo; Classe modal ALTURAS (m) fi 1,52 I---- 1,57 4 1,57 I---- 1,62 14 1,62 I---- 1,67 10 1,67 I---- 1,72 14 1,72 I---- 1,77 16 1,77 I---- 1,82 5 1,82 I----I1,87 10 TOTAL 73 Continuação VANTAGENS E DESVANTAGENS DA MODA 1. Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a modificação de alguns deles. 2. Não é influenciada por valores extremos (grandes) do conjunto de dados. 3. Pode ser calculada para distribuições com limites indeterminados (indefinidos) na maioria dos casos Continuação... 3. MEDIANA Considere uma série (conjunto de dados) ordenada, constituído de n valores. A mediana, denotada Me, é o valor que divide o conjunto em duas partes iguais, isto é, em duas partes de 50% cada). Exemplos: 1. Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13 (n = 7 ímpar) Me = 8 (termo de ordem central) Continuação... 2. Calcular a mediana do seguinte conjunto de dados: 2, 3, 5, 8, 9, 11, 13, 15 (n = 8 par) 𝑀𝑒 = 8 + 9 2 = 8,5 Verificamos que, estando ordenados os valores de uma série (conjunto de dados) e sendo n o número de elementos da série, o valor mediano será: o termo de ordem central 𝑛+1 2 , se n for ímpar a média aritmética dos termos de ordem , se n for ímpar (Média aritmética dos termos de ordens centrais) 1 2 e 2 nn CÁLCULO DA MEDIANA NUMA DISTRIBUIÇÃO DE FREQUÊNCIAS a) Dados Não-agrupados Neste caso, para a série de valores ordenados em ordem crescente de grandeza (isto é, em um rol), a mediana é o valor médio ou amédia aritmética dos valores centrais, caso tenhamos um número ímpar ou par de valores na série. b) Dados Agrupados em Classes No caso de dados agrupados, relembramos que uma distribuição de frequências pode ser representada por meio de um Histograma. Dizemos então que a mediana será o valor de X (abscissa) cuja ordenada divide a área total do Histograma em duas partes iguais. Continuação... Continuação... Assim, para dados agrupados, a mediana é obtida através de interpolação de acordo com a seguinte fórmula: Onde: me me ant me h f F n LMe 2 Lme = limite inferior da classe mediana; fme = frequência simples da alasse mediana; Fant = frequência acumulada anterior a clase mediana e hme = aplitude da classe da mediana. Representação Gráfica Exemplo: Determine a ALTURA MEDIANA dos 73 estudantes de Introdução à Estatística do Período 13.2. Classe da mediana Lme = 1,67 fme = 14 Fant = 28 hme = 0,05 ALTURAS (m) fi Fai 1,52 I---- 1,57 4 4 1,57 I---- 1,62 14 18 1,62 I---- 1,67 10 28 1,67 I---- 1,72 14 42 1,72 I---- 1,77 16 58 1,77 I---- 1,82 5 63 1,82 I----I1,87 10 73 TOTAL 73 37 2 173 2 1 n 70,105,0 14 285,36 67,1 Me Continuação... VANTAGENS E DESVANTAGEM DA MEDIANA • A mediana não é influenciada por valores extremos (grandes) de uma série ou conjunto de dados. • A mediana de uma série de dados agrupados de classes extremas indefinidas pode ser calculada. Medidas de dispersão MEDIDAS DE DISPERSÃO Definição: São medidas estatísticas que medem a variação ou a dispersão dos valores de um conjunto de dados. Principais tipos: • Amplitude total; • Variância; • Desvio Padrão; • Coeficiente de Variação. 1. Amplitude total Medida já apresentada na elaboração de uma distribuição de frequências com dados agrupados em classes, denotamos por AT AT = Xmáx - Xmín, onde: Xmáx=maior valor observado e Xmín=menor valor observado. 2. Variância A variância de um conjunto de dados (amostra ou população) mede a variabilidade do conjunto em termos de desvios quadrados em relação à média aritmética do conjunto. É uma quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. Continuação... Continuação... N μX σ 2 i2 1n xx s 2 i2 6,5 15 5857555352 1n xx s 22222 2 i2 Continuação... 3 - Desvio padrão É uma outra medida de dispersão mais comumente empregada do que a variância, por ser expresso na mesma unidade do conjunto de dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variância. Desvio Padrão = + (Raiz quadrada positiva da Variância) • Populacão: • Amostra: Variância N μX σ 2 i 2i 1n xx s Continuação... 1. Observação As medidas, calculadas a pertir da amostra, são denominadas ESTATÍSTICAS, e são estimativas dos PARÂMETROS POPULACIONAIS , e 2 que na maioria das são desconhecidos ,2ses,x CONJUNTO MEDIDAS POPULAÇÃO (parâmetros) AMOSTRA (estatísticas) Média Variância 2 s2 Desvio Padrão s x Continuação... CÁLCULO DA VARIÂNCIA EM UMA DISTRIBUIÇÃO DE FREQUÊNCIAS (Dados em distribuição de frequência) OBS.: No caso de dados agrupados os são os pontos médios de classes. 1n fxx s i 2 i2 ix Continuação... Exemplo: Determine a VARIÂNCIA e o DESVIO PADRÃO para a distribuição de frequancia abaixo Sabemos que: Logo: A variância é: m2 ALTURAS (m) fi xi fi xi fi 1,52 I---- 1,57 4 1,55 06,20 0,0225 0,090 1,57 I---- 1,62 14 1,60 22,40 0,0100 0,140 1,62 I---- 1,67 10 1,65 16,50 0,0025 0,025 1,67 I---- 1,72 14 1,70 23,80 0,0000 0,000 1,72 I---- 1,77 16 1,75 28,00 0,0025 0,040 1,77 I---- 1,82 5 1,80 09,00 0,0100 0,050 1,82 I----I1,87 10 1,85 18,50 0,0225 0,025 TOTAL 73 - 124,40 - 0,730 2i xx 2 i xx 1,70x 0,01 72 0,73 1n fxx s i 2 i2 Continuação... Como o Dsevio pardão é a raiz quadrada positiva da Variancia, teremos: 0,1s Variância Continuação... 3 – Coeficiente de Variação É uma quantidade adimensional e serve para comparar dois ou mais conjuntos de dados de unidades diferentes. Mede a "DISPERSÃO RELATIVA" de um conjunto de dados. É expresso, usualmente, em percentagem ( % ). • Populacão: • Amostra: 100 μ σ CV 100 x s CV É importante expressar a variabilidade em termos relativos porque, por exemplo, um desvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10. Observe também que o coeficiente de variação é adimensional e por este motivo permite a comparação das variabilidades de diferentes conjuntos de dados. Continuação... Importância do Coeficiente de Variação VALORES MÉDIA D.P. C.V. 1 - 2 - 3 2 1 50 % 100 - 200 - 300 200 100 50 % 101 - 102 - 103 102 1 1 % Continuação... Exemplo: Determine o COEFICIENTE DE VARIAÇÃO para a distribuição de frequência abaixo. Do item anterior sabemos que: e Logo: ALTURAS (m) fi xi fi xi fi 1,52 I---- 1,57 4 1,55 06,20 0,0225 0,090 1,57 I---- 1,62 14 1,60 22,40 0,0100 0,140 1,62 I---- 1,67 10 1,65 16,50 0,0025 0,025 1,67 I---- 1,72 14 1,70 23,80 0,0000 0,000 1,72 I---- 1,77 16 1,75 28,00 0,0025 0,040 1,77 I---- 1,82 5 1,80 09,00 0,0100 0,050 1,82 I----I1,87 10 1,85 18,50 0,0225 0,025 TOTAL 73 - 124,40 - 0,730 1,70x 0,1s 5,88%100 1,70 0,1 100 x s CV 2 i xx 2 i xx Continuação... CONSIDERAÇÕES GERAIS O conjunto de todos os possíveis elementos de uma determinada pesquisa constitui uma população estatística. Sua média é a média populacional, usualmente representada pela letra grega μ. Na grande maioria das situações práticas, a média populacional é desconhecida e deve ser estimada a partir de dados amostrais. Se a amostra for extraída de forma adequada, a média amostral é uma boa estimativa de μ. A amplitude, apesar de ser muito fácil de calcular, tem a desvantagem de levar em consideração apenas os dois valores extremos (máximo e mínimo) da massa de dados, desprezando os demais. A variância populacional é representada por σ2. Usualmente, a variância populacional é desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extraída de forma adequada, a variância amostral s2 é uma boa estimativa de σ2. As medidas , s2 e s tomadas na amostra, são denominadas ESTATÍSTICAS, e são estimativas dos PARÂMETROS POPULACIONAIS μ, σ2 e σ (supostos desconhecidos). x x Continuação... Exemplo 1: Na tabela abaixo encontra-se a estrutura do produto interno bruto do Brasil, em bilhões de reais, segundo as atividades econômicas. Em qual dos setores ocorre a maior variabilidade? PERÍODO AGROPECUÁRIA INDÚSTRIA SERVIÇOS 2002 6,6 27,1 66,3 2003 7,4 27,8 64,8 2004 6,9 30,1 63 2005 5,7 29,3 65 2006 5,5 28,8 65,8 2007 5,6 27,8 66,6 Continuação... Exemplo 2: Uma certa empresa que fabrica duas linhas de produtos (A e B) necessita reestruturar sua produção. Foi realizado um estudo para tal finalidade e uma das variáveis consideradas foi VENDA (quantidade mensal) de cada tipo de produto (A e B). Para este estudo foi tomado como referência o primeiro semestre de determinado ano, onde foram verificados as seguintesVENDAS: a) Em relação a esta variável, qual dos produtos (A ou B) apresentou maior estabilidade nas VENDAS mensais? b) A empresa decide penalizar a equipe que obteve, em algum mês, um volume de venda inferior a -1,5s. Alguma equipe foi penalizada? PRODUTO A 13 32 28 25 24 25 PRODUTO B 25 20 29 30 26 20 x
Compartilhar