Baixe o app para aproveitar ainda mais
Prévia do material em texto
MEDIDAS DESCRITIVAS/ESTATÍSTICAS Aula: 18 /03/ 2015 Após a organização dos dados em distribuições de frequências, onde tornou-se possível visualizar como uma variável se distribui, em termos dos dados observados, isto é, se ela localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual. MEDIDAS DESCRITIVAS/ESTATÍSTICAS Descreve um conjunto de dados de forma organizada e compacta, possibilitando a visualização deste conjunto por meio de suas estatísticas. MEDIDAS DESCRITIVAS/ESTATÍSTICAS Quando a variável em estudo é quantitativa, podemos resumir certas informações de seus dados por algumas medidas descritivas (estatísticas). MEDIDAS DESCRITIVAS/ESTATÍSTICAS MEDIDAS DESCRITIVAS: • Medidas de Posição; • Medidas de Dispersão; • Medidas de Assimetria; e • Medidas de Curtose. Primeiramente, estudaremos as medidas descritivas de Posição para dados não agrupados. MEDIDAS DE POSIÇÃO/CENTRO/TENDÊNCIA CENTRAL As medidas de posição recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de posição, destacaremos: MEDIDAS DE POSIÇÃO • A média aritmética; • A moda; • A mediana; As outras medidas de posição são as separatrizes, que englobam: MEDIDAS DE POSIÇÃO • A própria mediana; • Os quartis; • Os percentis; • Os decis; Em um conjunto de dados, podemos definir vários tipos de médias. No entanto, em nossos estudos iremos nos limitar à mais importante: a média aritmética: Média aritmética é o quociente da divisão da soma dos valores da variável pelo quantidade deles. n x x n i i 1 MÉDIA ARITMÉTICA ( 𝒙 ) Média Aritmética n x x n i i 1 FÓRMULA: , sendo: x → a média aritmética; xi → os valores da variável; n → quantidade de valores da variável; MÉDIA ARITMÉTICA - DADOS AGRUPADOS Exemplo 1: Sabendo-se que o número de visitantes em um museu, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 visitantes, determine o número médio de visitantes na semana: 7 12181615131410 x Logo, a média para os dados apresentados é de 14 visitantes. MÉDIA ARITMÉTICA - DADOS AGRUPADOS Exemplo 2: No conjunto de valores referentes ao número de viagens de oito turistas: 4, 5, 5, 6, 6, 7, 7 e 8. Determine o número médio de viagens destes turistas. 8 87766554 x viagensx 6 8 84 Ilustrando o comportamento da média do exemplo 2: 4 5 5 6 6 7 7 8 6x Observando a figura, verificamos que a média indica o centro de um conjunto de dados, ou seja, é o ponto de uma distribuição em torno do qual os valores acima dele se equilibram com os que estão abaixo. Exemplo 3: Entretanto, se o conjunto de valores do exemplo acima fosse formado pelos valores {4, 5, 5, 6, 6, 7, 7, 24},o que aconteceria com o valor da média? 8 247766554 x viagensx 8 8 64 Ilustrando o comportamento da média do exemplo 3: 4 5 5 6 6 7 7 24 8x Como podemos observar, a maioria dos valores observados ficou abaixo do valor da média, ou seja, o valor da média foi deslocado do centro da distribuição pelo valor observado extremo (24). Obs.: Ás vezes, a média pode ser um número diferente de todos os dados do conjunto que ela representa. É o que acontece quando temos os valores 2, 4, 8 e 10, para os quais a média aritmética é 6. Esse será o número representativo desse conjunto de valores, embora não esteja representado nos dados originais. MÉDIA ARITMÉTICA - DADOS AGRUPADOS MODA (Mo) - DADOS NÃO AGRUPADOS Denominaremos moda o valor que ocorre com maior frequência em um conjunto de dados. Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria. Exemplo 4: Dados os conjuntos a seguir, determine e classifique o valor modal: a) A = {1, 2, 2, 3, 4} b) B = {1, 1, 2, 2, 3, 4} MODA (Mo) - DADOS NÃO AGRUPADOS Mo = 2 Unimodal Mo1 = 1 Bimodal Mo2 = 2 c) C = {1, 2, 3, 4} d) D = {1, 2, 2, 3, 3, 4, 4, 5, 5} Amodal Polimodal e) H = ,,,, ,,,, ,,,, ,,,. Amodal MODA (Mo) - DADOS NÃO AGRUPADOS Obs.: A Moda é também a única das medidas de posição que faz sentido no caso das variáveis qualitativas. Mediana (Md) A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Cálculo da Mediana para dados não agrupados: Se n for número ímpar: O valor mediano será o termo de ordem dado pela fórmula: 2 1n Exemplo: Determine a mediana de A = {1, 2, 2, 3, 4} Md = 2 Se n for par: O valor mediano será a média entre os elementos centrais de ordem . 1 22 n e n MEDIANA Determine a Md de D = {1, 2, 2, 3, 3, 4, 4, 4, 5, 5} Obs.: Como medida de posição, a Mediana representa, de fato, o centro (meio) do conjunto de valores ordenados. Assim como a Média, o valor da Mediana não precisa coincidir com algum dos valores do conjunto de dados. COMPARAÇÃO ENTRE MODA, MEDIANA E MÉDIA Conforme vimos , a Média é a única das três medidas de posição apresentadas que leva em consideração todos os valores do conjunto na obtenção. Pela sua definição, somente é possível determinar o valor da média para variáveis quantitativas. Observamos que uma desvantagem da média é que ela é afetada pela presença de valores extremos, ou seja, se há um valor ou valores muito altos(s) ou muito baixo(s) dentro do conjunto de valores observados, a média se desloca para próximo desse extremo saindo do ponto de equilíbrio. COMPARAÇÃO ENTRE MODA, MEDIANA E MÉDIA MEDIANA VERSUS MÉDIA A mediana, como vimos, divide um conjunto ordenado de valores em duas partes iguais. Comparada com a média, que leva em consideração todos os valores do conjunto, a mediana apenas resume o que ocorre no centro do conjunto de valores. A mediana, entretanto, ao contrário da média, não é influenciada por valores extremos, pois o que utilizamos para localizá-la é a ordem dos elementos e não diretamente seus valores. Sendo assim, se um elemento do conjunto de dados tem os eu valor alterado (um erro, por exemplo), mas sua ordem continua a mesma, a mediana não sofre influência nenhuma. MEDIANA VERSUS MÉDIA MEDIANA VERSUS MÉDIA De maneira geral, o uso da mediana é indicado quando o conjunto de dados possui algumas poucas observações extremas (valores muito mais altos ou muito mais baixo que os outros). MODA VERSUS MÉDIA E MEDIANA A moda, como vimos, resume-se a identificar o valor ou valores observados que mais se repetem numa distribuição. A vantagem em relação à média e a à mediana é a possibilidade de analisarmos a moda numa variável qualitativa, verificando qual a categoria que mais aparece (maior frequência) no conjunto de dados. 1. Um certo cruzamento tem alto índice de acidentes de trânsito, conforme pode ser constatado em uma amostra dos últimos 12 meses: 5, 4, 7, 8, 5, 6, 4, 7, 9, 7, 6 e 8. Determine as medidas de tendência central. Exercícios 2. O número de espetáculos realizados pela SEC durante os cinco primeirosmeses de 2013 foram: 44 - 52 - 103 - 79 - 48 Determine as medidas de posição. 3. Para estudar pernoites médios (xi) na Província de Alicante, foram colhidos dados nos seguintes municípios turísticos escolhidos: Municípios Pernoites Venidorn 35 Alcoy 13 Elche 12 Elda 10 Determine as medidas de posição. MEDIDAS DE DISPERSÃO/VARIABILIDADE As medidas de posição não proporcionam um quadro completo quanto ao comportamento de um conjunto de dados, pois não informam sobre o grau de variação ou dispersão do dados observados em torno da média. Na maioria dos casos uma única medida é suficiente para descrever de modo satisfatório um conjunto de dados. Exemplo 5: Número de viagens de 3 grupos de turistas: 1 2 3 4 5 6 7 8 9 10 Grupo A 1 2 3 4 5 6 7 8 9 10 Grupo B 1 2 3 4 5 6 7 8 9 10 Grupo C OBSERVAÇÕES IMPORTANTES: i) Os 3 grupos possuem a mesma média. ii) Os números das viagens estão distribuídos sob diferentes formas. iii) A média resume o conjunto de dados apenas posição central. iv) A média não fornece informações sobre a variabilidade dos dados. Conclusão: Apresentar junto da média uma medida que sumarize a variabilidade dos conjuntos de dados. Dentre as medidas de dispersão, estudaremos o desvio padrão e o coeficiente de variação. E a amplitude total que já foi estudada. MEDIDAS DE DISPERSÃO/VARIABILIDADE DESVIO PADRÃO Esta medida leva em conta todas os dados observados e mede a dispersão desses dados em torno da média. FÓRMULA DO DESVIO PADRÃO: Dados Amostrais Dados Populacionais Exemplo 6: Determine o desvio padrão dos seguintes valores: 1, 3 e 2. Resolução: Primeiramente devemos calcular a média aritmética. 2 3 61 n x x n i i Agora podemos trabalhar a fórmula do desvio padrão para dados amostrais. EXERCÍCIOS 4. Considerando os dados do exemplo 5 (número de viagens), determine o desvio padrão para cada grupo de alunos, compare e o interprete. Grupo A: 4, 5, 6, 7, e 8. Grupo B: 5, 6, 6, 6, e 7. Grupo C: 2, 3, 8, 8, e 9. Podemos observar que ainda que dois conjuntos de dados apresentem a mesma média como valor típico. O desvio padrão aumenta de valor à medida que aumenta a dispersão em torno da média aritmética. Mesmo que o desvio padrão requeira uma sequência de etapas de operações matemáticas para o seu cálculo, podemos afirmar que é uma medida de dispersão de mais fácil interpretação. DESVIO PADRÃO Quanto maior for a dispersão em torno da média de um conjunto de dados maior é o valor do desvio padrão. DESVIO PADRÃO 5. Foram obtidos os tempos (em segundos) decorridos entre a formulação de um pedido e a entrega de um determinado sanduíche em uma lanchonete McTonalds. 135 90 85 121 83 69 159 177 120 133 90 80 70 93 80 110 Calcule média, mediana, moda, desvio padrão e coeficiente de variação. Interprete os resultados e comente sobre como está sendo o atendimento nesta loja. EXERCÍCIOS COEFICIENTE DE VARIAÇÃO (CV) Uma questão que surge com frequência, é se um desvio padrão é grande ou pequeno. A resposta a esta questão depende da ordem de grandeza da variável. A comparação também se torna difícil em situações onde as médias são muito desiguais. Nestes casos, é conveniente exprimir a dispersão em termos relativos, ou seja, expressar a dispersão dos dados tirando a influência da ordem de grandeza da variável. O Coeficiente de Variação é uma medida relativa de dispersão e representa o desvio padrão expresso como porcentagem da média. FÓRMULA DO CV: ou Quanto menor o CV de um conjunto de dados menor é a sua dispersão. O CV é uma medida adimensional, isto é, não depende da unidade de medida. Essa característica no permite usá-lo para comparar a variabilidade de conjuntos de dados medidos em unidades diferentes. CLASSIFICAÇÃO DO GRAU DE HOMOGENEIDADE ATRAVÉS DO CV Quanto menor o coeficiente de variação, mais homogênea é a variável naquele conjunto de dados. Uma classificação possível segundo Soares & Siqueira (2002,p.58) é a seguinte: • CV inferior a 0,10 (10%) indica dispersão baixa. • CV entre 0,10 a 0,20 (entre10% e 20%) indica dispersão média. • CV entre 0,20 a 0,30 (entre20% e 30%) indica dispersão alta. • CV superior a 0,30 (30%) indica dispersão muito alta. Obs.: Embora seja uma medida de dispersão bastante usada, o desvio padrão nem sempre é a medida mais adequada. Quanto a média não é a medida de posição mais indica (por causa da presença de valores extremos, por exemplo), o desvio padrão e, por consequência, o Coeficiente de Variação, também não são indicados para medir a dispersão, pois ambos dependem da média e sofrem dos mesmos problemas. Exemplo 7: Estaturas(em cm) e pesos (em kg) de um grupo de turistas. Variável Média Desvio Padrão Estatura 175 5 Peso 68 2 Qual das variáveis possui maior homogeneidade? Estatura Peso Logo, nesse grupo de indivíduos, a variável estatura apresenta menor grau de dispersão nos dados que a variável peso e ambas apresentaram dispersão relativa baixa. Na figura abaixo foi plotada a média (20,60 C), a média acrescida de mais um desvio-padrão e a média descontada de um desvio-padrão da série de dados de temperatura média diária do mês de dezembro de 2004 da estação do IAG, com o objetivo de mostrar que uma grande porcentagem (cerca de 68%) dos dados ficam entre os limites da média somada e diminuída de um desvio-padrão. Figura 3. Temperatura média diária do mês de dezembro de 2004 da estação do IAG (São Paulo), juntamente com a média da série e a média acrescida e diminuída de um desvio-padrão. Os dados em análise possuem desvio-padrão igual a 2.2. Exemplo: Média x Desvio padrão REFERÊNCIAS • COSTA, Suely de Souza; NASCIMENTO, Sonia Araújo e NETO, José Cardoso. Metodologia aplicada às Ciências Sociais. Manaus: UEA, 2006.
Compartilhar