Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística e Probabilidade Prof. Me. Diego Souza Medidas de Tendência, Posição e Separatrizes O estudo que fizemos sobre distribuições de frequência, até agora, permite-nos descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Dessa forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual. Para ressaltar, porém, as tendências características de cada distribuição, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem através de números, que nos permitam traduzir essas tendências. 2 Média A medida de tendência central mais popular é a que o leigo chama de “média” e o Estatístico denomina média aritmética ou, também, simplesmente média. A média é definida como: A média de n números é sua soma dividida por n. ҧ𝑥 = σ𝑥𝑖 𝑛 Com esta fórmula iremos calcular a média, apenas quando se tratar de dados brutos, ou seja, não agrupados. 3 Média • A média pode ser calculada para qualquer conjunto de dados numéricos e, portanto, sempre existe. • Qualquer conjunto de dados numéricos tem uma, e uma só, média e, portanto, é sempre única. • A média se presta a outros tratamentos estatísticos; por exemplo, como veremos, as médias de vários conjuntos de dados podem ser sempre combinadas em uma média global de todos os dados. 4 Média • A média é relativamente confiável, no sentido de que as médias de amostras repetidas extraídas da mesma população geralmente não flutuam, ou variam, tanto quanto outras medidas estatísticas usadas para estimar a média de uma população. • A média leva em conta todos os elementos de um conjunto de dados. 5 Média Nove alunos de um colégio que foram numa excursão ao zoológico têm 18, 16, 16, 17, 18, 15, 17, 17 e 17 anos de idade e o professor de Biologia que os acompanhou tem 49. Qual é a idade média das dez pessoas na excursão? ҧ𝑥 = σ𝑥𝑖 𝑛 = ҧ𝑥 = 18 + 16 + 16 + 17 + 18 + 15 + 17 + 17 + 17 + 49 10 = 20 6 Média Observe, entretanto, que qualquer afirmação que se refira à idade média dos participantes da excursão como sendo de 20 anos pode ser facilmente mal interpretada. Para evitar a possibilidade de sermos induzidos ao erro por algum valor extremo (muito pequeno ou muito grande), pode ser recomendável omitir um tal dado estranho (o 49 de nosso exemplo), ou então usar uma outra medida estatística que não a média. 7 Média Ponderada Quando calculamos uma média e as grandezas em jogo não têm todas a mesma importância ou a mesma significância, podemos muito bem não estar obtendo uma medida estatística que nos diga o que estamos esperando descrever. Em outras palavras, podemos estar obtendo um resultado totalmente inútil. ҧ𝑥 = σ𝑤 ∗ 𝑥𝑖 σ𝑤 8 Média Ponderada Considere o seguinte exemplo: A cada quarta-feira, uma rede de supermercados (e presumivelmente outras redes também) anuncia suas ofertas especiais da semana, e nesta semana as ofertas incluem carne moída R$ 9,99 por Kg, contrafilé a R$ 14,99 por Kg e picanha a R$ 27,99 por Kg. Calcule o preço médio por quilograma desses três tipos de carne, sabendo que o supermercado vendeu 83,52 kg de carne moída, 140,72 kg de contrafilé e 35,60 kg de picanha. 9 Média Ponderada Resolução: ҧ𝑥 = σ𝑤 ∗ 𝑥𝑖 σ𝑤 = 9,99 ∗ 83,52 + 14,99 ∗ 140,72 + 27,99 ∗ 35,60 83,52 + 140,72 + 35,60 = 15,16 10 Média para dados agrupados Sem intervalos de classe Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: ҧ𝑥 = σ𝑥𝑖 ∗ 𝑓𝑖 σ𝑓𝑖 11 Média para dados agrupados Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: ҧ𝑥 = σ𝑥𝑖 ∗ 𝑓𝑖 σ𝑓𝑖 12 Moda Outra medida estatística por vezes utilizada para descrever o meio ou o centro de um conjunto de dados é a moda, definida simplesmente como o valor ou categoria que ocorre com a maior frequência e mais do que uma vez. As duas vantagens principais da moda são que não exige cálculo algum, apenas uma contagem, e que pode ser determinada tanto para dados numéricos quanto para categóricos. 13 Moda Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. • Amostras ou dados amodais • Amostras ou dados bimodais 14 Moda: dados agrupados Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. 15 Moda: dados agrupados Com intervalos de classe A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. 𝑀𝑜 = 𝑙 + 𝐿 2 16 Moda: dados agrupados • Lh = limite inferior da classe modal. • a = amplitude do intervalo de classe. • fh = frequência da classe modal. • f(h–1) = frequência da classe anterior à classe modal. • f(h+1) = frequência da classe posterior à classe modal. 17 Moda: quando usar a moda? • Quando desejamos obter uma medida rápida E aproximada de posição; • Quando a medida de posição deve ser o valor mais típico da distribuição. 18 Mediana Para evitar a possibilidade de sermos enganados por um ou alguns valores muito pequenos ou muito grandes, ocasionalmente descrevemos o “meio” ou “centro” de um conjunto de dados com outras medidas estatísticas que não a média. Uma dessas, a mediana de n valores, requer que primeiro ordenemos os dados de acordo com seu tamanho. Então definimos a mediana como: A mediana é o valor do elemento do meio se n é ímpar, e a média dos dois valores do meio se n é par. 19 Mediana • O valor da mediana pode coincidir ou não com um elemento da série, como vimos. • Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par. • A mediana e a média aritmética não têm, necessariamente, o mesmo valor. • A mediana é designada, muitas vezes, por valor mediano. 20 Mediana Para dados agrupados – sem intervalos de classe Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não agrupados, implicando, porém, a determinação prévia das frequências acumuladas. Ainda aqui, temos de determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. 21 Mediana Para dados agrupados – com intervalos de classe Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana. Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Outro método de cálculo da mediana é utilizando a fórmula a seguir: 22 Mediana 𝑴𝒅 = 𝒍 + 𝒂 𝒇𝒉 ( ൗ𝒏 𝟐 ∗ 𝑭𝒉−𝟏) • Md = mediana. • l = limite inferior da classe que contém a mediana. • a = amplitude do intervalo de classe. • fh = frequência da classe que contém a mediana. • n = número de dados no conjunto. 23 Mediana: quando usar? • Desejamos obter o ponto que divide a distribuição em partes iguais; • Há valores extremos que afetam de uma maneira acentuada a média; • A variávelem estudo é salário. 24 Qual medida usar? • A escolha da medida a ser utilizada para representar um conjunto de dados dependerá do objetivo da pesquisa e da forma em que se apresentam os dados a serem estudados. • A média não faz sentido para descrever dados qualitativos, como, por exemplo, o grau de satisfação dos clientes com os serviços prestados. 25 Qual medida usar? • A mediana pode ser mais adequada, quando existe uma grande variabilidade entre os dados quantitativos. E a moda é adequada quando se pretende lançar um produto novo no mercado, pois nesse caso estamos preocupados em pesquisar as necessidades da maioria das pessoas interessadas no produto. 26 Outras medidas de posição/separatrizes Quartis, decis e percentis Quartis Denominamos quartis os valores de uma série que a dividem em quatro partes iguais, com o mesmo número de elementos, de tal forma que cada intervalo do quartil contenha 25% dos elementos coletados. Há, portanto, três quartis: 28 Quartis • O primeiro quartil (Q1) - valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. • O segundo quartil (Q2) - evidentemente, coincide com a mediana (Q2 = Md). • O terceiro quartil (Q3) - valor situado de tal modo que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte (25%) é maior. 29 Quartis 30 Quartis 31 Para saber em que classe está o quartil Para saber o valor do quartil Decis • Nos decis, a série é dividida em dez partes iguais, com o mesmo número de elementos, de tal forma que cada intervalo do decil contenha 10% dos elementos coletados. • Os elementos separatrizes da série são: D1, D2, D3, D4, D5, D6, D7, D8 e D9. 32 Decis 33 Para saber em que classe está o decil Para saber o valor do decil Percentis Nos percentis, a série é dividida em 100 partes iguais (P1, P2, P3, ... Pn), de tal forma que cada intervalo do percentil contenha 1% dos elementos coletados. 34 Para saber em que classe está o percentil Para saber o valor do percentil POSITIVA Exercício de Aplicação PRÓXIMA AULA? • Medidas de Dispersão e Variabilidade
Compartilhar