Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE Prof. Lucio Borges de Araújo Aula 4 – Estatística Descritiva – Parte III 1 �Medidas de Dispersão: Também é conhecido como medidas de variabilidade. A Utilização de uma medida de posição para substituir um conjunto de dados é insuficiente para sintetizar a informação nele contida. A = { 10, 10, 10, 10, 10, 10, 10} B = { 7, 8, 10, 10, 10, 12, 13} C = { 1, 2, 10, 10, 10, 13, 24} 2 � Calculando a média, mediana e moda desse três conjuntos de têm-se: � São utilizadas para determinar as variações ou oscilações dos dados individuais em torno da média, da mediana e da moda, � Servem também para verificar a representatividade das medidas de posição. 3 � Exemplo: Seja o tempo de vida útil (meses) de duas marcas de baterias A e B : � Qual bateria utilizar? 4 2.4.8 AMPLITUDE TOTAL � É a diferença entre o maior e o menos valor observado: � Exemplo: vida util de baterias 5 PROPRIEDADES � É uma medida de dispersão fácil de ser calculada; � No seu cálculo não são considerados todas as observações; � São considerados apenas valores extremos (menos prováveis) 6 2.4.9 AMPLITUDE INTERQUARTILICA � Os quartis fornecem indicação quanto à forma como as observações se distribuem em torno da mediana. � Entre Q1 e Q3 eles existem 50% das observações centrais. Assim, quanto mais próximos estiverem estes quartis, maior será a concentração das observações em torno da mediana. � Amplitude interquartílica é definida como: 7 � Exemplo: Calcular a amplitude interquartílica para vida útil de baterias � Para marca A: Q1=10 e Q3=12 � Para marca B: Q1=9 e Q3=13 � Observação: Estas medidas são mais completas do que a amplitude total, porque usam dois valores menos extremos (Q1 e Q3). 8 2.4.10 VARIÂNCIA � Optou-se por utilizar a soma de quadrados dos desvios e dividindo pelo número de observações obtém-se a variância populacional � Quando estiver trabalhando com amostras, a variância é dada pela soma dos quadrados dos desvios dividida por (n - 1). Assim: 9 � Alternativamente: �� � �∑ �� ��� ���̅ ��� � Exemplo: Calcular a variância para vida útil de baterias(em meses) � OBSERVAÇÃO: Um inconveniente da variância é que ela é expressa em unidades ao quadrado. 10 2.4.11 DESVIO PADRÃO � Para resolver o problema da unidade da variância trabalha-se com o desvio padrão, que definido: � Exemplo: Calcular o desvio padrão para vida útil de baterias(em meses) 11 2.4.12 COEFICIENTE DE VARIAÇÃO � A variância e desvio padrão são medidas de dispersão absolutas; � Assim para comparar a variabilidade de dois ou mais conjuntos de dados é necessário que: 1. os conjuntos de dados tenham a mesma média; 2. tenham mesmo número de repetições; 3. que sejam expressos na mesma unidade; 12 � Então para comparar qualquer conjunto de dados relativos a sua variabilidade deve-se lançar mão de uma medida de dispersão relativa, que expressa a variabilidade dos dados em relação a sua média. O coeficiente de variação é definido como: 13 � Exemplo: Considere a tabela abaixo que se refere à temperatura ambiental e precipitação de um certa região. Deseja-se saber qual das duas variáveis possui maior dispersão. 14 � Exemplo: Considere os pesos (em kg) de uma amostra de meninos de 11 anos de idade e de uma amostra de homens de 25 anos de idade. 15 2.4.13 BOX PLOT (GRÁFICO DE CAIXAS) � O Box Plot é um gráfico que fornece uma visualização da distribuição dos dados; � Permitir detectar rapidamente uma possível assimetria dessa distribuição. � Sua construção é baseada nas seguintes medidas: na mediana, no primeiro e terceiro quartis, e nos valores extremos. � Esse gráfico tem as seguintes forma 16 17 � A caixa ("box") é delimitada pelo Q1 e Q3. A linha interior da caixa é a mediana (Q2). � A partir dos limites da caixa, considera-se duas linhas auxiliares que distam 1,5 o intervalo interquartil (Q=Q3-Q1) � Estas linhas servem para caracterizar os valores discrepantes que são os valores menores que C1=Q1-1,5Q ou valores maiores que C3=Q3+1,5Q � Os valores discrepantes serão representados no Gráfico com asteriscos (*). 18 OBSERVAÇÕES � A caixa contém 50% dos valores (25% de cada lado da mediana). Outros 50% dos valores estão praticamente divididos entre o "bigode“ direito e "bigode“ esquerdo. � Este gráfico é útil para informar a variabilidade e a simetria dos dados; � Também é útil para detectar diferenças entre o comportamento de variáveis; 19 � Exemplo: Construir o box-plot para vida útil de baterias � Para marca A: Q1=10, Q2= 11 e Q3=12 � Para marca B: Q1=9 , Q2= 11 e Q3=13 20
Compartilhar