Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/08/2018 1 ESTATÍSTICA DESCRITIVA PROF. ELSON DE JESUS ANTUNES JÚNIOR Estatística Descritiva É a parte da estatística que lida com a organização, resumo e apresentação de dados. Coleta, organização e apresentação de dados As mensurações que são realizadas em uma característica de interesse na população ou na amostra possuem uma característica denominada de VARIAÇÃO. 14/08/2018 2 Coleta, organização e apresentação de dados Esse fenômeno refere-se ao fato de que uma medida de um indivíduo tem grandes chances de ser diferente da medida dessa característica em outro indivíduo, além do que, antes de a medida ser realizada é praticamente impossível determinar ou fazer previsão do seu valor. Coleta, organização e apresentação de dados Os dados coletados numa forma sem ordenação e sem nenhum tipo de arranjo sistemático. DADOS BRUTOS Coleta, organização e apresentação de dados Dados brutos obtidos de uma amostra de 10 carros vendidos em função do tipo de transmissão, automática (A) ou manual (M). M A A A M A A M A A 14/08/2018 3 Coleta, organização e apresentação de dados Dados brutos de uma amostra da vida útil (h) de baterias da marca D. 3,65 21,26 3,87 24,57 1,38 5,67 9,79 12,56 4,54 6,79 13,19 4,14 3,78 15,60 6,23 12,13 17,12 19,68 5,64 8,21 Coleta, organização e apresentação de dados Essa representação de dados apresentada é pouco informativa. Para melhorá-la um pouco é possível ORDENAR em uma sequencia crescente ou decrescente ou AGRUPÁ-LOS quanto as suas categorias ou atributos. Coleta, organização e apresentação de dados Dados elaborados obtidos de uma amostra de 10 carros vendidos em função do tipo de transmissão, automática (A) ou manual (M). A A A A A A A M M M 14/08/2018 4 Coleta, organização e apresentação de dados Dados brutos de uma amostra da vida útil (h) de baterias da marca D. 1,38 3,65 3,78 3,87 4,14 4,54 5,64 5,67 6,23 6,79 8,21 9,79 12,13 12,56 13,19 15,60 17,12 19,68 21,26 24,57 Coleta, organização e apresentação de dados Frequência do tipo de transmissão escolhida na aquisição de um carro novo TIPO DE TRANSMISSÃO FREQUÊNCIA (Fi) AUTOMÁTICA 7 MANUAL 3 Coleta, organização e apresentação de dados Gráfico de setores (pizza) e barras mostrando formas alternativas para representação da escolha do tipo de transmissão do carro novo. 14/08/2018 5 Coleta, organização e apresentação de dados Ao se lidar com dados quantitativos contínuos não é possível efetuar o mesmo tipo de tratamento dispensado aos dados qualitativos e quantitativos discretos. Coleta, organização e apresentação de dados Para resolver o problema de apresentar a distribuição de dados quantitativos contínuos de uma forma resumida e manter o máximo de informação contida nela, será apresentada a DISTRIBUIÇÃO DE FREQUÊNCIAS para esse tipo de dados. Coleta, organização e apresentação de dados Nesse tipo de representação, os dados quantitativos contínuos são agrupados em classes de valores, das quais as frequências e os limites são apresentados em uma tabela. 14/08/2018 6 Coleta, organização e apresentação de dados O grande problema dessa representação é definir o número de classes ideal para agrupar um conjunto de dados de uma amostra. Coleta, organização e apresentação de dados Um critério empírico para isso que tem sido muito usado é o de considerar um número de classes entre 5 e 20, em função do conhecimento do investigador sobre os dados de sua pesquisa. Coleta, organização e apresentação de dados Normalmente, quanto maior o número de observações em um conjunto de dados, mais classes devem ser usadas. Uma regra prática razoável é número de classes (k) ≈ número de observações (n) 14/08/2018 7 Coleta, organização e apresentação de dados O próximo passo será determinar o tamanho de uma classe específica. O tamanho da classe é denominado de amplitude de classe e representado por c. c = A k − 1 Sendo: A = amplitude [A = X(n) – X(1)] Coleta, organização e apresentação de dados O limite da primeira classe (LI1) é definido por: LI1 = X 1 − c 2 Coleta, organização e apresentação de dados O limite superior da primeira classe é então obtido somando-se, ao limite inferior dessa classe, a amplitude de classe. O limite inferior da segunda classe é igualado ao limite superior da primeira classe. O limite superior dessa classe é obtido somando-se a amplitude de classe ao limite inferior. 14/08/2018 8 Coleta, organização e apresentação de dados Distribuição de frequência da vida útil (h) para uma amostra de n=20 baterias. Fi = frequência dos indivíduos Fri = frequência relativa Fpi = frequência percentual Classe de tempo (h) 𝑿i Fi Fri Fpi -2,49 ˫ 5,25 1,38 6 0,30 30 5,25 ˫ 12,98 9,11 8 0,40 40 12,98 ˫ 20,71 16,84 4 0,20 20 20,71 ˫ 28,44 24,57 2 0,10 10 Medidas de tendência central Pela concentração de dados de um conjunto de mensurações nas proximidades de alguns valores, verifica-se que esses valores podem ser usados para representar todos os dados. Em outras palavras, é possível afirmar que alguns valores podem ser representantes do conjunto de mensurações. Medidas de tendência central MÉDIAARITMÉTICA A média é a soma das observações dividida pelo número delas. 𝑋 = 𝑖=1 𝑛 𝑋𝑖 𝑛 14/08/2018 9 Medidas de tendência central Para dados agrupados em uma tabela de distribuição de frequências, a média para esse caso é apresentada na equação a seguir: 𝑋 = 𝑖=1 𝑛 𝐹𝑖 𝑋𝑖 𝑛 Em que 𝑋i é o ponto médio Fi é a frequência da classe i, para i = 1, 2,... , k; k é o número de classes. Medidas de tendência central MEDIANA É uma medida típica de tendência central, sendo definida em um conjunto de dados ordenados como o valor central, ou seja, o valor para o qual há tanta mensurações que o superam quanto são superados por ele. Medidas de tendência central MEDIANA X 𝑛+1 2 se n for ímpar md = X 𝑛 2 + X 𝑛+2 2 2 se n for par 14/08/2018 10 Medidas de tendência central MODA A moda é uma dessas medidas típicas de tendência central, sendo definida de uma forma mais grosseira em um conjunto de dados como o valor mais frequente. Analise... Consumo de combustível de três carros. Qual o consumo médio de cada carro? Qual o melhor? A B C 14,27 13,44 11,27 14,60 13,76 13,30 14,72 14,55 13,50 14,95 14,86 15,25 14,99 15,30 15,44 15,17 15,42 15,51 15,21 15,81 15,72 15,42 15,89 16,04 15,63 15,94 16,39 16,00 15,99 18,54 Medidas de dispersão e variabilidade AMPLITUDE A diferença entre a maior e a menor observação é denominada de amplitude (A). 14/08/2018 11 Medidas de dispersão e variabilidade DEVIOMÉDIO É possível considerar conjuntos de dados com a mesma amplitude, mas com diferentes estruturas de variação de seus valores intermediários. É possível expressar a variabilidade de um conjunto de dados em termo de desvios da média. Medidas de dispersão e variabilidade DEVIOMÉDIO Assim, o desvio médio será definido com sendo a média dos desvios absolutos em relação à média da amostra. Medidas de dispersão e variabilidade DEVIOMÉDIO 𝑆| 𝑋| = 𝑖=1 𝑛 𝑋𝑖 − 𝑋 𝑛 14/08/2018 12 Medidas de dispersão e variabilidade VARIÂNCIA A variância é definida dividindo-se a soma de quadrados de desvios pelo grau de liberdade da amostras, ou seja, n – 1. A unidade da variância não é a mesma de cada mensuração. Essa unidade não tem significado físico por estar ao quadrado. Medidas de dispersão e variabilidade VARIÂNCIA 𝑆2 = 𝑆𝑄 𝑛 − 1 = 𝑖=1 𝑛 𝑋𝑖 − 𝑋 2 𝑛 − 1 Medidas de dispersão e variabilidade FORMADECALCULODAVARIÂNCIA 𝑆2 = 1 𝑛 − 1 𝑖=1 𝑛 𝑋𝑖 2 − 𝑖=1 𝑛 𝑋𝑖 2 𝑛14/08/2018 13 Medidas de dispersão e variabilidade DESVIOPADRÃO O desvio padrão é definido tomando-se a raiz quadrada da variância. Dessa forma o desvio padrão é expresso na mesma unidade dos dados e por essa razão possui significado físico e é preferido pelos investigadores, por ser mais fácil de interpretar. Medidas de dispersão e variabilidade DESVIOPADRÃO 𝑆 = 1 𝑛 − 1 𝑖=1 𝑛 𝑋𝑖 2 − 𝑖=1 𝑛 𝑋𝑖 2 𝑛 Medidas de dispersão e variabilidade COEFICIENTEDEVARIAÇÃO O desvio padrão e a variância são medidas da variabilidade absoluta dos dados. Essa medidas são dependentes da grandeza, escala ou unidade de medida empregada para mensurar os dados. Fica evidente que um estimador que não seja dependente desses fatores se faz necessário. 14/08/2018 14 Medidas de dispersão e variabilidade COEFICIENTEDEVARIAÇÃO Essa avaliação da variabilidade é conhecida por medida de variabilidade relativa de um amostra ou população. O coeficiente de variação (CV) é usado para esse propósito. Medidas de dispersão e variabilidade COEFICIENTEDEVARIAÇÃO 𝐶𝑉 = 𝑆 𝑋 𝑥 100% Medidas de dispersão e variabilidade A média e o desvio padrão do consumo de combustível de dois carros são: 𝑋A = 14 km/l e SA = 0,8 km/l e 𝑋B= 18 km/l e SB = 1,2 km/l. Qual carro possui maior uniformidade de consumo? 14/08/2018 15 Medidas de dispersão e variabilidade ERROPADRÃODAMÉDIA O erro padrão da média é uma medida da dispersão das médias amostrais em torno da média da população. É fácil perceber que quanto menor for o seu valor, mais provável será a chance de obter a média da amostra nas proximidades da média da população, e quanto maior for, menos provável será esse evento. Medidas de dispersão e variabilidade ERROPADRÃODAMÉDIA 𝑆 𝑋 = 𝑆 𝑛 EXEMPLO O conjunto de dados a seguir consiste de observações da vazão de chuveiros (L/min) de uma amostra de n = 117 lares em Pether, Austrália. 4,6 12,3 7,1 7,0 9,2 6,7 6,9 11,5 5,1 11,2 10,5 14,3 8,0 6,4 5,1 5,6 9,6 7,5 7,5 6,2 5,8 2,3 10,4 9,8 6,6 3,7 6,4 8,3 6,5 7,6 9,3 7,3 5,0 6,3 13,8 6,2 5,4 4,8 7,5 6,0 10,8 7,5 6,6 5,0 3,3 7,6 3,9 11,9 2,2 7,2 6,1 15,3 18,9 7,2 5,4 5,5 4,3 9,0 11,3 7,4 5,0 3,5 8,2 8,4 7,3 10,3 11,9 5,6 9,5 9,3 10,4 9,7 5,1 6,7 10,2 6,2 7,0 4,8 5,6 10,5 14,6 10,8 15,5 7,5 6,4 5,5 6,6 5,9 15,0 9,6 7,8 7,0 6,9 4,1 11,9 3,7 5,7 6,8 11,3 9,3 9,6 10,4 9,3 9,8 9,1 10,6 4,5 6,2 8,3 3,2 4,9 5,0 8,2 6,3 3,8 6,0 10,1 14/08/2018 16 EXEMPLO a. Determine as frequências e frequências relativas dos valores observados. b. Desenhe o histograma de dados, usando a frequência relativa na escala vertical e comente suas características. c. Determine o valor da média amostral. d. Determine o valor da mediana e moda amostral. Por que o valor da média, mediana e moda são tão diferentes? e. Qual a amplitude amostra? EXEMPLO f. Calcule 𝑋𝑖 e 𝑋𝑖 2 . g. Use os valores anteriores para obter a variância amostral e o desvio padrão amostral. h. Determine o coeficiente de variação e o erro padrão da média.
Compartilhar