Baixe o app para aproveitar ainda mais
Prévia do material em texto
Centro de Cieˆncias Exatas e Tecnolo´gicas - CETEC Universidade Federal do Recoˆncavo da Bahia - UFRB 1a Unidade - Estat´ıstica Descritiva Talita Costa Dias 28 de outubro de 2017 28 de outubro de 2017 1 / 62 Programa da Unidade 23 de Outubro Aula 1 :Conceitos iniciais e objetivos da estat´ıstica; introduc¸a˜o ao pensamento cient´ıfico; fases de um trabalho estat´ıstico; populac¸a˜o e amostra; Exerc´ıcios. Laborato´rio Aula 2 :Conhecendo um conjunto de dados; Estudo das varia´veis: quantitativas e qualitativas; cont´ınuas e discretas. Representac¸a˜o Tabular. Exerc´ıcios. 30 de Outubro Aula 3 :Continuac¸a˜o de representac¸a˜o tabular. Distribuic¸a˜o de Frequeˆncias: Varia´veis Qualitativas e Quantitativas Discretas. Exerc´ıcios. Laborato´rio Aula 4 :Frequeˆncia Acumulada e Distribuic¸a˜o de Frequeˆncias: Varia´veis Quantitativas Cont´ınuas. Exerc´ıcios. 28 de outubro de 2017 2 / 62 Programa da Unidade 06 de Novembro Aula 5 :Representac¸a˜o Gra´fica. Medidas de tendeˆncia central (me´dia aritme´tica (simples e ponderada), mediana e moda). Exerc´ıcios. Laborato´rio Aula 6 :Representac¸a˜o Gra´fica e Medidas de Tendeˆncia Central no Excel. 13 de Novembro Aula 7 :Separatrizes (quartil, decil, centil). Medidas de dispersa˜o (amplitude total, desvio-padra˜o, variaˆncia, coeficiente de variac¸a˜o). Exerc´ıcios. Laborato´rio Aula 8 :Continuac¸a˜o de Medidas de dispersa˜o. Box-Plot e Exerc´ıcios. 28 de outubro de 2017 3 / 62 Programa da Unidade 20 de Novembro (Feriado?) Aula 9 :Medidas de Assimetria. Aula de Du´vidas. Laborato´rio Aula 10 :Avaliac¸a˜o Observac¸a˜o Devido a` dinaˆmica pro´pria da disciplina e da turma, este cronograma podera´ sofrer alterac¸o˜es durante a unidade; os discentes sera˜o previamente notificados, e sempre que poss´ıvel, fara˜o parte da alterac¸a˜o. 28 de outubro de 2017 4 / 62 Avaliac¸a˜o Avaliac¸a˜o 1 2 Pontos: Atividades em sala de aula. As avaliac¸o˜es sera˜o realizadas individualmente. Avaliac¸a˜o 2 8 Pontos: Semina´rio de Ana´lise Descritiva dos Dados Sera˜o sorteados banco de dados em que os alunos ira˜o fazer ana´lises e sera´ apresentado no u´ltimo dia da unidade. A avaliac¸a˜o sera´ realizada em grupo. Bibliografia Sera˜o disponibilizadas uma apostila e as notas de aulas no SIGAA. No final das notas de aulas estara˜o os livros dispon´ıveis na biblioteca. 28 de outubro de 2017 5 / 62 O que e´ a Estat´ıstica? Para muitos, a estat´ıstica na˜o passa de conjuntos de tabelas de dados nume´ricos. Os estat´ısticos sa˜o pessoas que coletam esses dados. A estat´ıstica originou-se com a coleta e construc¸a˜o de tabelas de dados para os governos. A situac¸a˜o evoluiu e esta coleta de dados representa somente um dos aspectos da estat´ıstica. 28 de outubro de 2017 6 / 62 Definic¸a˜o de Estat´ıstica A Estat´ıstica e´ uma metodologia cient´ıfica que permite; organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer a´rea do conhecimento. Aplicac¸o˜es Indu´stria (Controle de qualidade) Economia (Econometria) Cieˆncias Sociais (Demografia) Psicologia (Psicometria) Agronomia (Experimentac¸a˜o Agr´ıcola) 28 de outubro de 2017 7 / 62 A´reas da Estat´ıstica 1 Estat´ıstica Descritiva 2 Probabilidade 3 Infereˆncia Estat´ıstica 28 de outubro de 2017 8 / 62 Estat´ıstica Descritiva Etapa inicial da ana´lise utilizada para descrever, organizar e resumir os dados coletados. A disponibilidade de uma grande quantidade de dados e de me´todos computacionais muito eficientes revigorou esta a´rea da Estat´ıstica. 28 de outubro de 2017 9 / 62 Probabilidade A teoria das probabilidades auxilia na modelagem de fenoˆmenos aleato´rios, ou seja, aqueles em que esta´ presente a incerteza. E´ uma ferramenta fundamental para a infereˆncia estat´ıstica. 28 de outubro de 2017 10 / 62 Infereˆncia Estat´ıstica Conjunto de te´cnicas que permite, a partir de dados amostrais, tirar concluso˜es sobre a populac¸a˜o de interesse, controlando erros. 28 de outubro de 2017 11 / 62 Conceitos Ba´sicos Populac¸a˜o Conjunto de elementos (indiv´ıduos ou objetos) que apresentam pelo menos uma caracter´ıstica em comum (a ser estudada). Amostra Suconjunto de uma populac¸a˜o, que mesmo tendo tamanho reduzido, seja capaz de representa´-la. Censo Pesquisas nas quais toda uma populac¸a˜o sa˜o avaliadas estatisticamente. Problemas: Custos Tempo Dificuldades na obtenc¸a˜o de dados... 28 de outubro de 2017 12 / 62 Etapas da Analise Estat´ıstica 28 de outubro de 2017 13 / 62 Amostragem Uma a´rea importante em muitas aplicac¸o˜es Estat´ısticas e´ a da Tecnologia de Amostragem. Exemplos de Aplicac¸a˜o: Pesquisa de mercado, Pesquisa de opinia˜o, Avaliac¸a˜o do processo de produc¸a˜o, Praticamente em todo experimento. 28 de outubro de 2017 14 / 62 Atividade 1 Caracterize uma poss´ıvel amostra para cada populac¸a˜o: Populac¸a˜o (ou Universo): alunos de uma escola. Populac¸a˜o: casais residentes em uma cidade. Populac¸a˜o: pec¸as produzidas por certa ma´quina. Populac¸a˜o: pec¸as produzidas por certa ma´quina. Populac¸a˜o: dados de uma estac¸a˜o meteorolo´gica de uma cidade. Populac¸a˜o: dados da Bolsa de Valores de Sa˜o Paulo - IBOVESPA. Populac¸a˜o: funciona´rios de uma empresa. 28 de outubro de 2017 15 / 62 Conjunto de Dados Exemplo 1 Informac¸a˜o do estado civil, grau de instruc¸a˜o, nu´mero de filhos, idade e procedeˆncia de 36 funciona´rios sorteados ao acaso da empresa MB.(Bussab e Morettin) 28 de outubro de 2017 16 / 62 Resumo dos Dados Primeira Etapa Resumo dos Dados=Estat´ıstica Descritiva 28 de outubro de 2017 17 / 62 Varia´vel Os valores obtidos para cada empregado (cada linha) da empresa MB e´ representado nas colunas e os consideramos como caracter´ısticas. As caracter´ısticas perguntadas aos funciona´rios, como estado civil, grau de instruc¸a˜o, entre outras, e´ denominada de Varia´vel. Varia´vel: Estado Civil Solteiro Casado Varia´vel: Nu´mero de Filhos Assume valores de 0(sem filhos) a` 5(filhos). Tais varia´veis teˆm naturezas diferentes com relac¸a˜o aos valores que podem assumir. 28 de outubro de 2017 18 / 62 Classificac¸a˜o de Varia´veis Varia´vel Qualquer caracter´ıstica associada a uma populac¸a˜o. Classificac¸a˜o de Varia´veis Observac¸a˜o A varia´vel idade, medida em anos, e´ considerada discreta, entretanto se levarmos em conta os dias, ou seja, 2, 5 ou 2, 85 anos, iremos classifica´-la como cont´ınua. 28 de outubro de 2017 19 / 62 Atividade 2 Classifique as varia´veis: Populac¸a˜o (ou Universo): alunos de uma escola. Varia´vel: cor dos cabelos Populac¸a˜o: casais residentes em uma cidade. Varia´vel: no de filhos Populac¸a˜o: pec¸as produzidas por certa ma´quina. Varia´vel: no de pec¸as produzidas por hora Populac¸a˜o: pec¸as produzidas por certa ma´quina. Varia´vel: diaˆmetro externo Populac¸a˜o: dados de uma estac¸a˜o meteorolo´gica de uma cidade. Varia´vel: precipitac¸a˜o pluviome´trica, durante o ano Populac¸a˜o: dados da Bolsa de Valores de Sa˜o Paulo - IBOVESPA. Varia´vel: nu´mero de ac¸o˜es negociadas Populac¸a˜o: funciona´rios de uma empresa. Varia´vel: sala´rios 28 de outubro de 2017 20 / 62 Organizac¸a˜o e Representac¸a˜o dos Dados Uma das formas de organizar e resumir a informac¸a˜o contida em dados observados e´ por meio de tabela de frequeˆncias e gra´ficos. Representac¸a˜o Tabular Consiste em dispor os dados em linhas e colunas distribu´ıdas de modo ordenado, obedecendo a` Resoluc¸a˜o n◦ 886, de 26 de outubro de 1966, do Conselho Nacional de Estat´ıstica, editadas pelo Instituto Brasileiro de Geografia e Estat´ıstica- IBGE. Tabela de Frequeˆncia Relaciona categorias (ou classes) de valores, juntamente com contagem (ou frequ¨eˆncias) do nu´mero de valores que se enquadram em cada categoria ou classe. 28 de outubro de 2017 21 / 62 Representac¸a˜o Tabular Representac¸a˜o Esquema´tica 28 de outubro de 2017 22 / 62 Representac¸a˜o Tabular T´ıtulo Define o que esta´ sendo estudado; O que? (Assunto a ser representado (Fato)) Onde? (O lugar onde ocorreu o fenoˆmeno (local)) Quando? (A e´poca em que se verificou o fenoˆmeno (tempo)). Cabec¸alho E´ a parte da tabela na qual e´ designada a natureza do conteu´do de cada coluna. 28 de outubro de 2017 23 / 62 Representac¸a˜o Tabular Corpo E´ a parte da tabela composta por linhas e colunas. Linhas: e´ a parte do corpo que conte´m uma sequeˆncia horizontal de informac¸o˜es. Colunas: e´ a parte do corpo que conte´m uma sequeˆncia vertical de informac¸o˜es. Coluna Indicadora: e´ a coluna que conte´m as discriminac¸o˜es correspondentes aos valores distribu´ıdos pelas colunas nume´ricas. Casa ou ce´lula: e´ a parte da tabela formada pelo cruzamento de uma linha com uma coluna. 28 de outubro de 2017 24 / 62 Representac¸a˜o Tabular Rodape´ E´ o espac¸o aproveitado em seguida ao fecho da tabela, onde sa˜o colocados as notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se a` entidade que organizou ou forneceu os dados expostos. Notas e Chamadas: sa˜o esclarecimentos contidos na tabela (nota - conceituac¸a˜o geral; chamada - esclarecer minu´cias em relac¸a˜o a uma ce´lula). 28 de outubro de 2017 25 / 62 Representac¸a˜o Tabular Varia´veis Qualitativas ou Quantitativas Discretas Podemos construir tabelas de frequeˆncias que os quantificam por categoria de classificac¸a˜o. Exemplo 1 (Varia´vel Qualitativa) Tabela 1: Frequencias e porcentagens dos 36 empregados da Companhia MB no ano de 2017. 28 de outubro de 2017 26 / 62 Representac¸a˜o Tabular Notac¸a˜o ni : Frequeˆncia Absoluta da categoria i (nu´mero de indiv´ıduos que pertencem a` categoria i). fi = ni n : Frequeˆncia Relativa da categoria i . fi (%) = ni n ∗ 100% : Frequeˆncia Relativa Percentual da categoria i . Exemplo 2 (Varia´vel Quantitativa Discreta) Tabela 2: Distribuic¸a˜o de frequ¨eˆncias de funciona´rios da empresa MB, segundo o nu´mero de filhos. 28 de outubro de 2017 27 / 62 Representac¸a˜o Tabular Para varia´veis cujos valores possuem ordenac¸a˜o natural (Qualitativas Ordinais e Quantitativas) faz sentido incluirmos tambe´m uma coluna contendo frequeˆncias acumuladas fac . Frequeˆncia Acumulada (fac) E´ obtida pela soma das frequeˆncias de todos os valores da varia´vel, menores ou iguais ao valor considerado. S ua principal utilidade e´ estabelecer pontos de corte com uma determinada frequeˆncia nos valores da varia´vel. 28 de outubro de 2017 28 / 62 Representac¸a˜o Tabular Quantitativas Cont´ınuas Construir classes ou faixas de valores e contar o nu´mero de ocorreˆncias em cada faixa. Metodologia tambe´m pode ser empregada para uma grande quantidade de valores de varia´veis Quantitativas Discretas. Para construir a distribuic¸a˜o de frequeˆncia por classes e´ necessa´rio: 1 determinar o nu´mero de classes; 2 determinar quem sa˜o as classes; 3 contar as frequeˆncias dos seus dados em cada classe. Cabe ao pesquisador escolher esse nu´mero ou recorrer a um dos me´todos que existem para calcular esse nu´mero. 1 Me´todo da Raiz: Para n = 25, k = 5 e para n > 25,K = √ n; 2 Fo´rmula de Sturges: k = 1 + 3, 33 log n; Os softwares estat´ısticos calculam automaticamente as classes. 28 de outubro de 2017 29 / 62 Representac¸a˜o Tabular Amplitude Total (R) E´ a diferenc¸a entre o maior valor e o menor valor observado R = xmax − xmin Amplitude da classe (h) E´ a divisa˜o inteira entre a amplitude total e o nu´mero de classes: h = R k . Limites das Classes 1 LI `a LS considera os valores entre o limite inferior, LI , e o limite superior, LS , incluindo ambos intervalos; 2 LI ` LS considera os valores entre o limite inferior, LI , e o limite superior, LS , incluindo LI e excluindo LS ; 3 LI a LS considera os valores entre o limite inferior, LI , e o limite superior, LS , excluindo LI e incluindo LS ; Exemplo 3 (Varia´vel Quantitativa Cont´ınua) Tabela 3: Distribuic¸a˜o de frequ¨eˆncias de funciona´rios da empresa MB, por faixa de sala´rio. 28 de outubro de 2017 30 / 62 Representac¸a˜o Tabular Os seguintes dados sa˜o provenientes do Hospital Pedia´trico HPC, da cidade de Co´rdoba ano de 2014 e se referem ao teor de gordura (g) de algumas crianc¸as selecionadas no setor pedia´trico deste hospital. 4.23 1.30 0.69 0.94 3.80 0.92 1.68 3.29 4.56 1.00 3.52 3.49 0.25 1.55 4.61 3.23 3.84 4.12 2.60 0.39 1.30 4.06 3.57 2.30 3.82 1.58 2.16 1.28 3.10 1.25 3.63 0.99 1.75 2.55 4.57 4.35 3.21 3.82 3.37 1.34 1 Identifique a populac¸a˜o, amostra, caracter´ıstica de interesse e classifique a varia´vel. 2 Construa a distribuic¸a˜o de frequeˆncia por classes simples e acumulada mais adequada para estes dados. 28 de outubro de 2017 31 / 62 Representac¸a˜o Gra´fica Varia´vel Qualitativa Gra´fico de Barras Diagrama circular, de sectores ou em forma de pizza Gra´fico de Barras Consiste em construir retaˆngulos ou barras, em que uma das dimenso˜es e´ proporcional a` magnitude a ser representada (ni ou fi ). As barras sa˜o dispostas paralelamente umas a`s outras, horizontal ou verticalmente. 28 de outubro de 2017 32 / 62 Representac¸a˜o Gra´fica Gra´fico em Setores (Pizza) Este gra´fico e´ apropriado para representar varia´veis qualitativas e quantitativas discretas quando o nu´mero de categorias e´ pequeno. Adequado quando o objetivo for a ana´lise da participac¸a˜o de cada categoria em relac¸a˜o ao total. As frequeˆncias devem somar 100%. 28 de outubro de 2017 33 / 62 Representac¸a˜o Gra´fica Varia´vel Quantitativa Histograma Boxplot Observac¸a˜o Gra´ficos que tambe´m podem ser empregados para uma grande quantidade de valores de varia´veis Quantitativas Discretas. 28 de outubro de 2017 34 / 62 Representac¸a˜o Gra´fica Histograma Representa uma distribuic¸a˜o de frequeˆncias por meio de retaˆngulos justapostos, cujas a´reas sa˜o proporcionais a`s frequeˆncias das classes. Dadas as classes, da distribuic¸a˜o de frequeˆncia, constru´ımos retaˆngulos com base na classe e altura proporcional a frequeˆncia relativa. 28 de outubro de 2017 35 / 62 Representac¸a˜o Gra´fica Histograma 28 de outubro de 2017 36 / 62 Medidas Sintetizadoras Medidas sintetizadoras Anteriormente, vimos diversas formas de sintetizar os dados atrave´s de distribuic¸o˜es de frequeˆncias e gra´ficos. E´ importante saber que tambe´m podemos sintetizar as informac¸o˜es dos dados atrave´s de medidas descritivas. Estas medidas sintetizadoras podem ser classificadas como medidas de tendeˆncia central (ou posic¸a˜o), de dispersa˜o ou de posic¸a˜o relativa. 28 de outubro de 2017 37 / 62 Medidas Sintetizadoras Medidas sintetizadoras Veremos as seguintes medidas de tendeˆncia central: me´dia, mediana e moda. Veremos as seguintes separatrizes: quartis, decis, percentis. Veremos as seguintes medidas de dispersa˜o: amplitude total, variaˆncia, desvio padra˜o, coeficiente de variac¸a˜o de Pearson. 28 de outubro de 2017 38 / 62 Medidas de Tendeˆncia Central Me´dia aritme´tica simples E´ a medida de tendeˆncia central mais conhecida. E´ denotada por µ ou X , e representa o valor me´dio do conjunto de dados. A me´dia aritme´tica simples e´ calculada a partir da soma de todas as observac¸o˜es da amostra divida pelo nu´mero total de dados da amostra. 28 de outubro de 2017 39 / 62 Medidas de TendeˆnciaCentral Me´dia aritme´tica simples A me´dia aritme´tica simples e´ calculada atrave´s da seguinte expressa˜o: X = n∑ i=1 Xi n = X1 + . . .+ Xn n onde 1 ∑ denota o somato´rio; 2 n representa o tamanho da amostra; 3 X1, . . . ,Xn representa o conjunto de valores da varia´vel X . 28 de outubro de 2017 40 / 62 Medidas de Tendeˆncia Central Exemplo ilustrativo - me´dia aritme´tica simples Os seguintes dados amostrais se referem ao diaˆmetro (m) do tronco de a´rvores de jatoba´. 1.71 2.63 3.63 1.94 3.69 2.77 1.42 2.48 Calcule o valor me´dio do diaˆmetro do tronco das a´rvores amostradas. 28 de outubro de 2017 41 / 62 Medidas de Tendeˆncia Central Func¸o˜es estat´ısticas na calculadora cientifica 1 Tecla : MODE CLR → 2. 2 Introduzimos o primeiro nu´mero e apertamos a tecla: M+. 3 Observamos que ao introduzir cada nu´mero, na tela aparece que quantidade de nu´meros ja´ foi gravada na memoria. 4 Repetimos o processo anterior ate´ o u´ltimo nu´mero. 5 Tecla: SHIFT 2 6 Se estamos interessados na me´dia, tecla: 1= 7 Se estamos interessados no desvio padra˜o populacional, tecla: 2= 8 Se estamos interessados no desvio padra˜o amostral, tecla: 3= 28 de outubro de 2017 42 / 62 Medidas de Tendeˆncia Central Me´dia Aritme´tica Ponderada - Dados Brutos E´ a soma dos produtos de cada valor observado pelo seu respectivo peso, dividida pela soma dos pesos. X = ∑n i=1 xipi∑n i=1 pi Exemplo ilustrativo - me´dia aritme´tica ponderada para dados brutos Um estudante obteve na 1a unidade a nota 7,0, na 2a nota 9,0 e na 3a nota 8,0. A nota final do semestre e´ uma me´dia ponderada, em que as treˆs unidades teˆm pesos 2, 3 e 5, respectivamente. Logo, qual sera´ a nota final deste aluno? 28 de outubro de 2017 43 / 62 Medidas de Tendeˆncia Central Mediana E´ o valor que divide o conjunto de observac¸o˜es ordenados em duas partes iguais. E´ denotada por Md . E´ o valor que ocupa o centro da distribuic¸a˜o, isto e´, 50% dos elementos do conjunto esta˜o abaixo da mediana e 50% dos elementos do conjunto esta˜o acima da mediana. Podemos encontrar a mediana de um conjunto de dados da seguinte forma: 1 se n e´ impar: a mediana sera´ o valor central do conjunto de dados ordenados. 2 se n e´ par: teremos dois valores centrais e a mediana sera´ a me´dia entre esses dois valores centrais. 28 de outubro de 2017 44 / 62 Medidas de Tendeˆncia Central Exemplo ilustrativo - mediana Os seguintes dados amostrais se referem ao diaˆmetro (m) do tronco de a´rvores de jatoba´. 1.71 2.63 3.63 1.94 3.69 2.77 1.42 2.48 Calcule a mediana do diaˆmetro do tronco das a´rvores amostradas. 28 de outubro de 2017 45 / 62 Medidas de Tendeˆncia Central Moda E´ o valor que ocorre com maior frequeˆncia no conjunto das observac¸o˜es, e e´ denotada por Mo. A moda pode na˜o existir. Neste caso o conjunto de dados e´ considerado amodal. A moda pode na˜o ser u´nica e ale´m disso na˜o e´ influenciada por valores extremos. A moda e´ a medida de tendeˆncia central menos empregada. No entanto, e´ adequada para caracterizar situac¸o˜es onde estejam em causa os casos ou valores mais usuais. Por exemplo: Em estudos de mercado, o empresa´rio pode estar interessado nos produtos que mais se vendem. 28 de outubro de 2017 46 / 62 Medidas de Tendeˆncia Central Relac¸a˜o entre a me´dia aritme´tica simples, mediana e moda Me´dia = Moda = Mediana → distribuic¸a˜o de dados sime´trica. Me´dia > Mediana > Moda → distribuic¸a˜o de dados assime´trica positiva. Me´dia < Mediana < Moda → distribuic¸a˜o de dados assime´trica negativa. 28 de outubro de 2017 47 / 62 Separatrizes Separatrizes Permitem calcular valores da varia´vel que dividem a distribuic¸a˜o em partes iguais. Existem quatro tipos de separatrizes, tambe´m chamada de quantis: 1 Mediana. 2 Quartis. 3 Decis. 4 Centis ou Percentis. 28 de outubro de 2017 48 / 62 Separatrizes Separatrizes Enquanto a mediana separa a distribuic¸a˜o em duas partes iguais, a caracter´ıstica principal das outras separatrizes e´: 1 Quartis - Qi - dividem a distribuic¸a˜o em quatro partes iguais. 2 Decis - Di - dividem em dez partes iguais. 3 Centis ou Percentis - Pi - dividem em cem partes iguais. 28 de outubro de 2017 49 / 62 Separatrizes Separatrizes Ca´lculo da posic¸a˜o da separatriz de ordem i : 1 Ordenar os dados de forma crescente. 2 Para o quartil de ordem i : Qi = i . n 4 3 Para o decil de ordem i : Di = i . n 10 4 Para o centil de ordem i : Pi = i . n 100 28 de outubro de 2017 50 / 62 Medidas de dispersa˜o Medidas de dispersa˜o absoluta Sa˜o expressas na mesma unidade de medida da varia´vel em estudo. Amplitude total. Variaˆncia. Desvio padra˜o. Medidas de dispersa˜o relativa Independem da unidade de medida da varia´vel observada. Servem para estudar comparativamente a variabilidade de duas ou mais distribuic¸o˜es. Coeficiente de variac¸a˜o de Pearson. Varia´vel padronizada. 28 de outubro de 2017 51 / 62 Medidas de dispersa˜o Medidas de dispersa˜o A produc¸a˜o dia´ria da pec¸a Z de uma certa indu´stria foi observada em treˆs empregados no per´ıodo de 15 a` 19 de abril de 2000. Suponha que o interesse do administrador da empresa e´ que os empregados apresentem produc¸a˜o elevada e a mais homogeˆnea poss´ıvel. Qual dos treˆs empregados apresentou melhor desempenho no trabalho no per´ıodo observado? 28 de outubro de 2017 52 / 62 Medidas de dispersa˜o Medidas de dispersa˜o Considerando agora apenas dois empregados com produc¸a˜o me´dia dia´ria diferente. Quem apresentou melhor desempenho no trabalho no per´ıodo observado, Antoˆnio ou Benedito? 28 de outubro de 2017 53 / 62 Medidas de dispersa˜o Amplitude total E´ a diferenc¸a entre os valores extremos do conjunto. E´ calculada atrave´s da seguinte expressa˜o: R = xmax − xmin Exemplo - amplitude total Calcule a amplitude total da produc¸a˜o da pec¸a Z para cada empregado da indu´stria e identifique qual empregado apresentou a menor dispersa˜o e qual apresentou a maior dispersa˜o na produc¸a˜o dia´ria. Seriam ideˆnticas as produc¸o˜es dia´rias observadas de Daniel e Eduardo? 28 de outubro de 2017 54 / 62 Medidas de dispersa˜o Desvio padra˜o O desvio-padra˜o, tambe´m denominado desvio quadra´tico me´dio, e´ definido como a me´dia quadra´tica dos desvios em relac¸a˜o a me´dia aritme´tica. Utilizamos a seguinte expressa˜o para calcular o desvio-padra˜o amostral: s = √∑n i=1(xi − x¯)2 n − 1 Utilizamos a seguinte expressa˜o para calcular o desvio-padra˜o populacional: σ = √∑n i=1(xi − µ)2 n 28 de outubro de 2017 55 / 62 Medidas de dispersa˜o Exemplo ilustrativo - desvio padra˜o Calcule o desvio padra˜o da produc¸a˜o da pec¸a Z para cada empregado da indu´stria. Exemplo ilustrativo - desvio padra˜o Os seguintes dados amostrais (n=10) se referem ao diaˆmetro (m) do tronco de a´rvores de jatoba´: 1.50 1.60 1.70 1.8 1.90 1.90 1.90 2 2 2.1 Calcule o desvio padra˜o referente ao diaˆmetro do tronco das a´rvores amostradas. 28 de outubro de 2017 56 / 62 Medidas de dispersa˜o Variaˆncia Se denota por σ2X , ou Var(X ). Representa a dispersa˜o de um conjunto de dados em torno da me´dia. E´ uma quantidade na˜o negativa e expressa em unidades quadradas do conjunto de dados. E´ calculada atrave´s da soma de quadrados dos desvios com relac¸a˜o a` media, dividida pelo nu´mero de elementos. 28 de outubro de 2017 57 / 62 Medidas de dispersa˜o Variaˆncia Utilizamos a seguinte expressa˜o para calcular a variaˆncia amostral: S2 = n∑ i=1 ( Xi − X )2 n − 1 Utilizamos a seguinte expressa˜o para calcular a variaˆncia populacional: σ2 = n∑ i=1 ( Xi − X )2 n28 de outubro de 2017 58 / 62 Medidas de dispersa˜o Exemplo ilustrativo - variaˆncia Calcule a variaˆncia da produc¸a˜o da pec¸a Z para cada empregado da indu´stria. Exemplo ilustrativo - variaˆncia Os seguintes dados amostrais (n=10) se referem ao diaˆmetro (m) do tronco de a´rvores de jatoba´. 1.50 1.60 1.70 1.8 1.90 1.90 1.90 2 2 2.1 Calcule a variaˆncia referente ao diaˆmetro do tronco das a´rvores amostradas. 28 de outubro de 2017 59 / 62 Medidas de dispersa˜o Coeficiente de variac¸a˜o Trata-se de uma medida relativa de dispersa˜o, u´til para comparar a variabilidade de duas ou mais distribuic¸o˜es. E´ calculado a partir da seguinte expressa˜o: CV = S X . E´ uma medida de dispersa˜o relativa utilizada para comparar dois ou mais conjuntos de dados com unidades de medidas diferentes. Como o CV e´ uma medida que exprime a variabilidade relativa a` me´dia, e´ usualmente expresso em porcentagem. 28 de outubro de 2017 60 / 62 Medidas de dispersa˜o Exemplo ilustrativo - coeficiente de variac¸a˜o Os seguintes dados amostrais (n=10) se referem ao X = diaˆmetro (m) do tronco de a´rvores de jatoba´: 1.50 1.60 1.70 1.8 1.90 1.90 1.90 2 2 2.1 Os seguintes dados amostrais (n=10) se referem ao Y = peso do fruto (g) da a´rvore de jatoba´: 115 120 113 107 116 112 111 109 108 121 Calcule e interprete o CV para ambos conjuntos de dados. 28 de outubro de 2017 61 / 62 Box-Plot Box-Plot E´ um me´todo alternativo ao histograma para representar os dados. Sa˜o convenientes para revelar tendeˆncias centrais, dispersa˜o, distribuic¸a˜o dos dados e a presenc¸a de outliers (valores extremos). Utiliza: valor m´ınimo,Md = Q2,Q1,Q3 e o valor ma´ximo do conjunto de dados. U´til para comparar dois ou mais conjuntos de dados. O box-plot pode ser desenhado na posic¸a˜o vertical (mais comum) ou horizontal. 28 de outubro de 2017 62 / 62 Box-Plot Box-plot 28 de outubro de 2017 63 / 62 Box-Plot Interpretac¸a˜o do gra´fico Box-plot A dispersa˜o e´ representada pela altura do retaˆngulo (Q3− Q1), amplitude interquartil. Assimetria: a proximidade da linha da mediana em relac¸a˜o a Q1 e Q3 informa sobre a assimetria. 1 Se a mediana esta´ no centro do retaˆngulo, a distribuic¸a˜o dos dados e´ sime´trica. 2 Se a mediana e´ pro´xima de Q1, a distribuic¸a˜o e´ assime´trica positiva. 3 Se a mediana e´ pro´xima de Q3, a distribuic¸a˜o e´ assime´trica negativa. 28 de outubro de 2017 64 / 62 Box-Plot Interpretac¸a˜o do gra´fico Box-plot Os pontos que esta˜o fora do intervalo dado pela amplitude interquart´ılica sa˜o considerados valores at´ıpicos ou discrepantes (outliers), ou seja, valores muito grandes ou muito pequenos em relac¸a˜o aos demais. Geralmente sa˜o representados pelos s´ımbolos ∗ ou ? O que fazer se forem detectados outliers em um conjunto de dados? Abandonar a observac¸a˜o quando houver uma justificativa convincente: observac¸a˜o incorreta ou erro na execuc¸a˜o do experimento. A ana´lise deve ser refeita sem o outlier. Conservar quando nenhuma explicac¸a˜o pode ser dada a` observac¸a˜o at´ıpica. Neste caso e´ preciso um tratamento especial na ana´lise desses dados. 28 de outubro de 2017 65 / 62 28 de outubro de 2017 66 / 62 28 de outubro de 2017 67 / 62 Bibliografia MAGALHA˜ES, Marcos N. LIMA, Antonio C. P. Noc¸o˜es de Probabilidade e Estat´ıstica. Sa˜o Paulo. Edusp, 2004. MORETTIN, Pedro A. BUSSAB, Wilton. Estat´ıstica Ba´sica. Sa˜o Paulo. Saraiva, 2006. 28 de outubro de 2017 68 / 62 Bibliografia
Compartilhar