Prévia do material em texto
Estat´ıstica Descritiva Prof. Wesley Bertoli da Silva Probabilidade e Estat´ıstica DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 1 / 41 Agenda • Conceitos de Populac¸a˜o e Amostra; • Varia´veis Qualitativas e Quantitativas; • Tabulac¸a˜o e Descric¸a˜o de Dados; • Tipos de Tabelas e Gra´ficos; • Medidas de Tendeˆncia Central; • Medidas de Dispersa˜o; • Noc¸o˜es de Amostragem. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 2 / 41 Populac¸a˜o e Amostra • Populac¸a˜o: Conjunto de N elementos (indiv´ıduos, objetos, etc.) que apresentam pelo menos uma caracter´ıstica em comum; − Finita: Tamanho populacional conhecido; − Infinita: Tamanho populacional desconhecido; • Amostra: Subconjunto de uma populac¸a˜o que, em geral, apresenta tamanho n consideravelmente menor. Exemplo de populac¸o˜es: • Conjunto de alunos da UTFPR, de habitantes de Curitiba, etc; • Conjunto dos nu´meros reais, de bacte´rias de determinada espe´cie que circulam pelo ar, etc. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 3 / 41 Varia´veis Aleato´rias • Varia´vel: Denota uma caracter´ıstica que sera´ observada em cada um dos elementos de uma populac¸a˜o ou amostra; − Qualitativas: Os poss´ıveis resultados sa˜o atributos (qualidades); − Quantitativas: Os poss´ıveis resultados sa˜o de natureza nume´rica; • Uma varia´vel qualitativa sera´ nominal se na˜o for poss´ıvel estabelecer uma ordem natural entre seus poss´ıveis resultados. Caso contra´rio a varia´vel e´ dita ordinal; • Uma varia´vel quantitativa sera´ discreta se so´ puder assumir nu´meros inteiros (naturais). Caso contra´rio a varia´vel e´ dita cont´ınua; • Exemplos: Geˆnero, estado de uma doenc¸a, nu´mero de irma˜os, tempe- ratura local, etc. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 4 / 41 Tabulac¸a˜o de Dados DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 5 / 41 Tabulac¸a˜o de Dados Varia´veis observadas: • V1 - Geˆnero; • V2 - Grau de Escolaridade; • V3 - Meio de Transporte; • V4 - Altura; • V5 - Nu´mero de Filhos; • V6 - Idade. − Note que V1, V2 e V3 sa˜o qualitativas, ao passo que V4, V5 e V6 sa˜o quantitativas; − Podemos resumir tais dados por meio de uma se´rie de ferramentas, tais como tabelas, gra´ficos e medidas descritivas. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 6 / 41 Medidas de Frequeˆncia • Frequeˆncia Absoluta (FA): Quantidade de vezes em que cada particular poss´ıvel resultado i foi observado. Notac¸a˜o: Fi , i = 1, 2, . . . , p; • Frequeˆncia Relativa (FR): fi = Fi n e fi (%) = Fi n × 100; • Frequeˆncia Acumulada (FAC): Fac1 = F1 e Faci = i−1∑ k=1 Fk ; • Frequeˆncia Acumulada Relativa (FAR): faci = Faci n e faci (%) = Faci n × 100. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 7 / 41 Tipos de Tabelas Para varia´veis qualitativas: • Tabela Simples: Resumo de uma u´nica varia´vel nominal/ordinal em termo de suas frequeˆncias; • Tabela de Dupla Entrada: Resumo de duas varia´veis nominais/ordinais em termo de suas frequeˆncias cruzadas. Para varia´veis quantitativas: • Distribuic¸a˜o de Frequeˆncia Pontual: Resumo de uma u´nica varia´vel discreta em termo de suas frequeˆncias; • Distribuic¸a˜o de Frequeˆncia em Classes: Resumo de uma u´nica varia´vel discreta/cont´ınua em termo de suas frequeˆncias agrupadas. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 8 / 41 Estrutura de Uma Tabela Tabela X: Cabec¸alho/t´ıtulo da tabela. Coluna Indicadora Caracter´ısticas Avaliadas Atributos, Valores ou Classes Distribuic¸a˜o Frequeˆncias da Varia´vel Total* ∗Chamada: o total e´ optativo. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 9 / 41 Exemplos Tabela 1 : Geˆnero dos 25 in- div´ıduos entrevistados. Geˆnero Fi fi fi (%) Feminino 8 0,32 32 Masculino 17 0,68 68 Total 25 1,00 100 Tabela 2 : Nu´mero de filhos dos 25 indiv´ıduos entrevis- tados. No Filhos Fi fi fi (%) Faci faci faci (%) 0 2 0,08 8 2 0,08 8 1 7 0,28 28 9 0,36 36 2 8 0,32 32 17 0,68 68 3 6 0,24 24 23 0,92 92 4 2 0,08 8 25 1,00 100 Total 25 1,00 100 - - - DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 10 / 41 Tabela de Dupla Entrada Tabela X: Cabec¸alho/t´ıtulo da tabela. Varia´vel 1 Varia´vel 2 Total Linhas Atributos da Varia´vel 2 Atributos da Frequeˆncias Cruzadas Varia´vel 1 Total Colunas n DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 11 / 41 Exemplos Tabela 3 : Geˆnero vs. meio de transporte utilizado pe- los 25 indiv´ıduos entrevistados. Geˆnero Meio de Transporte Total Linhas C P Feminino 3 5 8 Masculino 7 10 17 Total Colunas 10 15 25 Tabela 4 : Geˆnero vs. grau de escolaridade dos 25 indiv´ıduos entrevistados. Geˆnero Escolaridade Total Linhas PG SG TG Feminino 1 4 3 8 Masculino 7 4 6 17 Total Colunas 8 8 9 25 DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 12 / 41 Distribuic¸a˜o de Frequeˆncia em Classes Agrupar uma varia´vel discreta/cont´ınua em classes pode ser uma al- ternativa interessante quando muitos diferentes valores forem observados. Para construir esse tipo de distribuic¸a˜o de frequeˆncia, devemos determinar: • O nu´mero de classes (k): − Me´todo emp´ırico: k = √n, se n ≤ 100 ou k = 5 log (n), se n > 100 (observar o inteiro mais pro´ximo); − Me´todo de Sturges: k = d1 + 3, 322 log10 (n)e ≈ d1 + log2 (n)e, em geral para 30 ≤ n ≤ 40; • A amplitude das classes (h): h = AT k = x(max) − x(min) k . A medida AT denota a amplitude total (medida de variabilidade). DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 13 / 41 Distribuic¸a˜o de Frequeˆncia em Classes Devemos escolher uma configurac¸a˜o para as classes. Sejam os limites lj (inferior) e Lj (superior) da j − e´sima classe, j = 1, 2, . . . , k , podemos: • Incluir lj e na˜o incluir Lj =⇒ lj ` Lj ou [lj , Lj); • Incluir Lj e na˜o incluir lj =⇒ lj a Lj ou (lj , Lj ]; • Incluir lj e Lj =⇒ lj `a Lj ou [lj , Lj ]; • Na˜o incluir lj e Lj =⇒ lj − Lj ou (lj , Lj). Vale salientar que: • Pode-se utilizar mais de uma configurac¸a˜o em uma mesma tabela; • E´ poss´ıvel construir distribuic¸o˜es de frequeˆncias com classes de amplitu- des distintas. Neste caso, a interpretac¸a˜o deve basear-se na˜o somente nas frequeˆncias absolutas, mas tambe´m na densidade das classes. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 14 / 41 Exemplos Para a varia´vel Altura, temos: k = √ 25 = 5 e h = 1, 92− 1, 57 5 = 0, 35 5 = 0, 07. Tabela 5 : Altura dos 25 indiv´ıduos entrevistados. Altura Fj fj(%) Facj facj(%) PMj 1, 57 ` 1, 64 3 12 3 12 1,605 1, 64 ` 1, 71 7 28 10 40 1,675 1, 71 ` 1, 78 7 28 17 68 1,745 1, 78 ` 1, 85 6 24 23 92 1,815 1, 85 `a 1, 92 2 8 25 100 1,885 Total 25 100 - - - ∗PMj = 0, 5(lj + Lj ) representa o ponto me´dio da j − e´sima classe. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 15 / 41 Tipos de Gra´ficos Um gra´fico basicamente traduz uma tabela por meio de uma figura. Em relac¸a˜o a` varia´vel de interesse, por meio de um gra´fico devemos ser capazes de detectar: • As tendeˆncias e oscilac¸o˜es; • As eventuais discrepeˆncias. Os gra´ficos para varia´veis qualitativas sa˜o: • Gra´fico de Barras/Colunas: Resumo de uma u´nica varia´vel nominal/or- dinal em termo de suas frequeˆncias; • Gra´fico Comparativo: Resumo de duas varia´veis nominais/ordinais em termo de suas frequeˆncias cruzadas (gra´fico de barras/colunas); • Gra´fico de Setores: Resumo de uma u´nica varia´vel nominal em termo de suas frequeˆncias. DAMAT -UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 16 / 41 Tipos de Gra´ficos Os gra´ficos para varia´veis quantitativas sa˜o: • Gra´fico de Basto˜es: Resumo de uma u´nica varia´vel discreta em termo de suas frequeˆncias. Alguns autores convencionam utilizar o gra´fico de barras/colunas nesse tipo de situac¸a˜o; • Histograma: Resumo de uma u´nica varia´vel discreta/cont´ınua por meio de suas frequeˆncias agrupadas; • Gra´fico de Pontos: Apresentac¸a˜o dos valores de uma ou mais varia´veis discretas/cont´ınuas por meio de uma linha ligando os pontos observa- dos. O gra´fico de linhas e´ amplamente utilizado para apresentar dados ob- servados ao longo de um determinado per´ıodo de tempo (se´rie temporal). DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 17 / 41 Gra´fico de Barras 1º G ra u 2º G ra u 3º G ra u Frequência Absoluta 0 5 10 15 Figura 1 : Grau de escolaridade dos 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 18 / 41 Gra´fico de Colunas Feminino Masculino Fr eq uê nc ia A bs ol ut a 0 5 10 15 20 Figura 2 : Geˆnero dos 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 19 / 41 Gra´fico Comparativo 1º Grau 2º Grau 3º Grau Fr eq uê nc ia A bs ol ut a 0 2 4 6 8 10 Feminino Masculino Figura 3 : Geˆnero vs. grau de escolaridade dos 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 20 / 41 Gra´fico de Setores Para construir um gra´fico de setores, devemos, primei- ramente, calcular os aˆngulos, θi , i = 1, 2, . . . , p, associa- dos aos poss´ıveis resultados da varia´vel de interesse. Estes aˆngulos podem ser obtidos a partir da seguinte relac¸a˜o: θi = 360oFi n . No exemplo a seguir, te- mos que θ1 = 144 o (MT Cole- tivo) e θ2 = 360 o− θ1 = 216o (MT Pro´prio). Coletivo Próprio Figura 4 : Meio de transporte utilizado pe- los 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 21 / 41 Gra´fico de Basto˜es (Colunas) 0 1 2 3 4 Fr eq uê nc ia A bs ol ut a 0 2 4 6 8 10 Figura 5 : Nu´mero de filhos dos 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 22 / 41 Histograma Fr eq uê nc ia A bs ol ut a 1.5 1.6 1.7 1.8 1.9 2.0 0 1 2 3 4 5 6 7 Figura 6 : Distribuic¸a˜o da altura dos 25 indiv´ıduos entrevistados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 23 / 41 Gra´fico de Pontos Tabela 6 : Lucro de um banco durante os anos de 2002 a 2013. Ano Lucro (Por Milha˜o) 2002 40 2003 42 2004 42 2005 45 2006 48 2007 53 2008 51 2009 51 2010 56 2011 60 2012 55 2013 68 Total 611 40 45 50 55 60 65 70 Lu cr o 20 02 20 03 20 04 20 05 20 06 20 07 20 08 20 09 20 10 20 11 20 12 20 13 Figura 7 : Lucro de um banco durante os anos de 2002 a 2013. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 24 / 41 Medidas Descritivas Uma outra maneira de se resumir dados de natureza quantitativa, ale´m de tabelas e gra´ficos, e´ apresenta´-los na forma de medidas descritivas. • Para dados populacionais, essas medidas sa˜o denominadas paraˆmetros e sa˜o usualmente denotadas por letras gregas (θ, µ, σ, etc.); • Para dados amostrais, essas medidas sa˜o denominadas estat´ısticas ou estimadores. Podemos classificar as medidas descritivas da seguinte maneira: • Medidas de posic¸a˜o (tendeˆncia central e separatrizes); • Medidas de dispersa˜o (ou variabilidade); • Medidas de assimetria e de curtose. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 25 / 41 Medidas de Tendeˆncia Central As medidas de tendeˆncia central sa˜o assim denominadas por indicarem um ponto em torno do qual os dados tendem a se concentrar. As principais medidas que estudaremos sa˜o: • Me´dia aritme´tica; • Mediana; • Moda. Daqui em diante, vamos convencionar que: • A varia´vel aleato´ria de interesse sera´ representada por X (maiu´sculo); • Uma particular realizac¸a˜o da varia´vel aleato´ria X sera´ denotada por x, ou seja, observou-se o evento (X = x); • Um conjunto de observac¸o˜es da varia´vel aleato´ria X sera´ denotado pelo vetor x = (x1, x2, . . . , xt), t = n ou N, n ≤ N. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 26 / 41 Me´dia Aritme´tica Seja (x1, x2, . . . , xn) um conjunto de n observac¸o˜es provenientes de uma varia´vel aleato´ria quantitativa X. A me´dia amostral aritme´tica desta varia´vel e´ definida por: x = 1 n n∑ i=1 xi . Se todos os elementos da populac¸a˜o (em relac¸a˜o a caracter´ıstica X) forem observados, enta˜o: µ = 1 N N∑ i=1 xi , em que µ representa o paraˆmetro de me´dia aritme´tica populacional. Obs. A me´dia aritme´tica e´ uma das medidas descritivas mais utilizadas na pra´tica para o resumo de dados quantitativos. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 27 / 41 Me´dia Aritme´tica Propriedades: • A me´dia aritme´tica depende de todos os valores observados; • A me´dia artime´tica e´ u´nica em um determinado conjunto de dados e nem sempre existe; • A me´dia aritme´tica e´ afetada por valores extremos. Obs. Em conjuntos de dados com valores muito discrepantes, a me´dia aritme´tica pode na˜o ser uma boa representante para o mesmo. Exemplo: Suponha que um estudo foi realizado com servidores da UTFPR. Seja X - nu´mero de filhos dos servidores da UTFPR. Considere x = (3, 2, 0, 4, 1, 3, 2, 1) o nu´mero de filhos de n = 8 servidores aleatoria- mente selecionados. Neste caso, temos: x = 1 8 (3 + 2 + 0 + 4 + 1 + 3 + 2 + 1) = 1 8 16 = 2 filhos. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 28 / 41 Mediana • O que ocorreria no exemplo anterior se inclu´ıssemos mais um servidor na amostra com 11 filhos? Haveria uma inflac¸a˜o de 50% na me´dia! • Neste cena´rio, faz-se necessa´rio utilizar medidas que na˜o sejam afetadas por valores extremos na amostra (ou populac¸a˜o), como a mediana. A mediana e´ o valor que ocupa a posic¸a˜o central do conjunto ordenado de observac¸o˜es de uma varia´vel X, dividindo-o em duas partes iguais. Exemplo: Considere novamente o exemplo anterior. Enta˜o: Dados Observados x1 x2 x3 x4 x5 x6 x7 x8 3 2 0 4 1 3 2 1 Dados Ordenados x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) 0 1 1 2 2 3 3 4 Neste caso: Md = x(4) + x(5) 2 = 2 + 2 2 = 2 filhos. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 29 / 41 Mediana • Repetindo o exerc´ıcio de incluir, na amostra, o servidor com 11 filhos, notaremos que a mediana na˜o se altera! Genericamente, podemos obter a mediana de um determinado conjunto de dados a partir do seguinte procedimento: 1) Ordenar o conjunto de dados; 2) Determinar a posic¸a˜o (q) que a mediana ocupa: q = 0, 5(n + 1). 3) Obter a mediana (Md) da seguinte forma: Md = x(α) + β[x(α+1) − x(α)], em que α representa a parte inteira e β a parte decimal de q. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 30 / 41 Moda A medida conhecida como moda representa o poss´ıvel resultado com maior frequeˆncia (absoluta) dentre os valores observados de uma determi- nada varia´vel X. Em relac¸a˜o a` moda, um conjunto de dados pode ser: • Amodal: quando todos os valores observados apresentam a mesma frequeˆncia absoluta; • Unimodal: quando a maior frequeˆncia absoluta esta´ associada a um u´nico valor observado; • Plurimodal:quando a maior frequeˆncia absoluta esta´ associada a mais de um valor observado. Exemplo: Novamente para o exemplo do nu´mero de filhos de 8 ser- vidores da UTFPR, temos que este conjunto e´ plurimodal (trimodal), uma vez que os valores 1, 2 e 3 apresentam FA = 3. Note que a inclusa˜o do 9o servidor, com 11 filhos, na˜o altera a moda do conjunto de dados. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 31 / 41 Medidas Separatrizes As medidas separatrizes sa˜o aquelas que ocupam posic¸o˜es em um de- terminado conjunto de dados ordenado. • Quartis: Dividem o conjunto de dados em 4 partes iguais (Qj , j = 1, 2, 3); • Decis: Dividem o conjunto de dados em 10 partes iguais (Dj , j = 1, 2, . . . , 9); • Percentis: Dividem o conjunto de dados em 100 partes iguais (Pj , j = 1, 2, . . . , 99). Algumas observac¸o˜es importantes: • As treˆs medidas apresentadas podem ser generalizadas em termos dos percentis; • A mediana tambe´m e´ uma medida separatriz (Md = Q2 = D5 = P50). DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 32 / 41 Medidas Separatrizes Considerando a generalizac¸a˜o em termo dos percentis, podemos ob- ter qualquer medida separatriz pelo mesmo procedimento utilizado para a obtenc¸a˜o da mediana, ou seja: 1) Ordenar o conjunto de dados; 2) Determinar a posic¸a˜o (q) que a medida separatriz de interesse ocupa: q = j 100 (n + 1), j = 1, 2, . . . , 99. 3) Obter a medida separatriz de interesse (Pj) da seguinte forma: Pj = x(α) + β[x(α+1) − x(α)], em que α representa a parte inteira e β a parte decimal de q. Exemplo: Novamente para o exemplo do nu´mero de filhos de n = 8 servidores da UTFPR, temos que Q1 = P25 = 1 filho e D7 = P70 = 3 filhos. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 33 / 41 Medidas de Dispersa˜o As medidas de dispersa˜o sa˜o aquelas que visam fornecer o grau de dispersa˜o (ou variabilidade) de um determinado conjunto de dados, sempre utilizando como refereˆncia uma medida de tendeˆncia central. As principais medidas de dispersa˜o que estudaremos sa˜o: • Amplitude interquart´ılica; • Desvio me´dio (desvio absoluto); • Variaˆncia; • Desvio padra˜o; • Coeficiente de variac¸a˜o. Obs. Com excec¸a˜o da primeira, as demais medidas que sera˜o apresen- tadas sa˜o medidas de dispersa˜o em relac¸a˜o a` me´dia aritme´tica. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 34 / 41 Amplitude Interquart´ılica A amplitude inter- quart´ılica e´ uma medida de dispersa˜o definida por: AQ = Q3 − Q1. A partir das quan- tidades que definem a AQ podemos construir um gra´fico conhecido como boxplot, muito u´til na identificac¸a˜o de pontos discrepantes (outliers). Figura 8 : Exemplo de um boxplot. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 35 / 41 Desvio Me´dio Seja x a me´dia aritme´tica amostral de um conjunto de observac¸o˜es (x1, x2, . . . , xn) de uma varia´vel aleato´ria quantitativa X. Independente dos valores observados e de x , teremos sempre que: n∑ i=1 (xi − x) = 0. • A ideia de desvio e´ fundamental para a definic¸a˜o da maioria das medidas de dispersa˜o; • Em virtude do citado acima, devemos pensar em alternativas para de- finir medidas de dispersa˜o baseadas nos desvios. Como alternativa, podemos definir a medida conhecida como desvio me´dio (ou absoluto), dado por: DM = 1 n n∑ i=1 |xi − x |. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 36 / 41 Variaˆncia e Desvio Padra˜o Como alternativa ao desvio me´dio, surge a medida de dispersa˜o conhe- cida como variaˆncia que, para dados amostrais, e´ dada por: S2 = 1 (n − 1) n∑ i=1 (xi − x)2, em que o termo (n − 1) e´ denominado grau de liberdade. Se todos os elementos da populac¸a˜o (em relac¸a˜o a caracter´ıstica X) forem observados, enta˜o: σ2 = 1 N N∑ i=1 (xi − µ)2, em que σ2 representa o paraˆmetro de variaˆncia populacional. • A variaˆncia e´ a medida que fornece o grau de dispersa˜o dos dados em torno da me´dia, na unidade quadra´tica. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 37 / 41 Coeficiente de Variac¸a˜o A medida conhecida como coeficiente de variac¸a˜o fornece a variac¸a˜o dos dados em termos relativos. Para dados amostrais, esta medida e´ dada por: CVA(%) = S x × 100. Para dados populacionais, temos: CVP(%) = σ µ × 100. • O coeficiente de variac¸a˜o nos fornece uma medida a partir da qual podemos classificar o conjunto de dados como homogeˆneo ou hete- rogeˆneo; • Quanto mais pro´ximo de zero estiver o coeficiente de variac¸a˜o, mais agrupados esta˜o os dados; • O crite´rio usual e´ o de classificar como homogeˆneo conjuntos com CV < 50% e como heterogeˆneo caso contra´rio. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 38 / 41 Exemplo Considere novamente os dados referentes ao nu´mero de filhos de n = 8 servidores da UTFPR. Sabemos que x = 2 filhos. Logo: S2 = 1 7 8∑ i=1 (xi − 2)2 = 1 7 [(3− 2)2 + (2− 2)2 + . . .+ (1− 2)2] = 1 7 12 = 1, 714286 filhos2. Disto, temos que S = √ 1, 714286 = 1, 309307 filhos. Portanto: CVA = 1, 309307 2 × 100 = 0, 6546537× 100 = 65, 46537%. Adicionalmente, temos que DM = 18 8∑ i=1 |xi − 2| = 1 filho. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 39 / 41 Exemplo Para a amostra com n = 9 servidores da UTFPR, temos que x = 3 filhos. Logo: S2 = 1 8 9∑ i=1 (xi − 3)2 = 1 8 [(3− 3)2 + (2− 3)2 + . . .+ (11− 3)2] = 1 8 84 = 10, 5 filhos2. Disto, temos que S = √ 10, 5 = 3, 24037 filhos. Portanto: CVA = 3, 24037 3 × 100 = 1, 080123× 100 = 108, 0123%. Adicionalmente, temos que DM = 19 9∑ i=1 |xi − 2| = 2 filhos. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 40 / 41 Exemplo A partir das medidas obtidas para a varia´vel nu´mero de filhos em ambas as amostras de servidores da UTFPR, podemos construir boxplots. 0 2 4 6 8 10 12 N úm er o de F ilh os (a) n = 8 0 2 4 6 8 10 12 N úm er o de F ilh os (b) n = 9 Figura 9 : Nu´mero de filhos de servidores da UTFPR. DAMAT - UTFPR Estat´ıstica Descritiva Probabilidade e Estat´ıstica 41 / 41