Prévia do material em texto
Estat´ıstica Descritiva Dennis Marinho1 1Departamento de Engenharia Ele´trica Universidade Federal do Vale do Sa˜o Francisco dennis.marinho@univasf.edu.br tel. 2102-7630 23 de novembro de 2017 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Estat´ıstica Descritiva E´ uma ferramenta muito u´til para resumir a descric¸a˜o de uma ou va´ris se´ries de valores. Dessa maneira torna-se poss´ıvel realizar um estudo GLOBAL sobre o comportamento, organizac¸a˜o, descric¸a˜o e apresentac¸a˜o dos dados. As treˆs formas, principais, para apresentac¸a˜o dos dados: 1 Tabelas; 2 Gra´ficos; 3 Medidas Descritivas. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Fundamentos da Estat´ıstica POPULAC¸A˜O: E´ a catalogac¸a˜o de TODOS os elementos desejados por uma varia´vel. AMOSTRA: E´ uma parte da catalogac¸a˜o de parte da populac¸a˜o, de acordo com a varia´vel. 1 Status Finita; 2 Status Infinita. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Varia´vel E´ a medida da qual desejamos catalogar em nosso conjuto ou banco ou massa de dados. Pode ser chamada de x ou y ou z... Tipo de Varia´vel 1 Na˜o-Aleato´ria: Segue um comportamento padronizado. 2 Aleato´ria: Segue um comportamento na˜o padronizado. Exemplo: Saber na UNIVASF a me´dia dos alunos que recebem bolsa (x) e possuem algum v´ınculo. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Forma ou N´ıveis de Varia´veis Qualitativa: Classifica o objeto em estudo por um nome. 1 Ordinal: Segue uma ordem natural, exemplo do Estado Civil. 2 Nominal: Apresenta um nu´mero espec´ıfico, dentro de uma cadeia lo´gica, exemplo de cor de pelo ou nota escolar. Quantitativa: Classifica o objeto em estudo por um nu´mero Real ou Natural. 1 Discreto: A varia´vel e´ um nu´mero inteiro. 2 Cont´ınuo: A varia´vel e´ um nu´mero cont´ınuo. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Observac¸a˜o da Coleta de Dados Dados Brutos: Sa˜o varia´veis que chegaram do campo sem nenhuma alterac¸a˜o estat´ıstica. Rol: Primeiro tratamento aplicado aos dados, do qual organiza os dados de maneira crescente ou decrescente. Observac¸a˜o: Coleta na˜o deve seguir nenhum interesse ou vantagem, os dados registrados integralmente. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Tabelas Simples; Clara; Objetiva; Auto Explicativa. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Elementos da Tabela T´ıtulo: Descreve fenoˆmeno, e´poca e local de ocorreˆcnia. Cabec¸alho: Simplifica os conteu´dos das colunas. Coluna: Simplifica o conteu´do das linhas Corpo: Mostra os dados da tabela. Fonte: Local de extrac¸a˜o das informac¸o˜es. Nota: Explica a metodologia aplica (ver ABNT). Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Modelo de Tabela Figura: Tabela Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Distribuic¸a˜o de Frequeˆncia E´ o nu´mero de vezes ou percentual que determinada varia´vel ou intervalo ou ponto acorreu. Tipos de Frequeˆncia: 1 Pontual; 2 Intervalar ou Classe. Exemplo: Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Somas das Frequeˆncias Simples Absoluta; Simples Relativa; Acumulada Crescente; Acumulada Decrescente. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Calcule as frequeˆncias: Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo de tabelas: Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Classe da Tabela Amplitude dos Dados: At = Xmaximo − Xminimo Quantidade de Classes: 1 Para n ≤ 25, considere ate´ 5 classes (ma´ximo); 2 Para n > 25, utilizar Sturges: k = 1 + 3.22log(n) Limites das Classes: 1 Limite Superior ou Ls 2 Limite Inferior ou Li Tipos dos Limites das Classes: 1 Li | − |Ls equivalente: Li ≤ Xi ≤ Ls 2 Li ` Ls equivalente: Li ≤ Xi < Ls 3 Li a Ls equivalente: Li < Xi ≤ Ls 4 Li − Ls equivalente: Li < Xi < Ls Amplitude da Classe (h) ou tamanho da classe: h = Atk Ponto Me´dio da Classe: divide ao meio a classe, XM = Ls+Li 2 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Organize os dados abaixo em tabela de distribuic¸a˜o de frequeˆncia, contendo classe, ponto me´dio, a frequeˆncia absoluta-relativa e acumulada absoluta-relativa. 20 22 23 23 23 24 26 27 22 24 24 26 25 25 25 21 23 21 25 25 25 25 26 26 22 20 20 26 26 20 26 26 26 21 27 27 26 26 27 27 25 25 23 20 20 27 27 28 28 29 28 23 29 21 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Gra´ficos Recurso visual; Menor grau de detalhe, maior velocidade de leitura; Visa˜o global dos dados. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Barra Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Coluna Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Categorizado Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Setores ou Pizza Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Linhas Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Basta˜o Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Histograma Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Histograma: Observac¸o˜es Gra´fico de colunas, no entanto sa˜o justapostas; Representam a distribuic¸a˜o de frequeˆncia para dados cont´ınuos-discretos; O Eixo y pode receber a quantidade absoluta ou relativa ou decimal; O Eixo x pode trabalhar com valores pontuais ou intervalares. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Ogivas Observac¸a˜o: Gra´fico constru´ıdo a partir da frequeˆncia acumulada absoluta ou relativa. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Medidas Descritivas E´ uma forma de resumir os dados atrave´s de um nu´mero ou intervalo de nu´meros; As informac¸o˜es podera˜o ser expressas em termos populacionais ou amostrais, de acordo com a simbologia apresentada abaixo: Medida Paraˆmetro (Pop.) Estimador(Amost.) Nu´mero de Elmentos N n Me´dia µ x Variaˆncia σ2 S2 Desvio Padra˜o σ S Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Divisa˜o das Medidas Descritivas Medidas de Posic¸a˜o 1 Me´dia; 2 Mediana; 3 Moda 4 Separatrizes: Quartil-Decil-Percentil Medidas de Dispersa˜o 1 Amplitude total; 2 Desvio Me´dio; 3 Variaˆncia; 4 Desvio Padra˜o; 5 Coeficiente de Variac¸a˜o. Medidas de Assimetria Medidas de Curtose Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Medidas de Posic¸a˜o ou Tendeˆncia Central 1 Me´dia; 2 Mediana; 3 Moda 4 Separatrizes: Quartil-Decil-Percentil Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Me´dia E´ a soma de todos os valores de xi dividido pelo nu´mero de elementos. Dados Na˜o Agrupados em Classe de Frequeˆncia: µ = ∑N i=1 Xi N x = ∑n i=1 xi n Dados Agrupados em Classe de Frequeˆncia: µ = ∑N i=1 XiFi N x = ∑n i=1 xi fi n Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Vantagens e Desvantagens da informac¸a˜o Me´dia Fa´cil obtenc¸a˜o; Estat´ıstica de maior uso; Tratada alebricamente (manipulada); Facilmente influenciada por valores extermos; Na˜o e´ boa para dados muito heterogeˆneos (altos e baixos). Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Propriedades da Me´dia A somato´ria das diferenc¸as entre cada valor observado xi e sua respectiva me´dia resultara´ em zero; n∑ i=1 (xi − x) = 0 A multiplicac¸a˜o de cada elemento xi por uma constante C, gera a pro´pria me´dia multiplicada pela constante.∑n i=1 xi ∗ C n = C ∗ ∑n i=1 xi n Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo:Calculando a me´dia aritme´tica da tabela abaixo: IDADE FREQUEˆNCIA 18 2 19 1 20 6 21 2 22 1 23 1 24 1 25 3 26 1 29 1 30 1 35 1 37 1 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Calculando a me´dia aritme´tica da tabela abaixo: Idade Xi Fabsoluta FAbs−Relativa% FAcumAbsol FAcumAbsolRela% 18 ` 22 20 11 50 11 50 22 ` 26 24 6 27,27 17 77,27 26 ` 30 28 2 9,09 19 86,36 30 ` 34 32 1 4,55 20 90,91 34 ` 38 36 2 9,09 22 100 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Moda - Mo Sa˜o os valores de maior frequeˆncia na amostra; Os gra´ficos sa˜o facilmente observados: Amodal: Sem moda; Modal: Um u´nico valor se apresenta; Bimodal: Dois valores se destacam ao mesmo tempo. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Observe os valores e classifique a sua moda ou na˜o. 2 2 3 3 5 5 8 8 2 2 3 5 5 5 8 8 2 2 2 3 5 5 5 8 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Moda para dados AGRUPADOS: Func¸a˜o de Czuber Mo = LinferiorModa + FAbsolModal − FAbsolAnt 2.FAbsolModal − (FAbsolAnt + FAbsolPost)h Pearson Mo = 3Md = 2x Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Observac¸o˜es da Moda Na˜o e´ influenciada pelo valor, mas sim pela quantidade; Na˜o depende de todos os valores do banco de dados; Possui ac¸a˜o mais significativa nos bancos significativamente grandes; Abre possibilidades para outros estudos. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Calcule a Moda Idade Xi Fabsoluta FAbs−Relativa% FAcumAbsol FAcumAbsolRela% 18 ` 22 20 11 50 11 50 22 ` 26 24 6 27,27 17 77,27 26 ` 30 28 2 9,09 19 86,36 30 ` 34 32 1 4,55 20 90,91 34 ` 38 34 2 9,09 22 100 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Mediana - Md Valor que ocupa posic¸a˜o central em relac¸a˜o aos dados ordenados (considerando que todos apresentam igual possibilidade de ocorreˆncia) ou e´ o ponto central que divide os dados em 50% para ambos os lados. Dados Na˜o Agrupados n ı´mpar: apenas o valor central. n par: me´dia entre os dois valores centrais. Me = x n 2 + x n+2 2 2 Dados Agrupados Md = LimInf. Med. + n 2 − FAcum. Ant. Med. FSimples Med. .h Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Determine a Mediana Notas Frequeˆncia (fi ) 0 ` 2 3 2 ` 4 5 4 ` 6 10 6 ` 8 8 8 ` 10 4 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Separatrizes E´ uma maneira fa´cil de ordenar o banco de dados, em grande quantidade, e e´ poss´ıvel divir em blocos de informac¸o˜es; Quartil (4) - Decil (10) - Percentil (100) Caso Abordado: Quartil Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Quartil - Dados Na˜o Agrupados Qj = Xk+( j(n + 1) 4 −k)∗(Xk+1−Xk), onde: K (inteiro) < j(n + 1) 4 n Nu´mero de elementos; j Nu´mero do quartil calculado; k Maior inteiro, inferior a j(n+1)4 ; X′s Elemento capturado. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Boxplot Gra´fico u´til para detectar padro˜es ou anormalidade nas informac¸o˜es; Figura: Boxplot Amplitude: Mı´nima ou Esquerda: Le = Q1 − (Q3 − Q1) ∗ 1.5 Ma´xima ou Direita: Ld = Q3 + (Q3 − Q1) ∗ 1.5 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Monte o boxplot com as informac¸o˜es das idades dos alunos abaixo. 18 18 19 20 20 20 20 20 21 21 22 23 24 25 25 25 26 29 30 35 37 ** ** ** Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Assimetria e Curtose Assimetria: E´ o grau de distribuic¸a˜o sime´trica (ou assime´trica) dos dados. Curtose: E´ o grau de achatamento da curva de distribuic¸a˜o dos dados (histograma). Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Assimetria: Func¸o˜es e Ca´lculos Primeira Assimetria de Pearson A1 = x −mo sx Segunda Assimetria de Pearson A2 = x − x˜ sx Assimetria por Momento Am = E [( x − µ σ )3] = 1 n n∑ i=1 ( xi − x sx )3 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Tipos de Assimetria: Positiva ou Direita Figura: x > x˜ > mo Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Tipos de Assimetria: Negativa ou Esquerda Figura: x < x˜ < mo Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Tipos de Assimetria: Simetria Figura: x = x˜ = mo Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Classificac¸a˜o e Valores de Assimetria Assimetria = Negativa se A < 0 Sime´trica se A = 0 Positiva se A > 0 Grau de Simetria: Praticamente Sime´trica se |A| < 0.15 Moderadamente Assime´trica se 0.15 < |A| < 1 Assime´trica se |A| > 1 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Curtose Figura: x = x˜ = mo Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Curtose: Func¸o˜es e Ca´lculos Curtose por Percetil Kp = Q3 − Q1 2(P90 − P10) Curtose por Momento Km = m4 m22 = m4 s4 = n ∑ (xi − x)4 ( ∑ (xi − x)2)2 Curtose por Distribuic¸a˜o Teo´rica Kd = E [( (X − µ)4 σ4 )] = 1 n ∑ (xi − x)4 (s2)2 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Classificac¸a˜o e Valores de Curtose Kp = Q3 − Q1 2(P90 − P10) K ∼ 0.263⇒ Distriuic¸a˜o Mesocu´rtica K < 0.263⇒ Distriuic¸a˜o Leptocu´rtica K > 0.263⇒ Distriuic¸a˜o Platicu´rtica Km = m4 m22 K ≈ 3⇒ Distribuic¸a˜o Mesocu´rtica K < 3⇒ Distribuic¸a˜o Platicu´rtica K > 3⇒ Distribuic¸a˜o Leptocu´rtica Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Exemplo: Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Assimetria: Func¸o˜es e Ca´lculos Assimetria de Bowley Aquartilica = (Q3 − Q2)− (Q2 − Q1) Q3 − Q1 Assimetria Amostral Aa = m3 s3 = ∑ (xi−x)3 n ( √ (xi−x)2 n ) 3 = √ n ∗ ∑ (xi − x)3 ( √∑ (xi − x)2)3 Observac¸a˜o: (i) Momento Amostral: Mk = E (X k) = ∑ xki n (ii) Momento CENTRAL Amostral: mk = ∑ (xi−x)k n Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Medidas de Dispersa˜o Descreve as informac¸o˜es estat´ıstica dentro de um intervalo de resposta. Observe os dados referentes as notas em 5 unidades: Ada˜o 0 10 10 10 10 Felipe 6 8 6 10 10 Vicente 10 10 10 5 5 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Amplitude Cada estat´ıstica envolvida apresentara´ uma ma´ximo e m´ınimo. Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Desvio Me´dio E´ o acu´mulo das diferenc¸as entre me´dia e valor observado, em mo´dulo. 1 Na˜o Agrupados: Dm = ∑N i=1 |Xi − µ| N dm = ∑n i=1 |xi − x | n 2 Agrupados: Dm = ∑N i=1 |Xi − µ|Fi N dm = ∑n i=1 |xi − x |fi n Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Variaˆncia e Desvio Padra˜o Variabilidade do conjunto de dados em termos quadrados (variaˆncia) considerando a me´dia obtida, ja´ o desvio padra˜o e´ a raiz quadrada da variaˆncia. Na˜o Agrupados: σ2 = ∑N i=1(Xi − µ)2 N S2 = ∑n i=1(xi − x)2 n − 1 Agrupados: σ2 = ∑N i=1(Xi − µ)2Fi N S2 = ∑n i=1(xi − x)2fi n − 1 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Coeficiente de Variac¸a˜o Mede o grau de homo ou heterogeneidade que os dados apresentam, cv > 50% forte heterogeneidade ou alterac¸a˜o dos dados. Populacional CV = σ.100 µ Amostral cv = S .100 x Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Qual o melhor aluno? Ada˜o 0 10 10 10 10 Felipe 6 8 6 10 10 Vicente 10 10 10 5 5 Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Prof. Dennis Marinho O R de Souza Estat´ıstica Descritiva Prof. Dennis MarinhoO R de Souza Estat´ıstica Descritiva