Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística DescritivaEstatística Descritiva (I)(I) 1 O que é Estatística • Origem relacionada com a coleta e construção de tabelas de dados para o governo. • A situação evoluiu: a coleta de dados representa somente um dos aspectos da Estatística. • No século XIX, o desenvolvimento do cálculo de probabilidade e outras metodologias matemáticas, tais como a técnica de Mínimos Quadrados, foram fundamentais para o desenvolvimento da Estatística. 2 • No século XX a Estatística desenvolve-se como uma área específica do conhecimento a partir do desenvolvimento da Inferência Estatística, metodologia que faz uso da Teoria das Probabilidades e com ampla aplicação em ciências experimentais. • A Estatística hoje consiste em uma metodologia científica para obtenção, organização e análise de dados oriundos das mais variadas áreas das ciências experimentais, cujo objetivo principal é auxiliar a tomada de decisões em situações de incerteza. População Características Amostra Técnicas de amostragem Análise descritiva Estatística 3 Informações contidas nos dados Conclusões sobre as características da população descritiva Inferência estatística Amostragem Associada à coleta de dados, a tecnologia da amostragem desenvolve técnicas para obtenção de amostras da população de interesse de forma conveniente e informativa. As amostras que consideraremos neste curso são do tipo probabilístico, em que cada indivíduo da população pode ou não fazer parte da amostra com a mesma probabilidade que os demais. 4 com a mesma probabilidade que os demais. Exemplos de usoExemplos de uso: • Pesquisas de mercado • Pesquisas de opinião pública • Ensaios clínicos • Controle de qualidade Estatística Descritiva A disponibilidade de uma grande quantidade de dados e de Etapa inicial da análise utilizada para descrever, organizar e resumir os dados coletados. 5 A disponibilidade de uma grande quantidade de dados e de métodos computacionais eficientes tem revigorado esta área da Estatística. Probabilidade A Teoria das Probabilidades propicia a modelagem matemática de fenômenos aleatórios, em que está presente a incerteza. É uma ferramenta fundamental para a Inferência Estatística. 6 Inferência Estatística Conjunto de técnicas que permite, a partir de dados amostrais, tirar conclusões sobre a população de interesse, com um controle probabilístico sobre a confiabilidade de tais inferências. Exemplo 1: Numa pesquisa eleitoral, um instituto de pesquisa tem como objetivo prever o resultado da eleição, utilizando uma amostra da população. 7 Considere o Candidato “A”: Denomine por p a proporção de pessoas na população que votarão em “A” na eleição. Denomine por p a proporção de pessoas no^ 8 ^EstimaçãoEstimação:: Podemos usar o valor de p para estimar a proporção p da população. Denomine por p a proporção de pessoas no levantamento amostral de opinião que expressam intenção de voto em “A”. ^ Pesquisa DataFolha O quadro, apresentado a seguir, refere-se à intenção de Em anos de eleições, os institutos de pesquisa de opinião colhem periodicamente amostras de eleitores para obter as estimativas de intenção de voto da população. As estimativas são fornecidas com um valor e uma margem de erro. 9 O quadro, apresentado a seguir, refere-se à intenção de voto para presidente do Brasil para o primeiro turno das eleições de 2014. A resposta foi estimulada e única. Pergunta realizada: Se a eleição para presidente fosse hoje e os candidatos fossem estes, em quem o(a) Sr.(Sra) votaria? Intenção de voto para presidente do Brasil, 1º Turno – 2014 10 Pesquisa DataFolha, em % do total de votos. 5.377 eleitores - Margem de erro de 2% com 95% de confiança. Estatística Descritiva O que fazer com as observações que coletamos? 11 Resumo dos dados = Estatística descritiva Primeira Etapa: NOMINALNOMINAL sexo, cor dos olhos Variável: Qualquer característica associada a uma população. Classificação das variáveis: 12 QUALITATIVAQUALITATIVA QUANTITATIVAQUANTITATIVA NOMINALNOMINAL ORDINALORDINAL CONTÍNUACONTÍNUA DISCRETADISCRETA peso, altura, salário, idade número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução User Typewriter Não há ordem entre as opções User Typewriter Existe ordem entre cada opção User Typewriter Opções que são medidas User Typewriter Opções que são contadas Variáveis Quantitativas Mínimo, Máximo, Moda, Média, Mediana, Percentis MEDIDAS DE POSIÇÃO: 13 Amplitude, Distância Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. MEDIDAS DE DISPERSÃO: • Máximo (max): é o maior valor observado • Mínimo (min): é o menor valor observado • Moda (mo): é o valor (ou atributo) que ocorre com a maior frequência. Medidas de Posição 14 Dados: 4, 5, 4, 6, 5, 8, 4 mo = 4max = 8 min = 4 n x n xxxx x n i i n å == = 1321 ... • Média: 15 Dados: 2, 5, 3, 7, 8 5 5 87352 = =x • Mediana: A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. 2 Posição (ordem) da mediana: n+1 16 2 Posição (ordem) da mediana: n+1 Exemplos: Dados: 2, 6, 3, 7, 8 Dados ordenados: 2 3 6 7 8 n = 5 (ímpar) Posição da Mediana ordem: 5+1 = 3o. 2 Md=6 17 Md = (4 + 6) / 2 = 5 Dados: 4, 8, 2, 1, 9, 6 n = 6 (par) Dados ordenados: 1 2 4 6 8 9 Md 6+1 = 3,5o. 2 O percentil de ordem pp 100100 (0 < pp < 1), em um conjunto de dados de tamanho nn, é o valor da variável que ocupa a posição pp (nn + 1) do conjunto de dados ordenados. Percentil: percentil 50 = mediana ou segundo quartil (Md) Casos particulares: 18 percentil 50 = mediana ou segundo quartil (Md) percentil 25 = primeiro quartil (Q1) percentil 75 = terceiro quartil (Q3) percentil 10 = primeiro decil Md = 3,05 Q1 = 2,05 Q3 = 4,9 Dados:Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 n=10 Posição de Md: 0,5(n+1)= 0,511= 5,5 Posição de Q1: 0,25 (11) = 2,75 Posição de Q3: 0,75 (11) = 8,25 Md = (3 + 3,1)/2 = 3,05 Q1=( 2+2,1)/2=2,05 Q3=(3,7+6,1)/2=4,9 19 Md = 5,3 Q1 = 1,7 Q3 = 12,9 Dados:Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 n=11 Observação: os softwares utilizam fórmulas de cálculo de percentis um pouco diferentes e, assim, podem fornecer valores um pouco diferentes. Grupo 1: 3,4,5,6,7Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5Grupo 3: 5,5,5,5,5 Exemplo 2: Considere as notas de um teste de 3 grupos de alunos. GG 11 * * * * * GG 22 * * * * * 20 GG 22 GG 33 * * * * * 0 105 e md1= md2= md3 = 5Temos: x1 = x2 = x3 = 5 __ __ __ Medidas de Dispersão Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados. •• AmplitudeAmplitude ((AA)):: A = máx - min 21 Para os grupos anteriores, temos: Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0 A = máx - min DadosDados:: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 • Distância Interquartil: É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, QQ33 -- QQ11.. 22 Q1 = 2,05 e Q3= 4,9 Q3 - Q1 = 4,9 - 2,05 = 2,85 User Typewriter Problema: Não leva em conta os dados que estão fora dos quartis do meio. Se algum dado esta nos 25% iniciais ou nos 25% finais, ele não será considerado. 1 )( 1 )(...)()( Variância 1 2 22 2 2 12 - - = - --- == å = n xx n xxxxxx s n i i n • Variância: •Desvio padrão: 23 Variância padrão Desvio == s • Desvio padrão: User Typewriter Problema: Não costuma ter uma unidade realista. Exemplo: (Kg)² User Typewriter --> Por esse motivo, usa-se com mais frequencia a ferramenta de Desvio Padrão, pois é raíz da Variânça, corrigindo o problema da unidade. Cálculo para os grupos: 4 GG11: s2 =(3-5)2+ (4-5)2+ (5-5)2+ (6-5)2+ (7-5)2 s = 1,58 s2 = 10/4= 2,5 24 G3: s2 = 0 s = 0 GG22: s2 = 10 s = 3,16 Fórmulas alternativas para a Variância: S2 = X i 2 i=1 n å -nX 2 (n-1) = X i 2 i=1 n å - 1 n X i i=1 n å æ è çç ö ø ÷÷ 2 (n-1) 25 Em G1: Xi 2 = 9 + 16 + 25 + 36 +49 = 135 4 S2 = 135 - 5(5)2 = 2,5 - é uma medida de dispersão relativa - elimina o efeito da magnitude dos dados - exprime a variabilidade em relação à média s • Coeficiente de Variação (CV) 26 %100= x s CV Altura 1,50m 0,05m 3,3% Peso 50 kg 3,5kg 7% Média Desvio Padrão Coef. de Variação Altura e peso de alunos Exemplo 3: 27 Peso 50 kg 3,5kg 7% Conclusão: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que quanto à altura. Desvio padrão Coef. de variaçãoMédia Recém-nascidos 50 6 12% Altura (em cm) de uma amostra de recém- nascidos e de uma amostra de adolescentes Exemplo 4: 28 Conclusão: Em relação às respectivas médias, as alturas dos adolescentes e dos recém- nascidos apresentam variabilidades semelhantes. Recém-nascidos 50 6 12% Adolescentes 160 16 10% User Typewriter CONFERIR EXERCICIOS DE AULA PARA PROPRIEDADES
Compartilhar