Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Bibliografia Bussab W. de O.; Morettin, P. A. Estatística Básica - 7ª Edição. São Paulo. Ed. Saraiva, 2011. VIEIRA, S. Elementos de Estatistica, 4 Edição. Ed. Atlas, 2003. BARBETA, P.A., Estatística Aplicada às Ciências Sociais, 7ª ed., São Paulo: LTC, 2010. 2 Conceitos Estatística Estatística Indutiva e Inferencial Exemplos de utilização da estatística População e amostra Parâmetro e estatística Dados primários e secundários Censo Variável 3 Conceitos Estatística: é a ciência que tem por objetivo planejar, coletar, tabular, analisar e interpretar informações e delas extrair conclusões que permitam a tomada de decisões acertadas mediante incertezas. Áreas: Estatística Descritiva e Estatística Inferencial ou Indutiva 4 Conceitos Estatística Descritiva Busca descrever a realidade. Usa técnicas para organizar e sintetizar os dados observáveis dessa realidade. Estatística Inferencial ou Indutiva Busca inferir, induzir ou estimar sobre a característica do todo (a população) com base nos dados da parte (amostra). Usa técnicas para generalizar um fato particular tendo como referência uma amostra 5 6 Exemplo: Estudo sobre Idade (anos) Dados (n=165): 14 23 50 37 24 16 51 41 32 28 14 40 50 37 23 27 18 22 29 36 35 18 26 17 31 54 19 53 17 41 53 17 44 14 40 50 16 25 26 22 21 24 70 21 32 18 10 26 32 28 22 41 32 31 29 34 31 17 39 25 70 21 32 37 19 19 39 30 44 18 22 40 50 37 28 29 36 35 32 22 47 26 27 45 41 41 62 36 35 32 26 54 19 37 38 27 25 26 60 35 38 17 70 21 27 43 62 21 37 45 50 43 19 19 51 18 26 44 37 19 31 17 42 37 60 46 19 49 16 22 41 19 43 62 21 27 18 22 29 21 33 18 32 24 19 28 27 53 17 45 17 39 25 27 18 22 26 28 38 48 20 21 32 28 14 É preciso resumir de alguma forma 7 Estatística Descritiva Após a coleta das observações: Primeira Etapa Resumo dos Dados = Estatística Descritiva Conceitos Finalidade da Estatística Desenvolver métodos e técnicas p/ coleta, organização, análise e interpretação de dados; Fornecer métodos para inferir conclusões sobre um universo maior a partir das observações de um fenômeno particular 8 Conceitos População: é o conjunto de elementos (valores, pessoas, medidas etc.) que tem pelos menos uma característica em comum. Alunos de 5 a 12 anos da rede pública do município de Gurupi-TO (para verificação de parasitas intestinais) Idosos integrantes da Unati - Universadade Aberta à Terceira Idade (importância da relação médico – paciente, percepção sobre a atuação do médico) Calendula officinalis L. (ASTERACEA). Influência do processo extrativo nas características físicas e químicas dos extratos. Amostra: é um subconjunto de elementos extraídos de uma população. 9 Conceitos Tipos de Amostras Amostragem casual simples com reposição Os elementos da população entram mais de uma vez na amostra. Amostragem casual simples sem reposição Os elementos da população só podem entrar uma vez na amostra Amostragem sistemática: Seleção da amostra com base num critério: Um em cada dez. Amostragem por conglomerados: A amostra é selecionada por sorteio da área a ser pesquisada Amostra estratificada ou em estágios múltiplos: A amostra é dividida em grupos e selecionada por etapas dentro de cada grupo: cidade/bairro/quadra 10 Conceitos 11 Conceitos Parâmetro: é uma medida numérica que descreve uma característica de uma população. Estatística: é uma medida numérica que descreve uma característica da amostra. Dados primários: dados coletados pelo próprio pesquisador e sua equipe. Dados secundários: não foram obtidos pelo pesquisador e sua equipe (diversas fontes como artigos em periódicos, institutos de pesquisa, DATASUS, IBGE, OMS, OPAS). 12 Conceitos Censo: é uma coleção de dados relativos a todos os elementos de uma população. Variável: é a característica de interesse que é medida em cada elemento da amostra ou população, podendo ter resultados numéricos ou não. Seus valores variam de elemento a elemento. 13 Variáveis - Classificação Contínua Discreta vaQuantitati Ordinal Nominal aQualitativ Variável 14 15 Exemplos de variáveis qualitativa nominal: sexo, carreira, região onde mora, portador de diabetes qualitativa ordinal: grau de instrução, nível de renda, grau de evolução de uma doença quantitativa discreta: número de filhos, número de acidentes em um mês quantitativa contínua: peso, altura, pressão sangüínea sistólica, tempo de vida útil Levantamento de dados Problemas usuais - Representatividade Fator associado à forma de amostragem. Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). Amostra tendenciosa – conclusões sem consistência. 16 Levantamento de dados A importância da coleta de dados Cuidado na hora de coletar informações; Não adianta uma metodologia perfeita e um bom planejamento se na hora da coleta dos dados houver alguma influência do entrevistador perante o entrevistado; As pessoas que são contratadas para fazer as entrevistas devem passar por um bom treinamento. 17 Amostragem Se os dados amostrais não forem coletados de maneira apropriada, eles podem ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los. A aleatoriedade comumente desempenha papel crucial na determinação de quais dados coletar. 18 Amostragem Vantagens do levantamento por amostragem: custo menor, menor tempo e objetivos mais amplos. Situações para trabalho com amostras: população muito grande, dificuldade de acesso, grande número de variáveis. Tipos Aleatória Estratificada Sistemática Conglomerados Conveniência 19 Distribuições de Frequências Relacionam categorias ou classes de valores, juntamente com contagens (ou frequência) do número de valores que se enquadram em cada categoria. Exemplo: VARIÁVEL QUALITATIVA Indígenas por etno-região de origem, Manaus, 2007 20 Etno-Região n % Juruá, Jutaí, Purus, Javari 51 7,35 Marau-Andirá 148 21,33 Rio Negro 315 45,39 Solimões 129 18,59 Tapajós-Madeira 38 5,48 Outras regiões 13 1,87 Total 694 100,00 Tabelas Tabela de distribuição de frequência Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as frequências. Solução: 21 Tabelas X fi fac fr far 21 3 3 3/17 3/17 22 2 5 2/17 5/17 23 2 7 2/17 7/17 24 1 8 1/17 8/17 25 4 12 4/17 12/17 26 3 15 3/17 15/17 28 1 16 1/17 16/17 30 1 17 1/17 17/17 17 1 22 Tabelas Para a construção de tabelas de frequências para variáveis contínuas, os dados devem ser agrupados em intervalos de classes. Para a construção das classes algumas definições são necessárias: 23 Tabelas Amplitude Total ou “Range” (R): É a diferença entre o maior e o menor valor observado. Ex.: R = 30 - 21 = 9. 24 Tabelas Intervalos de Classe: Conjunto de observações apresentadas na forma contínua, sem superposição de intervalos, de tal modo que cada valor do conjunto de observação possa ser alocado em um, e apenas um, dos intervalos. 25 Tabelas O número k de intervalos para cada conjunto de observações com n valores pode ser calculado como: k = 1 + 3,322(log10 n) (fórmula de Sturges) Ex.: para um conjunto com 50 observações obtemos log10(50) ≈ 1,699; k = 1 + 3,322 x 1,699 ≈ 6,6 ≈ 7 intervalos O tamanho w de cada intervalo é obtido pela divisão do valor da diferença entre o maior e o menor valor, R, pelo número de intervalos k: w = R/k 26 Tabelas Etapas para a construção de tabelas de frequência para dados agrupados:1) Encontrar o menor e o maior valor (mínimo e máximo) do conjunto de dados. 2) Calcular o número de classes que englobem todos os dados sem haver superposição dos intervalos. 27 Tabelas 3) Contar o número de elementos que pertencem a cada classe. 4) Determinar a frequência relativa de cada classe. 28 Tabelas Exemplo: O conjunto de dados abaixo representa as idades de mulheres responsáveis pelos domicílios. Construa intervalos de classes para o mesmo. 19 19 20 21 23 23 23 23 24 24 25 25 26 26 26 27 27 27 29 29 29 29 30 31 31 31 33 33 33 34 37 37 37 37 40 40 40 40 43 43 44 44 47 48 48 48 51 52 52 53 29 Tabelas Solução: se utilizar a fórmula de Sturges R = 53 – 19 = 34 e n = 50 Então: K = 1 + 3,322 x 1,699 ≈ 7 intervalos W = 34/7 ≈ 5 idades em cada Intervalo de classe Freqüência 19 |------- 24 8 24 |------- 29 10 29 |------- 34 11 34 |------- 39 5 39 |------- 44 6 44 |------- 49 6 49 |------- 54 4 30 Tabelas Ou construir intervalos empiricamente: Intervalo de classe Freqüência 10 |------- 20 2 20 |------- 30 20 30 |------- 40 12 40 |------- 50 12 50 |------- 60 4 31 Tabelas Os extremos dos intervalos são conhecidos como limites de classes. Procedendo-se desse modo, ao resumir os dados referentes a uma variável contínua perde-se informações. 32 Apresentação de dados - Tabelas Componentes Título Distribuição dos pacientes segundo as escalas de ABVD e AIVD, Hopital H, Manaus-AM, 2014 Cabeçalho Variáveis f f (%) Atividades Básica da Vida Diária (ABVD) Independência (6 ou mais) 49 79,03 Dependência Parcial (4 - 5) 9 14,52 Corpo Coluna Dependência Importante (2 ou menos) 4 6,45 Indicadora Atividades Instrumentais da Vida Diária Independência (7 - 9) 26 41,94 Célula Dependência Parcial (4 - 6) 17 27,42 Dependência importante (0 - 3) 19 30,65 Rodapé: f: Freqüência; f(%): Freqüência Relativa Fonte: Labio 33 Variáveis Quantitativas MEDIDAS DE POSIÇÃO: Moda, Média, Mediana, medidas de posição separatrizes (Percentís, Decis e Quartis) MEDIDAS DE DISPERSÃO: Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. Medidas Resumo Medidas de Posição Moda(Mo): É o valor (ou atributo) que ocorre com maior freqüência. Ex: 4,5,4,6,5,8,4,4 Mo = 4 Variavel qualitativa Média nn x n i i n xxxxx 1321 ... Ex:2,5,3,7,8 Média = [(2+5+3+7+8)/5]=5 Mediana A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. Posição da mediana: (n+1)/2 Ex: 2,5,3,7,8 Dados ordenados: 2,3,5,7,8 => (5+1)/2=3 => Md = 5 Dados ordenados:1,2,3,5,6,8 => (6+1)/2=3,5 => Md=(3+5)/2=4 Medidas de posição Separatrizes As separatrizes são medidas de posição relativas à sua posição na série, dividindo esta em partes iguais. Ex: quartis, percentis e decis. Medidas de posição Separatrizes Os quartis: Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Existem 3 quartis: a) Primeiro quartil (Q1): 25% dos dados é menor que ele e 75% são maiores b) Segundo quartil (Q2) : coincide com a mediana c) Terceiro quartil (Q3): 75% dos dados são menores que ele e 25% são maiores Medidas de posição Separatrizes Os quartis: Cálculo: Dados agrupados sem clases: Qk = K ∑ fi / 4 Onde k = número de ordem do quartil. Observe: k = 2 voltamos a fórmula da mediana. Medidas de posição Separatrizes Os quartis: Cálculo: De forma análoga: Qk = li + [ ( k. N/4 – fa [i-1] ) / fc ] .h Observe que se k=2 voltamos a fórmula que nos dá a mediana. Medidas de posição Separatrizes Os quartis: exemplo Determine o 1º e 3º quartil da distribuição abaixo Medidas de posição Separatrizes Os quartis: exemplo – solução Medidas de posição Separatrizes Os percentis: Denominamos percentis os 99 valores que separam uma série em 100 partes iguais: Medidas de posição Separatrizes Os percentis: Indicamos: P1, P2, P3,... P99 Evidentemente: P50 = Md P25 = Q1 P75 = Q3 Medidas de posição Separatrizes Os percentis: Cálculo Utilizamos técnica do do cálculo da mediana. Pk = K ∑ fi / 100 Onde k = ordem do percentil Medidas de posição Separatrizes Os percentis: Cálculo: Para uma distribuição de classes: Pk = li + [ ( k. N/100 – fa [i-1] ) / fc ] .h Observe que se k=50 voltamos a fórmula que nos dá a mediana. Medidas de posição Separatrizes Os percentis: Exemplo: para o distribuição do exemplo anterior: Medidas de posição Separatrizes Exercícios: Dada a distribuição de freguência abaixo calcule a moda, a mediana, o primeiro e terceiro quartil e o 30 percentil. Custo (%$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150 fi 8 10 11 16 13 5 1 Percentis O percentil de ordem px100 (0<p<1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição px(n+1) do conjunto de dados ordenados. O percentil de ordem p (ou p-quantil) deixa px100% das observações abaixo dele na amostra ordenada. Casos Particulares: Percentil 50=mediana, segundo quartil(md,Q2,q(0,5)) Percentil 25= primeiro quartil (Q1), q(0,25) Percentil 75= terceiro quartil (Q3) , q(0,75) Distribuições de Frequências Exercício: VARIÁVEL QUANTITATIVA Distribuição de frequência para dados agrupados ou tabulados em classes. Idade dos sociólogos em anos 36 39 40 40 40 42 43 44 44 45 45 45 47 49 49 50 50 51 52 53 55 57 58 59 59 51 Distribuições de Frequências Dados agrupados em classes Idade de 25 sociólogos Idade Frequência 35 I-- 40 2 40 I-- 45 7 45 I-- 50 6 50 I-- 55 5 55 I-- 60 5 Fonte: Dados Fictícios 52 Distribuição de Frequência • Frequência Absoluta – Valor total das observações • Frequência Relativa – Valor porcentual das observações • Frequência Acumulada – Somatória das frequências de todos intervalos Modalidade Esportiva Frequencia Relativa Frequência Absoluta Frequência Acumulada Frequência Acumulada Futebol 35% 70 70 35% Vôlei 25% 50 120 60% Basquete 20% 40 160 80% Natação 10% 20 180 90% Tênis 8% 15 195 98% Ciclismo 2% 5 200 100% 100% 200 200 100% Histograma Histograma: Gráfico das distribuições das frequências de uma variável. • Gráfico de Barras (Histograma) – Gráfico de retângulos, diagrama de colunas; gráfico de áreas. • Histograma – As frequências dos fenômenos são proporcionais à superfície de cada retângulo que as representam. Para intervalos de mesma amplitude as frequências serão proporcionais às alturas Processo de Elaboração do Histograma • Organizar os dados em ordem crescente; • Determinar a amplitude total; • Dividir a amplitude total em um nº adequado de intervalos de preferência com a mesma amplitude; • O número mínimo de intervalos é 5, número máximo 20; • Quando possível os pontos médios dos intervalos devem coincidir com os valores realmente observados Distribuição de Frequência Histograma • Distribuições Simétricas e Assimétricas - Os histogramas podem apresentar distribuição simétricas ou assimétricas. Indicadas nos slides a seguir, • Polígono de Frequências – Unindo-se os valores médios dos intervalos de classe, o histograma se transforma num polígono de frequências. Pode-se então comparar este polígono com uma curva teórica (Normal). Distribuição de Frequência Histograma Variaveis Frequência 1 4 2 6 3 16 4 8 5 7 6 2 GRÁFICO DE FREQUÊNCIAS: Histograma 0 2 4 6 8 10 12 14 16 18 1 2 3 4 5 6 Categorias F re q u ê n c ia s 40-45 10 45-50 15 50-55 18 55-60 22 60-65 35 65-70 42 70-75 32 75-80 18 89-85 10 85-90 6 Total 208 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA 10 15 18 22 35 42 32 18 10 6 0 5 10 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 simétrico 40-45 35 45-50 42 50-55 32 55-60 24 60-65 20 65-70 17 70-75 15 75-80 10 89-85 10 85-90 6 Total 208 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA Assimétrico à esquerda 0 510 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 assimétrico 40-45 5 45-50 8 50-55 12 55-60 15 60-65 17 65-70 21 70-75 24 75-80 29 89-85 42 85-90 35 Total 173 Pesos (x1) Nº alunos (f1) HISTOGRAMA E POLÍGONO DE FREQUÊNCIA Assimétrico à direita 0 5 10 15 20 25 30 35 40 45 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90 assimétrico
Compartilhar