Prévia do material em texto
ESTATÍSTICA DESCRITIVA Prof. Ms. Felicien Gonçalves Vásquez ✓ População Alvo ou Universo Estatístico(N): totalidade dos elementos ou de um atributo dos elementos referentes a um conjunto determinado com pelo menos uma característica em comum. ✓Amostra (n): obter uma amostra de uma população consiste em selecionar um determinado número de elementos dessa população. ✓ Censo: censo é o processo total de coleta, processamento, avaliação, análise e divulgação de dados relativos a todos os elementos da população. ✓Amostragem: é o processo de seleção da amostra. CONCEITOS INICIAIS PLANEJAMENTO AMOSTRAL Um plano amostral deve em primeiro lugar reconhecer o universo a que se refere o estudo, a população que será estudada e a unidade amostral (o objeto sobre o qual se fará medidas do evento de interesse no estudo). • Caberá ao pesquisador decidir se a amostra deve ser aleatória (ao acaso) ou intencional. • Será intencional ou não probabilística quando o investigador puder arbitrar quais as unidades da população estudada devem ser tomadas para observação. • Na maioria dos estudos o pesquisador busca aleatoriedade para evitar o erro sistemático ou vício de amostragem que torne abrangentes os resultados de seu estudo, neste caso, deverá trabalhar com amostragem probabilística, onde cada elemento na população tem probabilidade conhecida e diferente de zero de pertencer a amostra. MÉTODOS PROBABILÍSTICOS Amostragem Aleatória Simples * Neste tipo de amostragem a premissa é de que cada componente da população estudada tem a mesma chance de ser escolhido para compor a amostra, o que pode ser obtido por meio de um sorteio aleatório. Ex.: Dimensionar uma amostra de 10 funcionários para medir a satisfação dos servidores com a Empresa. 21 11 12 14 15 17 18 19 20 1 2 3 4 567 8 9 10 13 16 22 23 24 26 2527 28 29 30 21 11 12 14 15 17 18 19 20 1 2 4 567 8 9 32 73 16 82 45 38 26 3160 65 40 30 41 População N= 100 Amostra n=10 20 38 1626 35 21 59 87 99 Tabela de Nº Aleatórios 008 026 020 003 016 035 021 003 059 087 099 085 025 085 077 096 085 036 025 045 089 067 028 069 Amostragem Sistemática - Deve obedecer o mesmo princípio da amostragem aleatória simples. No entanto, prevê a coleta de dados ao longo de um período de tempo e arbitra um ritmo para tomada de unidades da população para compor a amostra. - Por exemplo, na listagem de 100 indivíduos numerados de uma população, sorteamos um número entre os dez primeiros da lista. A partir do número sorteado, selecionamos um a cada dez indivíduos. - É muito útil quando se quer planejar um período de tempo para execução da coleta de dados ou quando se deseja cobrir um determinado período de tempo com a amostra estudada. - A primeira observação pode ser calculada como na amostragem aleatória simples e o intervalo sistemático é encontrado utilizando-se a equação: K = N/n. Intervalo de amostragem: K = N/n --> K=100/10 = 10 Tabela de Nº Aleatórios 008 018 028 038 048 058 068 003 078 088 098 085 025 085 077 096 085 036 025 045 089 067 028 069 Amostra n=10 8 18 28 38 48 58 68 78 88 98 21 11 12 14 15 17 18 19 20 1 2 3 4 567 8 9 10 13 16 22 23 24 26 2527 28 29 30 21 11 12 14 15 17 18 19 20 1 2 4 567 8 9 32 73 16 82 45 38 26 3160 65 40 30 41 População N= 100 Amostragem Sistemática Ex.: Dimensionar uma amostra de 10 funcionários para medir a satisfação dos servidores com a Empresa. nh = (n/N)xNh ; onde h = Masculino(M) e Feminino(F). Amostra n=10 21 11 12 14 15 17 18 19 20 1 2 3 4 567 8 9 10 13 16 22 23 24 26 2527 28 29 30 21 11 12 14 15 17 18 19 20 1 2 4 567 8 9 32 73 16 82 45 38 26 3160 40 41 População N= 100 NM = 80 NF = 20 nM=(10/100)x80= 8 nF=(10/100)x20= 2 Amostragem Aleatória Estratificada - A população é dividida em estratos (grupos) e em seguida é selecionada uma amostra aleatória de cada estrato. - Esta estratégia geralmente é aplicada quando o evento estudado numa população tem características distintas para diferentes categorias. Ex.: Dimensionar uma amostra de 10 funcionários para medir a satisfação dos servidores com a Empresa. Grupo Nh nh M 80 8 F 20 2 Total 100 10 Amostragem por Conglomerados - A população é dividida em subpopulações distintas (conglomerados). - Alguns dos conglomerados são selecionados segundo a amostragem aleatória simples e são observadas todas as unidades dos conglomerados selecionado de acordo com os objetivos. Amostragem por Estágios Múltiplos - Esta estratégia de amostragem pode ser vista como uma combinação de dois ou mais planos amostrais. - Considere por exemplo uma população estratificada onde o número de estratos é muito grande. Ao invés de sortear uma amostra de cada estrato, o pesquisador poderia optar por sortear alguns estratos e em seguida selecionar uma amostra de cada estrato sorteado. - Neste caso, teríamos uma amostragem em dois estágios usando, nas duas vezes, a amostragem aleatória simples. VARIÁVEIS Variáveis Qualitativas Quantitativas Nominais Ordinais Discretas Contínuas São características que podem ser observadas ou medidas em cada elemento da população ou da amostra sob as mesmas condições. NORMAIS PARA CONSTRUÇÃO DE TABELAS Cabeçalho NORMAIS PARA CONSTRUÇÃO DE TABELAS DISTRIBUIÇÃO DE FREQUÊNCIA ✓ DADOS BRUTOS: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados constitui- se nos dados brutos. Ex.: Idade dos funcionários da Empresa Alfa no ano de 2002 na cidade de Manaus – AM. 24 23 22 28 35 21 23 23 33 34 24 21 25 36 26 22 30 32 25 26 33 34 21 31 25 31 26 25 35 33 DISTRIBUIÇÃO DE FREQUÊNCIA ✓ ROL: É o arranjo dos dados brutos em ordem de freqüências crescente ou decrescente. Assim: 21 21 21 22 22 23 23 23 24 24 25 25 25 25 26 26 26 28 30 31 31 32 33 33 33 34 34 35 35 36 DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUALITATIVAS DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUALITATIVAS DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUALITATIVAS DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUALITATIVAS DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS ✓ Amplitude total “Amp”: É a diferença entre o maior e o menor valor observado. No exemplo: Amp = 36 - 21 = 15. ✓ Frequência absoluta (fi): É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. ✓ Distribuição de frequência: É o arranjo dos valores e suas respectivas frequências. DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS ✓ Numero de classes (K): não há fórmula exata para o número de classes (arredondar para o inteiro mais próximo). Soluções: - K pode ser igual a 5 se o tamanho da amostra for menor que 25 ou igual a raiz quadrada de n se o tamanho da amostra for maior que 25; - Fórmula de Sturges: K= 1 + 3,32 log(n). Onde: n = tamanho da amostra. ✓ Amplitude da classe (h): h = Amp/K (aproximar para o maior inteiro). DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS Tabela 1. Distribuição segundo a frequência da idade dos funcionários da Empresa Alfa no ano de 2002 na cidade de Manaus – AM. Classes fi 21 |--- 24 8 24 |--- 27 9 27 |--- 30 1 30 |--- 33 4 33 |--- 36 7 36 |--- 39 1 Total 30 DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS ✓ Frequência relativa simples (fri) em porcentagem (%): a frequência relativa de um valor é dada por pela razão entre as frequências absolutas e o tamanho da amostra. Assim: fri = (fi/n)*100 (Ao multiplicar por 100 o resultado é em %). ✓ Frequência absoluta acumulada (Fac): é a soma das frequências absolutas simples. ✓ Frequência relativa acumulada (fac): é a soma das frequências relativas simples. ✓Ponto médio da classe (PM): é a média aritmética entre o limite superior (Ls) e o inferior da classe (Li). DISTRIBUIÇÃODE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS fi % Fac fac(%) PM 21 |- 24 8 26,7 8 26,7 22,5 24 |- 27 9 30,0 17 56,7 25,5 27 |- 30 1 3,3 18 60,0 28,5 30 |- 33 4 13,3 22 73,3 31,5 33 |- 36 7 23,3 29 96,6 34,5 36 |- 39 1 3,3 30 100,0 37,5 30 100,0 - - -TOTAL Idade Tabela 1. Distribuição segundo a frequência da idade dos funcionários da Empresa Alfa no ano de 2002 na cidade de Manaus – AM. DISTRIBUIÇÃO DE FREQUÊNCIA PARA VARIÁVEIS QUANTITATIVAS GRÁFICOS ESPECIAIS ✓ HISTOGRAMA: é a representação gráfica de uma distribuição de frequência por meio de retângulos justapostos. GRÁFICOS ESPECIAIS ✓Polígono de frequência: representação gráfica de uma distribuição por meio de uma linha poligonal fechada unindo os pontos médios e as frequências absolutas de cada classe. MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE INTRODUÇÃO ✓ As Medidas de Tendência Central ou Medidas de Posição são assim denominadas porque em geral estão localizadas mais para o centro de uma distribuição onde tende a haver uma maior concentração dos valores observados. ✓ As medidas de posição são: média aritmética, moda e mediana. ✓ A Média Aritmética Simples (que chamaremos apenas de média) é a medida de tendência central mais conhecida e usada para o resumo de dados. MÉDIA ARITMÉTICA MODA ✓ É o valor mais frequênte de uma distribuição de dados. MODA MEDIANA ✓A mediana é o valor que divide um conjunto de dados ordenados em exatamente duas partes iguais. MEDIANA MEDIANA MEDIANA MEDIDAS DE DISPERSÃO OU VARIABILIDADE INTRODUÇÃO ✓ As medidas de dispersão indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma medida de posição: a média. ✓ Consideraremos quatro medidas de dispersão: Desvio- Médio, Variância, Desvio Padrão e Coeficiente de Variação. ✓ Variância: Esta medida leva em conta todas as observações da amostra e mede a dispersão desses valores em torno da média. VARIÂNCIA ✓ A Variância é dada pela soma dos quadrados dos desvios (SQD) em relação a media aritmética, dividida pelo número de graus de liberdade (G.L)*. Por definição é a média dos quadrados dos desvios. DESVIO-PADRÃO COEFICIENTE DE VARIAÇÃO CV (%) 21,8 58,5 44,8 COEFICIENTE DE VARIAÇÃO