Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade I – ESTATÍSTICA DESCRITIVA 1.1. Distribuição de Frequência e Representação Gráfica Tipos de Variáveis Cada uma das características observadas ou mensuradas nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento é denominada de variável. Para a variável “sexo” são dois os resultados possíveis: sexo masculino e sexo feminino. Para a variável “número de filhos” há um número de resultados possíveis expressos através dos números naturais: 0, 1, 2, 3, ... n. Para a variável “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. As variáveis podem ser: Variáveis Quantitativas - referem-se a quantidades e podem ser medidas em uma escala numérica. Exemplos: idade, preço de produtos, peso. Elas subdividem-se em dois grupos: Variáveis quantitativas discretas: são aquelas cujos possíveis valores formam um conjunto finito e que resultam, frequentemente, de uma contagem. Por exemplo: número de vendas diárias em uma empresa, número de pessoas por família, quantidade de doentes por hospital. Variáveis quantitativas contínuas: são aquelas cujos possíveis valores pertencem a um intervalo de números reais e que resultam de uma mensuração. Exemplos dessas variáveis são os pesos de pessoas, a renda familiar, o tempo de vida, em horas, de componentes eletrônicos, o preço de um produto agrícola. Variáveis Qualitativas - refere-se a dados não numéricos. Exemplos dessas variáveis é o sexo das pessoas, a raça, o grau de instrução, etc. Elas subdividem-se também em dois grupos: Variáveis qualitativas ordinais: são aquelas que definem um ordenamento ou uma hierarquia, como por exemplos o grau de instrução, a classificação de um estudante no curso de engenharia, as posições das 100 empresas mais lucrativas, etc. Variáveis qualitativas nominais: por sua vez não definem qualquer ordenamento ou hierarquia. São exemplos destas a raça, o sexo, o local de nascimento, etc. Apresentação de Dados O objetivo é apresentar os dados agrupados de forma que seu manuseio, visualização e compreensão sejam simplificados. Esta apresentação pode ser feita de forma tabular ou gráfica. A tabela é um quadro que resume um conjunto de observações. A representação gráfica das séries estatísticas tem por finalidade dar uma ideia, a mais imediata possível, dos resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista. Distribuição de Frequência Um estudo completo das distribuições de frequências é imprescindível porque este é o tipo de tabela mais importante para a Estatística Descritiva. A seguir são descritos os procedimentos usuais na construção dessas tabelas. Primeiramente vamos ver alguns conceitos fundamentais. a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos valores coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22, 28, 35, 21, 23, 33 b) Rol: É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente. Os dados brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33, 35 c) Amplitude Total ou "range" (R): É a diferença entre o maior e o menor valor observado. No exemplo, R = 35 - 21 = 14 Quando o volume de dados é muito grande, o processo de ordenação torna-se trabalhoso, e sua listagem, ainda que ordenada, pouco representará. Nesses casos, pode-se simplificar o processo agrupando-se os dados em certo de número de classes. d) Intervalo de Classes O tamanho de cada intervalo, w, é obtido pela divisão do valor da diferença entre o maior e o menor valor, R, pelo número de intervalos k: Uma forma de determinar um número razoável, k, de classes, consiste em aplicar a fórmula de Sturges: Ex.: para um conjunto com 50 observações obtemos log10(50) ≈ 1,699; k = 1 + (3,322 x 1,699) ≈ 6,6 ≈ 7 intervalos Embora não exista uma regra única para a determinação do tamanho e da quantidade de classes, devem-se observar as seguintes indicações: As classes devem conter todas as observações; A 1a classe deve conter o menor valor e a última classe o maior valor; Cada valor deve ser colocado em uma única classe; Deve-se usar entre 5 e 20 classes, se possível, classes de mesmo tamanho. Construção de Distribuições de Frequências Xi é o ponto médio da i-ésima classe, é a média dos pontos extremos da classe; n é a quantidade total de observações; fi é a quantidade de observações, ou frequência absoluta, da i-ésima classe; Fi é a frequência acumulada até a i-ésima classe, e indica a quantidade de observações inferiores ao limite superior da classe; é obtida somando-se os valores das frequências observadas; fri é a frequência relativa da classe, obtida dividindo-se fi por n; Fri é frequência relativa acumulada, obtida dividindo-se Fi pelo total de observações. Gráficos Os gráficos são representações dos dados, muito valiosas na visualização dos resultados. Os principais tipos de gráficos usados na representação estatística são: a) Histograma (para dados agrupados em distribuições de frequências) b) Gráfico em Barras (ou em colunas) c) Gráfico em linhas d) Gráfico em setores a) Histograma São utilizados para representar a distribuição de frequências. Um histograma é um conjunto de retângulos com as bases proporcionais aos intervalos de classe, centros nos pontos médios das classes e áreas proporcionais as frequências. Pode-se usar tanto a frequência absoluta, ni, como a relativa, fi. Exemplo: O conjunto abaixo representa as notas do exame final de uma turma: 54 50 15 65 70 42 77 33 55 92 61 50 35 54 75 71 64 10 51 86 70 66 60 60 71 64 63 77 75 70 81 48 34 73 65 62 66 75 60 85 64 57 74 60 63 85 47 67 79 37 66 45 58 67 71 53 23 61 66 88 58 48 73 76 81 83 62 75 69 68 66 71 66 67 50 76 60 45 61 74 Notas Frequência 0 ----| 10 1 10 ----| 20 1 20 ----| 30 1 30 ----| 40 4 40 ----| 50 9 50 ----| 60 13 60 ----| 70 26 70 ----| 80 17 80 ----| 90 7 Mais 1 Fonte: dados hipotéticos Fonte: Dados hipotéticos. Notas do Exame Final de uma Turma 0 5 10 15 20 25 30 10 20 30 40 50 60 70 80 90 Mais Classes Frequência b) Gráfico em barras (ou em colunas) Fonte: Dados fornecidos pela Telemar Fonte: questionário aplicado aos alunos da UFAM, com ingresso no ano de 2003. *134 alunos não responderam esta questão 0 100 200 300 400 500 600 700 Fr eq uê nc ia Humanas Agrárias Exatas Biológicas Acadêmicos por Área e por Tipo de 2º Grau - UFAM 2003 Int.Pública Pública Particular Int.Partic Acessos de Telefonia Fixa na Região Norte do Brasil (1999-2003) 0 500 1000 1500 2000 1999 2000 2001 2002 2003 Anos Milhares de Acesso c) Gráfico de linhas Fonte: Dados fornecidos pela Telemar d) Gráfico em setores Construção de um gráfico de setores, dos acadêmicos por área – UFAM 2003. Fonte: questionário aplicado aos alunos da UFAM, com ingresso no ano de 2003. *134 alunos não responderam esta questão Acadêmicos por Aréa - UfAM 2003 1241 122 485 372 Humanas Agrárias Exatas BiológicasAcessos de Telefonia Fixa na Região Norte do Brasil (1999-2003) 1117 1465 1843 1903 1857 500 700 900 1100 1300 1500 1700 1900 2100 1999 2000 2001 2002 2003 Anos Milhares de Acesso MEDIDAS ESTATÍSTICAS Medidas Numéricas: Média, Mediana, Moda, Variância e Desvio Padrão. Suponha que você já definiu: Quais as características de interesse da população; Qual o tamanho da amostra; Você já coletou os dados; Você já entrou com os dados no computador e verificou (e corrigiu) possíveis erros de digitação. E agora????? Medidas de Locação ou de Tendência Central Exemplo: Considere os pesos de 10 recém-nascidos (em Kg). A média amostral é uma medida que indica onde está o centro da sua amostra. Entretanto, o centro da população também pode ser definido, como veremos mais tarde, e esta medida será chamada de média da população, e denotada por .
Compartilhar