Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Básica AULA 03 – CONCEITOS BÁSICOS De onde surgiu a estatística Estatística Do latim statisticum collegium (Assuntos do Estado) Do italiano statista (Homem do estado) Do alemão Statistik (Análise de dados) Uma coleção de informação de interesse para o Estado sobre população e economia. Informações indispensáveis para os governantes conhecerem suas nações e para a construção de programas de governo. OBJETIVOS DA ESTATISTICA: “tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações.” População e Amostra Podemos inferir (deduzir) determinadas características de uma população se extraímos uma amostra representativa desta. POPULAÇÃO: coleção de unidades individuais com uma ou mais características comuns, que se pretendem estudar. AMOSTRA: conjunto de dados ou observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões para a população de onde é recolhida. População e Amostra Eleições no Brasil: População geográfica População estatística Todos os brasileiros Brasileiros que votam EXTRAPOLAÇÃO: generalizar com base em dados parciais e reduzidos, estender a validação de uma afirmação ou conclusão, além dos limites que ele é comprovável. Amostra Uma amostra, para ser boa, tem de ser representativa, ou seja, deve conter proporcionalmente uma imagem qualitativa e quantitativa o que a população possui. A amostra deve ser imparcial, isto é, todos os elementos da população devem ter as mesmas chances de fazerem parte da amostra. Atenção Por exemplo, sem usar amostras, como poderíamos saber a taxa de defeitos de fabricação de uma fábrica de fósforos, será que seria riscando todos os que foram produzidos? Variáveis 1. Pretendia-se fazer um estudo sobre o número de irmãos dos alunos do 10º ano de escolaridade de uma Escola Secundária. Para isso, efetuou-se um inquérito ao qual responderam 60 alunos. Indique: a) População; b) Amostra; c) Variável. R – PopulaçãoTodos os alunos do 10º ano da escola. Amostra Os 60 alunos que responderam ao inquérito. Variável Números de irmãos de cada aluno. Variável: Elementos da amostra que queremos averiguar estatisticamente, referente a cada elemento da amostra ou população. Variável é qualquer característica comum aos elementos de uma população à qual se possa atribuir um número ou uma categoria, podendo assumir valores diferentes de unidade observacional para unidade observacional. Variáveis V ar iá ve is Qualitativas Ordinárias Nominais Quantitativas Discretas Continuas Variável é a característica de interesse que é medida em cada elemento da amostra ou população. Ex: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. Ex: número de filhos, número de bactérias por litro de leite. Ex: sexo, cor dos olhos, fumante/não fumante, doente/sadio Ex: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal) Exercícios 1) Das variáveis abaixo, indique a discreta: a) O número de "caras" que se pode obter jogando ao ar dez moedas. b) O tempo de duração de um disco, tomando como unidade o minuto. c) A temperatura de uma sala, medida em graus Celsius. d) As alturas dos alunos de uma turma, expressas em cm. e) As notas dos alunos, em um teste de Matemática. Exercícios: Classifique as seguintes variáveis em: (QN) Qualitativa nominal, (QO) Qualitativa ordinal (QC)Quantitativa contínua, (QD)Quantitativa discreta ( ) Cor dos olhos ( ) Número de filhos de um casal ( ) Peso de um indivíduo ( ) Altura de um indivíduo ( ) Número de alunos de uma escola ( ) Tipo sangüíneo ( ) Posicionamento das empresas no mercado ( ) Fator RH ( ) Sexo ( ) Comprimento de um segmento de reta Variáveis Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Considere o seguinte conjunto de dados Tabela primitiva ou dados brutos É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Rol dos dados É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Distribuição de frequência Quando se estuda uma massa de dados é de frequente interesse resumir as informações de variáveis. Dados podem ser arrumados em: Classes Intervalos Determinando o número de indivíduos pertencentes a cada classe ou intervalo. Distribuição de freqüência SEM INTERVALOS DE CLASSE: É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Distribuição de freqüência COM INTERVALOS DE CLASSE: Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Distribuição de frequência Dados Freqüência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20 SEM INTERVALOS DE CLASSE Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 COM INTERVALOS DE CLASSE Frequência absoluta ou simples (Fi): É o número de observações que se encontra presente em uma classe ou intervalo especifico. CLASSE: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 é a 3ª classe, onde i = 3. Distribuição de Frequência LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ). Ex: Em 49 |------- 53,... l3 = 49 e L3 = 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |------- 57. Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 Distribuição de Frequência AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li. Obs: Na distribuição de frequência c/ classe o hi será igual em todas as classes. Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 ℎ𝑖 = 𝐿𝑖 − 𝑙𝑖 Ex: na tabela anterior. ℎ𝑖 = 53 − 49 = 4 Distribuição de Frequência AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 𝐴𝐴 = 61 − 41 = 20 AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). 𝐴𝑇 = 𝐿𝑚𝑎𝑥 − 𝐼𝑚𝑖𝑛 𝐴𝐴 = 𝑋𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 Em nosso exemplo: 𝐴𝐴 = 60 − 41 = 19 Obs: AT sempre será maior que AA. Distribuição de Frequência PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. ....... Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, . 𝑥3 = (𝐼3 + 𝐿3) 2 Método prático para construção de uma Distribuição de Frequências c/ Classe 1º - Organize os dados brutos em um ROL. 2º - Calcule a amplitude amostral AA. 3º - Calcule o número de classes através da "Regra de Sturges": nI nº de classes 3 |-----| 5 3 6 |-----| 11 4 12 |-----| 22 5 23 |-----| 46 6 47 |-----| 90 7 91 |-----| 181 8 182 |-----| 362 9 No nosso exemplo: n = 20 dados, então ,a princípio, a regra sugere a adoção de 5 classes. Distribuição de Frequência 4º - Decidido o nº de classes, calcule então a amplitude do intervalo de classe. Obs: Como h > AA/i um valor ligeiramente superior para haver folga na última classe. Utilizaremos então h = 4 ℎ > 𝐴𝐴 𝑖 𝐴𝐴 𝑖 = 19 5 = 3,8 5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com freqüência = 0 (zero). No nosso exemplo: o menor nº da amostra = 41 + h = 45, logo 41 |------- 45. As classes seguintes respeitarão o mesmo procedimento. O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe anterior. Representação Gráfica A base retângulo é formada pelos intervalos de classe e a altura do retângulo é proporcional à frequência do intervalo. Histogramas Distribuição de frequência Um histograma fornece uma representação visual da distribuição dos dados. Um engenheiro da área de vendas de uma montadora selecionou ao acaso, uma amostra de 40 revendedores autorizados em todo Brasil e anotou o número de unidades adquiridas por estes revendedores no mês de maio. Com estes dados, ele deseja construir um quadro de frequência. 10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20 Unidades adquiridas no mês de maio 1º PASSO: Identifique o valor máximo e o valor mínimo para calcular a amplitude. Aa = Max - Min = 39 - 6 = 33 Passos para a construção de uma Tabela de Frequência 2º PASSO: Escolha do número de classes ou intervalos (k). - não existe uma regra única para a determinação do tamanho e quantidade de classes. Alguns autores afirmam que ela deve variar entre 5 e 25. - Adotaremos o seguinte cálculo: 32,640 nk Importante: o valor de k deve ser um valor inteiro. Assim, neste caso pode ser: 6 ou 7. 3º PASSO: Determinação da amplitude do intervalo (h) kk R h 33 Obs.: Como os dados coletados são números inteiros, a amplitude também deve ser um número inteiro. Assim, o valor da amplitude (R) deve ser acrescido de duas unidades para que sua divisão pelo número de classes (k =7) seja um número inteiro. 5 7 3533 kk R h 4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe e o limite superior para a última classe. Passos para a construção de uma Tabela de Frequência Passos para a construção de uma Tabela de Frequência 5º PASSO: Montagem da tabela de frequência Classes Intervalo de classe ou número de carros Número de revendedores ou frequência Frequência percentual 1 5 |----------- 2 3 4 5 6 7 |-------- 40 Total Tabela de frequência 10 3 7,5% 40 10 |---------- 15 3 7,5% 15 |---------- 20 11 27,5% 20 |----------25 11 27,5% 25 |----------30 6 15% 30 |----------35 4 10% 35 2 5% 100% 1 - Dados brutos 10 13 19 17 24 15 18 14 15 18 21 19 16 19 17 14 17 12 18 22 20 23 11 16 3 Proceder a contagem 10 a 13 - /// 13 a 16 - //// 16 a 19 - //// /// 19 a 22 - //// 22 a 25 - /// 4 - Fazer uma tabela de freqüência classe nº % 10 a 13 3 12,5 13 a 16 5 20,8 16 a 19 8 33,4 19 a 22 5 20,8 22 a 25 3 12,5 ou 5 - traçar um histograma classes 2 - Fixar intervalos de classe 1 - intervalo total= máx-min 2 - 3 - k totalervalo Amplitude knk int 255 Distribuições de Frequência Exercício: Montar uma tabela de frequência para o peso dos homens da turma de estatística. 60 58 71 62 85 65 83 68 68 66 60 78 80 60 85 69 75 69 60 90 68 73 59 70 90 73 63 77 68 74 62 80 Tabela de pesos de uma amostra da turma de estatística 1º PASSO: Encontrar o valor máximo e o valor mínimo para calcular a amplitude. R = Max - Min = 90 - 58 = 32 Tabela de Frequência - Exercício 2º PASSO: Escolha do número de classes ou intervalos (k). 6 6 3632 kk R h 66,532 nk Lembrando que: k deve ter um valor inteiro, este pode ser: 5 ou 6. 3º PASSO: Determinação da amplitude do intervalo (h) Como os dados são números inteiros valor de h deve ser um valor inteiro. Iremos admitir k = 6 e somaremos 4 unidades na amplitude. 4º PASSO: Rever os limites de classe preliminares. Aqui, o arredondamento deve ser distribuído igualmente para o limite inferior da primeira classe (5856) e para o limite superior da última classe (9092). Tabela de Frequência - Exercício 5º PASSO: Montagem da tabela de frequência: Classes Intervalos Número de pessoas ou frequência frequência percentual (%) 1 56 |------ 62 6 18,75 2 62 |------ 68 5 15,625 3 68 |------ 74 10 31,25 4 74 |------ 80 4 12,5 5 80 |------ 86 5 15,625 6 86 |------ 92 2 6,25 32 100% Tabela de Frequência Total Obs.: Atenção para o cálculo da frequência. 60 58 71 62 85 65 83 68 68 66 60 78 80 60 85 69 75 69 60 90 68 73 59 70 90 73 63 77 68 74 62 80 Tabela de pesos de uma amostra da Turma de estatística Tabela de Frequência - Exercício Um engenheiro de produção que atuava numa empresa de manutenção de motores de aviões, observou nos registros da empresa, que o tempo de mão-de-obra gastos na revisão completa de um motor apresentava-se na seguinte tabela de frequência:Classes Tempo de mão de obra (horas) Número de motores 1 0 |------ 4 1 2 4 |------ 8 5 3 8 |------ 12 10 4 12 |------ 16 12 5 16 |------ 20 4 32 Tabela de Frequência da manutenção de motores Total Para planejar o orçamento e a data de entrega de 5 motores, ele deseja saber o número médio de horas de mão-de-obra necessário para a revisão de cada motor. i ii f fx X Calculando a média pela Tabela de Frequência 1º PASSO: Calcular o ponto médio de cada classe: Classes Tempo de mão de obra (horas) Número de motores 1 0 |------ 4 1 2 4 |------ 8 5 3 8 |------ 12 10 4 12 |------ 16 12 5 16 |------ 20 4 32 Tabela de Frequência da manutenção de motores Total 2 6 10 14 18 iX 2 2 04 1 X 18 2 1620 5 X 2º PASSO: Realizar o somatório da multiplicação de cada ponto médio pela frequência: Classes Tempo de mão de obra (horas) Número de motores 1 0 |------ 4 1 2 4 |------ 8 5 3 8 |------ 12 10 4 12 |------ 16 12 5 16 |------ 20 4 32 Tabela de Frequência da manutenção de motores 2 6 10 14 18 iX ii fX 2 X1 =2 6 X5 =30 10X10 =100 14 X12 =168 18x4=72 372 ii fX Calculando a média pela Tabela de Frequência freqüência classes POLÍGONO DE FREQÜÊNCIA Alternativa ao histograma polígono de freqüência Formas gráficas de apresentação de dados É um gráfico que se obtém unindo por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as interseções do polígono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula. 0,30 0,20 0,10 0,00 3 8 13 18 23 28 33
Compartilhar