Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil “O que eu ouço, eu esqueço. O que eu vejo, eu lembro. O que eu faço, eu entendo.” (Confúcio) TEMA 01 O QUE É A ESTATÍSTICA De modo sintético, podemos dizer que a estatística é a ciência que se ocupa de descrever, analisar e interpretar dados experimentais. Conceitos básicos: * População: conjunto formado por todos os elementos – usualmente muitos - que têm em comum a característica em estudo. Ex.: se estamos estudando o desempenho de uma turma, todos os alunos da turma formam a população. 3ÍSTICA * Amostra: subconjunto de uma população com relativamente poucos elementos, de valores definidos. Deve-se ressaltar que uma amostra deve(ria) reproduzir todas as condições importantes de uma população. Ex.: uma amostra de alunos da turma deveria ter desempenho semelhante à turma toda (notas/médias/faltas...) A característica da população ou da amostra que estamos estudando pode ser expressa em termos de uma variável, que pode assumir diferentes valores. Há dois tipos de variáveis: • variáveis qualitativas: apresentam atributos como valor, por exemplo, cor de cabelos, cidade natal, times de futebol, orientações sexuais, etc. As variáveis qualitativas se dividem em duas categorias: nominal, quando há apenas o nome da variável (ex.: cor do cabelo), e ordinal, quando o nome da variável pode ser associado a uma graduação ou hierarquia (ex.: patentes militares). • variáveis quantitativas: apresentam valores numéricos, tais como peso de pessoas, idade, número de defeitos na produção de uma peça, etc. As variáveis quantitativas podem ser divididas em duas categorias: - discretas: são variáveis que podem apresentar apenas valores predeterminados dentro de um conjunto, ou seja, não existirão valores intermediários. Ex: número de filhos de um casal; número feriados no ano; quantidade de ações em alta numa bolsa, etc. As variáveis discretas estão ligadas às contagens; 4nidade I - contínuas: apresentam qualquer valor dentro de um faixa possível. Ex.: pesos dos estudantes na sala, quantidade de água em um copo; índices de inflação em vários períodos, etc. As variáveis contínuas estão ligadas às medições. Note que essa diferenciação entre variáveis discretas e contínuas pode ser tênue, em função da quantidade de elementos envolvidos e da precisão da medida. A Estatística é dividida em duas áreas: (1) A estatística descritiva cuida da coleta, organização, resumo e apresentação dos dados de um conjunto. Ou seja, é o tratamento das variáveis estatísticas. Assim, o conjunto tem que ser finito e com elementos com valores definidos e determináveis, ou seja, uma amostra. (Foco da disciplina Estatística!) (2) A estatística indutiva procura inferir conclusões e respaldar decisões coerentes acerca de uma população, normalmente respaldadas em dados obtidos pela estatística descritiva de uma amostra. (Foco da disciplina Estatística Aplicada!) _________________________________________________________________ DADOS ESTATÍSTICOS No trabalho de descrição das amostras seguimos uma série de passos: (i) coletar as informações: via de regra, uma extensa relação de dados sem nenhum tipo de ordem pré-estabelecida. (ii) organizar e representar esses dados. (ii-i) a representação dos dados é feita através de quadros, tabelas e gráficos. CONCEITOS: (i) frequência simples ( fi ): é o número de vezes que um mesmo elemento ou elementos de uma mesma faixa de valores se repetem na amostra. Exemplo 1: Foi coletado numa sala de alunos universitários o número de irmãos de cada um deles e se chegou à tabela abaixo. Tabela de dados brutos Tabela de frequências NÚMERO DE IRMÃOS QUE CADA ALUNO DA SALA POSSUI Número de irmãos Frequência simples 1 2 1 2 1 xi fi 5 3 2 4 3 0 8 0 1 1 0 4 1 15 2 4 2 5 1 2 11 1 0 1 2 6 3 7 3 2 2 4 1 4 5 2 1 0 1 3 5 3 0 3 3 4 5 6 1 2 2 0 1 1 Frequência total ( ft ) 50 1 0 1 3 0 Perceba que reduzimos cinquenta informações mostradas na tabela de dados brutos para apenas seis pares na tabela de frequências. Observe também a introdução do conceito de frequência total (ft), que é a soma de todas as frequências simples. Estatística – Prof. Dr. Pedro Ivo Brasil Estatística – Prof. Dr. Pedro Ivo Brasil Exemplo 2: Foi coletado numa sala de alunos universitários o salário de cada um deles e se chegou à tabela: Tabela de dados brutos Tabela de frequências SALÁRIO DE CADA ALUNO DA SALA Salários dos alunos da sala Frequência simples R$ 901 R$ 1.196 R$ 1.201 R$ 1.000 R$ 1.100 Li |--- Ls fi R$ 1.200 R$ 1.029 R$ 1.380 R$ 914 R$ 1.235 900 |--- 1000 6 R$ 1.436 R$ 934 R$ 1.297 R$ 1.136 R$ 1.095 1000 |--- 1100 11 R$ 1.145 R$ 1.189 R$ 1.020 R$ 1.350 R$ 1.247 1100 |--- 1200 15 R$ 1.037 R$ 1.320 R$ 1.189 R$ 1.098 R$ 1.479 1200 |--- 1300 11 R$ 1.156 R$ 1.167 R$ 957 R$ 1.178 R$ 988 1300 |--- 1400 4 R$ 1.310 R$ 1.048 R$ 1.215 R$ 1.070 R$ 1.250 1400 |--- 1500 2 R$ 1.052 R$ 1.172 R$ 1.080 R$ 1.134 R$ 1.096 1500 |--| 1600 1 R$ 1.183 R$ 1.580 R$ 1.264 R$ 990 R$ 1.115 Frequência total (ft) 50 R$ 1.275 R$ 1.143 R$ 1.280 R$ 1.120 R$ 1.286 Perceba que criamos o conceito de agrupamento por classes e novamente alcançamos o objetivo de organizar e agrupar informações. Transformamos 50 informações em sete pares de informações, o que é consideravelmente mais fácil de trabalhar. Note que todas as classes têm uma amplitude (Ls – Li) igual a 100. (ii) Frequência relativa (fr): é a razão entre a frequência simples e a frequência total de um dos valores ou da faixa valores. Logo, a frequência relativa do valor 4 irmãos (no exemplo 1) é de 10% [5 dividido por 50 é igual a 0,10 ou 10%]. E a frequência relativa dos salários entre R$1100 e R$1200 é de 30%, ou seja, 15 dividido por 50 é igual a 0,3 ou 30%. (iii) Frequência acumulada crescente (fac) (abaixo de; ≤): é o somatório de todas as frequências simples abaixo de determinado valor ou classe de valores, incluindo o próprio. Assim, por exemplo, a frequência acumulada abaixo de 2 irmãos (no exemplo 1) é de 34 alunos (11+15+8) e a frequência acumulada abaixo de R$ 1100 (no exemplo 2) é de 17 alunos (6+11). (iv) Frequência acumulada decrescente (fad) (acima de; ≥): é o somatório de todas as frequências simples acima de determinado valor ou classe de valores, incluindo o próprio. Assim a frequência acumulada acima de 4 irmãos no exemplo 1 é de 9 alunos (5+3+1) e a frequência acumulada acima de R$1400 no exemplo 2 é de 3 alunos (2+1). Exercício: construa as colunas com fr , fac , e fad para os exemplos 1 e 2.
Compartilhar