Buscar

Estatística Descritiva aula 01

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

Estatística Descritiva 
Wanderley de Oliveira Pereira 
2017.1 
O que é a estatística ? 
Para muitos, a estatística não passa de 
conjuntos de tabelas de dados 
numéricos. Os estatísticos são pessoas 
que coletam esses dados. 
Associar estatística a censo é 
perfeitamente correto do ponto de vista 
histórico. 
 
Estatística e Estado têm a mesma origem 
latina: status. 
 
Definição de Estatística 
A estatística é um conjunto de técnicas que 
permite, de forma sistemática, organizar, 
descrever, analisar e interpretar dados 
(numéricos ou não) oriundos de estudos 
ou experimentos, realizados em qualquer 
área do conhecimento. 
 
Estatística /Estatísticas 
• Estatística: indica uma metodologia 
desenvolvida para a coleta, a classificação, a 
apresentação, a análise e a interpretação de 
dados quantitativos e a utilização desses dados 
para a tomada de decisões. 
 
• Estatísticas: indica qualquer coleção de dados 
numéricos, reunidos com a finalidade de 
fornecer informações acerca de uma atividade 
qualquer. 
 
Importância 
A Estatística trabalha com informações, 
associando os dados a algum problema, 
descobrindo como e o que coletar, assim 
capacitando o pesquisador (ou profissional ou 
cientista) a obter conclusões a partir dessas 
informações, de tal forma que possam ser 
entendidas por outras pessoas. 
 
Áreas da Estatística 
• Estatística Descritiva: Conjunto de técnicas que 
objetivam coletar, organizar, apresentar, analisar 
e sintetizar os dados numéricos de uma 
população, ou amostra; 
• Estatística Inferencial: Processo de se obter 
informações sobre uma população a partir de 
resultados observados na amostra; 
• Probabilidade: Modelos matemáticos que 
explicam os fenômenos estudados pela Estatística 
em condições normais de experimentação. 
 
Exemplos 
• Anuário Estatístico Brasileiro 
O IBGE publica esse anuário apresentando, em 
várias tabelas, os mais diversos dados sobre o 
Brasil: educação, saúde, transporte, economia, 
cultura, etc. Embora simples, fáceis de serem 
entendidas, as tabelas são o produto de um 
processo demorado e extremamente 
dispendioso de coleta e apuração de dados. 
 
 
Exemplos 
• Análise financeira. 
Os analistas financeiros estudam dados sobre a 
situação da economia, visando explicar 
tendências dos níveis de produção e de 
consumo, projetando-os para o futuro. 
 
Probabilidade 
• O processo de generalização, que é característico 
do método indutivo, está associado a uma 
margem de incerteza. A existência da incerteza 
deve-se ao fato de que a conclusão, que se 
pretende obter para o conjunto de todos os 
indivíduos analisados quanto a determinadas 
características comuns, baseia-se em uma parcela 
do total das observações. A medida da incerteza 
é tratada mediante técnicas e métodos que se 
fundamentam na Teoria da Probabilidade. Essa 
teoria procura quantificar a incerteza existente 
em determinada situação. 
 
Fases do Método Estatístico 
• Definição do problema 
• Planejamento 
• Coleta de dados 
• Apuração dos dados 
• Apresentação dos dados 
• Análise e Interpretação dos dados 
 
Definição do problema 
Consiste na: 
• formulação correta do problema; 
• examinar outros levantamentos realizados no 
mesmo campo (revisão da literatura); 
• saber exatamente o que se pretende 
pesquisar é definir o problema corretamente 
(variáveis, população, hipóteses, etc.) 
 
Planejamento 
Determinar o procedimento necessário para 
resolver o problema: 
• Como levantar informações; 
• Tipos de levantamentos: 
- Por Censo (completo); 
- Por Amostragem (parcial). 
• Cronograma, Custos, etc. 
 
Coleta dos dados 
Consiste na obtenção dos dados referentes ao 
trabalho que desejamos fazer. 
• A coleta pode ser: 
Direta - diretamente da fonte – contínua, 
periódica e ocasional; 
Indireta - feita através de outras fontes – feitas 
por analogia, proporcionalização, indícios e 
avaliação. 
 
Apuração dos dados 
Consiste em resumir os dados, através de uma 
contagem e agrupamento. É um trabalho de 
coordenação e de tabulação. 
• Apuração: manual, mecânica, eletrônica e 
eletromecânica. 
Apresentação dos dados 
É a fase em que vamos expor os resultados 
obtidos na coleta e na organização. 
• Esta apresentação pode ser: 
Tabular (apresentação numérica) 
Gráfica (apresentação geométrica) 
 
Análise e Interpretação dos dados 
É a fase mais importante e também a mais 
delicada. 
 
O pesquisador tira conclusões que o 
auxiliam a resolver seu problema. 
 
Conceitos Fundamentais e Definições 
• População: conjunto de elementos que tem pelo 
menos uma característica em comum. 
• Amostra: subconjunto de elementos de uma 
população. Este subconjunto deve ter dimensão 
menor que o da população e seus elementos devem 
ser representativos da população. 
• Finitos: possuem um número limitado de 
elementos. 
• Infinitos: possuem um número ilimitado de 
elementos. 
 
 
• Amostragem Aleatória: Cada elemento da 
população tem a mesma chance de ser 
escolhido. 
• Amostragem Estratificada: Classificar a 
população em, ao menos dois estratos e 
extrair uma amostra de cada um. 
• Amostragem Sistemática: Escolher cada 
elemento de ordem k. 
 
 
 
 
• Amostragem por Conglomerados: Dividir em 
seções a área populacional, selecionar 
aleatoriamente algumas dessas seções e 
tomar todos os elementos das mesmas. 
• Amostragem de Conveniência: Utilizar 
resultados de fácil acesso. 
 
 
 
• Variável: é a característica que vai ser 
observada, medida ou contada nos elementos 
da população ou da amostra e que pode 
variar, ou seja, assumir um valor diferente de 
elemento para elemento. 
 
• Variável qualitativa: é uma variável que assume 
como possíveis valores: atributos ou qualidades. 
Também são denominadas variáveis categóricas. 
• Variável qualitativa nominal: atributos ou 
qualidades que não apresentam uma ordem 
natural de ocorrência. 
• Variável qualitativa ordinal: atributos ou 
qualidades que apresentam uma ordem natural 
de ocorrência. 
 
 
 
Exemplos 
• Exemplo 01: meios de informação utilizados 
pelos alunos da disciplina Estatística Descritiva 
do curso de Matemática da FAFIDAM: 
televisão, revista, internet, jornal. 
• Exemplo 02: estado civil dos alunos da 
disciplina Estatística Descritiva do curso 
Matemática da FAFIDAM: solteiro, casado, 
separado. 
 
• Variável quantitativa: é uma variável que 
assume como possíveis valores, números. 
• Variável quantitativa discreta: representadas 
geralmente por números inteiros, formando um 
conjunto finito ou enumerável. 
• Variável quantitativa contínua: representadas 
por números, em intervalos da reta real e, em 
geral, resultantes de mensurações. 
 
 
Exemplos 
• Exemplo 03: Idade dos alunos da disciplina 
Estatística Descritiva do curso de Matemática 
da FAFIDAM: 18, 18, 19, 17, 21, 25, 30,... 
• Exemplo 04: peso (quilogramas) dos alunos da 
disciplina Estatística Descritiva do curso de 
Matemática da FAFIDAM: 46,5; 48,85; 49; 
51,30; 55,12; 62,0 ... 
 
Representação tabular 
 
 
Série Estatística 
Uma série estatística é um conjunto de dados 
ordenados segundo uma característica comum, 
as quais servirão posteriormente para se fazer 
análises e inferências. 
Série Homógrada: a variável descrita tem 
variação discreta. 
Série Heterógrada: o fenômeno ou fato é 
apresentado em graduações ou subdivisões. 
 
Série Temporal ou Cronológica: É a série cujos 
dados estão dispostos em correspondência com 
o tempo, ou seja, varia o tempo
e permanece 
constante o fato e o local. 
 
Série Geográfica ou Territorial: É a série cujos 
dados estão dispostos em correspondência com 
o local, ou seja, varia o local e permanece 
constante a época e o fato. 
 
Série Específica ou Qualitativa: É a série cujos 
dados estão dispostos em correspondência com 
a espécie ou qualidade, ou seja, varia o fato e 
permanece constante a época e o local. 
 
Série Mista ou Composta: A combinação entre duas ou 
mais séries constituem novas séries denominadas 
compostas e apresentadas em tabelas de dupla 
entrada. O nome da série mista surge de acordo com a 
combinação de pelo menos dois elementos. 
 
Distribuição de Frequências 
É o tipo de série estatística na qual permanece 
constante o fato, o local e a época. Os dados são 
colocados em classes preestabelecidas, 
registrando a frequência de ocorrência. 
 
Algumas definições 
• Dados Brutos: dados originais que ainda não 
se encontram prontos para análise. 
• Rol: são os dados brutos organizados em 
ordem crescente ou decrescente. 
 
Distribuição de Frequência Discreta ou Pontual: 
Os valores das variáveis aparecem 
individualmente. 
 
Distribuição de Frequências Intervalar: os 
valores da variável não aparecem 
individualmente, mas agrupados em classes. 
Distribuição de Frequência Discreta 
Distribuição de Frequências Intervalar 
 
Elementos de uma distribuição de 
frequências. 
• Amplitude total (A): é a diferença entre o 
maior e o menor número do rol. 
Elementos de uma distribuição de 
frequências. 
• Amplitude total (A): é a diferença entre o 
maior e o menor número do rol. 
• Número de classes (K). 
A Regra de Sturges, que nos dá o número de classes em 
função do número de valores da variável. 
Para uma série com n elementos (valores): 
K=1+3,3.logn 
ou 
K=5, se n for menor ou igual a 25 
K ≈ 𝑥 = 𝑛, se n for maior que 25 
 
 
 
 
 
 
 
• Amplitude de um intervalo de classe (h): é o 
comprimento que define a classe. 
h=A/K. 
• Amplitude de um intervalo de classe (h): é o 
comprimento que define a classe. 
h=A/K. 
• Limites de Classe (i): os extremos de cada 
classe 
li = limite inferior (linf) e 
Li = limite superior (Lsup) 
Observação: Vamos trabalhar com intervalos 
fechados à esquerda e abertos à direita; isso 
significa que valores iguais ou superiores ao 
limite inferior são considerados nessa classe e 
valores iguais e/ou superiores ao limite superior 
são considerados na classe abaixo. 
• Ponto Médio da Classe - (xi): o ponto que 
divide o intervalo de classe em duas partes 
iguais. 
 𝑥𝑖 =
𝑙𝑖 + 𝐿𝑖
2
 
• Frequências 
• Frequências simples ou absoluta da classe i (fi): 
são os valores que realmente representam o 
número de dados de cada classe. 
• A soma das frequências simples é igual ao 
número total dos dados. 
• Frequências relativas (fri) – são os valores das 
razões entre as frequências simples e o 
número total de dados. 
 
 
fr𝑖 =
𝑓𝑖
𝑛
 
• Frequência acumulada (Fi) – é o total das 
frequências de todos os valores inferiores ao 
limite superior do intervalo de uma dada 
classe. 
• Frequência acumulada relativa (Fri) – é a 
frequência acumulada da classe, dividida pela 
frequência total da distribuição. 
 
 
 
Fr𝑖 =
𝐹𝑖
𝑛
 
Conceitos básicos 
Proporção 
x 
Porcentagem 
x 
Razão 
x 
Taxa 
Arredondamentos 
• 1°. Se o primeiro algarismo após aquele que 
formos arredondar for de 0 a 4, conservamos 
o algarismo a ser arredondado e desprezamos 
os seguintes. 
 
 
 
• 2°. Se o primeiro algarismo após aquele que 
formos arredondar for de 6 a 9, acrescenta-se 
uma unidade no algarismo a ser arredondado 
e desprezamos os seguintes. 
 
• 3°. Se o primeiro algarismo após aquele que 
formos arredondar for 5, seguido apenas de 
zeros, conservamos o algarismo se ele for par 
ou aumentamos uma unidade se ele for 
ímpar, desprezando os seguintes. 
 
• 4°. Se o 5 for seguido de outros algarismos dos 
quais, pelo menos um é diferente de zero, 
aumentamos uma unidade no algarismo e 
desprezamos os seguintes. 
 
• 5°. Quando, arredondarmos uma série de 
parcelas, e a soma ficar alterada, devemos 
fazer um novo arredondamento (por falta ou 
por excesso), na maior parcela do conjunto, de 
modo que a soma fique inalterada. 
 
Exemplo 01 
• Construa a Tabela de Frequência sobre os dados 
abaixo: 
Alturas (em cm) de 50 estudantes da Universidade ABC 
140 141 141 143 143 143 145 146 1470 149 
149 149 150 150 151 152 152 153 153 154 
155 155 156 157 157 159 159 160 160 160 
160 162 163 164 164 165 167 168 168 168 
169 171 171 172 172 174 176 178 182 192 
Exemplo 02 
20 observações relativas ao índice pluviométrico 
em determinados municípios do Estado 
 MILÍMETROS DE CHUVA 
144 152 159 160 
160 151 157 146 
154 145 141 150 
142 146 142 141 
141 150 143 158 
 
GRÁFICOS 
• Histograma: é formado por um conjunto de 
retângulos justapostos, cujas bases se 
localizam sobre o eixo horizontal, de tal modo 
que seus pontos médios coincidem com os 
pontos médios dos intervalos de classe. 
 
 
 
 
HISTOGRAMA 
• As larguras dos retângulos são iguais às 
amplitudes dos intervalos de classe. 
• As alturas dos retângulos devem ser 
proporcionais às frequências das classes, 
sendo igual a amplitude dos intervalos. 
 
• Polígono de frequência: é um gráfico em 
linha, sendo as frequências marcadas sobre 
perpendiculares ao eixo horizontal, levantada 
pelos pontos médios dos intervalos de classe. 
 
• Polígono de frequência acumulada: é traçado 
marcando-se as frequências acumuladas sobre 
perpendiculares ao eixo horizontal, levantadas 
nos pontos correspondentes aos limites 
superiores dos intervalos de classe. 
 
• Distribuição de frequência sem intervalos de 
classe: é representada graficamente por um 
diagrama em que cada valor da variável é 
representado por um segmento de reta 
vertical e de comprimento proporcional à 
respectiva frequência. 
 
Exemplo 01 
Construir um Histograma, um polígono de frequências 
e um polígono de frequências acumuladas para 
representar os dados abaixo. 
 Alturas (em cm) de 50 estudantes da Universidade ABC 
140 141 141 143 143 143 145 146 1470 149 
149 149 150 150 151 152 152 153 153 154 
155 155 156 157 157 159 159 160 160 160 
160 162 163 164 164 165 167 168 168 168 
169 171 171 172 172 174 176 178 182 192 
Gráficos de Linhas 
• Geralmente utilizado para ilustrar uma Série 
Temporal. 
• Num plano de 2 dimensões, marcamos um 
ponto no par ordenado correspondente a 
variável e ao valor observado. 
• Em seguida, unimos cada ponto ao seu 
sucessor por um segmento de reta. 
 
Gráfico de Linhas 
• Geralmente utilizado para ilustrar uma Série 
Mista, em que uma série é a Série Temporal. 
Gráficos de colunas ou barras 
• Usado para ilustrar qualquer tipo de série 
(variáveis nominais e ordinais). 
 
Gráficos de colunas ou barras 
• Características: 
• Os retângulos devem ter a mesma largura; 
• O comprimento do retângulo é proporcional a 
frequência (escolher uma escala); 
• A distância entre os retângulos deve ser de 
2/3 da largura do retângulo. 
• O número de retângulos não deve ser maior 
que 12. 
 
Gráfico de colunas comparativas 
(Justapostas) 
• Ilustrar uma Série Mista 
Gráfico de colunas comparativas 
(Sobrepostas) 
 
Gráfico de Barras 
• Séries com variáveis com designações 
extensas. Características iguais ao de Colunas. 
Gráfico de 
Barras 
comparativo

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais