Buscar

ANÁLISE DE CONJUNTOS DE DADOS AGRUPADOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
Probabilidade e Estatística
Professor André Espíndola
2014
Professor André Espíndola
ANÁLISE DE CONJUNTOS 
DE DADOS AGRUPADOS
Professor André Espíndola
INTRODUÇÃO
� Quando se lida com grandes conjuntos de 
dados, pode-se obter uma boa visualização e 
todas as informações necessárias, 
agrupando os dados em certo número de 
classes, intervalos ou categorias.
Professor André Espíndola
DADOS BRUTOS
� Conjunto de dados obtidos após a crítica dos 
valores, não é empregada nenhuma ordenação ou 
classificação nesse conjunto. 
Professor André Espíndola Professor André Espíndola
ROL 
� Conjunto de dados brutos organizado, ou seja, existe 
uma determinada ordem ou classificação dos dados.
2
Professor André Espíndola
DISTRIBUIÇÃO DE 
FREQUÊNCIAS
� Distribuição de frequências é uma técnica 
estatística para apresentar uma coleção de 
objetos classificados de modo a mostrar o 
número existente em cada classe ou grupo. 
Quando montamos uma D.F. podemos ter as 
seguintes frequências:
Professor André Espíndola
Frequências
� FREQUÊNCIA ABSOLUTA SIMPLES (fi): é o 
número de vezes que determinado valor aparece 
em uma população ou amostra.
� FREQUÊNCIA RELATIVA SIMPLES (fr): é a razão 
entre a frequência simples e o tamanho da amostra 
ou população.
� FREQUÊNCIA ABSOLUTA ACUMULADA (Fi): é a 
soma das frequências absolutas de uma classe com 
as frequências absolutas simples das classes 
anteriores.
� FREQUÊNCIA RELATIVA ACUMULADA (Fr): é a 
soma das frequências relativas de uma classe com 
as frequências relativas das classes anteriores.
Professor André Espíndola
Exemplos: Dados agrupados em classes:
Professor André Espíndola
Exemplo: Dados agrupados
Professor André Espíndola
Etapas Básicas
� As três etapas necessárias para definir as 
classes para uma distribuição de frequências 
com dados quantitativos são: 
� 1) Determinar o número de classes não 
sobrepostas. 
� 2) Determinar a extensão (tamanho) de cada 
classe. 
� 3) Determinar os limites de cada classe. 
Professor André Espíndola
Conceitos básicos
� Número total de observações: representa-se por n 
quando se trata de amostra e N quando se trata de 
população. 
� Limite inferior de observação: é o menor valor 
encontrado no rol. 
� Limite superior de observação: é o maior valor do 
conjunto. 
� Intervalo de observação ou amplitude de observação 
(H): é a diferença entre os limites de observação. 
� Número de classes ( k ): As classes são formadas 
especificando-se os intervalos que serão usados para 
agrupar as observações no conjunto de dados. 
3
Professor André Espíndola
Exemplo: Dados Brutos
Professor André Espíndola
Exemplo: ROL
H = 173-150 = 23
Professor André Espíndola
� Largura (ou amplitude) das classes: Recomenda-se que a 
largura seja a mesma para cada uma das classes. Construindo 
as classes com a mesma largura, reduzem-se as chances de 
interpretações inapropriadas pelo usuário. é a diferença entre o 
limite inferior da classe seguinte e o limite inferior da classe em 
questão. 
� Limites de classe: Os limites de classe precisam ser escolhidos 
de modo que cada uma das observações pertença a somente 
uma classe. 
� O limite inferior (li) de classe é o menor valor possível dos 
dados da respectiva classe. 
� O limite superior (Li) de classe é o maior valor possível dos 
dados da respectiva classe. 
� Ponto médio da classe : é a média aritmética entre os extremos 
da classe. 
Professor André Espíndola
DF
k = 6 classes
h = 4
li = 150
lf = 154
PM = 152
Professor André Espíndola
Exercícios
Professor André Espíndola
4
Professor André Espíndola
Responda
a) Qual a amplitude de observação? 
b) Qual a amplitude do segundo intervalo de 
classe? 
c) Qual o número de classes da distribuição? 
d) Qual o limite superior da classe de ordem 2? 
e) Qual o limite inferior da quarta classe? 
Professor André Espíndola
Representação gráfica de uma 
distribuição de frequências
� Uma distribuição de frequências pode ser 
representada graficamente pelo histograma, 
pelo polígono de frequências simples e pelo 
polígono de frequências acumulada: 
Professor André Espíndola
O HISTOGRAMA é a representação gráfica 
mais comum de uma distribuição de 
frequências e é formado por um conjunto de 
retângulos (justapostos quando a variável for 
contínua), que tem: 
a) a base sobre o eixo horizontal com o centro 
no ponto médio e largura igual a amplitude 
do intervalo de classes; 
b) a área proporcional à soma das frequências. 
Professor André Espíndola
Histograma de Frequência Absoluta 
Professor André Espíndola
Histograma de Frequência Relativa 
Professor André Espíndola
� O POLÍGONO DE FREQUÊNCIAS 
SIMPLES é um gráfico obtido ligando-se os 
pontos médios dos topos dos retângulos de 
um histograma. Para realmente obter um 
polígono (linha fechada), deve-se ligar os 
extremos da linha aos pontos médios da 
classe anterior à primeira e da posterior à
última, da distribuição. 
5
Professor André Espíndola
POLÍGONO DE FREQUÊNCIAS 
SIMPLES
Professor André Espíndola
� O POLÍGONO DE FREQUÊNCIAS 
ACUMULADAS é traçado marcando-se as 
frequências acumuladas sobre 
perpendiculares ao eixo horizontal, 
levantadas nos pontos correspondentes aos 
limites superiores dos intervalos de classe. 
Professor André Espíndola
Polígono de Frequência Acumulada 
baseado
Professor André Espíndola
MEDIDAS DE TENDÊNCIA 
CENTRAL (a partir da D.F.)
No passado, deu-se considerável atenção à
descrição de dados agrupados, porque, de modo 
geral, era vantajoso agrupar os dados antes de 
calcular várias medidas estatísticas. Hoje as 
condições são outras, pois os cálculos necessários 
podem ser feitos em questão de segundos por um 
computador. Mas alguns dados (cifras do governo e 
distribuição de medidas contínuas, por exemplo) só
são acessíveis em forma de distribuições de 
frequências. 
Professor André Espíndola
MÉDIA
Professor André Espíndola
Consideremos a distribuição: 
6
Professor André Espíndola
MEDIANA
� Primeiro: Determinar a Classe Mediana através do 
Ponto Mediano:
� A classe será aquela correspondente à frequência 
acumulada imediatamente superior ao Ponto 
Mediano.
Professor André Espíndola
Mediana
Professor André Espíndola
Exemplo: Calcule a média e a mediana da 
distribuição de frequência abaixo: 
Professor André Espíndola
Observação:
� Devido às condições impostas na obtenção da 
fórmula da mediana, fica evidente que o valor obtido 
pela fórmula é um valor aproximado do verdadeiro 
valor da mediana da série. 
� De modo geral, todas as medidas calculadas para 
uma variável contínua serão valores aproximados 
para estas medidas, uma vez que ao agruparmos 
os dados segundo uma variável contínua, há perda 
de informações quanto à identidade dos dados. 
Professor André Espíndola
MODA
� A classe que apresenta a maior frequência é
denominada classe modal. 
� Obs: Podemos determinar a moda como 
sendo o ponto médio da classe modal. 
Professor André Espíndola
Exemplo: As alturas dos alunos de uma 
escola estão representadas na tabela 
abaixo. Calcule a altura modal. 
7
Professor André Espíndola
Exemplo: As velocidades das motocicletas 
estão representadas na tabela abaixo. 
Calcule a velocidade modal. 
Professor André Espíndola
MEDIDAS DE DISPERSÃO (OU DE 
VARIABILIDADE)
Variância:
� A variância amostral para dados agrupados é
calculada pela seguinte fórmula: 
Professor André Espíndola
� Como o desvio padrão é a raiz quadrada 
positiva da variância, temos, para dados 
agrupados: 
Desvio padrão para dados agrupados
Professor André Espíndola
COEFICIENTE DE VARIAÇÃO
� O coeficiente de variação é uma medida 
adimensional, útil paracomparar resultados 
de amostras cujas unidades podem ser 
diferentes. 
� É definido como o quociente entre o desvio 
padrão e a média e, em geral, é expresso em 
percentual. 
Professor André Espíndola
CURVAS DE FREQUÊNCIAS
� Como, em geral, os dados coletados pertencem a 
uma amostra extraída de uma população, podemos 
imaginar as amostras tornando-se cada vez mais 
amplas e a amplitude das classes ficando cada vez 
menor, o que nos permite concluir que a linha 
poligonal (contorno do polígono de frequência) 
tende a se transformar numa curva - a curva de 
frequências - mostrando a verdadeira natureza da 
distribuição da população. 
� Podemos dizer, então, que, enquanto o polígono de 
frequência nos dá a imagem real do fenômeno 
estudado, a curva de frequência nos dá a imagem 
tendencial. 
Professor André Espíndola
Curvas em forma de sino
� Caracterizam-se pelo fato de apresentarem um valor máximo em 
torno da região central. 
� São muitos os fenômenos que oferecem distribuições em forma 
de sino: a estatura de adultos, o peso de adultos, a inteligência 
medida em testes. 
� As curvas em forma de sino podem ser simétricas ou 
assimétricas. 
� a) SIMÉTRICA: Esta curva caracteriza-se por apresentar o valor 
máximo no ponto central e os pontos equidistantes desse ponto 
terem a mesma frequência. 
� b) ASSIMÉTRICA: Na prática, não encontramos distribuições 
perfeitamente simétricas. Assim, as curvas correspondentes a 
tais distribuições apresentam a cauda de um lado mais 
alongada que do outro . Se a cauda mais alongada fica à direita, 
a curva é chamada assimétrica positiva. Se a cauda se alonga à
esquerda, a curva é assimétrica negativa. 
8
Professor André Espíndola
Exemplo
Professor André Espíndola
Referências
� SCHIFFMAN, L. & KANUK, L. Comportamento do consumidor. LTC 
Editora. 6a ed. 2000. P. 27) 
� DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. 
6.ed. São Paulo: Pioneira Thomson Learning, 2006.
� MORETTIN, P.A., BUSSAB, W. O. Estatística Básica. 5.ed. São Paulo: 
Ed. Saraiva, 2002.
� SPIEGEL, M. R. Estatística. 2.ed. Rio de Janeiro: Ao Livro Técnico 
S.A., 1969. SPIEGEL, M. R.. Manual de fórmulas, métodos e tabelas 
de matemática. São Paulo: Ed. Makron Books do Brasil, 1992.
� BUSSAB, Wilton O., MORETTIN, Pedro A. Estatística Básica. 5 ed. 
São Paulo: Saraiva, 2002.
� DOWNING, Douglas. Estatística Aplicada.2.ed São Paulo: Saraiva, 
2002. 
� TRIOLA, Mario Introdução à Estatística. 7.ed. Rio de Janeiro: LTC, 
1999.

Outros materiais