Buscar

CAPÍTULO - Cap. - 1 Estatística Descritiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

�PAGE �
�PAGE �26�
ESCOLA DE ENGENHARIA DE LORENA – EEL – USP
DISCIPLINA: ESTATÍSTICA
CAPÍTULO 1: Levantamento e Apresentação de Dados
1.0 Histórico
O Conceito de Estatística
Tipos de Estatísticas
População e Amostra
Tipos de Variáveis
Fases do Método Estatístico
Coleta de Dados
Apuração de Dados
Apresentação de Dados
Análise, Interpretação e Conclusão sobre os Dados
Distribuições de Freqüências
Dados Brutos
Rol
Distribuição de Freqüências
Intervalos e Limites de Classes
Limites Reais ou Verdadeiros de Classes
Amplitudes das Classes
Regras Gerais para Elaborar uma Distribuição de Freqüências
Representação Gráfica de uma Distribuição de Freqüências - Histograma
Representação Gráfica de uma Distribuição de Freqüências Acumuladas – Ogivas de Galton
Histograma Alisado
Função de Distribuição Acumulada
Ramo e Folhas
1.0 Histórico
 A Estatística é a “ciência” que estuda os métodos de coleta de dados experimentais. Sua origem está associada às primeiras contagens de objetos, animais, pessoas, etc. e a conseqüente transmissão das informações às pessoas, consistindo em uma forma rudimentar da Estatística. As primeiras contagens de pessoas (recenseamentos), avaliações de bens e riquezas, efetuadas a mando dos reis da antiguidade, já constituíam trabalhos estatísticos. Durante milhares de anos foram estas as únicas técnicas de contagem conhecidas. Porém os conhecimentos primários foram se acumulando, até que no século XVII, os grandes matemáticos Pascal e Fermat desenvolveram as bases da Análise Combinatória e da Teoria das Probabilidades. No século seguinte estes conceitos foram mais detalhados por J. Bernoulli e por Laplace.
 O século XIX viu o nascimento de Estatística Moderna, através dos trabalhos de Gauss, que retomando o estudo de uma função matemática descoberta por De Moivre em 1753, e deduzida também independentemente por Laplace em 1774; percebeu a sua grande importância para a Estatística; pelo que a curva correspondente definida passou a ser designada pelo seu nome: Curva de Gauss.
 A importância dos trabalhos de Bernoulli, Laplace e Gauss, consistiu no seguinte aspecto: até então a obtenção de conclusões válidas a respeito de uma certa característica de uma população (altura média dos habitantes de uma cidade, por exemplo), implicava na obtenção das medidas desta característica considerada, de todos os indivíduos componentes da população. Posteriormente a estes trabalhos, tornou-se possível efetuar o estudo da característica através da técnica de amostragem, em que as medidas passaram a ser efetuadas apenas sobre uma parcela da população total (amostra).
 Assim mesmo, verificou-se logo que os métodos de avaliação baseados na curva de Gauss só apresentavam resultados corretos quando a amostra era grande (mais de 200 elementos, por exemplo, sendo perceptível as falhas nas conclusões extraídas a partir de menos de 30 dados coletados), sendo que nem sequer essa condição era suficiente para garantir sempre a validade dos resultados. Mesmo essa última condição (amostra de tamanho maior) não era suficiente para garantir que todos os fenômenos seguiam a lei expressa pela Curva de Gauss, sendo que a maioria dos fenômenos aparentemente regidos pela curva de Gauss, só a seguiam de forma aproximada; indicando a necessidade de se introduzir outras funções matemáticas para servir de base ao estudo, nos casos em que a Lei de Gauss não se aplicava ou quando o afastamento dela era grande.
 Quanto à insuficiência de dados para a aplicabilidade da Curva de Gauss; o problema foi resolvido por “Student” (pseudônimo de W. S. Gosset), que introduziu em 1908 a chamada “Distribuição t” e por meio da qual podem ser tiradas conclusões seguras a partir de amostras pequenas.
 Paralelamente, K. Pearson apresentou em 1900, uma outra função, “
”, através da qual se tornava possível avaliar a discrepância entre observações e hipóteses (desvios).
 Nessa altura, a atenção dos estatísticos se deslocou para os métodos de coleta de dados, datando de 1922 o trabalho fundamental de R. A. Fisher concernente ao “Delineamento Experimental”, trabalho esse seguido por muitos outros trabalhos, tanto do próprio Fisher, como de seus colaboradores (F. Yates) e de pesquisadores independentes. Na atualidade, esse delineamento é um dos mais importantes capítulos da Estatística Aplicada e existem muitos planos experimentais extensamente estudados.
 Pouco antes da 2a Guerra Mundial o problema do Controle Estatístico da Qualidade foi abordado sistematicamente por Shewhart e na mesma época surgiram os primeiros Planos de Inspeção por Amostragem, assunto este que foi amplamente desenvolvido de lá para cá, dando origem também à Teoria da Amostragem.
 O ramo mais moderno da Estatística é a “Teoria da Decisão em Condições de Incerteza”, de maior aplicação nas áreas de Economia, Administração e Finanças.
 Verifica-se que a Estatística passou a lançar mão de Métodos Matemáticos para solucionar problemas específicos, sendo que deste ponto de vista ela pode ser classificada como um ramo definido da Matemática Aplicada, especialmente apoiado na Teoria das Probabilidades. Assim o seu estudo pode seguir dois caminhos fundamentalmente distintos:
pelo método dedutivo, partindo-se de modelos matemáticos pertinentes; ou
pelo método intuitivo ou empírico, tomando como ponto de partida a observação e aos poucos introduzindo o aparato matemático, na medida da necessidade aparente.
 O primeiro caminho apresenta a vantagem de uma exposição rigorosa, aliada à grande concisão e elegância inerentes ao desenvolvimento da Estatística Matemática em geral, sendo assim mais apropriado para cursos em Escolas de caráter mais teórico como a linha da Filosofia; o segundo é de apreensão mais imediata e de aprendizado mais fácil, sendo assim mais apropriado para Escolas com o objetivo da aplicação imediata como as Escolas de Engenharia. Nesse segundo tipo o objetivo é disponibilizar as técnicas estatísticas de maior uso dentro de suas especialidades, bem como capacitar a ampliar seus conhecimentos por auto-instrução, possibilitando a discussão de problemas de caráter mais elevado em momentos de estudos e discussão em grupos.
 O caminho utilizado aqui será o segundo, que possibilitará uma maior velocidade de aprendizado, bem como viabilizará linhas futuras específicas de estudos. 
Conceito de Estatística
 A Estatística se ocupa da coleta, organização, descrição, análise e interpretação de dados experimentais e pode ser dividida em duas grandes partes:
Coleta, Organização e Descrição dos Dados (Tabelas e Gráficos)
Análise e Interpretação dos Dados (Inferência) 
Tipos de Estatísticas
Estatística Descritiva: se ocupa da coleta, organização e descrição dos dados.
Estatística Indutiva: se ocupa da análise e interpretação dos dados.
População e Amostra
- População ou Universo: No sentido geral é um conjunto de elementos com pelo menos uma característica comum, a qual deve delimitar de forma inequívoca quais os elementos que fazem parte da população e quais os que não fazem. Às vezes não é fácil definir a população, porém, deve-se procurar caracterizá-la da melhor maneira possível, antes de se efetuar o levantamento de dados.
 
- Amostra: É uma parte da população, que às vezes é utilizada para minimizar o trabalho de manipulação dos dados da população como um todo. É um subconjunto da população, necessariamente finito. Entre as causas para a utilização de amostras, destacam-se: custo, tempo de resposta, acesso á população, etc.
Observações:
A Estatística Indutiva tem por objetivo obter conclusões sobre POPULAÇÕES, com base em resultados observados em AMOSTRAS extraídas dessas populações.
O processo indutivo é um processo de raciocínio em que, partindo-se do conhecimento de uma parte do todo, procura-se tirar conclusões sobre a realidade do todo. Logo, não é um processo exato e pode estar sujeito a erros; o que leva a definir a Estatística não como umaciência, propriamente dita.
A Estatística Indutiva, entretanto, irá dizer até que ponto pode estar ocorrendo o erro nas induções, e com que grau de possibilidade (probabilidade). Esse fato é fundamental para que uma indução (ou inferência) possa ser considerada estatística, e isto é parte integrante dos objetivos da Estatística Indutiva. O cálculo de probabilidade é fundamental ao estudo da Estatística Indutiva.
Quanto maior for a amostra, mais precisas e mais confiáveis deverão ser as induções realizadas sobre a População. Exagerando, concluí-se que os resultados mais perfeitos são aqueles obtidos pelo exame completo de toda a População, ao qual se costuma denominar CENSO ou RECENSEAMENTO.
Na prática, às vezes, o emprego de amostras pode ser feito de modo tal que se obtenha resultados confiáveis, em termos práticos equivalentes, ou até mesmo melhores do que os que seriam obtidos através de um censo.
A Estatística Descritiva vai organizar os dados das amostras: surge então a necessidade de certos cuidados básicos no processo de obtenção dessas amostras, o que é estudado na teoria da “AMOSTRAGEM”.
Para se desenvolver um estudo completo de Estatística, todos os aspectos abaixo indicados, devem abordados em maior ou menor grau, dentro da seqüência indicada:
 
 
 Figura 1: Aspectos do estudo da Estatística
Tipos de Variáveis
Dependendo da característica de interesse tem-se:
Variável Qualitativa: quando resultar de uma classificação por tipos ou atributos. Esse
tipo se subdivide em:
A1) Nominal: quando não existe qualquer ordenação das possíveis realizações.
 Exemplos: - Estado civil - Cor dos olhos - Sexo da pessoa
 A2) Ordinal: quando existe a possibilidade de ordenação nas realizações.
 Exemplos: - Grau de instrução - Posto militar
Variável Quantitativa: quando resultar de uma classificação por números (numérica).
Esse tipo se subdivide em:
 B1) Discreta: quando pode assumir apenas valores pertencentes a um conjunto
 enumerável; isto é, são pontuais (contagem).
 Exemplos: - Número de filhos - Pontos no lançamento de um dado.
 B2) Contínua: quando pode assumir qualquer valor dentro de um certo intervalo
 Exemplos: - Idade - Peso líquido - Diâmetro externo
Fases do Método Estatístico
Coleta de Dados
Coleta de dados primários: os valores são obtidos na fonte originária.
Coleta de dados secundários: os valores são obtidos de levantamentos anteriores
Apuração dos Dados
 Após a coleta dos dados, torna-se necessária sua apuração ou contagem, denominada também de tabulação. Para tanto costuma-se ordená-los mediante critérios de classificação.
Apresentação dos Dados
 Depois de estarem apurados, os dados podem ser apresentados em forma de:
 - Tabelas ou Quadros - Gráficos
Análise, Interpretação e Conclusão sobre os Dados
 Esta é a fase mais importante do processo estatístico, que depende diretamente das fases anteriores. A conclusão do levantamento estatístico deve ser coerente, pois em caso contrário, todo o trabalho anterior perderá valor.
Distribuições de Freqüências
Dados Brutos
 Quando os dados oriundos dos levantamentos, são apresentados em sua forma de obtenção (aleatoriamente dispostos), eles são chamados Dados Brutos.
Exemplo: Dados das estaturas de 76 alunos de uma determinada classe (em metros):
1,72 1,80 1,74 1,82 1,76 1,67 1,60 1,62 1,62 1,64 1,67 1,74 1,69 1,55 1,55 
1,56 1,63 1,69 1,55 1,80 1,76 1,71 1,79 1,67 1,73 1,80 1,91 1,92 1,72 1,63
1,68 1,65 1,83 1,89 1,78 1,64 1,72 1,64 1,54 1,65 1,70 1,68 1,69 1,80 1,74
1,75 1,72 1,76 1,72 1,74 1,73 1,65 1,65 1,63 1,81 1,56 1,80 1,68 1,50 1,66
1,78 1,78 1,68 1,81 1,84 1,66 1,77 1,67 1,66 1,73 1,60 1,80 1,86 1,85 1,69
1,79 
Rol
 Chama-se Rol, à apresentação dos dados brutos de forma ORDENADA; crescente da esquerda para a direita e de cima para baixo.
Exemplo: Rol das estaturas dos 76 alunos do exemplo anterior
 1,50 1,54 1,55 1,55 1,55 1,56 1,56 1,60 1,60 1,62 1,62
 1,63 1,63 1,63 1,64 1,64 1,64 1,65 1,65 1,65 1,65 1,66
 1,66 1,66 1,67 1,67 1,67 1,67 1,68 1,68 1,68 1,68 1,69
 1,69 1,69 1,69 1,70 1,71 1,72 1,72 1,72 1,72 1,72 1,73
 1,73 1,73 1,74 1,74 1,74 1,74 1,75 1,76 1,76 1,76 1,77
 1,78 1,78 1,78 1,79 1,79 1,80 1,80 1,80 1,80 1,80 1,80
 1,81 1,81 1,82 1,83 1,84 1,85 1,86 1,89 1,91 1,92
1.6.3 Distribuição de Freqüências
 As distribuições de freqüências indicam como estão distribuídas as freqüências ocorridas pelas observações. Podem ser dadas através de duas formas:
Dados não agrupados ou não tabulados em classes
Dados agrupados ou tabulados em classes.
Exemplo: Considerando o exemplo dos 76 alunos....
Tabela 1: Dados não Agrupados em classes
	Estaturas (m)
	Tabulação
	Freqüência
	1,50
	/
	1
	1,54
	/
	1
	1,55
	///
	3
	1,56
	//
	2
	1,60
	//
	2
	1,62
	//
	2
	1,63
	///
	3
	1,64
	///
	3
	1,65
	////
	4
	1,66
	///
	3
	1,67
	////
	4
	1,68
	////
	4
	1,69
	////
	4
	1,70
	/
	1
	1,71
	/
	1
	1,72
	/////
	5
	1,73
	///
	3
	1,74
	////
	4
	1,75
	/
	1
	1,76
	///
	3
	1,77
	/
	1
	1,78
	///
	3
	1,79
	//
	2
	1,80
	//////
	6
	1,81
	//
	2
	1,82
	/
	1
	1,83
	/
	1
	1,84
	/
	1
	1,85
	/
	1
	1,86
	/
	1
	1,89
	/
	1
	1,91
	/
	1
	1,92
	/
	1
	Total
	
	76
Tabela 2: Dados agrupados em classes
	Estaturas (m)
	Tabulação
	Freqüência
	1,50 1,56
	/////
	5
	1,56 1,62
	////
	4
	1,62 1,68
	///////////////////
	19
	1,68 1,74
	//////////////////
	18
	1,74 1,80
	//////////////
	14
	1,80 1,86
	////////////
	12
	1,86 1,92 
	///
	3
	1,92 1,98
	/
	1
	Total
	-
	76
 As freqüências indicadas correspondem às quantidades de ocorrências observadas e são comumente chamadas de “Freqüências Absolutas”, sendo indicada por fi ou ni e, geralmente, chamada apenas de freqüência.
 A totalidade das observações é chamada “Freqüência Total”, sendo indicada por ft ou N.
 Logo: N = ft = ( fi = ( ni ou 
 
 Representando graficamente a distribuição de freqüência, considerando os dados agrupados do exemplo anterior, tem-se:
 fi 
 
 
 
 1,50 1,56 1,62 1,68 1,74 1,80 1,86 1,92 1,98 Estaturas (m)
 Esta representação gráfica é também chamada de “HISTOGRAMA”.
 A “Freqüência Relativa” – fRi – é a relação (quociente) entre a freqüência absoluta e a freqüência total.
 Logo: fRi = 
 = 
, e 
 As propriedades da freqüência relativa são:
1) 
2) 
 se o evento A ocorrer em todas as n repetições
3) 
 se o evento A nunca ocorrer nas n repetições
4) Se A e B forem eventos mutuamente exclusivos, então: 
5) Estabilidade das freqüências ou Lei da Regularidade Estatística: ao se repetir um experimento, um número bastante grande de vezes, a freqüência relativa de um determinado evento vai se aproximando de sua característica natural. Por exemplo, ao se lançar uma moeda honesta, buscando a verificação de freqüência relativa de “CARA”, observa-se que quanto maior o número de lançamentos, a freqüência relativa de “CARA” tende a ficar em torno do valor 0,50.
 Freqüência Percentual (%): é o produto da freqüência relativa por 100%.
 
Intervalos e Limites de Classes
 Cada classe da distribuição será definida pelos limites(inferior e superior) e pelo seu intervalo.
Limite inferior da Classe: li
Limite superior da Classe: Li
Limites não Definidos 
 São aqueles levantamentos nos quais geralmente não são definidos os intervalos de classe (primeiro intervalo e último intervalo) da distribuição.
Exemplo: Distribuição de domicílios da grande São Paulo, segundo a classe de renda (1974)
	Renda Domiciliar ($1,00)
	Número de Domicílios
	 Até 800
	622.720
	 801 a 1.600
	733.920
	1.601 a 2.300
	356.265
	2.301 a 3.500
	256.455
	3.501 a 5.900
	109.115
	Mais que 5.901
	83.400
	Total
	2.171.875
 As classes, primeira e última, são de limites não definidos.
Limites Reais ou Verdadeiros da Classe
 São obtidos através da média aritmética simples entre o limite superior de uma classe e o limite inferior da classe seguinte
Exemplo: No exemplo anterior:
Limite Superior Real da 1ª classe: 
 
Limite Superior Real da 2ª classe: 
Amplitudes das Classes (h)
 O intervalo de uma classe corresponde ao comprimento desta classe. Numericamente pode ser definido como:
A diferença existente entre o limite inferior de uma classe, e o limite inferior da classe seguinte; ou
A diferença existente entre o limite superior de uma classe, e o limite superior da classe anterior; ou
A diferença entre o limite superior e o limite inferior da classe.
OBS: a) Amplitude Total ou Oscilação ou Range de uma Distribuição – (AT ou R)
 É a diferença entre os valores extremos do Rol.
 AT = R = Xmáx. – Xmín.
 b) Pontos Médios ou Centrais das Classes – (Ci ou PMi)
 Numericamente pode ser definido como:
 
A média aritmética simples, entre o limite superior e o limite inferior de uma mesma classe:
 Ci = PMi = 
, ou
A soma do limite inferior de uma classe, com a metade da amplitude dessa classe:
 Ci = PMi = li + 
, ou 
A diferença entre o limite superior da classe e a metade da amplitude dessa classe:
 Ci = PMi = Li - 
.
Exemplo: Considerando o exemplo da distribuição das estaturas dos 76 alunos, calcular para as classes:
Amplitude
Ponto Médio
Freqüência Absoluta
Freqüência Relativa
Solução:
	Classes
	Amplitudes
H
	Ponto Médio
	Freqüências
	
	
	
	
	Absoluta
fi 
	Relativa
fRi
	1,50 1,56
	0,06
	1,53
	1,53
	5
	0,07
	1,56 1,62
	0,06
	1,59
	1,59
	4
	0,05
	1,62 1,68
	0,06
	1,65
	1,65
	19
	0,25
	1,68 1,74
	0,06
	1,71
	1,71
	18
	0,24
	1,74 1,80
	0,06
	1,77
	1,77
	14
	0,18
	1,80 1,86
	0,06
	1,83
	1,83
	12
	0,16
	1,86 1,92 
	0,06
	1,89
	1,89
	3
	0,04
	1,92 1,98
	0,06
	1,95
	1,95
	1
	0,01
 
Regras Gerais para elaborar uma distribuição de freqüências
1ª) Monta-se o Rol dos dados existentes (dados brutos);
2ª) Calcula-se o range ou amplitude total da distribuição;
3ª) Calcula-se o número de classes da distribuição – k -, que será aproximadamente igual a:
 k = 
, onde: k = número de classes 
 N = número total de observações
 Este número de classes deverá sempre estar entre 5 e 20.
 Outro caminho de cálculo do número de classes é através da Regra de Sturges:
 k = 1 + 3,3 log N 
Esta regra também é apresentada na forma gráfica.
4ª) Determinam-se os intervalos das classes que serão dados por:
 h = 
5ª) Determina-se o número de observações que cai em cada classe, achando-se as freqüências de cada classe. Estes dados (freqüências absolutas) são colocados em tabelas de distribuição de freqüência, onde são também indicados os valores de freqüências relativas ou porcentagens.
Exemplo: Considerando o exemplo das estaturas dos 76 alunos...
O rol já foi montado no item 1.6.2
Amplitude total
At = Xmáx. – Xmin. = 1,92 – 1,50 = 0,42
Número de classes
K 
 = 8,71 
9
Amplitude da classe
h = 
= 
= 0,0467 
0,05
As observações de cada classe estão indicadas na tabela 3.
Tabela 3
	Classes
	Amplitudes
H
	Centro da Classe
	Freqüências
	Porcentagem
fr x 100%
	
	
	
	Absoluta - fa
	Relativa - fr
	
	1,50 1,55
	0,05
	1,525
	2
	0,03
	3
	1,55 1,60
	0,05
	1,575
	5
	0,07
	7
	1,60 1,65
	0,05
	1,625
	10
	0,13
	13
	1,65 1,70
	0,05
	1,675
	19
	0,25
	25
	1,70 1,75
	0,05
	1,725
	14
	0,18
	18
	1,75 1,80
	0,05
	1,775
	10
	0,13
	13
	1,80 1,85 
	0,05
	1,825
	11
	0,14
	14
	1,85 1,90
	0,05
	1,875
	3
	0,04
	4
	1,90 1,95
	0,05
	1,925
	2
	0,03
	3
	Total
	-
	-
	76
	1,00
	100
Representação Gráfica de uma Distribuição de Freqüências
 A distribuição de freqüências pode ser representada graficamente de duas maneiras:
A) Histograma ou Histograma de Freqüências (Absoluta, Relativa ou Porcentagem)
Consiste em um grupo de retângulos que têm:
- as bases sobre um eixo horizontal, com centro no ponto médio e as larguras iguais às amplitudes dos intervalos das classes:
- as alturas proporcionais às freqüências das classes (quando as classes têm intervalos de igual amplitude, as áreas dos retângulos serão, também, proporcionais às freqüências das classes) 
Exemplo: Considerando o exemplo das estaturas dos 76 alunos...
 fi 
 
 
 
 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m)
 fr % 
 
 
 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m)
B) Polígono de Freqüências
 É um gráfico de linhas em que as freqüências são locadas considerando os pontos médios superiores das classes; ligando-se esses pontos entre si.
 fi 
 
 
 
 
 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m)
1.6.9 Representação Gráfica de uma Distribuição de Freqüências Acumuladas – Ogivas
 A freqüência total de todos os valores inferiores ou superiores ao limite inferior ou superior de um dado intervalo de classes é denominada Freqüência Acumulada até ou após, incluindo o intervalo. 
 A tabela que apresenta essas freqüências acumuladas denomina-se Distribuição de Freqüências Acumuladas, ou Distribuição Acumulada. 
 Este tipo de distribuição pode ser elaborada em termos de freqüência absoluta, de freqüência relativa ou de porcentagem. As freqüências acumuladas são indicadas por F (maiúsculo).
 A representação gráfica da distribuição de freqüências acumuladas é denominada Polígono de Freqüências Acumuladas ou Ogivas de Galton. 
Exemplo: Considerando os dados da tabela 3, estão apresentadas abaixo, as distribuições de freqüências acumuladas de freqüências absolutas, de freqüências relativas e de porcentagens, na tabela 4.
Tabela 4
	Classes
	fi
	Fi
ACUMULADA
	fr
	Fr
ACUMULADA
	%
	%
ACUMULADA
	1,50 1,55
	2
	2
	0,03
	0,03
	3
	3
	1,55 1,60
	5
	7
	0,07
	0,10
	7
	10
	1,60 1,65
	10
	17
	0,13
	0,23
	13
	23
	1,65 1,70
	19
	36
	0,25
	0,48
	25
	48
	1,70 1,75
	14
	50
	0,18
	0,66
	18
	66
	1,75 1,80
	10
	60
	0,13
	0,79
	13
	79
	1,80 1,85 
	11
	71
	0,14
	0,93
	14
	93
	1,85 1,90
	3
	74
	0,04
	0,97
	4
	97
	1,90 1,95
	2
	76
	0,03
	1,00
	3
	100
	Total
	76
	-
	1,00
	-
	100
	-
 
 A distribuição de freqüências acumulada gráfica, será:
 fi
 
 
 
 
 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 (m)
 As ogivas poderão ser construídas considerando freqüênciasabsolutas, relativas ou percentuais; podendo ser crescentes (abaixo de) ou decrescente (acima de).
 fi
 Ogiva de Galton Ogiva de Galton
 Decrescente Crescente
76	
71
 
 
 
 
23
9
5
 1,50 1,56 1,62 1,68 1,74 1,80 1,86 1,92 1,90 Estaturas (m)
OBS: DISTRIBUIÇÃO COM INTERVALOS DE CLASSES DESIGUAIS
 Nos casos em que a distribuição apresente classes com intervalos desiguais, a análise comparativa não pode ser efetuada diretamente; deve-se fazer ajustes para possibilitar a comparação.
 A comparação deverá ser feita através da densidade de freqüência, a qual vai indicar a concentração de freqüência, por unidade da variável.
 Logo: Densidade de Freqüência = 
, onde:
 
 = freqüência absoluta da classe;
 
 = Amplitude da classe
 A densidade pode ser calculada em termos absolutos, relativos ou porcentagens.
Exemplo: Considerando a distribuição de 250 empresas, segundo o número de empregados.
	Número de Empregados
	Amplitude da Classe 
	Freqüência Absoluta
	Densidade de Freqüência Absoluta 
	Porcentagem
(%)
	Densidade de Porcentagem
	 00 10
	10
	5
	0,50
	2
	0,20
	 10 20
	10
	20
	2,00
	8
	0,80
	 20 30
	10
	35
	3,50
	14
	1,40
	 30 40
	10
	40
	4,00
	16
	1,60
	 40 60
	20
	50
	2,50
	20
	1,00
	 60 80
	20
	30
	1,50
	12
	0,60
	 80 100
	20
	20
	1,00
	8
	0,40
	100 140
	40
	20
	0,50
	8
	0,20
	140 180
	40
	15
	0,38
	6
	0,15
	180 260
	80
	15
	0,19
	6
	0,08
	TOTAL
	-
	250
	-
	100
	-
 O histograma da distribuição será:
 
 (%)
 
1,6
 
1,4
1,0
0,8
0,6
0,4
0,2
0,15
0,08
 10 20 30 40 60 80 100 140 180 260
 Nº de empregados
Histograma Alisado
 Quando os intervalos das classes diminuem de tamanho, o histograma obtido vai ficando cada vez mais irregular, chegando a atingir um ponto limite como uma curva bem suave. Este tipo de histograma é chamado, então, de histograma alisado e é útil para ilustrar rapidamente qual o tipo geral de comportamento da distribuição de uma variável. A interpretação deste tipo de gráfico é a mesma do histograma; isto é, nas regiões onde a curva é mais elevada, significa uma maior densidade de observações.
Exemplo: Considere os dados:
	Classes
	Centros
	Freqüências Absolutas - fi
	5 6
	5,5
	1
	6 7
	6,5
	3
	7 8
	7,5
	11
	8 9
	8,5
	12
	 9 10
	9,5
	18
	10 11
	10,5
	22
	11 12
	11,5
	18
	12 13
	12,5
	13
	13 14
	13,5
	11
	14 15
	14,5
	7
	15 16
	15,5
	4
	 16 17 
	16,5
	0
	Total
	-
	120
 O histograma dos dados seria:
 fi �
 5 6 7 8 9 10 11 12 13 14 15 16 x 
 O histograma alisado também é denominado de Histograma Polido, pois cada classe passaria a ser representada por um único ponto, conforme estrutura algébrica abaixo:
 
onde: fp = freqüência polida
 fc = freqüência da classe
 fa = freqüência da classe anterior
 fs = freqüência da classe seguinte
 A representação gráfica ficaria:
� 
Função de Distribuição Acumulada
 Dadas N observações de uma variável quantitativa, e um número x real qualquer, indicar-se-á por N(x), a função que apresenta o número de observações menores ou iguais a x, e que é denominada de função de distribuição acumulada (f. d. a.), e é indicada por:
 
 
Exemplo: Considerando a distribuição de freqüências do número de filhos de 20 pessoas:
	Número de filhos
	Freqüência - fi
	Procentagem (%)
	0
	4
	20
	1
	5
	25
	2
	7
	35
	3
	3
	15
	5
	1
	5
	Total
	20
	100
 
A função de distribuição acumulada será dada por:
	
 
 =
	0,00 se x < 0
	
	0,20 se 0 ≤ x < 1
	
	0,45 se 1 ≤ x < 2
	
	0,80 se 2 ≤ x < 3
	
	0,95 se 3 ≤ x < 5
	
	1,00 se x ≥ 5
Ramo e Folhas
 É um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se obter uma idéia da forma de sua distribuição. É conhecido também como Diagrama de TUKEY (1977) e possui a vantagem de apresentar os dados reais levantados; e possui a desvantagem de em alguns casos assumir grandes dimensões.
 A técnica de montagem consiste em dividir a observação em duas partes:
 - a primeira (RAMO): é colocada à esquerda de uma linha vertical
 - a segunda (FOLHA): é colocada à direita desta linha vertical.
Exemplo: Considerando o exemplo da distribuição das estaturas dos 76 alunos
RAMO E FOLHAS
1,5 0 4 5 5 5 6 6
1,6 0 0 2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9
1,7 0 1 2 2 2 2 2 3 3 4 4 4 4 5 6 6 6 7 8 8 8 9 9
1,8 0 0 0 0 0 0 1 1 2 3 4 5 6 9
1,9 1 2 
 Exemplo: Considerando a distribuição de salários de 36 funcionários de uma empresa (em termos de salários mínimos)
ROL 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59
 
 7,64 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 
 
 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85
 
 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 
RAMO E FOLHAS
 4 00 56
 5 25 73
 6 26 66 86
 7 39 59 64
 8 12 46 74 95
 9 13 35 77 80
10 53 76
11 06 59
12 00 79
13 23 60 85
14 69 71
15 99 
16 22 61
17 26
18 75
19 40
20
21
22
23 30
Observação: Para minimizar o número de linhas de um ramo e folhas, costuma-se subdividi-lo em valores múltiplos de 10 (em dezenas) ou mais.
Exemplo: Considerando a distribuição das produções de 20 Companhias Químicas, em toneladas: ROL: 50 90 120 170 180 180 200 240 250 280
 360 480 500 560 870 1000 1050 1100 4200 5100
RAMO E FOLHAS – 1ª FORMA
 0
6
7 
 8
 0
1 20 70 80 80
2 00 40 50 80
3 60
4 80
5 00 60
6
7
 70
1 000 050 100
2
3
4 200
5 100
RAMO E FOLHAS – 2ª FORMA
0 50 90
1 20 70 80 80
2 00 40 50 80
3 60
4 80
5 00 60
6
7
8 70
9
1 000 050 100
2
3
4 200
5 100
OBSERVAÇÕES
1ª) Existem outros tipos de representações gráficas de distribuições que são menos utilizadas, como por exemplo:
GRÁFICO DE LINHAS (lineares)
Exemplo: Produção de Pneumáticos no Brasil – 1971/1976
	Períodos
	Pneumáticos (1.000 peças)
	1971
	9.393
	1972
	10.710
	1973
	13.466
	1974
	16.238
	1975
	16.704
	1976
	19.149
Fonte: Conjuntura Econômica, julho/77Pneumáticos
(1.000 peças)
19.500
18.000
16.500
15.000
13.500
12.000
10.500
 9.000
 Anos
 71 72 73 74 75 76
DIAGRAMA DE BASTÃO
Exemplo: Número de crianças do sexo masculino, em 5 famílias com 4 crianças cada. .
Nº de Filhos
 4
 3
 2
 1
 A B C D E Anos
DIAGRAMA DE BARRAS
Exemplo: Fundo de garantia por tempo de serviço (Arrecadação líquida)
	Períodos
	 Milhões $
	1975
	7.963
	1976
	11.014
	1977
	16.900
	1978
	27.148
	1979
	40.718
	1980
	68.372
 Fonte: Conjuntura Econômica – Fev/83
 
 Anos 
 
 
 80
 
 79
 
 78 
 
 77
 
 
 76
 75
 
 6 12 18 24 30 36 42 48 54 60 66 72 $ milhões
SETOGRAMA
Exemplo: Consumo industrial de energia elétrica (milhões de kwh – 1976/Brasil)
	Empresas
	Milhões de kwh
	% de consumo
	Ângulo correspondente 
(graus)
	RIO – LIGHT
	3.226
	12,4
	44,6
	SP – LIGHT
	13.617
	52,3
	188,3
	CEMIG
	6.763
	26,0
	93,6
	CHESP
	1.183
	4,5
	16,2
	CESP
	1.258
	4,8
	17,3
	TOTAL
	26.047
	100
	360,0
Fonte: Conjuntura Econômica – julho/77
 
 
�
GRÁFICO POLAR
 É utilizado para mostrar as variações sazonais durante doze meses do ano, ou para outras séries de tempo. Desenvolve-se a partir do ponto central (origem) até a sua borda ou além ela.
Exemplo: Produção brasileira de Celulose, em 1.000 toneladas
	Período
	Produção (1.000 t)
	1969
	567,3
	1970
	664,0
	1971
	721,5
	1972
	898,3
	1973
	971,7
	1974
	1.129,5
	1975
	1.189,6
	1976
	1.253,8
	1977
	1.502,3
	TOTAL
	8.898,0
Fonte: Associação Paulista dos Fabricantes de Papel e Celulose
 
 1971
 1969
 
 1972
 1977
 
 1973
 1976
 1974
 1975
2ª) Tipos de Curvas de Freqüência
Curvas de Freqüências Simétricas ou em forma de sino
Caracterizam-se pelo fato das observações eqüidistantes do ponto central máximo, apresentarem as mesmas freqüências.
 
 
 
 
Curvas de Freqüências Moderadamente Assimétricas ou Desviadas
Caracterizam-se pelo fato da cauda de um lado da ordenada máxima ser mais longa do que a do outro lado. 
Se o ramo mais alongado fica à direita, a curva é chamada de DESVIADA PARA A DIREITA, ou de ASSIMETRIA POSITIVA.
Se o ramo mais alongado fica à esquerda, a curva é chamada de DESVIADA PARA A ESQUERDA, ou de ASSIMETRIA NEGATIVA.
Curvas em forma de “J” ou de “J” INVERTIDO
Caracterizam-se pelo fato do ponto de ordenada máxima ocorrer em uma das extremidades.
 
Curvas em forma de “U”
Caracterizam-se pelo fato de apresentar ordenadas máximas em ambas as extremidades.
 e) Curvas de duas ordenadas máximas
 f) Curvas com várias ordenadas máximas
ESTATÍSTICA
INDUTIVA
AMOSTRAGEM
ESTATÍSTICA
DESCRITIVA
CÁLCULO
DE 
PROBABILIDADE
 CESP 
 4,8% RIO 
 LIGHT 
 12,4% 
 
 
SP LIGHT CHESP 4,5% 
 52,3% 
 CEMIG
 26,0%
 
 
 
 26%
 
 
 
 
 
 
 
 
 
 
 
 
 
 26%
fp
_1246277966.unknown
_1280923965.unknown
_1280924088.unknown
_1327238440.unknown
_1327238803.unknown
_1330951420.unknown
_1376483401.unknown
_1327304106.unknown
_1327305031.unknown
_1327300981.unknown
_1327238661.unknown
_1327238403.unknown
_1280924123.unknown
_1327238344.unknown
_1280924010.unknown
_1246279645.unknown
_1246280332.unknown
_1280923245.unknown
_1246279736.unknown
_1246278953.unknown
_1246279204.unknown
_1246278047.unknown
_1059400061.unknown
_1246274691.unknown
_1246274768.unknown
_1059400124.unknown
_1059400302.unknown
_1058880784.unknown
_1059399999.unknown
_1058880782.unknown
_1058880781.unknown

Continue navegando