Buscar

Estat- ¦ística1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística – Gestão da Indústria Petroquímica
Aula 1:
Visão geral da Estatística.
Estatística é a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população.
Quando falamos em pesquisa, estamos interessados em conhecer melhor determinados assuntos. Por exemplo, quando respondemos perguntas de um questionário de uma revista, a editora deseja conhecer alguns aspectos dos eleitores desta revista. Quando a pesquisa termina o coordenador da pesquisa se vê com uma quantidade enorme de dados (respostas) resultantes dos questionários. Para analisar esse conjunto de dados ele deve organizá-los racionalmente e apresentá-los de alguma forma clara e concisa, para facilitar a análise e poder tirar conclusões a respeito da pesquisa.
Os dados referentes à idade dos leitores foram:
Os dados referentes à avaliação geral foram:
Para o coordenador da pesquisa, qualquer interpretação dobre esses dados obtidos seria impossível de ser feita, pois os dados estão totalmente desorganizados. Para organizar e apresentar os dados de forma clara e concisa, o coordenador poderia utilizar um dos seguintes métodos:
Tabela 1.0 – Tabela de Freqüência para a Idade dos Leitores da Revista
Tabela 1.1 – Tabela de Freqüência para Avaliação Geral da Revista
Definição: O termo Estatística tem dois significados básicos:
 Diz respeito a um conjunto de dados obtidos a partir de levantamentos específicos. Como exemplo podemos usar a seguinte frase: As estatísticas sobre a Indústria Petroquímica registrou um aumento de 3,5% na sua participação no PIB nacional.
O segundo significado refere-se à Estatística como método de análise e podemos defini-la como “uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrairmos conclusões”.
Grandes Áreas da Estatística
A Estatística pode ser dividida, basicamente, em duas partes que se inter-relacionam: Estatística Descritiva e s Estatística Indutiva.
A Estatística Descritiva: é a parte da Estatística que trabalha com organização e apresentação dos dados.
A Estatística Indutiva: é a parte da Estatística que trabalha com análise e interpretação dos dados.
Conceitos Iniciais
População: é o conjunto de todos os elementos (indivíduos ou objetos) que tem pelo menos uma característica em comum, e que está sob investigação ou estudo.
Amostra: é qualquer subconjunto de uma população.
As informações obtidas sobre toda a população são chamadas de dados populacionais e sobre uma amostra são chamados de dados amostrais.
�
Amostragem
A análise estatística geralmente realizada através de amostras, uma vez que a maioria das populações é constituída por um número muito grande de elementos, resultando, conseqüentemente, em quantidade muito grande de dados. O processo de obter as amostras é denominado amostragem.
A fase da coleta de dados é importante nesse processo, pois se a amostra não contiver informações adequadas, todo o tratamento estatístico realizado posteriormente não trará informações conclusivas sobre a população sob investigação ou estudo. Além disso, podem-se tomar decisões erradas quando a amostra não é adequada.
O método mais simples de obter uma amostra é através da amostragem casual simples, também conhecida por amostragem aleatória. Neste tipo de amostragem, todos os elementos da população têm a mesma chance de serem escolhidos.
Existem vários outros métodos de amostragem, como amostragem sistemática, amostragem estratificada e amostragem por conglomerados.
Variável
Característica dos elementos de uma população ou de uma amostra, que pode assumir diferentes valores, sejam numéricos ou não numéricos, e que interessa ao estudo.
As variáveis podem ser classificadas em variáveis qualitativas e quantitativas
Variável Qualitativa:
Tipo de variável que não pode ser medida numericamente. Exemplo: Atividade Industrial, marca de equipamentos... Os dados correspondentes a uma variável qualitativa são denominados dados qualitativos.
Variável Quantitativa:
Tipo de variável que pode ser medida numericamente. Exemplo: peso, volume de vendas, tempo de atendimento... Os dados correspondentes a uma variável quantitativa são denominados dados quantitativos.
As variáveis qualitativas podem ser classificadas em ordinais e nominais.
Uma variável qualitativa é dita ordinal quando os elementos desta variável têm relação de ordem entre elas.
Ex: Conceito: ótimo, bom, regular e péssimo
Uma variável qualitativa é dita nominal quando os elementos desta variável não têm relação de ordem entre elas.
Ex: Marca de Carros: Fiat, GM...
As variáveis quantitativas, por sua vez, podem ser classificadas em variáveis discretas e variáveis contínuas.
Variável Discreta:
Tipo de variável cujo valor muda em saltos ou passos, não admitindo valores intermediários entre cada passo salto ou passo.
Ex: Número de empregados de uma empresa
Variável contínua:
Tipo de variável que admite infinitos valores dentro de um intervalo.
Ex: Produção de anual de nafta (m3)
Ex: Idade (tempo)
FASES DO MÉTODO ESTATÍSTICO
1º - DEFINIÇÃO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema.
2º - PLANEJAMENTO: Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc.
3º - COLETA DE DADOS: Fase operacional. É o registro sistemático de dados, com um objetivo determinado.
Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE.
Dados secundários: quando são publicados pro outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.
OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.
Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca. 
A coleta direta pode ser: contínua (registros de nascimento, óbitos, casamentos, etc.), periódica (recenseamento demográfico, censo industrial) e ocasional (registro de casos de dengue).
Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação, indícios ou proporcionalização.
4º - APURAÇÃO DOS DADOS: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.
5º - APRESENTAÇÃO DOS DADOS: Há duas foram de apresentação, que não se excluem mutuamente. A apresentação tabular, ou seja é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno.
6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade.
�
Normas de apresentação tabular
Objetivo
Estas normas fixam conceitos e procedimentos aplicáveis à elaboração de tabelas de dados numéricos, de modo a garantir clareza das informações apresentadas.
Principais elementos de uma tabela
Inicialmente, apresentamos o esboço de uma tabela e a seguir serão conhecidos os elementos que a compõe.
Topo: Espaço superior de uma tabela destinado ao seu número e titulo
Título: Conjunto de termos indicadores do conteúdo de uma tabela. Toda tabela deve ter título, inscrito no topo, para indicar a naturezae as abrangências geográficas e temporal dos dados numéricos. As indicações da natureza e da abrangência geográfica dos dados numéricos devem ser feitas as abreviações, por extenso, de forma clara e concisa.
Centro: Espaço central de uma tabela destinado à moldura, aos dados numéricos e aos termos necessários à sua compreensão. No centro identificam-se quatro espaços menores: o espaço do cabeçalho, a coluna, a linha e a célula.
Espaço do cabeçalho: Espaço superior do centro de uma tabela destinado à indicação do conteúdo das colunas. Toda tabela deve ter um cabeçalho, inscrito no espaço do cabeçalho, para indicar, complementarmente ao título, o conteúdo das colunas. O conteúdo das colunas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações.
Coluna: Espaço vertical do centro de uma tabela destinado aos dados numéricos (coluna de dados numéricos) ou aos indicadores de linha (colunas indicadoras)
Linha: Espaço horizontal do centro de uma tabela destinado aos dados numéricos, toda tabela deve ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao título, o conteúdo das linhas. O conteúdo das linhas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações.
Dado numérico: Quantificação de um fato específico observado. A estruturação dos dados numéricos e dos termos necessários à compreensão de uma tabela deve ser feita com, no mínimo, três traços horizontais paralelos. O primeiro para separar o topo, o segundo para separar o espaço do cabeçalho. O terceiro para separar o rodapé.
Célula: Espaço mínimo do centro de uma tabela, resultante do cruzamento de um a linha com uma coluna, destinado ao dado numérico ou ao sinal convencional.
Sinal convencional: Representação que substitui um dado numérico A substituição de um dado numérico deve ser feita por um dos sinais abaixo, conforme o caso:
- dado numérico igual a zero não resultante de arredondamento;
.. não se aplica dado numérico;
... dado numérico não disponível;
x dado numérico omitido a fim de evitar a individualização da informação;
0; 0,0; 0,00 etc Valor igual a zero resultante de arredondamento de um dado numérico originalmente positivo;
-0; -0,0; -0,00, etc Valor igual a zero resultante de arredondamento de um dado numérico originalmente negativo.
Quando uma tabela contiver sinais convencionais, estes deverão ser apresentados em nota geral com seus respectivos significados. No caso de publicação que contenha tabela com sinais convencionais, na qual a apresentação dos sinais e de seus significados figure em destaque, é dispensável a nota geral em cada tabela.
Rodapé: Espaço inferior de uma tabela destinado à fonte, à nota geral e à nota específica.
Fonte: Identificador do responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos. Toda tabela deve ter fonte, inscrita a partir da primeira linha de seu rodapé. A identificação do responsável ou responsáveis pelos dados numéricos deve ser feita com palavras, por extenso, e precedida da palavra Fonte ou Fontes. Quando os dados são extraídos de algum documento, recomenda-se a indicação da referência bibliográfica do documento e quando a tabela contiver dados numéricos resultante de transformação dos dados numéricos obtidos na fonte, o responsável pela operação deve ser identificado em nota geral ou específica. 
Nota geral: Texto esclarecedor do conteúdo geral de uma tabela, quando necessário. Deve ser inscrito logo após rodapé da tabela e ser precedido do termo Nota ou Notas.
Nota específica: Texto esclarecedor de algum elemento específico de uma tabela, quando necessário. Deve ser inscrito no rodapé, logo após a nota geral (quando esta existir). Quando uma tabela contiver mais de uma nota específica, estas devem ser distribuídas obedecendo à ordem de numeração das chamadas, separando-se uma das outras por um ponto.
Chamadas: Símbolo remissivo atribuído a algum elemento de uma tabela que necessita uma nota específica. A remissiva atribuída a algum elemento deve ser feita em algarismos arábicos em destaque: entre parênteses, entre colchetes, exponencial. Quando uma tabela contiver mais de uma chamada, estas devem ser distribuídas sucessivamente, de cima para baixo e da esquerda para direita, em ordem crescente de numeração.
Unidade de medida: Tempo indicador da expressão quantitativa ou metrológica dos dados numéricos. Uma tabela deve ter unidade de medida, inscrita no espaço do cabeçalho ou nas colunas indicadoras, sempre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica dos dados numéricos. A unidade de medida deve ser feita com símbolos ou palavras entre parênteses.
 
Tabela de freqüência para dados qualitativos:
Uma tabela é constituída por dados organizados em linhas e colunas. Quando esta tabela é constituída por uma coluna referente aos dados de uma variável e outra referente às freqüências (número de ocorrências) associadas a cada dado, recebe o nome de tabela de freqüência.
A freqüência de um dado é o número de ocorrências ou repetições deste dado.
Os dados qualitativos obtidos em uma pesquisa podem ser organizados em formas de tabelas para facilitar a visualização e análise dos dados.
Ex: 
Tabela 1.0: Tabela de freqüência
OBS: As freqüências associadas aos dados da variável constituem a distribuição de freqüência.
Freqüência Relativa
A freqüência relativa de um dado é a razão entre a freqüência deste dado e o número total de dados (soma de todas as freqüências).
Esta freqüência relativa é expressa em número decimal. Pela tabela 1.0, podemos calcular a freqüência relativa, por exemplo, do conceito A, que resulta:
Frequentemente expressamos a freqüência relativa em termos de porcentagem (%). Para calcular a porcentagem, basta multiplicar a freqüência relativa por 100.
Calculando as freqüências relativas para os demais conceitos da tabela 1.0, obtemos os dados mostrados na tabela 1.2. Na última linha desta tabela, além de indicar a soma das freqüências relativas e das porcentagens, para simples conferência desses valores, uma vez que a soma das freqüências relativas deve, necessariamente, resultar em 1,00, e a soma das porcentagens deve resultar em 100%.
Tabela 1.1: Tabela de freqüência
	Conceito
	Freqüência
	Freq Relativa
	Porcentagem
	A
	9
	0,15
	15%
	B
	18
	0,30
	30%
	C
	27
	0,45
	45%
	D
	4
	0,07
	7%
	E
	2
	0,03
	3%
	Soma
	60
	1,00
	100 %
OBS: Às vezes, a soma das freqüências relativas pode resultar em 0,99 ou 1,01, e a soma das porcentagens pode resultar em 99% ou em 101%, devido ao erro de arredondamento.
Tabela de freqüência para dados discretos.
Os dados quantitativos discretos, da mesma forma que os dados qualitativos, podem ser agrupados em freqüência para se construir uma tabela de freqüência.
Freqüência Acumulada
Para dados quantitativos discretos podemos definir a chamada freqüência acumulada, que e o número total de elementos menores ou iguais a um determinado dado, ou se já:
Freqüência acumulada é a soma das freqüências dos dados menores ou iguais ao dado considerado. 
Podemos, também, definir:
Ex: Seja uma pesquisa sobre o número de irmãos de cada aluno, em uma sala de aula com 20 alunos, em que se obteve os seguintes dados: 1, 3, 0, 5, 2, 1, 1, 0, 0, 1, 4, 3, 1, 0, 1, 2, 2, 1, 3, 1. Construa uma tabela de freqüência para os dados:
Tabela1.2 Tabela de freqüência.
	Nº de irmãos
	fi
	fri
	%
	faci
	facri
	% acmd
	0
	4
	0,20
	20%
	4
	0,2
	20%
	1
	8
	0,40
	40%
	4 + 8 = 12
	0,6
	60%
	2
	3
	0,15
	15%
	12 + 3 = 15
	0,75
	75%
	3
	3
	0,15
	15%
	15 + 3 =18
	0,9
	90%
	4
	1
	0,05
	5%
	18 + 1 = 19
	0,95
	95%
	5
	1
	0,05
	5%
	19 + 1 = 20
	1,00
	100%
	Soma
	20
	1,00
	100%
	*****
	*****
	*****
OBS: A partir da tabela acima podemos obter informações, tais como: quantos alunos têm até três irmãos? Dezoito alunos têm até três irmãos.Além disso podemos afirmar que 90% dos alunos têm até três irmãos.
Gráficos 
Após a coleta de dados em uma pesquisa, vimos que uma maneira de organizar os dados de forma concisa é construir tabelas de freqüência. Uma vez obtida a tabela de freqüência, podemos visualizar melhor os dados desta tabela, construindo-se gráficos. Existem diversos tipos de gráficos e a escolha adequada depende basicamente do tipo de dado e da finalidade da apresentação. 
Gráficos de Barras
Gráfico de barras é um tipo de gráfico em que barras horizontais com larguras iguais e comprimentos proporcionais à freqüência de cada da dado são desenhadas lado a lado com algum espaçamento entre elas.
O gráfico de barras é mais apropriado para representar graficamente os dados qualitativos, porém pode, também, ser utilizado para representar dados quantitativos discretos.
Gráfico de Barras para dados qualitativos:
Gráfico de Barras para dados discretos:
Gráfico de Colunas
O gráfico de colunas é mais apropriado para representar graficamente os dados quantitativos discretos, porém pode, também, ser utilizados para representar dados qualitativos.
Gráfico de colunas para dados discretos.
Por exemplo: o número de acidentes em uma fábrica registrados nos 15 primeiros dias de Julho
Gráficos de Múltiplas colunas:
Quando temos dois ou mais grupos de dados para uma mesma variável, pode ser interessante fazer uma comparação entre os grupos. Para facilitar esta comparação, podemos representar os dados dos grupos em um mesmo gráfico de colunas, uma vez que a variável é a mesma.
Consideremos, por exemplo, a produção de componentes para indústria petroquímica oriunda de duas empresas concorrente, empresa A e empresa B. O número de peças defeituosas, por lotes, está resumido nas tabelas abaixo.
Tabela1.3 tabela de freqüência do número de peças defeituosas por lote da Empresa A. 
	Número de Peças defeituosas
	Freqüência
	Freq. relativa
	1
	12
	0,40
	2
	5
	0,17
	3
	8
	0,27
	4
	4
	0,13
	5
	1
	0,03
	Soma =
	30
	1,00
Tabela1.4 tabela de freqüência do número de peças defeituosas por lote da Empresa A. 
	Número de Peças defeituosas
	Freqüência
	Freq. relativa
	1
	5
	0,25
	2
	8
	0,40
	3
	3
	0,15
	4
	3
	0,15
	5
	1
	0,05
	Soma =
	20
	1,00
Gráfico de Setores
Uma outra forma de representar graficamente um conjunto de dados é o gráfico de setores, que consiste em representar a freqüência de cada dado como uma fatia (um setor) proporcional de um círculo. Este é também conhecido como gráfico de torta ou de pizza.
O gráfico de setores é apropriado para representar dados qualitativos, em que se quer ter uma visão da proporção de um dado em relação ao todo.
Consideremos, por exemplo, uma pesquisa realizada entre 60 pessoas, sobre os animais de estimação preferidos. 
Tabela de freqüência para dados contínuos
Comparemos dois exemplos de pesquisa: uma pesquisa envolvendo uma variável discreta e outra, uma variável contínua.
Variável discreta:
Dezesseis turmas de um colégio são pesquisadas e o número de alunos que estão satisfeitos com a qualidade da escola foi registrado, obtendo-se os seguintes dados:
42	43	43	41	42	43	42	43	42	44	42	40	43	43	41	43
Variável contínua:
Dezesseis alunos, escolhidos aleatoriamente, percorreram uma volta no campo de atletismo, obtendo-se os seguintes tempos de percurso, em segundos:
43,1	41,4	43,7	42,0	43,9	42,3	43,2	42,6	41,7	44,6	43,0	42,1	43,2	40,3	43,5	42,5
Como podemos observar, comparando as duas pesquisas, a repetição de um dado contínuo ocorre raramente, e, portanto, se organizarmos esses dados em forma de tabela de freqüência, da forma como fazemos com os dados discretos, a maioria dos dados terá freqüência unitária, não fornecendo informações sobre a distribuição de freqüência.
Para solucionar esse problema, que ocorre com a maioria dos dados contínuos, devemos considerar intervalos de valores da variável (dados). No caso do tempo de percurso, podemos dividir, por exemplo, em cinco intervalos:
1º intervalo: de 40,0 a 40,9 segundos;
2º intervalo: de 41,0 a 41,9 segundos;
3º intervalo: de 42,0 a 42,9 segundos;
4º intervalo de 43,0 a 43,9 segundos;
5º intervalo: de 44,0 a 44,9 segundos.
Fazendo, então, a contagem dos alunos que fizeram o percurso em um determinado intervalo de tempo, temos que:
Um aluno fez o percurso com tempo de 40,0 a 40,9 segundos.
Dois alunos fizeram o percurso com tempo de 41,0 a 41,9 segundos.
Cinco alunos fizeram o percurso com tempo de 42,0 a 42,9 segundos
Sete alunos fizeram o percurso com tempo de 43,0 a 43,9 segundos
Um aluno fez o percurso com tempo de 44,0 a 44,9 segundos
Cada intervalo é denominado classe (intervalo de tempo, no exemplo anterior) e o número de dados que pertencem a cada intervalo é denominado freqüência da classe ou simplesmente freqüência (número de alunos, no exemplo anterior)
Para indicar o intervalo, utilizaremos o símbolo |--- .Por exemplo a classe de 40,0 a 40,9 será representada, daqui em diante, por:
40,0 |--- 41,0
Onde 40,0 é chamado de limite inferior da classe e 41,0 de limite superior da classe. Genericamente, todo intervalo pode ser representado por: 
(limite inferior) |--- (limite superior)
Observe que, nesta notação, o limite inferior está incluído no intervalo, enquanto o limite superior não está incluído no intervalo, ou seja, corresponde à notação matemática:
(limite inferior) ≤ X < (limite superior)
Onde x é a variável dado.
O processo de organização dos dados em classes é chamado de agrupamento de dados em classes, e os dados agrupados podem ser apresentados em forma de tabela de freqüência, como mostra a tabela 1.5, utilizando os dados do exemplo anterior (tempo de percurso).
	Classe
	Freqüência
	40,0 |--- 41,0
	1
	41,0 |--- 42,0
	2
	42,0 |--- 43,0
	5
	43,0 |--- 44,0
	7
	44,0 |--- 45,0
	1
	Soma
	16
Número de Classes
O número de classes a ser utilizado no agrupamento em classe sé arbitrário e depende do bom senso do encarregado que faz a organização dos dados da pesquisa. Geralmente, o número de classes varia de 5 a 20, dependendo do número de dados. Na prática, quanto maior o número de dados, maior será o número de classes.
Apesar de ser arbitrário, algumas regras para a determinação do número de classes são propostas, com veremos a seguir:
Regra do Logaritmo
Uma das possíveis regras que dá uma idéia do número de classes é a regra do logaritmo, dada por:
k = 1 + 3,3. log (n)
onde: k é o número de classes e n é o número de dados.
Por exemplo, se tivermos um conjunto de 45 dados, ou seja, n = 45, o número de classes dada pela expressão anterior será:
K = 1 + 3,3 * log(45) = 1 + 3,3 * 1,65 = 6,45.
Arredondando este valor para um número inteiro mais próximo, obtemos: k = 6.
Regra da potência de 2
Uma outra regra que pode ser utilizada para ter uma idéia aproximada do número de classes é a regra da potência de 2, dada por:
Menor valor inteiro de k, tal que 2k ≥ n.
onde: k é o número de classes e n é o número de dados.
Por exemplo, se tivermos um conjunto de 60 dados, ou seja, n = 60, o número de classes k será igual a 6, pois 6 é o menor valor inteiro de k, tal que 2k ≥ 60, isto é, 26 ≥ 60 ou 64 ≥ 60.
Largura da Classe
Uma vez definido o número de classes, precisamos determinar a largura de cada classes.
A largura da classe é definida como a diferença entre o limite superior e o limite inferior da classe:
Largura da classe = (limite superior) – (limite inferior)
Geralmente, é preferível utilizar classes com a mesma largura, apesar de que, em algumas situações, diferentes larguras de classe possam ser utilizadas.
Quando todas as classes têm a mesma largura da classes pode ser obtida pela seguinte expressão:
Largura da classe = (máximo) – (mínimo)
 Número da classe
OBS: geralmente, o resultado dessa expressão é aproximado para um número adequado. Dependendo da escolha desse número aproximado, o número de classes poderá mudar ligeiramente (aumentar ou diminuir).
Para os dados do exemplo (tempo de percurso) em que o valor máximo é 43,5 e o valormínimo é 39,0 uma vez fixado o número de classes em 5, e considerando largura de classes iguais, obtemos:
Largura da classe = 
Poderemos aproximar esse número para 1,0. Logo, a largura da classe será 1,0 segundo.
Ponto Inicial
Ponto inicial é o número que será o limite inferior da primeira classe, a partir do qual todas as outras classes serão definidas. A princípio, qualquer número menor ou igual ao valor mínimo dos dados poderá ser escolhido como ponto inicial.
Freqüência Relativa E Porcentagem
A freqüência relativa da classe é igual à freqüência da classe dividida pelo número de dados.
A porcentagem da classe é igual à freqüência relativa da classe multiplicada por 100
Tabela 1.6 – Tabela de freqüência para dados agrupados em classes
	Classe
	Freqüência (fi)
	Freq Relat (fri)
	Porcentagem (%)
	40,0 |--- 41,0
	1
	0,06
	6%
	41,0 |--- 42,0
	2
	0,13
	13%
	42,0 |--- 43,0
	5
	0,31
	31%
	43,0 |--- 44,0
	7
	0,44
	44%
	44,0 |--- 45,0
	1
	0,06
	6%
	Soma
	16
	1,00
	100%
Histograma e Polígono de freqüência
Histograma:
Para dados agrupados em classes, a representação gráfica da distribuição de freqüências é feita por meio de um histograma, que é semelhante ao gráfico de colunas, porém, neste caso, a área de cada retângulo é proporcional à freqüência da classe, e os retângulos adjacentes se tocam.
Consideremos como exemplo, os dados da tabela anterior.
Histograma para Classes com Larguras Desiguais
Existem casos em que é mais adequado agrupar os dados em classes com larguras desiguais, como por exemplo, as idades dos atletas de acordo com a categoria à qual cada um pertence. Consideremos que existam 12 atletas na categoria mirim, 5 na infantil, 8 na juvenil, 30 na adulto, 12 na pré-senior e 12 na veterano, e que as faixas etárias correspondentes a cada categoria sejam as mostradas na tabela 1.7
Tabela 1.7 – Tabela de freqüência em classes com larguras desiguais.
	Classe
	Freqüência
	2 |--- 13
	12
	13 |--- 15
	5
	15 |--- 18
	8
	18 |--- 30
	30
	30 |--- 40
	12
	40 |--- 60
	10
	60 |--- 90
	12
A representação gráfica dos dados da tabela 1.7 em forma de um histograma requer a transformação dos valores de freqüência em densidade de freqüência, pois devemos manter a área dos retângulos do histograma proporcional a freqüência.
 A densidade da freqüência será dada por:
Calculando as densidades de freqüência de cada classe para os dados da tabela 1,7, obtemos os dados da tabela 1.7.1
Tabela 1.7.1 – Tabela de freqüência com densidades de freqüência.
	Classe
	Freqüência
	Largura da Classe
	Densidade de freqüência
	2 |--- 13
	12
	13 – 2 = 11
	12 / 11 = 1,1
	13 |--- 15
	5
	15 – 13 = 2
	5 / 2 = 2,5
	15 |--- 18
	8
	18 – 15 = 3
	8 / 3 = 2,7
	18 |--- 30
	30
	30 – 18 = 12
	30 / 12 = 2,5
	30 |--- 40
	12
	40 – 30 = 10
	12 / 10 = 1,2
	40 |--- 60
	10
	60 – 40 = 20
	10 / 20 = 0,5
	60 |--- 90
	12
	90 – 60 = 30
	12 /30 = 0,4
No eixo vertical temos as densidades, variando de 0,4 a 2,7 e nos eixos horizontal temos as classes, com largura do retângulo proporcional a largura da classe.
Polígono e Freqüência
Unindo-se os pontos médios da parte superior (patamar) de cada retângulo do histograma com segmentos de reta, obtemos o chamado polígono de freqüência. 
Do histograma anteriore (tempo de percurso de uma volta no campo); obteremos o polígono de freqüência mostrado abaixo.
O polígono de freqüência é importante, pois podemos comparar duas ou mais distribuições de freqüência, traçando os polígonos em um mesmo gráfico. No gráfico a seguir estamos comparando o tempo gasto para percorrer uma volta no campo pelos alunos de duas turmas, A e B.
Podemos observar que o desempenho da turma B foi melhor que o da turma A, pois o pico da distribuição de freqüência da Turma B se localiza mais à esquerda em relação ao pico da distribuição da turma A, significando que houve mais alunos da turma B que fizeram o percurso com menor tempo.
�
SÉRIES
Uma seqüência de dados correspondentes a duas variáveis é chamada de série. Quando uma dessas variáveis é o tempo, temos a chamada série temporal. Quando uma das variáveis é a localização geográfica, temos a série geográfica, e quando for de outro tipo chamamos de série específica.
Série Temporal:
Série temporal é uma seqüência de dados, correspondentes a diferentes instantes ou períodos de tempo, em um mesmo local ou região. Neste caso existem duas variáveis: a variável de interesse e o tempo.
Consideremos, por exemplo, as precipitações nas regiões de clima tropical durante o ano.
Tabela 1.8 – Precipitações nas regiões de clima tropical
	Mês
	Jan
	Fev
	Mar
	Abr
	Mai
	Jun
	Jul
	Ago
	Set
	Out
	Nov
	Dez
	Precipitação
(mm)
	200
	130
	120
	100
	70
	60
	20
	20
	80
	120
	130
	190
OBS: A representação gráfica de uma série cronológica (temporal) deve ser feita por meio de gráfico de linha (ou polígono de freqüência), pois o tempo é uma variável contínua.
Série Geográfica
Série geográfica é uma seqüência de dados correspondentes 
Tabela 1.5 – Tabela de freqüência para dados agrupados em classes.
�PAGE �
�PAGE �24�
_1248376047.unknown
_1249026778.unknown
_1249027062.unknown
_1249029142.unknown
_1249026336.unknown
_1248374527.unknown
_1248376033.unknown
_1248374171.unknown

Continue navegando