Buscar

Estatistica_primeiras_aulas[2]

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

AULA 01
CONCEITOS FUNDAMENTAIS
ESTATÍSTICA
Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos nas tomadas de decisão.
	A estatística divide-se em dois ramos:
	
	ESTATÍSTICA DESCRITIVA
	É a parte da estatística que se preocupa com a coleta, organização e a descrição dos dados observados, porém sem tirar conclusões mais genéricas.
	ESTATÍSTICA INDUTIVA OU INFERENCIAL
	É a parte que em baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar conclusões para o comportamento da população, dando a precisão dos resultados e com que probabilidade se pode confiar neles.
	POPULAÇÃO OU UNIVERSO
	É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica comum.
	AMOSTRA
	É um subconjunto finito de uma população.
	FENÔMENO
	É o número de resultados possíveis. Assim, por exemplo: para o fenômeno “número de filhos” há um número de resultados possíveis expresso através de números naturais: 0, 1, 2, 3, ..., n
	VARIÁVEL
	É, convenientemente, o conjunto de resultados possíveis de um fenômeno.
	Quando seus valores são expressos por atributos: cor dos olhos, sexo), etc ela é denominada qualitativa.
Quando os seus valores são expressos em números (salários, idade dos alunos de uma escola, etc) ela é denominada quantitativa. Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta.
Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = ( 1, 2, 3, ...), mas nunca valores como2,34 ou 5,76. Logo é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um aluno pode pesar 72 kg, como 72,5 kg, como 72,53 kg, etc, dependendo esse valor da precisão da medida.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações a variável discretas.
Quando uma variável é quantitativa discreta ela é manipulada como se apresenta. Entretanto quando a variável é quantitativa contínua há sempre um limite para a precisão com a qual a mensuração pode ser feita, o que nos leva a concluir que o valor verdadeiro nunca é conhecido. Na verdade, os valores observados são discretos e aproximados.
Convencionaremos que a precisão da medida será automaticamente indicada pelo número de decimais com que se escrevem os valores da variável.
Assim, um valor 4,60 indica que a variável em questão foi medida com a precisão de centésimos, não sendo exatamente o mesmo que 4,6, valor correspondente a uma precisão de décimos.
Para suprimir unidades inferiores às de determinada ordem recorremos a técnica de ARREDONDAMENTO DE DADOS.
ARREDONDAMENTO DE DADOS
A técnica de arredondamento de dados é normatizada pelo Instituto Brasileiro de Geografia e Estatística, IBGE através da resolução 886/66, da seguinte maneira:
Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, 4, fica inalterado o último algarismo a permanecer.
Ex. 53,24 passa a 53,2
Quando o primeiro algarismo a ser abandonado é 6, 7, 8, 9, aumenta-se uma unidade o algarismo a permanecer.
Ex. 42,87 passa a 42,9
 88, 08 passa a 88,1
Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.
 Ex. 2,352 passa a 2,4
109,250003 passa a 109,3
Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a permanecer só será aumentado de uma unidade se for impar.
Ex. 24,75 passa a 24,8
 24,65 passa a 24,6
 24,75000 passa a 24,8
 24,65000 passa a 24,6
 
OBS
Não devemos nunca fazer arredondamentos sucessivos.
EX. 17,3452 passa a 17,3 e não 17,35, a 17,4
Se tivermos a necessidade de um novo arredondamento, voltamos sempre aos dados originais.
PRECISÃO
	
	milésimo
	centésimo
	Décimo
	unidade
	dezena
	centena
	milhar
	3.876,55239
	3.876,552
	3.876,55
	3.876,6
	3.877
	3.880
	3.900
	4.000
COMPENSAÇÃO
Compensar é suprimir ou adicionar unidades conforme a precisão a ser requerida do resultado.
Supondo os dados abaixo, aos quais aplicamos as regras do arredondamento:
 		25,32				25,3
 	+	17,85			+	17,8
		10,44				10,4
		31,17				31,2
		84,78	 84,8 		84,7
Se arredondarmos a soma original para uma casa decimal vemos que o resultado é 84,8; a nova soma com as parcelas arredondadas difere em uma unidade. Entretanto para a apresentação dos resultados, é necessário que desapareça tal diferença, o que é possível com a técnica da COMPENSAÇÃO, conservando o mesmo número de casas decimais.
Praticamente, usamos descarregar a diferença na(s) maio(res) parcela(s). assim passamos a ter:
		25,3
	+	17,8
		10,4
		31,3
		84,8
AULA 02
APRESENTAÇÃO DOS DADOS
A apresentação dos dados pode ser efetuada de duas formas, não mutuamente excludentes. A primeira é a apresentação tabular, necessária quando se deseja uma apresentação sistemática dos dados; a outra forma é a gráfica, que se constitui em um importante complemento à apresentação tabular, principalmente por permitir uma visualização quase imediata das distribuições dos valores estudados.
 	
SÉRIES ESTATÍSTICAS
Segundo o Conselho Nacional de Estatística, a organização dos dados denomina-se série estatística, e esta deverá apresentar, o título, o cabeçalho, o corpo e o rodapé.
	Título - conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando?, Onde?, localizado no topo da série estatística;
	Cabeçalho - parte superior da tabela que especifica o conteúdo das colunas ( as categorias, as modalidades da variável);
	Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo;
	Rodapé – elementos complementares da tabela, que são a fonte, as notas, as chamadas.
ELEMENTOS COMPONENTES DE UMA TABELA – SÉRIE ESTATÍSTICA
	
	
	
	
	
	
	
	TABELA 1 - VENDA DE TRATORES BRASIL 2000 – 2001
	 Título
	
	
	
	
	
	
	
	
	
	2000
	2001
	 Cabeçalho
	
	
	
	
	
	
	
	
	TRATORES
	12.595
	14.892
	 Corpo
	
	
	COLHEITADEIRAS
	2.003
	2.010
	
	
	
	Anfavea
	Fonte
	
	
	
	
	
	
	
	
	
	
	
	
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar:
Um traço horizontal ( -) quando o valor é zero, não só quanto à natureza das coisas como quanto ao resultado do inquérito;
Três pontos (...) quando não temos os dados;
Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expresso em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros ( 0,0; 0,00; 0,000;...).
TIPOS DE SÉRIES ESTATÍSTICAS
Conforme o critério de agrupamento, as séries classificam-se em 4 tipos: temporal ou cronológica, geográfica ou espacial, específica ou categórica e distribuição de freqüências.
SÉRIE CRONOLÓGICA
É a série estatística em que os dados são observados segundo época de ocorrência.
	TABELA 2 – ARRECADAÇÀO MENSAL DE ICMS NO PARANÁ – 1991
	
	
	
	
	
	
	
	
	
	MESES
	 
	ARRECADAÇÃO R$
	MESES
	 
	ARRECADAÇÃO R$
	JANEIRO
	 
	24.856
	 
	JULHO
	 
	48.931
	 
	FEVEREIRO
	27.093
	 
	AGOSTO
	 
	53.564
	 
	MARÇO
	 
	30.912
	 
	SETEMBRO
	60.310
	 
	ABRIL
	 
	36.870
	 
	OUTUBRO
	69.065
	 
	MAIO
	 
	41.442
	 
	NOVEMBRO
	83.857
	 
	JUNHO
	 
	42.042
	 
	DEZEMBRO
	90.336
	 
	
	
	
	
	
	
	
	
	SEFA
	
	
	
	
	
	
	
SÉRIE GEOGRÁFICA
É a série em que os dados são observados segundo a localidade de ocorrência.
	TABELA 3 - METALÚRGICA S/A VENDAS POR REGIÃO (2003)REGIÃO
	 
	VENDAS (R$ 1000,00)
	
	
	SUL
	 
	6.900
	 
	
	
	SUDESTE
	7.700
	 
	
	
	CENTRO-OESTE
	6.500
	 
	
	
	NORDESTE
	5.800
	 
	
	
	NORTE
	 
	4.200
	 
	
	
	TOTAL
	 
	31.500
	 
	
	
	
	
	
	
	
	
	Dados fictícios
	
	
	
	
SÉRIE ESPECÍFICA
É a série em que os dados são observados segundo modalidades diferentes de ocorrência.
	TABELA 4 - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001
	
	
	
	
	
	
	
	TIPO
	 
	UNIDADES (2.000)
	UNIDADES(2.000)
	
	TRATORES
	12.595
	
	14.892
	 
	
	COLHEITADEIRAS
	2.003
	
	2.010
	 
	
	 
	 
	 
	 
	 
	 
	
	Anfavea
	
	
	
	
	
	
DISTRIBUIÇÃO DE FREQÜÊNCIAS
É o método de agrupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o número ou a percentagem de cada classe.
Estatura de 40 alunos do Colégio “A”
	I
	Estatura (cm)
	fi
	xi
	fri
	Fi
	Fri
	1
	150 |--- 154
	4
	152
	0,100
	4
	0,100
	2
	154 |--- 158
	9
	156
	0,225
	13
	0,325
	3
	158 |--- 162
	11
	160
	0,275
	24
	0,600
	4
	162 |--- 166
	8
	164
	0,200
	32
	0,800
	5
	166 |--- 170
	5
	168
	0,125
	37
	0,925
	6
	170 |--- 174
	3
	172
	0,075
	40
	1,000
	 
	 
	=40
	 
	 
	 
	 
REPRESENTAÇÀO GRÁFICA
A apresentação dos dados e respectivos resultados de sua análise pode também ser feita sob a forma de figuras, em geral gráficos ou diagramas.
Gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem comentários inseridos. Devem ser simples, atrair a atenção do leitor e inspirar confiança.
Alguns pontos devem ser respeitados na construção de um gráfico:
- o tamanho deve ser adequado à sua publicação em revistas, periódicos, cartazes ou livros;
 - deve ter sempre um título;
 - deve ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar.
Os gráficos podem ser cartogramas ou diagramas; entende-se por cartogramas o mapa geográfico ou topográfico em que as freqüências das categorias de uma variável são projetadas nas áreas específicas do mapa, utilizando-se cores ou traçados cujos significados constam em legendas anexadas às figuras.
Diagramas são gráficos em que a magnitude das freqüências é representada por certa mensuração de uma determinada figura geométrica. Se a medida utilizada for o comprimento, tem-se o diagrama de ordenadas (gráfico de linhas); caso se utilize superfície de figura, tem-se diagrama de barras, histograma e gráfico de setores, alem de gráficos representativos de distribuições de freqüência.
GRÁFICO EM LINHAS - ARRECADAÇÃO MENSAL DE ICMS NO PARANÁ – 1991
GRÁFICO EM COLUNAS MÚLTIPLAS - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001
Fonte: Anfavea
GRÁFICO EM BARRAS- METALÚRGICA S/A VENDAS POR REGIÃO (2002)
Fonte: Dados fictícios
GRÁFICO EM SETORES- METALÚRGICA S/A VENDAS POR REGIÃO (2001)
Fonte: Dados fictícios
GRÁFICO POLAR - ARRECADAÇÃO MENSAL DE ICMS NO PARANÁ – 1991
Fonte: SEFA
HISTOGRAMA: ESTATURA DE 40 ALUNOS DO COLÉGIO A
Fonte: Dados fictícios
	F
	
	
	
	
	
	
	
	
	
	12
	
	
	
	
	
	
	
	
	
	 
	
	
	
	
	
	
	
	
	
	10
	
	
	
	 
	
	
	
	
	
	 
	
	
	
	 
	
	
	
	
	
	8
	
	
	 
	 
	
	
	
	
	
	 
	
	
	 
	 
	 
	
	
	
	
	6
	
	
	 
	 
	 
	
	
	
	
	 
	
	
	 
	 
	 
	
	
	
	
	4
	
	
	 
	 
	 
	 
	
	
	
	 
	
	 
	 
	 
	 
	 
	
	
	
	2
	
	 
	 
	 
	 
	 
	 
	
	
	 
	
	 
	 
	 
	 
	 
	 
	
	
	0
	 
	 
	 
	 
	 
	 
	 
	 
	
	
	150
	154
	158
	162
	166
	170
	174
	 Estatura
GRÁFICO DE DISTRIBUIÇÃO DE FREQÜÊNCIA –
HISTOGRAMA/POLÍGONO DE FREQÜÊNCIA - NÚMERO MÉDIO DE ACIDENTES POR MIL HOMENS/HORA EM UMA INDÚSTRIA
Dados fictícios
AULA 03
DISTRIBUIÇÃO DE FREQÜÊNCIAS
Distribuição de freqüências são descrições de dados resultantes de variáveis quantitativas agrupadas em classes.
TABELA PRIMITIVA
É assim denominada quando os valores são diretamente organizados conforme coletados, isto é sem critérios de ordem numérica.
 Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando na seguinte tabela de valores:
 
Estatura de 40 alunos do Colégio “A”
	166
	160
	161
	150
	162
	160
	165
	167
	164
	160
	162
	161
	168
	163
	156
	173
	160
	155
	164
	168
	155
	152
	163
	160
	155
	155
	169
	151
	170
	164
	154
	161
	156
	172
	153
	157
	156
	158
	158
	161
ROL
Ë uma ordenação dos dados da tabela primitiva.
Estatura de 40 alunos do Colégio “A”
	150
	154
	155
	157
	160
	161
	162
	164
	166
	169
	151
	155
	156
	158
	160
	161
	162
	164
	167
	170
	152
	155
	156
	158
	160
	161
	163
	164
	168
	172
	153
	155
	156
	160
	160
	161
	163
	165
	168
	173
DISTRIBUIÇÃO DE FREQÜÊNCIA
É uma ordenação em freqüências, sendo no exemplo anterior o numero de alunos componentes da amostra.
 
Estatura de 40 alunos do Colégio “A”
	Estatura
	Freqüência
	
	Estatura
	Freqüência
	150
	1
	
	163
	2
	151
	1
	
	164
	3
	152
	1
	
	165
	1
	153
	1
	
	166
	1
	154
	1
	
	167
	1
	155
	4
	
	168
	2
	156
	3
	
	169
	1
	157
	1
	
	170
	1
	158
	2
	
	172
	1
	160
	5
	
	173
	1
	161
	4
	
	Total
	40
	162
	2
	
	
	
DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSES
É uma representação dos valores em vários intervalos; onde perde-se a sensibilidade ou pormenores mas ganha-se em simplicidade. No exemplo estudado agrupamos em intervalos de classe conforme critérios a serem estudados.
 
Estatura de 40 alunos do Colégio “A”
	ESTATURA
	FREQÜÊNCIA
	150 |--- 154
	4
	154 |--- 158
	9
	158 |--- 162
	11
	162 |--- 166
	8
	166 |--- 170
	5
	170 |--- 174
	3
	TOTAL
	40
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
Classes de freqüência, ou simplesmente classes - são os intervalos de variação da variável
Limites de classe - são os extremos de cada classe
		l1 = 150 L5 = 170
Amplitude de um intervalo de classe, ou simplesmente intervalo de classe é a medida do intervalo que define a classe.
		hi = Li – li h2 = L2 – l2 = 158 – 154 = 4 cm
Amplitude total de distribuição (AT) – é a diferença entre o limite superior da última classe ( limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo)
		AT = L(máx) – l(mín) = 174 – 150 = 24 cm
Amplitude amostral (AA) – é a diferença entre o valor máximo e o valor mínimo da amostra
		AA = x(máx) – x(mín) = 173 – 150 = 23 cm
Ponto médio de uma classe (xi) é o ponto que divide o intervalo de classe em duas partes iguais
		xi = (li + Li) / 2 x2 = (154 + 158) / 2 = 156 cm
	Note que a colocação de um índice i para x para f e os demais elementos da tabela tem a finalidade de referência. Deste modo x2 representa o segundo valor distinto da série, f3 representa a freqüência simples do terceiro valor da série e assim sucessivamente.
PASSOS PARA A CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
Estabelecer o número de classes
Pela fórmula de Sturges:
				i = 1 + 3,3 log n
Onde n representa o número total de observações
Esta regra nos permite obter a seguinte tabela:
	n
	I
	3 |---| 5
	3
	6 |---| 11
	4
	12 |---| 22
	5
	23 |---| 46
	6
	47 |---| 90
	7
	91 |---| 181
	8
	182 |---| 362
	9
	...
	...
i = 1 + 3,3 log n = 1 + 3,3 log 40 = 1 + 3,3 * 1,602 = 1 + 5,2866 = 6,2866 = 6
Portanto no exemplo usam-se 6 intervalos
Determinar a amplitude total dos dados
AT = L(máx) – l (mín)
AT = (173 + 1) – 150 = 24 cm
Estabelecer o intervalo ou amplitude de classe
h = AT / i
h = 24 / 6 = 4cm
	OBS: se h fosse decimal aplicar-se-ia o inteiro maior que o número dado, exemplo se h fosse 4,03 usar-se-ia 5 para amplitude de intervalo e não 4 como manda a regra de arredondamento, constituindo em estatística a única exceção a regra.
Estabelecer os limites dos intervalos, começando com um inteiro em relação ao menor valor da série.
O limite superior da primeira classe é determinado acrescendo-se o valor de h ao limite mínimo. L1= 150 + 4 = 154 cm
O limite inferior da segunda classe é igual ao limite máximo da primeira classe. l2 = 154 cm
TIPOS DE FREQÜÊNCIA
Estatura de 40 alunos do Colégio “A”
	i
	Estatura (cm)
	fi
	xi
	fri
	Fi
	Fri
	1
	150 |--- 154
	4
	152
	0,100
	4
	0,100
	2
	154 |--- 158
	9
	156
	0,225
	13
	0,325
	3
	158 |--- 162
	11
	160
	0,275
	24
	0,600
	4
	162 |--- 166
	8
	164
	0,200
	32
	0,800
	5
	166 |--- 170
	5
	168
	0,125
	37
	0,925
	6
	170 |--- 174
	3
	172
	0,075
	40
	1,000
	 
	 
	=40
	 
	 
	 
	 
Freqüências Simples ou Absolutas (fi) – são os valores que realmente representam o número de dados de cada classe.
Freqüências Relativas (fri) – são os valores das razões entre as freqüências simples e a freqüência total.
			Fri = fi / fi
Freqüência Acumulada (Fi) – é o total das freqüências de todos os valores inferiores ao limite superior de intervalo de uma dada classe.
			Fi = f1 + f2 + .... + fi
	
Freqüência Acumulada Relativa (Fri) – é a freqüência acumulada da classe dividida pela freqüência total de distribuição.
			Fri = Fi / fi
			
			Fri = fr1 + fr2 + .... + fri
HISTOGRAMA
POLÍGONO DE FREQÜÊNCIA
São a representação gráfica das distribuições de freqüência, onde no histograma os valores de fi são representados no eixo de y, paralelos aos limites de cada classe.
No polígono de freqüência as freqüências fi são representadas no eixo y porem no ponto médio de cada classe. 
	I
	Estatura (cm)
	fi
	1
	150 |--- 154
	4
	2
	154 |--- 158
	9
	3
	158 |--- 162
	11
	4
	162 |--- 166
	8
	5
	166 |--- 170
	5
	6
	170 |--- 174
	3
	 
	 
	=40
_1415706336.unknown
_1415706338.unknown
_1415706340.unknown
_1415706341.unknown
_1415706339.unknown
_1415706337.unknown
_1415706335.unknown

Outros materiais