Buscar

Estat- ¦ística 2 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

SÉRIES
Uma seqüência de dados correspondentes a duas variáveis é chamada de série. Quando uma dessas variáveis é o tempo, temos a chamada série temporal. Quando uma das variáveis é a localização geográfica, temos a série geográfica, e quando for de outro tipo chamamos de série específica.
Série Temporal:
Série temporal é uma seqüência de dados, correspondentes a diferentes instantes ou períodos de tempo, em um mesmo local ou região. Neste caso existem duas variáveis: a variável de interesse e o tempo.
Consideremos, por exemplo, as precipitações nas regiões de clima tropical durante o ano.
Tabela 1.8 – Precipitações nas regiões de clima tropical
	Mês
	Jan
	Fev
	Mar
	Abr
	Mai
	Jun
	Jul
	Ago
	Set
	Out
	Nov
	Dez
	Precipitação
(mm)
	200
	130
	120
	100
	70
	60
	20
	20
	80
	120
	130
	190
OBS: A representação gráfica de uma série cronológica (temporal) deve ser feita por meio de gráfico de linha (ou polígono de freqüência), pois o tempo é uma variável contínua.
Série Geográfica
Série geográfica é uma seqüência de dados correspondentes a diferentes locais ou regiões, em um determinado instante ou período de tempo. Neste caso, existem duas ou variáveis: a variável de interesse e a local.
Consideremos, por exemplo, os dados da tabela 1.9 referentes à população urbana por região em 1990, no Brasil.
Tabela 1.9 – População urbana por região, em 1990, no Brasil
	Região
	População urbana (%)
	Centro – Oeste (CO)
	79,2
	Nordeste (NE)
	57,2
	Norte (N)
	54,8
	Sudeste (SE)
	90,1
	Sul (S)
	78,7
�
Série Específica
Série específica é uma seqüência de dados que não se enquadra na série temporal, nem na série geográfica, ou seja, refere-se a fatos que ocorreram em um determinado local em um tempo definido, como mostram os dados da tabela 1.10
Tabela 1.10 – Médias finais obtidas por aluno em 1977.
	Disciplina
	Média final
	Biologia
	6,8
	Física
	8,7
	Geografia
	5,6
	História
	6,0
	Inglês
	7,5
	Português
	9,0
	Química
	8,5
SOMATÓRIO
Veremos como representar, matematicamente, os dados de uma seqüência utilizando índices e a soma dos dados utilizando o somatório.
Índice
Consideremos a seguinte seqüência de 5 números: 8; 13; 5; 27; 10
Podemos associar uma variável a esta seqüência de dados, por exemplo, a variável x, e identificar cada elemento (dado) por meio de um índice colocado na parte inferior da variável: X1; X2; X3; X4; X5.
Utilizando esta notação, X1 representa o primeiro dado da seqüência, X2 o segundo dado, e assim por diante. Desse modo temos:
X1 = 8; X2 = 13; X3 = 5; X4 = 27 e X5 = 10
Representaremos, genericamente, qualquer dado da seqüência por:
Variável → Xi ←índice,
Onde: X é a variável e i é o índice que assume valores inteiros de 1 até o total dos dados da seqüência.
A partir de agora, podemos representar os dados de uma tabela de freqüência, utilizando um índice.
Somatório
Somatório é a soma dos termos de uma seqüência de números. Por exemplo, a soma da seqüência 8; 13; 5; 27; 10, é: 8 + 13 + 5 + 27 + 10.
Esta soma pode ser escrita como X1 + X2 + X3 + X4 + X5, que pode ser representado pelo somatório (Σ é o sigma do alfabeto grego)
Propriedades do Somatório
P1 – Multiplicação por uma constante.
Dada uma seqüência xi, para i = 1, 2, 3, ...,n, temos:
, onde c é uma constante.
Exemplo: 
	i =
	1
	2
	3
	4
	Xi =
	5
	10
	7
	12
Para c = 3: 
 = 3*5 + 3*10 + 3*7 + 3*12 = 3*(5 + 10 +7 +12) = 102.
P2 – Somatório de uma constante.
Dada uma seqüência em que Xi = c, para i = 1, 2, 3,... , n, ou seja, X1 = X2 = X3 = X4 = ... Xn = c, onde c é uma constante:
Exemplo:
	i =
	1
	2
	3
	4
	 xi = 
	7
	7
	7
	7
 
Temos que xi = c = 7; 
.
P3 – Somatório da soma ou da diferença de variáveis:
Dadas duas seqüências xi e yi para i = 1, 2, 3, ..., n, temos:
Exemplo:
	i =
	1
	2
	3
	4
	xi =
	5
	3
	7
	9
	yi =
	2
	4
	8
	8
 = (5 + 2) + (3 + 4) + (7 + 8) + (9 + 8) = (3 + 5+ 7 + 9) + (2 + 4 + 8 + 8) = 46
MEDIDAS DE TENDÊNCIA CENTRAL
As medidas de tendência central são uma das principais características de um conjunto de dados e podem representar um conjunto de dados. As principais medidas são: média, mediana e moda.
Média Aritmética
A média aritmética, ou simplesmente, média, de um conjunto de dados numéricos é a soma de todos os dados dividida pelo número de dados, ou seja:
Existem dois símbolos para representar a média: o símbolo 
 é utilizado para a média amostral e o símbolo 
 (leia-se mi) é utilizado para a média populacional.
Portanto as expressões das médias amostral e populacional são escritas da seguinte forma:
, n é o número de dados da amostra.
, N é o número de dados da população.
Exemplo: Consideremos, como exemplo, os dados abaixo, que correspondem ao número de acidentes ocorridos por dia numa grande estrada.
3 1 2 0 2 5 0 1 2 2 4 3 1
A média de acidentes é calculada da seguinte forma:
, portanto a média de acidentes foi de 2 acidentes por dia.
Mediana.
A mediana é o valor que divide um conjunto de dados, ordenados, ao meio.
Vamos considerar, por exemplo, o número de gols marcados em cada partida de futebol, durante 13 jogos:
3 1 2 0 2 5 0 1 2 2 4 3 1
Ordenando esses dados, obtemos:
0 0 1 1 1 2 2 2 2 3 3 4 5
Podemos observar que o sétimo elemento, cujo valor é 2, divide os dados ordenados, acima, ao meio.
0 0 1 1 1 2 2 2 2 3 3 4 5
 
Portanto o valor da mediana é igual a 2.
�
Podemos obter a posição i da mediana, para dados ordenados, pela seguinte expressão:
, onde: i é o índice do i-ésimo elemento e n é a quantidade de dados.
No exemplo anterior, a posição da mediana é: 
, como o sétimo valor é 2, a mediana é igual a 2, como já havíamos obtido.
OBS: Se a quantidade de dados for ímpar, a posição da mediana é um número inteiro. Por outro lado, se a quantidade de dados for par, o resultado do cálculo da posição da mediana não é um número inteiro, indicando que existem dois valores centrais. Neste caso, a mediana é a média aritmética desses dois valores.
Consideremos os seguintes dados ordenados:
3 3 4 4 5 6 6 7 7 8 8 9 9 10
Calculando a posição da mediana, obtemos: 
. Logo a mediana se encontra entre o sétimo e o oitavo valores.
3 3 4 4 5 6 6 7 7 8 8 9 9 10
 
Portanto a mediana é igual a: 
Moda
A moda de um conjunto de dados é o valor que mais se repete, isto é, aquele com a maior freqüência. Existem caso em que ocorre mais de uma moda, e outros em que a moda não existe (os valore não se repetem ou todos tem a mesma freqüência ). No caso em que existem duas modas, o conjunto de dados é chamado bimodal.
OBS: A moda é a única medida de tendência central que pode ser calculada para dados qualitativos e quantitativos.
Exemplos para dados qualitativos:
Os dados abaixo referem-se às pesquisas de opinião dos clientes de três restaurantes (A, B e C) sobre os seus serviços (os valores possíveis são: E – excelente, O – ótimo, B – bom, R – regular, e P – péssimo).
Restaurante A: P, R, B, B, O, O, O, O, E, E ( a moda é O
Restaurante B: R, B, B, B, B, O, O, O, O, E ( as modas são B e O
Restaurante C: P, P, R, R, B, B, O, O, E, E ( não existe moda
Exemplos para dados quantitativos:
O número de livros vendidos a cada hora foi coletado, em três livrarias (A, B e C). Os dados obtidos em um período de oito horas, foram:
Livraria A: 0, 1, 2, 2, 2, 2, 3, 4 ( a moda é 2
Livraria B: 1, 2, 2, 2, 3, 3, 3, 5 ( as modas são 2 e 3 (bimodal)
Livraria C: 0, 0, 1, 1, 2, 2, 3, 3 ( não existe moda.
Medidas de tendência central utilizando tabela de freqüência.
Agora veremos como calcular as medidas de tendência central para dados organizados em tabela de freqüência.
Média
A coluna da freqüênciade uma tabela de freqüência indica a repetição de um dado. Como a soma de vários dados é igual a o produto do dado pela sua freqüência, isto é:
11 + 11 = 11*2; 12 + 12 + 12 + 12 + 12 = 12*5; 16 + 16 + 16 = 16*3;
a média amostral pode ser calculada pela seguinte expressão:
Podemos, então, utilizar a tabela de freqüência para calcular 
, acrescentando uma coluna referente a 
como mostra a tabela abaixo:
Tabela 1.11 – Tabela de freqüência para cálculo da média
	i
	xi
	f(xi)
	xi * f(xi)
	1
	11
	2
	11*2 = 22
	2
	12
	5
	12*5 = 60
	3
	13
	8
	13*8 =104
	4
	14
	6
	14*8 = 84
	5
	15
	5
	15*5 = 75
	6
	16
	4
	16*4 = 64
	Soma
	
	30
	400
Mediana
Uma vez que os dados encontram-se ordenados, podemos obter a mediana através da freqüência acumulada. Devemos, inicialmente, localizar a posição da mediana e depois obter a mediana.
A posição da mediana é dada por: 
 .
Exemplo: 
Seja a tabela a abaixo:
Tabela 1.12 – Tabela de freqüência e de freqüência acumulada
	i
	xi
	f(xi)
	fac(xi)
	1
	11
	2
	2
	2
	12
	5
	7
	3
	13
	8
	15
	4
	14
	6
	21
	5
	15
	5
	26
	6
	16
	4
	30
	Soma
	
	30
	
A posição da mediana é dada por: 
, logo a mediana está entre o décimo quinto e o décimo sexto valores.
Observando a freqüência acumulada, na tabela 1.12, verificamos que o décimo quinto valor é o 13 e o décimo sexto é o valor 14, e, portanto:
Moda
A moda é a medida mais fácil de encontrar na tabela de freqüência, pois é o dado com a maior freqüência.
Medidas de tendência central para dados contínuos 
Veremos agora, como calcular as medidas de tendência central, utilizando tabelas de freqüência para dados contínuos, em que os dados são agrupados em classes.
Média
A média amostral de um conjunto de dados é calculada por:
, onde: n é o número total de dados; m é o número de classes; 
 é o ponto médio da classe k; f(xk) é a freqüência da classe k
Exemplo:
Tabela1.13 – Tabela de freqüência e freqüência acumulada
	k
	Classe
	F(xk)
	fac(xk)
	1
	4,0 |---5,0
	1
	1
	2
	5,0 |---6,0
	4
	5
	3
	6,0 |---7,0
	11
	16
	4
	7,0 |---8,0
	7
	23
	5
	8,0 |---9,0
	2
	25
	Soma
	
	25
	
Na tabela 1.13, do exemplo, devemos acrescentar uma coluna de ponto médio da classe e uma coluna do produto do ponto médio da classe pela freqüência da classe.
	k
	Classe
	F(xk)
	fac(xk)
	
	
*
	1
	4,0 |---5,0
	1
	1
	4,5
	4,5
	2
	5,0 |---6,0
	4
	5
	5,5
	22,0
	3
	6,0 |---7,0
	11
	16
	6,5
	71,5
	4
	7,0 |---8,0
	7
	23
	7,5
	52,5
	5
	8,0 |---9,0
	2
	25
	8,5
	17
	Soma
	
	25
	
	
	167,5
Portanto a média é igual a: 
Mediana
Para calcular a mediana, devemos, primeiramente, identificar na tabela de freqüência acumulada, a classe k em que a freqüência acumulada fac(xk) se torna maior ou igual a n/2, onde n é o número de dados.
Se a freqüência acumulada fac(xk) for igual a n/2, então, a mediana é o limite superior da classe k.
Caso contrário, ou seja, fac(xk) maior que n/2, a mediana é obtida pela seguinte expressão:
, onde:
n é o número de dados;
xk(inf) é o limite inferior da classe k;
xk(sup) é o limite superior da classe k;
fac(xk-1) é a freqüência acumulada da classe k –1 (classe anterior à classe k)
fac(xk) é a freqüência acumulada da classe k.
Por exemplo, para os dados da tabela 1.13, temos 25 dados (n = 25) e, portanto, n/2 = 12,5. A classe cuja freqüência acumulada se torna maior ou igual a 12,5 é a terceira classe, isto é, k = 3
Para n = 25 e k = 3, temos:
 e, pela tabela 1,13, obtemos:
fac(x2) = 5 x3(inf) = 6,0
fac(x3) = 16 x3(sup) = 7,0.
Substituindo esses valores na expressão anterior, temos:
 e, portanto: mediana = 6,68
Moda
A classe com a maior freqüência é denominada classe modal.
Apresentaremos aqui duas maneiras de calcula a moda, para dados agrupados em tabela de classes.
1 – A moda como ponto médio da classe modal (classe com maior freqüência)
Pelos dados da tabela 1.13, a classe modal é 6,0 |--- 7,0 e portanto a moda é igual ao ponto médio desta classe que é 6,5
2 – A moda pela fórmula de Pearson:
Utilizando os dados da mediana e da média obtidos anteriormente, podemos calcular a moda através da fórmula de Pearson:
Moda = 3*6,68 – 2*6,7 = 6,64
OBS: Os valores das medidas de tendência central obtidas dos dados brutos e dos dados organizados em tabela de freqüência diferem, pois, quando agrupamos os dados em classes, estamos perdendo informações dos dados originais (brutos).
Características da Média, Mediana e Moda.
A média é única e utilizamos todos os dados para o seu cálculo. A média é sensível a valores discrepantes (dados muito maiores ou menores que a maioria dos dados)
A mediana é única e sempre existe. Como a mediana divide os dados ordenados ao meio, ela não é sensível a dados discrepantes.
A moda não é afetada por dados discrepantes e não utiliza todos os dados para sua determinação.
A moda pode não ser única e esta característica pode ser utilizada para detectar possíveis erros nos dados analisados.
Exercício:
Calcule a média, a mediana e a moda dos dados das tabelas a seguir:
a) 
	Classe
	Freqüência
	10 |---12
	4
	12 |---14
	12
	14 |---16
	21
	16 |---18
	13
	18 |---20
	6
b)
	Classe
	Freqüência
	0,50 |---0,55
	5
	0,55 |---0,60
	11
	0,60 |---0,65
	14
	0,65 |---0,70
	21
	0,70 |---0,75
	18
	0,75 |---0,80
	10
	0,80 |---0,85
	8
 6 valores
 6 valores
Mediana
 6 valores
 6 valores
Valore Centrais
�PAGE �
�PAGE �35�
_1250834998.unknown
_1250838052.unknown
_1250966930.unknown
_1250971360.unknown
_1251041245.unknown
_1251042340.unknown
_1251042610.unknown
_1251042881.unknown
_1251041552.unknown
_1251040845.unknown
_1251040978.unknown
_1250971393.unknown
_1250968533.unknown
_1250968708.unknown
_1250967503.unknown
_1250966691.unknown
_1250966917.unknown
_1250838457.unknown
_1250835609.unknown
_1250837342.unknown
_1250837555.unknown
_1250835834.unknown
_1250835284.unknown
_1250835402.unknown
_1250835116.unknown
_1250833249.unknown
_1250834006.unknown
_1250834449.unknown
_1250833519.unknown
_1250832299.unknown
_1250832616.unknown
_1250832101.unknown

Outros materiais

Outros materiais