Buscar

Estatística

Prévia do material em texto

Estatística
População
População não se restringe a seres humanos, ela é definida exatamente a partir dos objetivos da pesquisa.
Coleta e Organização de Dados para Pesquisa
Métodos de coleta:
· Amostragem: Pesquisas por Amostragem – pesquisa em que apenas uma amostra da população é investigada. *Amostra: Subconjunto da população.
· Censo: Pesquisa censitária – pesquisa em que toda a população é investigada de 10 em 10 anos.
Variáveis Qualitativas
Variável que descreve uma característica dos elementos de uma população.
Variáveis Nominais Ex.: Sexo, Estado Civil.
Variáveis Ordinais Ex.: Escolaridade (1°, 2°, 3° grau), mês (Jan, Fev, Mar... Dez).
Distribuições de Frequência
Frequência Simples Absoluta (Fi) e Relativa (Fr)
	Sexo
	Frequência Simples
	
	Absoluta
	Relativa
	Masculino
	270
	0,54
	Feminino
	230
	0,46
	Total
	500
	1,00
	Estado Civil
	Frequência Simples
	
	Absoluta
	Relativa %
	Solteiro
	125
	25
	Casado
	280
	56
	Divorciado
	85
	17
	Viúvo
	10
	2
	Total
	500
	100
Arredondamento de Números
Menor ou igual a 4 – o algarismo é inalterado.
Maior ou igual a 5 – o algarismo é acrescido de 1.
Gráficos
As distribuições de frequências para dados qualitativos também podem ser ilustradas graficamente através de gráficos de colunas ou gráficos de setores (pizza).
	Variáveis Quantitativas
Variável que mensura uma característica dos elementos de uma população.
Variáveis Discretas – Números naturais ou inteiros (contagem). Ex.: N° de filhos, dependentes; idade, faixa etária.
	Número de Dependentes
	Frequência Simples
	
	Absoluta
	Relativa %
	0
	120
	24
	1
	95
	19
	2
	90
	18
	3
	95
	19
	4
	35
	7
	5
	30
	6
	6
	20
	4
	7
	15
	3
	Total
	500
	100
Frequência Acumulada
	Número de Dependentes
	Frequência Acumulada
	
	Absoluta
	Relativa %
	0
	120
	24
	1
	215
	43
	2
	305
	61
	3
	400
	80
	4
	435
	87
	5
	465
	93
	6
	485
	97
	7
	500
	100
Frequências Agrupadas
Quando a variável assume muitos valores diferentes, fica inviável a construção de uma tabela de distribuição de frequências com uma linha para cada valor. Nesse caso, pode-se agrupar valores próximos em intervalos e construir uma tabela de distribuição de frequências com intervalos de classe.
	Faixa Etária
	Frequência Simples
	Frequência Acumulada
	
	Absoluta
	Relativa %
	Absoluta
	Relativa %
	19-23
	1
	0,2
	1
	0,2
	24-28
	23
	4,6
	24
	4,8
	29-33
	103
	20,6
	127
	25,4
	34-38
	246
	49,2
	373
	74,6
	39-43
	52
	10,4
	425
	85
	44-48
	50
	10
	475
	95
	49-53
	25
	5
	500
	100
	Total
	500
	100
	
	
Variáveis Contínuas – Números reais (medição). Ex.: Peso, altura, tempo, idade.
A amplitude de um conjunto de dados, representada por ∆total, é definida como a diferença entre os valores máximo e mínimo:
∆total = VMáx − VMín = xn – x1
Ex.: Suponha que, entre os 500 funcionários da nossa empresa, o menor salário seja 2.800 e o maior salário seja de 12.400. Para agrupar os dados em cinco classes, devemos fazer o seguinte:
∆total = VMáx − VMín = 12.400−2.800 = 9.600
Próximo múltiplo de 5 = 9.605
Comprimento de classe = = 1.921
Os limites de classe, então, são: 
2.800
2.800+1.921 = 4.721
4.721+1.921 = 6.642
6.642+1.921 = 8.563
8.563+1.921 = 10.484
10.484−1.921 = 12.405
e as classes podem ser definidas como
[2.800,4.721) (2.800 incluído; 4.721 excluído)
[4.721,6.642) (4.721 incluído; 6.642 excluído)
[6.642,8.563) (6.642 incluído; 8.563 excluído)
[8.563,10.484) (8.563 incluído; 10.484 excluído)
[10.484,12.405) (10.484 incluído; 12.405 excluído)
	Classe de Salário
	Frequência Simples
	Frequência Acumulada
	
	Absoluta
	Relativa %
	Absoluta
	Relativa %
	[3200,4021)
	4
	26,67
	4
	26,67
	[4021,4842)
	2
	13,33
	6
	40
	[4842,5663)
	2
	13,33
	8
	53,33
	[5663,6484)
	3
	20
	11
	73,33
	[6484,7305)
	4
	26,67
	15
	100
	Total
	15
	100
	
	
Histogramas de Frequência
O histograma e o polígono de frequências são gráficos usados para representar uma distribuição de frequências simples de uma variável quantitativa contínua.
Como as classes têm o mesmo comprimento, o histograma, nesse caso, pode ser construído de tal modo que as alturas dos retângulos sejam iguais às frequências das classes. Dessa forma, as áreas serão proporcionais (e não iguais) as frequências.
A área de cada retângulo é igual à frequência relativa da classe e a altura de cada classe é calculada usando-se a expressão que dá a área de um retângulo. Por exemplo, para a classe [3200,4021), a frequência (área) é = 0,266667 e a base do retângulo (comprimento de classe) é 3200 - 4021 = 821. Logo, a altura h do retângulo correspondente é:
h = = 0,000325
O resultado dessa divisão é denominado densidade, uma vez que dá a concentração em cada classe por unidade da variável. 
Em ambos os gráficos, a forma dos retângulos é a mesma; o que muda é a escala no eixo vertical.
Polígonos de Frequência
Um polígono de frequências é um gráfico de linha que se obtém unindo por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Mais precisamente, são plotados os pontos com coordenadas (ponto médio, frequência simples). Para obter as interseções da poligonal com o eixo, cria-se em cada extremo uma classe com frequência nula.
Diagrama de Ramos e Folhas
É mostrado o 1° dígito apenas uma vez para cada linha, à esquerda e separado dos outros dígitos por uma linha vertical.
Ex.: Idade de 23 funcionários – 27, 31, 45, 52, 33, 34, 29, 27, 35, 38, 50, 48, 29, 30, 32, 29, 42, 41, 40, 42, 28, 36, 48.
2
3
4
5
7 7 8 9 9 9
0 1 2 3 4 5 6 8
0 1 2 2 5 8 8 
0 2
Gráficos de Linhas
O gráfico de linhas é usado principalmente para representar observações feitas ao longo do tempo, isto é, observações de uma serie de tempo.
Ex.: Consumo de refrigerante (em milhões de litros) 1986-2005.
Medidas de Posição ou Tendência Central
Média Aritmética Simples
· Série sem números repetidos
 = = = 
· Série com números repetidos
 = , onde n = ΣF
Moda (x*)
A moda de uma distribuição ou conjunto de dados, representado por x*, é o valor que mais se repete, ou seja, o valor mais frequente.
Mediana (Me)
Ex.: Temos 15 observações – n =15. Onde n é o conjunto das observações ordenadas, de modo que x1 ≤ x2 ≤ ... xn.
1ª observação (x1), 2ª observação (x1), ..., 15ª observação (x15).
· n ímpar: Me = 
· n par: Me = 
Me = = x8
Média Aritmética Ponderada
p =
Exercício
	Classe de Renda
	Ponto Médio
	Frequência Simples
	Frequência Acumulada
	
	
	Absoluta
	Relativa %
	Absoluta
	Relativa %
	[3200,4021)
	3610,5
	4
	26,67
	4
	26,67
	[4021,4842)
	4431,5
	2
	13,33
	6
	40
	[4842,5663)
	5252,5
	2
	13,33
	8
	53,33
	[5663,6484)
	6073,5
	3
	20
	11
	73,33
	[6484,7305)
	6894,5
	4
	26,67
	15
	100
	Total
	
	15
	100
	
	
Média aritmética simples
1 = = 3610,5
2 = = 4431,5 ...
3610,5 – 4 ocorrências, 4431,5 – 2 ocorrências ...
Média dos dados agrupados 
 = = 5307,2333
Ou = 3610,5 x 0,2667 + 4431,5 x 0,1333 + 5252,5 x 0,1333 + 6073,5 x 0,20 + 6894,5 x 0,2667 = 5307,260
Moda: x* = 3610,5 e x* = 6894,5 (bimodal)
Mediana: Nas 2 primeiras classes somam-se 40% e nas 3 primeiras 53,33%. A mediana é algum ponto da classe mediana 4842├ 5663 e abaixo desse ponto temos que ter 50%.
50% - 40% = 10% para completar a distribuição.
A1 = 10% = 0,10 = (Me – 4842) x h
Am = 13,33% = 0,1333 = (5663 – 4842) x h
 = 10,00 3,33
← →
5457,904
A1
Me = 5457,904
Ou = 
Me = 5457,904
	Classe de Renda
	Ponto Médio
	Frequência Simples
	Frequência Acumulada
	
	
	Absoluta
	Relativa %
	Absoluta
	Relativa %
	0 ├ 5
	2,5
	5
	6,25
	5
	6,25
	5 ├ 10
	7,5
	15
	18,75
	20
	25
	10 ├ 15
	12,5
	22
	27,5
	42
	52,5
	15 ├ 20
	17,5
	18
	22,5
	60
	75
	20 ├ 25
	22,5
	12
	15
	72
	90
	25 ├ 30
	27,5
	8
	10
	80
	100
	Total
	
	80
	100
	
	
Média Aritmética Simples
1 = = 2,5 ; 2 = = 7,5; ...; 6 = = 27,5
Média dos dados agrupados 
 = 2,5x0,0625 + 7,5x0,1875 + 12,5x0,275 + 17,5x0,225 + 22,5x0,15 + 27,5x0,10 = 15,0625 
Mediana:
A1 = 25% = 0,25 = (Me – 10) x h
Am = 27,5 = 0,275 = (15 – 10) x h
 = → Me= 14,545
Desvio em torno da média
 di = xi - 
Desvio Médio Absoluto
DMA = = 
Variância
σ2 = = 
Desvio Padrão
σ = 
Coeficiente de Variação
CV = 
Coeficiente de Assimetria
e = 
Separatriz
· Quartil (Qi)Q1
Q2
Q3
25%
75%
· 1° Quartil (Q1): 25% - 75%
Q1
Q2
Q3
50%
50%
· 2° Quartil (Q2): 50% - 50%
Q1
Q2
Q3
25%
75%
· 3° Quartil (Q3): 75% - 25%
Qi = 
Intervalo Interquartil: IQ = Q3 – Q1
Operações com Eventos Aleatórios
Interseção 
 ↔ e 
Exclusão 
União 
 ↔ ou 
Complementar 
 ↔ 
Diferença
A – B = 
 ↔ e 
B – A = 
Permutação
Pn = n x (n-1) x (n-2) x ... x 2 x 1 = n!
Arranjo Simples
 
Combinações Simples
 
Exercícios
	xi
	ni
	 12
	9
	13
	19
	16
	22
	17
	12
	18
	8
	Total
	70
Obtenha a variância
a. 3,45
b. 4,90
c. 5,48
d. 5,21
e. 4,27
 = = = 15,07
σ2 = 
=4,27
Considere o diagrama de ramos e folhas abaixo, variando de 2,10 até 9,50.
2 10 10 30 47 47
4 10 25 25 30 30 35
5 10 14 26 26 26 85 93
6 15
9 05 05 12 50 50
Obtenha a média.
a. 5,30
b. 5,81
c. 4,75
d. 6,17
e. 5,54
 = = 5,30
Considere o diagrama de ramos e folhas abaixo, variando de 3,13 até 9,27.
3 13 13 30 62 62
5 13 25 25 30 35 48
7 19 20 53 53 53 85 95 95
8 15
9 05 05 27
Obtenha a mediana:
a. 7,19
b. 7,53
c. 5,48
d. 6,34
e. 7,95
n = 23 (ímpar)
Me = = x12 = 7,19
Dada a tabela de distribuição de frequências de dados agrupados:
	Classes
	Frequência Absoluta
	Frequência Relativa%
	Frequência Acumulada%
	01 a 06
	3
	2,4590163934426
	2,4590163934426
	06 a 11
	15
	12,295081967213
	14,754098360656
	11 a 16
	50
	40,983606557377
	55,737704918033
	16 a 21
	33
	27,049180327869
	82,786885245902
	21 a 26
	18
	14,754098360656
	97,540983606557
	26 a 31
	3
	2,4590163934426
	100
	Total
	122
	100
	
Obtenha a mediana:
a. 13,42
b. 15,65
c. 15,30
d. 16,92
e. 18,17
50% - 14,754098360656% = 35,24590164%
A1 = 0,3524590164 = (Me – 11) x h
Am = 0,40983606557377 = (16-11) x h
 → 0,40983606557377 Me – 4,508196721 = 1,762295082 → Me = 15,30
Quantos são os anagramas da palavra PERNAMBUCO em que as consoantes estão sempre juntas?
a. 86.400
b. 3.628.798
c. 720
d. 120.960
e. 4.320
10 letras → 6 consoantes + 4 vogais= assim as consoantes podem alterar de posição 4x.
_E_A_U_O_
5!x6! = (5x4x3x2x1) x (6x5x4x3x2x1) = 86.400
Considere o diagrama de ramos e folhas baixo, variando de 1,19 até 8,30.
1 19 19 30 32 32
4 19 25 25 30 30 35
5 10 14 14 65 85 85 92
6 15
8 05 05 12 30 30
Obtenha a amplitude total dos dados:
a. 7,73
b. 7,34
c. 7,42
d. 7,11
e. 6,43
Δtoital = 8,30 – 1,19 = 7,11
Considere o diagrama de ramos e folha abaixo, variando de 3,17 até 9,26.
 
3 17 17 30 26 26
5 17 25 25 30 35 35 68
7 12 20 53 53 53 85 95 95
8 15
9 05 05 26
Obtenha os quartis Q1 e Q3.
a. 5,25 e 7,95
b. 5,17 e 7,85
c. 5,21 e 7,90
d. 5,17 e 7,90
e. 5,21 e 7,85
Q1= = 6,25 → (5,17+5,25)/2 = 5,21
Q3= = 18,75 → (7,85+7,95)/2 = 7,90
Quantos são os anagramas da palavra PERNAMBUCO em que a expressão BOCA aparece?
a. 4.320
b. 5.040
c. 720
d. 3.628.776
e. 24
10 letras → 6 letras + 4 letras = _P_E_R_N_M_U_ . Assim boca pode alterar 7 posições.
7! = 5.040
Quantos são os anagramas da palavra PERNAMBUCO em que a expressão COR não aparece?
a. 3.628.798
b. 40.320
c. 4.320
d. 3.588.480
e. 3.628.800
10 letras → 10! = 3.628.800
7 letras + 3 letras = _P_E_N_A_M_B_U_
8! = 40.320
3.628.800 – 40.320 = 3.588.480
Quantos são os anagramas da palavra PERNAMBUCO que começam com a letra P e termina em vogal?
a. 362.880
b. 161.280
c. 40.320
d. 3.628.798
e. 4.320
Começar com P → P________E → 8! = 40.320
 P________A → 8! = 40.320
 P________U → 8! = 40.320
 P________O → 8! = 40.320
161.280
Considere o conjunto de dados a seguir:
45 45 56 56 56 56 63 63 63 63
63 78 78 78 80 80 80 80 95 95
Determine o Coeficiente de Assimetria:
a. 0,243
b. 0,241
c. 0,266
d. 0,395
e. 0,556
 = = 68,65
= 63
σ2 = = 204,2275
σ = = 14,29
e = = 0,395
Considere o conjunto de dados a seguir:
 2 2 7 7 7 7 13 13 13 13
13 20 20 20 23 23 23 23 27 27
Determine o Coeficiente de Variação:
a. 0,353
b. 0,518
c. 0,616
d. 0,644
e. 0,705
 = = 15,15
σ2 = = 61,9275
σ = = 7,85
CV = = 0,518
A probabilidade de um jogador de tênis vencer uma partida é 0,2.
Sabendo que ele irá jogar 7 partidas no próximo mês, determine a probabilidade de ele vencer apenas uma das 7 partidas.
a. 0,554543
b. 0,471819
c. 0,635476
d. 0,521825
e. 0,367002
1 chance de vencer e 6 de perder
0,2 vencer e 0,8 perder
P(x=1) = 
P(x=1) = 7 x 0,2 x 0,262 
P(x=1) = 0,36700
Das Usinas X, Y e Z são respectivamente 14%, 28% e 58% das peças produzidas por uma dada indústria. Os lotes delas oriundos têm 1,9%, 2,6% e 5,4% de peças defeituosas, respectivamente. Uma peça desta indústria é selecionada aleatoriamente.
Sabendo que esta peça é defeituosa, determine a probabilidade de ela ter sido produzida pela Usina Z.
a. 0,8470
b. 0,7433
c. 0,8589
d. 0,8048
e. 0,7591
A probabilidade de um indivíduo de classe X comprar um carro é 0,15, de um indivíduo de classe Y comprar um carro é 0,3 e de um indivíduo de classe Z comprar um carro é 0,55. A probabilidade de um indivíduo de classe X comprar um carro da marca A é 0,07, de um indivíduo de classe Y comprar um carro da marca A é 0,02 e de um indivíduo de classe Z comprar um carro da marca A é 0,06.
Em um dia que um carro seja vendido, qual a probabilidade que ele não seja da marca A?
a. 0,0495
b. 0,5285
c. 0,7775
d. 0,8405
e. 0,9505
Sindivíduo = {X, Y, Z} n = 3
A probabilidade de um jogador de tênis vencer uma partida é 0,4.
Sabendo que ele irá jogar 9 partidas no próximo mês, determine a probabilidade de ele vencer no máximo uma partida.
a. 0,075115
b. 0,258086
c. 0,070544
d. 0,339017
e. 0,175359
Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária:
Qual jornal você lê?
	
	A
	B
	(A e B)
	Total
	Menos de 16 anos
	6
	3
	8
	17
	Entre 16 e 21 anos
	18
	7
	17
	42
	Entre 22 e 30 anos
	14
	13
	8
	35
	Entre 31 e 45 anos
	9
	18
	17
	44
	Mais de 45 anos
	14
	1
	6
	21
	Total
	61
	42
	56
	159
Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ler o jornal A, dado que tem mais de 45 anos?
a. 0,088
b. 0,230
c. 0,667
d. 0,132
e. 0,384
Seja X uma variável aleatória com Distribuição Binomial de probabilidades com parâmetros n-6 e p-03,
Determine VAR(X).
a. 1,40
b. 1,47
c. 1,37
d. 1,26
e. 1,24
Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja:
X 2 6 8 12 13
p(x) 0,3 0,2 0,2 0,1 0,2
Determine E(X²):
a. 69,4
b. 68,0
c. 71,7
d. 68,6
e. 71,1
Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja:
X 1 5 8 10 14
p(x) 0,1 0,2 0,2 0,1 0,4
Determine P(5<X<14):
a. 0,6
b. 0,5
c. 0,4
d. 0,3
e. 0,9
Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária:
Qual jornal você lê?
	
	A
	B
	(A e B)
	Total
	Menos de 16 anos
	18
	12
	18
	48
	Entre 16 e 21 anos
	12
	11
	15
	38
	Entre 22 e 30 anos
	12
	2
	15
	29
	Entre 31 e 45 anos
	3
	8
	15
	26
	Mais de 45 anos
	8
	16
	8
	32
	Total
	53
	49
	71
	173
Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ter entre 22 e 45 anos?
a. 0,069
b. 0,318
c. 0,168
d. 0,150
e. 0,087
A probabilidade de um jogador de tênis vencer uma partida é 0,5. 
Sabendo que ele irá jogar 6 partidas no próximo mês, determine a probabilidade de ele vencer todas as 6 partidas.
a. 0,120438
b. 0,284100
c. 0,015625
d. 0,170449
e. 0,203167
Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária:
Qual jornal você lê?
	
	A
	B
	(A e B)
	Total
	Menos de 16 anos
	177
	9
	33
	Entre 16 e 21 anos
	12
	2
	5
	19
	Entre 22 e 30 anos
	10
	19
	12
	41
	Entre 31 e 45 anos
	10
	13
	17
	40
	Mais de 45 anos
	4
	13
	6
	23
	Total
	53
	54
	49
	156
Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ser leito do jornal A ou ter entre 16 e 21 anos?
a. 0,077
b. 0,385
c. 0,122
d. 0,340
e. 0,462
Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária:
Qual jornal você lê?
	
	A
	B
	(A e B)
	Total
	Menos de 16 anos
	15
	2
	16
	33
	Entre 16 e 21 anos
	6
	18
	5
	29
	Entre 22 e 30 anos
	14
	14
	5
	33
	Entre 31 e 45 anos
	14
	20
	4
	38
	Mais de 45 anos
	15
	1
	9
	25
	Total
	64
	55
	39
	158
Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ter ser leitor do jornal B e ter entre 31 e 45 anos?
a. 0,589
b. 0,241
c. 0,127
d. 0,462
e. 0,348
Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja:
X 2 5 8 11 13
p(x) 0,1 0,3 0,1 0,2 0,3
Determine E(X):
a. 9,7
b. 9,5
c. 6,9
d. 8,6
e. 9,1
A probabilidade de um jogador de tênis vencer uma partida é 0,6. 
Sabendo que ele irá jogar 8 partidas no próximo mês, determine a probabilidade de ele vencer pelo menos uma partida.
a. 0,999345
b. 0,730872
c. 0,894528
d. 0,994774
e. 0,811803
Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja:
X 3 5 9 10 
p(x) 0,4 0,3 0,2 0,1 
Determine VAR(X):
a. 5,95
b. 7,05
c. 7,55
d. 8,35
e. 8,85

Continue navegando