Buscar

Exercícios de Estatística Básica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

3.11 - EXERCÍCIOS
1 – A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém
as notas 7,5; 8,0; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, o
aluno foi aprovado ou não?
2 – A seguir é dada a distribuição da quantidade de defeitos por microcomputador para uma
amostra de 100 aparelhos:
0 1 2 3 4 5
15 28 20 14 10 7
Quantidade de defeitos por micro 6 Número de aparelhos 6
Determinar o número médio de defeitos por microcomputador.
3 – Calcular a média para cada uma das distribuições:
4 –
Tem-se R$2000,00 disponíveis mensalmente para compra de determinado artigo que custou
nos meses de junho, julho e agosto, respectivamente: R$100,00; R$200,00; e R$400,00. Qual
foi o custo médio do artigo para este período?
5 – Uma urna contém 100 fichas. Dez apresentam o número 5, trinta apresentam o número 10,
vinte apresentam o número 15 e quarenta apresentam o número 20. Determine a média
aritmética dos números apresentados nas fichas.
6 – Um sorveteiro vendeu, nas quatro últimas semanas, 1500, 1300, 1100 e 1800 picolés.
Qual foi a quantidade média vendida na semana?
7 – Um estudante realizou uma pesquisa sobre a remuneração semanal de auxiliares
financeiros em empresas de transporte. Uma amostra formada por cinco empresas revelou os
seguintes dados: $200,00; $250,00; $280,00; $320,00; $4200,00. Pede-se: a) calcule a média;
b) uma remuneração igual a $330,00 pode ser considerada alta ou baixa?
23
8 – Calcule a mediana da seguinte amostra: {3; 4; 5; 7; 8; 10}.
9 – Os valores referentes a sinistros ocorridos e, posteriormente, pagos por uma seguradora no
mês passado foram iguais a {$400,00; $1300,00; $700,00; $950,00; $8000,00}. Calcule a
média e a mediana. O que pode ser dito em relação aos valores encontrados? 10 – A seguir
estão apresentados os números de funcionários de empresas que prestam serviços de limpeza.
Qual a mediana dos valores apresentados?
Classes Fi
1 |- 11 9
11 |- 21 14
21 |- 31 35
31 |- 41 22
41 |- 51 11
Soma 91
11 – A tabela a seguir apresenta a distribuição das importações de uma empresa de plásticos.
Pede-se calcular a moda, a média e a mediana.
Volume importado Fi
50.000 |- 60.000 5
60.000 |- 70.000 10
70.000 |- 80.000 20
80.000 |- 90.000 10
90.000 |- 100.000 5
Soma 50
12 – Uma pesquisa com 36 funcionários da rede de lojas Preço Baixo Ltda. revelou os salários
apresentados na tabela seguinte. Calcule a média, a mediana e a moda.
49
7
49
7
49
9
50
0
50
1
50
4
50
5
50
6
50
8
50
8
50
8
50
8
51
0
51
1
51
1
51
1
51
1
51
2
51
2
51
3
51
3
51
3
51
4
51
6
51 52 52 52 52 52
8 0 0 3 4 4
52
5
52
6
52
8
52
9
53
0
53
3
13 – Com base nos dados da tabela seguinte, calcule: a) média; b) mediana; c) 1ºquartil; d) 3º
decil; e) 60º percentil; f) moda.
Classes Fi
4 |- 6 4
6 |- 8 11
8 |- 10 15
10|- 12 5
Soma 35
24
4 – MEDIDAS DE DISPERSÃO
São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão,
dos valores em torno da média. Servem para medir a representatividade da média. Por
exemplo, sejam as séries a): {20, 20, 20} e b): {0, 20, 40}, temos que as duas têm média igual
(20), porém, a série a) não possui dispersão em torno da média, enquanto a série b) apresenta
dispersão em torno da média.
4.1 – AMPLITUDE TOTAL
É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série.
Sua utilização como medida de dispersão é limitada, pois, sendo uma medida que depende
apenas dos valores externos, não capta possíveis variações entre esses limites.
Amplitude total (R) para dados não agrupados: Ex.: para a série : {10, 12, 20, 22, 25,
33, 38}, R = 38-10 = 28.
Amplitude total (R) para dados agrupados:
Classe Fi
4 |- 9 8
9 |- 14 12
14 |- 19 17
19|- 24 3
Soma 40
R = Lmax – lmin = 24-4 = 20.
4.2 – VARIÂNCIA AMOSTRAL
Como se deseja medir a dispersão dos dados em relação à média, é interessante
analisar os desvios de cada valor (xi) em relação à média x, isto é: (xi – x). Se as diferenças
forem baixas, teremos pouca dispersão.
A variância é dada por:
Para dados agrupados, a variância é:
EXEMPLO: Calcular a variância para as medidas amostrais abaixo:
25
xi - x
xi (xi - x)
2
3
7
2
1
8
n = 5
EXEMPLO 2: Calcular a variância:
PMi Fi PMi . Fi (PMi -
x)
(PMi - x)2
10 1 10
20 3 60
30 4 120
40 3 120
50 4 200
- 15 510 -
Classes (PMi - x)2 . Fi 5 |- 15
15 |- 25
25 |- 35
35 |- 45
45 |-| 55
Soma
26
4.3 – DESVIO PADRÃO AMOSTRAL
O cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à
média. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser
expressa em m2. Ou seja, a variância é expressa pelo quadrado da unidade de medida da
variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável,
calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão que será expresso na
unidade de medida original. Assim: S = √S2
4.4 – COEFICIENTE DE VARIAÇÃO
Trata-se de uma medida relativa de dispersão. Enquanto a amplitude total (R), a
variância (S2) e o desvio padrão (S) são medidas absolutas de dispersão, o coeficiente de
variação (CV) mede a dispersão relativa.
As medidas de dispersão relativa analisam a média e o desvio padrão de uma única
vez, através do cálculo da razão existente entre ambos. A mais usual medida de dispersão
relativa é o coeficiente de variação, representado pela razão entre o desvio padrão e a média
aritmética.
Assim: CV = S x 100
x
EXEMPLO: Em uma empresa, o salário médio dos homens é de $4000,00, com desvio
padrão de $1500,00, e o salário médio das mulheres é de $3000, com desvio padrão de
$1200,00. A dispersão relativa dos salários é maior para quem?
27
4.5 - EXERCÍCIOS
1 – A produção de manteiga dos últimos seis meses do Laticínio Sabor do Leite Ltda. foi, em
toneladas por mês: {11; 8; 4; 10; 9; 12}. Com base nos números apresentados, calcule: a) a
média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação. 2 –
As vendas mensais em toneladas de uma fábrica de tecidos sãos: {1; 2; 2; 1; 1; 3; 1; 1; 1; 1}.
Calcule a média, a variância, o desvio padrão, a amplitude total e o coeficiente de variação.
3 – A indústria de Queijos Mineiros Ltda. extraiu uma amostra composta por 20 produtos. Os
pesos encontrados (em gramas) foram iguais a: {1040; 950; 1100; 980; 1100; 1010; 1010;
900; 1005; 1015; 1030; 910; 1010; 1015; 1030; 910; 1050; 930; 950; 910}. Calcule: a) a
média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação.
4 – Os dados a seguir apresentam a quantidade (em milhares) de passageiros transportados em
diferentes épocas do ano por uma grande empresa de transporte urbano. Com base nos
números apresentados, pede-se obter: a) a média; b) a variância; c) o desvio padrão; d) a
amplitude total; e) o coeficiente de variação.
Classes Fi
1,5 |- 4,5 5
4,5 |- 7,5 10
7,5 |- 10,5 12
10,5 |- 13,5 6
13,5 |-| 16,5 7
Soma 40
5 – Os dados apresentados referem-se às idades de usuários de uma lan house da cidade. Com
base nos números fornecidos, pede-se encontrar: a) a média; b) a variância; c) o desvio
padrão; d) a amplitude total; e) o coeficiente de variação.
Classes Fi
5 |- 15 2
15 |- 25 7
25 |- 35 20
35 |- 45 5
45 |- 55 4
55 |- 65 2
Soma 40
6 – Um fabricante de caixas de papelão fabrica três tipos de caixas. Testa-se a resistência de
cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a pressão necessária
para romper cada caixa. Os resultados dos testes são:
28
A B
150 200
40 50
Tipos de caixas C
Pressão média de ruptura 300
Desvio padrão das pressões 60
a) Que tipo de caixa apresenta a menor variação absoluta na pressão de ruptura?
b) Que tipo de caixa apresenta a maior variação relativa na pressão de ruptura?
7 – Os dados seguintes referem-se a uma pesquisa feita com sete clientes da Mercearia Ltda.,
escolhidos ao acaso. Calcule: a) a média; b) a variância; c) o desvio padrão; d) a amplitudetotal; e) o coeficiente de variação.
Rend
a
49 700
22 650
30 8000
31 350
74 650
49 840
31 420
Cliente Idade Despesa Média
A 60
B 90
C 60
D 50
E 80
F 90
G 40
8 – Um pesquisador aborda 30 transeuntes ao acaso e pergunta-lhes a idade. O resultado é
dado pela tabela:
35 26 39 25 39 22 42 40 30 22
21 40 16 32 39 21 28 39 18 37
23 14 27 44 30 32 21 15 26 43
a) Resumir as informações sob a forma de distribuição de frequência.
b) Apresentar os dados na forma de um histograma.
c) Calcular a média, o desvio padrão e o coeficiente de variação.
29
5 – MEDIDAS DE ASSIMETRIA E CURTOSE
5.1 - ASSIMETRIA
Quando uma distribuição é simétrica, as medidas de média, mediana e moda
coincidem. Porém, a assimetria torna-as diferentes e essa diferença é tanto maior quanto
maior é a assimetria. Assim, em uma distribuição em forma de sino, temos: distribuição
simétrica, a média e a moda coincidem; distribuição assimétrica à esquerda ou negativa, a
média é menor que a moda; e assimétrica à direita ou positiva, a média é maior que a moda:
Baseando-nos nessas relações entre a média e a moda, podemos empregá-las para determinar
o tipo de assimetria. Assim. calculando o valor da diferença: x Mo − Se:
x Mo − = 0 , assimetria nula ou distribuição simétrica.
x Mo − < 0 , assimetria negativa ou à esquerda.
x Mo − > 0 , assimetria positiva ou à direita.
Ainda, tem-se o coeficiente de assimetria que é dado por:
3( ) x Md As
s
− =
Se 0,15 1 < < As , a assimetria é considerada moderada; se As >1, a assimetria é forte;
se As = 0 a distribuição é simétrica.
5.2 - CURTOSE
Denominamos curtose o grau de achatamento de uma distribuição em relação a uma
distribuição padrão, denominada curva normal.
30
Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal
(ou mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a
distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais achatada
na sua parte superior), ela é chamada platicúrtica.
A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica.
O coeficiente percentílico da curtose é dado por:
Q Q CP P
− = −
3 1
90 10 2( )
Uma vez que C = 0, 263 para uma curva normal, temos a seguinte classificação:
C
=
C
<
C
>
5.3 - EXERCÍCIOS
0, 263, curva mesocúrtica; 0,
263, curva leptocúrtica; 0, 263,
curva platicúrtica.
1 - Considere os seguintes resultados relativos a três distribuições de
freqüência:
Determine o tipo de assimetria de cada uma delas.
2 - Uma distribuição de freqüência apresenta as seguintes medidas: x Md s = = = 48,1, 47,9 e
2,12 . Calcule o coeficiente de assimetria.
3 - Em uma distribuição de freqüência foram encontradas as seguintes medidas: x Mo Md s =
= = = 33,18, 27,50, 31,67 e 12, 45 . a) Classifique o tipo de assimetria; b) Calcule o
coeficiente de assimetria.
4 - Considerando a distribuição de freqüência relativa aos pesos de 100 operários de uma
fábrica, determine o grau de assimetria:
31
5 - Considere as seguintes medidas, relativas a três distribuições de freqüência:
a) Calcule os respectivos graus de curtose.
b) Classifique cada uma das distribuições.
6 - Determine o grau de curtose e classifique a distribuição em relação à curva
normal:
32
6 – DISTRIBUIÇÃO NORMAL E BINOMIAL
6.1 - DISTRIBUIÇÃO DE PROBABILIDADE
Consideremos a distribuição de freqüências relativa ao número de acidentes diários em
um estacionamento:
Em um dia, a probabilidade de:
- não ocorrer acidentes é:
22 0,73
30 p = =
- ocorrer um acidente é:
5 0,17
30 p = =
- ocorrer dois acidentes é:
2 0,07
30 p = =
- ocorrer 3 acidentes é:
1 0,03
30 p = =
Podemos então escrever a tabela de distribuição de probabilidade:
Analisando outro caso, se o espaço amostral relativo ao "lançamento simultâneo de duas
moedas" é S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co) } e se X representa "o número de
caras" que aparecem, a cada ponto amostral podemos associar um número para X:
33
Assim, temos:
E podemos escrever:
Ao definir a distribuição de probabilidade, estabelecemos uma correspondência
unívoca entre os valores da variável aleatória X e os valores da variável P. Esta
correspondência define uma função; os valores xi (i = 1, 2, ... , n) formam o domínio da função
e os valores pi (i = 1, 2, 3, ... , n), o seu conjunto imagem.
Essa função é denominada de função probabilidade e define a distribuição de
probabilidade da variável aleatória X. Pode ser representada por: () ( )i f x PX x = = . Desta
forma, ao lançarmos um dado. a variável aleatória X, definida por "pontos de um dado", pode
tomar os valores 1, 2, 3, ... , 6. Como a cada um destes valores está associada uma e uma só
probabilidade de realização e
()1 ∑P xi = , fica definida uma função de probabilidade, da qual
resulta a seguinte distribuição de probabilidade:
6.2 - DISTRIBUIÇÃO BINOMIAL
Vamos, neste item, considerar experimentos que satisfaçam as seguintes condições: a.
O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n). b. As
provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os
resultados das sucessivas.
34
c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. d. No
decorrer do experimento, a probabilidade p do sucesso e a probabilidade qq p (1) = − do
insucesso manter-se-ão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos
em n tentativas. O experimento "obtenção de caras em cinco lançamentos sucessivos e
independentes de uma moeda" satisfaz essas condições.
Sabemos que, quando da realização de um experimento qualquer em uma única
tentativa, se a probabilidade de realização de um evento (sucesso) é p, a probabilidade de não
realização desse mesmo evento (insucesso) é 1− = p q .
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela
função:
() ( ) k nk n
f x PX k pq k− = = = 
na qual: PX k ( ) = é a probabilidade de que o evento se realize k vezes em n provas; p é a
probabilidade de que o evento se realize em uma só prova - sucesso; q é a probabilidade de
que o evento não se realize no decurso dessa prova - insucesso;
n
k é o coeficiente
binomial de n sobre k, igual a !
n
knk − .
!( )!
Essa função, denominada lei binomial, define a distribuição binomial.
6.2.1 - Exercícios
1 - Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem
obtidas 3 caras nessas 5 provas.
2 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A
ganhar 4 jogos.
3 - Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. 4 -
Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas
vezes.
5 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time
A:
a. ganhar dois ou três jogos;
35
b. ganhar pelo menos um jogo.
6 - A probabilidade de um atirador acertar o alvo é
2
3. Se ele atirar 5 vezes, qual a
probabilidade de acertar exatamente 2 tiros?
7 - Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10%
de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?
6.3 - DISTRIBUIÇÃO NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das mais
empregadas é a distribuição normal.
Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à
distribuição normal ou dela se aproximam.
O aspecto gráfico de uma distribuição normal é o da figura a seguir:
Figura 1 - Representação gráfica da distribuição normal
Para uma perfeita compreensão da distribuição normal, observe a figura anterior e
procure visualizar as seguintes propriedades:
1ª) A variável aleatória X pode assumir todo e qualquer valor real.
2ª) A representação gráfica da distribuição normal é uma curva em formade sino, simétrica
em torno da média ( x ), que recebe o nome de curva normal ou de Gauss. 3ª) A área total
limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à
probabilidade de a variável aleatória X assumir qualquer valor real. 4ª) A curva normal é
assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das
abscissas sem, contudo, alcançá-lo.
5ª) Como a curva é simétrica em torno de x , a probabilidade de ocorrer valor maior do que a
média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5. Escrevemos: P(X > x ) = P(X < x ) = 0,5.
36
Quando temos em mãos uma variável aleatória com distribuição normal, nosso
principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um
determinado intervalo. Vejamos como proceder, por meio de um exemplo concreto.
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por
certa máquina. Vamos supor que essa variável tenha distribuição normal com média x = 2 cm
e desvio padrão s = 0,04 cm.
Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro
com valor entre 2 e 2,05 cm.
É fácil notar que essa probabilidade, indicada por: P(2 < X < 2,05), corresponde à área
hachurada na Figura a seguir:
Figura 2 - Representação de probabilidade na curva normal
Se X é uma variável aleatória com distribuição normal de média x e desvio-padrão s,
então a variável:
z
s
− =
x x
tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio-padrão
1.
As probabilidades associadas à distribuição normal padronizada são encontradas na
Tabela 1. Esta é uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z
tomar qualquer valor entre a média 0 e um dado valor z, isto é: P(0 < Z < z).
Temos, então, que se X é uma variável aleatória com distribuição normal de média x e
desvio padrão s, podemos escrever:
P( x < X < x) = P(0 < Z < z)
com
z
s
− =
x x
37
Tabela 1 - Área sob a curva normal reduzida de 0 a z.
38
Voltemos ao problema apresentado. Queremos calcular P(2 < X < 2,05). Para obter
essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x =
2,05 (se x = 2 ⇒ z = 0, pois x = 2). Temos, então:
z
s
− − = = = =
x x
assim: P(2 < X < 2,05) = P(0 <
Z < 1,25)
2,05 2 0,05 1, 25
0,04 0,04
Procuremos, agora, na Tabela 1 o valor de z = 1,25.
Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o
valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e
coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z <
1,25) = 0,3944
Assim. a probabilidade de um parafuso fabricado por essa máquina apresentar um
diâmetro entre a média x = 2 e o valor x = 2,05 é 0,3944.
Escrevemos. então: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 = 39,44%
6.3.1 - Exercícios
1 - Determine as probabilidades e represente graficamente:
a) P Z ( 1, 25 0) − <<
b) P Z ( 0,5 1, 48) − <<
c) P Z (0,8 1, 23) < <
d) P Z( 0,6) >
e) P Z( 0,92) <
39
2 - Os salários semanais dos operários industriais são distribuídos normalmente, em torno da
média de R$ 500, com desvio padrão de R$ 40. Calcule a probabilidade de um operário ter
um salário semanal situado entre R$ 490 e R$ 520.
3 - Sendo Z uma variável com distribuição normal reduzida, calcule:
a. P(0 < Z < 1,44)
b. P( −0,85 < Z < 0)
c. P( −1,48 < Z < 2,05)
d. P(0,72 < Z < 1,89)
e. P(Z > −2,03)
f. P(Z > 1,08)
g. P(Z < −0,66)
h. P(Z < 0,60)
4 - Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio
padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a. maior
que 120;
b. maior que 80;
c. entre 85 e 115;
d. maior que 100.
5 - Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio
padrão 5,5 kg. Determine o número de estudantes que pesam:
a. entre 60 e 70 kg;
b. mais que 63,2 kg;
c. menos que 68 kg.
6 - A duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de
40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse
componente durar:
a. entre 700 e 1.000 dias;
b. mais de 800 dias;
C. menos de 750 dias.
40
7 – AMOSTRAGEM
A amostragem costuma ter o objetivo principal de permitir a síntese de informações
acerca de um conjunto maior de dados, o universo ou população, por meio de uma parte,
geralmente denominada amostra. As vantagens da amostragem consistiriam, geralmente, na
redução de custos e tempos do estudo – uma análise de menor quantidade de elementos
permite gastos menores, além de coleta e análise mais rápidas.
Nos procedimentos da amostragem geralmente empregados em Estatística, um
cuidado básico deve ser tomado. A amostra deve ser representativa da população. Com base
nos dados de uma amostra representativa e empregando procedimentos estatísticos
apropriados, é possível inferir ou generalizar as conclusões obtidas da amostra para a
população.
Os estudos estatísticos podem ser feitos de duas maneiras básicas: o censo – quando se
estuda toda a população, como no caso do censo do Instituto Brasileiro de Geografia e
Estatística – e a amostragem – quando se seleciona uma parte do todo para estudar.
Quando se deseja generalizar os dados de uma amostra para o universo, deve-se
observar uma condição básica e fundamental: a amostra deve ser representativa do universo.
Para se definir o tamanho da amostra, para populações finitas utiliza-se a seguinte equação:
⋅ ⋅⋅− = −⋅ + ⋅⋅−
NZ p p nN eZp p
2
(1 )
( 1) (1 )
2 2
onde: n é o tamanho da amostra; N é o tamanho do universo; Z é o valor tabulado
correspondente ao nível de confiança (por exemplo: Z = 1,96, para um nível de confiança de
95%); e é a margem de erro máximo que eu quero admitir; e p é a proporção que esperamos
encontrar, sendo considerada igual a 0,5 nos casos em que não temos nenhuma informação
sobre o valor que esperamos encontrar.
Quando trabalhamos com universos de tamanhos muito grandes (a partir de 100.000
indivíduos), considerados infinitos, podemos simplificar a equação anterior:
⋅⋅− =
Zp p (1 )
2
ne 2
Na Tabela 2 encontramos o tamanho das amostras. Nela estão descritos o tamanho do
universo, o nível de confiança e o erro inferencial. Normalmente utiliza-se um nível de
confiança de 95% e um erro inferencial de 5%. A situação para a utilização desta tabela
ocorre quando se trabalha com variáveis qualitativas ordinais ou nominais, variáveis
41
quantitativas, e a população finita de tamanho conhecido. Esta é a situação da maioria dos
estudos em Ciências Sociais, como a Administração.
Tabela 2 - Tamanho da amostra.
42
Uma vez determinado o tamanho da amostra, o método de seleção probabilístico mais
simples é aquele que utiliza a amostragem aleatória.
A amostragem aleatória, ou amostragem aleatória simples, consiste em uma das
principais maneiras de extrair uma amostra de qualquer população. Sendo representativa, deve
objetivar o cumprimento da exigência básica de que cada elemento da população tenha as
mesmas chances de ser escolhido para fazer parte da amostra.
Para uma população finita, a amostragem aleatória pode ser obtida de duas formas. A
primeira forma consiste basicamente na organização dos elementos da população em uma
lista, sendo, posteriormente, utilizado um processo aleatório para escolha dos elementos que
farão parte da amostra. A segunda forma de escolha é adequada para elementos que são
difíceis de ser identificados, tornando-se impossível listar a população para então aplicar um
processo para escolha dos itens que farão parte da amostra. Nestes casos, deve-se adequar um
intervalo, uma medida como base, no lugar dos itens para se fazer uma avaliação.
Para uma população finita muito grande, as formas de se obter uma amostra aleatória
tornam-semais desafiadoras. Uma das soluções se dá por meio do processo probabilístico, em
que se registram todos os casos na ordem em que eles vão aparecendo. É muito mais fácil
obter amostras aleatórias a partir de populações finitas, em que os elementos podem ser
contados e identificados.
Por exemplo, imagine que um pesquisador necessitasse extrair uma amostra aleatória
simples formada por cinco pessoas extraídas do universo de 28 alunos representado no quadro
seguinte:
Para selecionar aleatoriamente os alunos utiliza-se a Tabela de Números Aleatórios
(Tabela 3) que nada mais é que os números {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} distribuídos de forma
indistinta ou aleatória.
43
Tabela 3 - Tabela de Números Aleatórios.
Como existem 28 alunos, devem ser lidos os números na tabela aleatória de dois em dois
algarismos. Escolhendo de forma aleatória a segunda linha da tabela, os números sorteados
seriam: 08 – 13 – 67 – 90 – 68 – 58 – 14 – 89 – 26 – 69 – 37 – 43 – 19 – 01 – 49 – 71 – 82 –
80. Como apenas os números compreendidos entre 00 e 27 estão listados no universo,
somente os cinco primeiros valores sorteados entre estes intervalos poderiam ser
selecionados. Seriam escolhidos, nesta sequência, os números: 08 – Mariana; 13 – Maria; 14 –
Neila; 26 – Patrícia; e 19 – Ana.
Além dos métodos probabilísticos de amostragem existem também os métodos não
probabilísticos. Neste caso, não existe a manutenção ou tentativa de manutenção da
representatividade. A amostragem não probabilística apresenta gastos menores e pode ser
44
executada em menos tempo. Em amostragens deste tipo, não é necessário utilizar uma lista
com todos os elementos contidos na população.
Dentre os principais métodos empregados para a seleção de amostras não
probabilísticas, cita-se:
• Amostragem acidental ou por conveniência: neste tipo de amostragem, os elementos da
amostra são escolhidos por serem os mais acessíveis ou fáceis de ser estudados. •
Amostragem por julgamento: neste processo, os elementos são selecionados para a
amostra segundo o parecer de um especialista no assunto. Este julga aqueles mais
apropriados para o estudo em questão.
• Amostragem intencional ou proposital: o pesquisador escolhe propositalmente os
elementos que farão parte da amostra.
7.1 - EXERCÍCIOS
1 – O que é amostra? Qual sua relação com população?
2 – Qual a diferença entre amostragem probabilística e amostragem não probabilística? 3 –
Uma empresa de pesquisa eleitoral foi contratada por um partido político com o objetivo de
investigar a preferência dos eleitores pelo candidato da situação na próxima eleição
presidencial. Será utilizado um nível de confiança igual a 95% e um erro máximo igual a 4%.
Calcule os tamanhos das amostras necessárias nos seguintes casos:
Município Universo de eleitores
Gigantópolis muito grande, considerado infinito
Miracema 5000
Bela Morada 30000
4 – Uma empresa está realizando uma pesquisa de satisfação com seus funcionários. Para
tanto, vai coletar uma amostra referente a 30% do total de funcionários. Sabendo-se que o seu
setor possui 30 funcionários, quantos e quais serão os entrevistados? A tabela a seguir
apresenta o nome dos funcionários do seu setor. Utilize a Tabela de Números Aleatórios.
45
8 – CORRELAÇÃO E REGRESSÃO LINEAR
A análise de regressão e correlação tem como objetivo estimar numericamente o grau
de relação que possa ser identificado entre populações de duas ou mais variáveis, a partir da
determinação obtida com base em amostras selecionadas destas populações focalizadas.
Como exemplo considere o exemplo de uma rede de lojas de confecções que coletou
uma amostra de dados passados referentes a seus gastos com publicidade ($mil) e seu volume
de vendas ($mil).
Vendas versus gastos com publicidade de loja de confecções
Gastos com Publicidade
($mil)
3 4 8 12 14
Vendas ($mil) 7 14 15 28 32
35
30
25
s
a
d
n
e
V
20
15
10
5
0
0 2 4 6 8 10 12 14 16 Gastos com
publicidade
8.1 – REGRESSÃO LINEAR SIMPLES
A análise de regressão linear simples tem por objetivo obter a equação matemática da
reta que representa o melhor relacionamento numérico linear entre o conjunto de pares de
dados em amostras selecionadas, dos dois conjuntos de variáveis. A equação da reta obtida
pode ser apresentada como: y = a + b.x , sendo y a variável dependente (explicada) e x a
variável independente (explicativa).
Para se definir os termos a e b da equação, usa-se as seguintes funções:
Veja o exemplo que relaciona os gastos em publicidade com as vendas, anteriormente
apresentado:
46
Gastos com Publicidade ($mil) Vendas ($mil) x2 y2 xy
3 7 9 49 21
4 14 16 196 56
8 15 64 225 120
12 28 144 784 336
14 32 196 1024 448
∑x = 41 ∑y = 96 ∑x2 =
429
∑y2 =
2278
∑xy =
981
Aplicando-se as fórmulas:
Com base nos valores obtidos para a e b, é possível determinar que a reta que melhor
ajusta os pontos é: y = 2,0754 + 2,0884x.
Com essa função pode-se fazer previsões das vendas em relação à quantia que
pretende-se investir em publicidade.
35
s
a
d
n
e
V
y = 2,074 + 2,0884x
30
25
20
15
10
5
0
0 2 4 6 8 10 12 14 16 Gastos com
publicidade
8.2 - CORRELAÇÃO
A análise de correlação determina um número que expressa uma medida numérica do
grau da relação encontrada entre duas variáveis. Seu sinal pode ser positivo ou negativo e sua
faixa de variação está compreendida entre -1 e 1. O coeficiente de correlação indica o grau da
47
relação numérica linear obtida, ou o grau de ajuste de uma reta ao conjunto dos pontos da
amostra.
O coeficiente de correlação (r) pode ser calculado pela seguinte
equação:
Aplicando ao exemplo anterior, teremos:
A partir do r pode-se calcular o coeficiente de determinação, ou simplesmente r2, que
além de expressar o quadrado do coeficiente de correlação, representa a relação entre a
variação explicada pelo modelo e a variação total.
Para os dados apresentados anteriormente, temos: r2 = 0,9648 x 0,9648 = 0,9308. De
modo geral, para valores de r2 iguais ou superiores a 0,60, diz-se que o ajuste linear apresenta
uma boa qualidade.
8.3 – EXERCÍCIOS
1 – A Lojas Barateiras possui cinco lojas, situadas nos estados de São Paulo, Rio de Janeiro,
Minas Gerais, Rio Grande do Sul e Santa Catarina. Alguns dados da loja estão apresentados
na tabela seguinte:
SP RJ MG RS
18 12 10 16
16 11 10 14
Loja SC
Número de vendedores 13
Vendas (em $ mil) 12
A empresa acredita que o volume de vendas seja uma função linear do número de
vendedores de cada loja. Pede-se construir um modelo de ajuste linear. Utilizando o modelo
encontrado, qual seria a previsão de vendas para 19, 20 e 21 vendedores? 2 – Um professor
resolveu analisar as notas de uma amostra formada por oito alunos. Os dados coletados estão
apresentados na tabela seguinte. Pede-se: a) construa um modelo de ajuste linear entre os
pontos; b) calcule o coeficiente de determinação e comente a qualidade do ajuste; c) calcule a
nota esperada na prova para um aluno que obteve nota seis no teste.
48
Teste 7 5 10 3 8 9 7 5
Prova 10 7 10 5 12 10 10 6
3 – Uma empresa resolveu comparar o número de horas de treinamento preventivo com o
número de acidentes verificados nas suas instalações. Obteve os números apresentados na
tabela seguinte. Pede-se: a) construa um modelo de ajuste linear entre os pontos; b) calcule o
coeficiente de determinação e comente a qualidade do ajuste.
Treinament
o
14 12 18 25 32 44 17 28
Acidentes 49 52 45 46 41 35 49 44
4 – Uma empresa está estudando como varia a demanda de certo produto em função do seu
preço de venda. Para isso levantou as seguintes informações:
Mês Unidades Vendidas (y) Preços de vendas (x) por unidade
Jan. 250 R$ 163,00
Fev. 275 R$ 159,00
Mar. 300 R$ 175,00
Abr. 225 R$ 180,00
Maio 247 R$ 165,00
Com base nestes dados, mostrar que a demanda do produto decresce linearmente com
o acréscimo de preço.
5 – Uma rede de lojas de departamento suspeitava que em duas das suas oito filiais poderiam
estar ocorrendo fraudes, com o desvioirregular de faturamento. A direção acreditava que as
vendas das lojas poderiam ser explicadas, fundamentalmente, pelo seu tamanho. Os principais
dados das lojas estão apresentados na tabela seguinte:
Loja Tamanho em m2 Vendas em $
1 1200 85000,00
2 800 71000,00
3 600 71000,00
4 450 65000,00
5 900 75500,00
6 950 75600,00
7 750 73250,00
8 500 69500,00
Com base nos dados anteriores e na aplicação das técnicas de regressão e correlação,
estime em quais lojas podem estar acontecendo problemas.
6 – Uma empresa de itens de borracha apresenta, na tabela abaixo, a produção e os custos
associados a cada mês de produção. Analisou-se esses dados utilizando uma série histórica
dos custos relacionados à produção de um único produto, ocorridos no ano de 2002. Com
base nos dados apresentados pede-se: a) construa um modelo de ajuste linear entre os pontos;
49
b) calcule o coeficiente de determinação; faça a projeção dos custos utilizando os mesmos
dados de produção do ano 2002 com o modelo construído.
Mês Produção Custo Total
Jan 1750 R$
50.230,00
Fev 1900 R$
50.500,00
Mar 2220 R$
58.320,00
Abr 2220 R$
58.320,00
Mai 3000 R$
62.710,00
Jun 3000 R$
62.710,00
Jul 3000 R$
62.710,00
Ago 2000 R$
56.900,00
Set 1950 R$
50.600,00
Out 1000 R$
48.010,00
Nov 660 R$
37.000,00
Dez 600 R$
37.000,00
50
REFERÊNCIAS
BRUNI, A. L. Estatística Aplicada à Gestão Empresarial. 2.ed. São Paulo: Atlas,
2010. CRESPO, A. A. Estatística Fácil. 18 ed. São Paulo: Saraiva, 2002.
COSTA, S. F. Introdução Ilustrada à Estatística. 3. ed. São Paulo: Harbra, 1998.
MARTINS, G. A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2010.

Outros materiais