Buscar

Unid II Estatistica Aplicada

Prévia do material em texto

Unidade II
ESTATÍSTICAAPLICADAESTATÍSTICA APLICADA
Prof. Mauricio Fanno
AmostragemAmostragem
 Amostra é um subconjunto finito da população.
 Quando pesquisamos toda a população, temos um censo.
 Quando pesquisamos parte da população, temos uma 
pesquisa por amostragem.
 Amostragem, fundamentalmente, é o processo de colher 
amostras, estudá-las, determinando suas medidas 
estatísticas e, com base nesse estudo, induzir osestatísticas e, com base nesse estudo, induzir os 
parâmetros populacionais.
EstimaçãoEstimação
 Uma grandeza calculada com base em uma amostra 
é chamada de estatística.
 Essa mesma grandeza, calculada sobre toda a população, 
é um parâmetro.
 O processo de estimação consiste em calcular estatísticas em O processo de estimação consiste em calcular estatísticas em 
uma amostra para estimar os parâmetros populacionais 
correspondentes.
 Essa estimação sempre estará sujeita a um erro ou a uma 
margem de erro.
 Quanto maior for a amostra, menor será a margem de erro.
Estatísticas e parâmetrosEstatísticas e parâmetros
 Duas grandezas são particularmente importantes nesse 
processo de inferência: a média aritmética e o desvio padrão.
 A média aritmética da amostra é indicada por ,
enquanto a média da população será indicada por .
 O desvio padrão da amostra será indicado por S
x
 O desvio padrão da amostra será indicado por S, 
enquanto o desvio padrão da população será indicado por .
 A média da amostra é um estimadorA média da amostra é um estimador 
imparcial e eficiente da média populacional.
Distribuição amostralDistribuição amostral
 Admita que vamos retirar de uma população todas as 
amostras possíveis de tamanho N. 
 Para cada amostra, vamos calcular a sua média aritmética.
 Temos, então, uma distribuição amostral das médias.
 A média aritmética da distribuição amostral das médias 
é igual à média da população.
Distribuição amostral - exemploDistribuição amostral - exemplo
Já o desvio padrão da distribuição amostral das médias 
é dado por: 
Nx
 
 Exemplo 1: Sabemos que a altura média de 5.000 estudantes 
do sexo masculino é de 1,728 m com desvio padrão de 
0,067 m. Desse grupo, retiramos 100 amostras de 300,067 m. Desse grupo, retiramos 100 amostras de 30 
estudantes cada uma, com reposição. Qual é a média da 
distribuição amostral das médias e qual é o desvio padrão da 
distrib ição amostral das médias?distribuição amostral das médias?
SoluçãoSolução
 A média da distribuição amostral das médias é igual à média 
da população, ou seja, 1,728 m.
O desvio padrão da distribuição amostral das médias será:
067,0 012,0
30
067,0 x
 Obs.: embora não estejamos considerando todas as amostras 
possíveis, o número de amostras é elevado, o que torna 
o resultado confiável.o resultado confiável.
População finitaPopulação finita
Para populações finitas e amostragens sem reposição, o cálculo 
do desvio padrão tem de conter um fator de correção:
1
 px N
NN
N

 Sendo Np o número de elementos da população e N o número 
de elementos da amostra
1pNN
de elementos da amostra.
 O desvio padrão da distribuição amostral de uma grandeza 
estatística é frequentemente denominadoestatística é frequentemente denominado 
seu erro padrão.
Exemplo 2Exemplo 2
 Uma empresa com 4.000 funcionários paga um salário médio 
de R$ 1.500,00 com desvio padrão de R$ 300,00. Foram 
obtidas 80 amostras de 30 funcionários e verificados os seusobtidas 80 amostras de 30 funcionários e verificados os seus 
salários. Calcule a média da distribuição amostral das médias 
e o desvio padrão da distribuição amostral das médias, 
sabendo que as amostras foram obtidas sem reposição.
Solução: a média da distribuição amostral das médias é igual à 
édi d l ã j R$ 1 500 00média da população, ou seja, R$ 1.500,00.
Exemplo 2Exemplo 2
O desvio padrão da distribuição amostral das médias 
será dado por:
300004300 23,5499,077,54
1000.4
30000.4
30
300 
x
 Observe que usamos o fator de correção do desvio padrão 
para amostras sem reposição.
RespostaResposta
c) 15
A média da distribuição amostral das médias é igual à média da 
população, logo:
1575212014128  15
55x

Distribuição amostral de proporçõesDistribuição amostral de proporções
 Admita-se que uma população é infinita e que a probabilidade 
da ocorrência de um evento (sucesso) é p, enquanto a de sua 
não ocorrência é q (q = 1 p)não ocorrência é q (q = 1 – p).
 Considerem-se todas as amostras possíveis de tamanho N 
extraídas de uma população e, para cada amostra,extraídas de uma população e, para cada amostra, 
determinemos a proporção P de sucessos. 
Então, obtém-se uma distribuição amostral das proporções, cuja 
média e desvio padrão são dados por:
Distribuição amostral de proporçõesDistribuição amostral de proporções
 Média: p = N.p
Desvio Padrão:
N
qp
p
.
 Essas equações são válidas para populações infinitas 
N
e para populações finitas, cuja amostragem seja tomada 
com reposição.
 Para populações finitas e amostragem sem reposição temos Para populações finitas e amostragem sem reposição, temos 
um fator de correção igual ao visto para distribuição amostral 
das médias.
Exemplo 1Exemplo 1
 Considere a população constituída de todos os resultados 
possíveis do lançamento de um dado. A probabilidade de 
ocorrência do evento ‘número 3’ é dada por p = 1/6 e aocorrência do evento ‘número 3’ é dada por p = 1/6 e a 
probabilidade de sua não ocorrência é dada por q = 5/6.
 Quantas ocorrências do número 3 são esperadas em 120Quantas ocorrências do número 3 são esperadas em 120 
lançamentos?
Solução:
 p = N.p = 120.1/6 = 20 ocorrências
034,000116,0
120
1389,0
120
6
5
6
1
p 120120p
Distribuição normalDistribuição normal
 Note-se que, se o tamanho da amostra N for suficientemente 
grande, as distribuições amostrais serão normais ou 
aproximadamente normaisaproximadamente normais. 
 Note-se também que a população é distribuída binomialmente. 
 Por essa razão os métodos são conhecidos como métodos Por essa razão, os métodos são conhecidos como métodos 
das grandes amostras. 
Para ajustar a distribuição binomial à normal, usamos um fatorPara ajustar a distribuição binomial à normal, usamos um fator 
de correção:
 fc = ½.N
Exemplo 2Exemplo 2
 Em determinado processo produtivo, 4% dos itens produzidos 
são defeituosos. Em dado momento, retira-se da produção 500 
itens produzidositens produzidos.
a) Qual é a média da distribuição amostral dessa proporção?
b) Qual é o desvio padrão dessa distribuição amostralb) Qual é o desvio padrão dessa distribuição amostral 
das proporções?
c) Qual é a probabilidade de que desses 500 itensc) Qual é a probabilidade de que desses 500 itens 
inspecionados 3% ou mais sejam defeituosos?
Exemplo 2Exemplo 2
Solução:
a) p = 500.0,04 = 20, que é 4% da amostrap
b) Desvio padrão: 
009,096,004,0 
c) Para esse cálculo, precisamos inserir o fator de correção 
009,0
500p

para variáveis discretas: 
00101 f 001,0
5002
cf
Exemplo 2Exemplo 2
 Agora fazemos o cálculo da mesma forma que o fizemos 
quando estudamos a distribuição normal:
22,1
009,0
011,0
009,0
04,0001,003,0 
S
xxz i
 Na tabela da curva normal, esse valor corresponde a 11,12%.
 Como a pergunta é 3% ou mais, vamos subtrair o resultado de 
100%:100%:
 P = 100,00%-11,12%= 88,88%
Exemplo 2Exemplo 2
Distribuição amostral das diferençasDistribuição amostral das diferenças
 Dadas duas populações, das quais são retiradas amostras 
de NA da população A e NB elementos da população B, a 
distribuição amostral das diferenças (dasmédias ou dasdistribuição amostral das diferenças (das médias ou das 
proporções) é caracterizada pela diferença dos valores 
centrais e pela raiz quadrada da soma dos quadrados 
dos desvios padrões, dividida pelo tamanho da amostra:
BABA xxxx
  BABA
xx BA
22  
BA
xx NNBA
 
Exemplo 3Exemplo 3
 Os amortecedores do fabricante A rodam, em média, 65.000 
km, com desvio padrão de 4.500 km, normalmente 
distribuídos Já os amortecedores do fabricante B duram emdistribuídos. Já os amortecedores do fabricante B duram, em 
média, 60.000 km, com desvio padrão de 3.500 km. Suponha 
que foram testados 36 amortecedores da marca A e 49 
amortecedores da marca B. Calcule a média e o desvio padrão 
da distribuição amostral da diferença entre as vidas úteis.
SoluçãoSolução
A média das diferenças é:
000.5000.60000.65  BA xx
O desvio padrão é:
4901500.3500.4
2222
 xx BA  4,901
4936

BA
xx NN
BA
BA

InteratividadeInteratividade
Em um lote de 1.000 peças, sabe-se que 40 são defeituosas. 
Retirando-se uma amostra de 50 peças, espera-se que a 
quantidade de peças defeituosas seja igual a:quantidade de peças defeituosas seja igual a:
a) 2
b) 3b) 3
c) 4
d) 5d) 5
e) mais de 5
Teoria estatística da estimaçãoTeoria estatística da estimação
 Um problema importante da inferência estatística é a 
estimação de parâmetros populacionais, ou simplesmente 
parâmetros tais como a média a variância etc deduzidosparâmetros, tais como a média, a variância etc., deduzidos 
da estatística amostral correspondente.
 A estimativa de um parâmetro populacional, dada porA estimativa de um parâmetro populacional, dada por 
um número único, é denominada estimativa por pontos. 
A estimativa de um parâmetro populacional, dada por dois 
ú t i d id l t jnúmeros, entre os quais pode-se considerar que ele esteja 
situado, é denominada estimativa por intervalos. 
Teoria estatística da estimaçãoTeoria estatística da estimação
 As estimativas por intervalos indicam sua precisão ou 
exatidão e são, portanto, preferíveis às estimativas por 
pontos A declaração do erro ou precisão de uma estimativa épontos. A declaração do erro ou precisão de uma estimativa é 
denominada sua fidedignidade.
 Exemplo: Dizendo-se que uma grandeza tem sua medida dadaExemplo: Dizendo se que uma grandeza tem sua medida dada 
por 5,28 m está se apresentando uma estimativa por pontos. 
Se disser que a grandeza mede 5,28  0,03 m, isto é, está 
did t 5 25 5 31 tcompreendida entre 5,25 e 5,31 m, apresenta-se uma 
estimativa por intervalos.
Intervalo de confiança das médiasIntervalo de confiança das médias
Se a estatística é a média amostral, então os seus limites de 
confiança são dados por:
N
zx c
 
 Para o caso de amostragem de uma população infinita, 
ou tirada com reposição de uma população finita.
Com população finita e amostragem sem reposição temos:Com população finita e amostragem sem reposição, temos:
 p NN
1 p
p
c NN
zx
Intervalo de confiança das médiasIntervalo de confiança das médias
Com base na tabela da curva normal, temos: 
Limite de
confiança (%)
100 99 98 95 90 80 68,26 50
 Exemplo: Uma amostra de 45 contas pagas por uma empresa 
Valores críticos (zc) 3,90 2,58 2,33 1,96 1,64 1,28 1,00 0,68
apresentou um valor médio de R$ 14.900,00, com desvio 
padrão de R$ 3.600. Qual é o valor estimado para a média 
populacional, com 95% de confiabilidade?populacional, com 95% de confiabilidade?
SoluçãoSolução
 O cálculo do intervalo de confiança da média populacional, 
considerando a população infinita é:
45
360096,1900.14 
N
zx c

45N
052.1900.14 
 Baseado nesse cálculo e nessa amostra, pode-se dizer que se 
estima que as contas dessa empresa têm um valor médio 
entre R$ 13.848 e R$ 15.952 com 95% de certeza.entre R$ 13.848 e R$ 15.952 com 95% de certeza.
Intervalo de confiança das proporçõesIntervalo de confiança das proporções
 A proporção p de sucessos de uma amostra de tamanho N, 
retirada de uma população binomial, na qual P é sua 
probabilidade é dada por:probabilidade, é dada por:
pczPp 
 Se a população for finita e sem reposição, a fórmula acima 
terá o fator de correção.
pc
terá o fator de correção.
p NN
1pN
ExemploExemplo
 Em 40 lances de uma moeda, foram obtidas 24 caras. 
Determinar os limites de confiança de 95% para a proporção 
de caras que seria obtida em um número ilimitado de lancesde caras que seria obtida em um número ilimitado de lances 
da moeda.
Solução: no nível de 95%, zc = 1,96. Temos também N = 40;Solução: no nível de 95%, zc 1,96. Temos também N 40; 
p = 0,5 e q = 0,5. Assim:
079,096,16,0
40
5,05,096,1
40
24 p
 P = 0,60,15 ou 60  15%
InteratividadeInteratividade
Uma amostra aleatória de 400 salários escolhidos de uma 
população considerada infinita, revelou média de R$ 2.000,00 e 
desvio padrão de R$ 500 00 Qual é o intervalo de confiança dedesvio padrão de R$ 500,00. Qual é o intervalo de confiança de 
95% dessa estatística?
a) 2.000  140a) 2.000  140
b) 2.000  120
c) 2.000  80c) 2.000  80
d) 2.000  79
e) 2.000  49e) 2.000  49
CorrelaçãoCorrelação
 Surge quando se pergunta se há uma relação entre, pelo 
menos, 2 variáveis quantitativas, uma independente (X) e 
outra dependente (Y)outra dependente (Y). 
 Exemplo: alunos que estudaram + horas obterão melhor 
desempenho na prova.desempenho na prova.
 Variável Dependente  nota (Y).
 Variável Independente  no de horas de estudo (X).Variável Independente  no de horas de estudo (X).
Correlação linearCorrelação linear
 Correlação Linear: mede a relação entre as variáveis X e Y por 
meio da disposição dos pontos (X,Y) em torno de uma reta. 
O seu instrumento de medida é dado pelo coeficiente de 
correlação de Pearson, calculado pelo método dos 
mínimos quadrados:mínimos quadrados:
     2222 . YYnXXn YXXYnr XY        YYnXXn 
Correlação linearCorrelação linear
 O valor de r pode ser negativo ou positivo.
 Se r = 1, temos uma correlação perfeita positiva.
 Se r = -1, temos uma correlação perfeita negativa.
 Quanto mais próximo de 0 for o valor de r, mais fraca 
é a correlação.
 Se r = 0, a correlação é nula.
ExemploExemplo
 Uma empresa de confecções quer avaliar se suas despesas 
com publicidade estão repercutindo favoravelmente em 
suas vendas Para tanto levantou os gastos de publicidadesuas vendas. Para tanto, levantou os gastos de publicidade 
e as vendas em cinco meses diferentes, os quais estão 
relacionados na tabela abaixo. Calcule o coeficiente de 
correlação linear.
Gastos 3 4 8 12 14
vendas 7 14 15 28 32vendas 7 14 15 28 32
SoluçãoSolução
Construímos primeiramente uma tabela para calcular 
os somatórios:
X Y X² Y² X.Y
3 7 9 49 21
4 14 16 196 56
8 15 64 225 1208 15 64 225 120
12 28 144 784 336
14 32 196 1024 44814 32 196 1024 448
41 96 429 2278 981
SoluçãoSolução
 Calculando o valor de r, temos:
96,039364095 r
 Constatamos, então, uma forte correlação positiva entre 
,
2174464 
as variáveis.
Regressão linearRegressão linear
 É o processo de traduzir o comportamento conjunto de 
duas variáveis na forma de uma lei matemática denominada 
equação de regressão Assim sendo os conceitos deequação de regressão. Assim sendo, os conceitos de 
correlação e regressão são indissociáveis. 
 A regressão é linear quando essa lei matemática mencionadaA regressão é linear quando essa lei matemática mencionada 
é uma reta, portanto, uma função de 1º grau.
Regressão linearRegressão linear
 Como na prática trabalha-se com diversos pontos 
experimentais, existem inúmeras retas possíveis para umdeterminado conjunto de dadosdeterminado conjunto de dados.
 No entanto, o critério, normalmente, utilizado para a definição 
da melhor reta é o chamado método dos mínimos quadrados.da melhor reta é o chamado método dos mínimos quadrados.
 É sabido que a equação de uma reta é dada pela fórmula 
geral: y = a.x + b
 Em que a e b são os chamados coeficientes da reta.
Regressão linearRegressão linear
O cálculo dos coeficientes a e b podem ser feitos por meio das 
seguintes fórmulas:
 22 XXn
YXXYna 

n
XaYb 
ExemploExemplo
 A tabela abaixo mostra a evolução de duas variáveis 
possivelmente correlacionadas. Determine a equação de 
regressão linear decorrenteregressão linear decorrente.
x 3 5 7 9 10 14 16
 Solução: vamos construir a tabela com os somatórios
x 3 5 7 9 10 14 16
y 1 2 3 5 7 10 13
 Solução: vamos construir a tabela com os somatórios, 
sabendo que n = 7.
SoluçãoSolução
x y x² x.y
3 1 9 3
5 2 25 105 2 25 10
7 3 49 21
9 5 81 45
10 7 100 7010 7 100 70
14 10 196 140
16 13 256 208
64 41 716 49764 41 716 497
933,0
916
855
40965012
26243479
²647167
41644977 

a
91640965012647167
68,2
7
74,18
7
74,5941
7
64933,041 b
Resposta: y = 0,933.x – 2,68
777
RegressãoRegressão
 Com a equação de regressão pronta, podemos estimar valores 
para y dados alguns valores para x.
 Essa capacidade de previsão é tão mais confiável quanto 
melhor for o coeficiente de correlação entre as variáveis.
 Existem muitas aplicações para as regressões especialmente Existem muitas aplicações para as regressões, especialmente 
utilizando variáveis socioeconômicas.
InteratividadeInteratividade
A quantidade demandada de energia elétrica (y) é função da 
tarifa (x) e a equação de regressão é: 
y = - 0,56x + 158,8
Sendo assim, a estimação da quantidade demandada para uma 
tarifa de 100 é igual a:tarifa de 100 é igual a:
a) 102,8 
b) 214 8b) 214,8
c) 560,0
d) 401 2d) 401,2
e) 105,0
ATÉ A PRÓXIMA!

Outros materiais

Materiais relacionados

Perguntas relacionadas

Materiais recentes

Perguntas Recentes