Buscar

Probabilidade e estatística UFRGS - Apostila prof Marco Antônio Giacomelli _ Passei Direto

Prévia do material em texto

Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 
 
 
 
 
UNIVERSIDADE FEDERAL DO RIO GRANDE 
DO SUL 
 
 
 
Instituto de Matemática 
Departamento de Estatística 
 
 
 
 
ESTATÍSTICA GERAL II 
MAT02215 
 
 
Professor: Marco Antônio Giacomelli 
 www.mat.ufrgs.br/~giacomo/ 
 
 
 
 Porto Alegre, Agosto de 2013 
 
 
 
 
 
 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 2 
 1- INTRODUÇÃO 
 
 
1.1 - Ciências Estatísticas 
 
 
 Na medida que foi sendo colocado diante de novos desafios, decorrentes 
 especialmente do crescimento da população – quando as atividades e as relações sócio-
 econômicas tornaram-se mais complexas – o homem precisou aprimorar, 
 sistematicamente, os instrumentos existentes e/ou criar outros para continuar 
 garantindo sua sobrevivência. Nesse processo de evolução, que perdura até os dias atuais, 
 novas necessidades e dificuldades foram se sucedendo, sempre desafiando o ser humano a 
 ultrapassá-las. Com a observação sistemática da realidade e a utilização dos instrumentos 
 criados, surgiu o conhecimento científico, que permitiu ao ser humano entender explicar e 
explorar melhor, e mais rapidamente, o mundo em que vive. 
 
 Para registrar, classificar, controlar e estudar mais adequadamente fenômenos, fatos, 
 eventos e ocorrências foram sendo criadas, desenvolvidas e aperfeiçoadas, muitas técnicas 
 de análise de informações e métodos quantitativos. Esses avanços facilitaram a resolução 
 de inúmeros problemas que o homem encontrava para realizar as atividades básicas de 
produção, comércio, transportes, etc. 
 
 Nestes últimos anos houve necessidade de aprofundar estudos, realizar experimentos e 
 pesquisas mais específicas, inclusive para avaliar os resultados das atividades 
 desenvolvidas. Por essa razão, os conhecimentos teóricos e os métodos de análise de dados 
quantitativos vêm sendo aprimorados continuamente. 
 
 O conjunto de técnicas e métodos de pesquisa, experimentação e inferências mais 
 utilizadas para alcançar esses objetivos são o que modernamente se conhece como 
 Ciências Estatísticas, onde se destaca a seguinte gama de conhecimentos: Teoria dos Jogos, 
 Planejamento de Experimentos, Teoria das Filas, Controle de Qualidade, Teoria das 
Decisões, Séries Temporais, Econometria e outras técnicas. 
 
 
1.2 - Áreas de aplicação da Estatística 
 
 
 Dentre as áreas em que a Estatística adquire maior relevância, destacamos: 
 
 Economia: Planeja e desenvolve estudos prospectivos sobre o comportamento de 
 variáveis macroeconômicas: renda, produção, comércio interno, importação, exportação, 
 inflação, emissão de moeda, elaboração de índices para medir produtividade, realiza 
 análises microeconômicas envolvendo a evolução das vendas, produção, custos, margem de 
 lucro, otimização da receita, formula indicadores gerenciais para tomada de decisões, etc. 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 3 
 Ciências Sociais: estudo de fatores desencadeadores de comportamento violento, 
tipificação de uso de drogas, causas de criminalidade. 
 
 
 Pesquisa de mercado: planeja e coordena a realização de pesquisa, por 
 amostrage, para avaliar o comportamento do mercado, as reações do consumidor para 
 lançamento de novos produtos ou para estabelecer estratégias de venda, etc. 
 
 Pesquisa de opinião: planeja e coordena a realização de pesquisas sobre preferência 
 ou opinião da população em variados temas: candidaturas eleitorais, regime político, 
atividades culturais. 
 
 Controle de qualidade: desenvolve estudos para estabelecer padrões de qualidade e 
 confiabilidade de produtos e serviços; realiza testes para avaliação e controle de processos, 
etc. 
 
 Informática: elabora modelos de simulação para resolução de problemas complexos: 
 define indicadores para amostragem de banco de dados; implanta modelos de previsão e 
 análises estatísticas; estabelece índices e coeficientes para gerenciamento e tomada de 
decisões. 
 
 Demografia e saúde: estuda a evolução e as características da população; estabelece 
 tábuas de mortalidade; analisa os fluxos migratórios; estabelece níveis e padrões para 
 testes clínicos; planeja e realiza experimentos com grupos de controle para avaliação de 
tratamentos. 
 
 Pesquisa operacional: elabora modelos matemáticos utilizando técnicas de 
 programação linear e programação não linear para otimizar alocação de recursos; utiliza 
métodos de simulação para indicar soluções ótimas, etc. 
 
 Recursos Humanos: pesquisa a compatibilidade entre os conhecimentos/habilidades 
 e as atividades desenvolvidas por funcionários; estuda curvas salariais; propõe planos de 
 avaliação de desempenho do quadro funcional; elabora plano de previdência complementar 
e fundo de pensão. 
 
 Agronomia e veterinária: produtividade em função do uso de fertilizantes, 
melhoramento genético, desempenho de variedades de plantas. 
 
 
 
 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 4 
1.2. Divisão da Estatística 
 
 
 Estatística Descritiva: descrição, resumo e organização das informações. Compreende o 
uso de tabelas, gráficos e medidas-resumo. 
 
 
 
 Estatística Inferencial: através do particular (amostra) faz induções a respeito do todo 
 (população), controlando a probabilidade de erro (por isso estudaremos a Teoria das 
Probabilidades). 
 
Exemplo 1: projeção da percentagem de votos para um candidato numa eleição. 
 
 
 
Exemplo 2: comparação de adubos 
 
 
 
 
Os três canteiros são expostos à mesma incidência de luz, tipo de solo, mas recebem adubos 
diferentes. No final do experimento será medida a altura das plantas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 5 
1.3 – Revisão de Estatística Descritiva 
 
 
Medidas descritivas para dados não agrupados 
 
Média aritmética: 
n
x
n
xxx
X
n
i
i
n
∑
=
−
=
+++
= 121
L
 
 
 Moda: a moda de um conjunto de valores, denotada por mo , é definida como o valor mais 
 freqüente no conjunto. Convém lembrar que a moda pode não ser única, isto é, um conjunto 
 pode ser bimodal, trimodal, etc. No caso em que todas freqüências forem iguais diremos 
 que não há moda. Se a moda existir será denotada por Mo. 
 
 
Mediana: A mediana de um conjunto de valores, denotada por ordenado Med, é definida 
como o valor que separa o conjunto em dois subconjuntos de mesmo tamanho. 
 
 
 Med = 
[ ]
 [ ] [ ]









+
+
+par én se , 
2
) x (x
 
 ímpar én se , x
1
2
n
2
n
2
1n
 
 
sendo [ ]{ }x a amostra ordenada em ordem crescente. 
 
 
Amplitude: 0minmax ≥−= xxh 
 
 
Variância: 
( )
1
2
1
2
2
−
×−





=
−
=
∑
n
Xnx
S
n
i
i
 
 
Desvio padrão: 2SS = 
 
 Coeficiente de variação: %100. ×=
−
X
S
VC 
 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 6 
 Exemplo 3: número de irmãos dos alunos da turma U - disciplina Estatística 
 
 
 0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1 
 1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0 
 
 Obtenha média aritmética, mediana, moda, variância, desvio padrão e coeficiente de 
variação. 
 
Solução: 
 
 x f 
0 
1 
2 
3 
4 
5 
6 
7 
21 
8 
5 
4 
3 
2 
Total 50 
 
9,1
50
95 
==
−
x ; Mo=1; Med=1 
 
 
( )
6224,2
49
 9,150309 22 =
×−
=s ; 6194,1=s ; CV=85%. 
 
 
Medidas descritivas para dados agrupados em classes 
 
 
n
fx
f
fx
X
k
i
ii
k
i
i
k
i
ii ∑
∑
∑
=
=
=
−
×
=
×
= 1
1
1 
 
1
1
2
2
2
−






−×
=
∑
=
−
n
Xnfx
S
k
i
ii
 
 
2 SS = ; %100. ×=
−
X
S
VC 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 7 
 Exemplo 4: vendas semanais (em mil reais) de gêneros alimentícios: 
 
30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5 
40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9 
49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6 
49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45 
47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5 
48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9 
50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6 
52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2 
52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6 
55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5 
59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2 
63,5 60,4 64,4 61 62,4 66 68 
 
 
Tabela de distribuição de freqüências com 5 classes 
 
 
 
 
 
 
 
 
 
 
 
02325,51
172
8776 
==
−
X ; 
( )
82986,58
171
02325,51172457840 22 =
×−
=S ; 67006,7=S , 
 
 
 %0325,15100
02325,51
670101,7
=×=CV . 
 
 
 
 
 
 
 
 
 
 
 
 
Vendas 
ix if iF
 Percentual ii fx × ii fx ×
2 
 30.0000 |— 38.0000 
 38.0000 |— 46.0000 
 46.0000 |— 54.0000 
 54.0000 |— 62.0000 
 62.0000 |— 70.0000 
34 
42 
50 
58 
66 
8 
31 
78 
41 
14 
8 
39 
117 
158 
172 
4.6512 % 
 18.0233 % 
 45.3488 % 
 23.8372 % 
8.1395 % 
 
272 
1302 
3900 
2378 
924 
 
924 
54684 
195000 
137924 
60984 
 Total -------- 172 -------- 100% 8776 457840 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 8 
1.4 – Revisão de Probabilidade 
 
 
Operações com eventos: ( )ccc BABA UI = ; ( ) UI cc
c
BABA = ; 
 ( )II BABBAc −= 
 
 
 
Propriedades: 
 
 (1ª) 1)(0 ≤≤ AP , para A evento no espaço amostral Ω 
 (2ª) 1)( =ΩP 
 (3ª) 0Ø)( =P 
(4ª) ∑ == =
n
i i
n
i i
APAP
11
)()(U , para Ø=I ji AA , ji ≠ 
 (5ª) )(1)( APAP c −= 
(6ª) )()( BPAPBA ≤⇒⊆ 
(7ª) ⇒⊆ BA :)()()( APBPABP −=− 
 
 
Regra da adição: ( ) IU )()()( BAPBPAPBAP −+= para BA, eventos quaisquer 
 
Regra do produto: I )()()( BPAPBAP ×= se A e B forem independentes 
 
Probabilidade condicional: 
)(
)(
)|( 
BP
BAP
BAP 
I
= se 0)( >BP 
 
 
Variáveis aleatórias discretas 
 
 função massa de probabilidade (fmp): para X v.a. )()( xXPxf == 
 1)(0 ≤≤ xf 
 ∑ =x xf 1)( 
 
 
∑=
x
xxfXE )()( , ( )222 )()( EXxfxXVar
x
−





== ∑σ , 2σσ = 
 
%100. ×= 
EX
VC
σ
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 9 
Modelos Probabilísticos discretos 
 
 
Modelo Binomial 
 
 
 Seja um experimento aleatório com dois resultados possíveis, isto é, },{ 21 ωω=Ω , 
com pP =)( 1ω e qpP =−= 1)( 2ω . A variável aleatória X , tal que 1)( 1 =ωX (ocorreu 
 um sucesso) e 0)( 2 =ω X (ocorreu um fracasso) é dita modelo de Bernoulli. O que é um 
“sucesso” ou um “fracasso” é subjetivo. 
 
 
Exemplo 5: Ω ={ fator RH+ ; fator RH-} 
 
 X = 1, se é RH+ 
 = 0, se é RH- 
 
Sabe-se, da Biologia, que ( ) 85,01 ==XP e ( ) 15,00 ==XP . 
 
 
 Sendo nXXX ,....,, 21 v.a’s. independentes e identicamente distribuídas segundo 
uma Bernoulli de parâmetro p , então ∑ ==
n
i i
XX
1
 é dita binomial de parâmetros n e p . 
 
 
Notação: ),(~ pnBinomialX 
 
fmp: xnxxn qpCpnxf
−=),,( , nx .....,2,1,0= 
 
 
Esperança e Variância de uma v.a. Binomial 
 
 
 npEX = ; )1( pnpVarX −= 
 
Impresso por Danielle Madrid, CPF 029.499.340-13 para uso pessoal e privado. Este material pode ser protegido por direitos autorais e
não pode ser reproduzido ou repassado para terceiros. 28/01/2021 02:40:58
 10
 
 
 Exemplo 6: suponha que 40% dos moradores de um município são favoráveis à 
 implantação de um novo sistema de coleta e reciclagem de lixo. Se 5 pessoas forem 
 entrevistadas (independentemente), qual a probabilidade de: 
 
 (a) nenhuma ser favorável (b) no máximo 2 serem favoráveis 
 (c) no mínimo 4 serem favoráveis (d) entre 2 (incluso) e 5 (excluso) serem favoráveis 
 
solução: vamos denotar X como o número de pessoas favoráveis ao projeto 
 )40,0;5(~ BinomialX 
 
 (a) 07776,060,040,0)0( 5005 =××== CXP 
 
 (b) 
68256,060,040,060,040,060,040,0
)2()1()0()2(
322
5
411
5
500
5 =××+××+××=
==+=+==≤
CCC
XPXPXPXP
 
 
 (c) 08704,060,040,060,040,0)5()4()4( 0555
144
5 =××+××==+==≥ CCXPXPXP 
 
 (d) 
6528,060,040,060,040,060,040,0
)4()3()2()52(
144
5
233
5
322
5 =××+××+××
==+=+==<≤
CCC
XPXPXPXP
 
 
 
 Exemplo 7: no exemplo anterior, se 50 pessoas forem entrevistadas, qual o número 
esperado de favoráveis? 
 
 Solução: 2040,050)( =×=XE ; 1260,040,050)( =××=XVar ,

Continue navegando