Livro Noções de Probabilidade e Estatística - Magalhães parte 1
91 pág.

Livro Noções de Probabilidade e Estatística - Magalhães parte 1


DisciplinaProbabilidade e Estatística12.947 materiais121.769 seguidores
Pré-visualização37 páginas
em três categorias dependendo do andar onde se
cncontra: baixo, médio e alto. Estude a ocorrência de rachaduras e
inÍ'i ltrações para cada categoria.
l\u20ac, (tJse o computador) Os itens seguintes referem-se aos dados contidos no
êrquivo de nome aeusp.txt, que contém parte dos dados de uma pesquisa,
reslizuda pela Associação dos Educadores da USP (AEUSP), sobre aspectos
ãóeio-econômicos e culturais de comunidades de baixa renda da região do
ãutuntÍi, São Paulo. O questionário foi respondido por um dos moradores dn
gãËü sortcada para participar da pesquisa. Os dados estão organizados da
ãêgtlinlc lbrma:
golund /: Número do questionário (Num).
êalunu 2: Comunidade (Comun).
êalnnu.?: Sexo (Sexo):
ëHltl,d 5l
L : masculino;
2 : feminino.
Faixas de idade, em anos (Idade):
1 = 114,25);
2:125,35);
3: [35,45);
4 : [45, oo).
Bstado civil (Ecivil),
1 : solteiro;
2 = casado;
ll : clivorciado;
4 = viúvo;
l'r = outro.
llegiíio de procedência (Reproce).
Tentpo de residência em São Paulo, em anos (Ternposp),
Número de residentes na casa (Resid).
35
eetlttnu (t:
ttúunt 7i
è:olwtil Íli
ì6 Capítulo 1: Introdução à Análise Exploratória de Dados
coluna 9: Trabalho (Trab):
1 : sim;
2: náo;
3 : aposentado.
coluna l0: Tipo de trabalho, só para os que trabalham (Ttrab) :
1 : emPregado com carteira;
2 : emPregado sem carteira;
3 : profissional liberal;
4 : autônomo;
5 : rural.
coluna I l: Idadeque começou a trabalhar, em anos (Itrab).
coluna 12: Rendafamiliar em faixas de reais (Renda):
1 
-- 
[0,150);
2:1t50,300);
g : [300,450);
4 : [450, 900);
5 
- [900,1500);
6 : [1500, oo).
coluna 13.' Acesso a computador (Acompu):
1 : sim;
z: nao.
coluna t4: Sêrieem que parou de estudar (Serief).
Branco : não parou de estudar;
1a B : séries do ensino fundamental;
9 aL2: séries do ensino médio.
a. Explore o conjunto de dados e classifique as variáveis. Verifique se existem
variáveis com valores incompatíveis ou inválidos e proponha alternativas
para a solução do problema. Observe que existem variáveis com respostas
em branco e discuta porque isso acontece.
b. Estude a variável Renda em função de Comun. Você diria que os moradores
da Cohab e do Jardim d'Abril têm a mesma renda? Justifique sua resposta
baseando-se em gráficos e tabelas de freqüência.
c, Verifique se o comportamento'da variável Temposp é influenciado pelo tipo
de trabalho (variável Ttrab).
d. Faça um box-plot para a variável ltrab.
habilidades
Introdução
No capítulo anterior, vimos como caracterizar uma massa de dados, com o
do organizar e resumir informações. Neste capítulo, apresentamos o
ã nntemiltica que dá a base teôrica para o desenvolvimento de técnicas
Íatlens tt $erem apresentadas no restante do livro.
Denominamos fenômeno aleatório à situação ou acontecimento cujos
nõo podem ser previstos com certeza. Por exemplo, as condições
clo próximo domingo não podem ser estabelecidas com total acerto, O
pocle ser dito da taxa de inflação do próximo mês. Veremos que, cm
como essas, modelos podem ser estabelecidos para quantificar os
dus diversas ocorrências.
Aprcsentamos, a seguir, alguns conceitos de teoria dos conjuntos, que
Ëãados neste capítulo. Chamamos de espaço amostral ao conjunto de todos
possÍveis de um certo fenômeno aleatório. Ele será represontedo
letfa gregn O (ômega). Os subconjuntos de 0 são denominados eventoge
aclos pelas letras latinas maiúsculas A,8,. . . . O conjunto vazio, como jÍl
lelpnnl, será denotado por 0.
A união de dois eventos A e B, denotada por AUB, represento tt
ia ele, pclo menos, um dos eventos Aou B. Aintersecção do evento á
ã, denotrrcln por.rl a B, é a ocorrência simultânea de A e B.
Dois eventos A e B siro disjuntos ou mutuamefie exclusivos quando não
êlcmcntos ern coffrurïì.Isto é, Ao B : A.
Dlzemos qr,re Á e B são complementares se sua união é o espaço amostral
lnteraecçÍlo é vuzia. O complementarr de Á será representado por Á" e temos
U á', _: fl e .zt À A,, :4.
Vamos considerar probabilidade como sendo uma função P(') que
valores nurnéricos aos eventos do espaço amostral, conforme a defiriiçõo n
37
38 Capítulo 2 : Probabilidades
D efínição 2. 7 : Probabilidade
uma função P(.) é denominada probabilidade se satisfaz as condições:
?) 0< P(A)< 1,VÁcQ;
i,i,) P(A) : r;
iiü P(UAj) : t P(Aì, com os Á7t disjuntos.j:t
.i:r
tr
A pergunta que poderia surgir seria: como atribuir probabilidades aos
elementos do espaço amostral? Há duas maneiras principais de responder essa
questão.
A primeira delas consiste na atribuição de probabilidades, baseando-se
em características teóricas da realizaçáo do fenômeno. Por exemplo, ao lançarmos
um dado, temos o espaço amostral 0: {1,2,3,4,5,6}. Admitindo que o dado
foi construído de forma homogênea e com medidas rigorosamente simétricas, não
temos nenhuma razão para privilegiar essa ou aquela face. Assim, consideramos
P(1) : P(2) :. '. : P(6) :716.
Uma outra maneira de obter probabilidades é através das freqüências de
ocorrências. Observando as diversas repetições do fenômeno em que ocorre a
variável de interesse, podemos anotar o número de ocorrências de cada valor
dessa variável. Para um número grande de realizações, a freqüência relativa
poderia ser usada como probabilidade. For exemplo, desejando estabelecer as
probabilidades de cada face de um dado sem fazer nenhuma suposição inicial
sobre sua construção, usamos a experiência de sucessivas ocorrências. O ponto
delicado é decidir quanta experiência é necessária para se fazer a atribuição de
probabilidades, com alguma garantia de não se estar muito distante do verdadeiro
valor. Questões dessa natureza não serão discutidas aqui e fazem parte doS
capítulos de inferência estatística. Por ora, vamos assumir que, à medida que O
número de repetições vai aumentando, as freqüências relativas se estabilizam em
um número que chamaremos de probabilidade. Em ciências biológicas e humanas,
essa é a forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleatório ou ao
acaso em uma população, se a escolha desse ou daquele elemento só depende da
probabilidade a ele atribuída, seja através da freqüência relativa ou de algumit
suposição teórica.
Exemplo 2.1: Para a variável ldade, ver Tabela 1.3 clo Capítulo l, o cspitço
amostral será f) : {17,18, .. . ,25}. Supondo que um aluno é escolhiclo ao iÌcoso
?,1 ltitit,tlttl'ãtt 39
tr
flËl:n popullção, definimos a probabilidade dele ter uma certa idade pela
fuqttêrre irr rclativa associada à respectiva idade. Assim,
P(17) : 0,18; P(18) : 0,44; ...; P(25) : 0,04.
No 1lróximo exemplo, obtemos a probabilidade da união de eventos.
2.2; Considere a Tabela L2 do Capítulo 1, contendo informações a
r tlirs Íì'cqiiências da variável Sexo. Sabendo que 52Vo dos alunos estão na
A e 48Vo niÌ turma B, suponha que escolhemos um estudante ao acaso da
lnçno, Quirl seria a probabilidade de escolhermos um estudante do sexo
r ott itlguérn da turma B?
l)rrs inÍbrrnações a respeito da freqüência relativa acima e da Tabela 1.2,
/'(/&quot;) : 0,74, P(M) :0,26, P(A) :0,52, P(B): 0,48.
trilidrrdc que precisamos determinar pode ser representada por P(F U B),
guLl se sirnplesmente somarmos P(.F') com P(B), obtemos uma somn
Flor l I , E,videntemente isso não pode acontecer, pois o valor clu
llidnde poclc ser, no máximo, igual a 1. Não é difícil perceber que estamos
n trlg,rrns elcmentos duas vezes, pois ao considerarmos apenas estudantcs
t\u20acXo l'errrinino, temos estudantes da turma A bem como da turma B e ao
los upotìeìs iÌ turn'ìa B, temos estudantes do sexo feminino e masculino,
on r:sluclnntcs do sexo feminino e da turma B, isto é, o evento F O B, estd
Ito rlvcnlo ,Í;' c também no evento B.Logo, precisamos subtrair umiì vez
n IJ) ;turn obter a probabilidade correta. Desta forma, temos qllc il
ilitlrrtle rlit uniÍo FU B é igual àsomadas probabilidades