Apostila-Probabilidade e Estatística

•
FATEC-SP

Fernando Tomio
23.03.2014
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Probabilidade e Estatística

29.429 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Probabilidade 
E Estatística
Elaborado por Paul CHEGE 
Traduzido para Português por Paulo Diniz 
African Virtual university
Université Virtuelle Africaine
Universidade Virtual Africana
_Universidade Virtual Africana
Nota 
Este document é publicado sob as condições da Creative Commons
http://en.wikipedia.org/wiki/Creative_Commons
Atribuição 
http://creativecommons.org/licenses/by/2.5/
Licenca (abreviada “cc-by”), Versão 2.5.
 
Por CC 
São reservados alguns direitos 
_Universidade Virtual Africana
Índice 
I. Probabilidade e Estatística............................................................................... 3
II. Conhecimentos prévios (Pre-requisitos) ........................................................ 3
III. Tempo............................................................................................................... 3
IV. Materiais............................................................................................................ 3
V. Justificativa/Filosofia do módulo............................................................3 
VI. Conteúdos......................................................................................................... .4
6.1 Visão geral......................................................................................................... .4
6.2 Plano/Esboço..................................................................................................... .5
6.3 Diagrama de organização dos conteúdos....…………………………………. 6
VII. Objectivos do módulo……………………………………………………….. 7
VIII. Actividades específicas de aprendizagem………………………………….... 7
IX. Actividades de ensino e aprendizagem..............................................................9 
X. Lista de conceitos chaves (Glossário).............................................................. 12
XI. Lista de materiais de leitura obrigatória ........................................................ .18
XII. Lista de recursos……………………………….…………………………… 19
XIII. Lista de Links (Sítios da Internet) úteis…………………………………….. 20
XIV. Actividades de aprendizagem............................................................................21 
XV. Síntese do modulo………………………………………………………….. 112
XVI. Avaliação sumativa........................................................................................... 113
XVII. Referencias…………………………………………………………………… 121
XVIII. Registos de estudantes....................................................................................... 122
XIX. Principal Autor do módulo................................................................................ 123
_Univeridade Virtual 
Africana 
I. Probabilidade e Estatística
Por Paul Chege
II. Conhecimentos prévios (Pre-requisitos)
Para frequentarem este modulo, os estudantes precisam ter conhecimentos sobre 
Probabilidade e Estatística do Ensino Secundário
III. Tempo 
O tempo total para este modulo é de 120 horas de estudo. 
IV. Material 
Os estudantes deverão ter acesso aos textos nucleares de leitura que estão especificados 
em diante. Também precisarão de usar o computador para terem acesso total aos textos nucleares de leitura. 
Adicionalmente, os estudantes deverão estar aptos para instalar e usar o Sofware wx Maxima para 
exercitarem conceitos algébricos 
V. Importância do Módulo/Filosofia do Módulo 
Probabilidade e Estatística, para além de ser uma área chave para o ensino de matérias 
do ensino secundário, constitui uma base muito importante para o ensino da Matemática do 
nível superior. A Estatística é uma área fundamental da Matemática com aplicação em muitas 
outras disciplinas e é útil em análise de processos em produção industrial. O estudo da 
Estatística providencia especialistas (Estatísticos) capazes de recolher e analisar dados 
referentes a uma determinada população e fazer as respectivas inferências sobre certas 
características desta. Os Estatísticos providenciam aos governos e organizações instrumentos 
concretos que podem ajudar aos gestores na tomada de decisão perante uma determinada 
situação. Por exemplo, com base na Probabilidade e Estatística, pode-se analisar a taxa de 
expanção de doenças, as alterações da densidade populacional, pode-se fazer a previsão 
meteorológica, etc. 
O estudo da da teoria de Probabilidade ajuda na tomada de decisão dos agentes 
governamentais e das organizações, usando como base a teoria de chances. Por exemplo, 
pode-se predizer a quantidade de crianças de sexo masculino e de sexo feminino nascidas 
dentro de um determinado período e também projectar a quantidade de chuva que uma 
determinada região pode esperar, com base em alguns dados históricos sobre as 
regularidades/padrões de chuva dessa região. 
A teoria de Probabilidade também tem sido extensivamente usada na determinação de 
qualidade (alta, média e baixa) de produtos industriais, por exemplo, para prever o número de 
peças defeituosas num processo de produção industrial. 
_African Virtual University
VI. Conteúdos
6.1 Visão geral 
Este módulo é composto por três unidades:
Unidade 1: Estatística Descritiva e Distribuição de Probabilidades
A Estatística descritiva é uma unidade que é desenvolvida ou como uma extensão da 
matemática do nível secundário ou como uma introdução para estudantes que se iniciam no 
estudo da Estatística. Introduzem-se nesta unidade as medidades de tendência central e de
dispersão e também o conceito de probabilidade e o seu tratamento teórico. 
Unit 2: Variáveis aleatórias e Distribuições 
 
Esta unidade exige como pre-requisito a unidade 1. É desenvolvida a desde o conceito de 
Momento e função geradora de Momento, desiguladades de Markov e de Chebychev, algumas 
distribuições univariadas, distribuições bivariadas de probabilidade e probabilidades condicionais. 
Esta unidade dá algum subsídio para a análise de coeficientes de correlacão e para funções de 
distribuição de variáveis aleatórias, tais como a distribuição qui-quadrado, distribuição T e a 
distribuição F 
 
Unit 3: Teoria de Probabilidade 
 
Esta unidade é desenvolvida a partir da unidade 2. Nesta unidade faz-se a análise de 
Probabilidade usando funções de indicadores. Introduz-se a desigualdade de Bonferoni, funções 
geradoras, função característica e independência estatística de amostras aleatórias. Desenvolve o 
conceito de função para diferentes variáveis aleatórias e termina com o tratamento dos teoremas de 
convergência e de limite central. 
_African Virtual University
6.2 Plano: Programa
Unidade 1 ( 40 horas): Estatística Descritiva e Distribuição de Probabilidades
Nível 1. Prioridade A. Sem pre-requisitos. 
 
Distribuição de frequências relativas, distribuição de frequências acumuladas, curvas de 
frequências, média moda e mediana. Quartís e percentís, desvio padrão, distribuições simétricas 
e assimétricas. Probabilidade, espaço amostral, evento, definição de probabilidade, propriedades 
da probabilidade, variáveis aleatórias, distribuição de probabilidades, valor esperado (média) de 
uma variável aleatória, algumas distribuições particulares: distribuição de Bernoulli, distribuição 
Binomial, de poisson, Geométrica, Hipergeométrica, Uniforme, Exponencial e distribuição 
Normal. Distribuição de frequências bivariadas, tabelas de probabilidades conjuntas e 
probabilidades marginais 
Unidade 2 ( 40 horas): Variáveis Aleatórias e Distribuições de Testes 
Nível 2. Prioridade B. O pre-requisito é a Estatística 1 
 
Momentos e funções geradoras de Momentos, desigualdades de Markov e de 
Chebychev, distribuições univariadas especiais. Distribuição de probabilidades bivariadas, 
distribuições de probabilidades conjuntas, condicionais e marginais. Independência, regressãoe 
correlação de dados bivariadas, cálculo de coeficientes de regressão e de correção, função 
distribuição de variáveis aleatórias, distribuição normal bivariada. Distribuições derivadas, tais 
como qui-quadrado, T e F. 
 
Unidade 3 ( 40 horas): Teoria de Probabilidade 
Nível 3. Prioridade C. O pre-requisito é Estatística 2. 
 
Probabilidade: Uso de funções indicadoras. Desigualdade de Bonferoni de vectores aleatórios. Funções 
geradoras. Função característica. Independência estatística de amostras aleatórias. Distribuição multinomial. 
Função de várias variáveis aleatórias. Independência de X e de S2 em amostras normais, estatísticas de ordem, 
convergência e teorema de limite. Exercícios práticos. 
 
6.3. Diagrama de organização dos conteúdos 
_African Virtual University_African Virtual University
 
VII. Objectivos 
 
No fim deste modulo, os estudantes deverão ser capazes de calcular as medidas de 
tendência central e de dispersão em estatística e resolver tarefas de probabilidade baseadas 
nas leis probabilisticas e fazer testes de hipóteses usando a teoria de probabilidades 
VIII. Objectivos específicos de aprendizagem 
(Objectivos instrucionais)
 
 
 
 
 
 
 
Unidade 1: Estatística Descritiva e Distribuição de Probabilidades ( 40 Horas) 
 
No fim desta unidade, os estudantes deverão ser capazes de: 
 Desenhar várias curvas de frequência; 
 Calcular a média, moda, mediana, quartís, decís, percentís e desvio padrão de dados 
agrupados ou não; 
 Definir e enunciar as propriedades da Probabilidade; 
 Ilustrar as variáveis aleatórias, distribuição de probabilidades e valor esperado de uma 
variável aleatória; 
 Ilustrar as distribuições de Bernoulli, Binomial, Poisson, Geométrica, Hipergeométrica, 
Uniforme, Exponencial e Normal; 
Unidade 2: Variáveis Aleatórias e Distribuição de Testes ( 40 Horas) 
 
No fim desta unidade, os estudantes deverão ser capazes de: 
 Ilustrar Momentos e funções geradoras de Momentos; 
 Analisar as desigualdades de Markov e de Chebychev; 
 Examinar algumas distribuições univariadas de probabilidade, distribuições 
bivariadas de probabilidades, probabilidades conjuntas, marginais e condicionais; 
 Mostrar a independência de variáveis, correlação e regressão; 
 Calcular os coeficientes de correlação e regressão para dados bivariados; 
 Mostrar a função distribuição de varíáveis aleatórias; 
 Examinar a distribuição normal bivariada; 
 Ilustrar as distribuições derivadas, tais como a qui-quadrado, a T e a distribuição F. 
 
_African Virtual University
Unidade 3: Teoria de Probabilidade ( 40 Horas)
No fim desta unidade, os estudantes deverão ser capazes de: 
• Usar as funções de indicadores em Probabilidades; 
• Mostrar a desigualdade de Bonferoni; 
• Ilustrar funções geradora e característica;
• Examinar a independência estatistica de amostras aleatórias e a distribuição multinomial; 
 
• Avaliar funções de várias amostras aleatórias;
• Illustrar a independência de X e S2 em amostras normais de estatísticas de ordem;
• Mostrar a distribuição normal multivariada;
• Illustrar os teoremas de convergência e de limite;
• Resolver exercícios práticos.
_African Virtual University
IX. Actividades de Ensino e de Aprendizagem
9.1 Pre-Avaliação
A Matemática Básica é um pre-requisito para a Probabilidade e Estatística. 
Tarefas 
 
1. Se jogarmos um dado, a probabilidade de se obter um número maior que 4 é: 
 
 
2. Uma carta é extraida aleatoriamente de um baralho de 52 cartas. A probabilidade de ser 
Rainha é: 
 
 
 
3. São dados 100 números, dos quais 20 são 4s, 40 são 5s, 30 são 6s e os restantes são 7s. 
Encontre a média aritmética desses números. 
 
 
 
 
_0African Virtual University
4) Calcule a média dos seguintes dados. 
5) Encontre a moda dos seguintes dados: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8,
2, 5 e 4. 
A. 4 
B. 5 
C. 6 
D. 8 
6) O valor da probabilidade pode variar:
A. de 0 a 1
B. de -1 a +1
C. de 1 a 100
1
D. de 0 a 
2
7) Encontre a mediana dos seguintes dados: 8, 7, 11, 5, 6, 4, 3, 12, 10, 8, 2, 5, 1, 6, 4.
A. 12 
B. 5 
C. 8 
D. 6 
8) Encontre a amplitude total dos seguintes valores: 7, 4, 10, 9, 15, 12, 7, 9.
A. 9 
B. 11 
C. 7 
D. 8.88 
__African Virtual University
9) Se jogarmos duas moedas e verificarmos as faces voltadas para cima, o espaço amostral será:
A. C, K e CK
B. CC, CK, KC, KK
C. CC, CK, KK
D. C, K 
10) Se uma letra for escolhida aleatoriamente da palavra “Mississippi”, encontre a probabilidade
De que seja um “i” 
 
 
Chave de respostas
1. B 2. A 3. D 4. C 5. B
6. A 7. D 8. B 9. B 10. D
Comentários Pedagógicos para estudantes
Esta pré-avaliação destina-se a dar aos estudantes uma visão sobre o que devem lembrar 
sobre Probabilidade e Estatística. Uma pontuação inferior a 50% nesta pre-Avaliação 
indica que o estudante precisa de rever os conteúdos de Probabilidade e Estatística do 
nível secundário. A pré-avaliação abrange os conceitos básicos com os quais os 
estudantes precisam de se familiarizar antes de avançar com este módulo. Faça a revisão 
da Probabilidade e Estatística do ensino secundário para dominar o básico se tem
problemas com esta pré-avaliação. 
__African Virtual University
X. Conceitos Chaves ( Glossário)
Eventos mutuamente exclusivos: Dois eventos dizem-se mutuamente exclusivos se não podem 
ocorrer ao mesmo tempo. 
Variância de um conjunto de dados é definida como a raiz quadrada do desvio padrão, isto é, Var = 
S2. 
Experimento aleatório: é o processo de observação ou de acção cujos resultados, embora possam 
ser descritos no seu conjunto, não são determináveis à prior, antes da realização da experiência. Ex: 
tirar aleatoriamente uma carta de um baralho ou lançar um dado e verificar o número obtido. 
Espaço amostral: é o conjunto de todos resultados possíveis de um experimento. Ex., se lançarmos 
uma moeda e verificarmos a face de cima esperamos dois resultados possíveis (cara ou coroa). 
Portanto, o espaço amostral é (C; K). 
Variável aleatória: é uma função que assume valores reais para todos resultados possíveis de um 
experimento aleatório. 
Amostra aleatória: aquela que é construida por métodos envolvendo uma componente imprevisível.
Distribuição de Bernoulli: é uma distribuição de probabilidade discreta, que assume o valor 1 com 
probabilidade p de sucesso e valor 0, com probabilidade de fracasso q = 1- p. 
Distribuição Binomial: é uma distribuição de probabilidade discreta, que dá conta do número de 
sucessos em n experimentos aleatórios independentes, cada um com apenas dois resultados possíveis 
(um correspondendo ao sucesso e outro, ao fracasso). A probabilidade de sucesso p, é sempre a 
mesma para cada experimento. 
Distribuição Hipegeomátrica: é uma distribuição de probabilidade discreta que descreve o número 
de sucessos em uma amostra de tamanho n, retirada de uma população finita de tamanho N, sem 
reposição. 
Distribuição de Poisson: é uma distribuição de probabilidade discreta, que expressa a 
probabilidade de vários eventos que ocorrem em um determinado período de tempo, se 
esses eventos ocorrerem com uma taxa média conhecida, e independentemente do 
intervalo de tempo. 
Correlação: é uma medida de associação entre duas variáveis. 
Regressão: é uma medida usada para examinar a relação entre uma variável dependente 
e uma independente. 
Teste qui-quadrado: é um teste de hipótese estatística em que a estatística de teste tem 
uma distribuição qui-quadrado quando a hipótese nula é verdadeira, ou qualquer teste em 
que a distribuição de probabilidades da estatística de teste (assumindo que a hipótese nula 
é verdadeira) podeser aproximada a uma distribuição qui-quadrado, tanto quanto melhor, 
fazendo o tamanho da amostra suficientemente grande. 
Distribuição Normal multivariada: é uma distribuição de probabilidade específica, que pode ser 
considerada uma generalização da distribuição normal univariada, para dimensões mais grandes. 
teste-t é qualquer teste de hipótese estatística para dois grupos, em que a estatística de teste tem uma 
distribuição t de Student se a hipótese nula é verdadeira. 
 
 
 
 
__African Virtual University
Termos estatísticos 
 
1. Dados brutos: são dados não organizado numericamente.
2. Rol: é um arranjo dos dados numéricos em ordem crescente de magnitude.
3. Amplitude total: é a diferença entre o maior e o menor valor dos dados.
4. Intervalos de classes: Em uma série de dados agrupados por exemplo, 21-30, 31-40 etc, o 
intervalo 21-30 é chamado de intervalo de classe.
5. Limites da Classe: Em um intervalo de classe, por exemplo, 21-30, 21 e 30 são chamados de 
limites de classe.
6. Limites inferior de classe (Lic): No intervalo da classe 21-30, o limite inferior da classe é 
21 
7. Limite superior de classe (Lsc): no intervalo da classe 21-30, o limite superior da classe é 
30 
8. Fronteiras dos Limites inferior e superior da classe: No intervalo da classe 21-30, a 
fronteira do limite inferior de classe é de 20,5 e a do limite superior é 30.5. Essas fronteiras 
garantem, teoricamente, todos valores do intervalo de 21-30 estão incluidos no intervalo de 
20,5-30,5. 
9. Amplitude de classe: É a diferença entre o limite superior e o inferior. Exemplo, para o 
intervalo de 21-30, a amplitude é 9 e para o intervalo 20,5-30,5 a amplitude é 10. 
10. Marca de classe ou ponto médio: é a média aritmética dos limites da classe. Para o intervalo 
de 21-30, o ponto médio é 
 
11. Distribuição de frequências: Um grande número de dados brutos, pode ser representado 
na forma tabular, com as suas respectivas frequências. Por exemplo: 
 
Esta representação dos dados chama-se distribuição de frequências ou tabela de frequências 
12. Frequências acumuladas: A frequência acumulada até um certo valor ou dado, é a soma as 
frequências individuais precedentes incluindo a do próprio valor ou dado. Por exemplo: 
 
13. Distribuição de frequências relativas. Na tabela seguinte, 
 
A soma das frequências é 
 
A freqência relativa da classe 25-29 é calculada dividindo a frequência desta classe pela soma 
das frequências. Exemplo: A frequência relativa do intervalo de 25-29 é dada por 
 
 
 
 
 
__African Virtual University
14. Curva de frequências acumuladas (Ogiva). Dada a tabela de frequências abaixo, 
 
Podemos construir o gráfico das frequências acumuladas versus fronteiras dos limites superiores 
das classes. 
 
 
 
Nota: No gráfico de frequências acumuladas, o primeiro ponto marcado é (24,5; 4). Se 
começássemos o gráfico neste ponto, este ficaria pendurado no eixo-0y. Para evitar 
isso, criamos outro ponto (19,5, 0) como ponto de partida. 19,5 é a fronteira do limite 
superior da classe (projectada) anterior. 
 
 
 
__African Virtual University
Formas de curvas de frequência 
 
 
 
 
 
 
 
 
 
 
 
__African Virtual University
XI. Lista de material de leitura obrigatória
Leitura 1: Wolfram MathWorld Acedido em 06.05.07) 
Referência completa :http://mathworld.wolfram.com/Probabilty 
 Resumo: Esta referência fornece o material de leitura muito necessário em 
Probabilidade e Estatística. A referência tem uma série de ilustrações que 
capacitam o estudante através de diferentes metodologias de abordagem. 
Wolfram MathWorld é uma enciclopédia matemática online especializada.
Justificação/Filosofia: Ele fornece as referências mais detalhadas para qualquer 
tópico matemático. Os estudantes devem começar por utilizar o mecanismo de 
Leitura 2: Wikipedia (visitado em 06.05.07) 
Referência Completa : http://en.wikipedia.org/wiki/statistics 
Resumo: Wikipédia é uma enciclopédia on-line. É escrita pelos próprios leitores.
Está sempre renovada, já que novas entradas são continuamente revistas. Além 
disso, tem-se revelado extremamente precisa. Os assuntos matemáticos que dão 
entrada são muito detalhados.
Justificação/Filosofia: A Wikipédia dá definições, explicações e exemplos que os 
estudantes não podem acessar facilmente em outros recursos. Pelo facto de a
W 
Leitura 3: 
 
ikipedia ser atualizada com freqüência dá-se ao estudante a possibilidade de 
MacTutor History of Mathematics (Acedido em 03.05.07) 
Referência complete: http://www-history.mcs.standrews.ac.uk/Indexe s 
Resumo: O Arquivo MacTutor é a história mais abrangente da matemática na 
internet. Os recursos são organizados tendo em conta os temas históricos. 
Justificação/Filosofia: Os estudantes devem pesquisar o arquivo MacTutor por 
palavras-chave nos tópicos estão a estudar (ou pelo nome do módulo em si). É 
importante ter uma visão geral
de onde a matemática que está a ser estudada se encaixa na história da 
matemática. Quando
o estudante termina o curso e vai ensinar a matemática do ensino secudário, terá de 
traser o assunto para seus alunos.
Em particular, o papel das mulheres na história da matemática deve ser bem 
estudado para ajudar os alunos a compreenderem que dificuldades as mulheres têm 
enfrentado ainda que estejam a traser uma contribuição importante. Do mesmo 
modo, o papel do continente Africano deve ser estudado
para compartilhar com os alunos nas escolas, nomeadamente os primeiros 
dispositivos de contagem (por exemplo, o osso Ishango) e também o papel da 
matemática egípcia deve ser bem estudado. 
__African Virtual University
XII. Lista de recursos obrigatórios
 Recurso 1: Maxima.
 Referência Completa: Uma cópia do Maxima em disco faz parte do material para este 
curso 
Os estudantes do ensino à distância são ocasionalmente confrontados com dificuldades 
no ensino da matemática devido a falta de recursos que os possam guiar. A falta de 
aulas presenciais orientadas por um docente pode levar os estudantes a uma estagnação 
total, se não estiverem devidamente equipados de recursos que os ajudem a resolver 
seus problemas de aprendizagem da matemática. Este impedimento pode ser resolvido 
através de uso de recurso acompanhante: Maxima. 
Justificação/Filosofia: Maxima é um software do grupo das fontes abertas que pode 
permitir os estudantes a resolver equações lineares e quadráticas, sistemas de equações, 
integração e diferenciação, executar manipulações algébricas: factorização, 
simplificação, etc. Iste recurso é obrigatório para estudantes do ensino à distância 
porque possibilita uma aprendizagem rápida usando as habilidades em TIC’s já 
adquiridas. 
 
 
Recurso 2: Graph 
Referência Completa: Uma cópia de Graph, também acompanha este curso 
É relativamente difícil desenhar gráficos de funções, especialmente funções 
complicadas com funções em três dimensões. Os estudantes à distância, 
inevitavelmente encontrarão situações em que precisarão de algum recurso para 
desenhar gráficos em matemática. Este curso é acompanhado de um software chamado 
Graph para ajudar os estudantes no desenho de gráficos. Contudo, os estudantes 
precisam de estar familiarizados com este software para o poderem usar facilmente. 
 
Justificação/Filosofia: Graph é um software, dinâmico, do tipo fonte aberta, que os 
estudantes podem ter acesso através do disco que lhes é disponizado. Este ajuda aos 
estudantes de matemática a desenhar gráficos que de outro modo seriam bastante 
difíceis. É fácil usar este software, desde que os estudantes invistam algum tempo para 
aprenderem como funciona. Os estudantes sairão em vantagem porquepoderão usar 
este recurso em outras disciplinas durante e mesmo depois do curso. Notarão que é 
muito útil quando forem ensinar a matemática no ensino secundário. 
_0African Virtual University
XIII. Lista de Links úteis
Link 1 
Títlo : Wikipedia
 URL:http://en.wikipedia.org/wiki/Statistics 
Descrição: Wikipedia é dicionário de todos matemáticos. É um recurso-aberto que 
freqüentemente é atualizado. A maioria dos estudantes, de quando em vez, encontrará 
problemas de referências para materiais de consulta. A maioria dos livros disponíveis 
só cobre partes ou seções dos conteúdos de Probabilidade e Estatística. Esta escassez 
de materiais pode ser superada com o uso de Wikipedia. É fácil aceder por pesquisa no 
“Google”. 
Justificação/Filosofia: A disponibilidade de Wikipedia resolve problemas cruciais de 
falta de materiais de aprendizagem em várias áreas de matemática. Estudantes 
deveriam ter experiência, em primeira mão, de Wekipedia para os ajudar nas suas 
aprendizagens. É um recurso grátis muito útil que não só resolve os problemas de 
estudante de materiais de referência mas também dirige os estudantes para outro 
websites relativamente úteis, bastando clicar nos ícones indicados. A sua utilidade é de 
reconhecida importância. 
 
Link 2: 
 
Título: Mathsguru 
URL: http://en.wikipedia.org/wiki/Probability 
Descrição: Mathsguru é um website que ajuda os estudantes a compreender várias da 
Teoria de Números. É fácil acerder através de pesquisa no Google e disponibiliza 
informações detalhadas sobre várias questões de Probabilidade. Oferece explicações e 
exemplificações que facilmente os estudantes podem entender. 
 
Justificação/Filosofia: Mathsguru oferece vias alternativas para estudantes acederem a 
outros tópicos correlacionados, sugestões e soluções, podendo constituir uma grande 
ajuda para os que encontram frustrações em obter livros que ajudem na aprendizagem 
de Probabilidade. Oferece abordagens bastante úteis, tendo em consideração as várias 
áreas do módulo de Probabilidade. 
 
Link 3. 
Título: Mathworld Wolfram 
URL: http://mathworld.wolfram.com/Probability 
Descrição: Mathworld Wolfram é um website cheio de soluções para problemas de 
Probabilidade. Os estudantes podem aceder a este recurso através de pesquisa no 
Google. Wolfram também orienta os estudantes para outros websites úteis para 
aprimorar as suas compreensões sobre os mesmos tópicos. Mathworld Wolfram é um 
site que também providencia alguns subsídios sobre a Teoria de Números, desafios e 
algumas orientações metodológicas. Ajuda também na Modelagem Matemática e é 
fortemente recomendado para estudantes interessados em aprender a Teoria de 
Números e outras áreas da Matemática. Ajuda a fazer ligação para outros websites 
fornendo uma vasta gama de informações necessárias para estudantes compreenderem 
os conteúdos de Probabilidade e Estatística. 
__African Virtual University
XIV. Actividades de Aprendizagem
Unidade 1 40 Horas
Estatística Descritiva e Distribuição de Probabilidades 
Uma fazendeira desenvolveu as seguintes actividades na sua fazenda: 
1. Ela planta 80 mudas no primeiro dia de Março. No primeiro dia de Dezembro mede as 
alturas das plantas. 
2. Ela pesa todas as vacas da fazenda e regista os pesos no seu diário. 
3. Faz o registo da produção de ovos da secção de avícula. 
4. Faz o registo do tempo levado até entregar o leite à fábrica de processamento. 
 
Os resultados dos registos estão indicados a seguir: 
1. Alturas das plantas em cm 
 
 
 
2. Pesos de vacas em kg 
 
 
 
__African Virtual University
3. Número de Ovos 
 
 
4. Tempo gasto até que o leite chegue ao processamento 
 
 
 
CASO 1: 
 
Uma empresa local que lida com serviços de extensão agrícola visita a fazendeira. Ela 
orgulhosamente produziu seus registos. O gestor agrícola ficou muito impressionado com 
registos mas percebe claramente que a fazendeira precisa de algumas habilidades em 
gestão de dados para permitir que ela tome boas decisões com base nos dados provenientes 
da sua fazenda. O gestor agrícola projeta um curso sobre processamento de dados para 
todos os farmeiros rurais. Durante a fase de planeamento do curso, são definidos os 
seguintes conceitos: 
 
a) Dados: São resultados de uma observação. Por exemplo, alturas de mudas 
b) Freqüência: taxa de ocorrência de um dado. Por exemplo, número de vacas pesadas. 
c) Média: O valor médio de um conjunto de dados 
d) Moda: Dado que ocorre com maior frequência. 
e) A mediana: Postos os dados em ordem crescente, a mediana é o elemento da posição 
 
 
Aula 1: Introdução à Estatística 
 
A Estatística Descritiva é utilizada para designar qualquer das várias técnicas 
utilizadas para sumarizar um conjunto de dados. Tais técnicas são geralmente 
classificadas em: 
 
1. Descrição gráfica, em que usamos gráficos para sumarizar os dados. 
 
2. Descrição Tabular, em que se usam tabelas para sumarizar os dados. 
 
3. Descrição Paramétrica, em que se estimam os valores de determinados 
parâmetros que assumimos que completam a descrição do conjunto de dados. 
 
Em geral, os dados estatísticos podem ser descritos como uma lista de indivíduos 
ou unidades e os dados associados a cada um deles. 
 
1. Pretende-se neste momento alcançar dois objectivos: 
Pretende-se mostrar estatisticamente o quanto certas medidas são parecidas. Em 
manuais de Estatística esta questão é respondida com base nas medidas de tendência 
central. 
 
 
__African Virtual University
 
Quando estamos resumindo uma certa quantidade de dados, como o 
comprimento, o peso ou a idade, é comum responder-se à primeira 
questão com o cálculo da média aritmética, a mediana, ou a moda. Às 
vezes, pode-se calcular os quartís, decís ou percentís. 
 
As medidas mais comuns de variabilidade para dados quantitativos 
são a variância; a sua raiz quadrada, o desvio-padrão, a amplitude 
total; o intervalo interquartil, e o desvio absoluto. 
Aulas para os farmeiros 
 
Aos farmeiros é lhes ensinado como calcular: 
 
a) A Média 
A Média de um conjunto de dados é a soma de todos valores dividida pelo número 
total de dados. 
 
Exemplo: 
Calcule a média dos seguintes conjuntos de dados 
 
__African Virtual University
Aula 2 
 
Média de dados discretos 
 
Exemplo: Encontre a media dos seguintes dados 
 
__African Virtual University
 
 
 
 
 
__African Virtual University
FAÇA O SEGUINTE
 
Calcule a media de: 
 
 
 
 
Respostas 
 
 
__African Virtual University
Aula 3 
Moda 
Exemplo 
1) Encontre a moda dos seguintes dados: 1,3,4,4,5,6,1,3,3,2,2,3,3,5
Solução: 
A moda deste conjunto é o element que aparece mais vezes. Concretamente é o 3, 
com frequência igual a 5. 
2) Encontre a moda dos seguintes dados: 22, 24, 25,22, 27, 22, 25, 30, 25, 31
Solução: 
2. 2 e 25 ocorrem três vezes cada um. Portanto, as modas são 22 e 25. Neste caso, o 
conjunto de 
dados diz-se bimodal
3) Encontre a moda dos seguintes dados: 
Olhando para a distribuição de frequências, na tabela, conclui-se que a moda do conjunto 
de dados é X = 3, com frequência 16. 
 
 
4) Encontre a classe modal dos seguintes dados: 
Neste caso, a classe modal é 70 – 74, porque apresenta a frequência mais alta 15. 
__African Virtual University
FAÇA O SEGUINTE: 
 
Determine a moda ou a classe modal dos seguintes dados: 
 
 
 
 
Respostas 
 
 
__African Virtual University
Aula 4 
Mediana 
A mediana é o valor que se encontra no centro da distribuição de dados, quando estes estão 
dispostos na ordem crescente ou decrescente. Por exemplo, no conjunto 1; 2; 3; 4; 5, amediana é 3 porque aparece no centro. Isto é, o 3 divide o conjunto em duas partes iguais. 
Nos dados 1; 2; 2; 3; 4; 5; 6; 7; 7; 8, temos 10 elementos e não existe um único no centro. 
Ou seja, existem dois valores que formam o centro e, neste caso, a mediana é determinada 
calculando a média aritmética destes dois valores. 
 
Exemplo: 
 
 
Cálculo de mediana para dados agrupados em classes 
Exemplo: Encontre a mediana dos seguintes dados em classes 
 
 
_0African Virtual University
Definição: Limite superior e limite inferior de uma classe. 
Limite inferior de classe (Li) ou a fronteira inferior de classe e Limite superior de classe (Ls) ou a 
fronteira superior de classe. Exemplo, para o intervalo 20 – 24 a fronteira inferior é 19.5 e a superior é 
24.5 e para o intervalo 35 – 39 as fronteiras inferior e superior são respectivamente 34.5 e 39.5. 
Observa a tabela seguinte: 
 
 
 
Para determinar a mediana destes dados segue os seguintes passos: 
1. Identificar a classe que contém a mediana. Neste caso, a mediana ocorre no intervalo 30 – 34, 
onde se encontra o dado da posição 20.5. 
2. Encontrar as fronteiras desta classe. Neste caso, são Li = 29.5 e s = 34.5. 
3. Determinar as frequências acumuladas. 
4. Determinar a amplitude desta classe. Faz-se Ls – Li = 34.5 – 29.5 = 5 
5. Calcular a mediana fazendo: 
 
Amplitude total de um conjunto de dados 
A amplitude total de um conjunto de dados determina-se fazendo a diferença entre o valor 
máximo e o mínimo do conjunto. 
Exemplo: Para o conjunto 23,26,34, 47,63, a amplitude é 63 – 23 = 40 e para o conjunto 121, 
65, 78, 203, 298, 174, a amplitude é 298 – 65= 233. 
 
 
__African Virtual University
Aula 5: Medidas de posição ou de Localização e de dispersão 
1) Quartís 
Dados ordenados Segundo a sua magnitude, podem ser divididos em 4 partes iguais. As 
posições extremas destas divisões são os quartís. Assim, o primeiro quatil (Q1), deixa 25% de 
elementos à esquerda. O segundo quatil (Q2), deixa 50% de elementos à esquerda. Portanto, o 
segundo quartil coincide com a mediana. O terceiro quartil, deixa 75% de elementos à esquerda. 
2) Semi-amplitude interquartil
A semi-amplitude interquartil é definida como 
 
3) Decís 
Quando os dados estão ordenados, podem ser subdivididos em 10 partes iguais, contendo, cada 
uma, 10% do total de elementos. Cada parte corresponde a um decil e se denotam por D1, D2, 
D3, ..., D8 e D9 
 
4) Percentís 
Os percentís dividem o conjunto de dados em 100 partes iguais. Assim, podemos identificar 99 
percentís, P1, P2, P3, ...., P98 e P99 
 
5) Desvio médio absoluto 
O desvio médio absoluto de um conjunto de N dados, X1, X2, X3, ..., XN, é definido como a 
média dos desvios absolutos dos valores Xj em relação à média, isto é, 
 
 
 
__African Virtual University
Exemple 
Encontre o desvio médio absolute dos seguintes dados 3, 4, 6, 8, 9.
Solução 
 
A média aritmética dos valores dados é 
 
 
E, portanto, o desvio médio absoluto é 
 
 
 
 
Dada uma tabela de frequências 
 
 
 
O desvio médio absoluto é determinado usando a fórmula 
 
 
 
 
 
 
__African Virtual University
5) Desvio Padrão
O desvio padrão de um conjunto de N dados X1, X2, ...., XN, é definido como a média 
dos desvios quadráticos, ou seja, 
 
 
Para uma tabela de frequências, 
 
 
 
O dessvio padrão calcula-se fazendo 
 
 
 
6) Variância 
A variância de um conjunto de dados é definida como o quadrado do desvio padrão. 
Geralmente usa-se o S2 para denotar a variância calculada com base numa amostra de 
uma população e para denotar a variância populacional. De mesmo modo podemos 
considerar os respectivos desvios padrão. 
__African Virtual University
Exemplos 
Encontre a media e a amplitude dos seguintes dados: 5,5,4,4,4,2,2,2
Solução 
 
E a amplitude é A = 5 – 2 = 3 
 
 
Mediana 
Exemplo 
Dadas 13 observações 1,1,2,3,4,4,5,6,8,10,14,15,17, identifique a media 
Neste caso, há que identificar a posição da media. Como o número total de dados é ímpar, 
existe um só elemento no centro. Este elemento encontra-se na posição 
2
1N
2
113 = 7. 
Daí que basta identificar o elemento que está na posição 7, nos dados ordenados. 
Concretamente, a mediana é 5. 
Mas quando o N é par, a mediana é calculada com base na média aritmética dos dois valores 
da posição central. 
 
Exemplo: No conjunto 1,1,2,2,3,4,4,5,6,8,10,14,15,17, o N = 14 e a mediana é calculada 
fazendo a média aritmética dos números das posições 
2
N = 7 e 
2
N +1 = 8. Estes números 
são 4 e 5. Portanto a mediana é 
2
54  = 4.5 
 
 
__African Virtual University
 
FAÇA ISSO 
 
Encontre a mediana dos seguintes dados: 
 
 
A Variância é a média dos desvios quadráticos 
 
 
Onde N é o número de observações e a diferença X - X é o desvio em relação à média. 
 
S2 é a variância e a sua raíz é o desvo padrão. 
 
 
 
 
 
__African Virtual University
Exemplo 
Dado o conjunto 2,4,5,8,11. Determine a variância e o desvio padrão. 
 
Na tabela seguinte estão apresentados os cálculos até a soma dos desvios quadráticos 
 
 
Portanto, a variância S2 = 
5
50 = 10 e o desvio padrão S = 10 
 
FAÇA ISSO 
 
1) Calcule a amplitude dos seguintes dados: 1,1,1,2,2,3,3,3,4,5 
10) Calcule a variância e o desvio padrão dos seguintes dados: 1,2,3,4,5
Assimetria 
Dada uma distribuição, podemos determinar um coeficiente que mede o quanto a 
distribuição é assimétrica. Podemos considerar dois tipos de assimetria: Positiva ou 
assimetria à direita e negativa ou assimetria à esquerda. Numa distribuição simétrica, a 
média é igual a moda e a mediana. Na distribuição assimétrica positiva ou à direita, a 
média é maior do que a moda e a mediana. Na distribuição assimétrica negativa ou à 
esquerda, a média é menor do que a moda e a mediana. 
Pode-se ver a seguir alguns exemplos: 
__African Virtual University
Primeiro coeficiente de Assimetria de Pearson 
 
Este coeficiente é definido como: 
 
 
 
 
Segundo coeficiente de Assimetria de Pearson 
 
Este coeficiente é definido como: 
 
 
 
O coeficiente de Assimetria determinado a partir dos quartís. 
 
 
 
 
Coeficiente de Assimetria determinado a partir dos percentís. 
 
 
 
 
 
 
 
 
__African Virtual University
Exemplo: Encontre o percentil de ordem 25, para os seguintes dados: 1, 2, 3, 4, 5, 6, 
7, 9 
 
 
Solução: Como o N = 8, faz N.(0,25) = 8.(0,25) = 2. O elemento da posição 2 é o 2 e o da
posição 3 é o 3. O percentil pedido está entre 2 e 3. Como a diferença entre estes dois 
valores é 1, para encontrar o tal percentil faz (0,25).1 + 2 = 2,25 
 
 
Encontre o percentil de ordem 50 dos dados do exercício anterior 
Solução: 8.(0,50) = 4. O tal percentil entre o quarto e o quinto elemento, 4 e 5, 
respectivamente. Como a diferença entre estes valor é 1, faz (0,50).1 + 4 = 4,5 que é o 
percentil de ordem 50 
 
 
 
 
 
__African Virtual University
FAÇA ISSO 
 
Encontre os percentís de ord m 25, 50 e 90 dos seguintes dados: e 
 
 46,21,89,42,35,36,67,53,42,75,42,75,47,85,40,73,48,32,41,20,75,48,48,32,52,61 
 
49,50,69,59,30,40,31,25,43,52,62,50 
 
 
 
Respostas 
 
a) 36 b) 48 c) 73 
 
 
 
 
 
Curtose 
 
O coeficiente de curtose mede o grau de achatamento de uma distribuição quando se 
compara a uma distribuição normal. 
 
Exemplos: 
 
 
 
 
 
 
 
 
 
 
_0African Virtual University
FAÇA ISSO 
 
Encontre a moda dos seguintes dados:
1) 1,3,4,4,2,3,5,1,3,3,5,4,2,2,2,3,3,4,4,5
2) Número de casamentos em cada 1000 pessoas na população Africanapara os anos de 
1965 a 1975 
 
 
 
 
 
 
__African Virtual University
3) Número de mortes em cada 1000 pessoas ano a ano de 1960 e de 1965 – 1975
1960 9.5 
1965 9.4 
1966 9.5 
1967 9.4 
1968 9.7 
1969 9.5 
1970 9.5 
1971 9.3 
1972 9.4 
1973 9.3 
1974 9.1 
1975 8.8 
Soluções 
1. 3 
2. 10.6 
3. 9.5 
 
 
 
 
 
 
 
__African Virtual University
Probabilidade 
 
Conceitos importantes para o cálculo das probabilidades 
Para começarmos com o cálculo das probabilidades é importante que definamos três conceitos 
básicos: 
1. Experimento ou fenómeno aleatório 
2. Espaço amostral (conjunto fundamental ou espaço de resultados ou espaço de acontecimentos)
3. Evento ou acontecimento 
I)  Experimento Aleatório 
Chama‐se Experimento Aleatório ao processo de observações ou de acção cujos resultados, 
embora podendo ser descritos no seu conjunto, não são determináveis à priori, antes da 
realização da experiência.  
Um experimento Aleatório tem as seguintes características: 
‐ A possibilidade de repetição do experimento em condições similares; 
‐ Não se poder dizer à partida qual o resultado do experimento a se realizar, mas poder descrever‐
se o conjunto de todos resultados possíveis;   
‐ A existência de regularidades quando o experimento é repetido muitas vezes. 
 
Ex: Consideremos os seguintes experimentos 
 
E1: largar uma pedra de certa altura e verificar o que vai acontecer 
Para este experimento, uma questão é certa! A pedra vai cair 
E2: Lançar uma moeda, ao ar, e verificar a face voltada para cima quando a moeda já estiver no 
chão 
Aquí, porque a moeda (honesta ou não viciada) tem duas faces, não sabemos à prior qual estará 
voltada para cima! Existem duas possibilidades. 
Portanto, E1 é um experimento não aleatório enquanto que E2 é um experimento aleatório 
Outros experimentos aleatório que podemos considerar, são por exemplo: 
E3: Lançar duas moedas, ao ar, e verificar as faces de cima. 
Neste experimento, os resultados possíveis são:   (C,C); (C,K); (K,C) e (K,K)  em que C é a face 
coroa e K é a face cara. 
E4: Lançar um dado (de 6 faces) e verificar a face voltada para cima  
Para este experimento os resultados esperados são  1 ; 2 ; 3; 4; 5; 6 
II) Espaço Amostral ou Espaço de Resultados ou Espaço de acontecimentos ou Conjunto 
Fundamental (S) 
‐ É o conjunto de todos resultados possíveis de um certo experimento 
Ex: Para o experimento anterior (E2), o espaço amostral é  S = (K , C) 
Para o experimento E3 o conjunto fundamental é S = (C,C); (C,K); (K,C); (K,K) 
Para o E4 o espaço de resultados é S =  1 ; 2 ; 3; 4; 5; 6 
III) Evento ou acontecimento 
Chama‐se Evento à qualquer subconjunto de S 
Ex: Consideremos para o experimento E3 o acontecimento A: Saida da face cara pelo menos uma 
 
__African Virtual University
Definições ou Conceitos de Probabilidade
Vamos destacar, aqui, três definições ou conceitos de probabilidades: 
I. Conceito Clássico de Probabilidade (Teoria Clássica de Laplace) 
‐ Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente 
exclusivos e igualmente prováveis, e se n(X) desses resultados tiverem o atributo X, então a 
probabilidade de X é a fracção 
N
Xn )( ; Isto é P(X) = 
N
Xn )(   onde n(X) é o nº de resultados 
favoráveis a X e N é o nº de resultados possíveis para o experimento 
 
Ex: No experimento que consiste em lançar duas moedas e verificar a face de cima, o espaço 
amostral (S) tem 4 elementos ( resultados possíveis). Então N = 4. E os casos favoráveis ao 
evento A são 3. Portanto n(A) = 3. 
Então P(A) = 
N
An )(  = 
4
3  
 
II. Conceito frequencista de Probabilidade ou abordagem empírica 
‐ Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz‐se que a 
frequência relativa de A nas N realizações é f(A) =  
N
n  
P(A) = limf(A)   
N
n      (quando N ∞) 
Para o caso do exemplo anterior, o número de realizações do experimento é N = 4 e a 
frequência relativa de A é é f(A) =  
N
n =  
4
3 . Portanto a probabilidade de A é P(A)   
N
n = 
4
3  
Portanto, aqui, a probabilidade aproxima‐se à frequência relativa do evento. 
 
III. Conceito subjectivo ou personalista de probabilidade 
‐ Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de 
credibilidade ou de confiança que cada pessoa dá à realização de um acontecimento. Baseia‐se 
na informação quantitativa (ex: frequência de ocorrência de um acontecimento) e/ou 
qualitativa (ex: informação sobre experiência passada em situações semelhantes) que o decisor 
possui sobre o acontecimento em causa. Diferentes decisores podem atribuir diferenmtes 
probabilidades ao mesmo acontecimento decorrentes da experiência, atitudes, valores, etc, que 
possuem. 
 
Exemplo:  
O João diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de 
seres corrido por um cão‐guarda (dessa casa) é de 90%. 
Mas 
O Paulo diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de 
seres corrido por um cão‐guarda (dessa casa) é de 50%. 
Aqui, o João e o Paulo dão a mesma informação ao Manuel mas podes ver que eles atribuem 
probabilidades diferentes ao evento “ ser corrido...” 
Pode ser que de 10 vezes que o João passou daquela rua foi corrido 9 vezes e que o Paulo teve 
uma sorte diferente e foi corrido apenas 5 vezes! 
Portanto, cada um está usando as suas experiências passadas para definir a probabilidade de 
alguém ser corrido ao passar daquela rua. 
Então as probabilidades por eles atribuídas ao evento acima são subjectivas. 
 
__African Virtual University
Regras de Contagem
1) Factorial 
Definição: Factorial 4 ! = 4 x 3 x 2 x 1 and 7! = 7 x 6 x 5 x 4 x 3 x 2 x 1
2) Permutação 
 
 
 
 
__African Virtual University__African Virtual University
FAÇA ISSO 
 
 
 
 
Resolva as seguintes tarefas: 
 
 
 
. 
 
 
__African Virtual University
Exemplo: 
Axiomas da teoria de probabilidades 
‐ Da necessidade de sistematização dos conceitos empregues na teoria das probabilidades e da 
construção de um corpo teórico coerente surgem os três axiomas em que se baseiam todos os 
desenvolvimentos posteriores do campo das probabilidades. 
Assim consideramos que P(  ) é uma função que associa a todo o acontecimento A definido em S 
um nº compreendido no intervalo   ; e que satisfaz os seguintes axiomas: 
 
I. P(A)  ,  A S (onde S é o espaço amostral) 
II. P(S) = 1,  ( S é um acontecimento certo) 
III. Sendo A e B acontecimentos mutuamente exclusivos definidos em S, ou seja A  B 
, tem‐se que P(AB) = P(A)  P(B) 
 
       Em geral, se A1,  A2,  A3, ..., An são acontecimentos mutuamente exclusivos definidos em S, então 
P(A1  A2  A3 ... An ) = P(A1)  P(A2)  P(A3)  ...  P( An ) =
i=1
n
 P(Ai)  
 
Exemplo: Se lançarmos um dado, qual a probabilidade de obtermos 3 pontos ou 5 pontos? 
Solução: P(3)  = 
6
1 ; P(5) = 
6
1  e, portanto, P(3 ou 5) = 
6
1 +
6
1  = 
6
2  = 
3
1  
PROBABILIDADE DA MULTIPLICAÇÃO 
Em probabilidades, há uma regra análoga ao princípio fundamental da contagem (estudado na análise 
combinatória), denominada regra do produto ou regra de multiplicação de probabilidades. 
Enunciado: 
Se um acontecimento é composto por vários eventos sucessivos e independentes, de tal modo que: 
O 1º evento é A e a sua probabilidade é P(A) 
O 2º evento é B e a sua probabilidade é P(B) 
O 3º evento é C e a sua probabilidade é P(C) 
.                                        .                          . 
.                                        .                          . 
.                                        .                          . 
O K‐ésimo evento é K e a sua probabilidade é P(K), 
Então a probabilidadede que os eventos A, B, C, ..., K, ocorram nessa ordem é 
P(A B  C ...  K) = P(A).P(B).P(C).....P(K) 
Dois acontecimentos A e B, por exemplo, são independentes se e somente se a probabilidade de A 
ocorrer após B ter ocorrido é igual a probabilidade de  A. Isto é, P(A após B) = P(A) ou 
P(B após A) = P(B) 
NOTA: Axiomas são proposições aceites sem demonstração 
 
d) Alguns teoremas importantes 
Os teoremas sempre precisam de ser demonstrados! 
Teorema 1. 
Dado um acontecimento A com probabilidade P(A), a probabilidade do seu complementar 
(acontecimento contrário) obtém‐se subtraíndo à unidade, a probabilidade de A; isto é             
P( A  ) = P(A  ) = 1 –  P(A)              c
Temos (B  A)  (B – A) = . Então os acontecimentos    (B  A) e (B – A) são mutuamente 
exclusivos 
 
 
__African Virtual University
Teorema 2. 
Aprobabilidade do acontecimento impossível; isto é P( ) = 0 
Teorema 3. 
Dados dois acontecimentos A e B quaisquer, a probabilidade do acontecimento diferença B – A é 
P(B ‐ A) = P(B) – P(A  B) 
Demonstração:   
FIGURA: 
                       
Da figura podes ver que (B  A)  (B – A) = . Então os acontecimentos    (B  A) e (B – A) são 
mutuamente exclusivos 
Mas (B  A)  (B – A) = B  
Então P(B) = P(B  A)  (B – A)]  = P (B  A)  P(B – A)   P(B – A) = P(B) ‐ P (B  A)   c.q.d 
Teorema 4. 
‐ A probabilidade da união de dois acontecimentos quaisquer (não necessariamente mutuamente 
exclusivos), A e B é                                         P(A  B) = P(A)  P(B) ‐ P (B  A) 
 
Consideremos alguns exemplos: 
a) De um baralho de 52 cartas é escolhida aleatoriamente uma carta. Qual a probabilidade de ser 
um 10 ou coração. 
Solução: A probabilidade de ser um 10 é P(10) = 
52
4 ; a probabilidade de ser coração é 
P(coração) = 
52
13   e a probabilidade de ser 10 e coração P(10 e coração) = 
52
1 . 
Portanto, a probabilidade pedida é P(A  B) = P(A)  P(B) ‐ P (B  A) = P(10) + P(coração) – P(10 
e coração) = P(10) + P(coração) – P(10 e coração) = 
52
4 +
52
13 ‐
52
1  = 
52
16  
b) No lançamento de um dado, encontre a probabilidade de que se tenha obtido o número 4 
sabendo que  sabendo que o número obtido no lançamento foi par. 
Solução: Trata‐se, aquí, de uma probabilidade condicional. Para dois eventos A e B, em geral, a 
probabilidade de ocorrência simultânea é dada por P(A  B) = P(A/B).P(B) e, portanto, 
 P(A/B) = 
P(B)
 B) (A   
Sendo A: Saida do número 4 no lançamento de um dado e B: Saida de um número par no 
lançamento de um dado 
então  P(A  B) = 
6
1  e P(B) = 
6
3 . Portanto, P(A/B) = 
P(B)
 B) (A   = 
6
3
 
6
1
= = 
3
1  
c) Uma caixa contém 3 bolas cor de laranja, 3 cor amarela e 2 cor branca. Três bolas são 
seleccionadas aleatoriamente sem reposição. Achar a probabilidade de sairem duas amarelas e 
uma branca. 
Sejam, A1: Saida de bola amarela na primeira extracção. Então, P(A1) =  8
3  
A2: Saida de bola amarela na segunda extracção após ter saido amarela na primeira. Então, 
P(A2) =  7
2  
 
B3: Saida de bola branca na terceira extracção após terem saido amarelas nas duas extracções 
anteriores. Então, P(A2) = 
6
 
2  
Então, a probabildade de sairem duas amarelas e uma branca será: 
8
3 x
7
2 x
6
2  = 
28
1  
EXERCÍCIOS 
1. De quantas maneiras diferentes 7 pessoas podem estar dispostas numa fila? 
2. De quantas maneiras diferentes 3 canetas podem ser escolhidas de 12 canetas? 
3. Se de um baralho de 52 cartas escolhermos 3, qual a probabilidade de todas serem ouro? 
RESPOSTAS 
1. (5040)                2.     (220)       3.    (0,013) 
 
 LEIA 
 
 
 
An Introduction to Probability and Rondam 
Processes by Kenneth B & Gian-Carlo, páginas 1. 
1. 20-1.22 
* Capítulo 1 de exercícios: Sets, Events & 
Probability pg 1.23-1.28 Números 1-12 & 14-20 
2. 2.1-2.33 
* Capítulo 2 de exercícios: Finite Processes pag. 
2.33 Números 1, 2, 3, 13-20 
3. Itroduction to Probability , by Charles M 
Grinstead páginas 139-141 
 
Variáveis Aleatórias 
Variáveis Aleatórias (v. a) 
Definição: Uma variável aleatória é uma função que associa a cada resultado possível de um 
experimento aleatório um número real. 
(Harry Frank & Steve C Althoen, CUP, 1994, pág. 155). 
Uma variável Aleatória é uma variável no sentido de que ela pode ser usada como um substituto de 
um número nas equações ou inequações. Sua aleatoriedade é completamente descrita pela sua função 
de distribuição acumulada que pode ser usada para determinar a probabilidade que ela toma para certos 
valores particulares. 
Formalmente, uma variável aleatória é uma função mensurável de um espaço de probabilidades ao 
conjunto de números reais. Por exemplo, uma variável aleatória pode ser usada para descrever o 
processo de lançamento de um dado perfeito e os possíveis resultados {1, 2, 3, 4, 5, 6}. A 
representação mais óbvia é tomar estes conjunto como espaço amostral, a medida de probabilidade 
como sendo uma medida uniforme, e a função sendo a função identidade. 
Variável Aleatória 
Alguns consideram variável aleatória um nome inapropriado, uma vez que variável aleatória não é 
variável mas sim uma função que transforma resultados (de um experimento) em números reais. Seja A 
uma -álgebra e o espaço amostral de resultados relevantes ao experimento a ser levado a cabo. No 
exemplo de lançamento do dado, o espaço de resultados é = {1, 2, 3, 4, 5, 6}, e A seria a potência do 
conjunto. Neste caso, uma variável aleatória apropriada seria a função identide X() = , tal que se o 
resultado é um “1” então a variável aleatória é tabém 1. Um exemplo igualmente simples mas menos 
trivial é o exemplo no qual poderíamos lançar uma moeda: um espaço amostral adequado de resultados 
possíveis é = {H, T} (para cara ou coroa), e A igual ainda à potência de . Uma entre muitas 
variávis aleatórias possíveis definidas neste espaço é: 
X() = 




Tse
Hse


,1
,0
Matematicamente, uma variável aleatória é definida como uma função mensurável de um espaço 
amostral para algum espaço mensurável 
Convergência de Variáveis Aleatórias 
 Na teoria de probabilidade, existem várias noções de convergência para variáveis aleatórias. Elas são 
listadas abaixo em ordem da sua força, isto é, qualquer noção de convergência subsequente na lista 
implica convergência de acordo com todas as noções de convergência precedentes. 
Convergência em distribuição: Como o nome diz, uma sequência de variáveis aleatórias X1, X2, ... 
converge para a variável aleatória X em distribuição se as suas respectivas funções de distribuição 
acumuladas F1, F2, ... convergem para a função de distrbuição acumulada F, de X, sempre que F é 
contínua. 
Convergência Fraca: A sequência de variáveis aleatórias X1, X2, ... é dita convergir fracamente para 
uma variávela aleatória X se )|(|lim  XXP nn = 0 para cada  > 0. A Convergência Fraca é também 
chamada deconvergência em probabilidade. 
Convergência Forte: A sequência de variáveis aleatórias X1, X2, ... é dita convergir fortemente para 
uma variávela aleatória X se )(|lim XXP nn  = 1 
A convergência Forte é também conhecida como convergência quase certa. 
Intuitivamente, convergência forte é uma versão mais forte da convergência fraca, e em ambos casos 
as variáveis aleatórias X1, X2, ... mostram uma correlação crescente com X. Todavia, no caso da 
convergência em distriubuição, os valores realizados das variáveis aleatórias não precisam de 
convergir, e qual qualquer possível correlação entre eles é imaterial. 
Lei dos Grandes Números 
Se uma moeda perfeita é atirada para cima, sabemos que aproximadamente metade de vezes terá cara 
virada para cima, e outra metade terá coroa viradapara cima. Também parece que quanto mais 
lançarmos a moeda, mais provável é que a razão de cara:coroa aproximará a 1:1. A probabilidade 
moderna permite-nos chegar formalmente ao mesmo resultado, apelidada de Lei de Grandes 
Números. Este resultado é notável porque em parte alguma foi assumido durante a construção da 
teoria e é completamente um ramo da teoria. Ligando teoricamente-deduzidas as probabilidades à sua 
frequência real de ocorrência no mundo real, este resultado é considerado como um pilar na história da 
teoria estatística. 
A Lei forte de grandes números (SLLN – strong law of large numbers) afirma que se um evento de 
probabilidade p é observado repetidamente durante experimentos independentes, a razão entre a 
fraquência observada do tal evento e o número total de repetições converge fortemente para p em 
probabilidade. 
Em outras palavras, se X1, X2, ... são variáveis aleatórias independentes de Bernoulli tomando valores 
1 com probabilidade p e 0 com probabilidade 1 – p, então a sequência de números aleatórios 
n
X n converge para p quase certamente, isto é, 
11lim  






 
p
n
n
i iX
n
P 
Teorema Central do Limite 
O teorema central do limite é a razão de ocorrência omnipresente da distribuição normal, para a qual 
é um dos teoremas mais celebrados em probabilidade e estatística. 
O teorema afirma que a média de muitas variáveis aleatórias independentes e identicamente 
distribuidas tende para uma distribuição normal independentemente da qual distribuição original as 
variáveis aleatórias seguem. Formalmente, seja X1, X2, ... variáveis aleatórias independentes com 
médias 1, 2, ..., e variâncias .. Então, a sequência das variâveis aleatórias 
 Zn = 





n
i
i
n
i
iiX
1
2
1
)(


 
converge em distribuição para uma variável aleatória normal padrão. 
Funções de Variáveis Aleatórias 
Se temos uma variável aleatória X em  e uma função mensurável f: R  R, então Y = f(X) será 
também uma variável aleatória em , uma vez que a composição de uma função mensurável é uma 
função mensurável. O memso procedimento que nos permitiu sair do espaço de probabilidade (, P) 
para (R, dFX) pode ser usado para obter a distribuião de Y. A função acumulada de probabilidade de Y 
é 
FY(y) = P(f(X)  y). 
Exemplo 
Seja X tomando valores reais, uma variável aleatória contínua e seja Y = X2. Então 
FY(y) = P(X2  y). 
Se y < 0, então P(X2,  y) = 0, assim 
FY(y) = 0 se y < 0 
Se y  0, então 
P(X2  y) = P(|X|  y) = P ),( yXy  
Assim, FY(y) = FX( y) – F (-X y) se y  0 
Distribuições de Probabilidade 
Certas variáveis aleatórias ocorrem muitas vezes na teoria de probabilidade devido a muitos processos 
naturais e físicos. Suas distribuições portanto, ganharam importância especial na teoria de 
probabilidade. Algumas distribuições discretas fundamentais são a uniforme, a de Bernoulli, a 
binomial, a binomial negativa, de Poisson e a geométrica. Distribuições contínuas importantes incluem 
a uniforme contínua, a normal, exponencial, gamma e a distribuição beta. 
Funções de Distribuição 
Uma variável aleatória X:   R definida no espaço de probabilidade (, A, P) é dada, podemos 
colocar as questões do tipo “Quão provável é que o valor de X seja maior que 2?”. Esta questão é a 
mesma que a probabilidade do evento {s   : X(s) > 2} que muitas vezes é escrito como P(X > 2), de 
forma mais breve. 
Registando todas estas probabilidades para valores reais de X resulta a distribuição de probabilidade de 
X. A distribuição de probabilidade “esquece” do espaço particular de probabilidade usado para definir 
X e somente regista as probabilidades dos diferentes valores de X. Tal distribuição de probabilidade 
pode sempre ser capturada pela sua função acumulada de probabilidade 
 FX(x) = P(X  x) 
e algumas vezes também se usa uma função de densidade de probabilidade. Em termos de teoria de 
medidas, usamos a variável aleatória X para “puxar-a-diante” a medida P em  a uma medida dF em 
R. O espaço de probabilidade  subjacente é um dispositivo técnico usado para garantir a existência de 
variáveis aleatórias, e algumas vezes para construí-las. Na prática, se dispõe juntamente do espaço  e 
somente se atribui a uma medida em R que associa medida 1 a toda recta real, isto é, trabalhamos com 
distribuições de probabilidade em vez de variáveis aleatórias. 
Teoria de Probabilidade discreta 
A teoria de probabilidade discreta lida com eventos que ocorrem em espaços amostrais enumeráveis. 
Exemplos: Lançamento de um dado, experimentos com baralhos de cartas, e uma caminhada aleatória. 
Definição clássica: Inicialmente a probabilidade de um evento a ocorrer foi definida como um número 
de casos favoráveis ao evento, sobre o número total de resultados possíveis. Por exemplo, se o evento é 
“ocorrência de um número par quando o dado é lançado”, a probabilidade é dada por 
2
1
6
3  uma vez 
que 3 faces das 6 têm números pares. 
Definição moderna: a definição moderna começa com um conjunto chamado de espaço amostral que 
relaciona ao conjunto de todos resultados possíveis no sentido clássico, denotado por  = {x1, x2, ... }. 
E depois é assumido que para cada elemento x  , um número intrínseco de “probabilidade” f(x) é 
associado, que satisfaz as seguintes propriedades: 
1. f(x) [0, 1] para todo x   
 1)( 
x
xf
Um evento é definido como qualquer subconjunto E do espaço amostral . A probabilidade do 
evento 
 P(E) = 
Ex
xf )(
Assim, a probabilidade de todo espaço amostral é 1, e a probabilidade do evento nulo é 0. 
A função f(x) que transforma um ponto no espaço amostral ao valor da “probabilidade” é chamada 
uma função de massa de probabilidade abreviada como fmp (= pmf-probability mass function). A 
definição moderna não tenta responder como as funções de massa de probabilidade são obtidas, em vez 
disso constrói uma teoria que assume sua existência. 
Teoria de Probabilidade Contínua 
A teoria de probabilidade contínua lida com eventos que ocorrem num espaço amostral contínuo. 
Se o espaço amostral é um conjunto de números reais, então uma função chamada de função 
acumulada de probabilidade ou fadF (=cdfF – cumulative distribution function) é assumida a 
axistir, que resulta em P(X  x) = F(x) 
fadF deve satisfazer as seguintes propriedades: 
1. F é uma função monótona não decrescente e contínua à direita 
2. 0)( lim  xFx
3. 1)( lim  xFx
Se F é diferenciável, então a variável aleatória é dita ter uma função de desnsidade de probabilidade 
ou fdp ou simplesmente densidade f(x) = 
dx
xdF )( 
Para um conjunto E R, a probabilidade da variável aleatória em E é definida como 
P(X  E) =  Ex xdF )(
No caso da densidade existir, então a função anterior pode ser escrita como 
P(X  E) =  Ex dxxf )(
Enquanto que a fdp existe somente para variáveis aleatórias contínuas, a fad existe para todas variávis 
aleatórias (incluíndo para variáveis aleatórias discretas) que tomam valores em R. 
Estes conceitos podem ser genaralizados para casos de espaços multidimensionais ou seja em Rn. 
Função de Densidade de Probabilidade 
Distribuição discreta 
Se X é uma variável que pode assumir um conjunto discreto de valores X1, X2, X3, ..., Xk com respeito 
a probabilidades p1, p2, p3, ...., pk, onde p1 + p2 + p3 + ....... + pk = 1 dizemos que uma distribuição 
discreta de probabilidade para X foi definida. A função p(X), com os valores respectivos p1, p2, p3, ..., 
pk para X = X1, X2, X3, ..., Xk é chamda de função de probabilidade, ou função de frequência, de X. 
Porque X pode assumir certos valores com probabilidades dadas, esta função é muitas vezes chamada 
uma variávelaleatória discreta. Uma variável aleatória é também conhecida como uma variável de 
chance ou variável estocástica. {Murray R, 2006, pág. 130). 
Distribuição Contínua 
Supõe que X é uma variável aleatória contínua. Uma variável aleatória contínua X é especificada pela 
sua funçao de densidade de probabilidade que é escrita f(x) quando f(x)  0 em todo intervalo de 
valores para os quais x é válido. Esta função de densidade de probabilidade pode ser representada por 
uma curva, e as probabilidades são dadas pela área por baixo da curva. 
 
A área total por baixo da curva é igual a 1. A área por baixo da curva entre as rectas x = a e x = b 
(sombreada) corresponde a probabilidade de X entre a e b, que pode ser denotada por P(a < X < b). 
P(X) é chamada uma função de densidade de probabilidade e a variável X é muitas vezes chamada de 
uma variável aleatória contínua. 
Uma vez que a área total por baixo da curva é igual a 1, segue a probabilidade do espaço entre a e b é 
dada por 
 P(a  X  b) = b
a
dxxf )(
que é a área sombreada. 
Nota: ao calcular a área entre a e b, não distinguimos as desigualdades ( e ) e (< e >). Assumimos 
que as rectas em a e b não têm grossura e a sua área é igual a zero. 
 
Exemplos resolvidos: 
1) Uma variável aleatória X está distribuida com a função densidade de probabilidade f definida 
por 
f(x) = kx(16 – x2), para 0 < x < 4 
Avalie 
a). O valor da consatante k 
b). A probabilidade do espaço P(1 < X < 2) 
c). A probabilidade P(X  3) 
 
Solução 
 
Para qualquer função f(x) tal que 
f(x)  0, para a  X  b, 
e = 1 b
a
dxxf )(
pode ser tomada como a função de densidade de probabilidade (f. d. p) de uma variável aleatória 
contínua no intervalo a  X  b. 
Procedimento 
Passo 1: Em geral, se X é uma variável aleatória contínua (v. a. c.) com f. d. p. f(x) válida no 
intervalo a  X  b, então 
 
Xa
dxxf
||
1)( , isto é 

b
a
dxxf )( = 1 
Passo 2: 
a) Para determinar k, usamos o facto de que f(x) = kx(16 – x2), para 0  X  4, então 
1)16(
4
0
2  dxxkx 
 k 1)16(
4
0
3  dxxx
 k = 
64
1 
Passo 3 
b). Determinar P(1 < X < 2) 
Solução 
P(1 < X < 2) = 2
1
)( dxxf
 = 
64
1  
2
1
3 )16( dxxx = 
256
81 
 
Passo 4 
c). Determinar P(X  3) 
P(X  3) = 
64
1  4
3
3 )16( dxxx = 
256
49 
 
Exemplo 2 
 
2). X é a variável aleatória contínua ‘a massa de uma substância, em kg, por minuto num processo de 
produção industrial’, onde 
f(x) = 


 
casosoutrosem
Xxx
0
)30()6(
12
1
 
Determinar a proabilidade de que a massa seja mais que 2 kg. 
 
Solução 
 
X pode tomar valores somente de 0 a 3. Esboçamos o gráfico de f, e sombreamos a área requerida. 
 
P(X > 2) =  3
2
)6(
12
1 dxxx 
 =  3
2
2 )6(
12
1 dxxx 
 = 
3
2
3
2
3
3
12
1 

  xx 
 = 0,722 (3 casas decimais) 
A probabilidaade de que a massa seja mais do que 2 kg é de 0,722 
Exemplo resolvido 
3). Uma variável aleatória contínua tem fdp f(x) onde 
 f(x) = kx2, 0  X  6 
a). Determinar o valor de k 
b). Determinar P(2  X  4). 
 
Solução 
a) Uma vez que X é uma variável aleatória, a probabilidade total é igual 1, isto é, 
 
||
1)(
a
dxxf 
  = 1 
6
0
2dxkx
 1
3
6
0
3


kx 
 1
3
216 k 
 k = 
216
3 
Portanto, f(x) = 22
72
1
216
3 xx  , 0  X  6 
b) 
 
P(2  X  4) = 4
2
2
72
1 dxx 
 = 
4
2
3
216
1

x 
 = 0,259 
Portanto, a probabilidade P(2  X  4) = 0,259 
 
Exemplo resolvido 
4). Uma variável aleatória contínua (v. a c) tem a função de densidade de probabilidade f. d. p. f(x), 
onde 
f(x) = 





casosoutrosem
Xxk
Xk
0
)52()32(
20
a) Determinar o valor de k 
b) Esboçar y = f(x) 
c) Determinar P(X  1) 
d) Determinar P(X > 2,5) 
 
Solução 
a) Uma vez que X é uma variável aleatória, então 
 
Xa
dxxf
||
1)( 
Portanto, 
   2
0
5
2
1)32( dxxkkdx
 = 1   52220 3xxkkx 
 2k + 19k = 1 
 k = 
21
1 
b) Assim a f. d. p de X é 
f(x) = 









casosoutrosem
Xx
X
0
)52()32(
21
1
20
21
1
 
Esboço do gráfico de f: 
 
c) P(X  1) = área por baixo do gráfico entre zero e 1 = C  L = 1  
21
1 = 
21
1 = 0,048 
d) Determinar P(X > 2,5) = área do rectângulo + área do trapézio 
= (
21
1  2) + (
21
1 {0,5}{
21
1 + 
21
2 }) = 131,0
84
11  
 
 
 
 
 
 
 
 
 
 
 RESOLVE 
 
 
1). A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = k, 0  X  3. 
a) Esboce y = f(x) 
b) Determine o valor da constante k 
c) Determine P(0,5  X  1) 
 
2) A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = kx2, 1  X  4 
a) Determine o valor da constante 
b) Determine P(X  2) 
c) Determine P(2,5  X  3,5) 
3) A variável aleatória contínua X tem a f. d. p f(x) onde 
f(x) = 





casosoutrosem
Xxk
Xk
0
)32()12(
20
Determine o valor da constante k 
a) Esboce y = f(x) 
b) Determine P((X  2) 
c) Determine P(1  X  2,2) 
Reflexão: Os professores podem encontrar o software de produção de 
gráficos úteis no ensino da estatística. 
Um exemplo do software da Fonte Aberta é o Graph. Veja na página 
http://www.padowan.dk/graph/ 
Se tem acesso ao computador, faça o download graph e explore as suas 
ferramentas estatísticas 
A seguir está um exemplo de diferentes curvas que podem ser desenhadas 
com o recurso a Graph. 
 
Esperança 
Definição 
Se X é uma variável aleatória contínua com a função de densidade de probabilidade (f. d. p) f(x), então 
a esperança de X é E(X) onde 
E(X) = 
Xa
dxxXf
||
)(
NB: E(X) é muitas vezes denotada por  e referida como a média de X 
 
Exemplo 
1) Se X é uma variável aleatória contínua com f. d. p f(x) = 2
16
1 x , 0  X  3, determine E(X). 
Solução 
E(X) = 
Xa
dxxXf
||
)(
 3
0
2}{
16
1 dxXX = 
64
81
416
1
3
0
4


 x = 1,265 
 
2) Se a variável aleatória contínua X tem f. d. p. 
f(x) = 
5
2 (3 + x)(x – 1), 1  X  3, determine E(X). 
E(X) = 
Xa
dxxXf
||
)(
 3
0
)1)(3}({
16
1 dxxxX = 
60
608
2
3
3
2
45
2
3
1
234


  xxx = 10,13 
Generalização 
Se f(x) é uma função qualquer da variável aleatória contínua X tendo a f. d. p. f(x), então 
E[g(X)] = 
Xa
dxxfxg
||
)()(
e em particular 
E(X2) = 
Xa
dxxfX
||
2 )(
A seguinte conclusão é consistente 
1. E(a) = a 
2. E(aX) = aE(X) 
3. E(aX + b) = aE(X) + b 
4. E[f1(X) + f2(X)] = E[f1(X)] + E[f2(X)] 
 
Exemplo 
 
1) Uma variável aleatória contínua X tem f. d. p. f(x) onde f(x) = x
2
1 , 0  X  3 
Determine 
a) E(X) 
b) E(X2) 
c) E(2X + 3) 
 
Solução 
 
a) E(X) = = 
Xa
dxxXf
||
)( 3
0
2
2
1 dxx = 
3
0
3
32
1 

 x = 4,5 
 
b) E(X2) = = 
Xa
dxxfX
||
2 )( 3
0
3
2
1 dxx = 
3
0
4
42
1 

 x = 
8
81 = 10,125 
 
c) E(2X + 3) = E(2X) + 3 = 2E(X) + 3 = 2(4,5) + 3 = 12 (a partir de a) acima) 
 
 
RESOLVE 
 
1) A variável aleatória contínua X tem a f. d. p. f(x), onde 
f(x) = 






casosoutrosem
Xxk
xk
Xkx
0
)53()4(
31
10
a) Determine k 
b) Calcule E(X) 
 
2) A variável aleatória contínua X tem a f. d. p f(x) onde f(x) = )3(
101 x , 0  X  5 
Determine 
a) E(X) 
b) E(2X + 3) 
c) E(X2) 
d) E(X2 + 2X – 1) 
 
Distribuição de Bernoulli 
Na teoria de probabilidade e estatística, a distribuição de Bernoulli, assim chamada em homenagem 
ao cientísta Suiço Jacob Bernoulli, é uma distribuição discreta de probabilidade, que toma o valor 1 
com a probabilidade de sucesso p e valor 0 com a probabilidade de fracasso q = 1 – p. Assim se X é 
uma variável aleatória com esta distribuição, temos 
P(X = 1) = 1 – P(X = 0) = p. 
A função f de massa de probabilidade desta distribuição é: 
f(k; p) = 





casosoutrosem
ksep
ksep
0
01
1
O valor esperado de uma variável aleatória de Bernoulli X é E(X) = p, e sua variância Var(X) = p(1 – 
p). 
A curtose tende para o infinito para os valores altos e baixos de p, mas para p = 
2
1 a distribuição de 
Bernoulli tem a curtose mais baixa do que qualquer outra distribuição, nomeadamente -2. 
A distribuição de Bernoulli faz parte da família da distribuição exponencial. 
Distribuição Binomial 
Na teoria de probabilidade e estatística, a distribuição binomial é uma distribuição discreta de 
probabilidade do número de sucessos numa seuqência de n experimentos independentes do tipo 
sim/não cada um dos quais resulta em sucesso com probabilidade p. Um tal experimento de sucesso 
/fracasso é também chamado de experimento de Bernoulli ou ensaio de Bernoulli. De facto, quando n 
= 1, a distribuição binomial é uma distribuição de Bernoulli. A distribuição binomial é a base para o 
teste popular binomial da significância estatística. 
Exemplos 
Um exemplo elementar é o seguinte: lançar um dado para cima dez vezes e contar o número de 1s 
como resultado. Então este número aleatório segue uma distribuição binomial com n = 10 e p = 
6
1 
Por exemplo, assume que 5% da população tem olhos verdes. E você retira 500 pessoas 
aleatoriamente. O número de pessoas de olhos verdes você retira é uma variável aleatória X que segue 
uma distribuição binomial com n = 500 e p = 0,05 (quando a retirada de pessoas é com reposição). 
Exemplos 
1). Uma moeda é lançada para cima 3 vezes. Determine a probabilidade de obter 2 caras e uma coroa 
em qualquer ordem dada. 
Fórmula 
Podemos usar a fórmula     xnxnx ppC  1 
Onde n = ao número total de lançamentos 
 x = número de sucessos (1, 2, ...) 
 p = probabilidade de sucessos 
1º determina o número de possbilidades em que um sucesso pode ocorrer nxC
2º é a probabilidade de obter x sucessos  xp
3º é a probabilidade de obter n – x fracassos.   xnp 1
Solução 
Lançar 3 vezes significa n = 3 
Duas caras significa x = 2 
P(Cara) = 
2
1
; P(Coroa) = 
2
1
 
P(2 caras) = 
232
3
2 2
11
2
1 

 

C = 3  
4
1  
2
1
= 
8
3
 
RESOLVE 
 
 
1) Determine a probabilidade de obter exactamente um 5 quando um dado é lançado 3 vezes. 
2) Determine a probailidade de obter 3 caras quando 8 moedas são lançadas para cima. 
3) Uma urna contém 4 bolas vermelhas e 2 bolas verdes. Uma bola é extraída da urna e reposta na urna 
4 vezes. Qual a probabilidade de obter exactamente 3 bolas vermelhas e 1 bola verde? 
Resposta 
1) P(um 5) = 
72
25
6
5
6
1 213
1 



C = 0,347, isto é n = 3, x = 1 e p = 
6
1
 
2) P(3 caras) = 
32
7
2
1
2
1 538
3 



C = 0,218, isto é n = 8, x = 3, p = 
2
1
 
3) P(3 bolas vermelhas) = 
81
32
3
1
3
2 134
3 



C = 0,395 isto é n = 4, x = 3, p = 
3
2
 
 LEIA 
 
1. Lectures on Statistics, By Robert B. Ash, , page 1-4 
 Processes By 
is aleatórias (Random Variables) pág 3.64-3.82 
 Probability By Charles M. Grinstead 
8 
ki/Bernoulli_distribution
• Exercícios Nos.1, 2 e 3 na pág 4. 
2. An Introduction to Probability & Random
Kenneth B & Gian-Carlo R, pág. 3.1-3.63 
• Exercício Capítulo 3: Variáve
Nrs. 1-7, 11-17, 20-24, 34-36 
3. An Introduction to
Pág. 96-107, & 184 
• Exercícios nas pág. 113-11
Nrs. 1,2,3,4,5,8,9,10,19,20 
Ref: http://en.wikipedia.org/wiki/measurable_space 
Ref: http://en.wikipedia.org/wiki/Probability_theory 
Ref: http://en.wikipedia.org/wi 
tempo fixo se tais eventos ocorrem com uma taxa média conhecida, e são independentes do tempo a 
adas telefónicas por hora 
s vermelhos no sangue numa certa área. 
A probabilidade de X sucessos é: 
 
Distribuição de Poisson 
Na teoria de probabildade e estatística, a distribuição de Poisson é uma distribuição discreta de 
probabilidade que exprime a probabilidade de um número de eventos ocorrendo em um período de 
partir do último evento. 
A distribuição foi descoberta por Siméon-Denis Poisson (1781-1840). 
A distribuição de Poisson algumas vezes é chamada uma distribuição Poissonian, análogo ao termo 
Gaussiano para a distribuição de Gauss ou distribuição normal. 
A distribuição de Poisson é usada quando a variável ocorre num período de tempo, volume, área, etc. 
... e pode ser usada para chegadas de aviões em aeroportos, o número de cham
num estação, o número de glóbulo
!X
e x
 onde e é uma consatante matemática = 2,7183 
 é a média ou valor esperado das variáveis. 
 500 páginas manuscritas, determine 
idade de uma página dada tenha exactamente 4 erros. 
Determinar a média de erros  = 

 
 
 
 
 
Exemplo 
Se ocorrem 100 erros tipográficos distribuidos aleatoriamente em
a probabil
Solução 
5500
1100  = 0,2 
Em outras palavras, existe uma média de 0,2 erros por cada página. Neste caso x = 4, assim a 
probabilidade de escolher uma página com exactamente 4 erros é 

!X
e x
 = 
   
!4
2,07183,2 42,0
= 0,00168 
 Cerca de 0,2%
Trabalho em grupo 
1. Estude o cálculo da probabilidade e 
resolve a quesão que se segue 
Exemplo Resolvido 
Uma linha telefónica gratis recebe uma média de 4 chamadas por hora para qualquer hora dada. 
etermine a probabilidade de que ela receba exctamente 5 chamadas. 

D
!X
e x
 = 
  
!5
2,07183,2 53
= 0,1001 
RESOLVE 
Que é 10% 
 
 
Uma Companhia de Marketing de telefone obtém uma média de 5 encomendas em cada 1000 
chamadas. Se a companhia liga para 500 pessoas, determinar a probabilidade de obter 2 encomendas 
o 
ue é 26% 
 LEIA 
Soluçã
0,26 
Q
 
 
 
1. An Introduction to Probability & Random Processes By 
tas dos problemas 1,2,3 na pág 15. 
ef: http://en.wikipedia.org/wiki/Normal_distribution
Kenneth B & Gian-Carlo R, pág. 187-192 
2. Robert B. Ash, Lectures on Statistics, pág. 1 e respos
R 
distribuição geométrica é uma das duas distribuições 
nsaios de Bernoulli necessárias para obter um 
amos “a” distribuição geométrica por uma meras questão de convecção 
p1, então a probabilidade de que k 
ssários para obter um sucesso é 
.p0 
para k = 1, 2, 3, ... 
s em cada ensaio é p0, então a probabilidade de que 
primeiro sucesso é 
0 
para k = 0, 1, 2, 3, ... 
Em cada um dos casos, a sequência de probabilidades é uma sequência geométrica. 
 
Distribuição Geométrica 
Na teoria de probabilidade e estatística, a 
discretas: 
 a distribuição de probabilidade do número X de e
sucesso, realizadas no conjunto {1, 2, 3, ...} ou 
 a distribuição de probabilidade do número Y = X – 1 de fracassos antes do primeiro sucesso, 
sobre o conjunto {0, 1, 2, 3, ... } 
Uma destas distribuições cham
e conveniência. 
Se a probabilidade do sucesso em cada um dos experimentos é 
experimentos sejam nece
P(Y = k) = (1 – p0)k
Equivalentemente, se a probabilidade de sucesso
haja k fracassos antes do 
P(Y = k) = (1 – p0)k.p