Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Brasília - DF.
Estatística básica
Autores
Heitor Achilles Dutra da ROSA
Produção
Equipe Técnica de Avaliação, Revisão Linguística e 
Editoração
Sumario
Organização do caderno de estudos e pesquisa ..................................................................................................... 4
Introdução ............................................................................................................................................................................. 6
Aula 1
Pensamentos Estatísticos .......................................................................................................................................... 7
Aula 2
Organização e Descrição de Dados ......................................................................................................................23
Aula 3
Medidas de tendência central e medidas de variabilidade .........................................................................35
Aula 4
Probabilidade ...............................................................................................................................................................52
Aula 5
Distribuição de probabilidade de variáveis aleatórias discretas ...............................................................75
Aula 6
Distribuição de probabilidade de variáveis aleatórias contínuas..............................................................82
Tabelas estatísticas ..........................................................................................................................................................95
Referências ..........................................................................................................................................................................96
4
Organização do caderno de 
estudos e pesquisa
Para facilitar seu estudo, os conteúdos são organizados em unidades, subdivididas em capítulos, 
de forma didática, objetiva e coerente. Eles serão abordados por meio de textos básicos, com 
questões para reflexão, entre outros recursos editoriais que visam a tornar sua leitura mais 
agradável. Ao final, serão indicadas, também, fontes de consulta, para aprofundar os estudos 
com leituras e pesquisas complementares.
A seguir, uma breve descrição dos ícones utilizados na organização dos Cadernos de Estudos e Pesquisa.
Provocação
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes 
mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor 
conteudista.
Para refletir
Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa 
e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. 
É importante que ele verifique seus conhecimentos, suas experiências e seus 
sentimentos. As reflexões são o ponto de partida para a construção de suas 
conclusões.
Sugestão de estudo complementar
Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, 
discussões em fóruns ou encontros presenciais quando for o caso.
Praticando
Sugestão de atividades, no decorrer das leituras, com o objetivo didático de 
fortalecer o processo de aprendizagem do aluno.
5
Organização do caderno de estudos e pesquisa
Atenção
Chamadas para alertar detalhes/tópicos importantes que contribuam para a 
síntese/conclusão do assunto abordado.
Saiba mais
Informações complementares para elucidar a construção das sínteses/conclusões 
sobre o assunto abordado.
Sintetizando
Trecho que busca resumir informações relevantes do conteúdo, facilitando o 
entendimento pelo aluno sobre trechos mais complexos.
Para (não) finalizar
Texto integrador, ao final do módulo, que motiva o aluno a continuar a aprendizagem 
ou estimula ponderações complementares sobre o módulo estudado.
6
Introdução
Este caderno de estudos se destina a alunos do curso de Graduação a distância em Administração 
da AVM e apresenta uma introdução conceitual do campo da estatística e algumas aplicações. 
As aplicações correspondem a problemas contextualizados que exigem a análise de certos dados 
apresentados, bem como a escolha de um método conveniente para tratá-los estatisticamente. 
Sendo assim, ao longo de cada aula serão discutidas, desenvolvidas e ampliadas algumas técnicas 
estatísticas a fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que 
as questões apresentadas irão, constantemente, exigir que o estudante se posicione criticamente 
frente às mesmas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios 
para tomada de decisões na solução de problemas. Apesar do forte caráter das aplicações, é 
importante lembrar que, em todos os momentos, o rigor característico da linguagem matemática 
está presente, uma vez que um dos objetivos deste módulo é articular teoria e prática. Vale 
observar ainda que não existe preocupação de esgotar por completo os conceitos abordados, 
embora estejam incluídas referências bibliográficas para aqueles que assim desejam.
Este caderno de estudos tem como objetivos:
 » Servir de instrumento de reflexão, discussão e problematização em torno de temas e 
questões fundamentais presentes na prática de uma empresa e/ou organização.
 » Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um 
banco de dados.
 » Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas.
Enfatizar o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das 
inferências feitas a partir de dados, não só para aqueles que consomem, mas também para 
aqueles que produzem.
7
Apresentação
Esta aula apresenta algumas definições básicas de conceitos relacionados à estatística. Além 
disso, busca demonstrar o papel-chave que a estatística desempenha no raciocínio crítico, seja 
ele, elaborado no decorrer desse curso, no trabalho ou na vida diária.
Objetivos
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Identificar quais os objetivos da ciência estatística.
 » Identificar tipos de aplicações estatísticas na empresa.
 » Reconhecer quais são os elementos fundamentais da estatística.
 » Identificar e escolher adequadamente um método estatístico para análise de populações.
 » Classificar dados estatísticos.
 » Estabelecer um critério para coleta de dados.
 » Entender o papel da estatística no gerenciamento da tomada de decisões.
1AulAPEnSAMEnTOS ESTATíSTIcOS
8
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
O que é estatística?
Você pode ainda não ter notado, mas seja qual for a sua opinião sobre questões cotidianas, você 
sempre encontra ou poderá encontrar estatísticas ou pesquisas estatísticas para apoiar seus pontos 
de vista – quer seja para tomar algum tipo de vitamina ou para saber se o ensino integral é mais 
eficaz no desenvolvimento das crianças, ou até mesmo se um alimento faz mal ou bem. Existe 
um infinito fluxo de informações para auxiliá-lo a tomar decisões, podendo essas serem seguras 
ou não, parciais ou imparciais. Mas, qual o significado da estatística? Sabe-se, por exemplo, que 
ela pode ser capaz de fazer alguém pensar na média de gols por rodada de um campeonato, fazer 
com que se possa refletir sobre os números do desemprego no país e no mundo ou até mesmo 
em distorções numéricas de fatos. 
Dessa forma, a estatística aparece como uma ciência importante, útil e com um escopo abrangente 
de aplicações em negócios, administração, política, física e ciências sociais, quase ilimitado.
Definição 1.1
Estatística é a ciência da coleta, organização e interpretação de fatos numéricos, chamados de 
dados.
Vale lembrar que um estatístico além de calcular médias e/ou tabular resultados é também capaz 
de coletar informações numéricas em forma de dados, a fim de avaliá-los e a partir delestirar 
determinadas conclusões. Os estatísticos também são capazes de determinar qual informação 
é relevante em um dado problema e se as conclusões obtidas a partir de certo estudo podem ou 
não ser confiáveis.
Muitas descrições numéricas como, por exemplo, taxas mensais de desemprego, índice de falência 
para um novo negócio e proporção de mulheres executivas em um setor particular representam 
descrições estatísticas de um grande conjunto de dados coletados sobre algum fenômeno. Muitas 
vezes, os dados selecionados pertencem a algum conjunto maior do qual se deseja obter alguma 
característica. Este processo de seleção é chamado de amostragem. 
Por exemplo, você pode coletar as idades de uma amostra de consumidores em uma videolocadora 
para estimar a idade média de todos os consumidores da loja. Assim, você poderia usar suas 
estimativas nos anúncios da loja para atingir o grupo ou faixa etária apropriada. Nesse exemplo, 
a estatística envolve dois diferentes processos:
 » Descrever conjuntos de dados;
 » Obter conclusões (fazer estimativas, previsões, tomar decisões) sobre os conjuntos de 
dados baseados na amostragem.
9
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
O exemplo sugere duas aplicações da estatística, sendo assim, esta pode ser dividida em duas 
grandes áreas: estatística descritiva e estatística inferencial.
Definição 1.2
A estatística descritiva utiliza métodos numéricos e gráficos para coletar, organizar e descrever 
dados. 
Exemplo 1.1 – “Divisão do mercado norte-americano de cartões de crédito e débito” (U.S. Payment 
Card Information Network, 22 nov. 2005).
A CardWeb.com, Inc. é líder em publicações 
on-line de informações referentes a cartões de 
pagamento (isto é, crédito, débito, smart, pré-
pago e cartões telefônicos). Em 2005, a empresa 
rastreou, nos EUA, todas as compras efetuadas 
com cartões de crédito ou débito. A quantidade 
de cada compra foi gravada e classificada de 
acordo com o tipo de cartão usado. Os resultados 
são mostrados na figura 1.1 a seguir.
Figura 1.1 – Divisão do mercado de cartões de crédito norte-americano em 2005.
(Fonte: www.carddata.com)
Definição 1.3
A estatística inferencial utiliza uma amostra de dados para fazer estimativas, decisões, previsões 
ou outras generalizações acerca de um conjunto maior de dados.
Exemplo 1.2 – “O Índice de preços ao consumidor” (Departamento do trabalho Norte-americano).
Saiba mais
Um dos maiores usos do IPC como um índice de inflação 
é o de indicador do sucesso ou fracasso das políticas 
econômicas do governo. Outro uso é o de índice de 
reajuste dos salários. Milhões de trabalhadores possuem 
dissídios salariais em seus acordos sindicais coletivos; 
estas cláusulas indicam os aumentos nas taxas salariais 
com base em aumentos do IPC. Além disso, os benefícios 
da Previdência Social, a aposentadoria militar e os 
salários do funcionalismo público estão atrelados ao IPC. 
10
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Um conjunto de dados que virtualmente interessa à população de qualquer país é o conjunto 
de preços cobrados por bens e serviços na economia desse país. A tendência geral de aumento 
nesses preços é chamada inflação e a queda nos preços é conhecida como deflação. De modo 
a estimar a alteração nos preços ao longo do tempo, o Bureau de Estatísticas do Trabalho (BLS) 
do Departamento de Trabalho norte-americano desenvolveu o Índice de Preços ao Consumidor 
(IPC). A cada mês, o BLS coleta dados de preços de uma seleção específica de bens e serviços 
(chamados de cesta de bens e serviços) de 85 áreas urbanas do país. Procedimentos estatísticos 
são usados para calcular o IPC dessa amostra de dados de preços e de outras informações sobre 
os hábitos de consumo das pessoas. Ao comparar o IPC em diferentes momentos, é possível 
estimar (fazer uma inferência sobre) a taxa de inflação em um intervalo de tempo e comparar o 
poder de compra do dólar em diferentes momentos no tempo. Este é um exemplo de estatística 
inferencial, os dados de preço da cesta de bens e serviços coletados de uma amostra de áreas 
urbanas (usados para calcular o IPC) são usados nas inferências sobre a taxa de inflação e o 
aumento dos salários.
conceitos fundamentais da estatística
Métodos estatísticos são particularmente úteis para estudar, analisar e aprender sobre populações 
de unidades experimentais.
Definição 1.4
Chama-se unidade experimental um objeto a partir do qual correlatamos dados.
Definição 1.5
Chama-se população um conjunto universo qualquer, do qual desejamos obter informações, 
cujos elementos devem apresentar pelo menos uma característica em comum.
Exemplo 1.3 – Exemplos de Populações.
Todos os trabalhadores desempregados no Brasil; todos os eleitores da cidade do Rio de Janeiro; 
todos os carros produzidos no ano de 2007 no Brasil; todas as vendas realizadas no drive-thry de 
uma lanchonete da rede McDonald´s durante o ano de 2008; o conjunto de todos os atropelamentos 
ocorridos no 1º semestre de 2006 em Copacabana.
Ao estudar uma população, focamos uma ou mais características ou propriedades das unidades 
experimentais na população. Essas características são denominadas variáveis.
Definição 1.6
Chama-se variável uma característica ou propriedade de uma unidade experimental.
11
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Ao estudar uma variável em particular, é útil obter-lhe uma representação numérica. Muitas 
vezes para obter essa representação é necessário estabelecer um processo de medição. Sendo 
assim, a medição é o processo que utilizamos para atribuir números às variáveis de unidades 
populacionais distintas. Pode-se, por exemplo, medir a qualidade de um serviço solicitando a um 
cliente para avaliar a eficiência do serviço em uma escala de 1 a 10. Ou pode-se mensurar a idade 
da força de trabalho simplesmente fazendo a pergunta: “qual a sua idade?” De acordo com o caso, 
a medição pode envolver instrumentos específicos como cronômetros, réguas e calibradores.
Quando a população estudada é pequena, pode-se medir uma variação para cada unidade dessa 
população. Por exemplo, deseja-se medir o salário inicial de todos os graduados em Administração 
do IAVM em um determinado ano. É pelo menos factível obter cada salário. Nesse caso, em que 
se consegue medir uma variável para cada unidade experimental de uma população, o resultado 
obtido é denominado censo.
Definição 1.7
Chama-se censo o levantamento total da população. Nesse caso, cada elemento da população 
é analisado individualmente.
Porém, em muitos casos, a população de interesse envolve talvez muitos milhares ou ainda um 
número infinito de unidades. Sendo assim em vez de considerar toda a população, pode-se analisar 
uma parte dela. Mesmo porque, dependendo do caso, conduzir um censo para populações muito 
grandes pode ocasionar um custo proibitivo em termos de tempo e dinheiro. Uma alternativa 
razoável é selecionar e estudar um subconjunto (ou porção) das unidades na população.
Definição 1.8
Chama-se amostra todo subconjunto de unidades de uma população.
Exemplo 1.4 – Auditoria de faturamento.
Suponha que uma empresa está sendo auditada em seu faturamento. Em vez de examinar 
todas as 25.487 faturas emitidas durante certo ano, um auditor pode selecionar e examinar uma 
amostra de apenas 100 faturas. Se o interesse for a variável “fatura com erro”, gravaria (mediria) 
a condição (erro ou não erro) de cada fatura da amostra. Após cada variável de interesse de 
unidade experimental na amostra (ou população) ser medida, os dados são analisados por 
métodos estatísticos descritivos ou inferenciais. O auditor, por exemplo, pode apenas descrever 
a taxa de erro na amostra de 100 faturas. Contudo, é mais provável que ele utilize a informação 
obtida para fazer inferências sobre a população de todas as 25.487 faturas.
12
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Definição1.9
Uma inferência estatística é uma estimativa ou previsão ou alguma outra generalização sobre 
uma população com base em informações contidas numa amostra.
EXERCÍCIO RESOLVIDO
A Guerra das “Colas” é o termo popular para a intensa competição entre Coca-Cola e Pepsi 
mostrada em suas campanhas de marketing. As campanhas têm estrelas do cinema e televisão, 
vídeos de rock, apoio de atletas e afirmações preferenciais dos consumidores com base em 
testes de sabor. Como uma parte de uma campanha de marketing da Pepsi, suponha que 1 
000 consumidores de refrigerante sabor cola submetam-se a um teste cego de sabor (isto é, as 
marcas estão encobertas). Cada consumidor é questionado quanto à sua preferência em relação 
à marca A ou B.
( A ) Descreva a população.
( B ) Descreva a variável de interesse.
( C ) Descreva a amostra.
( D ) Descreva a inferência.
SOLUÇÃO
( A ) Uma vez que estamos interessados nas respostas dos consumidores de refrigerantes 
sabor cola no teste de sabor, um consumidor desse tipo de refrigerante é uma unidade 
experimental. Assim, a população de interesse é a coleção ou conjunto de todos esses 
consumidores.
( B ) A característica que a Pepsi deseja medir é a preferência do consumidor de refrigerante 
sabor cola revelada sob a aplicabilidade de um teste cego, logo, a preferência pelo tipo 
de refrigerante é a variável de interesse.
( C ) A amostra é de 1 000 consumidores de refrigerantes, sabor cola, selecionados da 
população de todos os consumidores desse tipo de refrigerante.
( D ) A inferência de interesse é a generalização da preferência de refrigerante sabor cola dos 
1 000 consumidores da amostra para a população de todos os consumidores desse tipo 
de refrigerante. Em particular, as preferências dos consumidores da amostra podem ser 
usadas para estimar o percentual de todos os consumidores que preferem cada marca.
Ao se fazer inferências, surgem questões em torno do quanto essas podem ser válidas ou “boas” 
para o que se pretende analisar e/ou interpretar, isto é, precisa-se determinar a sua confiabilidade. 
13
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
A única forma de se ter certeza de que uma inferência sobre uma população está correta é 
incluir a população inteira na amostra a ser estudada. Mas, devido aos recursos limitados (isto 
é, tempo insuficiente e/ou dinheiro), normalmente não se trabalha com populações inteiras, 
logo as inferências passam a ser baseadas apenas numa parte da população (amostra). Como 
consequência, sempre que possível, é importante determinar e relatar a confiabilidade de cada 
inferência. Portanto, o grau de confiabilidade de uma inferência é o responsável em separar a 
ciência estatística da arte de “adivinhar a sorte”.
Exemplo 1.5 – Idade média dos telespectadores do programa ABC World News Tonight.
De acordo com The Satte of the News Media, 2006, a idade média dos telespectadores do programa 
ABC World News Tonight é de 59 anos. Suponha que uma executiva de uma rede rival presuma 
que a média de idade dos telespectadores do ABC News é menor que 59 anos. Para testar a sua 
hipótese, ela coleta uma amostra de 500 telespectadores do noticiário noturno ABC e determina 
a idade de cada um. Neste exemplo, temos que a população é todo o conjunto de telespectadores 
do noticiário noturno da ABC, a idade (em anos) de cada telespectador é a variável de interesse, 
a amostra são os 500 telespectadores do ABC News selecionados pela executiva e a inferência é 
estimar se a idade média dos telespectadores é menor do que 59 anos. Se a executiva estivesse 
interessada no erro de estimativa (isto é, a diferença entre a idade média para a população de 
telespectadores de TV e a idade média de uma amostra de telespectadores de TV), usando métodos 
estatísticos, poder-se-ia determinar um limite do erro da estimativa. Este limite é simplesmente 
um número que nosso erro de estimativa não pode exceder. Nas próximas aulas, veremos que 
essa fronteira é uma medida de incerteza da nossa inferência. A confiabilidade das inferências 
estatísticas será discutida ao longo das aulas apresentadas nesse caderno de estudos.
Definição 1.10 
Uma medida de confiabilidade é uma afirmação 
(geralmente quantificada) sobre o grau de incerteza 
associado a uma inferência estatística.
TIPOS DE DADOS
Todos os dados (e, por conseguinte, as variáveis que 
medimos) podem ser classificados como um dos dois 
tipos gerais: quantitativo e qualitativo.
Exemplo 1.6 – Dados quantitativos.
A temperatura (em graus Celsius) em que cada unidade em uma amostra de 25 peças plásticas 
resistentes ao calor começam a derreter, a atual taxa de desemprego de cada um dos estados 
brasileiros da região sudeste, o salário dos administradores empregados em multinacionais, 
Atenção
Geralmente, atribuem-se valores numéricos 
arbitrários aos dados qualitativos para 
facilitar a entrada dos dados no computador e 
a análise. Esses valores numéricos atribuídos 
são apenas códigos: eles não podem ser 
somados, subtraídos, multiplicados ou 
divididos. Por exemplo, podemos atribuir 
os seguintes códigos: democrata = 1; 
republicano = 2 e independente = 3. 
14
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
o número de mulheres executivas empregadas em cada uma das amostras de 75 empresas de 
manufatura.
Definição 1.11
Dados quantitativos são medidas registradas em 
uma escala numérica de ocorrência natural.
Quanto aos dados qualitativos, temos que estes não 
podem ser medidos em escalas numéricas naturais, 
ou seja, eles podem apenas ser classificados em 
categorias. 
Exemplo 1.7 – Dados qualitativos.
A afiliação de um partido político (democrata, 
republicano ou independente), a condição de defeito 
(defeito ou não) de cada uma das 100 peças de um 
microcomputador, a nacionalidade de 100 turistas 
em visita a cidade do Rio de Janeiro.
Definição 1.12
Dados qualitativos são mensurações que não podem 
ser medidas em uma escala numérica natural, eles 
só podem ser classificados em grupo de categorias.
COLETA DE DADOS
Após ter decidido o tipo de dados (quantitativos ou qualitativo) apropriados para o problema 
em questão a ser estudado, é preciso coletá-los. Essa coleta de dados pode ser feita de quatro 
formas:
 » Dados de fonte publicada.
 » Dados de estudo controlado.
 » Dados de pesquisa.
 » Dados coletados por meio de observação.
Em muitos estudos, o conjunto de dados de interesse já foi coletado e está disponível numa fonte 
publicada, tais como um livro, jornal, periódico ou site da internet. Por exemplo, você pode querer 
examinar e sintetizar as taxas de pessoas que possuem o 3º grau completo na região sudeste. 
Atenção
Se o nosso interesse está voltado para certa variável 
de um determinado grupo de elementos, esta pode 
ser classificada em:
 » Qualitativa, isto é, quando resulta de uma 
classificação por tipos ou atributos. Sendo assim, 
pode ser:
 › Nominal - como, por exemplo, sexo ou cor dos 
olhos;
 › Ordinal - como, por exemplo, classe social ou 
grau de instrução.
 » Quantitativa, isto é, quando os seus valores 
indicam quantidades. Dessa forma, a variável 
pode ser:
 › Discreta - quando seus possíveis valores 
formam um conjunto enumerável, finito ou 
infinito como, por exemplo, número de peças 
defeituosas, número de filhos ou números de 
carros;
 › Contínua - quando assume qualquer valor 
dentro de um intervalo de variação como, por 
exemplo, peso, altura, tempo ou renda.
15
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Esse conjunto de dados (assim como outros inúmeros dados relacionados à educação) pode ser 
encontrado no site do INEP que, por meio de pesquisas, publica anualmente esses resultados.
Um segundo método de coleta de dados envolve a condução de um estudo controlado, no qual 
o pesquisador exerce um estrito controle sobre as unidades sob estudo (pessoas, objetosou 
eventos). Por exemplo, um recente estudo médico investigou o poder preventivo da aspirina em 
ataques do coração. Médicos voluntários foram divididos em dois grupos – o grupo experimental 
e o grupo de controle. No grupo experimental, cada médico tomou uma drágea de aspirina por 
dia, durante um ano; enquanto que, no grupo de controle, os médicos, tomaram um placebo 
imitando uma drágea de aspirina. Os pesquisadores, não os médicos sob estudo, controlavam 
quem recebia a drágea de aspirina (tratamento) e quem recebia o placebo. A partir daí, são 
extraídas informações dos dados do que seria possível nesse estudo não controlado.
As pesquisas são a terceira fonte de dados. Com uma pesquisa, o pesquisador tira uma amostra 
de um grupo de pessoas e submete-as a uma entrevista, sendo feitas uma ou mais perguntas, 
registrando as respostas dadas. As pesquisas eleitorais, realizadas por institutos de pesquisas 
(como, por exemplo, o DATAFOLHA, o IBOBE e o GALLUP) são provavelmente as mais conhecidas.
Os estudos observacionais também podem ser empregados na coleta de dados. Em um estudo 
observacional, o pesquisador observa unidades experimentais em seu ambiente natural e registra 
a(s) variável(is) de interesse. Por exemplo, um psicólogo corporativo pode observar e registrar o 
comportamento “Tipo A” de uma amostra de trabalhadores da linha de montagem de uma fábrica.
Seja qual for o método adotado para a coleta de dados, provavelmente, os dados consistirão em 
uma amostra da população e, ao aplicá-los na estatística inferencial, torna-se imprescindível 
que essa amostra seja representativa. 
Definição 1.13
Uma amostra representativa exibe as características de uma população de interesse.
Por exemplo, considere a apuração de votos conduzida durante uma eleição presidencial. 
Suponha que se deseja estimar um percentual de todos os eleitores no Brasil em função de um 
determinado candidato. O instituto de pesquisa poderia cometer o erro de basear a sua estimativa 
sobre a coleta de dados de uma amostra de eleitores que pertencem ao “curral” eleitoral de um 
dos candidatos. Tais números certamente produziriam estimativas muito enviesadas.
Dessa forma, para satisfazer as exigências de uma amostra representativa deve-se selecionar uma 
amostra aleatória. Uma amostra aleatória assegura que cada subconjunto de dados de tamanho 
predeterminado numa população tenha a mesma chance de ser incluído na amostra.
16
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Definição 1.14
Uma amostra aleatória de n unidades experimentais será uma amostra selecionada da população, 
de forma que cada amostra de tamanho n tenha a mesma probabilidade de seleção.
EXERCÍCIO RESOLVIDO
Como se sentem os consumidores em relação às compras feitas pela internet? Para descobrir, uma 
empresa de software encomendou um estudo nacional a respeito da experiência do consumidor 
que envolveu 1980 brasileiros na idade adulta que tivessem feito uma transação on-line durante 
o último ano em websites de bancos, compras, viagens ou seguros. A conclusão foi publicada 
numa revista de negócios e revelou que 1600 entrevistados, ou 81%, aproximadamente, tiveram 
problemas técnicos com a transação on-line. Mais de um terço dos consumidores também 
procurou os sites concorrentes quando uma pequena falha na transação on-line ocorreu.
( A ) Identifique o método de coleta de dados.
( B ) Identifique a população-alvo.
( C ) As amostras de dados da população são representativas?
SOLUÇÃO
( A ) O método de coleta de dados é uma pesquisa: 1980 pessoas que completaram o 
questionário.
( B ) A população-alvo é composta por todos os consumidores que fizeram transações on-line.
( C ) Como os 1980 entrevistados claramente formam um subconjunto da população-alvo, 
eles compõem uma amostra. Se a amostra é ou não representativa, não se sabe, uma 
vez que a revista de negócios não apresentou informações detalhadas sobre como os 
1980 entrevistados foram selecionados.
O papel da estatística no gerenciamento da tomada de 
decisões
O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios 
e às atividades governamentais (controle de qualidade, auditoria estatística, previsões), tem sido 
marcante nas últimas décadas. A cada dia, a mídia apresenta resultados e pesquisas políticas, 
econômicas e sociais. Na ênfase cada vez maior do governo a respeito das drogas e dos testes 
de produtos, por exemplo, testemunha-se a clara evidência da necessidade de ser capaz de 
avaliar os dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um 
17
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
discernimento – uma habilidade de raciocínio para interpretar e entender o significado dos 
dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e generalizações, 
isto é, ajudar a pensar criticamente, usando a estatística.
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística 
para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação 
na população e no processamento de dados.
Definição 1.15
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística 
para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação 
na população e no processamento de dados.
Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar 
decisões. O fluxograma a seguir, da figura 2, mostra o papel da estatística na tomada de decisão.
Figura 2 – O papel da estatística na tomada de decisão gerencial.
18
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado 
em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo 
o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar 
nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados 
da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo 
é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial 
pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do 
problema gerencial.
Recurso tecnológico
O excel como ferramenta auxiliar
Ao iniciar o Excel, você encontrará uma tela semelhante à da figura 3. Boa parte dessa tela 
compreende uma planilha – chamada pasta de trabalho do Excel – com colunas (denominadas 
A, B, C etc) representando variáveis e linha representando observações (ou casos). Na parte 
superior da tela do Excel está a barra de menu principal, com botões para diferentes funções e 
procedimentos disponíveis no Excel.
Figura 3 – Tela inicial do Excel.
19
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
como entrar com dados?
Primeiro, deve-se criar uma pasta de trabalho no Excel entrando com dados diretamente em linhas 
e colunas da planilha. A figura 4 apresenta dados registrados na 1a coluna (A). Opcionalmente, 
podem-se adicionar nomes para as variáveis (colunas) na primeira linha da pasta de trabalho.
Figura 4 – Entrada de dados.
como acessar dados de um arquivo?
Se os dados estão salvos em um arquivo externo, você pode acessá-los usando as opções disponíveis 
no Excel. Clique em “Personalizar barras de ferramentas de acesso rápido” como indica a figura 5. 
Figura 5 - Personalizar barras de ferramentas de acesso rápido.
20
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Em seguida, aparecerá uma caixa de diálogo semelhante à apresentada na figura 6, selecione a 
opção “Abrir”.
Figura 6 – Selecionando a opção abrir.
A tela contendo a planilha do Excel terá incluído na sua barra de ferramentas o ícone marcado 
na figura 7.
Figura 7 – ícone abrir.
Apósclicar no ícone grifado na figura 7, aparecerá uma caixa de diálogo semelhante à da Figura 
8; em seguida, selecione o arquivo do Excel que deseja acessar e clique em “Abrir”.
21
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Figura 8 – Abrindo arquivo.
como imprimir planilha de dados no Excel?
Para imprimir dados da planilha do Excel, clique no ícone assinalado na figura 9.
Figura 9 – Impressão de uma planilha no Excel.
22
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
RESUMO
Vimos até agora:
 » O conceito de estatística.
 » Os tipos de aplicações da estatística: descritiva e inferencial.
 » Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou 
amostra, identificar a(s) variável(is), coletar dados e descrever os dados.
 » Os cinco elementos dos problemas estatísticos inferenciais: identificar a população, 
identificar a(s) variável(is), coletar dados da amostra, inferir (deduzir) sobre a população 
baseando-se na amostra e medir a confiabilidade para fazer a inferência.
 » A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos 
(de natureza categórica).
 » Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano 
experimental.
 » O papel da estatística no gerenciamento da tomada de decisões.
23
Apresentação
Esta aula apresenta como pode ser realizada a descrição de dados qualitativos e quantitativos 
de uma pesquisa estatística. A ênfase é dada aos métodos gráficos e a construção de tabelas.
Objetivos:
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Descrever dados qualitativos de uma pesquisa estatística.
 » Estabelecer métodos gráficos para descrever dados quantitativos.
 » Interpretar e utilizar dados apresentados graficamente.
 » Selecionar a maneira mais adequada para representar um conjunto de dados graficamente.
2
AulA
ORgAnIzAçãO E 
DEScRIçãO DE DADOS
24
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Preliminares
Suponha que se deseja avaliar a habilidade matemática de 400 estudantes de administração do 
AVM, com base nas notas do curso de Estatística. Sendo assim, a primeira questão a ser estudada 
é “Como podemos descrever essas 400 medições?”. Vale lembrar que as características do grupo 
de dados incluem o grau típico ou mais frequente obtido no componente curricular Estatística 
e incluem, ainda, a variabilidade dessas notas, as maiores e as menores notas, o formato dos 
dados e, também, se o grupo a ser estudado contém ou não dados com resultados não usuais.
Para fazer tal estudo, é necessário estabelecer um método formal a fim de restringir e caracterizar 
a informação obtida por meio da pesquisa realizada. Vale ressaltar que esses métodos também 
são essenciais para a inferência estatística. Muitas vezes, numa pesquisa estatística, a população 
corresponde a um grande grupo de dados. Daí se faz necessário utilizar um método para descrever 
uma amostra do grupo de dados pela qual sejamos capazes de fazer afirmativas descritivas 
(inferências) sobre a população da qual a amostra foi extraída.
Nesta aula, estudaremos o método gráfico para descrever um conjunto de dados. 
 Descrição de dados qualitativos
Iniciaremos nossos estudos a partir do seguinte exemplo:
Suponha que um determinado órgão consultor esteja interessado em investigar o perfil dos 
executivos brasileiros quanto ao seu grau de escolaridade, isto é: “A maior parte dos executivos 
é formada nos níveis mais altos de escolaridade?”.
Para responder a essa pergunta, a tabela a seguir fornece algumas informações a respeito dos 20 
executivos mais bem pagos do Brasil.
Tabela 2.1 – Os 20 executivos mais bem pagos do Brasil.
Executivo Empresa Salário (R$) Idade (Anos) Formação
Antonio Silva LSW 7 000 50 Doutorado
Ricardo Amaral capital 4 500 38 MBA
Felipe cunha MAS 4 450 45 MBA
Paulo Magalhães Atenas 4 000 42 Bacharelado
Maicon Alves Sigma 4 600 32 MBA
Antônio Serqueira Miragem 5 300 45 Mestrado
Anderson Figueiredo Alfa 4 500 51 MBA
Ronaldo Barbosa Empreendimentos 5 250 52 Mestrado
Pedro Firmino Moreti 7 000 49 Doutorado
25
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Executivo Empresa Salário (R$) Idade (Anos) Formação
cassio Ladeiras KWY 4 600 53 MBA
Renato Marchi Sensorial 4 550 42 MBA
Ronaldo Teixeira compacto 4 000 39 Bacharelado
Renato O. Rocha Trema 5 200 38 Mestrado
Bernardo Oliveira W System 5 200 38 Mestrado
Paulo S. Dantas Economic 4 600 40 MBA
Angelo Rosas Ponto 4 800 35 Bacharelado
José carlos Toll Rossi 4 600 42 MBA
Fabio coutinho contato 4 500 50 MBA
Ricardo Santos grupo RSA 5 200 28 Mestrado
Daniel Dutra cardmaster 4 800 32 MBA
Nesse estudo, a variável de interesse, mais alto nível de formação escolar, é qualitativa. Dessa 
forma, o valor de uma variável qualitativa só pode ser classificado em categorias denominadas 
classes. A tabela indica os possíveis tipos de formação, ou seja, Bacharelado, MBA, Mestrado 
ou Doutorado. Portanto, esses representam as classes para a variável qualitativa a ser estudada. 
Esses dados podem ser resumidos numericamente de duas formas: 
 » Calculando a frequência de classe;
 » Calculando a frequência relativa de classe.
Definição 2.1
Chama-se classe a categoria dentro da qual dados qualitativos podem ser classificados.
Definição 2.2
Chama-se frequência simples de classe ou frequência absoluta de classe, denotada por , o número 
de ocorrências no grupo de dados entrando em uma classe particular.
Definição 2.3
Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de 
observações de uma classe pelo total de observações no grupo de dados.
Definição 2.4
Chama-se porcentagem de classe o produto da frequência relativa por 100.
A partir da tabela 2.1, pode-se obter uma nova tabela denominada tabela de frequências. Isto 
é, podem-se definir 4 classes que estão relacionadas a formação dos 20 executivos mais bem 
26
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
pagos do Brasil. Observa-se que há 3 executivos que têm apenas o Bacharelado, 10 executivos 
que possuem curso de MBA, 5 mestres e 2 doutores. Os números 3, 10, 5 e 2 representam as 
frequências de classes para as 4 classes definidas. Sendo assim, podem-se obter as frequências 
relativas de cada classe, ou seja:
Bacharelados: 
=
3 0,15
20
MBA: 
=
10 0,50
20
Mestrado: 
=
5 0,25
20
Doutorado: 
=
5 0,25
20
A tabela a seguir ilustra uma tabela de distribuição de frequências da tabela 2.1.
Tabela 2.2 – Distribuição de frequências.
Classes Frequência absoluta
Frequência 
relativa Porcentagem
Bacharelado 3 0,15 15%
MBA 10 0,50 50%
Mestrado 5 0,25 25%
Doutorado 2 0,10 10%
Total 20 1,00 100%
A tabela 2.2 permite auxiliar a descrição dos dados em questão por meio de uma representação 
gráfica. Os métodos gráficos mais usados para descrever dados qualitativos são o gráfico de 
barras e o gráfico de pizza. Abaixo segue cada uma dessas representações.
Figura 2.1 – Gráfico de barras (Escolaridade dos 20 executivos mais bem pagos do Brasil).
27
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Figura 2.3 – Gráfico de pizza (Escolaridade dos 20 executivos mais bem pagos do Brasil).
No gráfico de barras (figura 2.2), a altura de cada retângulo, ou “barra”, sobre cada classe é 
igual à frequência de classe. O gráfico de pizza (figura 2.3) apresenta as frequências relativas 
(expressa em porcentagens) dos 4 tipos de escolaridade. Esse gráfico corresponde a um círculo 
(com circunferência de 360º). O tamanho de cada (ângulo), “fatia” atribuída a cada classe, é 
proporcional à frequência relativa da classe. Por exemplo, a fatia atribuída à escolaridade MBA 
é de 50% de 360º, isto é, 180º.
Chama-se diagrama de Pareto o gráfico de barras com as categorias (classes) da variávelqualitativa 
(isto é, as barras) organizado por altura em ordem descendente da esquerda para a direita.
A figura 2.4 apresenta o diagrama de Pareto relacionado à tabela 2.2 de distribuição de frequências.
Figura 2.4 – Diagrama de Pareto (Escolaridade dos 20 executivos mais bem pagos do Brasil).
28
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Descrição de dados quantitativos
Considere a distribuição das alturas de 50 alunos de uma turma do curso de administração do 
IAVM.
1,75 1,68 1,57 1,82 1,76 1,71 1,70 1,74 1,58 1,57
1,67 1,64 1,69 1,56 1,59 1,93 1,50 1,74 1,72 1,88
1,84 1,78 1,67 1,69 1,76 1,67 1,76 1,74 1,81 1,88
1,93 1,68 1,59 1,73 1,82 1,82 1,69 1,67 1,74 1,71
1,58 1,64 1,65 1,68 1,74 1,62 1,69 1,81 1,77 1,76
Pode-se, a partir dos dados brutos acima, construir 
uma tabela de frequências e, para isso, basta 
realizar os seguintes passos:
Passo 1: definir o número de classes 
Pode-se, normalmente, definir tal número utilizando-se uma das seguintes regras:
 » Regra de Sturges: 1 3,3= +i logN
 » Regra do quadrado: =i N
onde é o número de dados. 
Saiba mais
Notação para intervalos de classe
Considere os extremos a e b de um intervalo, então:
a b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferior a e exclui o limite superior b;
a b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b;
a b: intervalo fechado à esquerda e à direita. Inclui os dois extremos;
a – b: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b.
Passo 2: calcular a amplitude da amostra (A)
A amplitude da amostra é obtida fazendo a diferença 
entre o seu maior e o seu menor elemento quando 
feito o rol do conjunto.
:: Dados brutos:
Chamam-se dados brutos os resultados das variáveis 
dispostos aleatoriamente, isto é, sem nenhuma ordem 
de grandeza crescente ou decrescente. 
:: Rol:
Chama-se rol a ordenação dos dados brutos, de um 
modo crescente ou decrescente. 
29
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Passo 3: Calcular a amplitude do intervalo de classe (h)
A amplitude de um intervalo de classe deve ser sempre maior que o quociente entre a amplitude 
da amostra e o número de classes de uma distribuição de frequências. Isto é:
>
Ah
i
Passo 4: Escolher os limites de classe
Os limites de classe devem ser, sempre que possível, números inteiros.
Passo 5: Construir a tabela de frequências.
Para a distribuição das alturas dos 50 alunos do curso de administração do IAVM, podem-se 
estabelecer 5 classes de amplitude igual a 0,10. Sendo assim, obtém-se a seguinte tabela de 
frequências:
Tabela 2.3 – Distribuição de frequências das alturas de 50 alunos do IAVM.
Alturas (em metros) Frequência absoluta
1,50 |- 1,60 8
1,60 |- 1,70 15
1,70 |- 1,80 17
1,80 |- 1,90 8
1,90 |-| 2,00 2
Total 50
A organização dos dados brutos por classes, junto com as frequências correspondentes, é chamada 
de Distribuição de Frequências.
No caso de dados quantitativos percebe-se que as definições 2.5, 2.6, 2.7 e 2.8, a seguir, são 
análogas às definições 2.1, 2.2, 2.3 e 2.4 respectivamente.
Definição 2.5
Chama-se classe a categoria dentro da qual dados quantitativos podem ser classificados.
Definição 2.6
Chama-se frequência simples de classe ou frequência absoluta de classe o número de elementos 
de dados entrando em uma classe particular.
Definição 2.7
Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de 
observações de uma classe pelo total de observações no grupo de dados.
30
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Definição 2.8
Chama-se porcentagem de classe o produto da frequência relativa por 100.
A partir da tabela 2.3, aplicando as definições 2.7 e 2.8, podem-se obter os seguintes resultados 
expostos na tabela 2.4 a seguir.
Alturas (em metros) Frequência absoluta Frequência relativa Porcentagem
1,50 |- 1,60 8 0,16 16%
1,60 |- 1,70 15 0,30 30%
1,70 |- 1,80 17 0,34 34%
1,80 |- 1,90 8 0,16 16%
1,90 |-| 2,00 2 0,04 4%
Total 50 1,00 100%
Tabela 2.4 – Distribuição das frequências absoluta, relativa e das porcentagens das alturas de 50 
alunos do IAVM.
Definição 2.9
Chama-se intervalo de classe o conjunto de números que constitui o intervalo.
Definição 2.10
Chama-se limite de classe os extremos de uma classe. Denota-se por l o limite inferior da classe 
e por L o limite superior da classe.
Definição 2.11
Chama-se ponto médio de uma classe o ponto que divide o intervalo de classe em partes iguais. 
Daí, denotando o ponto médio de uma classe por PM, tem-se:
2
+
=
L lPM
Observação 2.1
O ponto médio de um intervalo de classe é o seu legítimo representativo. Os pontos médios de uma 
distribuição de frequência estão em progressão aritmética, isto é, a diferença entre eles é constante.
Definição 2.12
Chama-se amplitude de um intervalo de classe a medida do intervalo que define a classe. 
Denotando por h a amplitude do intervalo de classe, tem-se que:
= −h L l
31
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Definição 2.13
Chama-se amplitude total da distribuição a diferença entre o limite superior da última classe 
(limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).
Os conjuntos de dados quantitativos são definidos como conjuntos de dados em uma escala 
numérica com significados. Para resumir e detectar padrões desses dados, podem-se usar 
métodos gráficos para a descrição dos mesmos. Geralmente, é mais comum representar dados 
em gráficos dispostos em duas dimensões como, por exemplo, gráficos de pontos, gráfico de 
ramos e folhas e histogramas.
Gráfico de pontos e gráfico de ramos e folhas
No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é 
representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos 
são posicionados um sobre o outro verticalmente.
Outro tipo de representação gráfica é o gráfico de ramos e folhas. Neste gráfico, o valor numérico 
da variável quantitativa é particionado em um “ramo” e uma “folha”. Os galhos possíveis estão 
listados em ordem, em uma coluna. A folha para cada medição quantitativa no conjunto de 
dados está posicionada no ramo da linha correspondente. Folhas para observações no mesmo 
ramo de valor são listadas em ordem crescente, horizontalmente.
Exemplo 2.1 (Adaptado de MC CLVE, 2009 pp. 42 – 43)
Suponha que uma analista financeira esteja interessada no montante de recursos gastos por 
empresas de hardware e software em pesquisa e desenvolvimento (P&D). Ela obtém uma 
amostra de 20 firmas de tecnologia e calcula o total que cada uma gastou no último ano como 
uma porcentagem de sua receita total. A tabela 2.5 apresenta os resultados encontrados pela 
analista financeira.
Tabela 2.5 – Porcentagem de receitas gastas em pesquisa e desenvolvimento.
Empresa Porcentagem(%) Empresa Porcentagem(%)
1 6,2 11 4,2
2 8,3 12 7,1
3 6,2 13 6,2
4 6,2 14 7,1
5 4,2 15 13,1
6 10,1 16 10,2
7 6,7 17 6,2
8 7,8 18 4,1
9 9,2 19 7,8
10 6,2 20 7,1
32
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Vale lembrar que como as medidas numéricas feitas sobre a amostra de 20 unidades (as firmas), 
essas porcentagens representam dados quantitativos. O objetivo da analista é resumir e descrever 
esses dados de forma a extrair informações relevantes. No gráfico de pontos (Figura 2.5) para 
as 20 porcentagens P&D, o eixo horizontal da figura é uma escala para a variável quantitativa, 
percentual. O valor numérico da cada medida do grupo de dados está localizado na escala 
horizontal por um ponto. Quando os valores se repetem, os pontos são colocados um sobre o 
outro, formando uma pilha naquela localização numérica.
Figura 2.5 – Gráfico de pontos para as20 porcentagens de P&D.
A partir da tabela 2.5, pode-se obter o seguinte gráfico de ramo e folhas da figura 2.6.
Figura 2.6 – Gráfico de ramo e folhas para as 20 porcentagens de P&D.
Gráfico de Ramo e folhas para 20 porcentagens de P&D
4 1 2
6 2 2 2 2 2 2 7
7 1 1 1 8 8
8 3
9 2
10 1 2
Histogramas
Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência 
relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável 
quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam 
a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo 
de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja 
altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão.
33
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Ao interpretar um histograma, devem-se considerar dois importantes fatores. O primeiro é a 
porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal 
que é igual à frequência relativa de medidas no intervalo. O segundo é que se pode imaginar a 
aparência do histograma da frequência relativa para um conjunto de dados muito grande (uma 
população).
Exemplo 2.2
Considere a variável X = idade, em anos, de um grupo de empregados com 30 anos ou mais, do 
setor de vendas de uma empresa.
Tabela 2.6 - Idade, em anos, de um grupo de empregados do setor de vendas de uma empresa.
35 42 33 59 63 31 55 42 77
54 66 44 41 33 39 48 41 31
65 70 36 40 40 52 62 39 37
74 50 58 62 31 34 42 33 35
Note que, nesse grupo de 36 pessoas, a pessoa mais jovem tem 31 anos, enquanto a mais velha 
possui 77 anos, ou seja, a amplitude dos dados é 77 – 31 = 46 anos. Usando a regra do quadrado, 
segue que o número de classes = =36 6i . O número de classes i deve ser maior que 6, sendo 
assim, a cada classe deve ser dada a amplitude 46 : 6 ≅ 8 anos. A tabela 2.7 a seguir apresenta a 
distribuição de frequências da variável X.
Tabela 2.7 – Distribuição das idades, em anos, de um grupo de empregados do setor de 
vendas de uma empresa.
Idade (em anos) Frequência absoluta Frequência relativa Porcentagem
30 |- 38 7 0,22 22%
38 |- 46 9 0,28 28%
46 |- 54 3 0,09 9%
54 |- 62 5 0,16 16%
62 |- 70 5 0,16 16%
70 |-| 78 3 0,09 9%
Total 32 1,00 100%
A partir da tabela 2.7, obtém-se o histograma representativo da distribuição de frequências em 
questão, como pode ser observado na figura 2.7.
34
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Figura 2.7 – Histograma da distribuição das idades, em anos, de um grupo de empregados 
do setor de vendas de uma empresa.
Observação 2.2 
Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados 
(particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas 
cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente 
visíveis em um gráfico de ramo e folhas.
Resumo
Vimos até agora:
 » Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar 
as frequências absoluta e relativas das classes e representar tais frequências em gráficos 
de barras, de pizza e de Pareto;
 » Como descrever dados quantitativos, isto é, identificar classes de categorias, determinar 
as frequências absoluta e relativas das classes e a representar tais frequências em gráficos 
de pontos, de ramos e folhas e em histogramas;
35
Apresentação 
Esta aula apresenta conceitos e métodos para se obter medidas de tendência centrais e medidas 
de variabilidade, bem como critérios para interpretar o significado dessas medidas.
Objetivos
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Calcular e interpretar medidas de tendência central.
 » Calcular e interpretar medidas numéricas de variabilidade.
 » Calcular e interpretar medidas numéricas de posicionamento relativo.
3
AulA
MEDIDAS DE TEnDêncIA cEnTRAL E 
MEDIDAS DE vARIABILIDADE
36
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Medidas numéricas de tendência central
Nesta secção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer 
inferências sobre medições correspondentes da população. Existem muitos métodos numéricos 
para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas 
características:
A tendência central do conjunto de medições, isto é, a tendência dos dados observados se 
agruparem em torno de valores centrais.
A variabilidade do conjunto de medições, isto é, a dispersão dos dados.
Média aritmética
DEFInIçãO 2.14
A média aritmética de um conjunto de dados quantitativos é a soma das medições dividida pelo 
número de medições contadas no conjunto de dados. Notação: x .
Isto é:
1== ∑
n
ii
x
x
n
Exemplo 2.3
A venda diária de certo produto alimentício, durante uma semana, foi de 12, 14, 15, 13, 18 e 12 
quilos. Portanto, a venda média diária na semana é dada por:
12 14 15 13 18 12 14quilos
6
+ + + + +
= =x 
Definição 2.15
Chama-se desvio em relação à média, denotado por di , a diferença entre cada elemento de um 
conjunto de valores e a média aritmética, isto é:
= −i id x x
onde xi é o i-ésimo valor elemento do conjunto. 
37
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
como calcular a média de dados agrupados
CASO 1: Sem intervalos de classe (por pontos)
Basta usar a seguinte caracterização:
= ∑ i ix fx
n
Exemplo 2.4
Considere a distribuição relativa de 30 famílias de 4 filhos, tomando por variável o número de 
filhos do sexo masculino, apresentada na tabela 2.8 abaixo.
Tabela 2.8 - Distribuição relativa de 30 famílias de 4 filhos.
Número de pessoas Frequência (fi)
0 2
1 6
2 8
3 10
4 4
Total n = 30
Portanto, segue que:
0 2 1 6 2 8 3 12 4 4 74 2,46 meninospor família
30 30
⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = ≅x
CASO 2: Com intervalos de classe (por classe)
Basta considerar todos os valores incluídos num intervalo de classe coincidir com o seu ponto 
médio e, assim, determinar a média ponderada por meio da fórmula:
= ∑ i iPM fx
n
Exemplo 2.5
A partir da tabela 2.7 (página 50), de distribuição das idades, em anos, de um grupo de empregados 
do setor de vendas de uma empresa obtém-se como idade média:
⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = =
34 7 42 9 50 3 58 5 66 5 74 3 1608 50,25
32 32
x
Além da média aritmética temos também outros tipos de média como a média geométrica e a 
média harmônica. Para maiores detalhes ver GONZÁLEZ, N. 2008.
38
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Mediana
Definição 2.19
Chama-se mediana de um conjunto de dados quantitativos 
o número do “meio” quando as medidas são organizadas em 
ordem ascendente (ou decrescente). Notação: .
No cálculo da mediana, primeiramente devem-se organizar 
as n medições dadas da menor para a maior. Se n é ímpar, 
então, a mediana é o número do meio. Se n é par, então, a 
mediana é a média aritmética entre dois números.
Exemplo 2.9
Considere os seguintes dados: 13, 15, 6, 7, 17, 23, 25, 8, 10.
Para obter a mediana, primeiramente, se organiza os dados em um rol: 
6, 7, 8, 10, 13, 15, 17, 23, 25
Como o número de dados é ímpar, segue que a mediana é o valor central obtido a partir do rol 
acima, isto é: me = 13.
Exemplo 2.10
Considere os seguintes dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6.
Organizando esses dados num rol, obtém-se:
0, 0, 1, 1, 2, 3, 3, 4, 5, 6
Sendo par o número de dados, segue que a mediana é a média 
aritmética dos dois valores centrais, isto é:
2 3 2,5
2
+
= =em
como calcular a mediana de dados agrupados
CASO 1: sem intervalosde classe (por ponto)
Neste CASO, obtém-se a frequência acumulada imediatamente superior à metade da soma das 
frequências. A mediana será o valor que corresponde a tal frequência acumulada.
Saiba mais
A frequência absoluta acumulada (fac) 
indica o número inferior ao limite 
superior da classe. Sendo assim a soma 
da frequência absoluta de uma classe 
com as frequências absolutas de todas as 
classes anteriores. 
Saiba mais
A frequênci a relativa acumulada (Fac) 
indica a porcentagem inferior ao limite 
superior da classe. Isto é, a soma da 
frequência relativa de uma classe com as 
frequências relativas de todas as classes 
anteriores. 
39
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
 » Se o somatório das frequências for um número ímpar então o valor mediano será o 
termo de ordem dado pelo quociente:
1
2
+∑ if
 » Se o somatório das frequências for par, o valor mediano será o termo de ordem dado 
pelo quociente:
( ) ( )/2 /2 1
2
+ +∑ ∑i if f
CASO 2: com intervalos de classe
Neste caso, basta seguir os seguintes passos:
Passo 1: determinar a frequência simples acumulada crescente;
Passo 2: Calcular 2
∑ if
Passo 3: Marcar a classe correspondente à frequência simples acumulada crescente, imediatamente, 
superior a 2
∑ if . Tal classe será a classe mediana.
Passo 4: Calcular a mediana usando a fórmula:
2 −= +
ant
e cme cme
icme
n f
m l h
f
em que:
lcme = limite inferior da classe mediana
fant = frequência simples acumulada crescente da classe anterior à classe mediana
ficine = frequência simples da classe mediana
hcme = amplitude do intervalo da classe mediana
Exemplo 2.11
Considere a distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso 
apresentada na tabela 8 abaixo.
Tabela 2.11 - Distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso.
Classes Frequência (fi) Frequência acumulada
50 54 4 4
54 58 9 13
40
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Classes Frequência (fi) Frequência acumulada
58 62 11 24
62 66 8 32
68 70 5 37
70 74 6 40
Total 43
Segue que:
43 21,5
2 2
= =∑ if
Logo, a classe mediana será a 3ª classe da distribuição.
Portanto:
−
= + ⋅ =
43 9258 4 62,54
11e
m
Moda
Definição 2.20
Chama-se moda a medição que ocorre com mais frequência no conjunto de dados. Notação: m0
Em dados não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, 
procurar o valor que mais se repete de preferência após ter organizado os dados em um rol.
como obter a moda de dados agrupados
CASO 1: sem intervalos de classe
Neste caso, basta identificar o valor da variável com maior frequência.
CASO 2: com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. A moda, neste caso, é o 
valor dominante que está compreendido entre os limites da classe modal. O método mais simples 
para o cálculo da moda consiste em tomar o ponto médio da classe modal, isto é:
2
+
=o
l Lm
41
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Onde é o limite inferior da classe modal e o limite superior da classe modal.
Exemplo 2.12
A tabela 2.12, a seguir, indica as temperaturas de certa cidade da América do Norte durante um 
mês de inverno.
Tabela 2.12 – Temperaturas de uma cidade da América do norte.
Temperaturas Frequências
0ºc 4
1ºc 9
2ºc 14
3ºc 5
4ºc 4
Segue que 2ºC é a temperatura modal, pois é a de maior frequência.
Exemplo 2.13
Considere a tabela 2.7 de frequências apresentada no exemplo 2.2. A 2ª classe é a classe modal, 
pois é a de maior frequência. Portanto, a idade modal é dada por: 
38 46 48
2
+
= =om
Medidas separatrizes
São medidas ligadas à mediana, isto é, ligadas a sua característica de separar uma série em duas 
partes, que apresentam o mesmo número de valores. Essas medidas são os quartis, os decis, os 
centis (percentis) que juntamente com a mediana são conhecidas como medidas separatrizes.
Os Quartis, por exemplo, são valores que dividem a distribuição em quatro partes, ou seja, a 
partir da ordenação dos dados, define-se:
1o Quartil: o valor que deixa 25% dos dados abaixo dele e 75% dos dados acima dele.
2o Quartil: o valor que deixa 50% dos dados abaixo dele e 50% dos dados acima dele, ou seja, é 
a mediana.
3o Quartil: o valor que deixa 75% dos dados abaixo dele e 25% dos dados acima dele.
Exemplo 2.14
Considere os seguintes dados: 5, 3, 7, 8, 11, 14, 16.
42
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Organizando os dados num rol, obtém-se:
3, 5, 7, 8, 11, 14, 16
Daí, temos que: Q2 = me = 8
A mediana divide a série acima em duas partes com a mesma quantidade de dados: 3, 5, 7 e 11, 
14, 16. Para o cálculo do 1º e do 3º quartil, basta determinar, respectivamente, as medianas de 
cada um dos grupos determinados, isto é: Q1 = 5 e Q3 = 14.
Para maiores detalhes de como obter quartis, decis, percentis de dados agrupados em classes 
ver WALPOLE, R. E. et al 2008.
Medidas numéricas de variabilidade
As medidas numéricas de variabilidade ou medidas de dispersão quantificam a variabilidade 
dos dados. Conhecer a variabilidade dos dados, juntamente com seu centro, pode ser útil para 
visualizar o formato do conjunto de dados em questão, assim como os seus valores externos. 
Como exemplo de medidas de dispersão, tem-se a amplitude, a variância e o desvio padrão.
Amplitude
Definição 2.21
Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor 
medição.
Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito 
apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isto porque 
dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito 
à variação dos dados.
variância
Definição 2.22
A variância, indicada por s2, representa a variabilidade em torno da média da variável, ou seja, 
consideram-se as diferenças −ix x e calcula-se a média dos quadrados dessas diferenças:
( )22 1= −= ∑
n
ii
x x
s
n
43
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Se os dados representam uma amostra (e não toda a população), a expressão acima deve ser 
usada colocando-se (n – 1) no denominador, ou seja:
( )22 1
1
=
−
=
−
∑
n
ii
x x
s
n
Desvio padrão
Definição 2.23
Chama-se desvio padrão e indica-se por s, a raiz quadrada da variância.
Observação 2.3
Quando os dados estão em tabelas de classes de frequências, os valores das medidas de dispersão 
podem ser obtidos por meio de um valor aproximado, se considerarmos que cada classe de 
frequência pode ser representada pelo seu ponto médio. Neste caso, a variância e o desvio padrão 
são obtidos, respectivamente, pelas seguintes fórmulas:
( )22
2
1
−
=
−
∑∑ i ii i
x f
x f
ns
n
 e 
( )22
1
−
=
−
∑∑ i ii i
x f
x f
ns
n
Observação 2.4
Uma pequena dispersão absoluta dos dados pode ser considerável quando comparada à ordem 
de grandeza dos valores da variável. Para perceber o tamanho da dispersão dos dados, define-se 
o coeficiente de variação (CV):
=
sCV
x
Observação 2.5
Chama-se medida de assimetria a medida usada para quantificar a assimetria da distribuição 
de um conjunto de dados. Pearson definiu um coeficiente, denotado por A, dado por:
−
= o
x mA
s
 » Se 0,15<A , considera-se a distribuição simétrica;
 » Se 0,15 1≤ ≤A , considera-se a distribuição moderadamente simétrica;
 » Se 0,15 1≤ ≤A , considera-se a distribuição fortemente simétrica.
44
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
EXERCÍCIO RESOLVIDO
SejaX = número de defeitos por peça produzida em um lote de 16 peças, representadas pelos 
valores abaixo:
1 1 3 1 2 2 2 2 0 0 0 0 0 1 0 2
( A ) Construa a tabela de frequências.
( B ) Construa um histograma representativo da distribuição de frequências.
( C ) Calcule a média, a mediana e a moda da distribuição.
( D ) Encontre a variância e o desvio padrão da distribuição.
( E ) Determine o coeficiente de variação e a medida de assimetria.
SOLUÇÃO
A)
Número de 
defeitos por 
peça (xi)
Frequência 
absoluta (fi)
Frequência 
absoluta 
acumulada 
(fac)
Frequência 
relativa (Fi)
Frequência 
relativa 
acumulada 
(Fac)
Porcentagem 
(%)
0 6 6 0,3750 0,3750 37,50
1 4 10 0,2500 0,6250 25,00
2 5 15 0,3125 0,9375 31,25
3 1 16 0,0625 1,0000 6,25
Total 16 1,0000 100
B)
45
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
C)
0 6 1 4 2 5 3 1 17 1,0625
16 16
× + × + × + ×
= == = =∑ i ix fx
n
Como n = 16, a mediana é o valor que ocorre entre a 8ª e a 9ª posições. Portanto, me = 1.
A moda é o valor de maior frequência, isto é, mo = 0.
D)
( )2 22
2
1733 16 0,9958
1 15
− −
= = ≅
−
∑∑ i ii i
x f
x f
ns
n
VARIÂNCIA
0,9958 0,9978= ≅s
DESVIO PADRÃO
E)
0,9978 0,9391 93,91
1,0625
= ≅ =CV %
1,0625 0 1,0648
0,9978
−
= ≅A
DISTRIBUIÇÃO FORTEMENTE SIMÉTRICA
Distorção da realidade
Muitas vezes, a Estatística descritiva pode servir como instrumento de distorção, mesmo que não 
intencionalmente ou como resultado de práticas estatísticas não éticas. Dessa forma, é preciso 
tomar certos cuidados ao observar e ao interpretar um gráfico ou uma medida descritiva numérica.
Distorções gráficas
Os gráficos geram impressões a respeito de dados representados. Essas impressões podem ser 
alteradas, por exemplo, quando se altera a escala de um dos eixos do gráfico. Observe o gráfico 
da figura 2.8 abaixo:
46
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Figura 2.8 – Participação moderada da empresa S&A no mercado de vendas.
A escala escolhida para o eixo horizontal e eixo vertical indica, visualmente, uma participação 
moderada no mercado de vendas da empresa S&A. Os mesmos dados podem ser usados e 
representados de forma a causar uma nova impressão visual sobre a participação da empresa 
S&A no mercado de vendas. Ou seja, aumentando a distância entre as unidades sucessivas do 
eixo vertical e diminuindo as distâncias entre os anos indicados, obtém-se a representação 
contida na figura 2.9 a seguir:
Figura 2.9 – Participação crescente da empresa S&A no mercado de vendas.
A distorção visual também pode ser percebida quando se faz a largura das barras proporcional 
à altura. Algumas vezes, não se faz necessário manipular os gráficos para distorcer a impressão 
que ele cria. Modificar a descrição verbal que acompanha o gráfico pode mudar a impressão 
que será feita pelo leitor. Observe a figura 2.10.
47
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Figura 2.10 – Mudando a descrição verbal para mudar a interpretação do leitor.
Para a produção, não precisamos nem mudar o gráfico, 
simplesmente muda-se o título para indicar uma má performace.
 
Para o público em geral, dizemos que ainda estamos nos 
1ºs anos.
Estatísticas descritivas numéricas enganosas
As informações de um conjunto de dados também podem ser distorcidas usando-se medidas 
descritivas numéricas. Ou seja:
Exemplo 2.15
Uma pequena empresa de advocacia possui um membro sênior e três membros juniores. Paulo 
interessado em trabalhar nesta empresa pergunta: “Que salário se deve esperar, caso eu venha 
trabalhar para essa empresa?”
Ele recebe duas respostas:
Resposta A: o membro sênior diz que um “trabalhador médio” ganha R$ 87.500,00 anualmente.
Resposta B: um dos membros Junior depois diz que um “trabalhador médio” ganha R$ 75.000,00 
anualmente.
Em qual resposta Paulo deve acreditar?
A confusão existe porque não está claro o significado da expressão “trabalhador médio”. Suponha 
que os quatro salários pagos sejam: R$ 75.000,00 anuais, para cada um dos três membros Junior 
e R$ 125.000,00 anual, para o membro sênior. Então:
⋅ +
= =
3 75000 125000 87500
4
 x 
me = 75.000
48
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Dessa forma, percebe-se que o membro sênior reportou-se à média dos quatro salários, enquanto 
que o membro júnior, à mediana. As duas informações dadas foram distorcidas, pois nenhum 
dos dois membros definiu qual medida de tendência central estava sendo usada. Vale lembrar 
que neste caso a mediana é a medida que melhor descreve o salário do “trabalhador médio”.
Outro tipo de distorção de uma informação em uma amostra ocorre quando apenas uma medida 
de tendência central é reportada. Medidas de tendência central e de variabilidade devem ser 
mencionadas a fim de se obter uma imagem mental precisa de um conjunto de dados.
Exemplo 2.16
Ana deseja comprar um carro novo e está em dúvida entre dois modelos. Como combustível e 
economia são ambos assuntos importantes, Ana escolhe o modelo A, pois a relação km/l é de 
13,6 Km/l rodados: para o modelo B, no entanto, a relação é de apenas 12,7 Km/l. Será que Ana 
fez uma boa escolha?
Neste caso, faltou verificar quanta variabilidade está associada às relações. Por exemplo, suponha 
que numa avaliação mais aprofundada revele que o desvio padrão para o modelo A é de 2,12 
Km/l, e para o modelo B é de apenas 0,42 Km/l. Assim, existe uma maior variabilidade associada 
ao modelo A, o que implica um maior risco na compra desse modelo. Isto é, o modelo A está 
mais propenso a ter uma relação que difere muito de 13,6 Km/l.
Recurso tecnológico
Gráficos no excel
Para fazer gráficos de dados de uma única variável no Excel, primeiramente digite a tabela de 
frequências (como ilustração faremos a representação dos dados do exemplo 2.10). Então:
49
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Em seguida, selecione o menu inserir:
Então, teremos a seguinte tela:
Selecione na barra de ferramentas o tipo de gráfico que deseja obter, por exemplo, gráfico de 
colunas:
50
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Com isso você poderá escolher um dos modelos listados (a título de ilustração será escolhido o 
modelo marcado abaixo):
51
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
 clicar no modelo, o gráfico é gerado. Selecionando a opção layout do gráfico, você pode personalizar 
o gráfico de acordo com os padrões apresentados, a aparência pode ser alterada ao escolher no 
menu estilos de gráficos um modelo proposto.
RESUMO
Vimos até agora:
 » Como calcular medidas de tendência central como a média, a mediana e a moda.
 » Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão.
 » Como determinar o coeficiente de variação de uma distribuição, bem como determinar 
a medida de assimetria das mesmas. 
52
Apresentação
Esta aula apresenta métodos e conceitos combinatórios, que consistem no estudo de situações 
em que a contagem se reduz, a saber, a quantas maneiras um determinado grupo de objetos 
pode ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais 
situações envolvem o desenvolvimento de competências como o planejamento de estratégias 
na resolução de problemas, a divisão de problemas em casos, a análise envolvendo números 
pequenos levando à generalização e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, 
serão aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance 
de um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de 
um evento. Obteras chances de um determinado evento ocorrer permite, racionalmente, tomar 
decisões prevendo eventos futuros.
Objetivos:
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o 
princípio multiplicativo.
 » Resolver problemas que envolvam o cálculo do número de elementos da união de 
conjuntos.
 » Identificar em situações-problema agrupamentos associados a conjuntos e sequências.
 » Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus 
elementos ou não e resolver problemas que envolvam arranjos, combinações e/ou 
permutações simples, com elementos repetidos e circulares.
 » Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço 
amostral nessas situações-problema.
 » Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
 » Utilizar o princípio multiplicativo no cálculo de probabilidades.
4AulAPROBABILIDADE
53
PROBABILIDADE • AulA 4
 » Resolver problemas que envolvem o cálculo da probabilidade de eventos.
 » Identificar eventos independentes e não independentes em situações-problema.
 » Resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
 » Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
combinatória
Entende-se por combinatória a parte da Matemática que analisa estruturas e relações discretas. 
Dessa forma, é muito comum a ocorrência de dois tipos de problemas em Combinatória:
 » Demonstrar a existência de subconjuntos de elementos de um conjunto finito dado e 
que satisfazem certas condições.
 » Contar ou classificar os subconjuntos de um conjunto finito e que satisfazem certas 
condições dadas.
A resolução de problemas combinatórios exige, muitas vezes, engenhosidade e a compreensão 
plena da situação descrita, embora a Combinatória apresente técnicas gerais que permitem 
atacar certos tipos de problemas.
Nesta secção, serão apresentadas ferramentas básicas que nos permitem determinar o número 
de elementos de conjuntos formados de acordo com certas regras, sem que seja necessário 
enumerar seus elementos.
Princípio da adição
“Se A e B são dois conjuntos disjuntos, com m e n elementos, respectivamente, então AÈB possui 
m + n elementos.”
Princípio Fundamental da contagem (PFc) ou princípio 
multiplicativo 
“Se há X modos de tomar uma decisão d1 e, tomada a decisão d1, há y modos de tomar a decisão 
d2, então o número de modos de tomar sucessivamente as decisões d1 e d2 é x y.”
Assim, podemos utilizar esta ideia para enunciar esse mesmo princípio, só que de uma forma 
mais geral, isto é:
“Se um acontecimento Ai pode ocorrer de mi maneiras distintas para i = 1,2,3,...,n), então a 
sequência (A1, A2, ..., An) de n acontecimentos sucessivos pode ocorrer de m1.m2. ... .mn maneiras 
distintas.”
54
AulA 4 • PROBABILIDADE
EXERCÍCIO RESOLVIDO
Com 4 homens e 3 mulheres, de quantos modos se pode formar um casal?
SOLUÇÃO
Formar um casal equivale a tomar as decisões:
d1: escolher um homem 
d2: escolher uma mulher 
Assim, #d1 = 4 e #d2 = 3. Portanto pelo PFC, 4x3 = 12 modos de formar um casal.
EXERCÍCIO RESOLVIDO
Uma bandeira é formada por 7 listras que devem ser coloridas usando apenas as cores branco, 
preto e vermelho. Se cada listra deve ter apenas uma cor e não se pode usar cores iguais em listras 
adjacentes, de quantos modos se pode colorir a bandeira?
SOLUÇÃO
Colorir a bandeira equivale a escolher a cor de cada listra. 
d1: escolher uma cor para pintar a primeira listra 
d2: escolher uma cor para pintar a segunda listra, após ter ocorrido d1
d3: escolher uma cor para pintar a terceira listra, após terem ocorrido d1 e d2
 .
 .
 .
d7: escolher uma cor para pintar a sétima listra, após terem ocorrido d1,d2,...,d6
Assim, #d1 = 3, #d2 = 2, #d3 = 2, ..., #d7 = 2. Portanto, pelo PFC, 3 x 2 x 2 x ... x 2 = 192 modos de 
distintos de pintar a bandeira.
EXERCÍCIO RESOLVIDO 
Quantos são os números de 3 dígitos que podem ser escritos no sistema de base 10?
SOLUÇÃO 
Um número de três dígitos é representado por p1 p2 p3, onde p1, p2 e p3 denotam a posição de cada 
algarismo que compõe o número. Então:
Atenção
Denotamos por #d o número de 
possibilidades para se tomar a decisão d.
55
PROBABILIDADE • AulA 4
d1: escolher um número para a posição p1, diferente de zero 
d2: escolher um número para a posição p2, após ter ocorrido d1
d3: escolher um número para a posição p2, após terem ocorrido d1 e d2
Assim, #d1 = 9, #d2 = 10 e #d3 = 10. 
Portanto, pelo PFC, 9 x 10 x 10 = 900 
EXERCÍCIO RESOLVIDO
Quantos são os números de 3 dígitos distintos que podem 
ser escritos no sistema de base 10?
SOLUÇÃO 
Um número de três dígitos distintos é representado por p1 
p2 p3, onde p1, p2 e p3 denotam a posição de cada algarismo 
que compõe o número. Então:
d1: escolher um número para a posição p1, diferente de zero 
d2: escolher um número para a posição p2, após ter ocorrido d1
d3: escolher um número para a posição p2, após terem ocorrido d1 e d2
Assim, #d1 = 9, #d2 = 9 e #d3 = 8. Portanto, pelo PFC, 9 x 9 x 8 = 648.
Permutações simples
Dados objetos distintos , de quantos modos é possível ordená-los? 
Por exemplo, para os objetos 1, 2, 3, há 6 ordenações: 123, 132, 213, 231, 312 e 321. No caso geral, 
temos n modos de escolher o objeto que ocupará o primeiro lugar, modos de escolher o que 
ocupará o segundo lugar, ... , 1 modo de escolher o objeto que ocupará o último lugar. Portanto, 
o número de modos de ordenar n objetos distintos é:
!1)...1( nnn =−
Cada ordenação dos objetos é chamada uma permutação simples de objetos e o número de 
permutações simples de objetos distintos é representado por Pn . Assim, Pn=! (já que 0! = 1, 
define-se P0 =1).
PROBLEMA RESOLVIDO
a. Quantos são os anagramas da palavra “CALOR”? 
Atenção
A notação n! representa o fatorial de n.
Isto é:
3! (lê-se: três fatorial ou o fatorial de 3)
Nesse caso:
3! = 3 • 2 • 1 = 6 
4! = 4 • 3 • 2 • 1 = 24 
Atenção: por definição 0! = 1
56
AulA 4 • PROBABILIDADE
b. Quantos começam por consoante?
SOLUÇÃO
A) Cada anagrama corresponde a uma ordem de colocação dessas 5 letras. 
d: Permutar as 5 letras
Assim, d = P5 = 5 ! = 120. Logo, existem 120 anagramas da palavra CALOR.
B) Agora, temos uma restrição, isto é, queremos contar o número de anagramas da palavra CALOR 
que começam por consoante. Então:
d1: escolher uma consoante para ser a primeira letra
d2: permutar as letras restantes
Assim, #d1 = 3 e #d2 = P4 = 4! = 24. Portanto, pelo PFC, 3 x 24 = 72 anagramas que começam por 
consoante.
PROBLEMA RESOLVIDO
De quantos modos podemos arrumar em fila 5 livros diferentes de Matemática, 3 livros diferentes 
de Estatística e 2 livros diferentes de Física, de modo que os livros de uma matéria permaneçam 
juntos?
SOLUÇÃO 
d1: Escolher a ordem das matérias
d2: Permutar os livros de matemática, após ter ocorrido d1
d3: Permutar os livros de estatística após terem ocorrido d1 e d2
d4: Permutar os livros de física, após terem ocorrido d1, d2, e d3
Assim, #d1 = P3 = 3! = 6, #d2 = P5 = 5! =120, #d3 = P3 = 3! = 6 e #d4 = P2 = 2! = 2. Logo, pelo PFC, temos 
3!5!3!2! = 6 x 120 x 6 x 2 = 8640.
Permutações de elementos nem todos distintos
Vejamos, primeiramente, o seguinte exemplo:
Exemplo 3.3 
Quantos são os anagramas da palavra “BOTAFOGO”?
57
PROBABILIDADE • AulA 4
Se as letras fossem diferentes, a resposta seria 8!. Como temos três letras O, isto é, três letras que 
são iguais, quando as trocamos entre si obtemos o mesmo anagrama e não um anagrama distinto. 
Isso faz com que, na nossa contagem de 8!, tenhamos contado o mesmo anagrama váriasvezes, 
3! vezes precisamente, pois há 3! modos de trocar as letras O entre si.
A resposta é 8! 67203!
= .
E como ficaria o caso geral?
No caso geral, suponha que temos n objetos distintos onde existem objetos do tipo 1, a2 objetos 
do tipo 2, ... , ak objetos do tipo ʎ, onde a1 + a2 + ... + ak = n. Então:
1 2, ,...
1 2
!
! !... !
=ka a an
k
nP
a a a
COMBINAÇÕES SIMPLES
De quantos modos podemos selecionar objetos distintos entre objetos distintos dados? Ou, o 
que é o mesmo, quantos são os subconjuntos com elementos do conjunto {a1, a2, .... , an}?
Cada subconjunto com elementos é chamado de uma combinação simples de classe dos objetos 
a1, a2, ... , an. Assim, por exemplo, as combinações simples de classe 3 dos objetos a1, a2, a3, a4, a5 são: 
{a1,a2,a3} {a1,a2,a4} {a1,a2,a5} {a1,a3,a4} {a1,a3,a5}
{a1,a4,a5} {a2,a3,a4} {a2,a3,a5} {a2,a4,a5} {a3,a4,a5}.
O número de combinações simples de classe p de n objetos é representado por pnC . Assim, 35 10=C .
Analisemos esta resposta: a escolha do 1º elemento da combinação pode ser feita de 5 modos; a do 
2º, de 4 modos e a do 3º, de 3 modos. A resposta parece ser 5 x 4 x 3 = 60. Entretanto, se pensarmos 
numa combinação, por exemplo, {a1,a2,a3}, verificamos que as combinações {a1,a2,a3}, {a1,a3,a2}, 
{a2,a1,a3},... são idênticas e foram contadas como se fossem diferentes. Com efeito, se dissermos 
que há 5 modos de escolher o 1º elemento da combinação é porque estamos considerando 
as escolhas a1 e a2 como diferentes e, portanto, estamos contando {a1,a2,a3} como diferente de 
{a2,a1,a3}. Em suma, na resposta 60 estamos contando cada combinação uma vez para cada ordem 
de escrever seus elementos. Como em cada combinação os elementos podem ser escritos em 
P3 = 3! = 6 ordens, cada combinação foi contada 6 vezes. Logo, a resposta é 60/6 = 10.
No caso geral, temos:
( ) ( ) 01 ... 1 ,0 , e 1.
!
− − +
= < ≤ =pn n
n n n p
C p n C
p
58
AulA 4 • PROBABILIDADE
Uma expressão alternativa pode ser obtida multiplicando o numerador e o denominador por 
( )!−n p
Obtemos:
( )
! , 0 .
! !
= ≤ ≤
−
p
n
nC p n
p n p
OBSERVAÇÃO 4.1
A expressão 
( )1 ( 1)
!
n n n n p
p p
− … − + 
= 
 
Faz sentido para qualquer n real, desde que p seja um número inteiro positivo. Define-se, então, 
para qualquer n real e qualquer p inteiro não negativo o binomial de n sobre p por:
( ) ( )
1 ( 1) 0 e 1 0!
n nn n n p
p
p p
− … − +   
= > =   
   
Se n é inteiro não negativo:
( )1 ( 1)
!
p
n
n n n n p
C
p p
− … − + 
= = 
 
Isto é, pnC é o número de p-subconjuntos de um conjunto com n elementos. 
Vale observar que se n não é inteiro não negativo, pnC não tem sentido.
EXERCÍCIO RESOLVIDO
Quantas saladas contendo exatamente 4 frutas podemos formar se dispomos de 10 frutas 
diferentes?
SOLUÇÃO
d: Escolher 4 das 10 frutas para formar a salada
Assim, ⋅ ⋅ ⋅= =410
10 9 8 7# =210 modos.
4!
d C
59
PROBABILIDADE • AulA 4
Princípio da inclusão-exclusão
O Princípio da Inclusão-Exclusão é uma fórmula para contar o número de elementos que 
pertencem à união de vários conjuntos não necessariamente disjuntos. Na sua versão mais 
simples, ele afirma que:
# (A ∪ B) = #A + #B - #(A ∩ B)
No caso de três conjuntos este princípio afirma que:
# (A ∪ B ∪ C) = #A + #B + #C - #(A ∩ B) - #(A ∩ C) - #(B ∩ C) + #(A ∩ B ∩ C)
Probabilidades
Os resultados apresentados nas secções anteriores desta aula servem como aplicações na Teoria 
das Probabilidades.
Vale ressaltar que o estudo de probabilidades se dará a partir de exemplos simples que servirão 
de motivação para introduzir definições importantes que ajudam a desenvolver a noção de 
probabilidade com mais facilidade.
Suponha que uma moeda foi lançada uma vez para o alto e ao cair observou-se que a face voltada 
para cima era cara. Esse resultado, isto é, o resultado que vemos e registramos é chamado de 
observação ou medição, e o processo de realizar uma observação é chamado de experimento. 
Um experimento pode ser classificado em determinístico ou aleatório.
Definição 4.1
Diz-se que um experimento é determinístico quando repetido em condições semelhantes conduz 
a resultados idênticos.
Definição 4.2
Diz-se que um experimento é aleatório quando repetidos sob as mesmas condições produzem 
resultados geralmente diferentes.
O experimento acima (lançamento de uma moeda) corresponde a um experimento aleatório. 
Fenômenos como este acontecem frequentemente em nossa vida cotidiana. 
60
AulA 4 • PROBABILIDADE
Exemplo 4.5
São experimentos aleatórios:
 » O resultado no lançamento de uma moeda.
 » O resultado no lançamento de um dado.
 » O número de peças defeituosas num lote de 100 unidades produzidas por uma máquina.
 » O tempo de duração de uma lâmpada elétrica.
A Teoria das Probabilidades é o ramo da Matemática que cria, desenvolve e em geral pesquisa 
modelos que podem ser utilizados para estudar experimentos ou fenômenos aleatórios. 
Definição 4.3
Chama-se espaço amostral de um experimento aleatório, e representa-se por W, o conjunto de todos 
os resultados possíveis desse experimento. Os elementos de W são chamados pontos amostrais.
Exemplo 4.6
Os espaços amostrais associados aos experimentos aleatórios apresentados no exemplo 3.5 são, 
respectivamente:
»» W = {K, C}, onde K = cara e C = coroa
»» W = {1, 2, 3, 4, 5, 6}
»» W = {0, 1, 2, 3, ..., 100}
»» W = {x ∈ R| x > 0}
Definição 4.4
Chama-se evento todo e qualquer subconjunto do espaço amostral.
Definição 4.5
Os elementos do espaço amostral são chamados eventos elementares.
Observação 4.2
Dois casos extremos de eventos são o próprio espaço amostral W, chamado evento certo e o 
conjunto vazio ∅, denominado evento impossível.
61
PROBABILIDADE • AulA 4
Definição 4.6
Diz-se que dois eventos A e B são mutuamente exclusivos se A ∩ B = ∅.
DEFINIÇÃO 4.7
Se n eventos A1, A2, ..., An são mutuamente exclusivos, e se A1 ∪ A2 ∪ ... ∪ An = W, diz-se que esses 
eventos formam uma partição de W.
Exemplo 4.7
Considere o experimento aleatório: jogue um dado e observe o número mostrado na face de cima. 
Nesse caso, o conjunto formado por todos os resultados possíveis do experimento é dado por:
W»= {1, 2, 3, 4, 5, 6} (Espaço amostral)
Portanto, #W = 6.
Qualquer subconjunto do espaço amostral caracteriza um evento, por exemplo, o subconjunto
A = {2, 4, 6}
é o evento que acontece se o número mostrado na face de cima é par. Assim, #A = 3. Uma das 
perguntas que pode ser feita é: qual a chance (probabilidade) do evento A ocorrer?
Intuitivamente, se esse experimento for repetido em um grande número de vezes, obtém-se um 
número par em aproximadamente metade dos casos. Isto é:
 » Os eventos elementares são todos igualmente prováveis.
 » O número de elementos de A é justamente a metade dos elementos de W.
Logo, pode-se afirmar que:
Probabilidade de # 3 1
# 6 2
AA = = =
W
.
Definição de laplace para probabilidade
Chama-se probabilidade o quociente entre o número de casos favoráveis pelo número de casos 
possíveis. Isto é:
Probabilidade = número de casos favoráveisnúmero de casos possíveis
62
AulA 4 • PROBABILIDADE
As considerações anteriores permitem a seguinte conclusão:
Suponha que os experimentos aleatórios têm as seguintes características:
 » Há um número finito n de eventos elementares (casos possíveis). A união de todos os 
eventos elementares é o espaço amostral.
 » Os eventos elementares são igualmente prováveis.
 » Todo evento A é uma união de m eventos elementares onde m ≤ n.
Portanto:
Probabilidade de A:
número de casos favoráveis # mP(A)= = =número de casos possíveis # n
A
W
A definição acima tem como consequências imediatas:
 » Paratodo evento A, 0 ≤ P(A) ≤ 1;
 » P(W) = 1;
 » P(∅) = 0;
 » Se A ∩ B = ∅ então P(A ∪ B) = P(A) + P(B).
EXERCÍCIO RESOLVIDO
Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola dessa urna. Qual 
a probabilidade de se obter uma bola cujo número inscrito é múltiplo de 3?
SOLUÇÃO
Segue que:
Espaço amostral: {1, 2, 3, 4, 5, 6, 7, 8, 9,1 0}W=
Evento: A = {3, 6, 9}
Logo: #( ) 10
# 3AP A
W
= =
63
PROBABILIDADE • AulA 4
EXERCÍCIO RESOLVIDO
Uma moeda é lançada três vezes, sucessivamente. Qual é a probabilidade de observarmos:
( A ) Exatamente uma cara?
( B ) No máximo duas caras?
SOLUÇÃO
Podemos construir uma árvore de possibilidades, em que as 3 colunas representem os possíveis 
resultados dos 3 lançamentos. Isto é:
 
K: Cara C: Coroa
Segue que o espaço amostral é dado por:
W = {(K,K,K), (K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Logo, #W = 8.
a. O evento “exatamente uma cara” corresponde ao conjunto:
A = {(K,C,C), (C,K,C), (C,C,K)}
Daí: #A = 3
Portanto:
#
# 3( ) 37,5%8
AP A = = =
W
64
AulA 4 • PROBABILIDADE
b. O evento “no máximo duas caras” corresponde ao conjunto:
B = {(K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Daí: #B = 7
Portanto:
#
# 7( ) 87,5%8
BP B = = =
W
Observação 4.4
Nos dois últimos exercícios resolvidos, foi possível construir o espaço amostral representando 
cada um deles pelos seus pontos amostrais. Muitas vezes isso fica muito trabalhoso, tornando-
se inviável a descrição de todos os pontos amostrais. Dessa forma, em casos como esses, devem 
ser utilizadas as técnicas combinatórias apresentadas na secção anterior a fim de determinar o 
número de elementos tanto do espaço amostral W como do evento A, sem que seja necessário 
apresentar W e a explicitamente.
EXERCÍCIO RESOLVIDO
Certo setor de uma empresa possui 20 homens e 25 mulheres. Deseja-se formar, por meio de 
sorteio, uma comissão de cinco pessoas para representar esse setor. Qual a probabilidade de 
essa comissão vir a ser formada exclusivamente por homens?
SOLUÇÃO
Segue que:
 » O número de elementos do espaço amostral é igual ao número de maneiras de se 
escolher uma comissão qualquer de cinco pessoas, a partir dos 45 funcionários desse 
do setor da empresa.
 » O evento em questão corresponde a “todas as pessoas da comissão são homens”.
Logo:
W = 545# C e 520# A C=
Portanto:
P(A) = #Α = ≅
#W
=
5
20
5
45
0,0126 1,26%C
C
65
PROBABILIDADE • AulA 4
Espaços de probabilidade
A partir de agora será introduzida a noção geral de probabilidade.
Definição 4.8
Seja W espaço amostral. Uma função P definida para todos os subconjuntos de W (chamados 
eventos) é chamada uma probabilidade se:
1. 0 ≤ P(A) ≤ 1, para todo evento A ⊂»W;
2. P(∅) = 0, P(W) = 1;
3. Se A e B são eventos disjuntos, então P(A∪B) = P(A) + P(B).
Consequências da definição 3.8:
 » P( A ) = 1 – P(A).
 » Se A ⊂»B, então P(A) = P(B) – P(B – A).
 » Se A ⊂»B, então P(A) ≤ P(B).
 » P(A ∪»B) = P(A) + P(B) – P(A ∩ B).
EXERCÍCIO RESOLVIDO
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei 
ou uma carta de espadas?
SOLUÇÃO
Considere:
A: saída de um rei
B: saída de uma carta de espada
Então:
P(A) = 452 e P(B) = 
13
52
Mas, temos ainda:
A∩B: saída de um rei de espada
Daí:
P(A∩B) = 1
52
66
AulA 4 • PROBABILIDADE
Portanto:
P(A∪B) = P(A) + P(B) – P(A∩B) = + − = ≅4 13 1 16 0,3769%
52 82 52 82
EXERCÍCIO RESOLVIDO
Qual a probabilidade de, num baralho de 52 cartas, ao se retirarem 4 cartas, ao acaso, sem 
reposição, se obter uma quadra?
SOLUÇÃO
Segue que o espaço amostral W corresponde ao conjunto que contém todas as possibilidades 
de se extrair 4 cartas, ao acaso, de um baralho de 52 cartas. O evento A corresponde ao conjunto 
de todas as possibilidades de se obter uma quadra. Daí:
W = 452# C e #A = 13
Portanto:
P(A) = 4
52
13
 C
Probabilidade condicional
Definição 4.9
Sejam A ⊂»W e B ⊂»W. Define-se probabilidade condicional de A, dado o evento B, (A|B), como:
P(A|B) = ∩( )( )
P A B
P B se P(B) ≠ 0.
EXERCÍCIO RESOLVIDO
Um grupo de pessoas está classificado da seguinte forma:
Idioma/Sexo Fala alemão Fala francês Fala inglês
Homens 30 45 90
Mulheres 38 34 103
Escolhe-se uma pessoa ao acaso. Sabendo-se que esta pessoa fala francês, qual é a probabilidade 
de que seja homem?
SOLUÇÃO
Seja B o evento que ocorre se a pessoa escolhida fala francês e A se a pessoa escolhida é homem. 
Então:
+
= = ∩ =
45 34 79 45( ) e ( )
360 360 360
P B P A B
67
PROBABILIDADE • AulA 4
Portanto:
P(A|B) = ∩ = =
79
( ) 79360
45( ) 45
360
P A B
P B
Eventos independentes
Definição 4.10
Se os eventos A1, A2, ..., An são independentes então:
=1 =1
 Π Α = (Α ) 
 
∏∩
nn
Pι ι
ι ι
onde .
( ) ( )
=
= ⋅ ⋅…⋅∏ 1 2
1
( ) ( )
n
i n
i
P A P A P A P A
Teorema da probabilidade total
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral. Seja B um evento 
desse espaço. Então:
( )
=
= ⋅∑
1
( ) ( | )
n
i i
i
P B P A P B A
EXERCÍCIO RESOLVIDO
Uma urna contém 3 bolas brancas e 2 amarelas. Uma segunda urna contém 4 bolas brancas e 
2 amarelas. Escolhe-se, ao acaso, uma urna e dela retira-se também ao acaso, uma bola. Qual a 
probabilidade de que seja branca?
SOLUÇÃO
O problema pode ser resolvido com o auxílio de uma árvore de possibilidades, isto é:
68
AulA 4 • PROBABILIDADE
B: bola branca A: bola amarela
Portanto:
P(B) = ⋅ =3 1 19
10 3 30
Teorema bayes
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral W. Seja B ⊂»W. Sejam 
conhecidas e , i = 1, 2, ..., n. Então:
=
⋅
=
⋅∑
j i
n
i ii 1
P(A ) P(B| A )
( | )
P(A ) P(B| A )i
P A B , j = 1, 2, ..., n.
Observação 4.5
O Teorema de Bayes é também conhecido como Teorema da Probabilidade a Posteriori. Ele 
relaciona uma das parcelas da probabilidade total com a própria probabilidade total.
EXERCÍCIO RESOLVIDO
A urna A contém 3 bolas vermelhas e 2 azuis, e a urna B contém 2 bolas vermelhas e 8 azuis. 
Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma bola da urna A; se der coroa, 
extrai-se uma bola da urna B. Uma bola vermelha é extraída. Qual a probabilidade de ter saído 
cara no lançamento?
SOLUÇÃO
3V 2V
2A
Urna A Urna B
8A
69
PROBABILIDADE • AulA 4
K: Cara C: Coroa
Pede-se para determinar P(C|V). Segue que:
P(K) = 12 P(V|K) = 
3
5
 
P(C) = 1
2
 P(V|C) = 1
2
 
Como:
P(V) = P(K∩V)+P(C∩V)
Logo:
P(V) = P(K) •»P(V|K) + P(C) • P(V|C)
Daí:
P(V) = ⋅ ⋅+ =1 3 1 2 4
2 5 2 10 10
Portanto:
( ) ∩= = =
3
( ) 310| 4( ) 4
10
P V CP C V
P V
O problema também pode ser resolvido com o auxílio de uma árvore de possibilidades:
Portanto:
P(V) = 3 2 410 20 10+ =
P(C|V) = 
3
310
4 4
10
= .
70
AulA 4 • PROBABILIDADE
Probabilidade binomial
Considere um experimento com apenas dois resultados possíveis, chamados de sucesso e fracasso.
Exemplo 4.9
 » No lançamento de uma moeda não viciada, tome sucesso = cara e fracasso = coroa.
 » No lançamento de um dado não viciado, tome sucesso = o resultado é 4 ou 6 e fracasso 
= o resultado é 1, 2, 3 ou 5.
Seja p a probabilidade de sucesso e q = 1 – p a probabilidade de fracasso. No exemplo 3.9, segue 
que os valores de p são, respectivamente, 1
2
 e 35
A partir de cada experimento apresentado no exemplo 4.9, pode-se estar interessado em repeti-
los um número fixo n de vezes. Supondo que a probabilidade p de sucesso se mantém constante 
ao longo das provas e que as provas sejam independentes, surge a seguinte questão: Qualé a 
probabilidade de obtermos k sucessos nessas n provas?
Para resolver essa questão, utiliza-se o teorema binomial, isto é:
Teorema binomial
A probabilidade de ocorrerem exatamente k sucessos em uma sequência de n provas independentes, 
na qual a probabilidade de sucesso em cada prova é p, é igual a:
−  − 
 
(1 )n
k
k n kp p
EXERCÍCIO RESOLVIDO
Joga-se uma moeda não viciada 10 vezes. Qual a probabilidade de se obter exatamente 5 caras?
SOLUÇÃO
Tome: sucesso = cara.
Assim, p = 1
2
 em cada prova e as provas são independentes. Deve-se obter a probabilidade de 
k = 5 sucessos em n = 10 provas. Portanto, pelo teorema binomial, segue que:
−   − = =  
  
5
10 51 252 63(1 )
2 1024 256
10 1
5 2
71
PROBABILIDADE • AulA 4
Recurso tecnológico
cálculo da média, variância e desvio padrão
Na aula 2, vimos como calcular a média, a variância e o desvio padrão de uma amostra. Agora 
vejamos como isso pode ser feito com o auxílio do Excel.
Considere o seguinte conjunto de dados da figura 1 contidos numa planilha do Excel:
Figura 1 – Salários da empresa X.
Para obter a média salarial dos funcionários, escolha a última célula pertencente à coluna Salário 
mensal (R$) e no menu principal escolha o ícone fórmulas, isto é:
Figura 2 – cálculo da Média.
72
AulA 4 • PROBABILIDADE
Em seguida, clique no ícone “Mais Funções”, e escolha “Estatística”, ou seja:
Figura 3 – Selecionando o ícone “Mais Funções”.
Agora basta escolher a função desejada, isto é, no caso da média, escolha MÉDIA. Assim, a 
média salarial aparecerá calculada na célula selecionada. Analogamente, se obtêm outros tipos 
de médias, a mediana, a moda, a variância e o desvio padrão.
Figura 4 – Selecionando o ícone Estatística.
 
73
PROBABILIDADE • AulA 4
Assim:
Figura 5 – Obtenção de algumas medidas de tendência.
RESUMO
Vimos até agora:
 » Como resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou 
o princípio multiplicativo.
 » Como reconhecer a diferença entre conjuntos e sequências e identificar em situações-
problema agrupamentos associados a conjuntos e sequências.
 » Como reconhecer situações em que os agrupamentos são distinguíveis pela ordem de 
seus elementos ou não e resolver problemas que envolvam arranjos, combinações e/
ou permutações simples e com elementos repetidos.
74
AulA 4 • PROBABILIDADE
 » Como reconhecer o caráter aleatório de variáveis em situações-problema e identificar 
o espaço amostral nessas situações-problema.
 » Como resolver problemas que envolvam o cálculo de probabilidades de eventos 
equiprováveis.
 » Como resolver problemas que envolvem o cálculo da probabilidade de eventos.
 » Como identificar eventos independentes e não independentes em situações-problema.
 » Como resolver problemas que envolvam o conceito de probabilidade condicional e 
binomial.
 » Como utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do 
conhecimento.
75
Apresentação
Esta aula apresenta o conceito de variável aleatória discreta e exemplos de distribuições de 
probabilidades que servem como modelos para o estudo de experimentos estatísticos.
Objetivos
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Identificar variáveis aleatórias discreta.
 » Entender como ocorre a distribuição de probabilidades para variáveis aleatórias discretas.
 » Utilizar adequadamente o modelo de distribuição de probabilidades discreta binomial 
na resolução de problemas estatísticos.
5
AulA
DISTRIBUIçãO DE PROBABILIDADE 
DE vARIávEIS ALEATóRIAS 
DIScRETAS
76
AulA 5 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS
Preliminares
A seguir, será apresentado o conceito de variável aleatória a fim de associá-lo aos resultados de 
um experimento aleatório. Esse conceito estará relacionado a um número real que, juntamente 
com a definição de função, permitirá calcular a probabilidade de ocorrência de vários eventos 
correspondentes a esse experimento de forma mais simples e fácil.
Definição 5.1
Uma variável aleatória é uma variável que assume valores associados com resultados aleatórios de 
um experimento, onde um (e apenas um) valor numérico é marcado para cada ponto da amostra.
As variáveis aleatórias são classificadas em variáveis aleatórias discretas e variáveis aleatórias 
contínuas (esta última a ser tratada na aula 6).
Definição 5.2
Chama-se variável aleatória discreta toda variável aleatória que pode assumir um número de 
valores.
Exemplo 5.1 – Variáveis aleatórias discretas
 » O número de vendas feitas por um vendedor em uma semana de trabalho: x = 0, 1, 2, 3, ...
 » O número de consumidores de uma amostra de 600 pessoas que preferem o produto 
da marca A em relação ao produto da marca B: x = 0, 1, 2, 3, ..., 600.
 » O número de clientes esperando serem servidos em um restaurante num horário 
específico: x = 1, 2, 3, ...
Distribuição de probabilidades para variáveis aleatórias 
discretas
Uma descrição completa de uma variável aleatória discreta requer as seguintes especificações:
 » Os possíveis valores que ela pode assumir;
 » A probabilidade associada a cada valor.
Definição 5.4
A distribuição de probabilidade de uma variável aleatória discreta é um gráfico, tabela ou fórmula 
que especifica a probabilidade associada em cada valor possível que a variável aleatória pode 
assumir.
77
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS • AulA 5
Vale lembrar que são necessários dois requisitos para uma distribuição de probabilidades de 
uma variável aleatória discreta X:
 » p(x) > 0 ∀ x
»» S p(x) = 1
Média ou valor esperado de uma variável aleatória discreta
A média de uma variável aleatória discreta é o principal parâmetro de posição e indica informações 
sobre o centro de sua distribuição de probabilidades.
Definição 5.5
Chama-se média ou valor esperado de uma variável aleatória discreta e representa-se, por m ou 
E(x), a seguinte soma:
( )= =∑ ( )i i
i
E x x p xm
Observação 5.1
Esperado é um termo matemático e não deve ser interpretado como usualmente é aplicado. O 
valor esperado é a média da distribuição de probabilidades ou uma medida de tendência central.
EXERCÍCIO RESOLVIDO
João é funcionário de uma empresa de seguros e vendeu uma apólice de seguros de um ano por 
US$ 10.000 com um prêmio anual de US$ 290. Observando tabelas atuariais, verifica-se que a 
probabilidade de morte durante o próximo ano para uma pessoa da idade, sexo, nível de saúde 
do seu cliente é de 0,001. Qual o ganho esperado (quantidade de dinheiro feito pela empresa) 
para uma apólice desse tipo?
SOLUÇÃO
O objetivo do experimento é observar se o cliente viverá no ano seguinte. As probabilidades 
associadas com os dois pontos amostrais, viver e morrer, respectivamente, são 0,009 e 0,001. A 
variável aleatória de interesse é o ganho X que pode assumir valores discretos na tabela 5.1 abaixo.
Tabela 5.1 – ganhos e perdas com a venda de apólice de seguros de uma empresa.
Ganho X Ponto amostral Probabilidade
US$ 290 cliente vive 0,009
- US$ 9 710 cliente morre 0,001
78
AulA 5 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS
Se o cliente vive, então o ganho é de US$ 290. Se o cliente morre, então o ganho é negativo, isto 
é, igual a US$ (290 – 1 000) = - US$ 9 710.
Portanto, o valor esperado é dado por:
( ) ( )= = = ⋅ + − ⋅ =∑ ( ) 290 0,999 9710 0,001 $ 280i i
i
E x x p x USm
Conclusão:
Se a empresa vender um número grande de apólices de um ano de US$ 10 000 para clientes que 
possuem as características descritas anteriormente, ela ganha um valor líquido (em média) de 
US$ 280 por venda no próximo ano.
No caso das variáveis aleatórias discretas, podem-se também encontrarmedidas de variabilidade.
Definição 5.6
A variância de uma variável aleatória discreta X é dada por
( ) ( )= −∑ 2 2i i
I
VAR X x p x m
Definição 5.7
O desvio padrão de uma variável aleatória discreta é igual à raiz quadrada da variância, isto é:
( ) ( )DP X VAR X=
PROBLEMA RESOLVIDO
Um jogo consiste em lançar uma moeda. Se cair cara, ganham-se R$ 10,00 e se cair coroa perdem-
se R$ 5,00. Qual o lucro médio do jogo e qual a sua variância?
SOLUÇÃO
Temos que X é a variável lucro, daí:
Tabela 5.2 – variável lucro.
Resultado Probabilidade (xi) Valor de xi
cara 1/2 R$ 10,00
coroa 1/2 R$ 5,00
79
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS • AulA 5
Portanto:
( )= = = ⋅ + ⋅ − =∑ 1 1( ) 10 ( 5) $ 2,502 5i ii
E x x p x Rm
( ) ( )    = − = =   
  
⋅

⋅∑ 2 2 $ 56,25i i
I
1 1VAR X x p x 100 - 2,5 + 25 - 2,5 R
2 2
PROBLEMA RESOLVIDO
João investe uma soma fixa de dinheiro em 5 negócios na área de internet. Sabendo que 70% 
desses investimentos têm sucesso, que os resultados dos investimentos são independentes uns 
dos outros e que a distribuição de probabilidade para o número X de investimentos de sucesso 
entre cinco é:
Tabela 5.3 – Investimentos de sucesso.
X 0 1 2 3 4 5
p(X) 0,002 0,029 0,132 0,309 0,360 0,168
( A ) Determine o número médio de investimentos de sucesso e interprete o seu resultado.
( B ) Encontre o desvio padrão dessa distribuição.
SOLUÇÃO
(A) Temos que:
( ) ( ) ⋅ ⋅ ⋅ ⋅= = = = + + + + ⋅ + =⋅∑ 0 0,002 1 0,029 2 0,132 3 0,309 4 0,360 5 0,168 3,50i i
i
E x x p xm
Na média, o número de investimentos de sucesso em 5 será igual a 3,5. Esse valor esperado só 
faz sentido quando o experimento (realiza 5 investimentos na internet) for repetido um grande 
número de vezes.
(B) Temos que:
( ) ( )= − =∑ 2 2i i
I
VAR X x p x m
⋅ ⋅= + ⋅ + + + + −⋅ ⋅ ⋅ =(0 0,002 1 0,029 4 0,132 9 0,309 16 0,360 25 0,168) 12,25 1,048
Logo:
( ) ( )= = ≅1,048 1,0237DP X VAR X
80
AulA 5 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS
Principais distribuições de variáveis aleatórias discretas
Dentre as principais distribuições de variáveis aleatórias discretas estão as distribuições de 
Bernoulli, geométrica, de Pascal, hipergeométrica, binomial e a de Poisson. Para fins de nossos 
estudos daremos destaque às distribuições de variáveis aleatórias discretas referentes ao modelo 
binomial.
Distribuição binomial
Considere n tentativas independentes de um experimento aleatório. Sabendo que cada tentativa 
admite duas possibilidades: sucesso e fracasso com probabilidades p e q = 1 – p, respectivamente, 
e sendo X o número de sucessos em n tentativas a função:
P(X = x) = pk qn – k 
Define uma distribuição binomial. Segue também que:
E(X) = np
VAR(X) = npq
EXERCÍCIO RESOLVIDO
Numa linha de produção, 10% das peças são defeituosas, e as peças são acondicionadas em caixas 
com 5 unidades. Seja X a variável aleatória igual ao número de peças defeituosas encontradas 
numa caixa.
( A ) Qual a probabilidade de uma caixa conter duas ou mais peças defeituosas?
( B ) Qual a probabilidade de uma caixa conter duas ou mais peças defeituosas?
( C ) Qual o valor esperado do desconto na venda de um lote de 1 000 caixas, sabendo-se que 
uma caixa com mais de uma peça defeituosa tem um desconto no preço de R$ 10,00?
SOLUÇÃO
Temos que:
X = número de peças defeituosas na caixa
N = 5
p = p(sucesso) = 0,10
81
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS DIScRETAS • AulA 5
A) P(X = 3) = 
 
 
 
5
3 × 0,10
3 × (1 – 0,10)2 = 0,0081
B) P(X > 2) = 1 – P(X < 2)
 P(X < 2) = 
 
 
 
5
0 × 0,10
0 × (1 – 0,10)5 +   
 
5
1 × 0,10
1 × (1 – 0,10)4 =0,91854
Portanto: 
 P(X > 2) = 1 – 0,91854 = 0,08146
C) Tome: Y = valor do desconto por caixa
Então:
E(Y) = np = 10 P(X > 2) + 0 P(X < 2) = 
= 10 • 0,08146 + 0 • 0,91854 = 0,8146
Logo, em um lote de 1 000 caixas, o desconto esperado no preço será de 1 000(0,8146) = R$ 814,60.
RESUMO
Vimos até agora:
 » Como reconhecer e ou classificar uma variável aleatória discretas.
 » Como resolver problemas relacionados às distribuições de probabilidades de variáveis 
aleatórias discretas.
 » Utilizar adequadamente o modelo binomial de distribuição de probabilidades discretas.
82
Apresentação
Esta aula apresenta o conceito de variável aleatória contínua e exemplos de distribuições de 
probabilidades que servem como modelos para o estudo de experimentos estatísticos.
Objetivos
 » Identificar variáveis aleatórias contínuas.
 » Entender como ocorre a distribuição de probabilidades para variáveis aleatórias contínuas.
 » Utilizar adequadamente o modelo de distribuição de probabilidades contínuas normal 
na resolução de problemas estatísticos.
6
AulA
DISTRIBUIçãO DE PROBABILIDADE 
DE vARIávEIS ALEATóRIAS 
cOnTínUAS
83
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Considere o experimento que consiste em selecionar, ao acaso, uma peça da produção de uma 
máquina e determinar o valor do comprimento da peça em milímetros. Neste caso, dentro de 
um determinado grau de precisão decorrente da limitação do instrumento de medida, a variável 
aleatória X (comprimento da peça) pode assumir qualquer valor em um intervalo da reta real, 
sendo, dessa forma, uma variável contínua.
Definição 6.1
Chama-se variável aleatória contínua, toda variável aleatória que pode assumir valores 
correspondentes a quaisquer pontos contidos em um ou mais intervalos (isto é, valores que são 
incontáveis).
Exemplo 6.1 – Variáveis aleatórias contínuas
 » A quantidade de tempo entre chegadas a um hospital: 0≤x≤¥.
 » A profundidade no qual uma perfuração chega pela primeira vez com sucesso ao petróleo: 
0≤x≤c, em que c é a profundidade máxima que pode ser obtida.
 » O peso de um item de alimentação comprado em um supermercado: 0≤x≤500.
Distribuição de probabilidades para variáveis aleatórias 
contínuas
Nas duas últimas seções desta aula, interessavam apenas situações caracterizadas por variáveis 
aleatórias discretas. Agora, o foco está num outro tipo de variável, isto é, variáveis que aparecem 
em problemas nos quais uma grandeza medida assume um valor que pode variar continuamente. 
Alguns exemplos como o tempo de espera para ser atendido na emergência de um hospital, o 
peso de um camundongo em um experimento de laboratório, o tempo de vida de um capacitor 
em um teste de controle de qualidade serão alvo de nossos estudos.
Nos casos citados, não faz sentido associar uma probabilidade a cada valor do resultado de um 
experimento, já que existe um número infinito de valores possíveis, distribuídos ao longo de certo 
intervalo. Sendo assim, será usada uma função chamada função densidade de probabilidade 
para indicar como as probabilidades estão distribuídas ao longo do contradomínio da variável 
aleatória.
Definição 6.2
Uma função contínua f(x) é chamada função densidade de probabilidade se satisfaz as seguintes 
condições:
1. f(x) > 0, ∀ x ∈ R
84
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS
2. P(a ≤ x ≤ b) = ( )∫f x dx
β
α
3. ( )
∞
−∞
=∫ 1f x dx
Na definição 6.2, vale observar que a primeira condição decorre do fato de que as probabilidades 
não podem ser negativas. Já a segunda condição indica que a probabilidade de uma variável 
aleatória pode assumir valores num intervalo, sendo este a área sob a curva da função densidade 
de probabilidade no intervalo associado. A terceira condição define que a probabilidade do espaço 
amostral é 1, isto é, a probabilidade de ocorrência de algum dos resultados possíveis é certa.
Figura 6.1 – Função densidade de probabilidade.
EXERCÍCIO RESOLVIDO
Uma variável aleatória contínuaX é dada pela função densidade de probabilidade f(x) = x2, 0≤x≤1. 
Calcule P(0≤x≤1/2).
SOLUÇÃO
Temos que:
1
2
0
= =≤ ≤ =∫
13
2 2
0
1 1(0 )
2 3 24
xP x x dx
85
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Média ou valor esperado de uma variável aleatória 
contínua
A média ou valor esperado de uma variável aleatória contínua é o principal parâmetro de posição 
e indica informações sobre o centro de sua distribuição de probabilidades.
Definição 6.3
Se X é uma variável aleatória contínua cuja função densidade de probabilidade é f(x), a média 
ou o valor esperado de X, indicado por m ou E(X), é dada por:
m = E(X) = ( )
∞
−∞
⋅∫ x f x dx
EXERCÍCIO RESOLVIDO
Seja X = tempo durante o qual um equipamento elétrico é usado em carga máxima, num certo 
período de tempo, em minutos. A função densidade de probabilidade de X é dada por:
( )
( )
 ≤= 
 ≤ ≤

2
2
1 x, se 0 x<1500
500
1 3000-x , se 1500 x 3000
500
f x
Calcular E(X).
SOLUÇÃO
( ) ( )⋅ ⋅ == + −∫ ∫
1500 3000
2 2
0 1500
1 1 3000 1500 minutos 
500 500
E x x xdx x xdx
No caso das variáveis aleatórias contínuas, podem-se também encontrar medidas de variabilidade, 
ou seja:
Definição 6.4
Se X é uma variável aleatória contínua cuja média é m e cuja função densidade de probabilidade 
é f(x), a variância de X, VAR(X), é dada por:
VAR(X) = ( )
∞
−∞
−∫ 2 2 x f x dx m
Definição 6.5
O desvio padrão de uma variável aleatória contínua é igual à raiz quadrada na variância, isto é:
DP(X) = ( )VAR X
86
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS
Distribuição normal
Dentre as principais distribuições de variáveis aleatórias contínuas está a distribuição normal, 
a qual se dará ênfase nesse momento.
Diz-se que X é uma variável aleatória normal, ou que a distribuição X é uma distribuição normal, 
de parâmetros m e s se a função densidade de X é dada por: 
( )
−
−
= −∞ < <∞
2
2
( )
21 , 
2
x
f x e x
m
s
s π
O gráfico de f(x) é dado como na figura 6.2 abaixo:
Figura 6.2 – Gráfico da distribuição normal.
m - s m m + s
A função acima apresenta as seguintes características:
 » O ponto máximo de f(x) é o ponto X = m;
 » Os pontos de inflexão da função são X = m - s e X = m + s;
 » A curva é simétrica em relação a m;
 » E(X) = m e VAR(X) = s»2.
É possível mostrar que:
−∞ −
−∞
=∫
2
2
( )
21 e 1
2
x
dx
m
s
s π
Dessa forma, para calcular a probabilidade indicada na figura 6.3 abaixo, deve-se fazer:
87
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Figura 6.3 – cálculo da probabilidade.
a b
( )
−
−
≤ ≤ = ∫
2
2
( )
21
2
xa
b
P a X b e dx
m
s
s π
Que apresenta um grau relativo de dificuldade. Isto porque as integrais envolvidas neste processo 
não possuem solução analítica, de modo que é preciso recorrer a soluções aproximadas. Na 
prática, basta construir tabelas de valores aproximados para a distribuição normal padrão, 
já que qualquer variável aleatória normal pode ser convertida para a forma padrão por uma 
transformação linear. Ou seja:
Se X é uma variável aleatória normal de parâmetros m e s, uma nova variável aleatória Z é definida 
através da relação:
−
=
XZ m
s
A distribuição de Z é a distribuição normal. Sendo assim, pode-se usar a última igualdade para 
converter qualquer variável aleatória normal em uma variável padrão. Portanto, torna-se possível 
usar uma tabela de probabilidade para a distribuição normal, apresentada no Apêndice 1 desse 
caderno de estudos. Esta tabela tem valores (com precisão de 4 casas decimais) da função de 
distribuição cumulativa Φ( )x associada à variável aleatória normal padrão, isto é, da função:
( )
−
−∞
= ∫
2
21
2
x t
x e dt
π
Vale observar que a tabela contém apenas os valores de Φ( )x para x > 0. Para determinar os 
valores de Φ( )x para x< 0, usa-se a relação:
( )Φ − = −Φ1 ( )x x
Se Z é uma variável padrão, temos que:
P(Z < - X) = P(Z > X)
88
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS
Já que:
P(Z > X) = 1 – P(Z < X)
Passos para encontrar uma probabilidade correspondendo 
a uma variável aleatória normal
1o Passo: esboce a distribuição normal e indique a média da variável aleatória x. Então, sombreie 
a área correspondendo à probabilidade que você quer encontrar.
2o Passo: converta as bordas da área sombreada de x valores para z valores da variável aleatória 
normal padrão usando a fórmula:
−
=
XZ m
s
3o Passo: use a tabela contida no Apêndice 1 desse caderno de estudos, para encontrar áreas 
correspondendo aos valores de Z. Se necessário, use a simetria da distribuição normal para 
encontrar áreas correspondendo aos valores negativos de Z e o fato de que a área total de cada lado 
da média é igual a 0,5 para converter as áreas da tabela contida no apêndice 1 às probabilidades 
do evento que você sombreou.
EXERCÍCIO RESOLVIDO
Considere uma distribuição normal com média m = 100 e variância VAR(X) = 25. Calcule:
A) P(100 < X < 106);
B) P(89 < X < 107);
C) P(112 < X < 116);
D) P(X > 108).
SOLUÇÃO
Temos que:
−
=
XZ m
s
89
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Portanto:
A)
−
= ⇒ =
100 100 0
5
Z Z
−
= ⇒ =
106 100 1,2
5
Z Z
100 106 X 0 1,2 Z
P(100 < X < 106) = P(0 < Z < 1,2) = 0,384930
B)
−
= ⇒ = −
89 100 2,2
5
Z Z
−
= ⇒ =
107 100 1,4
5
Z Z
89 100 107 X -2,2 0 1,4 Z
P(89 < X < 107) = P(-2,2 < Z < 1,4) = 
= P(-2,2 < Z < 0) + P(0 < Z < 1,4) = 0,90534
C)
−
= ⇒ =
112 100 2,4
5
Z Z
−
= ⇒ =
116 100 3,2
5
Z Z
90
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS
100 112 116 X 0 2.4 3.2 Z
P(112 < X < 116) = P(2,4 < Z < 3,2) = 
= P(0 < Z < 3,2) - P(0 < Z < 2,4) = 0,007510
D)
−
= ⇒ =
108 100 1,6
5
Z Z
100 108 X 0 1.6 Z
P(X > 108) = P(Z > 1,6) = 
= 0,5 - P(Z < 1,6) = 0,054799
EXERCÍCIO RESOLVIDO
Um fabricante de peças eletrônicas sabe, por experiências anteriores, que as peças que ele 
produz têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem 
aproximadamente distribuição normal. O fabricante oferece garantia de 312 dias, ou seja, troca 
a peça que apresentar defeito nesse período. Sabendo que ele fabrica 1000 peças mensalmente, 
determine o número de peças que o fabricante deverá trocar pelo uso da garantia, mensalmente.
SOLUÇÃO
Temos que:
m = 600 dias, s = 100 dias e X = 312.
Daí:
−
= ⇒ = −
312 600 2,88
100
Z Z
91
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Logo:
600312 X 0-2,88 Z
P(X < 312) = P(Z < -2,88) = 
= 0,5 - P(-2,88 < Z < 0) = 0,001988
Portanto, deverá substituir mensalmente: 
1000 x 0,001988 = 1,988 = 2 peças.
Observação 6.1
Muitas vezes é necessário estudar o comportamento de uma variável que é resultante de 
variáveis normais independentes. Sendo assim, a seguir são apresentadas algumas propriedades 
importantes para estudos desse tipo.
Sejam n variáveis aleatórias independentes, cada uma com distribuição normal e sejam 
E(Xi) = µi,
VAR(Xi) = si2,
i = 1, 2, ..., n.
 » Se a variável 
=
=∑
1
n
i
i
X x então, X é normalmente distribuída. Isto é:
=
=∑
1
n
X i
i
m m
( )
=
=∑ 2
1
n
i
i
VAR X s
 » Se a variável 
=
=∑
1
n
i
i
X x e 
= =…= = = =…= =2 2 21 2 1 2 n nem m m m s s s s
então X é normalmente distribuída, isto é:
=X nm m
92
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEISALEATóRIAS cOnTínUAS
 » Se 
=
= ∑
1
1 n
i
i
X x
n
 então é normalmente distribuída, isto é:
=Xm m
( ) =
2
VAR X
n
s
 » Se = + + +…+1 1 2 2 n nY a b X b X b X , então Y é normalmente distribuída, isto é:
=
= +∑
1
n
Y i i
i
a bm m
( )
=
=∑ 2 2
1
N
i i
I
VAR Y b s
Vale lembrar que as variáveis aleatórias normais são usadas para modelar muitos fenômenos 
naturais, como as notas obtidas pelos alunos em uma prova e os erros cometidos na medida de 
uma grandeza física, por exemplo.
Recurso tecnológico
Probabilidades normais e distribuições amostrais simuladas 
usando o excel
Para obter probabilidades cumulativas para a variável aleatória normal usando o Excel, primeiro 
selecione fórmulas, isto é:
Figura 5 – Opções do menu Excel.
93
DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS • AulA 6
Em seguida, clique em “mais funções” e, em seguida, selecione “Estatística”, veja a figura 6 a seguir:
Figura 6 – Menu Estatística.
Então, clique na distribuição de sua escolha (por exemplo, normal). Veja figura 7 abaixo:
Figura 7 – Opção distribuição normal.
94
AulA 6 • DISTRIBUIçãO DE PROBABILIDADE DE vARIávEIS ALEATóRIAS cOnTínUAS
Após clicar na distribuição de sua escolha, neste caso, a distribuição normal, aparecerá uma 
caixa de diálogo. Especifique os parâmetros da distribuição (por exemplo, a média m e o desvio 
padrão s), clique na probabilidade cumulativa que você deseja (X< = ou >) e especifique o valor 
de x de interesse no quadro. Quando você clicar “OK”, a probabilidade normal cumulativa para 
o valor de x especificado aparecerá em uma nova planilha Excel.
Figura 8 – parâmetros de distribuição.
RESUMO
Vimos até agora: 
 » Como reconhecer e ou classificar uma variável aleatória contínuas.
 » Como resolver problemas relacionados às distribuições de probabilidades de variáveis 
aleatórias contínuas.
 » Utilizar adequadamente o modelo de distribuição normal de probabilidades contínuas.
95
Tabelas estatísticas
96
Referências
ACHILLES, H. Aspectos referentes ao ensino de matemática com aplicações de modelos característicos à teoria da 
confiabilidade. 2006. Dissertação de Mestrado. Departamento de pesquisa e Pós-graduação. CEFET-RJ. Rio de Janeiro.
AGRESTI, A.; COULL, B. A. Approximate is better than exact for interval estimation of binomial propoertions. The 
American Statistician, pp. 119-126 v. 52, n.2, mai 1998.
ANDERSON, D. R.; SWEENEY, D. J.; WILLIANS, T. A. Estatística aplicada à administração e economia. 2ª ed. São 
Paulo: Cengage Learning, 2007.
ARA, A. B; MUSETTI, A. V.; SCHNEIDERMAN, B. Introdução à estatística. São Paulo: Edgard Blucher Ltda, 2003.
ARKIN, H. Sampling methods for the aditor. Nova Iorque: McGraw-Hill, 1982.
BLACKWELL, D. Estatística básica. São Paulo: McGraw-Hill, 1973.
Brochures about survey research, section on survey research methods, American Statistic Association, 2004. Disponível 
em: www.amstat.org.
BROWKER, A. H; LIEBERMAN, G. J. Engineering statistic. Englewood Cliffs: Prentice Hall, 1959.
BUSSAB, W. Estatística básica. São Paulo: Saraiva, 2002.
COCHRAN, W. G. Sampling techniques. 3ª ed. Nova Iorque: Wiley, 1877.
FARHAT, C. A. V. Introdução à estatística aplicada. São Paulo: FTD, 1988.
FREEDMAN, D.; PISANI, R.; PURVES, R. Statistics. Nova Iorque: W. W. Norton and Co, 1978.
GIBBONS, J. D. Nonparametric statistical inference. 2ª ed. Nova Iorque: McGraw-Hill, 1985. 
GONZALEZ, N. Estatística básica. Rio de Janeiro: Editora Ciência Moderna, 2008.
HOLLANDER, M.; WOLFE, D. A. Nonparametric statistical methods. Nova Iorque: Wiley, 1973.
KARMEL. P. H.; POLASEK, M. Estatística geral e aplicada para economistas. São Paulo: Atlas, 1974.
KASMIER, L. J. Estatística aplicada à economia e administração. São Paulo: Makron Books, 2003.
LAPPONI, J. C. Estatística usando o Excel. São Paulo: Lapponi treinamento e editora, 2000.
LEVINE, D.; BERENSON, M. L. Estatística; teoria e aplicações. Rio de Janeiro: LTC, 2000.
LINDGREN, B. W. Statistical theory. 3ª ed. Nova Iorque: Macmilan, 1976.
MCCLAVE, J. T.; BENSON, P. G.; SINCICH, T. Estatística para economia e administração. 10ª ed. São Paulo: Pearson 
Prentice Hall, 2008.
MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro, LTC, 1983.
MORETTIN, L. G. Estatística básica: probabilidade. São Paulo: Makron books, 2006.
MORGADO, A. C. DE O.; PITOMBEIRA, J. B.; CARVAHO, P. C. P.; FERNADEZ, P. Análise combinatória e probabilidade. 
Rio de Janeiro: SBM, 2004.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1994.
SPIEGEL, M. R. Probabilidade e estatística. São Paulo: McGraw-Hill, 1978.
TUKEY, J. Exploraty data analysis. Reading, Mass: Addison-Wesley, 1977.
WALPOLE, R. E.; MYERS, R. H.; MYERS, S.; YE, K. Probabilidade e estatística: para engenharia e ciências. São Paulo: 
Pearson Prentice Hall, 2008.
YAMANE, T. Elementary sampling theory. 3ª ed. Englewood Cliffs: Prentice Hall, 1967.

Mais conteúdos dessa disciplina