Buscar

estatistica_basica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 71 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 71 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 71 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Estatística Básica
SIRLEI ALVES CHAVES
1ª Edição
Brasília/DF - 2020
Ficha catalográfica elaborada pela Bibliotecária Marjorie Gonçalves Andersen Trindade, CRB-1/2704
C512e
Chaves, Sirlei Alves
Estatística básica / Sirlei Alves Chaves. – Brasília : Alumnus, 2020.
71 p.
Recurso online: e-book
Modo de acesso: world wide web
ISBN 978-65-89227-10-6
1. Estatística. 2. Estatística matemática. I. e-book. II. Título.
CDU 311.1
Autores
Sirlei Alves Chaves
Produção
Equipe Técnica de Avaliação, Revisão Linguística e 
Editoração
Sumário
Organização do Livro Didático....................................................................................................................................... 4
Introdução ............................................................................................................................................................................. 6
Capítulo 1
Conceitos fundamentais ............................................................................................................................................. 7
Capítulo 2
Distribuição de frequências ....................................................................................................................................16
Capítulo 3
Medidas estatísticas ..................................................................................................................................................27
Capítulo 4
Probabilidade ...............................................................................................................................................................36
Capítulo 5
Distribuição de probabilidade de variáveis aleatórias discretas ...............................................................52
Capítulo 6
Distribuição de probabilidade de variáveis aleatórias contínuas..............................................................59
4
Organização do Livro Didático
Para facilitar seu estudo, os conteúdos são organizados em capítulos, de forma didática, objetiva e 
coerente. Eles serão abordados por meio de textos básicos, com questões para reflexão, entre outros 
recursos editoriais que visam tornar sua leitura mais agradável. Ao final, serão indicadas, também, 
fontes de consulta para aprofundar seus estudos com leituras e pesquisas complementares.
A seguir, apresentamos uma breve descrição dos ícones utilizados na organização do Livro Didático.
Atenção
Chamadas para alertar detalhes/tópicos importantes que contribuam para a 
síntese/conclusão do assunto abordado.
Cuidado
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o 
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
Importante
Indicado para ressaltar trechos importantes do texto.
Observe a Lei
Conjunto de normas que dispõem sobre determinada matéria, ou seja, ela é origem, 
a fonte primária sobre um determinado assunto.
Para refletir
Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa 
e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. 
É importante que ele verifique seus conhecimentos, suas experiências e seus 
sentimentos. As reflexões são o ponto de partida para a construção de suas 
conclusões.
5
OrganIzaçãO DO LIvrO DIDátICO
Provocação
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes 
mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor 
conteudista.
Saiba mais
Informações complementares para elucidar a construção das sínteses/conclusões 
sobre o assunto abordado.
Sintetizando
Trecho que busca resumir informações relevantes do conteúdo, facilitando o 
entendimento pelo aluno sobre trechos mais complexos.
Sugestão de estudo complementar
Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, 
discussões em fóruns ou encontros presenciais quando for o caso.
Posicionamento do autor
Importante para diferenciar ideias e/ou conceitos, assim como ressaltar para o 
aluno noções que usualmente são objeto de dúvida ou entendimento equivocado.
6
Introdução
Este livro didático destina-se aos alunos do curso de graduação a distância da Faculdade Unyleya e 
apresenta uma introdução conceitual do campo da estatística e algumas aplicações. As aplicações 
correspondem a problemas contextualizados que exigem a análise de certos dados apresentados 
e a escolha de um método conveniente para tratá-los estatisticamente. Sendo assim, ao longo 
de cada capítulo, serão discutidas, desenvolvidas e ampliadas algumas técnicas estatísticas, a 
fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que as questões 
apresentadas irão, constantemente, exigir que o estudante se posicione criticamente em relação a 
elas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios para a tomada 
de decisão na solução de problemas. 
Apesar do forte caráter das aplicações, é importante lembrar que, em todos os momentos, o 
rigor característico da linguagem matemática está presente, uma vez que um dos objetivos deste 
livro é articular teoria e prática. Vale observar, ainda, que não existe preocupação de esgotar 
por completo os conceitos abordados, embora estejam incluídas referências bibliográficas para 
aqueles que assim desejarem.
Objetivos
Este livro didático tem como objetivos:
 » Servir de instrumento de reflexão, discussão e problematização em torno de temas e 
questões fundamentais presentes na prática de uma empresa e/ou organização.
 » Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um 
banco de dados. 
 » Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas; enfatizar 
o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das 
inferências feitas a partir de dados, não só para aqueles que consomem, mas também 
para aqueles que produzem.
7
Introdução do capítulo 
Este capítulo apresenta algumas definições básicas de conceitos fundamentais relacionados 
à estatística. Além disso, busca demonstrar o papel-chave que a estatística desempenha no 
raciocínio crítico, seja ele elaborado no decorrer deste curso, no trabalho ou na vida diária.
Objetivos 
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
 » Identificar os objetivos da ciência estatística.
 » Identificar tipos de aplicações estatísticas na empresa.
 » Reconhecer os elementos fundamentais da estatística.
 » Identificar e escolher adequadamente um método estatístico para análise de populações.
 » Classificar dados estatísticos.
 » Estabelecer um critério para coleta de dados.
 » Entender o papel da estatística no gerenciamento da tomada de decisão.
a estatística e sua importância
Durante muito tempo a estatística foi vista apenas como gráficos e tabelas. Atualmente, no mundo 
globalizado em que vivemos, a informação é de fundamental importância nas mais variadas 
atividades profissionais como economia, agronomia, administração, biologia etc.
1CAPÍTULOCOnCEItOS FUnDaMEntaIS
8
CAPÍTULO 1 • COnCEItOS FUnDaMEntaIS
Como a estatística é uma ciência relativamente nova, muitos ainda não se deram conta da sua 
importância para a vida moderna. Com os recentes avanços computacionais, a estatística tem 
sido cada vez mais utilizada, pois muitas de suas técnicas envolvem cálculos cansativos que 
hoje podem ser facilmente resolvidos por pacotes estatísticos (programas de computadores 
específicos para estatística) disponíveis no mercado.
A estatística como ciência é uma área da matemática que, com base na teoria das probabilidades, 
estuda métodos para a modelagem de fenômenos. A estatística básica usa os aleatórios, aqueles 
fenômenos que produzem dados de observação, tais como temperatura média diária em uma 
determinada região ou o índice de inflação mensal de certo país.
Como os fenômenos aleatórios permeiam as mais variadas áreas do conhecimento, esses métodos 
usam a estatísticacomo ferramenta na solução de problemas nessas áreas. Por isso, observa-se 
que são raros os cursos de graduação que não incluem em sua grade curricular pelo menos uma 
disciplina da área de estatística.
A estatística está dividida em duas grandes áreas: a sstatística descritiva e a inferência estatística. 
A estatística descritiva é de extrema importância principalmente em pesquisa de levantamento de 
dados, pois, diante de uma grande massa de dados (observações), coletados de um determinado 
fenômeno (por exemplo, o preço de um produto em todos os supermercados da cidade), 
precisa-se de procedimentos estatísticos para organizá-los de forma que este fenômeno possa 
ser interpretado de maneira bastante clara.
Os métodos de inferência estatística são utilizados principalmente para tomar decisões diante 
de incertezas que são inerentes aos fenômenos aleatórios. Embora já se disponha de métodos 
estatísticos bem sofisticados, muitos problemas do nosso dia a dia podem ser resolvidos com a 
estatística descritiva.
A estatística descritiva deve ser aplicada na coleta, organização e descrição dos dados, enquanto 
que a inferência estatística auxilia na análise e interpretação dos dados.
Sendo assim, em qualquer área do conhecimento, em vários cursos de graduação, é fundamental 
que se tenha a matéria estatística, iniciando com uma disciplina cujo conteúdo trate de estatística 
descritiva.
Importante
A principal ferramenta para transformar uma massa de números (dados) em informações é exatamente a estatística. 
As técnicas estatísticas são utilizadas para organizar, apresentar, analisar e interpretar dados. Embora a análise e a 
interpretação de dados escape à noção de estatística, estas seriam, na verdade, o seu principal uso.
9
COnCEItOS FUnDaMEntaIS • CAPÍTULO 1
População e amostra
População é o conjunto de todos os elementos (pessoas, animais, domicílios ou objetos) que 
têm em comum a característica ou o atributo de interesse do fenômeno em estudo.
Como exemplo, suponha que queremos estudar o perfil sócio-econômico dos estudantes 
universitários da cidade de Manaus. Então, o fenômeno em estudo é o perfil sócio-econômico 
dos universitários da cidade de Manaus e a população é formada por todos os estudantes 
universitários da cidade de Manaus, ou seja, estudantes matriculados nas universidades e 
faculdades localizadas na cidade de Manaus.
Amostra é uma parte da população, selecionada de maneira criteriosa, para efetivamente fornecer 
os dados para o estudo. 
Figura 1. População e amostra.
População
Amostra
Fonte: https://www.shutterstock.com/g/Bakhtiar+zein?searchterm=Popula%C3%a7%C3%a3o%20e%20amostra.
Uma amostra representativa de uma população pode ser obtida escolhendo-se aleatoriamente 
os elementos que irão compor a amostra e isso nos permite fazer inferências sobre a população. 
Importante
É possível distinguir duas concepções para a palavra ‘estatística’: no plural (estatísticas), indica qualquer coleção de 
dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. No singular 
(estatística), indica a atividade humana especializada ou um corpo de técnicas, ou ainda uma metodologia desenvolvida 
para coleta, classificação, apresentação, análise e interpretação de dados quantitativos e utilização desses dados para a 
tomada de decisões.
A Éstatística é uma parte da matemática que fornece métodos para a coleta, organização, descrição, análise e 
interpretação de dados, viabilizando a utilização deles na tomada de decisões
https://www.shutterstock.com/g/Bakhtiar+Zein?searchterm=Popula%C3%A7%C3%A3o%20e%20amostra
10
CAPÍTULO 1 • COnCEItOS FUnDaMEntaIS
No exemplo acima, a amostra é formada por parte dos estudantes universitários da cidade de 
Manaus.
Censo e amostragem: quando consideramos todos os elementos da população em um estudo, 
realizamos um censo e quando tomamos parte da população estatística básica usando o para o 
estudo, realizamos uma amostragem. 
Em geral a realização de um censo demanda muito tempo e alto custo, daí o Brasil fazer o censo 
a cada dez anos. O censo se torna viável quando a população é pequena e é fácil o acesso aos 
seus elementos.
Definição e classificação de variáveis
Quando falamos no estudo do perfil sócio-econômico dos universitários da cidade de Manaus, 
fica subentendido que estamos tratando com algumas variáveis, tais como, idade, renda familiar, 
número de filhos na família, escolaridade dos pais etc. É importante diferenciar os tipos de 
variáveis para que se possa dar o tratamento estatístico adequado a cada uma delas.
As variáveis são classificadas como qualitativas ou quantitativas. Uma variável qualitativa 
representa uma qualidade e seus valores são categorias. 
atenção
Duas observações: 
A primeira é que devemos usar procedimentos estatísticos para determinar o tamanho da amostra, ou seja, quantos 
elementos devem ser selecionados para fazer parte da amostra.
A segunda é utilizar o método de amostragem (amostragem aleatória simples, amostragem estratificada, amostragem 
por conglomerado etc...) mais adequado para os objetivos do levantamento.
atenção
Se o nosso interesse está voltado para certa variável de determinado grupo de elementos, ela pode ser classificada 
em:
Qualitativa, isto é, quando resulta de uma classificação por tipos ou atributos. Sendo assim, pode ser:
 » nominal - como, por exemplo, sexo ou cor dos olhos;
 » ordinal - como, por exemplo, classe social ou grau de instrução.
Quantitativa, isto é, quando os seus valores indicam quantidades. Dessa forma, a variável pode ser:
 » discreta - quando seus possíveis valores formam um conjunto enumerável, finito ou infinito, como, por exemplo, 
número de peças defeituosas, número de filhos ou número de carros;
 » contínua - quando assume qualquer valor dentro de um intervalo de variação, como, por exemplo, peso, altura, 
tempo ou renda.
11
COnCEItOS FUnDaMEntaIS • CAPÍTULO 1
De acordo com as categorias, a variável pode ser subdividida em qualitativa nominal, se as 
categorias não impõem uma ordem natural ou qualitativa ordinal, se as categorias impõem 
uma ordem natural.
Por outro lado, uma variável quantitativa representa uma quantidade e seus valores são numéricos. 
Podem ser subdivididas em quantitativa discreta, quando seus valores são pontos sobre a reta, 
geralmente resultado de uma contagem, ou quantitativa contínua, quando seus valores estão 
em um intervalo da reta, geralmente resultado de uma medida.
Figura 2. variáveis estatíscas.
Fonte: https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
Exemplos:
Variáveis qualitativas nominais - nacionalidade (brasileira, francesa, portuguesa, ...); religião 
(católica, evangélica); sexo: (masculino, feminino). Observa-se nessas variáveis que não existe 
uma relação de ordem entre as categorias.
Variáveis qualitativas ordinais - escolaridade (ensino fundamental; ensino médio; ensino 
superior); classe social (A, B, C, ...). Nesse caso as categorias apresentam uma relação de 
ordem natural.
Variáveis quantitativas discretas - número de filhos por família (0, 1, 2, ...); pontos na Carteira 
Nacional de Habilitação (0, 7, ..., 20).
Variáveis quantitativas contínuas - peso de indivíduo (em quilograma), altura de indivíduos 
(em centímetro), idade, temperatura, etc.
As variáveis são medidas registradas de um dado objeto de estudo, realizadas em diferentes 
unidades de observação. Por exemplo, no estudo do perfil dos universitários da cidade de Manaus, 
o pesquisador tem “estudante universitário” como objeto ou unidade amostral. Como variáveis, 
“idade do estudante”, “renda familiar do estudante” e “curso em que está matriculado”; o valor 
da variável depende do estudante avaliado, sendo a medida expressa pela escala escolhida, por 
exemplo, idade em anos e renda em salários mínimos.
https://marketinganalitico.com.br/marketing-e-estatistica-variaveis/
12
CAPÍTULO 1 • COnCEItOS FUnDaMEntaIS
tipos de dados
Todos os dados (e, por conseguinte,as variáveis que medimos) podem ser classificados 
como um dos dois tipos gerais: quantitativo ou qualitativo. 
Dados quantitativos são medidas registradas em uma escala numérica de ocorrência 
natural.
Exemplo 1: a temperatura (em graus Celsius) em que cada unidade em uma amostra de 
25 peças plásticas resistentes ao calor começa a derreter; a atual taxa de desemprego 
de cada um dos estados brasileiros da região Sudeste; o salário dos administradores 
empregados em multinacionais; o número de mulheres executivas empregadas em cada 
uma das amostras de 75 empresas de manufatura.
Quanto aos dados qualitativos, são mensurações que não podem ser medidas em uma 
escala numérica natural. Eles só podem ser classificados em grupo de categorias, ou seja, 
podem apenas ser classificados em categorias.
Exemplo 2: a afiliação a um partido político, a condição de defeito (defeito ou não) de 
cada uma das 100 peças de um microcomputador, a nacionalidade de cem turistas em 
visita à cidade do Rio de Janeiro.
Coleta de dados
Em toda pesquisa de levantamento em que queremos fazer afirmações sobre características de 
uma população, surgem dois problemas que devem ser tratados com bastante atenção para a 
confiabilidade dos resultados do estudo.
O primeiro diz a respeito ao número de unidades a serem observadas, ou seja, o tamanho da 
amostra. O segundo refere-se ao plano amostral, isto é, como operacionalizar a coleta dos dados.
Fontes de dados
Os dados a serem coletados podem estar previamente armazenados em algum lugar ou podem 
ser gerados pelo próprio pesquisador. As fontes de dados podem ser secundárias e primárias.
atenção
Na realização de estudos dessa natureza é quase impossível observar todos os elementos da população em estudo, 
principalmente devido ao tempo e custo operacional. Portanto, tendo que trabalhar com uma amostra, deve-se 
escolher a estatística básica usando uma amostra que seja representativa da população, ou seja, uma cópia o mais fiel 
possível da população. Assim, escolhendo-se criteriosamente as unidades amostrais, teremos segurança para usar a 
inferência estatística e generalizar os resultados obtidos na amostra para a população.
13
COnCEItOS FUnDaMEntaIS • CAPÍTULO 1
Fontes secundárias: são bancos de dados ou arquivos previamente existentes, onde estão 
armazenadas as informações que serão utilizadas no levantamento, ou seja, os dados já existem e o 
pesquisador irá lançar mão deles para desenvolver seu estudo. As fichas de cadastro de estudantes 
ou de clientes de uma loja de departamentos são exemplos de fonte de dados secundária.
Fontes primárias: dizemos que a fonte é primária quando o próprio pesquisador gera a 
informação. As fontes primárias mais utilizadas são a observação direta do fenômeno, que é 
um método clássico na pesquisa científica, e o questionário que é o instrumento de pesquisa 
do levantamento de dados.
Construção do instrumento de pesquisa
O instrumento de pesquisa é o objeto que reúne um conjunto de questões para gerar um 
documento padrão onde serão coletados e registrados os dados da pesquisa. O instrumento 
precisa ser bem adequado e direcionado aos objetivos da pesquisa. 
O papel da estatística no gerenciamento das tomadas de decisão
O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios 
e às atividades governamentais (controle de qualidade, auditoria estatística, previsões) tem sido 
marcante nas últimas décadas. 
Todo dia a mídia apresenta resultados e pesquisas políticas, econômicas e sociais. Na 
ênfase cada vez maior do governo a respeito das drogas e dos testes de produtos, por 
exemplo, testemunha-se a clara evidência da necessidade de ser capaz de avaliar os 
atenção
Para o êxito do instrumento de pesquisa devemos:
 » fazer questões tão simples quanto possível;
 » acilitar as respostas dos entrevistados;
 » elaborar com clareza as perguntas;
 » facilitar a memória do sujeito entrevistado;
 » evitar realização de cálculos;
 » evitar palavras técnicas no instrumento;
 » evitar perguntas com respostas dúbias;
 » evitar perguntas sugestivas;
 » evitar um grande número de questões;
 » evitar questões com respostas abertas;
 » permitir uma resposta adicional.
14
CAPÍTULO 1 • COnCEItOS FUnDaMEntaIS
dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um 
discernimento – uma habilidade de raciocínio para interpretar e entender o significado 
dos dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e 
generalizações, isto é, ajudar a pensar criticamente, usando a estatística.
Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar 
decisões. O fluxograma da figura 3, mostra o papel da estatística na tomada de decisão.
Figura 3. O papel da estatística na tomada de decisão gerencial.
Fonte: Criação do autor.
Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado 
em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo 
o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar 
nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados 
da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo 
Para refletir
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística para avaliar 
criticamente dados e inferências. É fundamental para o processo que exista variação na população e no processamento 
de dados.
15
COnCEItOS FUnDaMEntaIS • CAPÍTULO 1
é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial 
pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do 
problema gerencial.
Sintetizando
Vimos até agora:
 » O conceito de estatística.
 » Os tipos de aplicações da estatística: descritiva e inferencial.
 » Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou amostra, identificar as variáveis, 
coletar dados e descrever os dados.
 » A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos (de natureza categórica).
 » Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano experimental.
 » O papel da estatística no gerenciamento da tomada de decisão.
16
Introdução do Capítulo 
Caro discente, agora que você já aprendeu como coletar os dados, no capítulo 2 estudará algumas 
técnicas estatísticas para organizar esses dados em tabelas. Você verá que para cada tipo de 
variável, qualitativa ou quantitativa, existe uma tabela adequada para apresentar os dados. 
Objetivos 
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
 » Descrever dados qualitativos de uma pesquisa estatística.
 » Estabelecer métodos gráficos para descrever dados quantitativos.
 » Interpretar e utilizar dados apresentados graficamente.
 » Selecionar a maneira mais adequada para representar um conjunto de dados 
graficamente.
variáveis qualitativas 
Uma vez coletados os dados, precisamos ter familiaridade com eles e, portanto, é necessário 
organizá-los de maneira que essa massa de dados se transforme em informações a respeito do 
fenômeno que está sendo estudado.
Ou seja, nosso objetivo neste capítulo é organizar e apresentar os dados em tabelas, de modo a 
facilitar o seu manuseio e entendimento do fenômeno. 
Classificação simples
Para organizar as observações (dados) de uma variável qualitativa, construímos uma tabela a 
partir do conjunto de valores observados. Em uma coluna registramos as categorias da variável 
2CAPÍTULODIStrIBUIçãO DE FrEQUÊnCIaS
17
DIStrIBUIçãO DE FrEQUÊnCIaS • CAPÍTULO 2
e em outra coluna a frequência de cada categoria. Por exemplo, suponha que 50 candidatos 
ao vestibular de 2019, tenham respondido a um questionário com a pergunta, qual o grau de 
instrução do seu pai? As respostascodificadas são:
1 – Nenhum, 2 – Fundamental, 3 – Médio e 4 – Superior.
Vamos admitir que o conjunto de resposta fosse o seguinte:
3 3 2 2 3 1 3 4 4 2 2 1 4 2 3 2 3 3 3 3 3 2 2 3 1
3 3 3 3 1 1 2 3 2 3 3 2 3 2 3 2 2 2 3 3 3 3 3 3 3
Os dados estão organizados na tabela 1. 
Uma tabela deve ter os seguintes elementos:
Título - o título explica o que contém a tabela. Compõe-se da referência (tipo de elemento e 
número), da descrição do conteúdo e da data de referência.
Corpo - o corpo é formado pelas linhas e colunas de dados da tabela. É a parte da tabela que 
contém os dados e informações.
Cabeçalho - o cabeçalho da tabela é a primeira linha. É a parte superior da tabela que especifica 
o conteúdo das colunas. Pode ser constituído de um ou vários níveis.
Coluna indicadora - a coluna indicadora é primeira coluna, especifica o conteúdo das linhas.
Fonte - consiste na indicação da entidade (ou entidades) responsável pelo fornecimento ou 
elaboração dos dados e/ou informações constantes da tabela.
tabela 1. grau de instrução do pai do candidato, vestibular 2019.
Grau de Instrução Frequência
nenhum 5
Fundamental 15
Médio 27
Superior 3
Total 50
 
Fonte: Criação do autor.
Classificação dupla
As informações contidas na tabela 1 podem ser mais detalhadas. Por exemplo, a informação 
sobre o grau de instrução dos pais, pode ser informada por sexo ou pelo curso que o 
candidato escolheu. Ou seja, podemos construir uma tabela com duas entradas ou dupla 
classificação.
18
CAPÍTULO 2 • DIStrIBUIçãO DE FrEQUÊnCIaS
Utilizando o exemplo anterior, suponha que no conjunto dos 50 candidatos acima, 30 são do 
sexo masculino e 20 do sexo feminino, além disso, 10 candidatos escolheram a área de ciências 
exatas, 25 escolheram ciências humanas e 15 escolheram ciências biológicas. Esses dados agora 
podem ser apresentados como nas tabelas a seguir:
tabela 2. grau de instrução do pai por sexo do candidato, vestibular 2019.
Grau de Instrução
Frequência
Masculino Feminino
Total
nenhum 3 2 5
Fundamental 5 10 15
Médio 14 13 27
Superior 2 1 3
Total 24 26 50
 
Fonte: Criação do autor.
Note que a coluna da direita contém o total das frequências relativas à variável grau de instrução. 
Tais frequências são distribuídas no corpo da tabela conforme as categorias da outra variável de 
classificação. Na tabela 2 a variável sexo e na tabela 3 a variável área escolhida. Vejamos:
tabela 3. grau de instrução do pai do candidato pela área escolhida, vestibular 2019.
Grau de Instrução
Frequência
Biológicas Exatas Humanas
Total
nenhum 1 1 3 5
Fundamental 3 4 8 15
Médio 5 8 14 27
Superior 2 0 1 3
Total 11 13 26 50
 
Fonte: Criação do autor.
variáveis quantitativas 
No caso de variável quantitativa discreta, quando existem poucos valores diferentes da variável, 
construímos uma tabela semelhante à tabela 1, apenas colocando na coluna indicadora os 
diferentes valores da variável. Por exemplo, se fosse perguntado aos candidatos, qual o número 
de filhos na sua família, poderíamos ter o resultado apresentado na tabela 4.
19
DIStrIBUIçãO DE FrEQUÊnCIaS • CAPÍTULO 2
Tabela 4. Número de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência
0 5
1 26
2 9
3 5
4 3
5 2
Total 50
 
Fonte: Criação do autor. 
Quando existe um grande número de valores diferentes para a variável discreta, ou se a variável 
quantitativa é contínua, construímos uma tabela de distribuição em classes de frequências.
Dados brutos 
Os dados, na forma como são coletados, são chamados de dados brutos. Depois de ordenados, 
em ordem crescente ou decrescente, são chamados de rol. Por exemplo, suponha que coletamos 
a idade de cinquenta estudantes do curso de administração, cujos valores são apresentados a 
seguir:
Dados Brutos
19 22 19 21 25 26 24 23 28 19 
17 20 18 23 29 18 18 20 20 22
26 18 20 27 24 19 20 19 24 17
20 19 17 28 22 19 25 20 22 20
18 18 27 23 19 25 19 24 23 20
Dessa forma (dados brutos), temos dificuldade, por exemplo, de verificar qual a maior idade 
no grupo ou qual a idade do estudante mais jovem. Essas questões são facilmente respondidas 
quando dispomos os dados, por exemplo, em ordem crescente como segue:
rol
17 17 17 18 18 18 18 18 18 19
19 19 19 19 19 19 19 19 20 20
20 20 20 20 20 20 20 21 22 22
20
CAPÍTULO 2 • DIStrIBUIçãO DE FrEQUÊnCIaS
22 22 23 23 23 23 24 24 24 24
25 25 25 26 26 27 27 28 28 29
Agora é simples verificar que o estudante mais jovem no grupo tem 17 anos, assim como o mais 
velho tem 29 anos.
Distribuição em classes de frequências
Esses dados podem ser organizados numa tabela de distribuição em classes de frequências. 
Com os dados do exemplo anterior, vamos construir uma tabela de distribuição em classes de 
frequências para a variável idade dos estudantes. Inicialmente observamos que a menor idade é 
17 anos e a maior idade é 29 anos, portanto, estes dados têm uma amplitude de 13 anos, vejamos:
Amplitude total = At = maior valor – menor valor = 29 – 17 = 13.
Escolhendo k = 6 classes (e é uma escolha), cada classe deve ter o comprimento aproximado de 
13 2,16
6
Ath
k
= = ≅ .
Para facilitar os cálculos e respeitar a segunda regra, podemos usar h = 2 e como limite inferior 
da primeira classe o valor 16. Logo as seis classes de idade são: 16 a 18, 18 a 20, 20 a 22, 22 a 24, 
24 a 26 e 26 a 28. Como o maior valor é 29, devemos aumentar mais uma classe para respeitar a 
segunda regra, a última classe será 28 a 30.
tabela 5. Distribuição em classes de frequências para a variável idade.
Número de filhos Frequência
16  18 3
18  20 15
20  22 10
22  24 8
24  26 7
26  28 4
28  30 3
Total 50
 
Fonte: Criação do autor. 
Importante
Para construir as classes de frequências devemos observar as seguintes regras:
 » as classes devem conter todas as observações;
 » a primeira classe deve conter o menor valor e a última classe o maior valor;
 » cada valor deve ser colocado em uma única classe;
 » dDeve-se usar entre 5 e 15 classes, se possível, de mesmo tamanho.
21
DIStrIBUIçãO DE FrEQUÊnCIaS • CAPÍTULO 2
As classes são fechadas à esquerda e abertas à direita, isto significa que a idade 18 anos pertence 
à segunda classe e não à primeira. Por fim, contamos a frequência de cada classe.
Observe que na classe de 16 a 18, encontra-se três vezes a idade 17 anos. Portanto, a primeira 
classe tem frequência igual a 3. Para a segunda classe verificamos que aparecem seis vezes a 
idade de 18 anos e nove vezes a idade 19 anos, logo, a segunda classe tem frequência igual a 15. 
E assim por diante, até a última classe que tem frequência 3, pois os valores correspondentes à 
classe 28 a 30 são as idades 28, 28 e 29 anos. 
Ao organizamos os dados em uma tabela de distribuição em classes de frequências, não sabemos 
mais quais as idades que estão na terceira classe, por exemplo. Sabemos apenas que existem 10 
estudantes com 20 anos ou mais e menos de 22 anos.
Elementos de uma distribuição de frequência
Os elementos em uma tabela de distribuição em classes de frequências trazem informações tais 
como, a proporção de estudantes com menos de 26 anos, quantos estudantes têm 24 anos ou 
mais. Esses elementos estão na tabela 6 e são definidos da seguinte forma, vejamos:
tabela 6. Distribuição em Classes de Frequências para a variável idade.
Número de filhos Xi fi Fi fri Fri
16  18 17 3 3 0,06 0,06
18  20 19 15 18 0,30 0,36
20  22 21 10 28 0,20 0,56
22  24 23 8 36 0,16 0,72
24  26 25 7 43 0,14 0,86
26  28 27 4 47 0,08 0,94
28  30 29 3 50 0,06 1,00
Total 50
 
Fonte: Criação do autor. 
atenção
A soma de todas as frequências relativas de uma amostra totaliza 100% ou 1.
Saiba mais
Notação para intervalos de classe.
Considere os extremos a e b de um intervalo, então:
a  b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferiora e exclui o limite superior b;
a  b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b;
a  b: intervalo fechado à esquerda e à direita. Inclui os dois extremos;
a  b:: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b.
22
CAPÍTULO 2 • DIStrIBUIçãO DE FrEQUÊnCIaS
Ponto médio da classe (Xi): É o valor que representa todas as observações da classe. É calculado 
como sendo a média dos limites da classe. Sendo assim, para a quarta classe temos:
4
22 24 23
2
X += =
Frequência simples ou absoluta (fi): É o número de observações na classe. Na quarta classe 
existem oito observações, conforme se verifica no rol, sendo quatro vezes a idade 23 anos e 
quantro vezes a idade 24 anos, portanto:
F4 = 8
Frequência acumulada (Fi): É a soma das frequências absolutas até a i-ésima classe. Para a quarta 
classe, temos:
F4 = F1 + F2 + F3 + F4 = 3 + 15 + 10 + 8 = 36
Frequência relativa (fri): É a proporção de observações na i-ésima classe e é calculada como o 
quociente entre a frequência absoluta e o total de observações, ou seja, fri = fi/n. Para a quarta 
classe, temos:
4
4
8 0,16
50
ffr
n
= = =
Frequência relativa acumulada (Fri): É a proporção de observações acumuladas até a i-ésima 
classe, ou seja, Fri = Fi/n. Ou ainda, a soma das frequências relativas até a i-ésima classe. Para a 
quarta classe temos:
4
4
36 0,72
50
FFr
n
= = =
Também pode ser calculada da seguinte forma:
Fr4 = Fr1 + Fr2 + Fr3 + Fr4 = 0,06 + 0,30 + 0,20 + 0,16 = 0,72
Apresentação gráfica
O gráfico constitui um importante instrumento de representação de dados, fornecendo uma 
comunicação rápida, clara e efetiva, poupando, sobretudo, tempo e esforço na visualização de 
dados sumarizados, sendo uma forma de representar uma distribuição de frequências.
Um gráfico deve levar a uma rápida compreensão do fenômeno apresentado e possibilitar uma 
correta interpretação dos seus valores. Ele auxilia bastante a apresentação de dados estatísticos 
facilitando a sua compreensão.
23
DIStrIBUIçãO DE FrEQUÊnCIaS • CAPÍTULO 2
Gráfico de pontos
No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é 
representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos 
são posicionados um sobre o outro, verticalmente.
Gráfico 1. Número de filhos na família do candidato, Vestibular 2019.
Fonte: Criação do autor.
Gráficos de colunas e barras
Gráficos de colunas são empregados para representar a distribuição de frequências de variáveis 
qualitativas e quantitativas discretas. Cada categoria ou valor é representado por uma coluna 
cuja altura é a sua frequência absoluta ou frequência relativa. Por exemplo: a distribuição de 
frequências do gráfico abaixo:
Importante
Um gráfico deve apresentar título e escala. O título deve ser colocado acima do gráfico e descrito como figura. As 
escalas devem crescer da esquerda para a direita e de baixo para cima. As legendas explicativas, quando houver 
necessidade, devem ser colocadas, de preferência, à direita do gráfico. 
24
CAPÍTULO 2 • DIStrIBUIçãO DE FrEQUÊnCIaS
Gráfico 2. Número de filhos na família do candidato, Vestibular 2019.
Fonte: Criação do autor.
Alternativamente, podemos apresentar as categorias no eixo vertical e a frequências no eixo 
horizontal. Os gráficos construídos desta forma são chamados de gráficos de barras. Como 
exemplo, a distribuição de frequências está representada no gráfico 3:
Gráfico 3. Grau de instrução do pai do candidato, Vestibular 2019.
Fonte: Criação do autor.
Gráfico de setores
O gráfico de setores é utilizado em geral para variáveis qualitativas. Ele é construído dividindo-
se o círculo em setores, cada um correspondendo, de forma proporcional, à frequência simples 
25
DIStrIBUIçãO DE FrEQUÊnCIaS • CAPÍTULO 2
ou relativa de uma das categorias da variável. O grau de instrução do pai do candidato está 
representado no gráfico de setores, que também pode ser chamado de pictórico, da figura abaixo:
Gráfico 4 . Grau de instrução do pai do candidato, Vestibular 2019.
Fonte: Criação do autor.
Histogramas
Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência 
relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável 
quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam 
a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo 
de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja 
altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão.
O histograma que representa a distribuição em classes de frequências da tabela 5 está apresentado 
no gráfico 5:
Importante
Ao interpretar um histograma, devem-se considerar dois importantes fatores:
O primeiro é a porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal, 
que é igual à frequência relativa de medidas no intervalo. 
O segundo é que se pode imaginar a aparência do histograma da frequência relativa para um conjunto de dados 
muito grande (uma população).
26
CAPÍTULO 2 • DIStrIBUIçãO DE FrEQUÊnCIaS
Gráfico 5. Histograma da idade de 50 estudantes de Administração.
Fonte: Criação do autor. 
Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados 
(particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas 
cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente 
visíveis em um gráfico de ramo e folhas.
Sintetizando
Vimos até agora:
1. Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar as frequências absolutas e 
relativas das classes e representar tais frequências em gráficos de barras e gráficos de pizza.
2. Como descrever dados quantitativos, ou seja, identificar classes de categorias, determinar as frequências absoluta e 
relativa das classes e representar tais frequências em gráficos de pontos, de ramos e folhas e em histogramas.
27
Introdução do capítulo 
Este capítulo apresenta conceitos e métodos para obter medidas de tendência central e medidas 
de variabilidade, bem como critérios para interpretar o significado dessas medidas.
Objetivos 
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
 » Calcular e interpretar medidas de tendência central.
 » Calcular e interpretar medidas numéricas de variabilidade.
 » Calcular e interpretar medidas numéricas de posicionamento relativo.
Medidas numéricas de tendência central 
Nesta seção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer 
inferências sobre medições correspondentes da população. Existem muitos métodos numéricos 
para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas 
características:
 » a tendência central do conjunto de medições, ou melhor, a tendência dos dados 
observados se agruparem em torno de valores centrais;
 » a variabilidade do conjunto de medições, ou seja, a dispersão dos dados.
Média aritmética 
A média aritmética de um conjunto de dados quantitativos é a soma das medições 
dividida pelo número de medições contadas no conjunto de dados. A média aritmética 
é a mais importante medida de posição. Certamente você já calculou várias vezes a média 
3CAPÍTULOMEDIDaS EStatÍStICaS
28
CAPÍTULO 3 • MEDIDaS EStatÍStICaS
aritmética, afinal, para ser aprovado numa disciplina você precisa obter média maior 
ou igual a cinco. Notação: x.
Ou seja:
1
n
ii
x
X
n
== ∑
Exemplo: digamos que o professor Sirlei tenha realizado cinco testes e você tenha tirado as 
seguintes notas: 10, 2, 9, 6 e 8, respectivamente. 
Neste caso temos n = 5 observações e a sua média igual a:
10 2 9 6 8 7
5
X + + + += =
Como calcular a média de dados agrupados
Quando agrupamosos dados, calculamos a média ponderada onde cada valor x¬ tem peso igual 
a sua frequência fi¬, ou seja,
1 1 2 2
1
1
 1 k k k
i i k
i
i
f X f X f XX f X
n n fi=
=
+ +…
= =
=
∑
∑
Exemplo: Para a distribuição de frequências da tabela 4, a média é calculada como segue:
0 . 5 1 . 26 2 . 9 3 . 5 4 . 3 5 . 2 81 1,6
50 50
X + + + + += = =
Observe que a média pode não ser um dos valores encontrados na amostra, como também 
não temos 1,6 filhos. Este valor, que chamamos de média, representa o centro da distribuição 
do número de filhos por família, é como o centro de massa de um corpo na física, é o ponto de 
equilíbrio.
Quando os dados estão agrupados em classes de frequências, calculamos a média ponderada 
usando Xi como sendo o ponto médio da classe. Exemplo: para a distribuição de frequências da 
tabela 5, a média é calculada como segue:
17 . 3 1 9 . 1 5 21 . 1 0 23 . 8 25 . 7 27 . 4 29 . 3 1100 22
50 50
X + + + + + += = =
Sendo assim, conclui-se que os estudantes do curso de administração apresentam uma média 
de 22 anos de idade.
atenção
O símbolo 
1
1
n
xi
i=
=∑ significa o somatório dos números xi, com i variando de 1 a n. 
29
MEDIDaS EStatÍStICaS • CAPÍTULO 3
Mediana (Md)
A mediana é o valor que ocupa a posição central de uma série de n observações ordenadas.
A mediana divide um conjunto de dados no meio, deixando 50% dos dados abaixo dela e 50% 
dos dados acima. O cálculo da mediana depende do número n de observações.
Mediana para dados agrupados
Se os dados estão agrupados, o procedimento de cálculo da mediana não se altera. Logo, basta 
conferir que os valores já estão ordenados e a posição da mediana é encontrada pela frequência 
acumulada.
Tabela 7. Número de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência (Fi) Fi
0 5 5
1 26 31
2 9 40
3 5 45
4 3 48
5 2 50
Total 50
 
Fonte: Criação do autor. 
Neste caso, sendo n = 50 um número par, a mediana será a média entre os valores que ocupam 
as posições 2
n 
 
 
 o 12
n + 
 
 o e , isto é, o 25º e 26º elementos. Observe pela frequência acumulada que, 
do 1º ao 5º elemento, todos são iguais a zero, do 6º ao 31º, todos são iguais a 1 e portanto, o 25º 
e 26º elementos são iguais a 1 e assim a mediana será dada por 1 1 1
2
Md += = . Assim, a mediana 
é 1 filho por família.
Importante
Se n é ímpar, a mediana é o valor que ocupa a posição central dos dados ordenados. Ou seja, é aquele valor que ocupa 
a posição 12
n + 
 
 
 . Vejamos: no caso das notas de estatística, os valores ordenados são 2, 6, 8, 9, 10. Neste caso, n = 5, a 
posição central é a 3ª observação cujo valor é 8, logo, 8.
Se n é par, a mediana será a média dos termos centrais dos dados ordenados. Ou seja, a mediana será a média entre os 
valores que ocupam as posições 1 
2 2
n ne +      
   
 . Sendo assim, voltando ao caso das notas de estatística e considerando seis 
notas, se as notas ordenadas são 2, 5, 6, 8, 9, 10, então a mediana será a média entre o 3º e o 5º termos, cujos valores são 6 
e 8, respectivamente. 
Portanto a mediana é dada por Md = 6 8 7
2
+  = 
 
30
CAPÍTULO 3 • MEDIDaS EStatÍStICaS
tabela 8. Distribuição em Classes de Frequências para a variável idade.
Número de filhos Xi fi Fi
16  18 17 3 3
18  20 19 15 18
20  22 21 10 28
22  24 23 8 36
24  26 25 7 43
26  28 27 4 47
28  30 29 3 50
Total 50
 
Fonte: Criação do autor. 
Como exemplo, vamos calcular a mediana para a variável idade com os dados da tabela 8. Neste 
caso, ( ) 50 25
2
Pos Md = = . Pela coluna de frequência acumulada, verificamos que o 25º elemento está 
na classe 20 a 22 anos, ou seja, a terceira classe é a classe mediana. Portanto a mediana é dada por:
( )( ) ( )25 18 20 2 21,4
10
Pos Md Fi i
Md li x h x
fi
− − −
= + = + =
Portanto, para este conjunto de idades de estudantes do curso de administração, a idade mediana 
é 21,4 anos.
Moda Mo
A moda é o valor que ocorre com maior frequência em um conjunto de dados. Por exemplo, 
considere que dez alunos realizaram um teste de estatística obtendo as seguintes notas: 5, 4, 4, 6, 
3, 6, 3, 1, 7 e 2. Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse conjunto 
de notas a moda é 4. Mo = 4
Observação:
Importante
Quando os dados estão distribuídos em classes de frequências, como na tabela 8, o procedimento muda totalmente. 
Primeiro calculamos a posição da mediana, ( ) 
2
nPos Md = . Em seguida, pela frequência acumulada, determinamos a 
classe mediana, que é a classe que contém a mediana. E por fim calculamos a mediana como segue:
( )( )
 
Pos Md Fi i
Md li x h
fi
− −
= + , onde,
li: é o limite inferior da classe mediana;
Fi - 1 é a frequência acumulada da classe anterior à classe mediana;
fi é a frequência simples da classe mediana;
h é o intervalo de classe.
31
MEDIDaS EStatÍStICaS • CAPÍTULO 3
• Existem conjuntos com duas modas, 5, 6, 6, 8, 9, 10, 10. Conjunto bimodal.
Mo = 6 e Mo = 10
• Existem conjuntos sem moda, 1, 6, 11, 17, 21. Conjunto amodal.
• Existem conjuntos com várias modas. Conjunto polimodal.
Moda para dados agrupados
A moda para dados agrupados como na tabela 7 é simplesmente o valor de maior frequência 
simples. Neste caso, a moda vale Mo = 1, pois o valor 1 tem a maior frequência simples que é 
igual a 26.
Quando os dados estão agrupados em classes de frequências, a moda pode ser calculada pelo 
seguinte método: primeiro determinamos a classe modal, aquela que apresenta a maior frequência 
simples; depois, empregamos a fórmula, 1 
1 2
Mo li x h∆= +
∆ +∆
, onde:
li = limite inferior da classe modal;
∆1 = é a diferença entre a frequência simples da classe modal e a frequência simples da classe 
imediatamente anterior à da classe modal;
∆2 = é a diferença entre a frequência simples da classe modal e a frequência simples da classe 
imediatamente posterior à da classe modal;
hi = amplitude da classe modal.
Por exemplo, para calcular a moda para os dados da tabela 8, observamos inicialmente que a 
classe modal é a segunda classe, cujas idades vão de 18 a 20 anos.
Neste caso, 1 2 1 15 3 12 2 2 3 15 10 5f f f f∆ = − = − = ∆ = − = − = e 
Portanto, a moda é calculada como segue:
1 12 18 2 18 1,4 19,4
1 2 12 5
Mo li x h x∆= + = + = + =
∆ + ∆ +
Medidas de dispersão ou de variabilidade
Para descrição adequada de um fenômeno, não basta saber o valor em torno do qual os dados 
estão variando, é necessário saber o grau de variabilidade dos dados. Isto é conhecido por meio 
das medidas de dispersão. As medidas de variabilidade ou medidas de dispersão que vamos 
calcular são: amplitude, variância, desvio padrão e coeficiente de variação.
32
CAPÍTULO 3 • MEDIDaS EStatÍStICaS
amplitude
Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor 
medição.
Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito 
apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isso porque 
dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito 
à variação dos dados.
variância e desvio padrão
A variância, assim como o desvio padrão, são medidas que complementam a informação das 
medidas de posição. Para calcular essas medidas de variabilidade, consideramos os desvios de 
cada observação em relação à média aritmética, ou seja, Xi – X. Em seguida calculamos a média 
dos quadrados dos desvios.
Assim, para um conjunto de valores X1, X2, X3, ..., Xn, a variância, denotada por S2, é calculada 
como segue:
( )22 1 
1
n
ii
X X
S
n
=
−
=
−
∑
Como a variância é uma medida quadrática, sua unidade de medida é o quadrado da unidade de 
medida dos dados. Portanto, devemos trabalhar com a raiz quadrada positiva da variância, que 
está na mesma unidade de medida dos dados. Esta medida é o desvio padrão, que é denotado 
por S, dado por:
( )22 1 
1
n
ii
X X
S S
n
=
−
= =
−
∑
Exemplo: voltamosao exemplo do professor de estatística que realizou cinco testes nos quais 
você tirou as seguintes notas: 10, 2, 9, 6 e 8, respectivamente. Neste caso a sua média foi:
1
1 10 2 9 6 8 7
5
n
i
i
X X
n =
+ + + +
= = =∑
Logo, a variância é calculada da seguinte forma:
33
MEDIDaS EStatÍStICaS • CAPÍTULO 3
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )
2 2 2 2 2 2
2 1
2 22 2 2
10 7 2 7 9 7 6 7 8 7
 
1 5 1
3 5 2 1 1 9 25 4 1 1 40 10
4 4 4
n
ii
X X
S
n
=
− − + − + − + − + −
= =
− −
+ − + + − + + + + +
= = = =
∑
E o desvio padrão é calculado assim:
2 10 3,2S S= = ≅
variância e desvio padrão para dados agrupados
Quando os dados estão agrupados, cada valor Xi¬ tem sua frequência correspondente. Neste 
caso a variância e o desvio padrão são dados, respectivamente, por:
( ) ( )2 22 21 1 
1 1
n n
i ii i
X X X X
S S S
n n
= =
− −
= → = =
− −
∑ ∑
Por exemplo, para os dados da tabela 9, vamos determinar a variância e o desvio padrão do 
número de filhos por família. Já vimos que para estes dados a média foi X = 1,7.
Tabela 9. No de filhos na família do candidato, Vestibular 2019.
Número de filhos Frequência (fi) Xifi Fi(Xi – X)2
0 5 0 5(0 - 1,7)2 = 14,45
1 26 26 26(1 - 1,7)2 = 12,74
2 9 18 9(0 - 1,7)2 = 0,81
3 5 15 5(3 - 1,7)2 = 8,45
4 3 12 3(4 - 1,7)2 = 15,87
5 2 10 2(5 - 1,7)2 = 21,78
total 50 81 74,10
 
Fonte: Criação do autor. 
Usando as informações da última coluna da tabela 9 para calcular a variância e desvio padrão 
temos:
( )22 21 74,10 1,51 1,51 1,2
1 49
n
ii
fi X X
S S S
n
=
−
= = ≅ → = = ≅
−
∑
Quando os dados estão agrupados em classes de frequências, cada valor Xi¬ será o ponto médio 
da classe. Para os dados da tabela 10, já calculamos a média de idade X = 22 anos.
34
CAPÍTULO 3 • MEDIDaS EStatÍStICaS
tabela 10. Distribuição em Classes de Frequências para a variável idade.
Número de filhos Xi fi Xifi Fi(Xi – X)2
16 18 17 3 51 3(17 - 22)2 = 75
18 20 19 15 285 15(19 - 22)2 = 10
20 22 21 10 210 10(21 - 22) 2 = 10
22 24 23 8 184 8(23 - 22) 2 = 8
24 26 25 7 175 7(25 - 22) 2 = 63
26 28 27 4 108 4(27 - 22) 2 = 100
28 30 29 3 87 3(29 - 22) 2 = 147
Total 50 1100 538
 
Fonte: Criação do autor. 
Sendo assim, temos:
( )22 2 21 538 10,98 10,98 3,31 
1 49
n
ii
fi X X
S anos S S anos
n
=
−
= = ≅ → = = ≅
−
∑
Coeficiente de variação
O desvio padrão, quando analisado individualmente, tem limitações. Por exemplo, um desvio 
padrão S = 2, pode ser considerado pequeno, ou insignificante para uma série de valores cuja 
média é X = 200, mas se a média for X = 20, esse desvio padrão já é bastante significativo. 
Por isso, muitas vezes é conveniente usar uma medida de dispersão relativa para expressar a 
variabilidade de um conjunto de dados.
Nesses casos, usamos o coeficiente de variação (CV) comparando o desvio padrão com a média, 
ou seja, calculamos SCV
X
= .
Como o desvio padrão e a média são expressos na mesma unidade de medida dos dados, o 
coeficiente de variação é uma medida de dispersão relativa adimensional e, portanto, o resultado 
desta divisão deve ser multiplicado por 100 e expresso em porcentagem, isto é, .1 00
SCV
X
= .
Exemplo: suponha que para os cinquenta estudantes do curso de administração, foram também 
determinadas as alturas de cada um. A média e o desvio padrão das alturas de homens e mulheres 
estão na tabela 11.
tabela 11. resumo das alturas de 50 estudantes de administração.
Variável Méida ( X ) Desvio Padrão (S)
altura – homens 183 cm 8 cm
altura – mulheres 166 cm 5 cm
 
Fonte: Criação do autor. 
35
MEDIDaS EStatÍStICaS • CAPÍTULO 3
A grande utilidade do coeficiente de correlação é comparar diferentes conjuntos de dados. Vamos 
calcular o coeficiente de variação para a variável altura de homens e mulheres.
Homens: 8 .1 00 .1 00 0,0437 .1 00 4,37%
133
SCV
X
= = = = 
Mulheres: 8 .1 00 .1 00 0,0437 .1 00 4,37%133
SCV
X
= = = =
No exemplo acima, para esses conjuntos de dados de altura de estudantes, as mulheres apresentam 
menor dispersão relativa. Concluímos, portanto, que, embora as mulheres sejam mais baixas 
que os homens, as alturas das mulheres são mais homogêneas.
Sintetizando
Vimos até agora:
 » Como calcular medidas de tendência central como a média, a mediana e a moda.
 » Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão.
 » Como determinar o coeficiente de variação de uma distribuição e a medida de assimetria dela.
36
Introdução do capítulo 
Este capítulo apresenta métodos e conceitos combinatórios, que consistem no estudo de situações 
em que a contagem se reduz, a saber, a quantas maneiras determinado grupo de objetos pode 
ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais situações 
envolvem o desenvolvimento de competências como o planejamento de estratégias na resolução 
de problemas, a divisão de problemas em casos, a análise envolvendo números pequenos 
levando à generalização, e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, serão 
aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance de 
um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de 
um evento. Obter as chances de determinado evento ocorrer permite, racionalmente, tomar 
decisões prevendo eventos futuros.
Objetivos 
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
 » Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou princípio 
multiplicativo.
 » Resolver problemas que envolvam o cálculo do número de elementos da união de 
conjuntos.
 » Identificar em situações-problema agrupamentos associados a conjuntos e sequências.
 » Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus 
elementos, ou não, e resolver problemas que envolvam arranjos, combinações e/ou 
permutações simples, com elementos repetidos e circulares.
 » Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço 
amostral nessas situações-problema;
 » Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
4CAPÍTULOPrOBaBILIDaDE
37
PrOBaBILIDaDE • CAPÍTULO 4
 » Utilizar o princípio multiplicativo no cálculo de probabilidades.
 » Resolver problemas que envolvam o cálculo da probabilidade de eventos.
 » Identificar eventos independentes e não independentes em situações-problema.
 » Resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
 » Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
Probabilidades 
Todas as vezes que se estudam fenômenos de observação, cumpre-se distinguir o próprio 
fenômeno e o modelo matemático (determinístico ou probabilístico) que melhor o explique.
Os fenômenos estudados pela estatística são aqueles cujo resultado, mesmo em condições 
normais de experimentação, varia de uma observação para outra, dificultando dessa maneira a 
previsão de um resultado.
A observação de um fenômeno casual é recurso poderoso para se entender a sua variabilidade. 
Entretanto, com suposições adequadas e sem observar diretamente o fenômeno, podemos criar 
um modelo teórico que reproduza de forma bastante satisfatória a distribuição das frequüências 
quando o fenômeno é observado diretamente. Tais modelos são os chamados modelos de 
probabilidades.
Para refletir
A probabilidade teve sua origem por volta do século XVII, devido à curiosidade de um cavaleiro, o Chevalier de Méré, 
que era muito apaixonado por jogos e, um dia, discutiu com um matemático chamado Blaise Pascal (1654) sobre as 
possibilidades de ganhar em jogos com cartas, despertando no matemático um imenso interesse pelo assunto. Então, 
Pascal escreveu uma carta para um amigo, também matemático, chamado Pierre de Fermat expondo o problema do 
Chavalier de Méré. Para Fermat, o assunto era algo novo e desconhecido. Após a carta do amigo, ele começou a estudar 
formas dedescrever matematicamente as leis do acaso com maior precisão. Os amigos continuaram se comunicando 
por meio de cartas, compartilhando cada nova descoberta. Fermat não tinha um real comprometimento em aprimorar 
probabilidade, ele respondia às cartas de Pascal, e resolvia os problemas que o amigo enviava, o que era apenas uma 
curiosidade relacionada com jogatinas e apostas. A prova disso pode ser vista em um problema proposto a ele por 
Pascal.
O problema dizia o seguinte: “uma pessoa quer tirar seis no dado em oito jogadas, suponhamos que ela tenha feito três 
tentativas e falhado, quanto de dinheiro ela poderia apostar em seu sucesso, ou seja, tirar um seis, na quarta jogada?” 
O problema foi resolvido por Fermat da seguinte forma: a chance de se tirar um seis em um dado é de 1 
6
 portanto o 
apostador apostaria 1 
6
 do dinheiro disponível para as apostas. Se ele falhar e tiver que jogar o dado uma segunda vez, 
sua chance de tirar um seis ainda é de 
1 
6 , e o apostador deve apostar 
1 
6
 do dinheiro que lhe sobrou da primeira aposta, 
isso daria 
1 
6 do total do dinheiro, e assim por diante. 
Respondendo à questão inicial, a quarta aposta seria de 
125 
1296 do dinheiro total.
38
CAPÍTULO 4 • PrOBaBILIDaDE
Os fenômenos determinísticos conduzem sempre a um mesmo resultado quando as condições 
iniciais são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as mesmas condições, as 
variações obtidas para o valor do tempo de queda livre de um corpo são extremamente pequenas 
(em alguns casos, desprezíveis).
Os fenômenos aleatórios podem conduzir a diferentes resultados e mesmo quando as condições 
iniciais são as mesmas, existe a imprevisibilidade do resultado. Ex: lançamento de um dado.
Para a explicação desses fenômenos (fenômenos aleatórios), adota-se um modelo matemático 
probabilístico.
Para melhor entendimento desta unidade, é interessante relembrar alguns conceitos básicos no 
estudo das probabilidades tais como:
Espaço amostral
Um dos conceitos matemáticos fundamentais utilizados no estudo das probabilidades é o de 
conjunto. Um conjunto é uma coleção de objetos ou itens que possuem características comuns. 
É importante definir cuidadosamente o que constitui o conjunto em que estamos interessados, 
a fim de podermos decidir se determinado elemento é ou não membro do conjunto. Conjunto 
é uma coleção bem definida de objetos ou itens. 
A probabilidade só tem sentido no contexto de um espaço amostral, que é o conjunto de todos os 
resultados possíveis de um experimento. O termo “experimento” sugere a incerteza do resultado 
Importante
Consideram-se os experimentos aleatórios como fenômenos produzidos pelo homem:
 » lançamento de uma moeda honesta;
 » lançamento de um dado;
 » lançamento de duas moedas;
 » retirada de uma carta de um baralho completo, de 52 cartas;
 » determinação da vida útil de um componente eletrônico.
A análise desses experimentos revela que:
 » cada experimento poderá ser repetido indefinidamente sob as mesmas condições;
 » não se conhece em particular o valor do experimento a priori, porém, pode-se descrever todos os possíveis resultados – 
as possibilidades;
 » quando o experimento for repetido um grande número de vezes, surgirá uma regularidade.
39
PrOBaBILIDaDE • CAPÍTULO 4
antes de fazermos as observações. Os resultados de um experimento (ex: a ocorrência de um 
raio, uma viagem etc.) chamam-se eventos.
Evento aleatório (E)
É qualquer subconjunto de um espaço amostral. É também o resultado obtido de cada experimento 
aleatório, que não é previsível.
Espaço Amostral (S)
Espaço amostral de um experimento aleatório é o conjunto de todos os possíveis resultados 
desse experimento.
Exemplos de espaços amostrais:
S = { c, r } (é composto de dois eventos)
S = { 1, 2, 3, 4, 5, 6 } (é composto de seis eventos)
S = { (c, r), (c, c), (r, c), (r, r)} (é composto de oito eventos)
Genericamente, se o número de pontos (elementos do espaço amostral) amostrais de um espaço 
amostral finito é n, então o número de eventos é dado por 2n.
Exemplo: no lançamento de seis moedas, o número de pontos amostrais (resultados possíveis) 
é 26 = 64. Portanto, S = 64.
Exemplo: na extração de uma só carta, os eventos “a carta é de copas” e a “carta é de ouros” são 
mutuamente excludentes, porque uma carta não pode ser ao mesmo tempo de copas e de ouros.
Já os eventos “a carta é de copas” e “a carta é uma figura” não são mutuamente excludentes, 
porque algumas cartas de copas são também figuras.
Muitas vezes, é útil representar graficamente um espaço amostral, porque isso torna mais fácil 
visualizar os elementos.
Os eventos A e A’ são complementares:
Importante
O complemento de um evento é constituído de todos os resultados no espaço amostral que não façam parte do evento.
Os eventos são mutuamente excludentes, quando não têm elemento em comum, ou se não podem ocorrer 
simultaneamente.
40
CAPÍTULO 4 • PrOBaBILIDaDE
Figura 4. Elementos a e a’ são complementares.
Fonte: Criação do autor.
Os eventos A e B são mutuamente excludentes porque não se interceptam.
Figura 5. Elementos a e a’ são excludentes.
Fonte: Criação do autor.
Os eventos A e B não são mutuamente excludentes, pois têm alguns elementos em comum.
Figura 6. Elementos a e B são mutuamente excludentes.
Fonte: Criação do autor.
Operações com eventos aleatórios
41
PrOBaBILIDaDE • CAPÍTULO 4
Consideremos um espaço amostral finito:
{ }1 2 3 , , , ns e e e e= …
Sejam A e B dois eventos de S, as seguintes operações são definidas:
I) Reunião – A ∪ B – O evento reunião é formado pelos pontos amostrais que pertencem a pelo 
menos um dos eventos.
1 1 1 { |, }A B e S e Aou e B∪ = ∈ ∈ ∈
Figura 7. reunião de dois eventos.
Fonte: Criação do autor.
É o evento que ocorre se A ocorre ou B ocorre, ou ambos ocorrem.
II) Interseção – A ∩ B – O evento interseção é formado pelos pontos amostrais que pertencem 
simultaneamente aos eventos A e B.
1 1 1 { |, }A B e S e Aou e B∩ = ∈ ∈ ∈
Figura 8. Interseção de dois eventos.
Fonte: Criação do autor
É o evento que ocorre se A e B ocorrem. Obs: Se A ∩ B = ∅, A e B são eventos mutuamente exclusivos.
42
CAPÍTULO 4 • PrOBaBILIDaDE
Definição de Laplace para probabilidade
A probabilidade de um acontecimento associado a uma certa experiência aleatória é dada pelo 
quociente entre o número de casos favoráveis ao acontecimento e o número de casos possíveis.
Podemos representar isso da seguinte forma :
Seja A um acontecimento associado a certa experiência aleatória cujo espaço amostral 
é Ω, tendo-se A ⊆ Ω. Seja p(A) a sua probabilidade, então:
( ) 
 
Númerodecasos favoráveis a AP A
Númerodecasos possíveis
=
Sendo assim, suponha que os experimentos aleatórios têm as seguintes características:
 » há um número finito n de eventos elementares (casos possíveis). A união de todos os 
eventos elementares é o espaço amostral;
 » os eventos elementares são igualmente prováveis;
 » todo evento A é uma união de m eventos elementares em m n≤ que 
Portanto, probabilidade de A:
( ) # 
 #
Númerodecasos favoráveis a A A mP A
Númerodecasos possíveis n
= = =
Ω
De acordo com a definição acima temos como consequências imediatas: 
Para todo evento A, ( )0 1P A≤ ≤ ;
P(Ω) = 1;
P(∅) = 0;
Se A ∩ B = ∅ então ( ) ( ) ( ) ( ) .P A B P A P A P B= = + 
Exemplo 1:
Uma urna contém dez bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola dessa 
urna. Qual a probabilidade de se obter uma bola cujo número inscrito é múltiplo de 3?
Solução: 
Espaço amostral: Ω = {1, 2, 3, 4, 5, 6, 7, 8, 9,1 0}
Evento: A = {3, 6, 9}
43
PrOBaBILIDaDE • CAPÍTULO 4
Logo: ( ) ( ) # 3 # 10
AP A P A= = =
Ω
Exemplo 2:
Uma moeda é lançada três vezes, sucessivamente. Qual é a probabilidade de observarmos:
a. Exatamente uma cara?
b. No máximo duas caras?
Solução: podemos construir uma árvore de possibilidades, em que as três colunas representem 
os possíveis resultados dos três lançamentos. Isto é:
Figura 8. árvore depossibilidades.
Fonte: Criação do autor.
O espaço amostral é dado por:
Ω = {(K,K,K), (K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Logo, #Ω = 8.
a. O evento “exatamente uma cara” corresponde ao conjunto:
A = {(K,C,C), (C,K,C), (C,C,K)}
Daí: #A = 3 
44
CAPÍTULO 4 • PrOBaBILIDaDE
Portanto:
( ) # 3 37,5%
# 8
AP A = = =
Ω
b. O evento “no máximo duas caras” corresponde ao conjunto:
B = {(K,K,C), (K,C,K), (K,C,C), (C,K,K), (C,K,C), (C,C,K), (C,C,C)}
Daí: #B = 7
Portanto:
( ) # 7 87,5%
# 8
BP B = = =
Ω
Espaços de probabilidade
A partir de agora, será introduzida a noção geral de probabilidade.
Seja Ω espaço amostral. Uma função P definida para todos os subconjuntos de W 
(chamados eventos) é chamada uma probabilidade se:
1. ( ) 0 1P A≤ ≤ , para todo evento A Ω;
2. P(∅) = 0, P(Ω) = 1;
3. Se A e B são eventos disjuntos, então P(A∪B) = P(A) + P(B).
Considerando as consequências do espaço amostral, temos:
P( A ) = 1 – P(A).
Se A ⊂ B, então P(A) = P(B) – P(B – A).
Se A ⊂ B, então P(A) ≤ P(B).
P(A∪B) = P(A) + P(B) – P(A ∩ B).
Exemplo 3:
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei?
ou uma carta de espadas?
Solução:
45
PrOBaBILIDaDE • CAPÍTULO 4
Considere:
A: saída de um rei
B: saída de uma carta de copas
Então:
( ) ( )4 13 
52 52
P A e P B= =
Mas, temos ainda: A ∩ B: saída de um rei de copas, daí:
( ) 1 
52
P A B∩ =
Portanto: 
( ) ( ) ( ) ( ) 4 13 1 16 0,3769%
52 82 52 82
P A B P A P B P A B∪ = + − ∩ = + − = ≅
Probabilidade condicional
A probabilidade de um evento A ocorrer, dado que um outro evento B ocorreu, é chamada 
probabilidade condicional do evento A dado B.
Por exemplo, a probabilidade de que uma pessoa venha a contrair HIV dado que ele/ela 
é um usuário de drogas injetáveis é uma probabilidade condicional.
Um outro exemplo é um estudo sobre panfletos de fármacia, em que se deseja calcular a 
probabilidade de que um panfleto de propaganda seja jogado no lixo dado que contém 
uma mensagem sobre o cuidado de depositar lixo no local apropriado, ou seja, na lixeira.
Um terceiro exemplo, é uma frase que ocorrerá repetidamente neste material: ‘’Se a 
hipótese nula for verdadeira, a probabilidade de se obter um resultado como este é ...’’. 
Aqui a palavra se substitui à expressão ‘dado que’, mas o sentido é o mesmo.
Com dois eventos, A e B, a probabilidade condicional de A dado B é denotada por AP
B
 
 
 
 
, por exemplo, 
 
HIVP
Usuáriodedrogas
 
 
 
ou LixoP
Mensagem
 
 
 
.
Exemplo: frequentemente assumimos, com alguma justificativa, que a paternidade leva a 
responsabilidade. Pessoas que passam anos atuando de maneira descuidadosa e irracional 
de alguma forma parecem se tornar pessoas diferentes uma vez que elas se tornam pais, 
mudando muitos dos seus antigos padrões habituais. Suponha que uma estação de 
46
CAPÍTULO 4 • PrOBaBILIDaDE
rádio tenha amostrado 100 pessoas, 20 das quais tinham filhos. Eles observaram que 30 
dessas pessoas usavam cinto de segurança, e que 15 daquelas pessoas tinham filhos. Os 
resultaddos são mostrados na tabela abaixo:
tabela 12: Distribuição de dados.
Paternidade Usam cinto Não usam cinto Total
Com filho 15 5 20
Sem filho 15 65 80
total 30 70 100
 
Fonte: Criação do autor.
A partir da informação na tabela podemos calcular probabilidades simples (ou marginais ou 
incondicionais), conjuntas e condicionais.
 » A probabilidade de uma pessoa amostrada aleatoriamente usar cinto de segurança é 
30 0,30 30%
100
ou= .
 » A probabilidade de uma pessoa ter filho e usar cinto de segurança é 
15 0,15 1 5%
100
ou= .
 » A probabilidade de uma pessoa usar cinto de segurança dado que tem filho é 
15 0,75 75%
20
ou= .
 » A probabilidade de uma pessoa ter filho dado que usa cinto de segurança é 
15 0,50 50%
30
ou= .
teorema da probabilidade total
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral. Seja B um evento 
desse espaço. Então:
( ) ( )
1
 . 
n
i
i i
BP B P A P
A−
 
=  
 
∑
Exercício resolvido
Uma urna contém três bolas brancas e duas amarelas. Uma segunda urna contém quatro bolas 
brancas e duas amarelas. Escolhe-se, ao acaso, uma urna e dela retira-se, também ao acaso, uma 
bola. Qual a probabilidade de que seja branca?
Probabilidade da urna escolhida ser a primeira (três bolas brancas e duas amarelas): 
1 
2
P =
Probabilidade de uma bola dessa urna ser branca: 
3 1 3 3 . .
5 2 5 10
P P        = = =       
     
′
 
47
PrOBaBILIDaDE • CAPÍTULO 4
Probabilidade da urna escolhida ser a segunda: 
1 '' 
2
P =
Probabilidade de uma bola esoclhida da segunda urna ser branca: 
4 1 4 2 1 . .
6 2 6 6 3
P P ′′′
    ′ = = = =    
   
′
 
Logo, probabilidade total: 
1 3 19 
3 10 30
P P′′′ =′+ = +
teorema Bayes
Sejam A1, A2, ..., An eventos que formam uma partição do espaço amostral W. Seja B ⊂ W. Sejam 
conhecidas e , i = 1, 2, ..., n. Então:
( ) ( ) ( )
( ) ( )1
 . 
 , 1, 2, ..., 
 . 
i i
i n
i ii
P A P B A
P A B j n
P A P B A
=
= =
∑
∣
∣
∣
Exercício resolvido
A urna A contém três bolas vermelhas e duas azuis, e a urna B contém duas bolas vermelhas e 
oito azuis. Joga-se uma moeda honesta. Se a moeda der cara, extrai-se uma bola da urna A; se 
der coroa, extrai-se uma bola da urna B. Uma bola vermelha é extraída. Qual a probabilidade de 
ter saído cara no lançamento?
Figura 10. Probabilidade.
Fonte: Criação do autor.
atenção
O Teorema de Bayes é também conhecido como Teorema da Probabilidade a Posteriori. Ele relaciona uma das parcelas 
da probabilidade total com a própria probabilidade total.
48
CAPÍTULO 4 • PrOBaBILIDaDE
( ) ( )( )
 / ii
P X A
P A X
P X
∩
=
Pelo Teorema de Bayes temos:
( ) ( )( )
( ) ( )
( ) ( ) ( ) ( ) ( ) ( )1 1 2 2
|
 
| | |
i i i
i
n n
P X A P X A P A
P A B
P X P X A P A P X A P A P X A P A
∩
= =
+ +…+
( )
( ) ( )1 11
 in
i
P X A
P X A P A
=
∩
=
∑ ∣
Sendo assim:
( )
3 1 3 3
3 20 60 35 2 10 10 / 0,75 75%3 1 2 1 3 2 6 2 10 8 80 4
5 2 10 2 10 20 20
x
P Ca V x ou
x x
= = = = = = =
+
+ +
Probabilidade binomial
Considere um experimento com apenas dois resultados possíveis, chamados de sucesso e fracasso.
Vejamos:
 » No lançamento de uma moeda não viciada, tome sucesso = cara e fracasso = coroa.
 » No lançamento de um dado não viciado, tome sucesso = o resultado é 4 ou 6 e fracasso 
= o resultado é 1, 2, 3 ou 5.
Seja p a probabilidade de sucesso e q = 1 – p a probabilidade de fracasso. Vejamos o exemplo 
abaixo:
Considere o experimento aleatório: jogue um dado e observe o número mostrado na face de cima.
Nesse caso, o conjunto formado por todos os resultados possíveis do experimento é dado 
por: Ω = {1, 2, 3, 4, 5, 6} (Espaço amostral).
Qualquer subconjunto do espaço amostral caracteriza um evento, por exemplo, o 
subconjunto A = {2, 4, 6} é o evento que acontece se o número mostrado na face de cima 
é par. Assim, A = 3. Uma das perguntas que pode ser feita é: qual a chance (probabilidade) 
do evento A ocorrer?
49
PrOBaBILIDaDE • CAPÍTULO 4
Intuitivamente, se esse experimento for repetido em um grande número de vezes, obtém-
se um número par em aproximadamente metade dos casos. Isto é:
 » os eventos elementares são todos igualmente prováveis;
 » o número de elementos de A é justamente a metade dos elementos de Ω.
Logo, pode-se afirmar que:
Probabilidade de 3 1 
6 2
AA A= = = =
Ω
No exemplo acima, segue que os valores de p são, respectivamente, 
1 3 
2 6
e .
A partir de cada experimento apresentado no exemplo 4.9, pode-se estar interessado em repeti-
los um número fixo n de vezes. Supondo que a probabilidade p de sucesso se mantém constante 
ao longo das provas e que as provas sejam independentes, surge a seguinte questão:
Qual é a probabilidade de obtermos k sucessos nessas n provas?
Para resolver essa questão, utiliza-se o teorema binomial, isto é:
teorema binomial
A probabilidade de ocorrerem exatamente k sucessos emuma sequência de n provas 
independentes, na qual a probabilidade de sucesso em cada prova é p, é igual a:
( ) 1 n kk
n
p p
k
−  − 
 
Exercício resolvido
Joga-se uma moeda não viciada dez vezes. Qual a probabilidade de se obter exatamente cinco 
caras?
Solução:
Tome: sucesso = cara.
Assim, 
1 
2
p = em cada prova e as provas são independentes. Deve-se obter a probabilidade de 
k = 5 sucessos em n = 10 provas. Portanto, pelo teorema binomial, segue que:
5 10 510 1 1 252 63 1
5 2 2 1024 256
−    − = =    
   
50
CAPÍTULO 4 • PrOBaBILIDaDE
a Estatística e o recurso tecnológico
Cálculo da média, variância e desvio padrão
No capítulo 2, vimos como calcular a média, a variância e o desvio padrão de uma amostra. 
Agora,vejamos como isso pode ser feito com o auxílio do Excel.
Considere o seguinte conjunto de dados da figura abaixo contidos em uma planilha do Excel:
Figura 11. Salários da empresa XYz.
Fonte: Criação do autor
Para obter a média salarial dos funcionários, escolha a última célula pertencente à coluna Salário 
mensal (R$) e, no menu principal, escolha o ícone fórmulas, isto é:
51
PrOBaBILIDaDE • CAPÍTULO 4
Figura 11. Média dos salários da empresa XYz.
Fonte: Criação do autor.
Agora basta escolher a função desejada, isto é, no caso da média, escolha MÉDIA. Assim, a média 
salarial aparecerá calculada na célula selecionada. Analogamente, obtêm-se outros tipos de 
médias, a mediana, a moda, a variância e o desvio padrão.
Sintetizando
Vimos até agora:
 » Como resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o princípio multiplicativo.
 » Como reconhecer a diferença entre conjuntos e sequências e identificar em situações-problema agrupamentos 
associados a conjuntos e sequências.
 » Como reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço amostral nessas 
situações-problema.
 » Como resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
 » Como resolver problemas que envolvem o cálculo da probabilidade de eventos.
 » Como identificar eventos independentes e não independentes em situações-problema.
 » Como resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
 » Como utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
52
Introdução do capítulo 
Este capítulo apresenta o conceito de variável aleatória discreta e exemplos de distribuições e 
probabilidades que servem como modelos para o estudo de experimentos estatísticos.
Objetivos 
Esperamos que, após o estudo do conteúdo deste capítulo, você seja capaz de:
 » Identificar variáveis aleatórias discretas.
 » Entender como ocorre a distribuição de probabilidades para variáveis aleatórias discretas.
 » Utilizar adequadamente o modelo de distribuição de probabilidade discreta binomial 
na resolução de problemas estatísticos.
Preliminares
A seguir, será apresentado o conceito de variável aleatória a fim de associá-lo aos resultados de 
um experimento aleatório. Esse conceito estará relacionado a um número real que, juntamente 
com a definição de função, permitirá calcular a probabilidade de ocorrência de vários eventos 
correspondentes a esse experimento de forma mais simples e fácil.
Definição: uma variável aleatória é aquela que assume valores associados com resultados 
aleatórios de um experimento, em que um (e apenas um) valor numérico é marcado para cada 
ponto da amostra.
As variáveis aleatórias são classificadas em variáveis aleatórias discretas e variáveis aleatórias 
contínuas (esta última a ser tratada na capítulo 6).
Chama-se variável aleatória discreta toda variável aleatória que pode assumir um número de 
valores.
5
CAPÍTULO
DIStrIBUIçãO DE PrOBaBILIDaDE 
DE varIávEIS aLEatÓrIaS 
DISCrEtaS
53
DIStrIBUIçãO DE PrOBaBILIDaDE DE varIávEIS aLEatÓrIaS DISCrEtaS • CAPÍTULO 5
Exemplo de variáveis aleatórias discretas: o número de vendas feitas por um vendedor em uma 
semana de trabalho: x = 0, 1, 2, 3, ...
 » O número de consumidores de uma amostra de seiscentas pessoas que preferem o 
produto da marca A em relação ao produto da marca B: x = 0, 1, 2, 3, ..., 600.
 » O número de clientes esperando serem servidos em um restaurante em um horário 
específico: x = 1, 2, 3, ...
Distribuição de probabilidades para variáveis aleatórias 
discretas 
Uma descrição completa de uma variável aleatória discreta requer as seguintes especificações:
 » os possíveis valores que ela pode assumir;
 » a probabilidade associada a cada valor.
A distribuição de probabilidade de uma variável aleatória discreta é um gráfico, tabela ou fórmula 
que especifica a probabilidade associada em cada valor possível que a variável aleatória pode 
assumir.
Vale lembrar que são necessários dois requisitos para uma distribuição de probabilidades de 
uma variável aleatória discreta X:
( ) 0 P x x≥ ∀
( ) 1P xΣ =
Média ou valor esperado de uma variável aleatória discreta
A média de uma variável aleatória discreta é o principal parâmetro de posição e indica informações 
sobre o centro de sua distribuição de probabilidades.
Chama-se média ou valor esperado de uma variável aleatória discreta e representa-se, por ou 
E(x), a seguinte soma:
( ) ( ) i
i
E x x p xµ = =∑
54
CAPÍTULO 5 • DIStrIBUIçãO DE PrOBaBILIDaDE DE varIávEIS aLEatÓrIaS DISCrEtaS
Exercício resolvido
João é funcionário de uma empresa de seguros e vendeu uma apólice de seguros de um ano por 
US$10.000 com um prêmio anual de US$290. observando tabelas atuariais, verifica-se que a 
probabilidade de morte durante o próximo ano para uma pessoa da idade, sexo, nível de saúde 
do seu cliente é de 0,001. Qual o ganho esperado (quantidade de dinheiro feito pela empresa) 
para uma apólice desse tipo?
Solução
O objetivo do experimento é observar se o cliente viverá no ano seguinte. As probabilidades 
associadas com os dois pontos amostrais, viver e morrer, respectivamente, são 0,009 e 0,001. A 
variável aleatória de interesse é o ganho X que pode assumir valores discretos na tabela abaixo.
tabela 13. variável aleatória.
Ganho Y Ponto amostral Probabilidade
r$ 290 Cliente vive 0,009
- r$ 710 Cliente morre 0,001
 
Fonte: Criação do autor.
Se o cliente vive, então o ganho é de R$ 290. Se o cliente morre, então o ganho é negativo, isto é, 
igual a R$ (290 – 1.000) = - R$710.
( ) ( ) ( ) 290 . 0,999 710 . 0,001 $ 280
i
E x xip xi USµ = = = + − =∑
Portanto, conclui-se que o valor esperado é dado da seguinte forma: se a empresa vender um 
número grande de apólices de um ano de R$10.000 para clientes que possuem as características 
descritas anteriormente, ela ganha um valor líquido (em média) de R$ 280 por venda no próximo 
ano.
No caso das variáveis aleatórias discretas, pode-se também encontrar medidas de variabilidade.
A variância de uma variável aleatória discreta X é dada por: 
Importante
Esperado é um termo matemático e não deve ser interpretado como usualmente é aplicado. O valor esperado é a média 
da distribuição de probabilidades ou uma medida de tendência central.
55
DIStrIBUIçãO DE PrOBaBILIDaDE DE varIávEIS aLEatÓrIaS DISCrEtaS • CAPÍTULO 5
( ) ( )2 2 i I
I
VAR X x p x µ= −∑
O desvio padrão de uma variável aleatória discreta é igual à raiz quadrada da variância, isto é:
( ) ( ) DP X VAR X=
Problema resolvido
Um jogo consiste em lançar uma moeda. Se cair cara, ganham-se R$10,00 e, se cair coroa, perdem-
se R$5,00. Qual o lucro médio do jogo e qual a sua variância?
Solução
Temos que X é a variável lucro, daí:
tabela 14. varáveis aleatórias
Resultado Probabilidade () Valor de
Cara r$ 10,00
Coroa r$ 5,00
 
Fonte: Criação do autor.
Portanto:
( ) ( ) ( )1 1 .1 0 . 5 $ 2,50
2 2ii
E x xip x Rµ = = = + − =∑
( ) ( )2 2 21 1100 . 25 . 2,5 $ 56,25
2 2i II
VAR X x p x Rµ    = − = + − =   
   
∑
Problema resolvido.
Um dado honesto de seis faces numeradas de 1 a 6 é lançado duas vezes. Qual a 
distribuição de probabilidades

Continue navegando