Buscar

Estatistica Basica

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 96 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 96 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 96 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Brasília - DF.
Estatística básica
Autores
Heitor Achilles Dutra da ROSA
Produção
Equipe Técnica de Avaliação, Revisão Linguística e 
Editoração
Sumario
Organização do caderno de estudos e pesquisa ..................................................................................................... 4
Introdução ............................................................................................................................................................................. 6
Aula 1
Pensamentos Estatísticos .......................................................................................................................................... 7
Aula 2
Organização e Descrição de Dados ......................................................................................................................23
Aula 3
Medidas de tendência central e medidas de variabilidade .........................................................................35
Aula 4
Probabilidade ...............................................................................................................................................................52
Aula 5
Distribuição de probabilidade de variáveis aleatórias discretas ...............................................................75
Aula 6
Distribuição de probabilidade de variáveis aleatórias contínuas..............................................................82
Tabelas estatísticas ..........................................................................................................................................................95
Referências ..........................................................................................................................................................................96
4
Organização do caderno de 
estudos e pesquisa
Para facilitar seu estudo, os conteúdos são organizados em unidades, subdivididas em capítulos, 
de forma didática, objetiva e coerente. Eles serão abordados por meio de textos básicos, com 
questões para reflexão, entre outros recursos editoriais que visam a tornar sua leitura mais 
agradável. Ao final, serão indicadas, também, fontes de consulta, para aprofundar os estudos 
com leituras e pesquisas complementares.
A seguir, uma breve descrição dos ícones utilizados na organização dos Cadernos de Estudos e Pesquisa.
Provocação
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes 
mesmo de iniciar sua leitura ou após algum trecho pertinente para o autor 
conteudista.
Para refletir
Questões inseridas no decorrer do estudo a fim de que o aluno faça uma pausa 
e reflita sobre o conteúdo estudado ou temas que o ajudem em seu raciocínio. 
É importante que ele verifique seus conhecimentos, suas experiências e seus 
sentimentos. As reflexões são o ponto de partida para a construção de suas 
conclusões.
Sugestão de estudo complementar
Sugestões de leituras adicionais, filmes e sites para aprofundamento do estudo, 
discussões em fóruns ou encontros presenciais quando for o caso.
Praticando
Sugestão de atividades, no decorrer das leituras, com o objetivo didático de 
fortalecer o processo de aprendizagem do aluno.
5
Organização do caderno de estudos e pesquisa
Atenção
Chamadas para alertar detalhes/tópicos importantes que contribuam para a 
síntese/conclusão do assunto abordado.
Saiba mais
Informações complementares para elucidar a construção das sínteses/conclusões 
sobre o assunto abordado.
Sintetizando
Trecho que busca resumir informações relevantes do conteúdo, facilitando o 
entendimento pelo aluno sobre trechos mais complexos.
Para (não) finalizar
Texto integrador, ao final do módulo, que motiva o aluno a continuar a aprendizagem 
ou estimula ponderações complementares sobre o módulo estudado.
6
Introdução
Este caderno de estudos se destina a alunos do curso de Graduação a distância em Administração 
da AVM e apresenta uma introdução conceitual do campo da estatística e algumas aplicações. 
As aplicações correspondem a problemas contextualizados que exigem a análise de certos dados 
apresentados, bem como a escolha de um método conveniente para tratá-los estatisticamente. 
Sendo assim, ao longo de cada aula serão discutidas, desenvolvidas e ampliadas algumas técnicas 
estatísticas a fim de, posteriormente, serem aplicadas em situações-problema. Vale ressaltar que 
as questões apresentadas irão, constantemente, exigir que o estudante se posicione criticamente 
frente às mesmas, isto é, a partir de resultados estatísticos, o estudante deverá fornecer critérios 
para tomada de decisões na solução de problemas. Apesar do forte caráter das aplicações, é 
importante lembrar que, em todos os momentos, o rigor característico da linguagem matemática 
está presente, uma vez que um dos objetivos deste módulo é articular teoria e prática. Vale 
observar ainda que não existe preocupação de esgotar por completo os conceitos abordados, 
embora estejam incluídas referências bibliográficas para aqueles que assim desejam.
Este caderno de estudos tem como objetivos:
 » Servir de instrumento de reflexão, discussão e problematização em torno de temas e 
questões fundamentais presentes na prática de uma empresa e/ou organização.
 » Entender e usar de forma eficiente e eficaz informações estatísticas extraídas de um 
banco de dados.
 » Analisar relatórios estatísticos visando avaliar e tomar decisões acertadas.
Enfatizar o desenvolvimento do pensamento estatístico e avaliar a credibilidade do valor das 
inferências feitas a partir de dados, não só para aqueles que consomem, mas também para 
aqueles que produzem.
7
Apresentação
Esta aula apresenta algumas definições básicas de conceitos relacionados à estatística. Além 
disso, busca demonstrar o papel-chave que a estatística desempenha no raciocínio crítico, seja 
ele, elaborado no decorrer desse curso, no trabalho ou na vida diária.
Objetivos
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Identificar quais os objetivos da ciência estatística.
 » Identificar tipos de aplicações estatísticas na empresa.
 » Reconhecer quais são os elementos fundamentais da estatística.
 » Identificar e escolher adequadamente um método estatístico para análise de populações.
 » Classificar dados estatísticos.
 » Estabelecer um critério para coleta de dados.
 » Entender o papel da estatística no gerenciamento da tomada de decisões.
1AulAPEnSAMEnTOS ESTATíSTIcOS
8
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
O que é estatística?
Você pode ainda não ter notado, mas seja qual for a sua opinião sobre questões cotidianas, você 
sempre encontra ou poderá encontrar estatísticas ou pesquisas estatísticas para apoiar seus pontos 
de vista – quer seja para tomar algum tipo de vitamina ou para saber se o ensino integral é mais 
eficaz no desenvolvimento das crianças, ou até mesmo se um alimento faz mal ou bem. Existe 
um infinito fluxo de informações para auxiliá-lo a tomar decisões, podendo essas serem seguras 
ou não, parciais ou imparciais. Mas, qual o significado da estatística? Sabe-se, por exemplo, que 
ela pode ser capaz de fazer alguém pensar na média de gols por rodada de um campeonato, fazer 
com que se possa refletir sobre os números do desemprego no país e no mundo ou até mesmo 
em distorções numéricas de fatos. 
Dessa forma, a estatística aparece como uma ciência importante, útil e com um escopo abrangente 
de aplicações em negócios, administração, política, física e ciências sociais, quase ilimitado.
Definição 1.1
Estatística é a ciência da coleta, organização e interpretação de fatos numéricos, chamados de 
dados.
Vale lembrar que um estatístico além de calcular médias e/ou tabular resultados é também capaz 
de coletar informações numéricas em forma de dados, a fim de avaliá-los e a partir delestirar 
determinadas conclusões. Os estatísticos também são capazes de determinar qual informação 
é relevante em um dado problema e se as conclusões obtidas a partir de certo estudo podem ou 
não ser confiáveis.
Muitas descrições numéricas como, por exemplo, taxas mensais de desemprego, índice de falência 
para um novo negócio e proporção de mulheres executivas em um setor particular representam 
descrições estatísticas de um grande conjunto de dados coletados sobre algum fenômeno. Muitas 
vezes, os dados selecionados pertencem a algum conjunto maior do qual se deseja obter alguma 
característica. Este processo de seleção é chamado de amostragem. 
Por exemplo, você pode coletar as idades de uma amostra de consumidores em uma videolocadora 
para estimar a idade média de todos os consumidores da loja. Assim, você poderia usar suas 
estimativas nos anúncios da loja para atingir o grupo ou faixa etária apropriada. Nesse exemplo, 
a estatística envolve dois diferentes processos:
 » Descrever conjuntos de dados;
 » Obter conclusões (fazer estimativas, previsões, tomar decisões) sobre os conjuntos de 
dados baseados na amostragem.
9
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
O exemplo sugere duas aplicações da estatística, sendo assim, esta pode ser dividida em duas 
grandes áreas: estatística descritiva e estatística inferencial.
Definição 1.2
A estatística descritiva utiliza métodos numéricos e gráficos para coletar, organizar e descrever 
dados. 
Exemplo 1.1 – “Divisão do mercado norte-americano de cartões de crédito e débito” (U.S. Payment 
Card Information Network, 22 nov. 2005).
A CardWeb.com, Inc. é líder em publicações 
on-line de informações referentes a cartões de 
pagamento (isto é, crédito, débito, smart, pré-
pago e cartões telefônicos). Em 2005, a empresa 
rastreou, nos EUA, todas as compras efetuadas 
com cartões de crédito ou débito. A quantidade 
de cada compra foi gravada e classificada de 
acordo com o tipo de cartão usado. Os resultados 
são mostrados na figura 1.1 a seguir.
Figura 1.1 – Divisão do mercado de cartões de crédito norte-americano em 2005.
(Fonte: www.carddata.com)
Definição 1.3
A estatística inferencial utiliza uma amostra de dados para fazer estimativas, decisões, previsões 
ou outras generalizações acerca de um conjunto maior de dados.
Exemplo 1.2 – “O Índice de preços ao consumidor” (Departamento do trabalho Norte-americano).
Saiba mais
Um dos maiores usos do IPC como um índice de inflação 
é o de indicador do sucesso ou fracasso das políticas 
econômicas do governo. Outro uso é o de índice de 
reajuste dos salários. Milhões de trabalhadores possuem 
dissídios salariais em seus acordos sindicais coletivos; 
estas cláusulas indicam os aumentos nas taxas salariais 
com base em aumentos do IPC. Além disso, os benefícios 
da Previdência Social, a aposentadoria militar e os 
salários do funcionalismo público estão atrelados ao IPC. 
10
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Um conjunto de dados que virtualmente interessa à população de qualquer país é o conjunto 
de preços cobrados por bens e serviços na economia desse país. A tendência geral de aumento 
nesses preços é chamada inflação e a queda nos preços é conhecida como deflação. De modo 
a estimar a alteração nos preços ao longo do tempo, o Bureau de Estatísticas do Trabalho (BLS) 
do Departamento de Trabalho norte-americano desenvolveu o Índice de Preços ao Consumidor 
(IPC). A cada mês, o BLS coleta dados de preços de uma seleção específica de bens e serviços 
(chamados de cesta de bens e serviços) de 85 áreas urbanas do país. Procedimentos estatísticos 
são usados para calcular o IPC dessa amostra de dados de preços e de outras informações sobre 
os hábitos de consumo das pessoas. Ao comparar o IPC em diferentes momentos, é possível 
estimar (fazer uma inferência sobre) a taxa de inflação em um intervalo de tempo e comparar o 
poder de compra do dólar em diferentes momentos no tempo. Este é um exemplo de estatística 
inferencial, os dados de preço da cesta de bens e serviços coletados de uma amostra de áreas 
urbanas (usados para calcular o IPC) são usados nas inferências sobre a taxa de inflação e o 
aumento dos salários.
conceitos fundamentais da estatística
Métodos estatísticos são particularmente úteis para estudar, analisar e aprender sobre populações 
de unidades experimentais.
Definição 1.4
Chama-se unidade experimental um objeto a partir do qual correlatamos dados.
Definição 1.5
Chama-se população um conjunto universo qualquer, do qual desejamos obter informações, 
cujos elementos devem apresentar pelo menos uma característica em comum.
Exemplo 1.3 – Exemplos de Populações.
Todos os trabalhadores desempregados no Brasil; todos os eleitores da cidade do Rio de Janeiro; 
todos os carros produzidos no ano de 2007 no Brasil; todas as vendas realizadas no drive-thry de 
uma lanchonete da rede McDonald´s durante o ano de 2008; o conjunto de todos os atropelamentos 
ocorridos no 1º semestre de 2006 em Copacabana.
Ao estudar uma população, focamos uma ou mais características ou propriedades das unidades 
experimentais na população. Essas características são denominadas variáveis.
Definição 1.6
Chama-se variável uma característica ou propriedade de uma unidade experimental.
11
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Ao estudar uma variável em particular, é útil obter-lhe uma representação numérica. Muitas 
vezes para obter essa representação é necessário estabelecer um processo de medição. Sendo 
assim, a medição é o processo que utilizamos para atribuir números às variáveis de unidades 
populacionais distintas. Pode-se, por exemplo, medir a qualidade de um serviço solicitando a um 
cliente para avaliar a eficiência do serviço em uma escala de 1 a 10. Ou pode-se mensurar a idade 
da força de trabalho simplesmente fazendo a pergunta: “qual a sua idade?” De acordo com o caso, 
a medição pode envolver instrumentos específicos como cronômetros, réguas e calibradores.
Quando a população estudada é pequena, pode-se medir uma variação para cada unidade dessa 
população. Por exemplo, deseja-se medir o salário inicial de todos os graduados em Administração 
do IAVM em um determinado ano. É pelo menos factível obter cada salário. Nesse caso, em que 
se consegue medir uma variável para cada unidade experimental de uma população, o resultado 
obtido é denominado censo.
Definição 1.7
Chama-se censo o levantamento total da população. Nesse caso, cada elemento da população 
é analisado individualmente.
Porém, em muitos casos, a população de interesse envolve talvez muitos milhares ou ainda um 
número infinito de unidades. Sendo assim em vez de considerar toda a população, pode-se analisar 
uma parte dela. Mesmo porque, dependendo do caso, conduzir um censo para populações muito 
grandes pode ocasionar um custo proibitivo em termos de tempo e dinheiro. Uma alternativa 
razoável é selecionar e estudar um subconjunto (ou porção) das unidades na população.
Definição 1.8
Chama-se amostra todo subconjunto de unidades de uma população.
Exemplo 1.4 – Auditoria de faturamento.
Suponha que uma empresa está sendo auditada em seu faturamento. Em vez de examinar 
todas as 25.487 faturas emitidas durante certo ano, um auditor pode selecionar e examinar uma 
amostra de apenas 100 faturas. Se o interesse for a variável “fatura com erro”, gravaria (mediria) 
a condição (erro ou não erro) de cada fatura da amostra. Após cada variável de interesse de 
unidade experimental na amostra (ou população) ser medida, os dados são analisados por 
métodos estatísticos descritivos ou inferenciais. O auditor, por exemplo, pode apenas descrever 
a taxa de erro na amostra de 100 faturas. Contudo, é mais provável que ele utilize a informação 
obtida para fazer inferências sobre a população de todas as 25.487 faturas.
12
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Definição1.9
Uma inferência estatística é uma estimativa ou previsão ou alguma outra generalização sobre 
uma população com base em informações contidas numa amostra.
EXERCÍCIO RESOLVIDO
A Guerra das “Colas” é o termo popular para a intensa competição entre Coca-Cola e Pepsi 
mostrada em suas campanhas de marketing. As campanhas têm estrelas do cinema e televisão, 
vídeos de rock, apoio de atletas e afirmações preferenciais dos consumidores com base em 
testes de sabor. Como uma parte de uma campanha de marketing da Pepsi, suponha que 1 
000 consumidores de refrigerante sabor cola submetam-se a um teste cego de sabor (isto é, as 
marcas estão encobertas). Cada consumidor é questionado quanto à sua preferência em relação 
à marca A ou B.
( A ) Descreva a população.
( B ) Descreva a variável de interesse.
( C ) Descreva a amostra.
( D ) Descreva a inferência.
SOLUÇÃO
( A ) Uma vez que estamos interessados nas respostas dos consumidores de refrigerantes 
sabor cola no teste de sabor, um consumidor desse tipo de refrigerante é uma unidade 
experimental. Assim, a população de interesse é a coleção ou conjunto de todos esses 
consumidores.
( B ) A característica que a Pepsi deseja medir é a preferência do consumidor de refrigerante 
sabor cola revelada sob a aplicabilidade de um teste cego, logo, a preferência pelo tipo 
de refrigerante é a variável de interesse.
( C ) A amostra é de 1 000 consumidores de refrigerantes, sabor cola, selecionados da 
população de todos os consumidores desse tipo de refrigerante.
( D ) A inferência de interesse é a generalização da preferência de refrigerante sabor cola dos 
1 000 consumidores da amostra para a população de todos os consumidores desse tipo 
de refrigerante. Em particular, as preferências dos consumidores da amostra podem ser 
usadas para estimar o percentual de todos os consumidores que preferem cada marca.
Ao se fazer inferências, surgem questões em torno do quanto essas podem ser válidas ou “boas” 
para o que se pretende analisar e/ou interpretar, isto é, precisa-se determinar a sua confiabilidade. 
13
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
A única forma de se ter certeza de que uma inferência sobre uma população está correta é 
incluir a população inteira na amostra a ser estudada. Mas, devido aos recursos limitados (isto 
é, tempo insuficiente e/ou dinheiro), normalmente não se trabalha com populações inteiras, 
logo as inferências passam a ser baseadas apenas numa parte da população (amostra). Como 
consequência, sempre que possível, é importante determinar e relatar a confiabilidade de cada 
inferência. Portanto, o grau de confiabilidade de uma inferência é o responsável em separar a 
ciência estatística da arte de “adivinhar a sorte”.
Exemplo 1.5 – Idade média dos telespectadores do programa ABC World News Tonight.
De acordo com The Satte of the News Media, 2006, a idade média dos telespectadores do programa 
ABC World News Tonight é de 59 anos. Suponha que uma executiva de uma rede rival presuma 
que a média de idade dos telespectadores do ABC News é menor que 59 anos. Para testar a sua 
hipótese, ela coleta uma amostra de 500 telespectadores do noticiário noturno ABC e determina 
a idade de cada um. Neste exemplo, temos que a população é todo o conjunto de telespectadores 
do noticiário noturno da ABC, a idade (em anos) de cada telespectador é a variável de interesse, 
a amostra são os 500 telespectadores do ABC News selecionados pela executiva e a inferência é 
estimar se a idade média dos telespectadores é menor do que 59 anos. Se a executiva estivesse 
interessada no erro de estimativa (isto é, a diferença entre a idade média para a população de 
telespectadores de TV e a idade média de uma amostra de telespectadores de TV), usando métodos 
estatísticos, poder-se-ia determinar um limite do erro da estimativa. Este limite é simplesmente 
um número que nosso erro de estimativa não pode exceder. Nas próximas aulas, veremos que 
essa fronteira é uma medida de incerteza da nossa inferência. A confiabilidade das inferências 
estatísticas será discutida ao longo das aulas apresentadas nesse caderno de estudos.
Definição 1.10 
Uma medida de confiabilidade é uma afirmação 
(geralmente quantificada) sobre o grau de incerteza 
associado a uma inferência estatística.
TIPOS DE DADOS
Todos os dados (e, por conseguinte, as variáveis que 
medimos) podem ser classificados como um dos dois 
tipos gerais: quantitativo e qualitativo.
Exemplo 1.6 – Dados quantitativos.
A temperatura (em graus Celsius) em que cada unidade em uma amostra de 25 peças plásticas 
resistentes ao calor começam a derreter, a atual taxa de desemprego de cada um dos estados 
brasileiros da região sudeste, o salário dos administradores empregados em multinacionais, 
Atenção
Geralmente, atribuem-se valores numéricos 
arbitrários aos dados qualitativos para 
facilitar a entrada dos dados no computador e 
a análise. Esses valores numéricos atribuídos 
são apenas códigos: eles não podem ser 
somados, subtraídos, multiplicados ou 
divididos. Por exemplo, podemos atribuir 
os seguintes códigos: democrata = 1; 
republicano = 2 e independente = 3. 
14
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
o número de mulheres executivas empregadas em cada uma das amostras de 75 empresas de 
manufatura.
Definição 1.11
Dados quantitativos são medidas registradas em 
uma escala numérica de ocorrência natural.
Quanto aos dados qualitativos, temos que estes não 
podem ser medidos em escalas numéricas naturais, 
ou seja, eles podem apenas ser classificados em 
categorias. 
Exemplo 1.7 – Dados qualitativos.
A afiliação de um partido político (democrata, 
republicano ou independente), a condição de defeito 
(defeito ou não) de cada uma das 100 peças de um 
microcomputador, a nacionalidade de 100 turistas 
em visita a cidade do Rio de Janeiro.
Definição 1.12
Dados qualitativos são mensurações que não podem 
ser medidas em uma escala numérica natural, eles 
só podem ser classificados em grupo de categorias.
COLETA DE DADOS
Após ter decidido o tipo de dados (quantitativos ou qualitativo) apropriados para o problema 
em questão a ser estudado, é preciso coletá-los. Essa coleta de dados pode ser feita de quatro 
formas:
 » Dados de fonte publicada.
 » Dados de estudo controlado.
 » Dados de pesquisa.
 » Dados coletados por meio de observação.
Em muitos estudos, o conjunto de dados de interesse já foi coletado e está disponível numa fonte 
publicada, tais como um livro, jornal, periódico ou site da internet. Por exemplo, você pode querer 
examinar e sintetizar as taxas de pessoas que possuem o 3º grau completo na região sudeste. 
Atenção
Se o nosso interesse está voltado para certa variável 
de um determinado grupo de elementos, esta pode 
ser classificada em:
 » Qualitativa, isto é, quando resulta de uma 
classificação por tipos ou atributos. Sendo assim, 
pode ser:
 › Nominal - como, por exemplo, sexo ou cor dos 
olhos;
 › Ordinal - como, por exemplo, classe social ou 
grau de instrução.
 » Quantitativa, isto é, quando os seus valores 
indicam quantidades. Dessa forma, a variável 
pode ser:
 › Discreta - quando seus possíveis valores 
formam um conjunto enumerável, finito ou 
infinito como, por exemplo, número de peças 
defeituosas, número de filhos ou números de 
carros;
 › Contínua - quando assume qualquer valor 
dentro de um intervalo de variação como, por 
exemplo, peso, altura, tempo ou renda.
15
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Esse conjunto de dados (assim como outros inúmeros dados relacionados à educação) pode ser 
encontrado no site do INEP que, por meio de pesquisas, publica anualmente esses resultados.
Um segundo método de coleta de dados envolve a condução de um estudo controlado, no qual 
o pesquisador exerce um estrito controle sobre as unidades sob estudo (pessoas, objetosou 
eventos). Por exemplo, um recente estudo médico investigou o poder preventivo da aspirina em 
ataques do coração. Médicos voluntários foram divididos em dois grupos – o grupo experimental 
e o grupo de controle. No grupo experimental, cada médico tomou uma drágea de aspirina por 
dia, durante um ano; enquanto que, no grupo de controle, os médicos, tomaram um placebo 
imitando uma drágea de aspirina. Os pesquisadores, não os médicos sob estudo, controlavam 
quem recebia a drágea de aspirina (tratamento) e quem recebia o placebo. A partir daí, são 
extraídas informações dos dados do que seria possível nesse estudo não controlado.
As pesquisas são a terceira fonte de dados. Com uma pesquisa, o pesquisador tira uma amostra 
de um grupo de pessoas e submete-as a uma entrevista, sendo feitas uma ou mais perguntas, 
registrando as respostas dadas. As pesquisas eleitorais, realizadas por institutos de pesquisas 
(como, por exemplo, o DATAFOLHA, o IBOBE e o GALLUP) são provavelmente as mais conhecidas.
Os estudos observacionais também podem ser empregados na coleta de dados. Em um estudo 
observacional, o pesquisador observa unidades experimentais em seu ambiente natural e registra 
a(s) variável(is) de interesse. Por exemplo, um psicólogo corporativo pode observar e registrar o 
comportamento “Tipo A” de uma amostra de trabalhadores da linha de montagem de uma fábrica.
Seja qual for o método adotado para a coleta de dados, provavelmente, os dados consistirão em 
uma amostra da população e, ao aplicá-los na estatística inferencial, torna-se imprescindível 
que essa amostra seja representativa. 
Definição 1.13
Uma amostra representativa exibe as características de uma população de interesse.
Por exemplo, considere a apuração de votos conduzida durante uma eleição presidencial. 
Suponha que se deseja estimar um percentual de todos os eleitores no Brasil em função de um 
determinado candidato. O instituto de pesquisa poderia cometer o erro de basear a sua estimativa 
sobre a coleta de dados de uma amostra de eleitores que pertencem ao “curral” eleitoral de um 
dos candidatos. Tais números certamente produziriam estimativas muito enviesadas.
Dessa forma, para satisfazer as exigências de uma amostra representativa deve-se selecionar uma 
amostra aleatória. Uma amostra aleatória assegura que cada subconjunto de dados de tamanho 
predeterminado numa população tenha a mesma chance de ser incluído na amostra.
16
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Definição 1.14
Uma amostra aleatória de n unidades experimentais será uma amostra selecionada da população, 
de forma que cada amostra de tamanho n tenha a mesma probabilidade de seleção.
EXERCÍCIO RESOLVIDO
Como se sentem os consumidores em relação às compras feitas pela internet? Para descobrir, uma 
empresa de software encomendou um estudo nacional a respeito da experiência do consumidor 
que envolveu 1980 brasileiros na idade adulta que tivessem feito uma transação on-line durante 
o último ano em websites de bancos, compras, viagens ou seguros. A conclusão foi publicada 
numa revista de negócios e revelou que 1600 entrevistados, ou 81%, aproximadamente, tiveram 
problemas técnicos com a transação on-line. Mais de um terço dos consumidores também 
procurou os sites concorrentes quando uma pequena falha na transação on-line ocorreu.
( A ) Identifique o método de coleta de dados.
( B ) Identifique a população-alvo.
( C ) As amostras de dados da população são representativas?
SOLUÇÃO
( A ) O método de coleta de dados é uma pesquisa: 1980 pessoas que completaram o 
questionário.
( B ) A população-alvo é composta por todos os consumidores que fizeram transações on-line.
( C ) Como os 1980 entrevistados claramente formam um subconjunto da população-alvo, 
eles compõem uma amostra. Se a amostra é ou não representativa, não se sabe, uma 
vez que a revista de negócios não apresentou informações detalhadas sobre como os 
1980 entrevistados foram selecionados.
O papel da estatística no gerenciamento da tomada de 
decisões
O crescimento na coleta de dados, associado ao fenômeno científico, às operações de negócios 
e às atividades governamentais (controle de qualidade, auditoria estatística, previsões), tem sido 
marcante nas últimas décadas. A cada dia, a mídia apresenta resultados e pesquisas políticas, 
econômicas e sociais. Na ênfase cada vez maior do governo a respeito das drogas e dos testes 
de produtos, por exemplo, testemunha-se a clara evidência da necessidade de ser capaz de 
avaliar os dados inteligentemente. Como consequência, cada um de nós tem desenvolvido um 
17
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
discernimento – uma habilidade de raciocínio para interpretar e entender o significado dos 
dados. Essa habilidade pode ajudar a fazer escolhas inteligentes, inferências e generalizações, 
isto é, ajudar a pensar criticamente, usando a estatística.
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística 
para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação 
na população e no processamento de dados.
Definição 1.15
O pensamento estatístico envolve a aplicação do pensamento racional e da ciência da estatística 
para avaliar criticamente dados e inferências. É fundamental para o processo que exista variação 
na população e no processamento de dados.
Gestores de sucesso confiam muito no uso do pensamento estatístico para ajudá-los a tomar 
decisões. O fluxograma a seguir, da figura 2, mostra o papel da estatística na tomada de decisão.
Figura 2 – O papel da estatística na tomada de decisão gerencial.
18
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Cada problema de tomada de decisão inicia-se no mundo real. Esse problema é, então, formulado 
em termos gerenciais e estruturado como uma questão gerencial. Os próximos passos (seguindo 
o fluxograma no sentido anti-horário) identificam os papéis que a estatística pode representar 
nesse processo. Os problemas gerenciais são traduzidos para problemas estatísticos, os dados 
da amostra são coletados e analisados, e a questão estatística é respondida. O próximo passo 
é usar a resposta para resolver o problema gerencial. A resposta para o problema gerencial 
pode sugerir uma reformulação do problema original, uma nova questão ou levar à solução do 
problema gerencial.
Recurso tecnológico
O excel como ferramenta auxiliar
Ao iniciar o Excel, você encontrará uma tela semelhante à da figura 3. Boa parte dessa tela 
compreende uma planilha – chamada pasta de trabalho do Excel – com colunas (denominadas 
A, B, C etc) representando variáveis e linha representando observações (ou casos). Na parte 
superior da tela do Excel está a barra de menu principal, com botões para diferentes funções e 
procedimentos disponíveis no Excel.
Figura 3 – Tela inicial do Excel.
19
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
como entrar com dados?
Primeiro, deve-se criar uma pasta de trabalho no Excel entrando com dados diretamente em linhas 
e colunas da planilha. A figura 4 apresenta dados registrados na 1a coluna (A). Opcionalmente, 
podem-se adicionar nomes para as variáveis (colunas) na primeira linha da pasta de trabalho.
Figura 4 – Entrada de dados.
como acessar dados de um arquivo?
Se os dados estão salvos em um arquivo externo, você pode acessá-los usando as opções disponíveis 
no Excel. Clique em “Personalizar barras de ferramentas de acesso rápido” como indica a figura 5. 
Figura 5 - Personalizar barras de ferramentas de acesso rápido.
20
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
Em seguida, aparecerá uma caixa de diálogo semelhante à apresentada na figura 6, selecione a 
opção “Abrir”.
Figura 6 – Selecionando a opção abrir.
A tela contendo a planilha do Excel terá incluído na sua barra de ferramentas o ícone marcado 
na figura 7.
Figura 7 – ícone abrir.
Apósclicar no ícone grifado na figura 7, aparecerá uma caixa de diálogo semelhante à da Figura 
8; em seguida, selecione o arquivo do Excel que deseja acessar e clique em “Abrir”.
21
PEnSAMEnTOS ESTATíSTIcOS • AulA 1
Figura 8 – Abrindo arquivo.
como imprimir planilha de dados no Excel?
Para imprimir dados da planilha do Excel, clique no ícone assinalado na figura 9.
Figura 9 – Impressão de uma planilha no Excel.
22
AulA 1 • PEnSAMEnTOS ESTATíSTIcOS
RESUMO
Vimos até agora:
 » O conceito de estatística.
 » Os tipos de aplicações da estatística: descritiva e inferencial.
 » Os quatro elementos dos problemas estatísticos descritivos: identificar a população ou 
amostra, identificar a(s) variável(is), coletar dados e descrever os dados.
 » Os cinco elementos dos problemas estatísticos inferenciais: identificar a população, 
identificar a(s) variável(is), coletar dados da amostra, inferir (deduzir) sobre a população 
baseando-se na amostra e medir a confiabilidade para fazer a inferência.
 » A caracterização dos tipos de dados: quantitativos (de natureza numérica) e qualitativos 
(de natureza categórica).
 » Os métodos de coleta de dados: observacional, fontes publicadas, pesquisa e plano 
experimental.
 » O papel da estatística no gerenciamento da tomada de decisões.
23
Apresentação
Esta aula apresenta como pode ser realizada a descrição de dados qualitativos e quantitativos 
de uma pesquisa estatística. A ênfase é dada aos métodos gráficos e a construção de tabelas.
Objetivos:
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Descrever dados qualitativos de uma pesquisa estatística.
 » Estabelecer métodos gráficos para descrever dados quantitativos.
 » Interpretar e utilizar dados apresentados graficamente.
 » Selecionar a maneira mais adequada para representar um conjunto de dados graficamente.
2
AulA
ORgAnIzAçãO E 
DEScRIçãO DE DADOS
24
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Preliminares
Suponha que se deseja avaliar a habilidade matemática de 400 estudantes de administração do 
AVM, com base nas notas do curso de Estatística. Sendo assim, a primeira questão a ser estudada 
é “Como podemos descrever essas 400 medições?”. Vale lembrar que as características do grupo 
de dados incluem o grau típico ou mais frequente obtido no componente curricular Estatística 
e incluem, ainda, a variabilidade dessas notas, as maiores e as menores notas, o formato dos 
dados e, também, se o grupo a ser estudado contém ou não dados com resultados não usuais.
Para fazer tal estudo, é necessário estabelecer um método formal a fim de restringir e caracterizar 
a informação obtida por meio da pesquisa realizada. Vale ressaltar que esses métodos também 
são essenciais para a inferência estatística. Muitas vezes, numa pesquisa estatística, a população 
corresponde a um grande grupo de dados. Daí se faz necessário utilizar um método para descrever 
uma amostra do grupo de dados pela qual sejamos capazes de fazer afirmativas descritivas 
(inferências) sobre a população da qual a amostra foi extraída.
Nesta aula, estudaremos o método gráfico para descrever um conjunto de dados. 
 Descrição de dados qualitativos
Iniciaremos nossos estudos a partir do seguinte exemplo:
Suponha que um determinado órgão consultor esteja interessado em investigar o perfil dos 
executivos brasileiros quanto ao seu grau de escolaridade, isto é: “A maior parte dos executivos 
é formada nos níveis mais altos de escolaridade?”.
Para responder a essa pergunta, a tabela a seguir fornece algumas informações a respeito dos 20 
executivos mais bem pagos do Brasil.
Tabela 2.1 – Os 20 executivos mais bem pagos do Brasil.
Executivo Empresa Salário (R$) Idade (Anos) Formação
Antonio Silva LSW 7 000 50 Doutorado
Ricardo Amaral capital 4 500 38 MBA
Felipe cunha MAS 4 450 45 MBA
Paulo Magalhães Atenas 4 000 42 Bacharelado
Maicon Alves Sigma 4 600 32 MBA
Antônio Serqueira Miragem 5 300 45 Mestrado
Anderson Figueiredo Alfa 4 500 51 MBA
Ronaldo Barbosa Empreendimentos 5 250 52 Mestrado
Pedro Firmino Moreti 7 000 49 Doutorado
25
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Executivo Empresa Salário (R$) Idade (Anos) Formação
cassio Ladeiras KWY 4 600 53 MBA
Renato Marchi Sensorial 4 550 42 MBA
Ronaldo Teixeira compacto 4 000 39 Bacharelado
Renato O. Rocha Trema 5 200 38 Mestrado
Bernardo Oliveira W System 5 200 38 Mestrado
Paulo S. Dantas Economic 4 600 40 MBA
Angelo Rosas Ponto 4 800 35 Bacharelado
José carlos Toll Rossi 4 600 42 MBA
Fabio coutinho contato 4 500 50 MBA
Ricardo Santos grupo RSA 5 200 28 Mestrado
Daniel Dutra cardmaster 4 800 32 MBA
Nesse estudo, a variável de interesse, mais alto nível de formação escolar, é qualitativa. Dessa 
forma, o valor de uma variável qualitativa só pode ser classificado em categorias denominadas 
classes. A tabela indica os possíveis tipos de formação, ou seja, Bacharelado, MBA, Mestrado 
ou Doutorado. Portanto, esses representam as classes para a variável qualitativa a ser estudada. 
Esses dados podem ser resumidos numericamente de duas formas: 
 » Calculando a frequência de classe;
 » Calculando a frequência relativa de classe.
Definição 2.1
Chama-se classe a categoria dentro da qual dados qualitativos podem ser classificados.
Definição 2.2
Chama-se frequência simples de classe ou frequência absoluta de classe, denotada por , o número 
de ocorrências no grupo de dados entrando em uma classe particular.
Definição 2.3
Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de 
observações de uma classe pelo total de observações no grupo de dados.
Definição 2.4
Chama-se porcentagem de classe o produto da frequência relativa por 100.
A partir da tabela 2.1, pode-se obter uma nova tabela denominada tabela de frequências. Isto 
é, podem-se definir 4 classes que estão relacionadas a formação dos 20 executivos mais bem 
26
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
pagos do Brasil. Observa-se que há 3 executivos que têm apenas o Bacharelado, 10 executivos 
que possuem curso de MBA, 5 mestres e 2 doutores. Os números 3, 10, 5 e 2 representam as 
frequências de classes para as 4 classes definidas. Sendo assim, podem-se obter as frequências 
relativas de cada classe, ou seja:
Bacharelados: 
=
3 0,15
20
MBA: 
=
10 0,50
20
Mestrado: 
=
5 0,25
20
Doutorado: 
=
5 0,25
20
A tabela a seguir ilustra uma tabela de distribuição de frequências da tabela 2.1.
Tabela 2.2 – Distribuição de frequências.
Classes Frequência absoluta
Frequência 
relativa Porcentagem
Bacharelado 3 0,15 15%
MBA 10 0,50 50%
Mestrado 5 0,25 25%
Doutorado 2 0,10 10%
Total 20 1,00 100%
A tabela 2.2 permite auxiliar a descrição dos dados em questão por meio de uma representação 
gráfica. Os métodos gráficos mais usados para descrever dados qualitativos são o gráfico de 
barras e o gráfico de pizza. Abaixo segue cada uma dessas representações.
Figura 2.1 – Gráfico de barras (Escolaridade dos 20 executivos mais bem pagos do Brasil).
27
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Figura 2.3 – Gráfico de pizza (Escolaridade dos 20 executivos mais bem pagos do Brasil).
No gráfico de barras (figura 2.2), a altura de cada retângulo, ou “barra”, sobre cada classe é 
igual à frequência de classe. O gráfico de pizza (figura 2.3) apresenta as frequências relativas 
(expressa em porcentagens) dos 4 tipos de escolaridade. Esse gráfico corresponde a um círculo 
(com circunferência de 360º). O tamanho de cada (ângulo), “fatia” atribuída a cada classe, é 
proporcional à frequência relativa da classe. Por exemplo, a fatia atribuída à escolaridade MBA 
é de 50% de 360º, isto é, 180º.
Chama-se diagrama de Pareto o gráfico de barras com as categorias (classes) da variávelqualitativa 
(isto é, as barras) organizado por altura em ordem descendente da esquerda para a direita.
A figura 2.4 apresenta o diagrama de Pareto relacionado à tabela 2.2 de distribuição de frequências.
Figura 2.4 – Diagrama de Pareto (Escolaridade dos 20 executivos mais bem pagos do Brasil).
28
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Descrição de dados quantitativos
Considere a distribuição das alturas de 50 alunos de uma turma do curso de administração do 
IAVM.
1,75 1,68 1,57 1,82 1,76 1,71 1,70 1,74 1,58 1,57
1,67 1,64 1,69 1,56 1,59 1,93 1,50 1,74 1,72 1,88
1,84 1,78 1,67 1,69 1,76 1,67 1,76 1,74 1,81 1,88
1,93 1,68 1,59 1,73 1,82 1,82 1,69 1,67 1,74 1,71
1,58 1,64 1,65 1,68 1,74 1,62 1,69 1,81 1,77 1,76
Pode-se, a partir dos dados brutos acima, construir 
uma tabela de frequências e, para isso, basta 
realizar os seguintes passos:
Passo 1: definir o número de classes 
Pode-se, normalmente, definir tal número utilizando-se uma das seguintes regras:
 » Regra de Sturges: 1 3,3= +i logN
 » Regra do quadrado: =i N
onde é o número de dados. 
Saiba mais
Notação para intervalos de classe
Considere os extremos a e b de um intervalo, então:
a b: intervalo fechado à esquerda e aberto à direita. Inclui o limite inferior a e exclui o limite superior b;
a b: intervalo aberto à esquerda e fechado à direita. Exclui o limite inferior a e inclui o limite superior b;
a b: intervalo fechado à esquerda e à direita. Inclui os dois extremos;
a – b: intervalo aberto à esquerda e à direita. Exclui os dois limites a e b.
Passo 2: calcular a amplitude da amostra (A)
A amplitude da amostra é obtida fazendo a diferença 
entre o seu maior e o seu menor elemento quando 
feito o rol do conjunto.
:: Dados brutos:
Chamam-se dados brutos os resultados das variáveis 
dispostos aleatoriamente, isto é, sem nenhuma ordem 
de grandeza crescente ou decrescente. 
:: Rol:
Chama-se rol a ordenação dos dados brutos, de um 
modo crescente ou decrescente. 
29
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Passo 3: Calcular a amplitude do intervalo de classe (h)
A amplitude de um intervalo de classe deve ser sempre maior que o quociente entre a amplitude 
da amostra e o número de classes de uma distribuição de frequências. Isto é:
>
Ah
i
Passo 4: Escolher os limites de classe
Os limites de classe devem ser, sempre que possível, números inteiros.
Passo 5: Construir a tabela de frequências.
Para a distribuição das alturas dos 50 alunos do curso de administração do IAVM, podem-se 
estabelecer 5 classes de amplitude igual a 0,10. Sendo assim, obtém-se a seguinte tabela de 
frequências:
Tabela 2.3 – Distribuição de frequências das alturas de 50 alunos do IAVM.
Alturas (em metros) Frequência absoluta
1,50 |- 1,60 8
1,60 |- 1,70 15
1,70 |- 1,80 17
1,80 |- 1,90 8
1,90 |-| 2,00 2
Total 50
A organização dos dados brutos por classes, junto com as frequências correspondentes, é chamada 
de Distribuição de Frequências.
No caso de dados quantitativos percebe-se que as definições 2.5, 2.6, 2.7 e 2.8, a seguir, são 
análogas às definições 2.1, 2.2, 2.3 e 2.4 respectivamente.
Definição 2.5
Chama-se classe a categoria dentro da qual dados quantitativos podem ser classificados.
Definição 2.6
Chama-se frequência simples de classe ou frequência absoluta de classe o número de elementos 
de dados entrando em uma classe particular.
Definição 2.7
Chama-se frequência relativa de classe o quociente obtido pela divisão do número total de 
observações de uma classe pelo total de observações no grupo de dados.
30
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Definição 2.8
Chama-se porcentagem de classe o produto da frequência relativa por 100.
A partir da tabela 2.3, aplicando as definições 2.7 e 2.8, podem-se obter os seguintes resultados 
expostos na tabela 2.4 a seguir.
Alturas (em metros) Frequência absoluta Frequência relativa Porcentagem
1,50 |- 1,60 8 0,16 16%
1,60 |- 1,70 15 0,30 30%
1,70 |- 1,80 17 0,34 34%
1,80 |- 1,90 8 0,16 16%
1,90 |-| 2,00 2 0,04 4%
Total 50 1,00 100%
Tabela 2.4 – Distribuição das frequências absoluta, relativa e das porcentagens das alturas de 50 
alunos do IAVM.
Definição 2.9
Chama-se intervalo de classe o conjunto de números que constitui o intervalo.
Definição 2.10
Chama-se limite de classe os extremos de uma classe. Denota-se por l o limite inferior da classe 
e por L o limite superior da classe.
Definição 2.11
Chama-se ponto médio de uma classe o ponto que divide o intervalo de classe em partes iguais. 
Daí, denotando o ponto médio de uma classe por PM, tem-se:
2
+
=
L lPM
Observação 2.1
O ponto médio de um intervalo de classe é o seu legítimo representativo. Os pontos médios de uma 
distribuição de frequência estão em progressão aritmética, isto é, a diferença entre eles é constante.
Definição 2.12
Chama-se amplitude de um intervalo de classe a medida do intervalo que define a classe. 
Denotando por h a amplitude do intervalo de classe, tem-se que:
= −h L l
31
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Definição 2.13
Chama-se amplitude total da distribuição a diferença entre o limite superior da última classe 
(limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo).
Os conjuntos de dados quantitativos são definidos como conjuntos de dados em uma escala 
numérica com significados. Para resumir e detectar padrões desses dados, podem-se usar 
métodos gráficos para a descrição dos mesmos. Geralmente, é mais comum representar dados 
em gráficos dispostos em duas dimensões como, por exemplo, gráficos de pontos, gráfico de 
ramos e folhas e histogramas.
Gráfico de pontos e gráfico de ramos e folhas
No gráfico de pontos, o valor numérico de cada medição quantitativa do conjunto de dados é 
representado por um ponto em uma escala horizontal. Quando os valores se repetem, os pontos 
são posicionados um sobre o outro verticalmente.
Outro tipo de representação gráfica é o gráfico de ramos e folhas. Neste gráfico, o valor numérico 
da variável quantitativa é particionado em um “ramo” e uma “folha”. Os galhos possíveis estão 
listados em ordem, em uma coluna. A folha para cada medição quantitativa no conjunto de 
dados está posicionada no ramo da linha correspondente. Folhas para observações no mesmo 
ramo de valor são listadas em ordem crescente, horizontalmente.
Exemplo 2.1 (Adaptado de MC CLVE, 2009 pp. 42 – 43)
Suponha que uma analista financeira esteja interessada no montante de recursos gastos por 
empresas de hardware e software em pesquisa e desenvolvimento (P&D). Ela obtém uma 
amostra de 20 firmas de tecnologia e calcula o total que cada uma gastou no último ano como 
uma porcentagem de sua receita total. A tabela 2.5 apresenta os resultados encontrados pela 
analista financeira.
Tabela 2.5 – Porcentagem de receitas gastas em pesquisa e desenvolvimento.
Empresa Porcentagem(%) Empresa Porcentagem(%)
1 6,2 11 4,2
2 8,3 12 7,1
3 6,2 13 6,2
4 6,2 14 7,1
5 4,2 15 13,1
6 10,1 16 10,2
7 6,7 17 6,2
8 7,8 18 4,1
9 9,2 19 7,8
10 6,2 20 7,1
32
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Vale lembrar que como as medidas numéricas feitas sobre a amostra de 20 unidades (as firmas), 
essas porcentagens representam dados quantitativos. O objetivo da analista é resumir e descrever 
esses dados de forma a extrair informações relevantes. No gráfico de pontos (Figura 2.5) para 
as 20 porcentagens P&D, o eixo horizontal da figura é uma escala para a variável quantitativa, 
percentual. O valor numérico da cada medida do grupo de dados está localizado na escala 
horizontal por um ponto. Quando os valores se repetem, os pontos são colocados um sobre o 
outro, formando uma pilha naquela localização numérica.
Figura 2.5 – Gráfico de pontos para as20 porcentagens de P&D.
A partir da tabela 2.5, pode-se obter o seguinte gráfico de ramo e folhas da figura 2.6.
Figura 2.6 – Gráfico de ramo e folhas para as 20 porcentagens de P&D.
Gráfico de Ramo e folhas para 20 porcentagens de P&D
4 1 2
6 2 2 2 2 2 2 7
7 1 1 1 8 8
8 3
9 2
10 1 2
Histogramas
Os histogramas podem ser usados para mostrar tanto a frequência absoluta quanto a frequência 
relativa das medidas em cada intervalo de classes. No histograma, os valores numéricos da variável 
quantitativa estão divididos em intervalos de classe de mesma largura. Esses intervalos formam 
a escala do eixo horizontal. A frequência absoluta ou relativa das observações em cada intervalo 
de classe é determinada por uma barra vertical posicionada sobre cada intervalo de classe, cuja 
altura corresponde à frequência absoluta ou relativa do intervalo de classe em questão.
33
ORgAnIzAçãO E DEScRIçãO DE DADOS • AulA 2
Ao interpretar um histograma, devem-se considerar dois importantes fatores. O primeiro é a 
porção da área total abaixo do histograma que fica sobre um intervalo particular do eixo horizontal 
que é igual à frequência relativa de medidas no intervalo. O segundo é que se pode imaginar a 
aparência do histograma da frequência relativa para um conjunto de dados muito grande (uma 
população).
Exemplo 2.2
Considere a variável X = idade, em anos, de um grupo de empregados com 30 anos ou mais, do 
setor de vendas de uma empresa.
Tabela 2.6 - Idade, em anos, de um grupo de empregados do setor de vendas de uma empresa.
35 42 33 59 63 31 55 42 77
54 66 44 41 33 39 48 41 31
65 70 36 40 40 52 62 39 37
74 50 58 62 31 34 42 33 35
Note que, nesse grupo de 36 pessoas, a pessoa mais jovem tem 31 anos, enquanto a mais velha 
possui 77 anos, ou seja, a amplitude dos dados é 77 – 31 = 46 anos. Usando a regra do quadrado, 
segue que o número de classes = =36 6i . O número de classes i deve ser maior que 6, sendo 
assim, a cada classe deve ser dada a amplitude 46 : 6 ≅ 8 anos. A tabela 2.7 a seguir apresenta a 
distribuição de frequências da variável X.
Tabela 2.7 – Distribuição das idades, em anos, de um grupo de empregados do setor de 
vendas de uma empresa.
Idade (em anos) Frequência absoluta Frequência relativa Porcentagem
30 |- 38 7 0,22 22%
38 |- 46 9 0,28 28%
46 |- 54 3 0,09 9%
54 |- 62 5 0,16 16%
62 |- 70 5 0,16 16%
70 |-| 78 3 0,09 9%
Total 32 1,00 100%
A partir da tabela 2.7, obtém-se o histograma representativo da distribuição de frequências em 
questão, como pode ser observado na figura 2.7.
34
AulA 2 • ORgAnIzAçãO E DEScRIçãO DE DADOS
Figura 2.7 – Histograma da distribuição das idades, em anos, de um grupo de empregados 
do setor de vendas de uma empresa.
Observação 2.2 
Enquanto os histogramas proporcionam uma melhor descrição visual dos grupos de dados 
(particularmente grupos muito grandes), eles não permitem identificar medidas individuais. Mas 
cada uma das medidas originais é visível de alguma forma em um gráfico de pontos e claramente 
visíveis em um gráfico de ramo e folhas.
Resumo
Vimos até agora:
 » Como descrever dados qualitativos, isto é, identificar classes de categorias, determinar 
as frequências absoluta e relativas das classes e representar tais frequências em gráficos 
de barras, de pizza e de Pareto;
 » Como descrever dados quantitativos, isto é, identificar classes de categorias, determinar 
as frequências absoluta e relativas das classes e a representar tais frequências em gráficos 
de pontos, de ramos e folhas e em histogramas;
35
Apresentação 
Esta aula apresenta conceitos e métodos para se obter medidas de tendência centrais e medidas 
de variabilidade, bem como critérios para interpretar o significado dessas medidas.
Objetivos
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Calcular e interpretar medidas de tendência central.
 » Calcular e interpretar medidas numéricas de variabilidade.
 » Calcular e interpretar medidas numéricas de posicionamento relativo.
3
AulA
MEDIDAS DE TEnDêncIA cEnTRAL E 
MEDIDAS DE vARIABILIDADE
36
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Medidas numéricas de tendência central
Nesta secção, o objetivo é apresentar medidas numéricas descritivas da amostra a fim de fazer 
inferências sobre medições correspondentes da população. Existem muitos métodos numéricos 
para descrever conjuntos de dados quantitativos. A maior parte deles mede uma de duas 
características:
A tendência central do conjunto de medições, isto é, a tendência dos dados observados se 
agruparem em torno de valores centrais.
A variabilidade do conjunto de medições, isto é, a dispersão dos dados.
Média aritmética
DEFInIçãO 2.14
A média aritmética de um conjunto de dados quantitativos é a soma das medições dividida pelo 
número de medições contadas no conjunto de dados. Notação: x .
Isto é:
1== ∑
n
ii
x
x
n
Exemplo 2.3
A venda diária de certo produto alimentício, durante uma semana, foi de 12, 14, 15, 13, 18 e 12 
quilos. Portanto, a venda média diária na semana é dada por:
12 14 15 13 18 12 14quilos
6
+ + + + +
= =x 
Definição 2.15
Chama-se desvio em relação à média, denotado por di , a diferença entre cada elemento de um 
conjunto de valores e a média aritmética, isto é:
= −i id x x
onde xi é o i-ésimo valor elemento do conjunto. 
37
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
como calcular a média de dados agrupados
CASO 1: Sem intervalos de classe (por pontos)
Basta usar a seguinte caracterização:
= ∑ i ix fx
n
Exemplo 2.4
Considere a distribuição relativa de 30 famílias de 4 filhos, tomando por variável o número de 
filhos do sexo masculino, apresentada na tabela 2.8 abaixo.
Tabela 2.8 - Distribuição relativa de 30 famílias de 4 filhos.
Número de pessoas Frequência (fi)
0 2
1 6
2 8
3 10
4 4
Total n = 30
Portanto, segue que:
0 2 1 6 2 8 3 12 4 4 74 2,46 meninospor família
30 30
⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = ≅x
CASO 2: Com intervalos de classe (por classe)
Basta considerar todos os valores incluídos num intervalo de classe coincidir com o seu ponto 
médio e, assim, determinar a média ponderada por meio da fórmula:
= ∑ i iPM fx
n
Exemplo 2.5
A partir da tabela 2.7 (página 50), de distribuição das idades, em anos, de um grupo de empregados 
do setor de vendas de uma empresa obtém-se como idade média:
⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅
= = =
34 7 42 9 50 3 58 5 66 5 74 3 1608 50,25
32 32
x
Além da média aritmética temos também outros tipos de média como a média geométrica e a 
média harmônica. Para maiores detalhes ver GONZÁLEZ, N. 2008.
38
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Mediana
Definição 2.19
Chama-se mediana de um conjunto de dados quantitativos 
o número do “meio” quando as medidas são organizadas em 
ordem ascendente (ou decrescente). Notação: .
No cálculo da mediana, primeiramente devem-se organizar 
as n medições dadas da menor para a maior. Se n é ímpar, 
então, a mediana é o número do meio. Se n é par, então, a 
mediana é a média aritmética entre dois números.
Exemplo 2.9
Considere os seguintes dados: 13, 15, 6, 7, 17, 23, 25, 8, 10.
Para obter a mediana, primeiramente, se organiza os dados em um rol: 
6, 7, 8, 10, 13, 15, 17, 23, 25
Como o número de dados é ímpar, segue que a mediana é o valor central obtido a partir do rol 
acima, isto é: me = 13.
Exemplo 2.10
Considere os seguintes dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6.
Organizando esses dados num rol, obtém-se:
0, 0, 1, 1, 2, 3, 3, 4, 5, 6
Sendo par o número de dados, segue que a mediana é a média 
aritmética dos dois valores centrais, isto é:
2 3 2,5
2
+
= =em
como calcular a mediana de dados agrupados
CASO 1: sem intervalosde classe (por ponto)
Neste CASO, obtém-se a frequência acumulada imediatamente superior à metade da soma das 
frequências. A mediana será o valor que corresponde a tal frequência acumulada.
Saiba mais
A frequência absoluta acumulada (fac) 
indica o número inferior ao limite 
superior da classe. Sendo assim a soma 
da frequência absoluta de uma classe 
com as frequências absolutas de todas as 
classes anteriores. 
Saiba mais
A frequênci a relativa acumulada (Fac) 
indica a porcentagem inferior ao limite 
superior da classe. Isto é, a soma da 
frequência relativa de uma classe com as 
frequências relativas de todas as classes 
anteriores. 
39
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
 » Se o somatório das frequências for um número ímpar então o valor mediano será o 
termo de ordem dado pelo quociente:
1
2
+∑ if
 » Se o somatório das frequências for par, o valor mediano será o termo de ordem dado 
pelo quociente:
( ) ( )/2 /2 1
2
+ +∑ ∑i if f
CASO 2: com intervalos de classe
Neste caso, basta seguir os seguintes passos:
Passo 1: determinar a frequência simples acumulada crescente;
Passo 2: Calcular 2
∑ if
Passo 3: Marcar a classe correspondente à frequência simples acumulada crescente, imediatamente, 
superior a 2
∑ if . Tal classe será a classe mediana.
Passo 4: Calcular a mediana usando a fórmula:
2 −= +
ant
e cme cme
icme
n f
m l h
f
em que:
lcme = limite inferior da classe mediana
fant = frequência simples acumulada crescente da classe anterior à classe mediana
ficine = frequência simples da classe mediana
hcme = amplitude do intervalo da classe mediana
Exemplo 2.11
Considere a distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso 
apresentada na tabela 8 abaixo.
Tabela 2.11 - Distribuição das idades, em anos, de um grupo de pessoas de uma clínica de repouso.
Classes Frequência (fi) Frequência acumulada
50 54 4 4
54 58 9 13
40
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Classes Frequência (fi) Frequência acumulada
58 62 11 24
62 66 8 32
68 70 5 37
70 74 6 40
Total 43
Segue que:
43 21,5
2 2
= =∑ if
Logo, a classe mediana será a 3ª classe da distribuição.
Portanto:
−
= + ⋅ =
43 9258 4 62,54
11e
m
Moda
Definição 2.20
Chama-se moda a medição que ocorre com mais frequência no conjunto de dados. Notação: m0
Em dados não agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, 
procurar o valor que mais se repete de preferência após ter organizado os dados em um rol.
como obter a moda de dados agrupados
CASO 1: sem intervalos de classe
Neste caso, basta identificar o valor da variável com maior frequência.
CASO 2: com intervalos de classe
A classe que apresenta a maior frequência é denominada classe modal. A moda, neste caso, é o 
valor dominante que está compreendido entre os limites da classe modal. O método mais simples 
para o cálculo da moda consiste em tomar o ponto médio da classe modal, isto é:
2
+
=o
l Lm
41
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Onde é o limite inferior da classe modal e o limite superior da classe modal.
Exemplo 2.12
A tabela 2.12, a seguir, indica as temperaturas de certa cidade da América do Norte durante um 
mês de inverno.
Tabela 2.12 – Temperaturas de uma cidade da América do norte.
Temperaturas Frequências
0ºc 4
1ºc 9
2ºc 14
3ºc 5
4ºc 4
Segue que 2ºC é a temperatura modal, pois é a de maior frequência.
Exemplo 2.13
Considere a tabela 2.7 de frequências apresentada no exemplo 2.2. A 2ª classe é a classe modal, 
pois é a de maior frequência. Portanto, a idade modal é dada por: 
38 46 48
2
+
= =om
Medidas separatrizes
São medidas ligadas à mediana, isto é, ligadas a sua característica de separar uma série em duas 
partes, que apresentam o mesmo número de valores. Essas medidas são os quartis, os decis, os 
centis (percentis) que juntamente com a mediana são conhecidas como medidas separatrizes.
Os Quartis, por exemplo, são valores que dividem a distribuição em quatro partes, ou seja, a 
partir da ordenação dos dados, define-se:
1o Quartil: o valor que deixa 25% dos dados abaixo dele e 75% dos dados acima dele.
2o Quartil: o valor que deixa 50% dos dados abaixo dele e 50% dos dados acima dele, ou seja, é 
a mediana.
3o Quartil: o valor que deixa 75% dos dados abaixo dele e 25% dos dados acima dele.
Exemplo 2.14
Considere os seguintes dados: 5, 3, 7, 8, 11, 14, 16.
42
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Organizando os dados num rol, obtém-se:
3, 5, 7, 8, 11, 14, 16
Daí, temos que: Q2 = me = 8
A mediana divide a série acima em duas partes com a mesma quantidade de dados: 3, 5, 7 e 11, 
14, 16. Para o cálculo do 1º e do 3º quartil, basta determinar, respectivamente, as medianas de 
cada um dos grupos determinados, isto é: Q1 = 5 e Q3 = 14.
Para maiores detalhes de como obter quartis, decis, percentis de dados agrupados em classes 
ver WALPOLE, R. E. et al 2008.
Medidas numéricas de variabilidade
As medidas numéricas de variabilidade ou medidas de dispersão quantificam a variabilidade 
dos dados. Conhecer a variabilidade dos dados, juntamente com seu centro, pode ser útil para 
visualizar o formato do conjunto de dados em questão, assim como os seus valores externos. 
Como exemplo de medidas de dispersão, tem-se a amplitude, a variância e o desvio padrão.
Amplitude
Definição 2.21
Chama-se amplitude de um conjunto de dados quantitativos a diferença entre a maior e a menor 
medição.
Vale lembrar que a amplitude é de fácil cálculo e compreensão, mas é uma medida não muito 
apropriada de variação de dados quando os conjuntos de dados são muito grandes. Isto porque 
dois conjuntos de dados podem ter a mesma amplitude, mas serem diferentes no que diz respeito 
à variação dos dados.
variância
Definição 2.22
A variância, indicada por s2, representa a variabilidade em torno da média da variável, ou seja, 
consideram-se as diferenças −ix x e calcula-se a média dos quadrados dessas diferenças:
( )22 1= −= ∑
n
ii
x x
s
n
43
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Se os dados representam uma amostra (e não toda a população), a expressão acima deve ser 
usada colocando-se (n – 1) no denominador, ou seja:
( )22 1
1
=
−
=
−
∑
n
ii
x x
s
n
Desvio padrão
Definição 2.23
Chama-se desvio padrão e indica-se por s, a raiz quadrada da variância.
Observação 2.3
Quando os dados estão em tabelas de classes de frequências, os valores das medidas de dispersão 
podem ser obtidos por meio de um valor aproximado, se considerarmos que cada classe de 
frequência pode ser representada pelo seu ponto médio. Neste caso, a variância e o desvio padrão 
são obtidos, respectivamente, pelas seguintes fórmulas:
( )22
2
1
−
=
−
∑∑ i ii i
x f
x f
ns
n
 e 
( )22
1
−
=
−
∑∑ i ii i
x f
x f
ns
n
Observação 2.4
Uma pequena dispersão absoluta dos dados pode ser considerável quando comparada à ordem 
de grandeza dos valores da variável. Para perceber o tamanho da dispersão dos dados, define-se 
o coeficiente de variação (CV):
=
sCV
x
Observação 2.5
Chama-se medida de assimetria a medida usada para quantificar a assimetria da distribuição 
de um conjunto de dados. Pearson definiu um coeficiente, denotado por A, dado por:
−
= o
x mA
s
 » Se 0,15<A , considera-se a distribuição simétrica;
 » Se 0,15 1≤ ≤A , considera-se a distribuição moderadamente simétrica;
 » Se 0,15 1≤ ≤A , considera-se a distribuição fortemente simétrica.
44
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
EXERCÍCIO RESOLVIDO
SejaX = número de defeitos por peça produzida em um lote de 16 peças, representadas pelos 
valores abaixo:
1 1 3 1 2 2 2 2 0 0 0 0 0 1 0 2
( A ) Construa a tabela de frequências.
( B ) Construa um histograma representativo da distribuição de frequências.
( C ) Calcule a média, a mediana e a moda da distribuição.
( D ) Encontre a variância e o desvio padrão da distribuição.
( E ) Determine o coeficiente de variação e a medida de assimetria.
SOLUÇÃO
A)
Número de 
defeitos por 
peça (xi)
Frequência 
absoluta (fi)
Frequência 
absoluta 
acumulada 
(fac)
Frequência 
relativa (Fi)
Frequência 
relativa 
acumulada 
(Fac)
Porcentagem 
(%)
0 6 6 0,3750 0,3750 37,50
1 4 10 0,2500 0,6250 25,00
2 5 15 0,3125 0,9375 31,25
3 1 16 0,0625 1,0000 6,25
Total 16 1,0000 100
B)
45
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
C)
0 6 1 4 2 5 3 1 17 1,0625
16 16
× + × + × + ×
= == = =∑ i ix fx
n
Como n = 16, a mediana é o valor que ocorre entre a 8ª e a 9ª posições. Portanto, me = 1.
A moda é o valor de maior frequência, isto é, mo = 0.
D)
( )2 22
2
1733 16 0,9958
1 15
− −
= = ≅
−
∑∑ i ii i
x f
x f
ns
n
VARIÂNCIA
0,9958 0,9978= ≅s
DESVIO PADRÃO
E)
0,9978 0,9391 93,91
1,0625
= ≅ =CV %
1,0625 0 1,0648
0,9978
−
= ≅A
DISTRIBUIÇÃO FORTEMENTE SIMÉTRICA
Distorção da realidade
Muitas vezes, a Estatística descritiva pode servir como instrumento de distorção, mesmo que não 
intencionalmente ou como resultado de práticas estatísticas não éticas. Dessa forma, é preciso 
tomar certos cuidados ao observar e ao interpretar um gráfico ou uma medida descritiva numérica.
Distorções gráficas
Os gráficos geram impressões a respeito de dados representados. Essas impressões podem ser 
alteradas, por exemplo, quando se altera a escala de um dos eixos do gráfico. Observe o gráfico 
da figura 2.8 abaixo:
46
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Figura 2.8 – Participação moderada da empresa S&A no mercado de vendas.
A escala escolhida para o eixo horizontal e eixo vertical indica, visualmente, uma participação 
moderada no mercado de vendas da empresa S&A. Os mesmos dados podem ser usados e 
representados de forma a causar uma nova impressão visual sobre a participação da empresa 
S&A no mercado de vendas. Ou seja, aumentando a distância entre as unidades sucessivas do 
eixo vertical e diminuindo as distâncias entre os anos indicados, obtém-se a representação 
contida na figura 2.9 a seguir:
Figura 2.9 – Participação crescente da empresa S&A no mercado de vendas.
A distorção visual também pode ser percebida quando se faz a largura das barras proporcional 
à altura. Algumas vezes, não se faz necessário manipular os gráficos para distorcer a impressão 
que ele cria. Modificar a descrição verbal que acompanha o gráfico pode mudar a impressão 
que será feita pelo leitor. Observe a figura 2.10.
47
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Figura 2.10 – Mudando a descrição verbal para mudar a interpretação do leitor.
Para a produção, não precisamos nem mudar o gráfico, 
simplesmente muda-se o título para indicar uma má performace.
 
Para o público em geral, dizemos que ainda estamos nos 
1ºs anos.
Estatísticas descritivas numéricas enganosas
As informações de um conjunto de dados também podem ser distorcidas usando-se medidas 
descritivas numéricas. Ou seja:
Exemplo 2.15
Uma pequena empresa de advocacia possui um membro sênior e três membros juniores. Paulo 
interessado em trabalhar nesta empresa pergunta: “Que salário se deve esperar, caso eu venha 
trabalhar para essa empresa?”
Ele recebe duas respostas:
Resposta A: o membro sênior diz que um “trabalhador médio” ganha R$ 87.500,00 anualmente.
Resposta B: um dos membros Junior depois diz que um “trabalhador médio” ganha R$ 75.000,00 
anualmente.
Em qual resposta Paulo deve acreditar?
A confusão existe porque não está claro o significado da expressão “trabalhador médio”. Suponha 
que os quatro salários pagos sejam: R$ 75.000,00 anuais, para cada um dos três membros Junior 
e R$ 125.000,00 anual, para o membro sênior. Então:
⋅ +
= =
3 75000 125000 87500
4
 x 
me = 75.000
48
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Dessa forma, percebe-se que o membro sênior reportou-se à média dos quatro salários, enquanto 
que o membro júnior, à mediana. As duas informações dadas foram distorcidas, pois nenhum 
dos dois membros definiu qual medida de tendência central estava sendo usada. Vale lembrar 
que neste caso a mediana é a medida que melhor descreve o salário do “trabalhador médio”.
Outro tipo de distorção de uma informação em uma amostra ocorre quando apenas uma medida 
de tendência central é reportada. Medidas de tendência central e de variabilidade devem ser 
mencionadas a fim de se obter uma imagem mental precisa de um conjunto de dados.
Exemplo 2.16
Ana deseja comprar um carro novo e está em dúvida entre dois modelos. Como combustível e 
economia são ambos assuntos importantes, Ana escolhe o modelo A, pois a relação km/l é de 
13,6 Km/l rodados: para o modelo B, no entanto, a relação é de apenas 12,7 Km/l. Será que Ana 
fez uma boa escolha?
Neste caso, faltou verificar quanta variabilidade está associada às relações. Por exemplo, suponha 
que numa avaliação mais aprofundada revele que o desvio padrão para o modelo A é de 2,12 
Km/l, e para o modelo B é de apenas 0,42 Km/l. Assim, existe uma maior variabilidade associada 
ao modelo A, o que implica um maior risco na compra desse modelo. Isto é, o modelo A está 
mais propenso a ter uma relação que difere muito de 13,6 Km/l.
Recurso tecnológico
Gráficos no excel
Para fazer gráficos de dados de uma única variável no Excel, primeiramente digite a tabela de 
frequências (como ilustração faremos a representação dos dados do exemplo 2.10). Então:
49
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
Em seguida, selecione o menu inserir:
Então, teremos a seguinte tela:
Selecione na barra de ferramentas o tipo de gráfico que deseja obter, por exemplo, gráfico de 
colunas:
50
AulA 3 • MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE
Com isso você poderá escolher um dos modelos listados (a título de ilustração será escolhido o 
modelo marcado abaixo):
51
MEDIDAS DE TEnDêncIA cEnTRAL E MEDIDAS DE vARIABILIDADE • AulA 3
 clicar no modelo, o gráfico é gerado. Selecionando a opção layout do gráfico, você pode personalizar 
o gráfico de acordo com os padrões apresentados, a aparência pode ser alterada ao escolher no 
menu estilos de gráficos um modelo proposto.
RESUMO
Vimos até agora:
 » Como calcular medidas de tendência central como a média, a mediana e a moda.
 » Como calcular medidas de variabilidade como a amplitude, a variância e o desvio padrão.
 » Como determinar o coeficiente de variação de uma distribuição, bem como determinar 
a medida de assimetria das mesmas. 
52
Apresentação
Esta aula apresenta métodos e conceitos combinatórios, que consistem no estudo de situações 
em que a contagem se reduz, a saber, a quantas maneiras um determinado grupo de objetos 
pode ser escolhido, sem e com repetições em relação à ordem em que são selecionados. Tais 
situações envolvem o desenvolvimento de competências como o planejamento de estratégias 
na resolução de problemas, a divisão de problemas em casos, a análise envolvendo números 
pequenos levando à generalização e a crítica dos resultados obtidos. Essas técnicas, muitas vezes, 
serão aplicadas em outros tipos de situações-problema, cujo objetivo é investigar qual é a chance 
de um evento ocorrer, isto é, obter um número que indica a frequência relativa de ocorrência de 
um evento. Obteras chances de um determinado evento ocorrer permite, racionalmente, tomar 
decisões prevendo eventos futuros.
Objetivos:
Esperamos que, após o estudo do conteúdo desta aula, você seja capaz de:
 » Resolver problemas de contagem utilizando listagens, diagrama de árvores e/ou o 
princípio multiplicativo.
 » Resolver problemas que envolvam o cálculo do número de elementos da união de 
conjuntos.
 » Identificar em situações-problema agrupamentos associados a conjuntos e sequências.
 » Reconhecer situações em que os agrupamentos são distinguíveis pela ordem de seus 
elementos ou não e resolver problemas que envolvam arranjos, combinações e/ou 
permutações simples, com elementos repetidos e circulares.
 » Reconhecer o caráter aleatório de variáveis em situações-problema e identificar o espaço 
amostral nessas situações-problema.
 » Resolver problemas que envolvam o cálculo de probabilidades de eventos equiprováveis.
 » Utilizar o princípio multiplicativo no cálculo de probabilidades.
4AulAPROBABILIDADE
53
PROBABILIDADE • AulA 4
 » Resolver problemas que envolvem o cálculo da probabilidade de eventos.
 » Identificar eventos independentes e não independentes em situações-problema.
 » Resolver problemas que envolvam o conceito de probabilidade condicional e binomial.
 » Utilizar probabilidades para fazer previsões aplicadas em diferentes áreas do conhecimento.
combinatória
Entende-se por combinatória a parte da Matemática que analisa estruturas e relações discretas. 
Dessa forma, é muito comum a ocorrência de dois tipos de problemas em Combinatória:
 » Demonstrar a existência de subconjuntos de elementos de um conjunto finito dado e 
que satisfazem certas condições.
 » Contar ou classificar os subconjuntos de um conjunto finito e que satisfazem certas 
condições dadas.
A resolução de problemas combinatórios exige, muitas vezes, engenhosidade e a compreensão 
plena da situação descrita, embora a Combinatória apresente técnicas gerais que permitem 
atacar certos tipos de problemas.
Nesta secção, serão apresentadas ferramentas básicas que nos permitem determinar o número 
de elementos de conjuntos formados de acordo com certas regras, sem que seja necessário 
enumerar seus elementos.
Princípio da adição
“Se A e B são dois conjuntos disjuntos, com m e n elementos, respectivamente, então AÈB possui 
m + n elementos.”
Princípio Fundamental da contagem (PFc) ou princípio 
multiplicativo 
“Se há X modos de tomar uma decisão d1 e, tomada a decisão d1, há y modos de tomar a decisão 
d2, então o número de modos de tomar sucessivamente as decisões d1 e d2 é x y.”
Assim, podemos utilizar esta ideia para enunciar esse mesmo princípio, só que de uma forma 
mais geral, isto é:
“Se um acontecimento Ai pode ocorrer de mi maneiras distintas para i = 1,2,3,...,n), então a 
sequência (A1, A2, ..., An) de n acontecimentos sucessivos pode ocorrer de m1.m2. ... .mn maneiras 
distintas.”
54
AulA 4 • PROBABILIDADE
EXERCÍCIO RESOLVIDO
Com 4 homens e 3 mulheres, de quantos modos se pode formar um casal?
SOLUÇÃO
Formar um casal equivale a tomar as decisões:
d1: escolher um homem 
d2: escolher uma mulher 
Assim, #d1 = 4 e #d2 = 3. Portanto pelo PFC, 4x3 = 12 modos de formar um casal.
EXERCÍCIO RESOLVIDO
Uma bandeira é formada por 7 listras que devem ser coloridas usando apenas as cores branco, 
preto e vermelho. Se cada listra deve ter apenas uma cor e não se pode usar cores iguais em listras 
adjacentes, de quantos modos se pode colorir a bandeira?
SOLUÇÃO
Colorir a bandeira equivale a escolher a cor de cada listra. 
d1: escolher uma cor para pintar a primeira listra 
d2: escolher uma cor para pintar a segunda listra, após ter ocorrido d1
d3: escolher uma cor para pintar a terceira listra, após terem ocorrido d1 e d2
 .
 .
 .
d7: escolher uma cor para pintar a sétima listra, após terem ocorrido d1,d2,...,d6
Assim, #d1 = 3, #d2 = 2, #d3 = 2, ..., #d7 = 2. Portanto, pelo PFC, 3 x 2 x 2 x ... x 2 = 192 modos de 
distintos de pintar a bandeira.
EXERCÍCIO RESOLVIDO 
Quantos são os números de 3 dígitos que podem ser escritos no sistema de base 10?
SOLUÇÃO 
Um número de três dígitos é representado por p1 p2 p3, onde p1, p2 e p3 denotam a posição de cada 
algarismo que compõe o número. Então:
Atenção
Denotamos por #d o número de 
possibilidades para se tomar a decisão d.
55
PROBABILIDADE • AulA 4
d1: escolher um número para a posição p1, diferente de zero 
d2: escolher um número para a posição p2, após ter ocorrido d1
d3: escolher um número para a posição p2, após terem ocorrido d1 e d2
Assim, #d1 = 9, #d2 = 10 e #d3 = 10. 
Portanto, pelo PFC, 9 x 10 x 10 = 900 
EXERCÍCIO RESOLVIDO
Quantos são os números de 3 dígitos distintos que podem 
ser escritos no sistema de base 10?
SOLUÇÃO 
Um número de três dígitos distintos é representado por p1 
p2 p3, onde p1, p2 e p3 denotam a posição de cada algarismo 
que compõe o número. Então:
d1: escolher um número para a posição p1, diferente de zero 
d2: escolher um número para a posição p2, após ter ocorrido d1
d3: escolher um número para a posição p2, após terem ocorrido d1 e d2
Assim, #d1 = 9, #d2 = 9 e #d3 = 8. Portanto, pelo PFC, 9 x 9 x 8 = 648.
Permutações simples
Dados objetos distintos , de quantos modos é possível ordená-los? 
Por exemplo, para os objetos 1, 2, 3, há 6 ordenações: 123, 132, 213, 231, 312 e 321. No caso geral, 
temos n modos de escolher o objeto que ocupará o primeiro lugar, modos de escolher o que 
ocupará o segundo lugar, ... , 1 modo de escolher o objeto que ocupará o último lugar. Portanto, 
o número de modos de ordenar n objetos distintos é:
!1)...1( nnn =−
Cada ordenação dos objetos é chamada uma permutação simples de objetos e o número de 
permutações simples de objetos distintos é representado por Pn . Assim, Pn=! (já que 0! = 1, 
define-se P0 =1).
PROBLEMA RESOLVIDO
a. Quantos são os anagramas da palavra “CALOR”? 
Atenção
A notação n! representa o fatorial de n.
Isto é:
3! (lê-se: três fatorial ou o fatorial de 3)
Nesse caso:
3! = 3 • 2 • 1 = 6 
4! = 4 • 3 • 2 • 1 = 24 
Atenção: por definição 0! = 1
56
AulA 4 • PROBABILIDADE
b. Quantos começam por consoante?
SOLUÇÃO
A) Cada anagrama corresponde a uma ordem de colocação dessas 5 letras. 
d: Permutar as 5 letras
Assim, d = P5 = 5 ! = 120. Logo, existem 120 anagramas da palavra CALOR.
B) Agora, temos uma restrição, isto é, queremos contar o número de anagramas da palavra CALOR 
que começam por consoante. Então:
d1: escolher uma consoante para ser a primeira letra
d2: permutar as letras restantes
Assim, #d1 = 3 e #d2 = P4 = 4! = 24. Portanto, pelo PFC, 3 x 24 = 72 anagramas que começam por 
consoante.
PROBLEMA RESOLVIDO
De quantos modos podemos arrumar em fila 5 livros diferentes de Matemática, 3 livros diferentes 
de Estatística e 2 livros diferentes de Física, de modo que os livros de uma matéria permaneçam 
juntos?
SOLUÇÃO 
d1: Escolher a ordem das matérias
d2: Permutar os livros de matemática, após ter ocorrido d1
d3: Permutar os livros de estatística após terem ocorrido d1 e d2
d4: Permutar os livros de física, após terem ocorrido d1, d2, e d3
Assim, #d1 = P3 = 3! = 6, #d2 = P5 = 5! =120, #d3 = P3 = 3! = 6 e #d4 = P2 = 2! = 2. Logo, pelo PFC, temos 
3!5!3!2! = 6 x 120 x 6 x 2 = 8640.
Permutações de elementos nem todos distintos
Vejamos, primeiramente, o seguinte exemplo:
Exemplo 3.3 
Quantos são os anagramas da palavra “BOTAFOGO”?
57
PROBABILIDADE • AulA 4
Se as letras fossem diferentes, a resposta seria 8!. Como temos três letras O, isto é, três letras que 
são iguais, quando as trocamos entre si obtemos o mesmo anagrama e não um anagrama distinto. 
Isso faz com que, na nossa contagem de 8!, tenhamos contado o mesmo anagrama várias

Continue navegando