Prévia do material em texto
. 1
Banco do Brasil
Escriturário
Análise combinatória ............................................................................................................................ 1
Noções de probabilidade; Teorema de Bayes; Probabilidade condicional ........................................ 12
Noções de estatística; População e amostra; Análise e interpretação de tabelas e gráficos; Regressão,
tendências, extrapolações e interpolações; Tabelas de distribuição empírica de variáveis e histogramas;
Estatística descritiva (média, mediana, variância, desvio padrão, percentis, quartis, outliers,
covariância) ............................................................................................................................................ 24
Candidatos ao Concurso Público,
O Instituto Maximize Educação disponibiliza o e-mail professores@maxieduca.com.br para dúvidas
relacionadas ao conteúdo desta apostila como forma de auxiliá-los nos estudos para um bom
desempenho na prova.
As dúvidas serão encaminhadas para os professores responsáveis pela matéria, portanto, ao entrar
em contato, informe:
- Apostila (concurso e cargo);
- Disciplina (matéria);
- Número da página onde se encontra a dúvida; e
- Qual a dúvida.
Caso existam dúvidas em disciplinas diferentes, por favor, encaminhá-las em e-mails separados. O
professor terá até cinco dias úteis para respondê-la.
Bons estudos!
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 1
Caro(a) candidato(a), antes de iniciar nosso estudo, queremos nos colocar à sua disposição, durante
todo o prazo do concurso para auxiliá-lo em suas dúvidas e receber suas sugestões. Muito zelo e técnica
foram empregados na edição desta obra. No entanto, podem ocorrer erros de digitação ou dúvida
conceitual. Em qualquer situação, solicitamos a comunicação ao nosso serviço de atendimento ao cliente
para que possamos esclarecê-lo. Entre em contato conosco pelo e-mail: professores@maxieduca.com.br
ANÁLISE COMBINATÓRIA
A Análise Combinatória é a parte da Matemática que desenvolve meios para trabalharmos com
problemas de contagem. Ela também é o suporte da Teoria das Probabilidades, e de vital importância
para as ciências aplicadas, como a Medicina, a Engenharia, a Estatística entre outras.
PRINCÍPIO FUNDAMENTAL DA CONTAGEM-PFC (PRINCÍPIO MULTIPLICATIVO)
O princípio multiplicativo ou fundamental da contagem constitui a ferramenta básica para resolver
problemas de contagem sem que seja necessário enumerar seus elementos, através da possibilidades
dadas. É uma das técnicas mais utilizadas para contagem, mas também dependendo da questão pode
se tornar trabalhosa.
Exemplos
1) Imagine que, na cantina de sua escola, existem cinco opções de suco de frutas: pêssego, maçã,
morango, caju e mamão. Você deseja escolher apenas um desses sucos, mas deverá decidir também se
o suco será produzido com água ou leite. Escolhendo apenas uma das frutas e apenas um dos
acompanhamentos, de quantas maneiras poderá pedir o suco?
2) Para ir da sua casa (cidade A) até a casa do seu de um amigo Pedro (que mora na cidade C) João
precisa pegar duas conduções: A1 ou A2 ou A3 que saem da sua cidade até a B e B1 ou B2 que o leva
até o destino final C. Vamos montar o diagrama da árvore para avaliarmos todas as possibilidades:
Análise combinatória
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 2
De forma resumida, e rápida podemos também montar através do princípio multiplicativo o número de
possibilidades:
3) De sua casa ao trabalho, Silvia pode ir a pé, de ônibus ou de metrô. Do trabalho à faculdade, ela
pode ir de ônibus, metrô, trem ou pegar uma carona com um colega.
De quantos modos distintos Silvia pode, no mesmo dia, ir de casa ao trabalho e de lá para a faculdade?
Vejamos, o trajeto é a junção de duas etapas:
1º) Casa → Trabalho: ao qual temos 3 possibilidades
2º) Trabalho → Faculdade: 4 possibilidades.
Multiplicando todas as possibilidades (pelo PFC), teremos: 3 x 4 = 12.
No total Silvia tem 12 maneiras de fazer o trajeto casa – trabalho – faculdade.
FATORIAL DE UM NÚMERO NATURAL
É comum aparecerem produtos de fatores naturais sucessivos em problemas de análise combinatória,
tais como: 3. 2 . 1 ou 5. 4 . 3 . 2 . 1, por isso surgiu a necessidade de simplificarmos este tipo de notação,
facilitando os cálculos combinatórios. Assim, produtos em que os fatores chegam sucessivamente até a
unidade são chamados fatoriais.
Matematicamente:
Dado um número natural n, sendo n є N e n ≥ 2, temos:
Onde:
n! é o produto de todos os números naturais de 1 até n (lê-se: “n fatorial”)
Por convenção temos que:
Exemplos
1) De quantas maneiras podemos organizar 8 alunos em uma fila.
Observe que vamos utilizar a mesma quantidade de alunos na fila nas mais variadas posições:
Temos que 8! = 8.7.6.5.4.3.2.1 = 40320
Se um evento que chamaremos de E1 puder ocorrer
de a maneiras e um outro evento que chamaremos de E2 puder
ocorrer de b maneiras e E1 for independente de E2, assim a
quantidade de maneiras distintas de os dois eventos ocorrerem
simultaneamente será dado por axb, isto é, a quantidade de
maneiras de a ocorrer multiplicado pela quantidade de maneiras
de b ocorrer.
n! = n. (n – 1 ). (n – 2). ... . 1
0! = 1
1! = 1
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 3
2) Dado
9!
5!
, qual o valor dessa fração?
Observe que o denominador é menor que o numerador, então para que possamos resolver vamos
levar o numerador até o valor do denominador e simplificarmos:
9!
5!
=
9.8.7.6.5!
5!
= 3024
TIPOS DE AGRUPAMENTO
Os agrupamentos que não possuem elementos repetidos, são chamamos de agrupamentos
simples. Dentre eles, temos aqueles onde a ordem é importante e os que a ordem não é importante.
Vamos ver detalhadamente cada um deles.
- Arranjo simples: agrupamentos simples de n elementos distintos tomados(agrupados) p a p. Aqui a
ordem dos seus elementos é o que diferencia.
Exemplos
1) Dados o conjunto S formado pelos números S= {1,2,3,4,5,6} quantos números de 3 algarismos
podemos formar com este conjunto?
Observe que 123 é diferente de 321 e assim sucessivamente, logo é um Arranjo.
Se fossemos montar todos os números levaríamos muito tempo, para facilitar os cálculos vamos utilizar
a fórmula do arranjo.
Pela definição temos: A n,p (Lê-se: arranjo de n elementos tomados p a p).
Então:
Utilizando a fórmula:
Onde n = 6 e p = 3
An, p =
n!
(n − p)!
→ A6,3 =
6!
(6 − 3)!
=
6!
3!
=
6.5.4.3!
3!
= 120
Então podemos formar com o conjunto S, 120 números com 3 algarismos.
2) Uma escola possui 18 professores. Entre eles, serão escolhidos: um diretor, um vice-diretor e um
coordenador pedagógico. Quantas as possibilidades de escolha?
n = 18 (professores)
p = 3 (cargos de diretor, vice-diretor e coordenador pedagógico)
An, p =
n!
(n − p)!
→ A18,3 =
18!
(18 − 3)!
=
18!
15!
=
18.17.16.15!
15!
= 4896 grupos
- Permutação simples: sequência ordenada de n elementos distintos (arranjo), ao qual utilizamos
todos os elementos disponíveis, diferenciando entre eles apenas a ordem. A permutação simples é um
caso particular do arranjo simples.
𝑨𝒏, 𝒑 =
𝒏!
(𝒏 − 𝒑)!
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 4
É muito comum vermos a utilização de permutações em anagramas (alterações da sequência das
letras de uma palavra).
Exemplos
1) Quantos anagramas podemos formar com a palavra CALO?
Utilizando a fórmula da permutação temos:
n = 4 (letras)
P4! = 4! = 4 . 3 . 2 . 1! = 24 . 1! (como sabemos 1! = 1) → 24 . 1 = 24 anagramas
2) Utilizando a palavra acima, quantos são os anagramas que começam com a letra L?
P3! = 3! = 3 . 2 . 1! = 6 anagramas que começam com a letraL.
- Combinação simples: agrupamento de n elementos distintos, tomados p a p, sendo p ≤ n. O que
diferencia a combinação do arranjo é que a ordem dos elementos não é importante.
Vemos muito o conceito de combinação quando queremos montar uma comitiva, ou quando temos
também de quantas maneiras podemos cumprimentar um grupo ou comitiva, entre outros.
Exemplos
1) Uma escola tem 7 professores de Matemática. Quatro deles deverão representar a escola em um
congresso. Quantos grupos de 4 professores são possíveis?
Observe que sendo 7 professores, se invertermos um deles de posição não alteramos o grupo
formado, os grupos formados são equivalentes. Para o exemplo acima temos ainda as seguintes
possibilidades que podemos considerar sendo como grupo equivalentes.
P1, P2, P4, P3 – P2, P1, P3, P4 – P3, P1, P2, P4 – P2, P4, P3, P4 – P4, P3, P1, P2 ...
Com isso percebemos que a ordem não é importante!
Vamos então utilizar a fórmula para agilizar nossos cálculos:
Pn! = n!
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 5
Aqui dividimos novamente por p, para desconsiderar todas as sequências repetidas (P1, P2, P3, P4 =
P4, P2, P1, P3= P3, P2, P4, P1=...).
Aplicando a fórmula:
Cn, p =
n!
(n − p)! p!
→ C7,4 =
7!
(7 − 4)! 4!
=
7!
3! 4!
=
7.6.5.4!
3! 4!
=
210
3.2.1
=
210
6
= 35 grupos de professores
2) Considerando dez pontos sobre uma circunferência, quantas cordas podem ser construídas com
extremidades em dois desses pontos?
AGRUPAMENTOS COM REPETIÇÃO
Existem casos em que os elementos de um conjunto repetem-se para formar novos subconjuntos.
Nestes casos, devemos usar fórmulas de agrupamentos com repetição. Assim, teremos:
A) arranjo com repetição;
B) permutação com repetição;
C) combinação com repetição.
Vejamos:
a) Arranjo com repetição: ou arranjo completo, é um grupo de p elementos de um dado conjunto,
com n elementos distintos, onde a mudança de ordem determina grupos diferentes, podendo porém ter
elementos repetidos.
Indicamos por AR n,p
No arranjo com repetição, temos todos os elementos do conjunto à disposição a cada escolha, por
isso, pelo Princípio Fundamental da Contagem, temos:
Exemplo
Quantas chapas de automóvel compostas de 2 letras nas duas primeiras posições, seguidas por 4
algarismos nas demais posições (sendo 26 letras do nosso alfabeto e sendo os algarismos do sistema
decimal) podem ser formadas?
O número de pares de letras que poderá ser utilizado é:
Pois podemos repetir eles. Aplicando a fórmula de Arranjo com repetição temos:
𝑨𝑹 𝒏, 𝒑 = 𝒏𝒑 → 𝑨𝑹 𝟐𝟔, 𝟐 = 𝟐𝟔𝟐 = 𝟔𝟕𝟔
𝑪𝒏, 𝒑 =
𝑨𝒏, 𝒑
𝒑!
→ 𝑪𝒏, 𝒑 =
𝒏!
(𝒏 − 𝒑)! 𝒑!
Uma corda fica determinada quando escolhemos dois
pontos entre os dez.
Escolher (A,D) é o mesmo que escolher (D,A), então
sabemos que se trata de uma combinação.
Aqui temos então a combinação de 10 elementos tomados
2 a 2.
C10,2 =
n!
(n − p)! p!
=
10!
(10 − 2)! 2!
=
10!
8! 2!
=
10.9.8!
8! 2!
=
90
2
=
45 cordas
𝑨𝑹 𝒏, 𝒑 = 𝒏𝒑
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 6
Para a quantidade de números temos (0,1,2,3,4,5,6,7,8,9 – 10 algarismos):
𝑨𝑹 𝒏, 𝒑 = 𝒏𝒑 → 𝑨𝑹 𝟏𝟎, 𝟒 = 𝟏𝟎𝟒 = 𝟏𝟎. 𝟎𝟎𝟎
Assim o número de chapas que podemos ter é dado pela multiplicação dos valores achados:
676 . 10 000 = 6 760 000 possibilidades de placas.
Observação: Caso não pudesse ser utilizada a placa com a sequência de zeros, ou seja, com 4 zeros
teríamos:
𝑨𝑹 𝒏, 𝒑 = 𝒏𝒑 → 𝑨𝑹 𝟏𝟎, 𝟒 = 𝟔𝟕𝟔. 𝟏𝟎𝟒 − 𝟏𝟎𝟒 = 𝟏𝟎𝟒. (𝟔𝟕𝟔 − 𝟏)
b) Permutação com repetição: a diferença entre arranjo e permutação é que esta faz uso de todos
os elementos do conjunto. Na permutação com repetição, como o próprio nome indica, as repetições são
permitidas e podemos estabelecer uma fórmula que relacione o número de elementos, n, e as vezes em
que o mesmo elemento aparece.
Com α + β + γ + ... ≤ n
Exemplo
Quantos são os anagramas da palavra ARARA?
n = 5
α = 3 (temos 3 vezes a letra A)
β = 2 (temos 2 vezes a letra R)
Equacionando temos:
𝑷𝒏(∝,𝜷,𝜸,… ) =
𝒏!
𝜶! 𝜷! 𝜸!
… → 𝒑𝟓(𝟑,𝟐) =
𝟓!
𝟑! 𝟐!
=
𝟓. 𝟒. 𝟑!
𝟑! 𝟐!
=
𝟓. 𝟒
𝟐. 𝟏
=
𝟐𝟎
𝟐
= 𝟏𝟎 𝒂𝒏𝒂𝒈𝒓𝒂𝒎𝒂𝒔
B.1) Permutação circular: a permutação circular com repetição pode ser generalizada através da
seguinte forma:
Vejamos o exemplo como chegar na fórmula, para aplicação.
- De quantas maneiras 5 meninas que brincam de roda podem formá-la?
Fazendo um esquema, observamos que são posições iguais:
𝑷𝒏(∝,𝜷,𝜸,… ) =
𝒏!
𝜶! 𝜷! 𝜸!
…
𝑷𝒄𝒏 = (𝒏 − 𝟏)!
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 7
O total de posições é 5! e cada 5 representa uma só permutação circular. Assim, o total de permutações
circulares será dado por:
𝑃𝑐5 =
5!
5
=
5.4!
5
= 4! = 4.3.2.1 = 24
C) Combinação com repetição: dado um conjunto com n elementos distintos, chama-se combinação
com repetição, classe p (ou combinação completa p a p) dos n elementos desse conjunto, a todo grupo
formado por p elementos, distintos ou não, em qualquer ordem.
Exemplo
Em uma combinação com repetição classe 2 do conjunto {a, b, c}, quantas combinações obtemos?
Ilustrando temos:
Utilizando a fórmula da combinação com repetição, verificamos o mesmo resultado sem necessidade
de enumerar todas as possibilidades:
n = 3 e p = 2
𝑪𝑹𝒏, 𝒑 = 𝑪 𝒏 + 𝒑 − 𝟏, 𝒑 → 𝑪𝑹 𝟑 + 𝟐 − 𝟏, 𝟐 → 𝑪𝑹𝟒, 𝟐 =
𝟒!
𝟐! (𝟒 − 𝟐)!
=
𝟒!
𝟐! 𝟐!
=
𝟒. 𝟑. 𝟐!
𝟐! 𝟐!
=
𝟏𝟐
𝟐
= 𝟔
Referências
IEZZI, Gelson – Matemática – Volume Único
FILHO, Begnino Barreto; SILVA,Claudio Xavier da – Matemática – Volume Único - FTD
BOSQUILHA, Alessandra - Minimanual compacto de matemática: teoria e prática: ensino médio / Alessandra Bosquilha, Marlene Lima Pires Corrêa, Tânia
Cristina Neto G. Viveiro. -- 2. ed. rev. -- São Paulo: Rideel, 2003.
Questões
01. (Pref. Chapecó/SC – Engenheiro de Trânsito – IOBV) Em um restaurante os clientes têm a sua
disposição, 6 tipos de carnes, 4 tipos de cereais, 4 tipos de sobremesas e 5 tipos de sucos. Se o cliente
quiser pedir 1 tipo carne, 1 tipo de cereal, 1 tipo de sobremesa e 1 tipo de suco, então o número de opções
diferentes com que ele poderia fazer o seu pedido, é:
(A) 19
(B) 480
(C) 420
(D) 90
02. (Pref. Rio de Janeiro/RJ – Agente de Administração – Pref. do Rio de Janeiro) Seja N a
quantidade máxima de números inteiros de quatro algarismos distintos, maiores do que 4000, que podem
ser escritos utilizando-se apenas os algarismos 0, 1, 2, 3, 4, 5 e 6.
O valor de N é:
(A) 120
(B) 240
(C) 360
(D) 480
03. (CRQ 2ª Região/MG – Auxiliar Administrativo – FUNDEP) Com 12 fiscais, deve-se fazer um
grupo de trabalho com 3 deles. Como esse grupo deverá ter um coordenador, que pode ser qualquer um
deles, o número de maneiras distintas possíveis de se fazer esse grupo é:
(A) 4
(B) 660
(C) 1 320
(D) 3 960
𝑪𝑹𝒏, 𝒑 = 𝑪 𝒏 + 𝒑 − 𝟏, 𝒑
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 8
04. (BNDES – Técnico Administrativo – CESGRANRIO) Uma empresa de propaganda pretende
criar panfletos coloridos para divulgar certo produto. O papel pode ser laranja, azul, preto, amarelo,
vermelho ou roxo, enquanto o texto é escrito no panfleto em preto, vermelho ou branco.
De quantos modos distintos é possível escolher uma cor para o fundo e uma cor para o texto se, por
uma questão de contraste, as cores do fundo e do texto não podem ser iguais?
(A) 13
(B) 14
(C) 16
(D) 17
(E) 18
05. (TCE/BA – Analista de Controle Externo – FGV) Um heptaminó é um jogo formado por diversas
peças com as seguintes características:
• Cada peça contém dois números do conjunto {0, 1, 2, 3, 4, 5,6, 7}.
• Todas as peças são diferentes.
• Escolhidos dois números (iguais ou diferentes) do conjunto acima, existe uma, e apenas uma, peça
formadapor esses números.
A figura a seguir mostra exemplos de peças do heptaminó.
O número de peças do heptaminó é
(A) 36.
(B) 40.
(C) 45.
(D) 49.
(E) 56.
06. (SANEAR – Fiscal - FUNCAB) Os números dos segredos de um determinado modelo de cadeado
são compostos por quatro algarismos do conjunto C = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9}.
O número máximo de segredos distintos, desse modelo de cadeado, que começam com um algarismo
ímpar e terminam com um algarismo par, é:
(A) 1.120
(B) 1.750
(C) 2.255
(D) 2.475
(E) 2.500
07. (PM/SP – Cabo – CETRO) Uma lei de certo país determinou que as placas das viaturas de polícia
deveriam ter 3 algarismos seguidos de 4 letras do alfabeto grego (24 letras). Sendo assim, o número de
placas diferentes será igual a
(A) 175.760.000.
(B) 183.617.280.
(C) 331.776.000.
(D) 358.800.000.
08. (TJ/RS – Técnico Judiciário - FAURGS) O Tribunal de Justiça está utilizando um código de leitura
de barras composto por 5 barras para identificar os pertences de uma determinada seção de trabalho. As
barras podem ser pretas ou brancas. Se não pode haver código com todas as barras da mesma cor, o
número de códigos diferentes que se pode obter é de
(A) 10.
(B) 30.
(C) 50.
(D) 150.
(E) 250.
09. (SEED/SP – Agente de Organização Escolar – VUNESP) Um restaurante possui pratos principais
e individuais. Cinco dos pratos são com peixe, 4 com carne vermelha, 3 com frango, e 4 apenas com
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 9
vegetais. Alberto, Bianca e Carolina pretendem fazer um pedido com três pratos principais individuais,
um para cada. Alberto não come carne vermelha nem frango, Bianca só come vegetais, e Carolina só
não come vegetais. O total de pedidos diferentes que podem ser feitos atendendo as restrições
alimentares dos três é igual a
(A) 384.
(B) 392.
(C) 396.
(D) 416.
(E)432.
10. (PREF. JUNDIAI/SP – Eletricista – MAKIYAMA) Dentre os nove competidores de um campeonato
municipal de esportes radicais, somente os quatro primeiros colocados participaram do campeonato
estadual. Sendo assim, quantas combinações são possíveis de serem formadas com quatro desses nove
competidores?
(A) 126
(B)120
(C) 224
(D) 212
(E) 156
11. (PREF. LAGOA DA CONFUSÃO/TO – Orientador Social – IDECAN) Renato é mais velho que
Jorge de forma que a razão entre o número de anagramas de seus nomes representa a diferença entre
suas idades. Se Jorge tem 20 anos, a idade de Renato é
(A) 24.
(B) 25.
(C) 26.
(D) 27.
(E) 28.
12. (PREF. NEPOMUCENO/MG – Técnico em Segurança do Trabalho – CONSULPLAN) Numa
sala há 3 ventiladores de teto e 4 lâmpadas, todos com interruptores independentes. De quantas maneiras
é possível ventilar e iluminar essa sala mantendo, pelo menos, 2 ventiladores ligados e 3 lâmpadas
acesas?
(A) 12.
(B) 18.
(C) 20.
(D) 24.
(E) 36.
13. (CREA/PR – Agente Administrativo– FUNDATEC) A fim de vistoriar a obra de um estádio de
futebol para a copa de 2014, um órgão público organizou uma comissão composta por 4 pessoas, sendo
um engenheiro e 3 técnicos.
Sabendo-se que em seu quadro de funcionários o órgão dispõe de 3 engenheiros e de 9 técnicos,
pode-se afirmar que a referida comissão poderá ser formada de _____ maneiras diferentes.
Assinale a alternativa que completa corretamente a lacuna do trecho acima.
(A) 252
(B) 250
(C) 243
(D) 127
(E) 81
14. (ESCOLA DE SARGENTO DAS ARMAS – Música – EXÉRCITO BRASILEIRO) Colocando-se
em ordem alfabética os anagramas da palavra FUZIL, que posição ocupará o anagrama ZILUF.
(A) 103
(B) 104
(C) 105
(D) 106
(E) 107
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 10
15. (CODEMIG – Analista de Administração – Gestão de Concursos) Oito amigos encontraram-se
em uma festa. Se cada um dos amigos trocar um aperto de mão com cada um dos outros, quantos apertos
de mão serão trocados?
(A) 22.
(B) 25.
(C) 27.
(D) 28.
Respostas
01. Resposta: B.
A questão trata-se de princípio fundamental da contagem, logo vamos enumerar todas as
possibilidades de fazermos o pedido:
6 x 4 x 4 x 5 = 480 maneiras.
02. Resposta: C.
Pelo enunciado precisa ser um número maior que 4000, logo para o primeiro algarismo só podemos
usar os números 4,5 e 6 (3 possibilidades). Como se trata de números distintos para o segundo algarismo
poderemos usar os números (0,1,2,3 e também 4,5 e 6 dependo da primeira casa) logo teremos 7 – 1 =
6 possibilidades. Para o terceiro algarismos teremos 5 possibilidades e para o último, o quarto algarismo,
teremos 4 possibilidades, montando temos:
Basta multiplicarmos todas as possibilidades: 3 x 6 x 5 x 4 = 360.
Logo N é 360.
03. Resposta: B.
Esta questão trata-se de Combinação, pela fórmula temos:
Cn, p =
n!
(n − p)! p!
Onde n = 12 e p = 3
Cn, p =
n!
(n − p)! p!
→ C12,3 =
12!
(12 − 3)! 3!
=
12!
9! 3!
=
12.11.10.9!
9! 3!
=
1320
3.2.1
=
1320
6
= 220
Como cada um deles pode ser o coordenado, e no grupo tem 3 pessoas, logo temos 220 x 3 = 660.
04. Resposta: C.
_ _
6.3=18
Tirando as possibilidades de papel e texto iguais:
P P e V V=2 possibilidades
18-2=16 possiblidades
05. Resposta: A.
Teremos 8 peças com números iguais.
Depois, cada número com um diferente
7+6+5+4+3+2+1
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 11
8+7+6+5+4+3+2+1=36
06. Resposta: E.
O primeiro algarismo tem 5 possibilidades: 1,3,5,7,9
Os dois do meio tem 10 possibilidades, pois pode repetir os números
E o último tem 5: 0,2,4,6,8
_ _ _ _
5.10.10.5=2500
07. Resposta: C.
Algarismos possíveis: 0,1,2,3,4,5,6,7,8,9=10 algarismos
_ _ _ _ _ _ _
101010 242424 24=331.776.000
08. Resposta: B.
_ _ _ _ _
22222=32 possibilidades se pudesse ser qualquer uma das cores
Mas, temos que tirar código todo preto e todo branco.
32-2=30
09. Resposta: E.
Para Alberto:5+4=9
Para Bianca:4
Para Carolina: 12
_ _ _
9.4.12=432
10. Resposta: A.
1001.
C_9,4 = 9! / 5!4! = (9∙8∙7∙6∙5!) / (5!∙24) = 126
11. Resposta: C.
Anagramas de RENATO
_ _ _ _ _ _
6.5.4.3.2.1=720
Anagramas de JORGE
_ _ _ _ _
5.4.3.2.1=120
Razão dos anagramas:
720
120
= 6
Se Jorge tem 20 anos, Renato tem 20+6=26 anos
12. Resposta: C.
1ª possibilidade:2 ventiladores e 3 lâmpadas
𝐶3,2 =
3!
1!2!
= 3
𝐶4,3 =
4!
1!3!
= 4
𝐶3,2 ∙ 𝐶4,3 = 3 ∙ 4 = 12
2ª possibilidade:2 ventiladores e 4 lâmpadas
𝐶3,2 =
3!
1!2!
= 3
𝐶4,4 =
4!
0!4!
= 1
𝐶3,2 ∙ 𝐶4,4 = 3 ∙ 1 = 3
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 12
3ª possibilidade:3 ventiladores e 3 lâmpadas
𝐶3,3 =
3!
0!3!
= 1
𝐶4,3 =
4!
1!3!
= 4
𝐶3,3 ∙ 𝐶4,3 = 1 ∙ 4 = 4
4ª possibilidade:3 ventiladores e 4 lâmpadas
𝐶3,3 =
3!
0!3!
= 1
𝐶4,4 =
4!
0!4!
= 1
𝐶3,3 ∙ 𝐶4,4 = 1 ∙ 1 = 1
Somando as possibilidades: 12 + 3 + 4 + 1 = 20
13. Resposta: A.
Engenheiros
𝐶3,1 =
3!
2! 1!
= 3
Técnicos
𝐶9,3 =
9!
3! 6!
=
9 ∙ 8 ∙ 7 ∙ 6!
6 ∙ 6!
= 84
3 . 84 = 252 maneiras
14. Resposta: D.
F _ _ _ _ P4 = 4!
I _ _ _ _ P4 = 4!
L _ _ _ _p4 = 4!
U_ _ _ _P4 = 4!
ZF_ _ _P3 = 3!
ZIF_ _P2 = 2!
ZILFU-1
ZILUF
4 . 4! + 3! + 2! + 1 = 105
Portanto, ZILUF está na 106 posição.
15. Resposta: D.
A primeira pessoa apertará a mão de 7
A Segunda, de 6, e assim por diante.
Portanto, haverá: 7+6+5+4+3+2+1=28
PROBABILIDADE
A teoria das probabilidades surgiu no século XVI, com o estudo dos jogos de azar, tais como jogos de
cartas e roleta. Atualmente ela está intimamente relacionada com a Estatística e com diversos ramos do
conhecimento.
Definições:
A teoria da probabilidade é o ramo da Matemática que cria e desenvolve modelos matemáticos para
estudar os experimentos aleatórios. Alguns elementos são necessários para efetuarmos os cálculos
probabilísticos.
Noções de probabilidade; Teorema de Bayes; Probabilidadecondicional
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 13
- Experimentos aleatórios: fenômenos que apresentam resultados imprevisíveis quando repetidos,
mesmo que as condições sejam semelhantes.
Exemplos:
a) lançamento de 3 moedas e a observação das suas faces voltadas para cima
b) jogar 2 dados e observar o número das suas faces
c) abrir 1 livro ao acaso e observar o número das suas faces.
- Espaço amostral: conjunto de todos os resultados possíveis de ocorrer em um determinado
experimento aleatório. Indicamos esse conjunto por uma letra maiúscula: U, S, A, Ω ... variando de acordo
com a bibliografia estudada.
Exemplo:
a) quando lançamos 3 moedas e observamos suas faces voltadas para cima, sendo as faces da moeda
cara (c) e coroa (k), o espaço amostral deste experimento é:
S = {(c,c,c); (c,c,k); (c,k,k); (c,k,c); (k,k,k,); (k,c,k); (k,c,c); (k,k,c)}, onde o número de elementos do
espaço amostral n(A) = 8
- Evento: é qualquer subconjunto de um espaço amostral (S); muitas vezes um evento pode ser
caracterizado por um fato. Indicamos pela letra E.
Exemplo:
a) no lançamento de 3 moedas:
E1→ aparecer faces iguais
E1 = {(c,c,c);(k,k,k)}
O número de elementos deste evento E1 é n(E1) = 2
E2→ aparecer coroa em pelo menos 1 face
E2 = {(c,c,k); (c,k,k); (c,k,c); (k,k,k,); (k,c,k); (k,c,c); (k,k,c)}
Logo n(E2) = 7
Veremos agora alguns eventos particulares:
- Evento certo: que possui os mesmos elementos do espaço amostral (todo conjunto é subconjunto
de si mesmo); E = S.
E: a soma dos resultados nos 2 dados ser menor ou igual a 12.
- Evento impossível: evento igual ao conjunto vazio.
E: o número de uma das faces de um dado comum ser 7.
E: Ø
- Evento simples: evento que possui um único elemento.
E: a soma do resultado de dois dados ser igual a 12.
E: {(6,6)}
- Evento complementar: se E é um evento do espaço amostral S, o evento complementar de E
indicado por C tal que C = S – E. Ou seja, o evento complementar é quando E não ocorre.
E1: o primeiro número, no lançamento de 2 dados, ser menor ou igual a 2.
E2: o primeiro número, no lançamento de 2 dados, ser maior que 2.
S: espaço amostral é dado na tabela abaixo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 14
E: {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3) (2,4), (2,5), (2,6)}
Como, C = S – E
C = {(3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4),
(5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
- Eventos mutuamente exclusivos: dois ou mais eventos são mutuamente exclusivos quando a
ocorrência de um deles implica a não ocorrência do outro. Se A e B são eventos mutuamente exclusivos,
então: A ∩ B = Ø.
Sejam os eventos:
A: quando lançamos um dado, o número na face voltada para cima é par.
A = {2,4,6}
B: quando lançamos um dado, o número da face voltada para cima é divisível por 5.
B = {5}
Os eventos A e B são mutuamente exclusivos, pois A ∩ B = Ø.
Probabilidade em espaços equiprováveis
Considerando um espaço amostral S, não vazio, e um evento E, sendo E ⊂ S, a probabilidade de
ocorrer o evento E é o número real P (E), tal que:
𝐏(𝐄) =
𝐧(𝐄)
𝐧(𝐒)
Sendo 0 ≤ P(E) ≤ 1 e S um conjunto equiprovável, ou seja, todos os elementos têm a mesma
“chance de acontecer.
Onde:
n(E) = número de elementos do evento E.
n(S) = número de elementos do espaço amostral S.
Exemplo:
Lançando-se um dado, a probabilidade de sair um número ímpar na face voltada para cima é obtida
da seguinte forma:
S = {1, 2, 3, 4, 5, 6} n(S) = 6
E = {1, 3, 5} n(E) = 3
P(E) =
n(E)
n(S)
=
3
6
=
1
2
= 0,5 𝑜𝑢 50%
Probabilidade da união de dois eventos
Vamos considerar A e B dois eventos contidos em um mesmo espaço amostral A, o número de
elementos da reunião de A com B é igual ao número de elementos do evento A somado ao número de
elementos do evento B, subtraindo o número de elementos da intersecção de A com B.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 15
Sendo n(S) o número de elementos do espaço amostral, vamos dividir os dois membros da equação
por n(S) a fim de obter a probabilidade P (A U B).
𝑛(𝐴 ∪ 𝐵)
𝑛(𝑆)
=
𝑛(𝐴)
𝑛(𝑆)
+
𝑛(𝐵)
𝑛(𝑆)
−
𝑛(𝐴 ∩ 𝐵)
𝑛(𝑆)
P (A U B) = P(A) + P(B) – P (A ∩ B)
Para eventos mutuamente exclusivos, onde A ∩ B = Ø, a equação será:
P (A U B) = P(A) + P(B)
Exemplo:
A probabilidade de que a população atual de um país seja de 110 milhões ou mais é de 95%. A
probabilidade de ser 110 milhões ou menos é de 8%. Calcule a probabilidade de ser 110 milhões.
Sendo P(A) a probabilidade de ser 110 milhões ou mais: P(A) = 95% = 0,95
Sendo P(B) a probabilidade de ser 110 milhões ou menos: P(B) = 8% = 0,08
P (A ∩ B) = a probabilidade de ser 110 milhões: P (A ∩ B) = ?
P (A U B) = 100% = 1
Utilizando a regra da união de dois eventos, temos:
P (A U B) = P(A) + P(B) – P (A ∩ B)
1 = 0,95 + 0,08 - P (A ∩ B)
P (A ∩ B) = 0,95 + 0,08 - 1
P (A ∩ B) = 0,03 = 3%
Probabilidade condicional
Vamos considerar os eventos A e B de um espaço amostral S, definimos como probabilidade
condicional do evento A, tendo ocorrido o evento B e indicado por P(A | B) ou 𝑃 (
𝐴
𝐵
), a razão:
𝑷(𝑨|𝑩) =
𝒏(𝑨 ∩ 𝑩)
𝒏(𝑩)
=
𝑷(𝑨 ∩ 𝑩)
𝑷(𝑩)
Lemos P (A | B) como: a probabilidade de A “dado que” ou “sabendo que” a probabilidade de B.
Exemplo:
No lançamento de 2 dados, observando as faces de cima, para calcular a probabilidade de sair o
número 5 no primeiro dado, sabendo que a soma dos 2 números é maior que 7.
Montando temos:
S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4),
(3,5), (3,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4),
(6,5), (6,6)}
Evento A: o número 5 no primeiro dado.
A = {(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)}
Evento B: a soma dos dois números é maior que 7.
B = {(2,6), (3,5), (3,6), (4,4), (4,5), (4,6), (5,3), (5,4), (5,5), (5,6), (6,2), (6,3), (6,4), (6,5), (6,6)}
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 16
A ∩ B = {(5,3), (5,4), (5,5), (5,6)}
P (A ∩ B) = 4/36
P(B) = 15/36
Logo:
𝑃(𝐴|𝐵) =
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵)
=
4
36
15
36
=
4
36
.
36
15
=
4
15
Probabilidade de dois eventos simultâneos (ou sucessivos)
A probabilidade de ocorrer P (A ∩ B) é igual ao produto de um deles pela probabilidade do outro em
relação ao primeiro. Isto significa que, para se avaliar a probabilidade de ocorrem dois eventos
simultâneos (ou sucessivos), que é P (A ∩ B), é preciso multiplicar a probabilidade de ocorrer um deles
P(B) pela probabilidade de ocorrer o outro, sabendo que o primeiro já ocorreu P (A | B).
Sendo:
𝐏(𝐀|𝐁) =
𝐏(𝐀 ∩ 𝐁)
𝐏(𝐁)
𝐨𝐮 𝐏(𝐁|𝐀) =
𝐏(𝐀 ∩ 𝐁)
𝐏(𝐀)
- Eventos independentes: dois eventos A e B de um espaço amostral S são independentes quando
P(A|B) = P(A) ou P(B|A) = P(B). Sendo os eventos A e B independentes, temos:
P (A ∩ B) = P(A). P(B)
Exemplo:
Lançando-se simultaneamente um dado e uma moeda, determine a probabilidade de se obter 3 ou 5
na dado e cara na moeda.
Sendo, c = coroa e k = cara.
S = {(1,c), (1,k), (2,c), (2,k), (3,c), (3,k), (4,c), (4,k), (5,c), (5,k), (6,c), (6,k)}
Evento A: 3 ou 5 no dado
A = {(3,c), (3,k), (5,c), (5,k)}
𝑃(𝐴) =
4
12
=
1
3
Evento B: cara na moeda
B = {(1,k), (2,k), (3,k), (4,k), (5,k), (6,k)}
𝑃(𝐵) =
6
12
=
1
2
Os eventos são independentes, pois o fato de ocorrer o evento A não modifica a probabilidade de
ocorrer o evento B. Com isso temos:
P (A ∩ B) = P(A). P(B)
𝑃(𝐴 ∩ 𝐵) =
1
3
.
1
2
=
1
6
Observamos que A ∩ B = {(3,k), (5,k)} e a P (A ∩ B) poder ser calculada também por:
𝑃(𝐴 ∩ 𝐵) =
𝑛(𝐴 ∩ 𝐵)
𝑛(𝑆)
=
2
12
=
1
6
No entantonem sempre chegar ao n(A ∩ B) nem sempre é fácil dependendo do nosso espaço
amostral.
Lei Binomial de probabilidade
Vamos considerar um experimento que se repete n número de vezes. Em cada um deles temos:
P(E) = p, que chamamos de probabilidade de ocorrer o evento E com sucesso.
P(�̅�) = 1 – p, probabilidade de ocorrer o evento E com insucesso (fracasso).
A probabilidade do evento E ocorrer k vezes, das n que o experimento se repete é dado por uma lei
binomial.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 17
A probabilidade de ocorrer k vezes o evento E e (n - k) vezes o evento �̅� é o produto: pk . (1 – p)n - k
As k vezes do evento E e as (n – k) vezes do evento �̅� podem ocupar qualquer ordem. Então,
precisamos considerar uma permutação de n elementos dos quais há repetição de k elementos e de (n –
k) elementos, em outras palavras isso significa:
𝑃𝑛
[𝑘,(𝑛−𝑘)] =
𝑛!
𝑘.(𝑛−𝑘)!
= (𝑛
𝑘
), logo a probabilidade de ocorrer k vezes o evento E no n experimentos é
dada:
𝒑 = (
𝒏
𝒌
) . 𝒑𝒌. 𝒒𝒏−𝒌
A lei binomial deve ser aplicada nas seguintes condições:
- O experimento deve ser repetido nas mesmas condições as n vezes.
- Em cada experimento devem ocorrer os eventos E e �̅�.
- A probabilidade do E deve ser constante em todas as n vezes.
- Cada experimento é independente dos demais.
Exemplo:
Lançando-se uma moeda 4 vezes, qual a probabilidade de ocorrência 3 caras?
Está implícito que ocorrerem 3 caras deve ocorrer uma coroa. Umas das possíveis situações, que
satisfaz o problema, pode ser:
Temos que:
n = 4
k = 3
𝑃(𝐸) =
1
2
, 𝑃(𝐸)̅̅ ̅ = 1 −
1
2
Logo a probabilidade de que essa situação ocorra é dada por:
(
1
2
)
3
. (1 −
1
2
)
1
, como essa não é a única situação de ocorre 3 caras e 1 coroa. Vejamos:
Podemos também resolver da seguinte forma: (4
3
) maneiras de ocorrer o produto (
1
2
)
3
. (1 −
1
2
)
1
,
portanto:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 18
𝑃(𝐸) = (
4
3
) . (
1
2
)
3
. (1 −
1
2
)
1
= 4.
1
8
.
1
2
=
1
4
Referências
FILHO, Begnino Barreto; SILVA,Claudio Xavier da – Matemática – Volume Único - FTD
IEZZI, Gelson – Matemática – Volume Único
BUCCHI, Paulo – Curso prático de Matemática – Volume 2 – 1ª edição - Editora Moderna
TEOREMA DE BAYES
Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles
representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um
bom serviço. Veja:
P(BǀA) = probabilidade de “bom serviço” dado o “treinamento técnico”.
P(AǀB) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.
Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular.
Veja:
P(BǀA) = probabilidade de “ser aprovado no vestibular” dado “ser bom aluno”.
P(AǀB) = probabilidade de “ser bom aluno” dado “ser aprovado no vestibular”.
Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para
obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação
de probabilidades ou a regra do e) e lembre-se de que A e B são dois eventos que ocorrem em
sequência, A antecede B. Temos, pela "regra do e":
Donde:
Portanto:
Exemplo
Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis.
Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira
bola retirada.
Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda
bola retirada ser vermelha?
Veja o diagrama de árvore, que ajuda entender tudo o que pode acontecer quando você retira duas
bolas de uma urna, na situação descrita.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 19
Bola vermelha na segunda retirada acontece de duas maneiras, isto é,
azul e vermelha ou vermelha e vermelha:
O evento de interesse é sair bola azul na primeira retirada e sair bola vermelha na segunda retirada, ou
seja:
Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda
bola retirada ser vermelha é dada por:
Aplicamos o teorema de Bayes.
Mas vamos formalizar.
Teorema de Bayes: Sejam A e B dois eventos dependentes que ocorrem em sequência, A
antes de B. A probabilidade de ocorrer A sob a condição de ocorrer B é dada por:
Observe o esquema abaixo:
Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:
A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer
seu antecedente A.
O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B
que sucede A.
Exemplo
Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir
depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool. No entanto,
17% dos motoristas que não bebem também positivam no bafômetro. Você é um agente da lei. Qual é a
probabilidade de uma pessoa positivar no bafômetro mas não ter feito uso de bebida alcoólica?
Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro
por + e - respectivamente. Veja o diagrama de árvore.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 20
Exemplo
Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu
5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro
porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é
7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1
das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade
de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.
Referência
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
soniavieira.blogspot.com.br/2015/08/empostagem-anterior-foi-introduzido-o.html
fm2s.com.br/teorema-de-bayes/
Questões
01. (ENEM - CESGRANRIO) Em uma escola, a probabilidade de um aluno compreender e falar inglês
é de 30%. Três alunos dessa escola, que estão em fase final de seleção de intercâmbio, aguardam, em
uma sala, serem chamados para uma entrevista. Mas, ao invés de chamá-los um a um, o entrevistador
entra na sala e faz, oralmente, uma pergunta em inglês que pode ser respondida por qualquer um dos
alunos.
A probabilidade de o entrevistador ser entendido e ter sua pergunta oralmente respondida em inglês é
(A) 23,7%
(B) 30,0%
(C) 44,1%
(D) 65,7%
(E) 90,0%
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 21
02. (ENEM - CESGRANRIO) Uma competição esportiva envolveu 20 equipes com 10 atletas cada.
Uma denúncia à organização dizia que um dos atletas havia utilizado substância proibida.
Os organizadores, então, decidiram fazer um exame antidoping. Foram propostos três modos
diferentes para escolher os atletas que irão realizá-lo:
Modo I: sortear três atletas dentre todos os participantes;
Modo II: sortear primeiro uma das equipes e, desta, sortear três atletas;
Modo III: sortear primeiro três equipes e, então, sortear um atleta de cada uma dessas três equipes.
Considere que todos os atletas têm igual probabilidade de serem sorteados e que P(I), P(II) e P(III)
sejam as probabilidades de o atleta que utilizou a substância proibida seja um dos escolhidos para o
exame no caso do sorteio ser feito pelo modo I, II ou III. Comparando-se essas probabilidades, obtém-se
(A) P(I) < P(III) < P(II)
(B) P(II) < P(I) < P(III)
(C) P(I) < P(II)= P(III)
(D) P(I) = P(II) < P(III)
(E) P(I) = P(II) = P(III)
03. (ENEM - CESGRANRIO) Em uma central de atendimento, cem pessoas receberam senhas
numeradas de 1 até 100. Uma das senhas é sorteada ao acaso.
Qual é a probabilidade de a senha sorteada ser um número de 1 a 20?
(A) 1/100
(B) 19/100
(C) 20/100
(D) 21/100
(E) 80/100
04. (Pref. Niterói – Agente Fazendário – FGV) O quadro a seguir mostra a distribuição das idades
dos funcionários de certa repartição pública:
Escolhendo ao acaso um desses funcionários, a probabilidade de que ele tenha mais de 40 anos é:
(A) 30%;
(B) 35%;
(C) 40%;
(D) 45%;
(E) 55%.
05. (Pref. Niterói – Fiscal de Posturas – FGV) Uma urna contém apenas bolas brancas e bolas pretas.
São vinte bolas ao todo e a probabilidade de uma bola retirada aleatoriamente da urna ser branca é 1/5.
Duas bolas são retiradas da urna sucessivamente e sem reposição.
A probabilidade de as duas bolas retiradas serem pretas é:
(A) 16/25;
(B) 16/19;
(C) 12/19;
(D) 4/5;
(E) 3/5.
06. (TJ/RO – Técnico Judiciário – FGV) Um tabuleiro de damas tem 32 quadradinhos pretos e 32
quadradinhos brancos.
Um desses 64 quadradinhos é sorteado ao acaso.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 22
A probabilidade de que o quadradinho sorteado seja um quadradinho preto da borda do tabuleiro é:
(A) ½;
(B) ¼;
(C) 1/8;
(D) 9/16;
(E) 7/32.
07. (Pref. Jucás/CE – Professor de Matemática – INSTITUTO NEO EXITUS) Fernanda organizou
um sorteio de amigo secreto entre suas amigas. Para isso, escreveu em pedaços de papel o nome de
cada uma das 10 pessoas (incluindo seu próprio nome) que participariam desse sorteio e colocou dentro
de um saco. Fernanda, como organizadora, foi a primeira a retirar um nome de dentro do saco. A
probabilidade de Fernanda retirar seu próprio nome é:
(A) 3/5.
(B) 2/10.
(C) 1/10.
(D) ½.
(E) 2/3.
08. (Corpo de Bombeiros Militar/MT – Oficial Bombeiro Militar – COVEST – UNEMAT) Uma loja
de eletrodoméstico tem uma venda mensal de sessenta ventiladores. Sabe-se que, desse total, seis
apresentam algum tipo de problema nos primeiros seis meses e precisam ser levados para o conserto
em um serviço autorizado.
Um cliente comprou dois ventiladores. A probabilidade de que ambos não apresentem problemas nos
seis primeiros meses é de aproximadamente:
(A) 90%
(B) 81%
(C) 54%
(D) 11%
(E) 89%
09. (Corpo de Bombeiros Militar/MT – Oficial Bombeiro Militar – COVEST – UNEMAT) Em uma
caixa estão acondicionados uma dúzia e meia de ovos. Sabe-se, porém, que três deles estão impróprios
para o consumo.
Se forem escolhidos dois ovos ao acaso, qual a probabilidade de ambos estarem estragados?
(A) 2/153
(B) 1/9
(C) 1/51
(D) 1/3
(E) 4/3
10. (Corpo de Bombeiros Militar/MT – Oficial Bombeiro Militar – COVEST – UNEMAT) O jogo da
memória é um clássico jogo formado por peças que apresentam uma figura em um dos lados. Cada figura
se repete em duas peças diferentes. Para começar o jogo, as peças são postas com a figura voltada para
baixo, para que não possam ser vistas. Cada participante deve, na sua vez, virar duas peças e deixar que
todos as vejam. Caso as figuras sejam iguais, o participante deve recolher consigo esse par e jogar
novamente. Se forem peças diferentes, estas devem ser viradas novamente e a vez deve ser passada ao
participante seguinte. Ganha o jogo quem tiver descoberto mais pares, quando todos eles tiverem sido
recolhidos.
Fonte:<http:// www.wikipedia.org/wiki/Jogo_de_memoria>. Acesso em: 13.mar.2014.
Suponha que o jogo possua 2n cartas, sendo n pares distintos. Qual é a probabilidade de, na primeira
tentativa, o jogador virar corretamente um par igual?
(A)
1
2𝑛−1
(B)
1
𝑛
(C)
1
2𝑛
(D)
1
𝑛−1
(E)
1
𝑛+1
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 23
Respostas
01. Resposta: D.
A probabilidade de nenhum dos três alunos responder à pergunta feita pelo entrevistador é
0,70 . 0,70 . 0,70 = 0,343 = 34,3%
Portanto, a possibilidade dele ser entendido é de: 100% – 34 ,3% = 65,7%
02. Resposta: E.
Em 20 equipes com 10 atletas, temos um total de 200 atletas, dos quais apenas um havia utilizado
substância proibida.
A probabilidade desse atleta ser um dos escolhidos pelo:
Modo I é
𝑃(𝐼) = 3 ∙
1
200
∙
199
199
∙
198
198
=
3
200
Modo II é
𝑃(𝐼𝐼) =
1
20
∙ 3 ∙
1
10
∙
9
9
∙
8
8
=
3
200
Modo III é
𝑃(𝐼𝐼𝐼) = 3 ∙
1
20
∙
19
19
∙
18
18
∙
1
10
∙
10
10
∙
10
10
=
3
200
A equipe dele pode ser a primeira, a segunda ou a terceira a ser sorteada e a probabilidade dele ser o
sorteado na equipe é 1/10
P(I)=P(II)=P(III)
03. Resposta: C.
A probabilidade de a senha sorteada ser um número de 1 a 20 é 20/100, pois são 20 números entre
100.
04. Resposta: D.
O espaço amostral é a soma de todos os funcionário:
2 + 8 + 12 + 14 + 4 = 40
O número de funcionário que tem mais de 40 anos é: 14 + 4 = 18
Logo a probabilidade é:
𝑃(𝐸) =
18
40
= 0,45 = 45%
05. Resposta: C.
B = bolas brancas
T = bolas pretas
Total 20 bolas = S (espaço amostral)
P(B) = 1/5
𝑃(𝐵) =
𝑛(𝐵)
𝑛(𝑆)
→
1
5
=
𝑛(𝐵)
20
→ 𝑛(𝐵) =
20
5
= 4
Logo 20 – 4 = 16 bolas pretas
𝑃(𝑇1) =
𝑛(𝑇)
𝑛(𝑆)
=
16
20
=
4
5
Como não há reposição a probabilidade da 2º bola ser preta é:
𝑃(𝑇2) =
𝑛(𝑇)
𝑛(𝑆)
=
15
19
Como os eventos são independentes multiplicamos as probabilidades:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 24
4
5
.
15
19
=
60
95
=
12
19
06. Resposta: E.
Como são 14 quadrinhos pretos na borda e 64 quadradinhos no total, logo a probabilidade será de:
𝑃(𝐸) =
14
64
=
7
32
07. Resposta: C.
A probabilidade é calculada por 𝑃 =
𝑟𝑒𝑡𝑖𝑟𝑎𝑑𝑜
𝑡𝑜𝑡𝑎𝑙
Assim, 𝑃 =
1
10
08. Resposta: B.
6 / 60 = 0,1 = 10% de ter problema
Assim, se 10% tem problemas, então 90% não apresentam problemas.
𝑃 =
90
100
.
90
100
=
8100
10000
= 81%
09. Resposta: C.
𝑃 =
3
18
.
2
17
=
6
306
=
1
51
(: 6 / 6)
10. Resposta: A.
Como a primeira carta pode ser qualquer uma, as chances são certas (1). Após, a segunda carta
precisa ser igual à primeira, e só há 1 igual. Assim:
𝑃 =
1
1
.
1
2𝑛−1
=
1
2𝑛−1
Panorama Histórico
Todas as ciências têm suas raízes na história do homem.
Desde a Antiguidade muitos povos já faziam uso dos recursos da Estatística, através de registro de
número de óbitos, nascimentos, número de habitantes, além das estimativas das riquezas individuais e
sociais, entre muitas outras.
Na Idade Média as informações colhidas tinham como finalidade tributária e bélica.
Somente a partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais,
originando as primeiras tábuas e tabelas e os primeiros números relativos.
No século XVII o estudo de tais fatos foi adquirido, aos poucos, feição verdadeiramente científica.
Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu
objetivo e suas relações com as ciências.
A estatística é, hoje em dia, um instrumento útil e, em alguns casos, indispensável para tomadas de
decisão em diversos campos: científico, econômico, social, político…
Todavia, antes de chegarmos à parte de interpretação para tomadas de decisão, há que proceder a
um indispensável trabalho de recolha e organização de dados, sendo a recolha feita através de
recenseamentos (ou censos ou levantamentos estatísticos) ou sondagens.
Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. No nosso cotidiano,
precisamos tomar decisões, muitas vezes decisões rápidas.
Noções de estatística; População e amostra; Análise e interpretação de tabelas e
gráficos; Regressão, tendências, extrapolações e interpolações; Tabelas de
distribuição empírica de variáveis e histogramas; Estatísticadescritiva (média,
mediana, variância, desvio padrão, percentis, quartis, outliers, covariância).
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 25
Em linhas gerais a Estatística fornece métodos que auxiliam o processo de tomada de decisão através
da análise dos dados que possuímos.
Podemos ainda dizer que a Estatística é:
É a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem
decisões.
Divisão da estatística
- Estatística Descritiva: coleta, organização e descrição dos dados.
- Estatística Indutiva ou Inferencial: análise e a interpretação desses dados.
Método Estatístico
Atualmente quase todo acréscimo de conhecimento resulta da observação e do estudo. A verdade é
que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos, ou
seja desenvolvemos maneiras ou métodos para tais fins.
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.
- Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e
variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.
Muito utilizado no estudo da Física, da Química etc
- Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas
causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final,
que influências cabem a cada uma delas.
Fases do método estatístico
- Coleta de dados: após cuidadoso planejamento e a devida determinação das características
mensuráveis do fenômeno que se quer pesquisar, damos início à coleta de dados numéricos necessários
à sua descrição.
A coleta
pode ser
Direta: quando é feita sobre elementos informativos de registro obrigatório
(nascimento, casamentos e óbitos, importação e exportação de mercadorias),
dados coletados pelo próprio pesquisador através de inquéritos e
questionários, como por exemplo o censo demográfico. A coleta direta de
dados pode ser classificada em fator do tempo:
(i) contínua (registro) – quando feita continuamente.
(ii) periódica – quando feita em intervalos constantes de tempo (exemplo o
censo de 10 em 10 anos, etc)
(iii) ocasional – quando feita extemporaneamente, a fim de atender uma
conjuntura ou a uma emergência (caso de epidemias)
Indireta: quando é indeferida de elementos conhecidos (coleta direta) e/ou de
conhecimento de outros fenômenos relacionados com o fenômeno estudado.
Exemplo: pesquisas de mortalidade infantil, que é feita através de dados
colhidos por uma coleta direta (número de nascimentos versus números de
obtidos de crianças)
- Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados,
à procura de possível falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo
vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas.
A crítica é interna quando visa observar os elementos originais dos dados da coleta.
- Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios
de classificação, que pode ser manual, eletromecânica ou eletrônica.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 26
- Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada
(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.
- Análise dos resultados: realizadas anteriores (Estatística Descritiva), fazemos uma análise dos
resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução
ou inferência, e tiramos desses resultados conclusões e previsões.
Mais alguns conceitos devem ser aprendidos para darmos continuidade ao nosso entendimento sobre
Estatística.
- Variáveis: conjunto de resultados possíveis de um fenômeno.
As variáveis podem ser:
1) Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor
da pele, entre outros. Dizemos que estamos qualificando.
2) Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos
alunos, etc). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome
de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto
enumerável recebe o nome de variável discreta.
- População estatística ou universo estatístico: conjunto de entes portadores de, pelo menos, uma
característica comum.
Exemplos: estudantes (os que estudam), concurseiros (os que prestam concursos), ...
Podemos ainda pesquisar uma ou mais características dos elementos de alguma população, as quais
devem ser perfeitamente definidas. É necessário existir um critério de constituição da população, válido
para qualquer pessoa, no tempo ou no espaço.
- Amostra: é um subconjunto finito de uma população.
A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados
verificados em amostras retiradas dessa população. É preciso garantir que a amostra possua as mesmas
características da população, no que diz respeito ao fenômeno que desejamos pesquisar.
Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população.
Principais propriedades:
- Admite erros processual zero e tem 100% de confiabilidade;
- É caro;
- É lento;
- É quase sempre desatualizado (visto que se realizam em períodos de anos 10 em 10 anos);
- Nem sempre é viável.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 27
Dados brutos: quando observamos ou fazemos n perguntas as quais nos dão n dados ou respostas,
obtemos uma sequência de n valores numéricos. A toda sequência denominamos dados brutos.
Dados brutos é uma sequência de valores numéricos não organizados, obtidos diretamente da
observação de um fenômeno coletivo.
Rol: é uma sequência ordenada dos dados brutos.
Exemplo: Um aluno obteve as seguintes notas no ano letivo em Matemática: 5,5 ; 7 ; 6,5 ; 9
Os dados brutos é a sequência descrita acima
Rol: 5,5 – 6,5 – 7 – 9 (ordenação crescente das notas).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999
Questão
01. (Câmara Munic. Itatiba/SP – Analista de Recursos Humanos – VUNESP) Em estatística, a
técnica que nos permite fazer inferências sobre uma população, a partir da análise de uma parte dela,
denomina-se
(A) dedução.
(B) amostragem.
(C) probabilidade.
(D) descrição.
(E) extração.
Resposta
01. Resposta: B.
AMOSTRAGEM
Amostragem é um técnica especial para recolher amostras, que garante, tanto quanto possível, o
acaso na escolha.
Probabilística (aleatória): A probabilidade de um elemento da população ser escolhido é conhecida.
Cada elemento da população passa a ter a mesma chance de ser escolhido.
Não-probabilística (não aleatória): Não se conhece a probabilidade de um elemento ser escolhido
para participar da amostra.
No quadro abaixo está descrita os métodos de amostragem:
Amostragem probabilística
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 28
Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico.
Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um
dispositivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra.
Exemplo: 15% dos alunos de uma população de notasentre 8 e 10, serão sorteados para receber uma
bolsa de estudos de inglês.
Vantagens:
- Facilidade de cálculo estatístico;
- Probabilidade elevada de compatibilidade dos dados da amostra e da população.
Desvantagens:
- Requer listagem da população;
- Trabalhosa em populações elevadas;
- Custos elevados se a dispersão da amostra for elevada.
Amostragem sistemática: escolher cada elemento de ordem k. Assemelha-se à amostragem
aleatória simples, porque inicialmente enumeram-se as unidades da população. Mas difere da aleatória
porque a seleção da amostra é feita por um processo periódico pré-ordenado. Os elementos da população
já se acham ordenados, não havendo necessidade de construir um sistema de referência.
Exemplo: Amostra de 15% dos alunos com déficit de atenção diagnosticado. Sorteia-se um valor de 1
a 5. Se o sorteado for o 2, incluem-se na amostra o aluno 2, o 7, o 12 e assim por diante de cinco em
cinco.
Amostragem proporcional estratificada: muitas vezes a população se divide em subpopulações –
estratos, então classificamos a população em, ao menos dois estratos, e extraímos uma amostra de cada
um. Podemos determinar características como sexo, cor da pele, faixa etária, entre outros.
Exemplo: Supondo que dos noventa alunos de uma escola, 54 sejam meninos e 36 sejam meninas
vamos obter a amostra proporcional estratificada de 10% desta população.
Temos dois estratos: sexo masculino e feminino.
Sexo População 10% Amostra
M 54
10𝑥54
100
= 5,4 5
F 36
10𝑥36
100
= 3,6 4
Total 90
10𝑥90
100
= 9,0 9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem aos meninos e de 55 a 90, as
meninas.
Para amostragem muito grande também fazemos o uso da Tabela de Números Aleatórios, elaborada
a fim de facilitar os cálculos, que foi construída de modo que os dez algarismos (0 a 9) são distribuídos
ao acaso nas linhas e colunas, conforme pode ser visto abaixo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 29
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da
mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa
necessidade. Os números obtidos irão indicar os elementos da amostra.
No nosso exemplo vamos definir como critérios a primeira e a segunda colunas da esquerda, de cima
para baixo (constituídos de 2 algarismos), obtermos os seguintes números.
A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou vice versa),
verticalmente (de cima para baixo ou vice versa), diagonalmente (no sentido ascendente ou
descendente), formando desenho de alguma letra e até mesmo escolhendo uma única linha ou coluna.
O critério adotado deve ser definido antes do início do processo.
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Eliminamos os números maiores que 90 e os números repetidos.
Assim temos:
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas.
Vantagens:
- Pressupõe um erro de amostragem menor;
- Assegura uma boa representatividade das variáveis estratificadas;
- Podem empregar-se metodologias diferentes para cada estrato;
- Fácil organização do trabalho de campo.
Desvantagens:
- Necessita de maior informação sobre a população;
- Cálculo estatístico mais complexo.
Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos
(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.
Exemplo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 30
O mapa mostra os conglomerados selecionados (neste caso os municípios), que apresentaram a maior
proporção de casos de dengue confirmados no Estado de São Paulo até março de 2015.
Vantagens:
- Não existem listagem de toda a população;
- Concentra os trabalhos de campo num número limitado de elementos da população.
Desvantagens:
- Maior erro de amostragem;
- Cálculo estatístico mais complexo na estimação do erro de amostragem.
Amostragem não-probabilística
Amostragem por cotas: consiste em uma amostragem por julgamento que ocorre em suas etapas.
Em um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir,
selecionam-se os elementos da amostra com base em um julgamento.
Amostragem por julgamento: quando o pesquisador seleciona os elementos mais representativos
da amostra de acordo com seu julgamento pessoal. Essa amostragem é ideal quando o tamanho da
população é pequeno e suas características, bem conhecidas.
Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de
entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra
consecutiva.
Exemplo: Em uma pesquisa sobre dengue, arrolar os 200 pacientes que receberam diagnostico em
um hospital.
Vantagens:
- Mais econômica;
- Fácil administração;
- Não necessita de listagem da população.
Desvantagens
- Maior erro de amostragem que em amostras aleatórias;
- Não existem metodologias válidas para o cálculo do erro de amostragem;
- Limitação representativa;
- Maior dificuldade de controle de trabalho de campo
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 31
Tamanho da Amostra
O tamanho da amostra deve ser determinado antes de se iniciar a pesquisa.
Deve-se usar a maior amostra possível, pois quanto maior a amostra, maior a representatividade da
população. Amostras menores possuem resultados menos precisos.
É muito importante usarmos amostras de tamanhos adequados, para que os dados tenham maior
confiabilidade e precisão.
Consideramos:
Amostras grandes: n > 100
Amostras médias: n > 30
Amostras pequenas: n < 30
Amostras muito pequenas: n < 12
Erros de amostragem
Diferença randômica(aleatória) entre a amostra e população da qual a amostra foi retirada. O tamanho
do erro pode ser medido em amostras probabilísticas, expressa como “erro padrão” (ou precisão) de
média, proporção entre outros.
Erro padrão da média: é usado para estimar o desvio padrão da distribuição das médias amostrais,
tanto para populações finitas ou infinitas (será abordado em medidas de dispersão).
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2004.
SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas
S. A: 1999.
DORA, Filho U – Introdução à Bioestatística para simples mortais – São Paulo – Elsevier: 1999.
http://www.andremachado.org
Questões
01. (TRT/MG – Analista Judiciário – FCC) O objetivo de uma pesquisa era o de se obter,
relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda
familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível
educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores
para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda
familiar foram, respectivamente,
(A) censo e amostragem por conglomerados.
(B) amostragem aleatória e amostragem sistemática.
(C) censo e amostragem casual simples.
(D) amostragem estratificada e amostragem sistemática.
(E) amostragem sistemática e amostragem em dois estágios.
02. (EPE – Analista de Pesquisa Energética – CESGRANRIO) Considere um planejamento amostral
para uma população de interesse no qual é feita uma divisão dessa população em grupos idênticos à
população alvo, como uma espécie de microcosmos da população, e, em seguida, seleciona-se
aleatoriamente um dos grupos e retira-se a amostra do gruposelecionado.
A técnica de amostragem descrita acima é definida como:
(A) amostragem aleatória simples
(B) amostragem por conglomerados
(C) amostragem estratificada
(D) amostragem sistemática
(E) amostragem por cotas
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 32
03. (MTur – Estatístico – ESAF) Com relação à amostragem, pode-se afirmar que:
(A) na amostragem por quotas, tem-se uma amostra não probabilística na qual divide-se a população
em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos
individuais obedece o critério de uma amostra sistemática.
(B) na amostragem estratificada, divide-se a população em grupos (ou classes, ou estratos), de modo
que os elementos pertencentes ao mesmo estrato sejam o mais heterogêneos possível com respeito à
característica em estudo. Para cada grupo toma-se uma subamostra pelo procedimento a.a.s., e a
amostra global é o resultado da combinação das subamostras de todos os estratos
(C) na amostragem por conglomerados, seleciona-se primeiro, ao acaso, grupos (conglomerados) de
elementos individuais da população. A seguir, toma-se ou todos os elementos ou uma subamostra de
cada conglomerado. Nos conglomerados, as diferenças entre eles devem ser tão grandes quanto
possível, enquanto as diferenças dentro devem ser tão pequenas quanto possível.
(D) na amostragem por quotas, tem-se uma amostra probabilística na qual divide-se a população em
subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais
é por sorteio.
(E) na amostragem sistemática, toma-se cada k-ésima unidade da população previamente ordenada,
em que k é a razão de amostragem. O procedimento deve começar ao acaso, sorteando-se um número
entre 1 e k.
04. (TJ-ES – Analista Jurídico – CESPE) No que concerne aos planos amostrais, julgue os itens a
seguir.
Tanto na amostragem estratificada quanto na amostragem por conglomerados, a população é dividida
em grupos. Na amostragem por conglomerados, de cada grupo seleciona-se um conjunto de elementos;
na amostragem estratificada, devem-se selecionar quais estratos serão amostrados e, desses, observar
todos os elementos.
( ) Certo ( ) Errado
Respostas
01. Resposta: C.
Vide a definição apresentada em nosso material.
02. Resposta: B.
Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos
(conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente
algumas dessas seções e tomamos todos os elementos das mesmas.
03. Resposta: E.
Escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque
inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da
amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham
ordenados, não havendo necessidade de construir um sistema de referência.
04. Resposta: Errado.
As definições de amostragem estratificada e por conglomerados estão invertidas.
MÉDIA ARITMÉTICA
Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e efetue uma certa operação com todos os
elementos de A.
Se for possível substituir cada um dos elementos do conjunto A por um número x de modo que o
resultado da operação citada seja o mesmo diz – se, por definição, que x será a média dos elementos de
A relativa a essa operação.
MÉDIA ARITMÉTICA SIMPLES
A média dos elementos do conjunto numérico A relativa à adição é chamada média aritmética.
- Cálculo da média aritmética
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 33
Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn}, então, por
definição:
A média aritmética(x) dos n elementos do conjunto numérico A é a soma de todos os seus
elementos, dividida pelo número de elementos n.
Exemplos:
1) Calcular a média aritmética entre os números 3, 4, 6, 9, e 13.
Se x for a média aritmética dos elementos do conjunto (3, 4, 6, 9, 13), então x será a soma dos 5
elementos, dividida por 5. Assim:
𝑥 =
3 + 4 + 6 + 9 + 13
5
↔ 𝑥 =
35
5
↔ 𝑥 = 7
A média aritmética é 7.
2) Os gastos (em reais) de 15 turistas em Porto Seguro estão indicados a seguir:
65 – 80 – 45 – 40 – 65 – 80 – 85 – 90
75 – 75 – 70 – 75 – 75 – 90 – 65
Se somarmos todos os valores teremos:
𝑥 =
65 + 80 + 45 + 40 + 65+, , , +90 + 65
15
=
1075
15
= 71,70
Assim podemos concluir que o gasto médio do grupo de turistas foi de R$ 71,70.
Questões
01. (Câmara Municipal de São José dos Campos/SP – Analista Técnico Legislativo – Designer
Gráfico – VUNESP) Na festa de seu aniversário em 2014, todos os sete filhos de João estavam
presentes. A idade de João nessa ocasião representava 2 vezes a média aritmética da idade de seus
filhos, e a razão entre a soma das idades deles e a idade de João valia
(A) 1,5.
(B) 2,0.
(C) 2,5.
(D) 3,0.
(E) 3,5.
02. (TJ/SC - Técnico Judiciário - Auxiliar TJ-SC) Os censos populacionais produzem informações
que permitem conhecer a distribuição territorial e as principais características das pessoas e dos
domicílios, acompanhar sua evolução ao longo do tempo, e planejar adequadamente o uso sustentável
dos recursos, sendo imprescindíveis para a definição de políticas públicas e a tomada de decisões de
investimento. Constituem a única fonte de referência sobre a situação de vida da população nos
municípios e em seus recortes internos – distritos, bairros e localidades, rurais ou urbanos – cujas
realidades socioeconômicas dependem dos resultados censitários para serem conhecidas.
http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm
(Acesso dia 29/08/2011)
Um dos resultados possíveis de se conhecer, é a distribuição entre homens e mulheres no território
brasileiro. A seguir parte da pirâmide etária da população brasileira disponibilizada pelo IBGE.
http://www.ibge.gov.br/censo2010/piramide_etaria/index.php
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 34
O quadro abaixo, mostra a distribuição da quantidade de homens e mulheres, por faixa etária de uma
determinada cidade. (Dados aproximados)
Considerando somente a população masculina dos 20 aos 44 anos e com base no quadro abaixo a
frequência relativa, dos homens, da classe [30, 34] é:
(A) 64%.
(B) 35%.
(C) 25%.
(D) 29%.
(E) 30%.
03. (EsSA - Sargento - Conhecimentos Gerais - Todas as Áreas – EB) Em uma turma a média
aritmética das notas é 7,5. Sabe-se que a média aritmética das notas das mulheres é 8 e das notas dos
homens é 6. Se o número de mulheres excede o de homens em 8, pode-se afirmar que o número total
de alunos da turma é
(A) 4.
(B) 8.
(C) 12.
(D) 16.
(E) 20.
04. (SAP/SP - Oficial Administrativo – VUNESP) A altura média, em metros, dos cinco ocupantes de
um carro era y. Quando dois deles, cujas alturas somavam 3,45 m, saíram do carro, a altura média dos
que permaneceram passou a ser 1,8 m que, em relação à média original y, é
(A) 3 cm maior.
(B) 2 cm maior.
(C) igual.
(D) 2 cm menor.
(E) 3 cm menor.
05. (PC/SP – Oficial Administrativo – VUNESP) Em uma empresa com 5 funcionários, a soma dos
dois menores salários é R$ 4.000,00, e a soma dos três maiores salários é R$ 12.000,00. Excluindo-se o
menor e o maior desses cinco salários, a média dos 3 restantes é R$ 3.000,00, podendo-se concluir que
a média aritmética entre o menor e o maior desses salários é igual a
(A) R$ 3.500,00.
(B) R$ 3.400,00.
(C) R$ 3.050,00.
(D) R$ 2.800,00.
(E) R$ 2.500,00.
Respostas
01. Resposta: E.
Foi dado que: J = 2.M
𝐽 =
𝑎+𝑏+⋯+𝑔
7
= 2. 𝑀 ( I )
Foi pedido:
𝑎+𝑏+⋯+𝑔
𝐽
= ?
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 35
Na equação ( I ), temos que:
7 =
𝑎+𝑏+⋯+𝑔
𝐽
7
2
=
𝑎+𝑏+⋯+𝑔𝑀
𝑎 + 𝑏 + ⋯ + 𝑔
𝑀
= 3,5
02. Resposta: E.
[30, 34] = 600, somatória de todos os homens é: 300+400+600+500+200= 2000
600
300+400+600+500+200
=
600
2000
= 0,3 . (100) = 30%
03. Resposta: D.
Do enunciado temos m = h + 8 (sendo m = mulheres e h = homens).
A média da turma é 7,5, sendo S a soma das notas:
𝑆
𝑚+ℎ
= 7,5 → 𝑆 = 7,5(𝑚 + ℎ)
A média das mulheres é 8, sendo S1 a soma das notas:
𝑆1
𝑚
= 8 → 𝑆1 = 8𝑚
A média dos homens é 6, sendo S2 a soma das notas:
𝑆2
ℎ
= 6 → 𝑆2 = 6ℎ
Somando as notas dos homens e das mulheres:
S1 + S2 = S
8m + 6h = 7,5(m + h)
8m + 6h = 7,5m + 7,5h
8m – 7,5m = 7,5h – 6h
0,5m =1,5h
𝑚 =
1,5ℎ
0,5
𝑚 = 3ℎ
h + 8 = 3h → 8 = 3h – h → 8 = 2h → h = 4
m = 4 + 8 = 12
Total de alunos = 12 + 4 = 16
04. Resposta: A.
Sendo S a soma das alturas e y a média, temos:
𝑆
5
= 𝑦 → S = 5y
𝑆−3,45
3
= 1,8 → S – 3,45 = 1,8.3
S – 3,45 = 5,4
S = 5,4 + 3,45
S = 8,85, então:
5y = 8,85
y = 8,85 : 5 = 1,77
1,80 – 1,77 = 0,03 m = 3 cm a mais.
05. Resposta: A.
x1 + x2 + x3 + x4 + x5
x1 + x2 = 4000
x3 + x4 + x5 = 12000
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 36
𝑥2 + 𝑥3 + 𝑥4
3
= 3000
x2 + x3 + x4 = 9000
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 = 4000 + 12000 = 16000
Sendo 𝑥1 𝑒 𝑥5 o menor e o maior salário, respectivamente:
𝑥1 + 9000 + 𝑥5 = 16000
𝑥1 + 𝑥5 = 16000 − 9000 = 7000
Então, a média aritmética:
𝑥1 + 𝑥2
2
=
7000
2
= 3500
MÉDIA ARITMÉTICA PONDERADA
A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um
“determinado peso” é chamada média aritmética ponderada.
- Cálculo da média aritmética ponderada
Se x for a média aritmética ponderada dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn} com
“pesos” P1; P2; P3; ...; Pn, respectivamente, então, por definição:
P1 . x + P2 . x + P3 . x + ... + Pn . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn ↔ (P1 + P2 + P3 + ... + Pn) . x =
= P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn e, portanto,
Observe que se P1 = P2 = P3 = ... = Pn = 1, então 𝑥 =
𝑥1; 𝑥2; 𝑥3; …; 𝑥𝑛
𝑛
: que é a média aritmética simples.
A média aritmética ponderada dos n elementos do conjunto numérico A é a soma dos produtos
de cada elemento multiplicado pelo respectivo peso, dividida pela soma dos pesos.
Exemplos:
1) Calcular a média aritmética ponderada dos números 35, 20 e 10 com pesos 2, 3, e 5,
respectivamente.
Se x for a média aritmética ponderada, então:
𝑥 =
2 .35 + 3 .20 + 5 .10
2 + 3 + 5
↔ 𝑥 =
70 + 60 + 50
10
↔ 𝑥 =
180
10
↔ 𝑥 = 18
A média aritmética ponderada é 18.
2) Em um dia de pesca nos rios do pantanal, uma equipe de pescadores anotou a quantidade de peixes
capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado em Campo Grande.
Tipo de peixe Quilo de peixe pescado Preço por quilo
Peixe A 18 R$ 3,00
Peixe B 10 R$ 5,00
Peixe C 6 R$ 9,00
Vamos determinar o preço médio do quilograma do peixe vendido pelos pescadores ao supermercado.
Considerando que a variável em estudo é o preço do quilo do peixe e fazendo a leitura da tabela,
concluímos que foram pescados 18 kg de peixe ao valor unitário de R$ 3,00, 10 kg de peixe ao valor
unitário de R$ 5,00 e 6 kg de peixe ao valor de R$ 9,00.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 37
Vamos chamar o preço médio de p:
𝑝 =
18𝑥3,00 + 10𝑥5,00 + 6𝑥9,00
18 + 10 + 6
=
54 + 50 + 54
34
=
158
34
= 4,65 𝑟𝑒𝑎𝑖𝑠
Neste caso o fator de ponderação foi a quantidade de peixes capturadas de cada espécie.
A palavra média, sem especificações (aritmética ou ponderada), deve ser entendida como média
aritmética.
Referência
IEZZI, Gelson – Matemática – Volume Único
Questões
01. (EPCAR – Cadete – EPCAR) Um líquido L1 de densidade 800 g/l será misturado a um líquido L2
de densidade 900 g/l Tal mistura será homogênea e terá a proporção de 3 partes de L1 para cada 5 partes
de L2 A densidade da mistura final, em g/l, será
(A) 861,5.
(B) 862.
(C) 862,5.
(D) 863.
02. (TJM-SP – Oficial de Justiça – VUNESP) Ao encerrar o movimento diário, um atacadista, que
vende à vista e a prazo, montou uma tabela relacionando a porcentagem do seu faturamento no dia com
o respectivo prazo, em dias, para que o pagamento seja efetuado.
PORCENTUAL DO
FATURAMENTO
PRAZO PARA
PAGAMENTO (DIAS)
15% À vista
20% 30
35% 60
20% 90
10% 120
O prazo médio, em dias, para pagamento das vendas efetuadas nesse dia, é igual a
(A) 75.
(B) 67.
(C) 60.
(D) 57.
(E) 55.
03. (SEDUC/RJ - Professor – Matemática – CEPERJ) Uma loja de roupas de malha vende camisetas
com malha de três qualidades. Cada camiseta de malha comum custa R$15,00, de malha superior custa
R$24,00 e de malha especial custa R$30,00. Certo mês, a loja vendeu 180 camisetas de malha comum,
150 de malha superior e 70 de malha especial. O preço médio, em reais, da venda de uma camiseta foi
de:
(A) 20.
(B) 20,5.
(C) 21.
(D) 21,5.
(E) 11.
04. (CÂMARA MUNICIPAL DE SÃO JOSÉ DO RIO PRETO/SP – Programador de Computador –
FIP) A média semestral de um curso é dada pela média ponderada de três provas com peso igual a 1
na primeira prova, peso 2 na segunda prova e peso 3 na terceira. Qual a média de um aluno que tirou
8,0 na primeira, 6,5 na segunda e 9,0 na terceira?
(A) 7,0
(B) 8,0
(C) 7,8
(D) 8,4
(E) 7,2
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 38
05. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática
– FUNCAB) A tabela abaixo mostra os valores mensais do Imposto Predial e Territorial Urbano (IPTU)
pagos pelos apartamentos de um condomínio. Determine a média aritmética desses valores.
Número de Apartamentos Valor de IPTU Pago
5 R$ 180,00
5 R$ 200,00
10 R$ 220,00
10 R$ 240,00
4 R$ 300,00
6 R$ 400,00
(A) R$ 248,50
(B) R$ 252,50
(C) R$ 255,50
(D) R$ 205,50
(E) R$ 202,50
06. (SAP/SP - AGENTE DE SEGURANÇA PENITENCIÁRIA DE CLASSE I – VUNESP) Em uma
seção de uma empresa com 20 funcionários, a distribuição dos salários mensais, segundo os cargos
que ocupam, é a seguinte:
Sabendo-se que o salário médio desses funcionários é de R$ 1.490,00, pode-se concluir que o salário
de cada um dos dois gerentes é de
(A) R$ 2.900,00.
(B) R$ 4.200,00.
(C) R$ 2.100,00.
(D) R$ 1.900,00.
(E) R$ 3.400,00.
07. (UFPE - Assistente em Administração – COVEST) Em um concurso existem provas de
Português, Matemática, Informática e Conhecimentos Específicos, com pesos respectivos 2, 3, 1 e 4. Um
candidato obteve as seguintes notas nas provas de Português, Matemática e Informática:
Disciplina Nota
Português 77
Matemática 62
Informática 72
Se a nota do candidato no concurso foi 80, qual foi a sua nota na prova de Conhecimentos Específicos?
(A) 95
(B) 96
(C) 97
(D) 98
(E) 99
08. (VUNESP – FUNDUNESP – Assistente Administrativo) Um concurso teve duas fases, e, em
cada uma delas, os candidatos foram avaliados com notas que variaram de zero a dez. Para efeito de
classificação, foram consideradas as médias ponderadas de cada candidato, uma vez que os pesos da
1.ª e da 2.ª fases foram 2 e 3, respectivamente. Se um candidato tirou 8 na 1.ª fase e 5 na 2.ª, então é
verdade que sua média ponderada foi
(A) 6,2.
(B) 6,5.
(C) 6,8.
(D) 7,1.
(E) 7,4.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 39
09. (SAAE/SP - Fiscal Leiturista – VUNESP) A tabela mostra os valores de algumas latinhas de
bebidas vendidas em um clube e a quantidade consumida por uma família, em certo dia.
Bebidas (latinha) Valor unitário Quantidade Consumida
Refrigerante R$ 4,00 8
Suco R$ 5,00 6
Cerveja X 4
Considerando-se o número total de latinhas consumidas por essa família nesse dia, na média, o preço
de uma latinha saiu por R$ 5,00. Então, o preço de uma latinhade cerveja era
(A) R$ 5,00.
(B) R$ 5,50.
(C) R$ 6,00.
(D) R$ 6,50.
(E) R$ 7,00.
10. (Instituto de Pesquisas Tecnológicas – Secretária – VUNESP) Em um edifício residencial, 14
unidades pagam uma taxa mensal de condomínio no valor de 930 reais. Para as 28 unidades restantes,
que são menores, a taxa mensal de condomínio também é menor. Sabendo-se que o valor médio da taxa
mensal de condomínio, nesse edifício, é de 750 reais, é correto afirmar que o valor em reais que cada
unidade menor paga mensalmente de condomínio é igual a
(A) 600.
(B) 620.
(C) 660.
(D) 700.
(E) 710.
Respostas
01. Resposta: C.
3.800+5.900
3+5
=
2400+4500
8
=
6900
8
= 862,5
02. Resposta: D.
Média aritmética ponderada: multiplicamos o porcentual pelo prazo e dividimos pela soma dos
porcentuais.
15.0+20.30+35.60+20.90+10.120
15+20+35+20+10
=
=
600+2100+1800+1200
100
=
=
5700
100
= 57
03. Resposta: C.
Também média aritmética ponderada.
180.15+150.24+70.30
180+150+70
=
=
2700+3600+2100
400
=
=
8400
400
= 21
04. Resposta: B.
Na média ponderada multiplicamos o peso da prova pela sua nota e dividimos pela soma de todos os
pesos, assim temos:
𝑀𝑃 =
8.1 + 6,5.2 + 9.3
1 + 2 + 3
=
8 + 13 + 27
6
=
48
6
= 8,0
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 40
05. Resposta: B.
𝑀 =
5.180 + 5.200 + 10.220 + 10.240 + 4.300 + 6.400
5 + 5 + 10 + 10 + 4 + 6
=
10100
40
= 252,50
06. Resposta: C.
𝑀é𝑑𝑖𝑎 =
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
20
1490 =
2𝑥 + 8 ∙ 1700 + 10 ∙ 1200
20
2𝑥 + 13600 + 12000 = 29800
2𝑥 = 4200
𝑥 = 2100
Cada um dos gerentes recebem R$ 2100,00
07. Resposta: C.
2.77 + 3.62 + 1.72 + 4. 𝑥
2 + 3 + 1 + 4
= 80
412 + 4. 𝑥
10
= 80
4x + 412 = 80 . 10
4x = 800 – 412
x = 388 / 4
x = 97
08. Resposta: A.
𝑀𝑝 =
2.8 + 3.5
2 + 3
=
16 + 15
5
=
31
5
= 6,2
09. Resposta: E.
8.4 + 6.5 + 4. 𝑥
8 + 6 + 4
= 5
62 + 4. 𝑥
18
= 5
4.x = 90 – 62
x = 28 / 4
x = R$ 7,00
10. Resposta: C.
𝟏𝟒 . 𝟗𝟑𝟎 + 𝟐𝟖 . 𝒙
𝟏𝟒 + 2𝟖
= 𝟕𝟓𝟎
𝟏𝟑𝟎𝟐𝟎 + 𝟐𝟖 . 𝒙
𝟒𝟐
= 𝟕𝟓𝟎
13020 + 28.x = 42 . 750
28.x = 31500 – 13020
x = 18480 / 28
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 41
x = R$ 660,00
MÉDIA GEOMÉTRICA
Este tipo de média é calculado multiplicando-se todos os n valores e extraindo-se a raiz de
índice n deste produto. (n≥2)
Em uma fórmula: a média geométrica de a1, a2, ..., an é
A média geométrica de um conjunto de números é sempre menor ou igual à média aritmética dos
membros desse conjunto (as duas médias são iguais se e somente se todos os membros do conjunto são
iguais). Isso permite a definição da média aritmética geométrica, uma mistura das duas que sempre tem
um valor intermediário às duas.
A média geométrica é também a média aritmética harmônica no sentido que, se duas sequências (an)
e (hn) são definidas:
e
Então an e hn convergem para a média geométrica de x e y.
Exemplo:
Digamos que tenhamos os números 4, 6 e 9, para obtermos o valor médio aritmético deste conjunto,
multiplicamos os elementos e obtemos o produto 216.
Pegamos então este produto e extraímos a sua raiz cúbica, chegando ao valor médio 6.
Extraímos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos,
extrairíamos a raiz de índice n.
Neste exemplo teríamos a seguinte solução:
Utilidades da Média Geométrica
Progressão Geométrica
Uma das utilizações deste tipo de média é na definição de uma progressão geométrica que diz que
em toda PG., qualquer termo é média geométrica entre o seu antecedente e o seu consequente:
Tomemos como exemplo três termos consecutivos de uma PG.: 7, 21 e 63.
Temos então que o termo 21 é média geométrica dos termos 7 e 63.
Vejamos:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 42
Variações Percentuais em Sequência
Outra utilização para este tipo de média é quando estamos trabalhando com variações percentuais em
sequência.
Exemplo
Digamos que uma categoria de operários tenha um aumento salarial de 20% após um mês, 12% após
dois meses e 7% após três meses. Qual o percentual médio mensal de aumento desta categoria?
Sabemos que para acumularmos um aumento de 20%, 12% e 7% sobre o valor de um salário,
devemos multiplicá-lo sucessivamente por 1,2, ; 1,12 e 1,07 que são os fatores correspondentes a tais
percentuais.
A partir daí podemos calcular a média geométrica destes fatores:
Como sabemos, um fator de 1, 128741 corresponde a 12, 8741% de aumento.
Este é o valor percentual médio mensal do aumento salarial, ou seja, se aplicarmos três vezes
consecutivas o percentual 12, 8741%, no final teremos o mesmo resultado que se tivéssemos aplicado
os percentuais 20%, 12% e 7%.
Digamos que o salário desta categoria de operários seja de R$ 1.000,00, aplicando-se os sucessivos
aumentos temos:
Salário Inicial + %
Informado
Salário final Salário inicial + % médio Salário final
R$ 1.000,00 20% R$ 1.200,00 R$ 1.000,00 12, 8417 R$ 1.128,74
R$ 1.200,00 12% R$ 1.334,00 R$ 1.287,74 12, 8417 R$ 1.274,06
R$ 1.334,00 7% R$ 1.438,00 R$ 1.274,06 12, 8417 R$ 1.438,08
Observe que o resultado final de R$ 1.438,08 é o mesmo nos dois casos. Se tivéssemos utilizado a
média aritmética no lugar da média geométrica, os valores finais seriam distintos, pois a média aritmética
de 13% resultaria em um salário final de R$ 1.442,90, ligeiramente maior como já era esperado, já que o
percentual de 13% utilizado é ligeiramente maior que os 12, 8417% da média geométrica.
Cálculo da Média Geométrica Triangular
Bom... primeiro observamos o mapa e somamos as áreas dos quadrados catetos e dividimos pela
hipotenusa e no final pegamos a soma dos ângulos subtraindo o que está entre os catetos e dividimos
por PI (3,1415...) assim descobrimos a média geométrica dos triângulos.
Exemplo:
A média geométrica entre os números 12, 64, 126 e 345, é dada por:
G = R4[12 ×64×126×345] = 76,013
Aplicação Prática:
Dentre todos os retângulos com a área igual a 64 cm², qual é o retângulo cujo perímetro é o menor
possível, isto é, o mais econômico? A resposta a este tipo de questão é dada pela média geométrica entre
as medidas do comprimento a e da largura b, uma vez que a.b = 64.
A média geométrica G entre a e b fornece a medida desejada.
G = R[a × b] = R[64] = 8
Resposta:
É o retângulo cujo comprimento mede 8 cm e é lógico que a altura também mede 8 cm, logo só pode
ser um quadrado! O perímetro neste caso é p = 32 cm. Em qualquer outra situação em que as medidas
dos comprimentos forem diferentes das alturas, teremos perímetros maiores do que 32 cm.
Interpretação gráfica
A média geométrica entre dois segmentos de reta pode ser obtida geometricamente de uma forma
bastante simples.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 43
Sejam AB e BC segmentos de reta. Trace um segmento de reta que contenha a junção dos segmentos
AB e BC, de forma que eles formem segmentos consecutivos sobre a mesma reta.
Dessa junção aparecerá um novo segmento AC. Obtenha o ponto médio O deste segmento e com um
compasso centrado em O e raio OA, trace uma semicircunferência começando em A e terminando em C.
O segmento vertical traçado para cima a partir de B encontrará o ponto D na semicircunferência. A medida
do segmento BD corresponde à média geométrica das medidas dos segmentos AB e BC.
MÉDIA HARMÔNICA
A média harmônica é o inverso da Média Geométrica dada pela fórmula:
𝐻 =
1
𝑥1
+
1
𝑥2
+ ⋯ +
1
𝑥𝑝
𝑛
Exemplo:
Calcular a média entre os números 3 e 4
A média entre seus inversos é:
1
3
+
1
4
2
=
7
24
Logo a Média Harmônica é: 𝐻 = (
7
24
)
−1
=
24
7
≅ 3,42
Questão
01. Na figura abaixo os segmentos AB e DA são tangentes à circunferênciadeterminada pelos pontos
B, C e D. Sabendo-se que os segmentos AB e CD são paralelos, pode-se afirmar que o lado BC é:
A) a média aritmética entre AB e CD.
B) a média geométrica entre AB e CD.
C) a média harmônica entre AB e CD.
D) o inverso da média aritmética entre AB e CD.
E) o inverso da média harmônica entre AB e CD.
Resposta
01. Resposta: B.
Sendo AB paralela a CD, se traçarmos uma reta perpendicular a AB, esta será perpendicular a CD
também.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 44
Traçamos então uma reta perpendicular a AB, passando por B e outra perpendicular a AB passando
por D:
Sendo BE perpendicular a AB temos que BE irá passar pelo centro da circunferência, ou seja, podemos
concluir que o ponto E é ponto médio de CD.
Agora que ED é metade de CD, podemos dizer que o comprimento AF vale AB-CD/2.
Aplicamos Pitágoras no triângulo ADF:
(1)
Aplicamos agora no triângulo ECB:
(2)
Agora diminuímos a equação (1) da equação (2):
Note, no desenho, que os segmentos AD e AB possuem o mesmo comprimento, pois são tangentes à
circunferência. Vamos então substituir na expressão acima AD = AB:
Ou seja, BC é a média geométrica entre AB e CD.
SÉRIES ESTATÍSTICAS
A Estatística tem objetivo sintetizar os valores que uma ou mais variáveis possam assumir, para que
tenhamos uma visão global da variação dessa ou dessas variáveis. Esses valores irão fornecer
informações rápidas e seguras.
Tabela: é um quadro que resume um conjunto de observações. Uma tabela compõe-se de:
1) Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo;
2) Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
3) Coluna indicadora – parte da tabela que especifica o conteúdo das linhas;
4) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal;
5) Casa ou célula – espaço destinado a um só número;
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 45
6) Título – Conjunto de informações, as mais completas possíveis, que satisfazem as seguintes
perguntas: O quê? Quando? Onde? localizando-se no topo da tabela.
Elementos complementares: de preferência colocados no rodapé.
- Fonte;
- Notas;
- Chamadas.
Séries Estatísticas: toda tabela que apresenta a distribuição de um conjunto de dados estatísticos
em função da época, do local ou da espécie.
Observamos três elementos:
- tempo;
- espaço;
- espécie.
Conforme varie um dos elementos da série, podemos classifica-la em:
- Histórica;
- Geográfica;
- Específica.
- Séries históricas, cronológicas, temporais ou marchas: Os valores da variável são descritos em,
determinado local, em intervalos de tempo.
Fonte: IBGE
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 46
- Séries geográficas, espaciais, territoriais ou de localização: valores da variável, em determinado
instante, discriminados segundo regiões.
- Séries específicas ou categóricas: aquelas que descrevem valores da variável, em determinado
tempo e local, segundo especificações ou categorias.
- Séries conjugadas – Tabela de dupla entrada: utilizamos quando temos a necessidade de
apresentar, em uma única tabela, variações de mais de uma variável. Com isso conjugamos duas séries
em uma única tabela, obtendo uma tabela de dupla entrada, na qual ficam criadas duas ordens de
classificação: uma horizontal e uma vertical.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 47
Dados absolutos e dados relativos
Aos dados resultantes da coleta direta da fonte, sem manuseio senão contagem ou medida, são
chamados dados absolutos. Não é dado muito importância a estes dados, utilizando-se de os dados
relativos.
Dados relativos são o resultado de comparações por quociente (razões) que estabelecem entre dados
absolutos e têm por finalidade facilitar as comparações entre quantidades. Os mesmos podem ser
traduzidos por meio de percentagens, índices, coeficientes e taxas.
- Percentagens:
Considerando a série:
MATRÍCULAS NAS ESCOLAS DA
CIDADE B - 2016
CATEGORIAS
NÚMERO DE
ALUNOS
1º grau 19.286
2º grau 1.681
3º grau 234
Total 21.201
Dados fictícios.
Calculando os percentagens dos alunos de cada grau:
1º 𝑔𝑟𝑎𝑢 →
19.286𝑥100
21.201
= 90,96 = 91,0
2º 𝑔𝑟𝑎𝑢 →
1.681𝑥100
21.201
= 7,92 = 7,9
3º 𝑔𝑟𝑎𝑢 →
234𝑥100
21.201
= 1,10 = 1,1
Formamos com os dados uma nova coluna na série em estudo:
MATRÍCULAS NAS ESCOLAS DA CIDADE B - 2016
CATEGORIAS
NÚMERO DE
ALUNOS
%
1º grau 19.286 91,0
2º grau 1.681 7,9
3º grau 234 1,1
Total 21.201 100,0
Dados fictícios.
Esses novos valores nos dizem que, de cada 100 alunos da cidade B, 91 estão matriculados no 1º
grau, 8 (aproximadamente) no 2º grau e 1 no 3º grau.
- Índices: razões entre duas grandezas tais que uma não inclui a outra.
Exemplos:
𝑄𝑢𝑜𝑐𝑖𝑒𝑛𝑡𝑒 𝑖𝑛𝑡𝑒𝑙𝑒𝑡𝑢𝑎𝑙 =
𝑖𝑑𝑎𝑑𝑒 𝑚𝑒𝑛𝑡𝑎𝑙
𝑖𝑑𝑎𝑑𝑒 𝑐𝑟𝑜𝑛𝑜𝑙ó𝑔𝑖𝑐𝑎
𝑥100
𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒𝑚𝑜𝑔𝑟á𝑓𝑖𝑐𝑎 =
𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜
𝑠𝑢𝑝𝑒𝑟𝑓í𝑐𝑖𝑒
Econômicos:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 48
𝑃𝑟𝑜𝑑𝑢çã𝑜 𝑝𝑒𝑟 𝑐𝑎𝑝𝑖𝑡𝑎 =
𝑣𝑎𝑙𝑜𝑟 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑝𝑟𝑜𝑑𝑢çã𝑜
𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜
𝑅𝑒𝑐𝑒𝑖𝑡𝑎 𝑝𝑒𝑟 𝑐𝑎𝑝𝑖𝑡𝑎 =
𝑟𝑒𝑐𝑒𝑖𝑡𝑎
𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜
- Coeficientes: razões entre o número de ocorrências e o número total (ocorrências e não
ocorrências).
Exemplos:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑛𝑎𝑡𝑎𝑙𝑖𝑑𝑎𝑑𝑒 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑛𝑎𝑠𝑐𝑖𝑚𝑒𝑛𝑡𝑜𝑠
𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑚𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑𝑒 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 ó𝑏𝑖𝑡𝑜𝑠
𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙
Educacionais:
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜 𝑒𝑠𝑐𝑜𝑙𝑎𝑟 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑙𝑢𝑛𝑜𝑠 𝑒𝑣𝑎𝑑𝑖𝑑𝑜𝑠
𝑛ú𝑚𝑒𝑟𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑑𝑒 𝑚𝑎𝑡𝑟í𝑐𝑢𝑙𝑎𝑠
- Taxas: coeficientes multiplicados por um potência de 10 (10,100, 1000, ...) para tornar o resultado
mais inteligível.
Exemplos:
Taxa de mortalidade = coeficiente de mortalidade x 1000.
Taxa de natalidade = coeficiente de natalidade x 1000.
1) Em cada 200 celulares vendidos, 4 apresentam defeito.
Coeficiente de defeitos: 4/200 = 0,02
Taxa de defeitos = 2% (0,02 x 100)
Referências
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
Questão
01. O estado A apresentou 733.986 matriculas no 1º ano no início de 2009 e 683.816 no final do ano.
O estado B apresentou, respectivamente, 436.127 e 412.457 matriculas. Qual estado apresentou maior
evasão escolar?
Resposta
01. Resposta: Evasão estado A: 6,8% e Evasão estado B: 5,5%.
𝑬𝒔𝒕𝒂𝒅𝒐 𝑨: 𝑇𝑎𝑥𝑎 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜:
683816
733986
= 0,931647𝑥100 = 93,16472 𝑠𝑢𝑏𝑡𝑟𝑎𝑖𝑚𝑜𝑠 𝑑𝑒 100 = 6,8%
𝑬𝒔𝒕𝒂𝒅𝒐 𝑩: 𝑇𝑎𝑥𝑎 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜:
412457
436127
= 0,945727𝑥100 = 94,57268 𝑠𝑢𝑏𝑡𝑟𝑎𝑖𝑚𝑜𝑠 𝑑𝑒 100 = 5,4%
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 49
TABELAS E GRÁFICOS
O nosso cotidiano é permeado das mais diversas informações, sendo muito delas expressas em
formas de tabelas e gráficos, as quais constatamos através do noticiários televisivos, jornais, revistas,
entre outros. Os gráficos e tabelas fazem parte da linguagem universal da Matemática, e compreensão
desses elementos é fundamental para a leitura de informações e análise de dados.
A parte da Matemática que organiza e apresenta dados numéricos e a partir deles fornecer conclusões
é chamada de Estatística.
Tabelas: as informações nela são apresentadas em linhas e colunas, possibilitando uma melhor
leitura e interpretação. Exemplo:
Fonte: SEBRAE
Observação: nas tabelas e nos gráficos podemos notar que a um título e uma fonte. Otítulo é utilizado
para evidenciar a principal informação apresentada, e a fonte identifica de onde os dados foram obtidos.
Tipos de Gráficos
Gráfico de linhas: são utilizados, em geral, para representar a variação de uma grandeza em certo
período de tempo.
Marcamos os pontos determinados pelos pares ordenados (classe, frequência) e os ligados por
segmentos de reta. Nesse tipo de gráfico, apenas os extremos dos segmentos de reta que compõem a
linha oferecem informações sobre o comportamento da amostra. Exemplo:
Gráfico de barras: também conhecido como gráficos de colunas, são utilizados, em geral, quando há
uma grande quantidade de dados. Para facilitar a leitura, em alguns casos, os dados numéricos podem
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 50
ser colocados acima das colunas correspondentes. Eles podem ser de dois tipos: barras verticais e
horizontais.
- Gráfico de barras verticais: as frequências são indicadas em um eixo vertical. Marcamos os pontos
determinados pelos pares ordenados (classe, frequência) e os ligamos ao eixo das classes por meio de
barras verticais. Exemplo:
- Gráfico de barras horizontais: as frequências são indicadas em um eixo horizontal. Marcamos os
pontos determinados pelo pares ordenados (frequência, classe) e os ligamos ao eixo das classes por
meio de barras horizontais. Exemplo:
Observação: em um gráfico de colunas, cada barra deve ser proporcional à informação por ela
representada.
Gráfico de setores: são utilizados, em geral, para visualizar a relação entre as partes e o todo.
Dividimos um círculo em setores, com ângulos de medidas diretamente proporcionais às frequências
de classes. A medida α, em grau, do ângulo central que corresponde a uma classe de frequência F é
dada por:
𝛼 =
360°
𝐹𝑡
. 𝐹
Onde:
Ft = frequência total
Exemplo:
Preferência por modalidades esportivas
Esportes
Número de
praticantes (F)
Frequência
relativa
Futebol 160 40%
Vôlei 120 30%
Basquete 60 15%
Natação 40 10%
Outros 20 5%
Total (Ft) 400 100%
Dados fictícios
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 51
Para acharmos a frequência relativa, podemos fazer uma regra de três simples:
400 --- 100%
160 --- x
x = 160 .100/ 400 = 40% , e assim sucessivamente.
Aplicando a fórmula teremos:
−𝐹𝑢𝑡𝑒𝑏𝑜𝑙: 𝛼 =
360°
𝐹𝑡
. 𝐹 → 𝛼 =
360°
400
. 160 → 𝛼 = 144°
−𝑉ô𝑙𝑒𝑖: 𝛼 =
360°
𝐹𝑡
. 𝐹 → 𝛼 =
360°
400
. 120 → 𝛼 = 108°
−𝐵𝑎𝑠𝑞𝑢𝑒𝑡𝑒: 𝛼 =
360°
𝐹𝑡
. 𝐹 → 𝛼 =
360°
400
. 60 → 𝛼 = 54°
−𝑁𝑎𝑡𝑎çã𝑜: 𝛼 =
360°
𝐹𝑡
. 𝐹 → 𝛼 =
360°
400
. 20 → 𝛼 = 18°
Como o gráfico é de setores, os dados percentuais serão distribuídos levando-se em conta a proporção
da área a ser representada relacionada aos valores das porcentagens. A área representativa no gráfico
será demarcada da seguinte maneira:
Com as informações, traçamos os ângulos da circunferência e assim montamos o gráfico:
Pictograma ou gráficos pictóricos: em alguns casos, certos gráficos, encontrados em jornais,
revistas e outros meios de comunicação, apresentam imagens relacionadas ao contexto. Eles são
desenhos ilustrativos. Exemplo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 52
Histograma: o consiste em retângulos contíguos com base nas faixas de valores da variável e com
área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada
densidade de frequência ou simplesmente densidade definida pelo quociente da área pela amplitude da
faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do histograma, o
que pode ocasionar distorções (e, consequentemente, más interpretações) quando amplitudes diferentes
são utilizadas nas faixas. Exemplo:
Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das
classes. Exemplo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 53
Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal
ascendente utilizando os pontos extremos.
Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando o
objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
Interpretação de tabelas e gráficos
Para uma melhor interpretação de tabelas e gráficos devemos ter em mente algumas considerações:
- Observar primeiramente quais informações/dados estão presentes nos eixos vertical e horizontal,
para então fazer a leitura adequada do gráfico;
- Fazer a leitura isolada dos pontos.
- Leia com atenção o enunciado e esteja atento ao que pede o enunciado.
Exemplos:
(Enem 2011) O termo agronegócio não se refere apenas à agricultura e à pecuária, pois as
atividades ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural,
industrialização e comercialização dos produtos.
O gráfico seguinte mostra a participação percentual do agronegócio no PIB brasileiro:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 54
Centro de Estudos Avançados em Economia Aplicada (CEPEA).
Almanaque abril 2010. São Paulo: Abril, ano 36 (adaptado)
Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma queda da participação do
agronegócio no PIB brasileiro e a posterior recuperação dessa participação, em termos percentuais.
Segundo o gráfico, o período de queda ocorreu entre os anos de
A) 1998 e 2001.
B) 2001 e 2003.
C) 2003 e 2006.
D) 2003 e 2007.
E) 2003 e 2008.
Resolução:
Segundo o gráfico apresentado na questão, o período de queda da participação do agronegócio no
PIB brasileiro se deu no período entre 2003 e 2006. Esta informação é extraída através de leitura direta
do gráfico: em 2003 a participação era de 28,28%, caiu para 27,79% em 2004, 25,83% em 2005,
chegando a 23,92% em 2006 – depois deste período, a participação volta a aumentar.
Resposta: C
(Enem 2012) O gráfico mostra a variação da extensão média de gelo marítimo, em milhões de
quilômetros quadrados, comparando dados dos anos 1995, 1998, 2000, 2005 e 2007. Os dados
correspondem aos meses de junho a setembro. O Ártico começa a recobrar o gelo quando termina o
verão, em meados de setembro. O gelo do mar atua como o sistema de resfriamento da Terra, refletindo
quase toda a luz solar de volta ao espaço. Águas de oceanos escuros, por sua vez, absorvem a luz solar
e reforçam o aquecimento do Ártico, ocasionando derretimento crescente do gelo.
Com base no gráfico e nas informações do texto, é possível inferir que houve maior aquecimento global
em
A)1995.
B)1998.
C) 2000.
D)2005.
E)2007.
Resolução:
O enunciado nos traz uma informação bastante importante e interessante, sendo chave para a
resolução da questão. Ele associa a camada de gelo marítimo com a reflexão da luz solar e
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 55
consequentemente ao resfriamento da Terra. Logo, quanto menor for a extensão de gelo marítimo, menor
será o resfriamento e portanto maior será o aquecimento global.
O ano que, segundo o gráfico, apresenta a menor extensão de gelo marítimo, é 2007.
Resposta: E
Mais alguns exemplos:
1) Todos os objetos estão cheios de água.
Qual deles pode conter exatamente 1 litro de água?
(A) A caneca
(B) A jarra
(C) O garrafão
(D) O tambor
O caminho é identificar grandezas que fazem parte do dia a dia e conhecer unidades de medida, no
caso, o litro. Preste atenção na palavra exatamente, logo a resposta está na alternativa B.
2) No gráfico abaixo, encontra-se representada, em bilhões de reais, a arrecadação de impostos
federais no período de 2003 a 2006. Nesse período, a arrecadação anual deimpostos federais:
(A) nunca ultrapassou os 400 bilhões de reais.
(B) sempre foi superior a 300 bilhões de reais.
(C) manteve-se constante nos quatro anos.
(D) foi maior em 2006 que nos outros anos.
(E) chegou a ser inferior a 200 bilhões de reais.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 56
Analisando cada alternativa temos que a única resposta correta é a D.
Referências
https://www.infoenem.com.br
http://mundoeducacao.bol.uol.com.br
Questões
01. (Pref. Fortaleza/CE – Pedagogia – Pref. Fortaleza) “Estar alfabetizado, neste final de século,
supõe saber ler e interpretar dados apresentados de maneira organizada e construir representações, para
formular e resolver problemas que impliquem o recolhimento de dados e a análise de informações. Essa
característica da vida contemporânea traz ao currículo de Matemática uma demanda em abordar
elementos da estatística, da combinatória e da probabilidade, desde os ciclos iniciais” (BRASIL, 1997).
Observe os gráficos e analise as informações.
A partir das informações contidas nos gráficos, é correto afirmar que:
(A) nos dias 03 e 14 choveu a mesma quantidade em Fortaleza e Florianópolis.
(B) a quantidade de chuva acumulada no mês de março foi maior em Fortaleza.
(C) Fortaleza teve mais dias em que choveu do que Florianópolis.
(D) choveu a mesma quantidade em Fortaleza e Florianópolis.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 57
02. (DEPEN – Agente Penitenciário Federal – CESPE)
Ministério da Justiça — Departamento Penitenciário Nacional
— Sistema Integrado de Informações Penitenciárias – InfoPen,
Relatório Estatístico Sintético do Sistema Prisional Brasileiro,
dez./2013 Internet:<www.justica.gov.br> (com adaptações)
A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por
região em 2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de
vagas no sistema penitenciário e a quantidade de detentos no sistema penitenciário — registrado
em todo o Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil
habitantes.
Com base nessas informações e na tabela apresentada, julgue o item a seguir.
Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste.
( )certo ( ) errado
03. (TJ/SP – Estatístico Judiciário – VUNESP) A distribuição de salários de uma empresa com
30 funcionários é dada na tabela seguinte.
Salário (em salários mínimos) Funcionários
1,8 10
2,5 8
3,0 5
5,0 4
8,0 2
15,0 1
Pode-se concluir que
(A) o total da folha de pagamentos é de 35,3 salários.
(B) 60% dos trabalhadores ganham mais ou igual a 3 salários.
(C) 10% dos trabalhadores ganham mais de 10 salários.
(D) 20% dos trabalhadores detêm mais de 40% da renda total.
(E) 60% dos trabalhadores detêm menos de 30% da renda total.
04. (TJ/SP – Estatístico Judiciário – VUNESP) Considere a tabela de distribuição de frequência
seguinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados.
xi fi
30-35 4
35-40 12
40-45 10
45-50 8
50-55 6
TOTAL 40
Assinale a alternativa em que o histograma é o que melhor representa a distribuição de
frequência da tabela.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 58
(A)
(B)
(C)
(D)
(E)
05. (SEJUS/ES – Agente Penitenciário – VUNESP) Observe os gráficos e analise as afirmações
I, II e III.
I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001,
foi maior que 1000%.
II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior.
III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencia l e à
distância foi de 2 para 5.
É correto o que se afirma em
(A) I e II, apenas.
(B) II, apenas.
(C) I, apenas.
(D) II e III, apenas.
(E) I, II e III.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 59
06. (DEPEN – Agente Penitenciário Federal – CESPE)
A partir das informações e do gráfico apresentados, julgue o item que se segue.
Se os percentuais forem representados por barras verticais, conforme o gráfico a seguir, então
o resultado será denominado histograma.
( ) Certo ( ) Errado
Respostas
01. Resposta: C.
A única alternativa que contém a informação correta com ao gráficos é a C.
02. Resposta: CERTO.
555----100%
306----x
X=55,13%
03. Resposta: D.
(A) 1,8*10+2,5*8+3,0*5+5,0*4+8,0*2+15,0*1=104 salários
(B) 60% de 30, seriam 18 funcionários, portanto essa alternativa é errada, pois seriam 12.
(C)10% são 3 funcionários
(D) 40% de 104 seria 41,6
20% dos funcionários seriam 6, alternativa correta, pois5*3+8*2+15*1=46, que já é maior.
(E) 6 dos trabalhadores: 18
30% da renda: 31,20, errada pois detêm mais.
04. Resposta: A.
A menor deve ser a da primeira 30-35
Em seguida, a de 55
Depois de 45-50 na ordem 40-45 e 35-40
05. Resposta: E.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 60
I- 69,8------100%
781,6----x
X=1119,77
II- 781,6-680,7=100,9
III-
10
25
=
2
5
06. Resposta: ERRADO.
Como foi visto na teoria, há uma faixa de valores no eixo x e não simplesmente um dado.
REGRESSÃO LINEAR SIMPLES
Em estatística ou Econometria, regressão linear é um método para se estimar a condicional (valor
esperado) de uma variável y, dados os valores de algumas outras variáveis x. A regressão, em geral,
trata da questão de se estimar um valor condicional esperado.
A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é
uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos
parâmetros se chamam modelos de regressão não-linear.
Equação da Regressão Linear: Para se estimar o valor esperado, usa-se de uma equação, que
determina a relação entre ambas as variáveis.
Em que: Yi - Variável explicada (dependente); é o valor que se quer atingir;
α - É uma constante, que representa a interceptação da reta com o eixo vertical;
β - É outra constante, que representa o declive da reta;
Xi - Variável explicativa (independente), representa o factor explicativo na equação;
εi - Variável que inclui todos os factores residuais mais os possíveis erros de medição. O seu
comportamento é aleatório, devido à natureza dos factores que encerra. Para que essa fórmula possa
ser aplicada, os erros devem satisfazer determinadas hipóteses, que são: serem variáveis normais, com
a mesma variância (desconhecida), independentes e independentes da variável explicativa X.
Cálculo dos fatores α e β:
Definindo e , temos que e se relacionam por:
Desenvolvimento: Estas fórmulas podem ser desenvolvidas a partir da definição de mínimos
quadrados. O objectivo é determinar α e β de forma que a soma dos quadrados dos erros seja mínima,
ou seja, devemos minimizar.
Desenvolvendo este quadrado e eliminando os termos constantes (ou seja, aqueles que não têm
termos em α e β, chega-se a:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 61
A partir desse ponto, pode-se resolver usando-se cálculo (tomando as derivadas parciais, etc), ou
através de uma transformação de coordenadas:
ou
Transformando a expressão a ser minimizada em:
ou
Esta expressão se separa na soma de duas expressões quadráticas independentes, que podem ser
minimizadas usando matemática elementar:
Cujos valores minimizadores são:
Memorização:
Uma forma fácil de memorizar esta expressão é escrever:
Y = α + Xβ
XY = Xα + X2β
e, em seguida, somar as colunas:
Intervalos de confiança:
O valor estimado de , , deve ser analisado através da distribuição t de Student,porque
tem a distribuição t de Student com n-2 graus de liberdade (ver Fisher, R. A. (1925). "Applications of
"Student's" distribution". Metron 5: 90–104.), em que:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 62
A variância de , pode ser estimada através dos erros observados:
se distribui como uma Chi quadrado com n-2 graus de liberdade.
TESTES DE HIPÓTESES PARA MÉDIAS E PROPORÇÕES.
Em estatística, um Teste de Hipóteses é um método para verificar se os dados são compatíveis com
alguma hipótese, podendo muitas vezes sugerir a não-validade de uma hipótese. O teste de hipóteses é
um procedimento estatístico baseado na análise de uma amostra, através da teoria de probabilidades,
usado para avaliar determinados parâmetros que são desconhecidos numa população. A expressão teste
de significância foi criada por Ronald Fisher: "Critical tests of this kind may be called tests of significance,
and when such tests are available we may discover whether a second sample is or is not significantly
different from the first”. Um Teste de Hipóteses pode ser paramétrico ou não-paramétrico. Testes
paramétricos são baseados em parâmetros da amostra, por exemplo média e desvio padrão. O uso tanto
dos testes paramétricos como dos não-paramétricos está condicionado à dimensão da amostra e à
respectiva distribuição da variável em estudo.
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese
alternativa H1.
Hipótese nula (H0): é a hipótese que traduz a ausência do efeito que se quer verificar.
Hipótese alternativas (H1): é a hipótese que o investigador quer verificar.
Nível de significância: a probabilidade de rejeitar a hipótese nula quando ela é efetivamente verdadeira
(ERRO)
Finalidade: avaliar afirmações sobre os valores de parâmetros.
O valor-p é uma estatística muito utilizada para sintetizar o resultado de um teste de hipóteses.
Formalmente, o valor-p é definido como a probabilidade de se obter uma estatística de teste igual ou mais
extrema quanto àquela observada em uma amostra, assumindo verdadeira a hipótese nula.
ESTATÍSTICA DO TESTE
É o valor calculado a partir da amostra que será usado na tomada de decisão.
No exemplo, Zcalc = -2,5.
Zcalc = valor da estimativa - valor alegado para o parâmetro desvio-padrão do estimador.
Erros cometidos nos testes de hipóteses
São dois os tipos de erros que podemos cometer na realização de um teste de hipóteses:
1. Rejeitar a hipótese H0, quando ela é verdadeira.
2. Não rejeitar a hipótese H0, quando ela é falsa.
A Tabela a seguir resume as situações acima.
Aceitar H0 Rejeitar H0
H0 verdadeira Decisão correta Erro do tipo I
H0 falsa Erro do tipo II Decisão correta
Se a hipótese H0 for verdadeira e aceita, ou for falsa e rejeitada, a decisão estará correta. No entanto,
se a hipótese H0 for rejeitada sendo verdadeira, ou se for aceita sendo falsa, a decisão estará errada. O
primeiro destes erros é chamado de Erro do Tipo I e a probabilidade de cometê-lo é denotada pela letra
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 63
grega α (alfa); o segundo é chamado de Erro do Tipo II e a probabilidade de cometê-lo é denotada pela
letra grega β (beta). Assim temos,
Considere um teste unilateral dado pelas hipóteses:
Neste caso, a região de rejeição é determinada por , e a interpretação dos erros pode ser
vista como:
A situação ideal é aquela em que ambas as probabilidades, α e β, são próximas de zero. No entanto,
é fácil ver que a medida que diminuímos α, β aumenta. A Figura a seguir apresenta esta relação.
Para um teste de hipóteses do tipo acima, onde estamos interessados em testar a média de uma
população, utilizamos a expressão,
que é a estatística do teste de hipóteses. A partir do Teorema Central do Limite, sabemos que, desde
que tenhamos um tamanho amostral suficientemente grande, esta estatística tem distribuição Normal
padrão, isto é,
A partir dos valores de Z e da especificação do erro cometido, podemos definir a região crítica.
Vamos considerar que o erro mais importante a ser evitado seja o Erro do Tipo I. A probabilidade de
ocorrer o erro do tipo I (α) é denominada nível de significância do teste. O complementar do nível de
significância (1 - α) é denominado nível de confiança. Supondo que o nível de significância α seja
conhecido, temos condições de determinar o(s) valor(es) crítico(s).
TESTE PARA MÉDIA E PROPORÇÃO POPULACIONAL
Considere uma população da qual retiramos uma amostra X1, X2, ..., Xn. Estamos interessados em
realizar inferência sobre a média populacional μ.
Se não conhecemos o valor do desvio padrão populacional σ e a amostra é pequena, n < 30, devemos
substituir a expressão
pela expressão
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 64
onde T tem distribuição t de Student com n-1 graus de liberdade. Para facilitar a execução do teste,
podemos seguir os passos:
1. Estabelecer as hipóteses:
Fixamos H0: μ = μ0. Dependendo da informação que fornece o problema que estivermos estudando, a
hipótese alternativa pode ter uma das três formas abaixo:
H1: μ ≠ μ0 (teste bilateral);
H1: μ > μ0 (teste unilateral à direita);
H1: μ < μ0 (teste unilateral à esquerda).
2. Fixar o nível de significância α.
3. Determinar a região crítica.
Se o teste é bilateral, determinamos os pontos críticos e tais que
a partir da distribuição t de Student com n-1 graus de liberdade.
Se o teste é unilateral, determinamos o ponto crítico tal que .
Se o teste é unilateral à esquerda, determinamos o ponto tal que .
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 65
4. Calcular, sob a hipótese nula, o valor:
Onde:
: valor da média amostral.
μ0: valor da média populacional sob a hipótese nula.
s: valor do desvio padrão amostral.
n: tamanho da amostra.
5. Critério:
Teste bilateral: se ou se , rejeitamos H0. Caso contrário, aceitamos
H0.
Teste unilateral à direita: se , rejeitamos H0. Caso contrário, aceitamos H0.
Teste unilateral à esquerda: se , rejeitamos H0. Caso contrário, aceitamos H0.
6. O p-valor no teste bilateral é dado por
Se o teste é unilateral à direita, o p-valor é dado por
e, se o teste é unilateral à esquerda, o p-valor é dado por
7. O intervalo de confiança é dado por
se o teste é bilateral. Se o teste é unilateral à direita, então o intervalo de confiança para o parâmetro
μ é dado por
e, se o teste é unilateral à esquerda, então o intervalo de confiança para o parâmetro μ é dado por
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 66
Teste de hipóteses. Formalmente, o valor-p é definido como a probabilidade de se obter uma estatística
de teste igual ou mais extrema quanto àquela observada em uma amostra, assumindo verdadeira a
hipótese nula.
Questão
01. (CNMP – Analista – FCC) A probabilidade de sucesso em um experimento é igual a p. Sejam as
hipóteses H0 : p = 2/3 (hipótese nula) e H1 : p = 1/2 (hipótese alternativa). Estabelece-se que H0 é aceita
se e somente se, pelo menos, 2 sucessos forem obtidos em 3 vezes em que o experimento é executado.
A probabilidade de H0 ser rejeitada, dado que H0 é verdadeira, é
(A) 3/8
(B) 2/3
(C) 20/27
(D) 5/9
(E) 7/27
Resposta
01. Resposta: E.
A questão afirmou que H0 é verdadeira, logo:
- sucesso = 2/3 - fracasso = 1/3
P(0) = Combinação3,0 . p0 . q3
P(0) = 1 * 1 * (1/3)³ = 1/27
P(1) = C3,1 . p¹ . q²
P(1) = 3 . (2/3) . (1/3)² = 2/9
P(0) + P(1) = 1/27 + 2/9 = 7/27
CORRELAÇÃO
Diz-se que existe correlação entre duas ou mais variáveis quando as alterações sofridas por uma delas
são acompanhadas por modificações nas outras.Ou seja, no caso de duas variáveis x e y os aumentos
(ou diminuições) em x correspondem a aumentos (ou diminuições) em y. Assim, a correlação revela se
existe uma relação funcional entre uma variável e as restantes. Note-se que a palavra regressão em
Estatística corresponde à palavra função em Matemática. Ou seja, enquanto o matemático diz que y é
função de x, o estatístico fala em regressão de y sobre x.
Reta de regressão
Uma função muito interessante é a que representa a linha reta, cuja expressão matemática é
y = a + bx em que
y = variável dependente
x = variável independente
a = constante = intercepto (ponto em que a reta corta o eixo
dos y)
b = constante = coeficiente de regressão
sendo que o intercepto a pode ser calculado a partir de: a = y – b . x
Ressalte-se que necessariamente o ponto determinado pela média das variáveis está contido na reta.
A melhor reta que descreve a regressão. Supondo uma amostra em que um caráter métrico tenha a
seguinte distribuição de idades e larguras de um órgão:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 67
Idade
(x)
Largura
(y)
1 30 Em que:
2 40 total de larguras = 520
3 50 total de idades = 36
4 60
5 70 média de larguras = 65
6 80 média de idades = 4,5
7 90
8 100 Supondo a = 20 e b = 10
Quando se deseja desenhar uma reta, para facilitar, atribui-se 2 valores de x próximos aos extremos
dos dados. Depois, usa-se esses valores na equação: y = y + b.(x - x) . Portanto, para a idade x = 1 ano,
largura: y = 65 + 10 (1 - 4,5) = 30 para a idade x = 8 anos, largura: y = 65 + 10 (8 - 4,5) = 100
E chega-se ao seguinte gráfico:
Essa reta, que passa pelos pontos médios dos valores de x e y é a melhor reta que descreve a
regressão. Evidentemente, pode-se usar o mesmo processo em gráficos feitos em programas
computacionais.
Proporcionalidade: Direta e Inversa
Quando se observa o coeficiente de regressão b e o sentido da reta pode-se concluir se existe
correlação entre as variáveis e qual é o sentido da correlação. Nesse caso, verifica-se que a aumentos
na variável Idade (x) correspondem aumentos na variável Largura do órgão (y). Assim sendo, elas têm o
mesmo sentido de variação. Essa é uma correlação positiva. Evidentemente, uma correlação será
negativa quando a aumentos na variável x corresponderem diminuições na variável y. Nesse caso, as
variáveis estudadas variam em sentidos opostos.
Paralelamente, percebe-se que quando a reta de regressão em y é paralela ao eixo dos x (b = 0) não
há correlação. Portanto, para que exista correlação é necessário que a reta corte o eixo dos x em algum
ponto (b ≠ 0). Assim, quando há correlação, a reta de regressão em y não é paralela ao eixo dos x.
Existe correlação?
Para se decidir sobre a existência de correlação e o sentido da variação da reta de regressão, calcula-
se b e o erro de b. Depois efetua-se um teste t, testando as seguintes hipóteses:
H0 : b = 0, ou seja, H. Nula: a reta de regressão em y é paralela ao eixo dos x.
Ha : b ≠ 0, isto é, H. Alternativa: a reta de regressão em y não é paralela ao eixo dos x.
Como calcular
Recordando que as somatórias de quadrados (SQ) e de produtos (SP) são calculadas por:
SQx = x2 – [( x)2 / n]
SQy = y2 – [( y)2 / n]
SP = (x.y) – n.x.y
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 68
O coeficiente de regressão, b, pode ser calculado a partir de várias fórmulas:
b = [(x – x) (y – y)] / (x – x)2
ou
b = ( (x.y) – n.x.y) / x2 – [( x)2 /n]
ou
b = SP / SQx
O erro de b também pode ser calculado de maneiras diferentes:
sb = raiz (syx / SQy) ou
sb = raiz {(SQy – b.SP) / [SQx (n – 2)]}
Para se testar a significância de b, ou seja, para testar se b pode ser considerado ou não como
significativamente diferente de zero, calcula-se t, com GL = n - 2, sendo: t = b / sb
Para encontrar o t crítico, consulta-se a tabela de t, e obedece-se o seguinte critério:
t < tc
t não é significativo
b não é significativamente diferente
de 0
(a reta é paralela ao eixo dos x)
tc t > tc
t é significativo
b é significativamente diferente de
0
(a reta não é paralela ao eixo dos
x)
Portanto:
1. Se t não for significativo os caracteres não estão correlacionados: (t = 0)
Se t for significativo os caracteres estão correlacionados: (t ≠ 0)
2. Sendo t ≠ 0, se b < 0 a correlação é negativa. Os caracteres variam em sentidos opostos.
Sendo t ≠ 0, se b > 0 a correlação é positiva. Os caracteres variam no mesmo sentido.
ausência de correlação correlação positiva correlação negativa
t = 0, qualquer b t ≠ 0, b > 0 t ≠ 0, b < 0
Não há sentido de
variação
As variáveis variam no
mesmo sentido
As variáveis variam
em sentidos opostos
Exemplo: Os seguintes dados foram obtidos amostrando dimensões do mesmo órgão de 10 indivíduos.
comprimento x 40 25 65 75 65 40 50 40 15 25
largura y 25 15 50 65 50 25 40 40 15 15
que geraram os seguintes valores:
x 440 y 340 n 10
x 44 y 34 (x.y) 17950
x2 22850 y2 14350 n.x.y 14960
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 69
x2 / n 19360 y2 /
n
11560 SP 2990
SQx 3490 SQy 2790 SP2 8940100
s2x 387,78 s2y 310
Coeficiente de correlação linear de Pearson ( r )
Pode ser obtido a partir de diferentes fórmulas:
r = n . (x.y) - ( x) ( y) / raiz [n. x2 - ( x)2 ] [ n. y2 - (
y)2 ]
r = ( (x.y) - n.x.y ) / [( n - 1).𝛿x. 𝛿y]
r = raiz ( b.SP / SQy )
r = b.( 𝛿x /𝛿y)
Observando as duas últimas fórmulas rapidamente percebe-se que se não houver correlação entre x
e y, ou seja, se r = 0, então b = 0 e a reta será paralela ao eixo dos x. O coeficiente r varia entre -1 e +1.
Portanto, a correlação pode ser:
-1 -0,95 -0,50 -0,10 0 0,10 0,50 +0,95 +1
neg neg neg neg ausência pos pos pos pos
perfeita forte moderada fraca fraca moderada forte perfeita
Para testar a significância usamos um teste t. Estabelecemos as hipóteses:
H0 : r = 0 , ou seja, H. Nula: Não há correlação entre as variáveis x e y.
Ha : r ≠ 0, isto é, H. Alternativa: Há correlação entre as variáveis x e y.
Calcula-se t, com GL = n - 2, por meio da seguinte fórmula: t = r . raiz [(N - 2) / (1 - r2 )]
Coeficiente de determinação
O coeficiente de determinação é simbolizado por r2 e indica quanto da variação total é comum aos
elementos que constituem os pares analisados. Assim, a qualidade da regressão é indicada por este
coeficiente.
r2 = Variação explicada de Y / Variação total de Y
É importante notar que r2 varia entre 0 (zero) e 1 (um). Evidentemente, quanto mais próximo da unidade
for o coeficiente de Determinação, tanto maior será a validade da regressão.
Exemplo 1: Supondo que numa certa amostra tivessem sido obtidos os seguintes valores:
b = 0,86; SP = 2990; SQy = 2790
Estima-se r = raiz ( b.SP / SQy ), r = raiz ( 0,86.2990 / 2790), r = 0,96
Portanto, r2 = 0,92
1 - 0,92 = 0,08, ou seja 8%
Assim, pode-se dizer que apenas 8% da variância da regressão não depende das variáveis estudadas.
Exemplo 2: Dados obtidos de 7 pares de pai-filho, amostrando o número de anos de escola cursados
pelo pai (x) e o número de anos de escola cursados pelo filho (y). Qual é o valor do coeficiente de
correlação entre esses dados? Qual é o seu significado?
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 70
x x2 y y2 x.y
12 144 12 144 144
10 100 8 64 80
6 36 6 36 36
16 256 11 121 176
8 64 10 100 80
9 81 8 64 72
12 144 11 121 132
x = 73 x2 = 825 y = 66 y2 = 650 (x.y) = 720
r = N . xy - ( x) ( y) /raiz [ N. x2 - ( x)2 ] [ N. y2 - ( y)2 ]
r = 7 . 720 - 73 . 66 / raiz [ 7 . 825 - (73)2 ] [ 7 . 650 - (66)2 ]
r = + 0,754
Para testar a significância usamos um teste t. Estabelecemos as hipóteses:
H0 : r = 0 e Ha : r ≠ 0
t = r . raiz [(N - 2) / (1 - r2 )]
t = [+ 0,754.raiz[(7-2)] / (1 - 0,7542 )], portanto, t = 2,581
Verificando a tabela de t, com GL = 5 e a = 5%, t5 = 2,571
Conclui-se que como t calculado é maior que tc, pode-se rejeitar a hipótese nula (r = 0) e aceitar a
hipótese alternativa em que r ≠ 0, admitindo-se que o número de anos de escola cursados pelo pai está
positivamente correlacionado (r = + 0,754) ao número de anos de escola cursados pelo filho nesta
amostra.
Como r2 = 0,5685 e 1 - 0,5685 = 0,4315, pode-se dizer que nessa amostra, o número de anos de
escola cursados pelo pai explica 56,85% da variância do número de anos de escola cursados pelo filho.
Assim, 43,15% da variância da regressão depende de outras variáveis, não estudadas aqui.
Coeficiente de associação
Para verificar se dois caracteres qualitativos são interdependentes pode-se:
- empregar um teste de x2.
- calcular o coeficiente de associação.
Yule propôs esse coeficiente e o chamou de Q, para homenagear um pioneiro da Estatística, Lambert
A. J. Quételet (1796-1874). Monta-se uma tabela 2 x 2 e designa-se as células pelas letras a, b, c e d,
ficando a-d e b-c nas diagonais.
a b
c d
Obtém-se o coeficiente de associação Q por meio de:
Q = (ad - bc) / (ad + bc)
O desvio padrão de Q é obtido por:
s = (1 - Q2 ) / 2 raiz (1/a + 1/b + 1/c +1/d)
O intervalo de confiança de 95% de Q é obtido por:
Q ± t.s
Exemplo: Supondo que a distribuição de 200 pacientes adultos (92 homens e 108 mulheres) segundo
as formas maligna e benigna de uma doença foi:
Forma / Sexo Homens Mulheres Total
Maligna 60 a 40 b 100
Benigna 32 c 68 d 100
Total 92 108 200
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 71
Q = (ad - bc) / (ad + bc) = (60 x 68) - (40 x 32) / (60 x 68) + (40 x 32)
Q = (4080 - 1280) / ( 4080 + 1280 ) = 2800 / 5360
Q = 0,5224
O desvio padrão de Q é obtido por:
s = (1 - Q2 ) / 2 . raiz (1/a + 1/b + 1/c +1/d)
s = (1 - 0,52242 ) / 2 . raiz (1/60 + 1/40 + 1/32 +1/68)
s = 0,3635 . raiz (0,0167 + 0,0250 + 0,0312 + 0,01470)
s = 0,3635 . raiz 0,0876 = 0,3635 . 0,2960 = 0,1076
O intervalo de confiança de 95% de Q é obtido por:
Q ± t.s = 0,5224 ± 1,96 x 0,1076
Portanto, o valor mínimo é 0,3115 e o valor máximo é 0,7333.
Como o valor calculado de Q (0,5224 ) se encontra entre esses 2 valores (,3115 e 0,7333), conclui-se
que existe associação entre o sexo e as formas da doença, estando o sexo masculino associado à forma
maligna, pois nesse sexo há maior frequência dessa forma.
Questões
01. (SEAD/AP – Fiscal da Receita Estadual – FGV) Se no ajuste de uma reta de regressão linear
simples de uma variável Y em uma variável X o coeficiente de determinação observado foi igual a 0,64,
então o módulo do coeficiente de correlação amostral entre X e Y é igual a:
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80
02. Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição
de um aditivo (X). Para isto, foram realizados ensaios com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo.
Os resultados seguem.
Calcule a equação de regressão.
03. (Colégio Pedro II – Estatístico – IDECAN) As quantidades a seguir foram obtidas a partir de uma
amostra de 60 indivíduos com relação a duas características: X e Y.
O coeficiente de correlação amostral entre x e y é igual a
(A) 0,013.
(B) 0,780.
(C) 0,805.
(D) 0,911.
(E) 0,970.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 72
Respostas
01. Resposta: E.
Numa regressão, o coeficiente de determinação é R² e o coeficiente de correlação é R. Foi dito que R²
= 0,64, o que resulta R = 0,80.
02.
Β =
6.(1754,3)−(21).(496,8)
6.(91)−(21)²
=
93
105
= 0,886
α =
496,8−(0,886).(21)
6
= 79,7
y = 79,7 + 0,886x.
03. Resposta: D.
Coef. de correlação =
66
√82 . 64
= 0,911
MEDIDAS DE POSIÇÃO – CENTRALIDADE
As medidas de posição visam localizar com maior facilidade onde está a maior concentração de valores
de uma dada distribuição, podendo estar ela no início, meio ou fim; e também se esta distribuição está
sendo feita de forma igual.
As medidas de posição mais importantes são as de tendência central, as quais destacamos aqui:
- Média
- Moda;
- Mediana.
MÉDIA ARITMÉTICA (�̅�)
A média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles.
Anteriormente tratamos a média para dados não agrupados, agora veremos para dados agrupados.
1) Sem intervalo de classe: considerando a distribuição relativa a 34 famílias de quatro filhos, e
tomando como variável o número de filhos do sexo masculino, teremos a seguinte tabela:
Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34
As frequências são números indicadores da intensidade de cada valor da variável, elas funcionam
como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada por:
�̅� =
𝚺𝒙𝒊𝒇𝒊
𝚺𝒇𝒊
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 73
O método mais prático de resolvermos é adicionarmos mais uma coluna para obtenção da média
ponderada:
Nº de meninos fi xi.fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
∑ = 34 ∑ = 78
Aplicando a fórmula temos:
�̅� =
Σ𝑥𝑖𝑓𝑖
Σ𝑓𝑖
=
78
34
= 2,29 → �̅� = 2,3 𝑚𝑒𝑛𝑖𝑛𝑜𝑠
Nota: quando a variável apresenta um valor 2 meninos, 3 décimos de meninos, como devemos
interpretar o resultado? Como o valor médio 2,3 meninos sugere (para este caso) que o maior número de
famílias tem 2 meninos e 2 meninas, sendo uma tendência geral, certa superioridade numérica em relação
ao número de meninos.
2) Com intervalos de classe: convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidam com seu ponto médio. Determinamos a média ponderada através da
fórmula:
�̅� =
Σ𝑥𝑖𝑓𝑖
Σ𝑓𝑖
, 𝑜𝑛𝑑𝑒 𝑥𝑖 é 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒.
Exemplo:
i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40
Vamos abrir uma coluna para os pontos médios e outra para os produtos:
i Estaturas (cm) fi xi xi.fi
1 150 ├ 154 4 152 608
2 154 ├ 158 9 156 1404
3 158 ├ 162 11 160 1760
4 162 ├ 166 8 164 1312
5 166 ├ 170 5 168 840
6 170 ├ 174 3 172 516
∑ = 40 ∑ = 6440
∑xifi = 6440, ∑fi = 40 e �̅� =
Σ𝑥𝑖𝑓𝑖
Σ𝑓𝑖
Aplicando:
�̅� =
6440
40
= 161 → �̅� = 161 𝑐𝑚
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 74
Vantagens e desvantagens da média
1. É uma medida de tendência central que, por uniformizar os valores de um conjunto de
dados, não representa bem os conjuntos que revelam tendências extremas.
2. Não necessariamente tem existência real, isto é, nem sempre é um valor que faça parte
do conjunto de dados, para bem representá-lo, embora pertença obrigatoriamente ao intervalo
entre o maior e o menor valor.
3. É facilmente calculada.
4. Serve para compararmos conjuntos semelhantes.
MODA (Mo)
A moda é o valor que aparece com maior frequência em uma série de valores. Podemos dizer é o
valor que “está na moda”.
- Para dados não agrupados: ela é facilmente reconhecida, pois observamos o valor que mais se
repete, como dito na definição.
Exemplo:
A série: 7,8,9,10,11, 11, 12, 13, 14 tem moda igual a 10.
Observações:
- Quando uma série não apresenta valor modal, ou seja, quando nenhum valor aparece com
frequência, dizemos que ela é AMODAL.
- Quando uma série tiver mais de um valor modal, dizemos que é BIMODAL (dois valores modas),
TRIMODAL, etc.
- Para dados agrupados
1) Sem intervalo de classe: para determinarmos a moda basta observamos a variável com maior
frequência. Vejamos o exemplo:
Nº de meninos fi
0 2
1 6
2 10
3 12
4 4
∑ = 34
Observamos que a maior frequência(fi) é 12, que corresponde ao valor de variável 3, logo: Mo = 3
2) Com intervalo de classe:a classe que apresenta maior frequência é denominada classe modal. A
moda é o valor dominante que está compreendido entre os limites da classe modal. O método mais
simples para o cálculo é tomar o ponto médio da classe modal. A este valor damos o nome de moda
bruta.
𝑴𝒐 =
𝒍 ∗ +𝑳 ∗
𝟐
Onde:
l* → limite inferior da classe modal
L* → limite superior da classe modal
Exemplo:
i Estaturas (cm) fi
1 150 ├ 154 4
2 154 ├ 158 9
3 158 ├ 162 11
4 162 ├ 166 8
5 166 ├ 170 5
6 170 ├ 174 3
∑ = 40
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 75
Observe que a classe com maior frequência é a de i = 3, nela temos que l* = 158 e o L* = 162, aplicando
na fórmula:
𝑀𝑜 =
𝑙 ∗ +𝐿 ∗
2
=
158 + 162
2
=
320
2
= 160, 𝑙𝑜𝑔𝑜 𝑎 𝑀𝑜 = 160𝑐𝑚
Existem ainda outros métodos mais elaborados para encontramos a moda, um deles seria a fórmula
de Czuber, onde:
𝑴𝒐 = 𝒍 ∗ +
𝑫𝟏
𝑫𝟏 + 𝑫𝟐
. 𝒉 ∗
Onde temos:
l*→ limite inferior da classe modal
h* → amplitude da classe modal
D1 → f* - f(ant)
D2 → f* - f(post)
f*→ frequência simples da classe modal
f(ant)→ frequência simples da classe anterior à classe modal
f(post) → frequência simples da classe posterior à classe modal.
Aplicando a fórmula ao exemplo anterior temos:
𝑀𝑜 = 𝑙 ∗ +
𝐷1
𝐷1 + 𝐷2
. ℎ ∗= 158 +
11 − 9
(11 − 9) + (11 − 8)
. (162 − 158) = 158 +
2
2 + 3
. 4
𝑀𝑜 = 158 +
8
5
= 158 + 1,6 = 159,6 ≅ 160 𝑐𝑚
Gráficos da moda
Observe que a moda é o valor correspondente, no eixo das abcissas, ao ponto de ordenada máxima.
Assim temos:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 76
A moda é utilizada:
- Quando desejamos obter uma medida rápida e aproximada de posição;
- Quando a medida de posição deve ser o valor mais típico da distribuição.
Vantagens e Desvantagens da Moda
1) Não depende de todos os valores da série, nem de sua ordenação, podendo mesmo não se alterar
com a modificação de alguns deles.
2) Não é influenciada por valores extremos (grandes) da série.
3) Sempre tem existência real, ou seja, sempre é representada por um elemento do conjunto de
dados, excetuando o caso de classes de frequências, quando trabalhamos com subconjuntos (dados
agrupados) e não com cada elemento isoladamente.
MEDIANA (Md)
Como o próprio nome sugere, a mediana é o valor que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem. É o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de mesmo número de elementos.
- Para dados não agrupados: para identificarmos a mediana, precisamos ordenar os dados
(crescente ou decrescente) dos valores, para depois identificarmos o valor central. Exemplo:
Dada a série de valores:
5, 13, 10, 2, 18, 15, 6, 16, 9, vamos ordenar os valores em ordem crescente:
2, 5, 6, 9, 10, 13, 15, 16,18; como temos uma sequência de 9 números precisamos identificar aquele
que divide o conjunto em 2 subconjuntos com a mesma quantidade de elementos. Neste caso o valor é
10, pois temos a mesma quantidade de elementos tanto a esquerda quanto a direita:
Md = 10
Neste caso como a série tem número ímpar de termos, ficou fácil identificarmos a mediana. Porém se
a série tiver número par, a mediana será, por definição, qualquer dos números compreendidos entre dois
valores centrais desta série, ao qual utilizaremos o ponto médio entre as duas. Exemplo:
2, 6, 7, 10, 12, 13, 18, 21 (8 termos), vamos utilizar os valores mais centrais que neste caso são o 4º
e o 5º termo. Então a mediana será:
𝑀𝑑 =
10 + 12
2
=
22
2
= 11
Observações: estando ordenado os valores de uma série e sendo n o número de elementos desta
série, o valor mediano será:
- o termo de ordem
𝑛+1
2
, se n for ímpar;
- a média aritmética dos termos de ordem
𝑛
2
𝑒
𝑛
2
+ 1, se n for par.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 77
Observando os exemplos dados:
- Para n = 9, temos
𝑛+1
2
=
9+1
2
=
10
2
= 5, a mediana é o 5º temo, que é Md = 10.
- Para n = 8, temos 8/2 = 4 e 8/2 + 1 = 4 + 1 = 5. Logo a mediana é a média aritmética do 4º e 5º termo:
10 + 12 / 2 = 22 / 2 = 11 → Md = 11
Notas:
- O valor da mediana pode coincidir ou não com um elemento da série. Se for ímpar há
coincidência, se for par já não há;
- A mediana e a média aritmética não têm necessariamente, o mesmo valor;
- A mediana depende da posição dos elementos e não dos valores dos elementos na
série ordenada. Essa é uma diferença marcante entre mediana e a média;
- A mediana também pode ser chamada de valor mediano.
- Para dados agrupados: o cálculo da mediana se processa de modo semelhante ao dos dados não
agrupados, implicando na determinação prévia das frequências acumuladas.
1) Sem intervalo de classe: neste caso basta identificarmos a frequência acumulada imediatamente
superior à metade da soma da frequências. A mediana será o valor da variável que corresponde a tal
frequência acumulada. Exemplo:
Nº de meninos fi Fa
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ = 34
Logo teremos:
Σfi
2
=
34
2
= 17, a menor frequência acumulada que supera este valor é 18, que corresponder ao valor 2
da variável, sendo esta a mediana ou valor mediano. Md = 2 meninos.
Nota:
- Caso exista uma frequência acumulada (Fa ou Fi), tal que: 𝐹𝑖 =
Σfi
2
, a mediana será dada por:
𝑀𝑑 =
𝑥𝑖 + 𝑥𝑖+1
2
Ou seja, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência
acumulada e a seguinte. Exemplo:
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑ = 8
Temos: 8/2 = 4 = F3
Então:
𝑀𝑑 =
15 + 16
2
=
31
2
= 15,5
1) Com intervalo de classe: precisamos, neste caso, determinar o ponto do intervalo em que está
compreendido a mediana. Para tal, precisamos determinar a classe mediana, que será aquela
correspondente à frequência acumulada imediatamente superior a
Σfi
2
. Fazendo isso podemos interpolar
os dados (inserção de uma quantidade de valores entre dois números), admitindo-se que os valores se
distribuam uniformemente em todo o intervalo de classe. Exemplo:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 78
i Estaturas (cm) fi Fi
1 150 ├ 154 4 4
2 154 ├ 158 9 13
3 158 ├ 162 11 24
4 162 ├ 166 8 32
5 166 ├ 170 5 37
6 170 ├ 174 3 40
∑ = 40
A classe destaca é a classe mediana. Temos que:
Σfi
2
=
40
2
= 20
Como há 24 valores incluídos nas três primeiras classes de distribuição e como pretendemos
determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado
na terceira classe (i = 3), supondo que as frequências dessa classe estejam uniformemente distribuídas.
Como existe 11 elementos nesta classe (fi) e o intervalo da classe (i) é 4, devemos tomar, a partir do
limite inferior, a distância:
20 − 13
11
. 4 =
7
11
. 4, 𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑠𝑒𝑟á 𝑑𝑎𝑑𝑎 𝑝𝑜𝑟: 𝑀𝑑 = 158 +
7
11
. 4 = 158 +
28
11
= 158 + 2,54 = 160,5 𝑐𝑚
Em resumo aplicamos os seguintes passos:
1º - Determinamos as frequências acumuladas;
2º - Calculamos ∑fi / 2;
3º - Marcamos a classe corresponde à frequência acumulada imediatamente superior a ∑fi / 2 (classe
mediana) e após isso aplicamos a fórmula:
𝑴𝒅 = 𝒍 ∗ +
[
𝚺𝒇𝒊
𝟐
− 𝑭(𝒂𝒏𝒕)] . 𝒉 ∗
𝒇 ∗
Onde:
l* → limite inferior da classe mediana;
F (ant) → frequência acumulada da classe anterior à classe mediana;
f* → frequência simples da classe mediana;
h* → amplitude do intervalo da classe mediana.
Baseado no exemplo anterior temos:
l* = 158 ; F(ant) = 13 ; f* = 11 e h* = 4
Empregamos a mediana quando:
- Desejamos obter o ponto que divide a distribuição em partes iguais;
- Há valores extremos que afetam de uma maneira acentuada a média;
- A variável em estudo é salário.
Vantagens e Desvantagens da Mediana
1) Não depende detodos os valores do conjunto de dados, podendo mesmo não se
alterar com a modificação.
2) Não é influenciada por valores extremos (grandes) do conjunto de dados.
3) Quando há valores repetidos, a interpretação do valor mediano não é tão simples.
Posição relativa da Média, Mediana e Moda
Quando a distribuição é simétrica, as 3 medidas coincidem; porém a assimetria torna elas diferentes e
essa diferença é tanto maior quanto é a assimetria. Com isso teremos um distribuição em forma de sino:
x̅ = Md = Mo → curva simétrica
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 79
Mo < Md < x̅ → curva assimétrica positiva;
x̅ < Md < Mo → curva assimétrica negativa.
Referência
CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002
Questões
01. (TRT-8ª – Analista Judiciário – CESPE) Com relação à definição das medidas de tendência
central e de variabilidade dos dados em uma estatística, assinale a opção correta.
(A) A moda representa o centro da distribuição, é o valor que divide a amostra ao meio.
(B) A amplitude total, ou range, é uma medida de tendência central pouco afetada pelos valores
extremos.
(C) A mediana é o valor que ocorre mais vezes, frequentemente em grandes amostras.
(D) A variância da amostra representa uma medida de dispersão obtida pelo cálculo da raiz quadrada
positiva do valor do desvio padrão dessa amostra.
(E) A média aritmética representa o somatório de todas as observações dividido pelo número de
observações.
02. (Pref. Fortaleza/CE – Matemática – Pref. Fortaleza/CE) A medida estatística que separa as
metades superior e inferior dos dados amostrados de uma população é chamada de:
(A) mediana.
(B) média.
(C) bissetriz.
(D) moda.
03. (SSP/AM – Técnico de Nível Superior – FGV) A sequência a seguir mostra o número de gols
marcados pelo funcionário Ronaldão nos nove últimos jogos disputados pelo time da empresa onde ele
trabalha:
2, 3, 1, 3, 0, 2, 0, 3, 1.
Sobre a média, a mediana e a moda desses valores é verdade que:
(A) média < mediana < moda;
(B) média < moda < mediana;
(C) moda < média < mediana;
(D) mediana < moda < média;
(E) mediana < média < moda.
04. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática
– FUNCAB) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12).
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 80
(A) 8,5
(B) 9
(C) 10,5
(D) 11,5
(E) 10
05. (Pref. Guarujá/SP – SEDUC – Professor de Matemática – CAIPIMES) As massas de 5 amigos
são 63,5; 70,3; 82,2; 59 e 71,5 quilogramas. A média e a mediana das massas são, respectivamente:
(A) 69,3 e 70,3 quilogramas.
(B) 172,25 e 82,2 quilogramas.
(C) 69,3 e 82,2 quilogramas.
(D) 172, 70,3 quilogramas.
06. (FUNDUNESP – Auxiliar Administrativo – VUNESP) O gráfico apresenta informações sobre o
número médio de anos de estudo da população brasileira, com base na Pesquisa Nacional por Amostra
de Domicílios de 2011, publicado pelo Instituto Brasileiro de Geografia e Estatística (IBGE).
Com base nas informações do gráfico, é verdade que
(A) o número de homens com estudo é menor que o número de mulheres com estudo, nos anos de
2009 e 2011.
(B) de 2009 para 2011 houve um aumento no número de homens com estudo.
(C) em 2010, a média de anos de estudo das mulheres era de 7,4 anos.
(D) em 2009, a média de anos de estudos das mulheres era de exatos 7 anos e 3 meses.
(E) a média de anos de estudo das mulheres não ultrapassou a 5 meses a dos homens, nos anos de
2009 e 2011.
07. (FUNDUNESP – Auxiliar Administrativo – VUNESP) Um concurso é composto por três fases,
com pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi
7,0 e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5, que
as notas apresentadas ainda não estão multiplicadas pelos respectivos fatores, e que em cada fase as
notas variam de zero a dez, pode-se afirmar corretamente que
(A) não há como Pedro ser aprovado no concurso.
(B) Pedro já está aprovado no concurso, independentemente da nota que tirar na 3.ª fase.
(C) se Pedro tirar 5,0 ou mais na 3.ª fase, então ele estará aprovado no concurso.
(D) Pedro precisa tirar, no mínimo, 7,0 na 3.ª fase, para ser aprovado no concurso.
(E) tirando 4,0, Pedro estará aprovado no concurso.
08. (IF/GO – Assistente de Alunos – UFG) A tabela a seguir apresenta o índice de desenvolvimento
humano (IDH) de alguns países da América Latina referente ao ano 2012.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 81
Países IDH
Argentina 0,811
Bolívia 0,645
Brasil 0,730
Chile 0,819
Colômbia 0,719
Cuba 0,780
México 0,775
Uruguai 0,792
Venezuela 0,758
Disponível em: <http://www.abinee.org.br/abinee/decon/decon55a.htm>. Acesso em: 24 fev. 2014. (Adaptado).
Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é:
(A) Brasil
(B) Colômbia
(C) México
(D) Venezuela
09. (QC – Segundo Tenente – Ciências Contábeis – MB) Analise a tabela a seguir.
Classe Velocidade (em nós) Tempo(h)
1 0 |------- 5 1
2 5 |------ 10 7
3 10 |------ 15 15
4 15 |------ 20 9
5 20 |------ 25 3
6 25 |------ 30 2
Dos registros de navegação de um determinado navio, foi obtido o quadro acima.
Após análise dos registros, determine a média das velocidades do navio na série observada e assinale
a opção correta.
(A) 13,43 nós
(B) 13,92 nós
(C) 14,12 nós
(D) 14,69 nós
(E) 15,26 nós
10. (Pref. Paulistana/PI – Professor de Matemática – IMA) Considere o conjunto de dados abaixo,
referente ao salário médio dos funcionários de uma empresa.
O valor da Mediana é:
(A) 1240
(B) 1500
(C) 1360
(D) 1600
(E) 1420
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 82
Respostas
01.Resposta: E.
Pela definições apresentadas a única que responde de forma correta a questão é sobre a média.
02. Resposta: A.
Pela definição temos que esta medida é a Mediana.
03.Resposta: A.
Reordenando temos:
0,0,1,1,2,2,3,3,3
Fica evidente o valor da moda, Mo = 3
A mediana é o meio, como é uma sequência com 9 números temos: n+1/2 → 9 +1 / 2 → 10/2 → 5,
logo a mediana será o 5º termo, então Md = 2
A média é a somatória de todos os valores, dividido pela quantidade 1+1+2+2+3+3+3 = 15, 15/9 = 1,66
Logo: média < mediana < moda
04. Resposta: C.
Coloquemos os valores em ordem crescente:
8, 9, 10, 10, 10, 11, 11, 11, 12, 12
Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente,
temos que:
𝑀 =
10 + 11
2
=
21
2
= 10,5
05. Resposta: A.
A média é: 𝑀 =
63,5+70,3+82,2 + 59+71,5
5
=
346,5
5
= 69,3
Para verificar a mediana, basta colocar os valores em ordem crescente e verificar o elemento que se
encontra no meio deles:
59 63,5 70,3 71,5 82,2
06. Resposta: E.
Média das mulheres:
7,3+7,5
2
=
14,8
2
= 7,4 anos = 7,4 . 12 = 88,8 meses
Média dos homens:
7+7,1
2
=
14,1
2
= 7,05 anos = 7,05 . 12 = 84,6 meses
Assim, 88,8 – 84,6 = 4,2 meses
07. Resposta: C.
Pesos 1, 2 e 3, respectivamente. Pedro ficou sabendo que na 1.ª fase desse concurso sua nota foi 7,0
e que na 2.ª fase sua nota foi 4,0.
Sabendo-se que para ser aprovado a média aritmética ponderada final tem que ser, no mínimo, 5
𝑀 =
1.7 + 2.4 + 3. 𝑥
1 + 2 + 3
= 5
15 + 3. 𝑥
6
= 5
15 + 3𝑥 = 6 . 5
3𝑥 = 30 − 15
𝑥 =
15
3
= 5
08. Resposta: C.
Vamos colocar osnúmeros em ordem crescente:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 83
0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819
O número que se encontra no meio é 0,775 (México).
09. Resposta: C.
Vamos calcular a média de cada classe:
* Classe 1: (0 + 5) / 2 = 5 / 2 = 2,5
2,5 . 1 = 2,5
* Classe 2: (5 + 10) / 2 = 15 / 2 = 7,5
7,5 . 7 = 52,5
* Classe 3: (10 + 15) / 2 = 25 / 2 = 12,5
12,5 . 15 = 187,5
* Classe 4: (15 + 20) / 2 = 35 / 2 = 17,5
17,5 . 9 = 157,5
* Classe 5: (20 + 25) / 2 = 45 / 2 = 22,5
22,5 . 3 = 67,5
* Classe 6: (25 + 30) / 2 = 55 / 2 = 27,5
27,5 . 2 = 55
* Soma das médias = 522,5
* Total de horas = 37h
Por final: 522,5 / 37 = 14,12
10. Resposta: C.
Colocando na ordem crescente:
1100;1200;1210;1250;1300;1420;1450;1500;1600;1980
A mediana é o número que se encontra no meio. Nesse caso que tem 10 números(par) é a média do
5º e 6º números:
1300 + 1420
2
=
2720
2
= 1360
MEDIDAS DE DISPERSÃO
As medidas de tendência central fornecem informações valiosas mas, em geral, não são suficientes
para descrever e discriminar diferentes conjuntos de dados. As medidas de Dispersão ou variabilidade
permitem visualizar a maneira como os dados espalham-se (ou concentram-se) em torno do valor central.
Para mensurarmos está variabilidade podemos utilizar as seguintes estatísticas: amplitude total; distância
interquartílica; desvio médio; variância; desvio padrão e coeficiente de variação.
- Amplitude Total: é a diferença entre o maior e o menor valor do conjunto de dados.
Ex.: dados: 3, 4, 7, 8 e 8. Amplitude total = 8 – 3 = 5
- Distância Interquartílica: é a diferença entre o terceiro e o primeiro quartil de um conjunto de dados.
O primeiro quartil é o valor que deixa um quarto dos valores abaixo e três quartos acima dele. O terceiro
quartil é o valor que deixa três quartos dos dados abaixo e um quarto acima dele. O segundo quartil é a
mediana. (O primeiro e o terceiro quartis fazem o mesmo que a mediana para as duas metades
demarcadas pela mediana.) Ex.: quando se discutir o boxplot.
- Desvio Médio: é a diferença entre o valor observado e a medida de tendência central do conjunto
de dados.
- Variância: é uma medida que expressa um desvio quadrático médio do conjunto de dados, e sua
unidade é o quadrado da unidade dos dados.
- Desvio Padrão: é raiz quadrada da variância e sua unidade de medida é a mesma que a do conjunto
de dados.
- Coeficiente de variação: é uma medida de variabilidade relativa, definida como a razão percentual
entre o desvio padrão e a média, e assim sendo uma medida adimensional expressa em percentual.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 84
Boxplot: Tanto a média como o desvio padrão podem não ser medidas adequadas para representar
um conjunto de valores, uma vez que são afetados, de forma exagerada, por valores extremos. Além
disso, apenas com estas duas medidas não temos ideia da assimetria da distribuição dos valores. Para
solucionar esses problemas, podemos utilizar o Boxplot. Para construí-lo, desenhamos uma "caixa" com
o nível superior dado pelo terceiro quartil (Q3) e o nível inferior pelo primeiro quartil (Q1). A mediana (Q2)
é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os
valores máximo e mínimo, que não sejam observações discrepantes. O critério para decidir se uma
observação é discrepante pode variar; por ora, chamaremos de discrepante os valores maiores do que
Q3+1.5*(Q3-Q1) ou menores do que Q1-1.5*(Q3-Q1).
O Boxplot fornece informações sobre posição, dispersão, assimetria, caudas e valores discrepantes.
O Diagrama de dispersão é adequado para descrever o comportamento conjunto de duas variáveis
quantitativas. Cada ponto do gráfico representa um par de valores observados. Exemplo:
Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da
variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.
Variância: Define-se a variância, como sendo a medida que se obtém somando os quadrados dos
desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações
da amostra menos um.
Desvio-Padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime
não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão: O
desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será
a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.
Exemplo: Em uma turma de aluno, verificou-se através da análise das notas de 15 alunos, os seguintes
desempenhos:
Alunos
Conceito
na
Prova
1 4,3
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 85
2 4,5
3 9
4 6
5 8
6 6,7
7 7,5
8 10
9 7,5
10 6,3
11 8
12 5,5
13 9,7
14 9,3
15 7,5
Total 109,8
Média 7,32
Desvio
Padrão
1,77
Observamos no exemplo, que a média das provas, foi estimada em 7,32 com desvio padrão em 1,77.
Concluímos que a maioria das notas concentrou-se em 9,09 e 5,55.
Vejamos de outra forma:
Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da
variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Repare-se nas duas amostras seguintes, que embora tenham a mesma média, têm uma dispersão bem
diferente:
Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a
principal medida de dispersão - a variância, apresentada a seguir.
Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os
quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número
de observações da amostra menos um:
Se afinal pretendemos medir a dispersão relativamente à média. Por que é que não somamos
simplesmente os desvios em vez de somarmos os seus quadrados?
Experimenta calcular essa soma e verás que (x1-x) + (x2-x) + (x1-x) + ... + (xn – x) ≠ 0. Poderíamos ter
utilizado módulos, para evitar que os desvios negativos, mas é mais fácil trabalhar com quadrados, não
concorda?! E por que é que em vez de dividirmos pó “n”, que é o número de desvios, dividimos por (n-
1)? Na realidade, só aparentemente é que temos “n” desvios independentes, isto é, se calcularmos (n-1)
desvios, o restante fica automaticamente calculado, uma vez que a sua soma é igual a zero. Costuma-se
referir este fato dizendo que se perdeu um grau de liberdade.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 86
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma
que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades
que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior
será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da
definição, são:
- o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre
os dados.
- se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.
Exemplo: Na 2ª classe de certa escola o professor deu uma tarefa constituída por um certo númerode contas para os alunos resolverem. Pretendendo determinar a dispersão dos tempos de cálculo,
observam-se 10 alunos durante a realização da tarefa, tendo-se obtido os seguintes valores:
Aluno
i
Tempo
(minutos)
xi
1 13 - 3.9 15.21
2 15 - 1.9 3.61
3 14 - 2.9 8.41
4 18 1.1 1.21
5 25 8.1 65.61
6 14 - 2.9 8.41
7 16 -0.9 0.81
8 17 0.1 0.01
9 20 3.1 9.61
10 17 0.1 0.01
169 0.0 112.90
Resolução: Na tabela anterior juntamos duas colunas auxiliares, uma para colocar os desvios das
observações em relação à média e a outra para escrever os quadrados destes desvios. A partir da coluna
das observações calculamos a soma dessas observações, que nos permitiu calcular a média = 16.9.
Uma vez calculada a média foi possível calcular a coluna dos desvios. Repare-se que, como seria de
esperar, a soma dos desvios é igual a zero. A soma dos quadrados dos desvios permite-nos calcular a
variância donde s = 3.54.
s2 =
112.9
9
= 12.54
O tempo médio de realização da tarefa foi de aproximadamente 17 minutos com uma variabilidade
medida pelo desvio padrão de aproximadamente 3.5 minutos. Na representação gráfica ao lado
visualizamos os desvios das observações relativamente à média (valores do exemplo anterior):
Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é
influenciado por valores ou muito grandes ou muito pequenos (o que seria de esperar já que na sua
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 87
definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada,
não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de
variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da
distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente
simétricas.
Propriedades para dados com distribuição aproximadamente normal: Uma propriedade que se verifica
se os dados se distribuem de forma aproximadamente normal, ou seja, quando o histograma apresenta
uma forma característica com uma classe média predominante e as outras classes se distribuem à volta
desta de forma aproximadamente simétrica e com frequências a decrescer à medida que se afastam da
classe média, é a seguinte:
Aproximadamente 68% dos dados estão no intervalo .
Desvio Padrão: Propriedades para dados com distribuição aproximadamente normal:
- Aproximadamente 68% dos dados estão no intervalo
- Aproximadamente 95% dos dados estão no intervalo
- Aproximadamente 100% dos dados estão no intervalo
Como se depreende do que atrás foi dito, se os dados se distribuem de forma aproximadamente
normal, então estão praticamente todos concentrados num intervalo de amplitude igual a 6 vezes o desvio
padrão.
A informação que o desvio padrão dá sobre a variabilidade deve ser entendida como a variabilidade
que é apresentada relativamente a um ponto de referência - a média, e não propriamente a variabilidade
dos dados, uns relativamente aos outros.
A partir da definição de variância, pode-se deduzir sem dificuldade uma expressão mais simples, sob
o ponto de vista computacional, para calcular ou a variância ou o desvio padrão e que é a seguinte:
Amplitude: Uma medida de dispersão que se utiliza por vezes, é a amplitude amostral r, definida como
sendo a diferença entre a maior e a menor das observações: r = xn:n - x1:n, onde representamos por x1:n e
xn:n, respectivamente o menor e o maior valor da amostra (x1, x2, ..., xn), de acordo com a notação
introduzida anteriormente, para a amostra ordenada.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 88
Amplitude Inter-Quartil: A medida anterior tem a grande desvantagem de ser muito sensível à
existência, na amostra, de uma observação muito grande ou muito pequena. Assim, define-se uma outra
medida, a amplitude inter-quartil, que é, em certa medida, uma solução de compromisso, pois não é
afetada, de um modo geral, pela existência de um número pequeno de observações demasiado grandes
ou demasiado pequenas. Esta medida é definida como sendo a diferença entre os 1º e 3º quartis.
Amplitude inter-quartil = Q3/4 - Q1/4
Do modo como se define a amplitude inter-quartil, concluímos que 50% dos elementos do meio da
amostra, estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto
maior quanto maior for a variabilidade nos dados. Mas, ao contrário do que acontece com o desvio padrão,
uma amplitude inter-quartil nula, não significa necessariamente, que os dados não apresentem
variabilidade.
Amplitude inter-quartil ou desvio padrão: Do mesmo modo que a questão foi posta relativamente
às duas medidas de localização mais utilizadas - média e mediana, também aqui se pode por o problema
de comparar aquelas duas medidas de dispersão.
- A amplitude inter-quartil é mais robusta, relativamente à presença de "outliers", do que o desvio
padrão, que é mais sensível aos dados.
- Para uma distribuição dos dados aproximadamente normal, verifica-se a seguinte relação. Amplitude
inter-quartil 1.3 x desvio padrão.
- Se a distribuição é enviesada, já não se pode estabelecer uma relação análoga à anterior, mas pode
acontecer que o desvio padrão seja muito superior à amplitude inter-quartil, sobretudo se se verificar a
existência de "outliers".
Questões
01. (AL/GO – Assistente Legislativo – Assistente Administrativo – CS/UFG) Em estatística, a
variância é um número que apresenta a unidade elevada ao quadrado em relação a variável que
não está elevada ao quadrado, o que pode ser um inconveniente para a interpretação do resultado.
Por isso, é mais comumente utilizada na estatística descritiva o desvio-padrão, que é definido como
(A) a raiz quadrada da mediana, representada por "s" ou "μ".
(B) a raiz quadrada da variância, representada por "s" ou "α".
(C) a raiz quadrada da variância, representada por "s" ou "α".
(D) a raiz quadrada da média, representada por "s" ou "α".
02. (ANAC – Analista Administrativo – ESAF) Os valores a seguir representam uma amostra
3 3 1 5 4 6 2 4 8
Então, a variância dessa amostra é igual a
(A) 4,0
(B) 2,5
(C) 4,5
(D) 5,5
(E) 3,0
03. (MPE/AP – Analista Ministerial – FCC) Ao considerar uma curva de distribuição normal,
com uma média como medida central, temos a variância e o desvio padrão referentes a esta média.
Em relação a estes parâmetros,
(A) a variância é uma medida cujo significado é a metade do desvio padrão.
(B) a variância é calculada com base no dobro do desvio padrão.
(C) o desvio padrão é a raiz quadrada da variância.
(D) a média dividida pelo desvio padrão forma a variância.
(E) a variância elevada ao quadrado indica qual é o desvio padrão.
04. (MEC – Agente Administrativo – CESPE) Os dados abaixo correspondem às quantidades
diárias de merendas escolares demandadas em 10 diferentes escolas:
200, 250, 300, 250, 250, 200, 150, 200, 150, 200.
Com base nessas informações, julgue os próximos itens.
O desvio padrão amostral dos números diários de merendas escolares é superior a 50.
( ) Certo ( ) Errado
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 89
Respostas
01. Resposta: C.
Como visto, o desvio padrão é a raiz quadrada da variância.
02. Resposta: C.
Tem-se que a amostra contém as seguintes observações: 3 3 1 5 4 6 2 4 8. Para chegar à variância,
nessa questão, encontramos primeiro o valor da média.
A média desses valores é dada por: soma das observações/nº de observações menos 1.
Logo, 3+3+1+5+4+6+2+4+8/ 9 = 4
Após isso, aplicamos a construção: (3-4)²+(3-4)²+(1-4)²+(5-4)²+(4-4)²+(6-4)²+(2-4)²+(4-4)²+(8-4)²/9-1
Calculando: [(-1)²+(-1)²+(-3)²+(1)²+(0)²+(2)²+(-2)²+(0)²+(4)²]/9-1
(1+1+9+1+0+4+4+0+16)/8 → 36/8 = 4,5
03. Resposta:C.
Conforme visto anteriormente, desvio padrão é a raiz quadrada da variância.
04. Resposta: Errado.
O desvio padrão amostral é dado por:
√∑(Xi – X média)²/(n − 1)
Onde n é o número de elementos (n=10), Xi representa cada elemento da amostra e X a média da
amostra. A média, neste caso, é:
Média (X) = ∑(Xi)/ n = (150 + 150 + 200 + 200 + 200 +200 + 250 + 250 + 250 + 300) /10 = 215
O Desvio Padrão será:
√∑(Xi – X média)²/(n − 1) =
√2 ∗ (150 − 215)² + 4 ∗ (200 − 215)² + 3 ∗ (250 − 215)² + 1 ∗ (300 − 215)² / (10 − 1) =
√8450 + 900 + 3675 + 7225/9 =
√2250
√2500= 50
Logo: √2250< 50
MEDIDAS DE POSIÇÃO: SEPARATRIZES
São números que dividem a sequência ordenada de dados em partes que contêm a mesma quantidade
de elementos da série.
Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um deles contendo
50% dos valores da sequência, é também uma medida separatriz.
Além da mediana, as outras medidas separatrizes são: quartis, quintis, decis e percentis.
Quartis
Nos quartis, a série é dividida em quatro partes iguais. Os elementos separatrizes da serie são Q1, Q2,
e Q3.
25% 50% 75%
Q1 Q2 Q3
Q1: é o primeiro quartil, corresponde à separação dos primeiros 25% de elementos da série.
Q2: é o segundo quartil, coincide com a mediana (Q2 = Md).
Q3: é o terceiro quartil, corresponde à separação dos últimos 25% de elementos da série, ou seja, os
75% dos elementos da série.
Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do cálculo da mediana.
Consequentemente, podem-se utilizar as mesmas fórmulas do cálculo da mediana, levando em conta
que onde houver a expressão
2
if será substituída por
4
ifK , sendo K o número da ordem do quartil,
em que K =1 corresponde ao primeiro quartil; K = 2 corresponde ao segundo quartil e K = 3 ao terceiro
quartil.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 90
Cálculo do quartil para o rol
1° Passo: Determina-se a posição do Quartil.
)32,1(
4
ouKonde
Kn
P
QK
2° Passo: Identifica-se a posição mais próxima do rol.
3° Passo: Verifica-se quem está naquela posição.
Exemplo: Calcule Q1, Q2 e Q3 para o seguinte conjunto de valores:
12,9,2,6,8,7,10,11,0,8,1,4A
Inicialmente precisamos colocar os valores em ordem (rol)
12,11,10,9,8,8,7,6,4,2,1,0A
a) Vamos utilizar os passos para o cálculo do 1° quartil:
1° Passo: Determina-se a posição do 1° quartil:
quartildoposiçãoP
Q
1 3
4
121
1
2° Passo: Identificar a posição 3
3° Passo: Procura-se no rol o valor do número que está na posição identificada.
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
x
11
x
12
x
0 1 2 4 6 7 8 8 9 10 11 12
O número que corresponde a 25% do rol é o valor 2
b) Vamos utilizar os passos para o cálculo do 2° quartil:
1° Passo: Determina-se a posição do 2° quartil:
quartildoposiçãoP
Q
2 6
4
122
2
2° Passo: Identificar a posição 6
3° Passo: Procura-se no rol o valor do número que está na posição identificada.
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
x
11
x
12
x
0 1 2 4 6 7 8 8 9 10 11 12
O número que corresponde a 50% do rol é o valor 7
c) Vamos utilizar os passos para o cálculo do 3° quartil:
1° Passo: Determina-se a posição do 3° quartil:
quartildoposiçãoP
Q
3 9
4
123
3
2° Passo: Identificar a posição 9
3° Passo: Procura-se no rol o valor do número que está na posição identificada.
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
x
11
x
12
x
0 1 2 4 6 7 8 8 9 10 11 12
Quintis
Ao dividir a série ordenada em cinco partes, cada uma ficará com seus 20% de seus elementos.
Os elementos que separam estes grupos são chamados de quintis.
Assim, o primeiro quintil, indicado por K1, separa a sequência ordenada deixando 20% de seus valores
à esquerda e 80% de seus valores à direita.
De modo análogo são definidos os outros quintis.
Decis
Ao dividir a série ordenada em dez partes, cada uma ficará com seus 10% de seus elementos.
Os elementos que separam estes grupos são chamados de decis.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 91
Assim, o primeiro decil, indicado por D1, separa a sequência ordenada deixando 10% de seus valores
à esquerda e 90% de seus valores à direita.
De modo análogo são definidos os outros decis.
Os decis dividem a distribuição em dez partes iguais. A fórmula é semelhante à que vimos
anteriormente:
a) Calcula-se
10
.ni
onde 9,8,7,6,5,4,3,2,1i
b) Identifica-se a classe do decil (Di) pela frequência acumulada.
c) Aplica-se a fórmula
Di
Dii
F
hf
ni
lD
.
10
.
onde,
Dil = limite inferior da classe do decil
n = quantidade de elementos da amostra
f = frequência acumulada da classe anterior à classe do decil
h = amplitude da classe do decil
DiF = Frequência da classe do decil
Exemplo:
Estaturas(cm)
if iF
150 ├ 154 4 4
154 ├ 158 9 13
158 ├ 162 11 24
162 ├ 166 8 32
166 ├ 170 5 37
170 ├ 174 3 40
40
Se quiséssemos calcular o 4º e 8º Decis, faríamos:
Para o 4º Decil: 16
10
40.4
10
.
ni
09,159
11
4.13
10
40.4
1584
D
Para o 8º Decil 32
10
40.8
10
.
ni
166
8
4.24
10
40.8
1628
D
Percentis
Ao dividir a série ordenada em cem partes, cada uma ficará com 1% de seus elementos.
Os elementos que separam estes grupos são chamados de centis ou percentis.
Assim, o primeiro percentil, indicado por P1, separa a sequência ordenada deixando 1% de seus
valores à esquerda e 99% de seus valores à direita.
De modo análogo são definidos os outros percentis.
São as medidas que dividem a amostra em 100 partes iguais. O cálculo é semelhante aos anteriores:
a) Calcula-se
100
.ni
, onde 99,...,3,2,1i
b) Identifica-se a classe do percentil (Pi) pela frequência acumulada.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 92
c) Aplica-se a fórmula
Pi
Pii
F
hf
ni
lP
.
100
.
Exemplo:
Seja a tabela abaixo, obtida da amostra sobre salários em um determinado bairro de uma cidade.
Sal.Mínimo(SM)
if iF
4 ├ 9 8 8
9 ├ 14 12 20
14 ├ 19 17 37
19 ├ 24 3 40
40
Quais o 4º decil e o 72º percentil?
4º Decil. : 16
10
40.4
10
.
ni
A classe do 4º Decil é a de frequência igual a 12
33,12
12
5.8
10
40.4
94
D
72º Percentil : . 8,28
100
40.72
100
.
ni
59,16
17
5.208,28
1472
P
Conclusão: Nessa distribuição temos que o valor de 12,33 SM divide a amostra em duas partes: 40%
(4º decil) estão abaixo dele e 60% estão acima. Temos também que 16,59 SM divide a amostra em duas
partes: 72% (P72) estão abaixo dele e 28% estão acima.
Cálculo da separatriz:
Identifica-se a medida que se pretende obter com o percentil correspondente, Pi.
Calcula-se i% de n para localizar a posição do percentil i no Rol, ou seja:
Em seguida, identifica-se o elemento que ocupa esta posição.
Note que se o elemento for um número inteiro, então o Pi procurado é um dos elementos da sequência
ordenada.
Se não for um número inteiro, isto significa que Pi é um elemento intermediário entre os elementos que
ocupam as posições aproximadas por falta ou por excesso do valor calculado. Neste caso, Pi é definido
como sendo a média dos valores que ocupam estas posições aproximadas.
Outliers
Os outliers são dados que se diferenciam drasticamente de todos os outros,são pontos fora da curva.
Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá)
causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise.
Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos:
1. os outliers podem visar negativamente todo o resultado de uma análise;
2. o comportamento dos outliers pode ser justamente o que está sendo procurado.
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 93
Os outliers possuem diversos outros nomes, como: dados discrepantes, pontos fora da curva,
observações fora do comum, anomalias, valores atípicos, entre outros.
A seguir elencamos algumas situações comuns em que os outliers surgem na análise de dados e
apontamos sugestões de como lidar com eles em cada caso.
Como identificar quais são os dados outliers?
Encontrar os outliers utilizando tabelas
A forma mais simples de encontrar dados outliers é olhar diretamente para a tabela ou planilha de
dados – o dataset, como chamam os cientistas de dados.
O caso da tabela a seguir exemplifica claramente um erro de digitação, ou seja, de input dos dados. O
campo da idade do indivíduo Antônio Silveira certamente não representa a idade de 470 anos. Olhando
para a tabela é possível identificar o outlier, mas fica difícil afirmar qual seria a idade correta. Existem
várias possibilidades que podem se referir a idade certa, como: 47, 70 ou ainda 40 anos.
Em uma pequena amostra a tarefa de encontrar outliers com o uso de tabelas pode ser fácil. Porém,
quando a quantidade de observações passa para a casa dos milhares ou milhões fica impossível de
encontrar quais são os dados que destoam do geral. Essa tarefa fica ainda mais difícil quando muitas
variáveis (as colunas da planilha) são envolvidas.
Questões
01. A tabela apresenta uma distribuição hipotética. Não há observações coincidentes com os limites
das classes.
A melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de
(A)34,75
(B)34,9
(C)35
(D)35,75
(E)35,9
02. Um teste de raciocínio abstrato foi aplicado a 816 alunos de uma escola de 1° grau, dando
os seguintes resultados:
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 94
a) Qual é o máximo de pontos que classifica um aluno entre os 25% mais fracos?
b) Qual é o mínimo de pontos necessários para um aluno se classificar entre os 25% mais fortes?
c) Qual é o máximo de pontos que ainda classifica um aluno entre os 10% mais fracos?
d) Qual é o mínimo de pontos para que um aluno esteja entre os 10% mais fortes?
e) Qual é o máximo de pontos que ainda classifica o aluno entre os 1% mais fracos?
f) Qual é o mínimo de pontos para que um aluno esteja entre os 5% mais fortes?
Respostas.
01. Resposta: E.
3 Quartil = L1 + ((3*N/4 - Som. freq. anteriores)/Frequência quartil) * amplitude do intervalo
3 quartil = 30 + ((3*164/4 - 64)/100) * 10
3 Quartil = 35,90
02. Respostas:
a)
b)
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS
. 95
c)
d)
e)
f)
1618111 E-book gerado especialmente para GRAZIELA GUIMARAES DOS ANJOS