Buscar

[cliqueapostilas com br]-estatistica-ii (2)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 59 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 59 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 59 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE 
Estadual de Londrina 
 
 
 
 
 
 
 
 
 
ESTATÍSTICA 
Análise Exploratória de Dados 
Probabilidade 
Variáveis Aleatórias 
 
 
 
PROFESSORES: Dr. José Carlos Dalmas 
Ms. José da Costa Soeiro 
 
 
 
 
 
LONDRINA 
2014
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
2 
ESTATÍSTICA 
 
INTRODUÇÃO 
 
 No moderno ambiente administrativo e econômico global, dispõe-se de uma vasta 
quantidade de informações estatística. Os gerentes tomadores de decisão de maior sucesso são 
capazes de entender a informação e usá-la eficazmente. A seguir, fornecemos alguns 
exemplos que ilustram o uso da estatística. 
 Nos negócios frequentemente necessita de previsões sobre o futuro do ambiente 
econômico, tais como: previsão de taxas de inflação, índice de preços do consumidor, taxa de 
desemprego e a utilização da capacidade de produção. Escritórios de Contabilidade usam o 
procedimento de amostragem estatística quando realiza auditorias, cálculo de índices etc. 
 Os consultores financeiros utilizam uma série de informações estatísticas para guiar 
suas recomendações de investimentos. No caso das ações, os consultores revêem diversos 
dados financeiros incluindo relações preço/ganhos e rendimento de dividendos para concluir 
se uma ação individual está sendo sobre ou subavaliada. 
 Para estabelecer estratégias de marketing, os gerentes utilizam se da estatística para 
melhor entender o comportamento do mercado consumidor. 
 A estatística pode ser utilizada como uma ferramenta de controle da qualidade, com a 
criação de cartas de controle, bem como no monitoramento do processo de produção. 
Pode se definir a Estatística como: um conjunto de métodos e processos quantitativos 
que servem para estudar e medir os fenômenos coletivos, conforme Bernoulli. 
 No estudo estatístico, o que interessa são os fatos que envolvem os elementos dos 
fenômenos, como eles se relacionam e qual o seu comportamento. Para isso, é necessário que 
esse estudo seja feito através uma investigação planejada, desenvolvida e redigida de acordo 
com a metodologia de pesquisa científica. 
 
METODOLOGIA DA ESTATÍSTICA 
 Dependendo do objetivo da pesquisa pode-se classificar a metodologia estatística a ser 
aplicada como: 
 
Estatística Descritiva 
 Usualmente a expressão estatística descritiva é empregada para descrever, analisar e 
interpretar os registros quantitativos relativos aos atributos do fenômeno em estudo. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
3 
Estatística Indutiva 
A estatística indutiva é a parte da Estatística que tem por objetivo obter e generalizar 
conclusões para o todo a partir da análise de uma parcela. 
 
OBTENÇÃO DE DADOS 
A aplicação da análise estatística é utilizada a partir dos dados obtidos que descrevem 
os elementos observados, tais como: características de pessoas, animais, empresas, indústrias, 
sistema de produção, fenômenos físicos ou químicos etc. 
 A coleta desses elementos pode ser feita através de instrumentos, que se adéquam ao 
tipo de pesquisa, ou seja, questionários, planilhas de anotações ou através de desenvolvimento 
de experimentos. 
 
 
NOÇÕES BÁSICAS 
 
População 
É o grupo de todos os elementos que possuem características comuns, que determinam 
o universo a ser pesquisado. 
 
Censo 
 É quando no estudo das características utilizam-se todos os elementos da população. 
 
Amostra 
Quando somente uma parte da população é analisada, retirada com técnicas estatísticas 
adequadas, de forma a garantir a representatividade das características dos elementos da 
população. 
 
AMOSTRAGEM 
 Amostragem é um procedimento usado utilizado na retirada de amostras 
representativas da população. Para se aplicar a amostragem deve se observar a composição da 
população, o método de amostragem necessário e o tamanho da amostra. 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
4 
RETIRADA DA AMOSTRA 
 Basicamente existem dois métodos para a composição da amostra: probabilístico e não 
probabilístico. 
 
 
MÉTODOS PROBABILÍSTICOS 
O método de amostragem probabilística exige que cada elemento da população possua 
a mesma probabilidade de ser selecionado. Assim, considerando N o tamanho da população, a 
probabilidade de cada elemento será 1/N. Trata-se de um método que garante cientificamente 
a aplicação das técnicas estatísticas. 
 
Os tipos de amostragem probabilísticos mais usados são: 
 Amostragem Simples ao Acaso (ASA): Também conhecida como amostragem 
aleatória é aplicada quando a população é considerada homogênea, ou seja, quando 
todos os seus elementos têm a mesma característica e a mesma chance (probabilidade) 
de serem selecionados. Para se aplicar essa amostragem deve-se considerar um 
sistema de permita a seleção dos elementos através de um processo aleatório, ou seja, 
numerar todos os elementos e, efetuar sucessivos sorteios até atingir o tamanho da 
amostra desejado. 
 Amostragem Sistemática: Trata-se de uma variação da amostragem aleatória, 
utilizada quando a população se encontra segundo algum critério, como fichas de um 
fichário, listas telefônicas, pessoas organizadas em filas, produção em série etc. Tal 
amostragem exige o seguinte procedimento: 
 Calcular o intervalo de retirada, que corresponde a quantidade de elementos de cada 
grupo a ser dividida a população, obtido pela divisão do tamanho da população (N) pelo 
tamanho da amostra (n), 
n
Ns  . 
 Conhecido o valor de S (chamado de salto), sorteia-se um entre eles, que indicará a 
posição do primeiro elemento da amostra. Para a retirada dos demais elementos deve-se 
somar o valor de S à posição do elemento retirado anteriormente até compor a amostra 
desejada. 
 Por exemplo: Seja o tamanho da população (N) = 1000 
 O tamanho da amostra (n) = 100 
 Logo o salto será S = 10 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
5 
 Dentre os dez primeiros elementos da população determinado pelo salto, sorteia se um 
elemento suponha que tenha sido o número dois. Portanto, os elementos da população que 
ocupam as posições: 2o; 12o; 22o; 32o; ...; 992o, irão compor a amostra, ou seja, a cada dez 
elementos da população um será o representante na amostra. 
 Amostragem Estratificada: Utilizada quando a população é heterogênea onde se 
distingui grupos mais ou menos homogêneos, os quais se denominam de estratos. Para a 
estratificação de uma população pode-se utilizar de algumas características, tais como: classe 
social, idade, sexo, profissão, ou qualquer outro atributo que revele os estratos dentro da 
população. Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada 
estrato. O número de elementos retirados de cada grupo poderá ser proporcional ao tamanho 
do estrato, obtendo assim, a Amostragem Estratificada Proporcional. 
Tabela - Tamanho da amostra proporcional aos estratos. 
Estrato Tamanho do estrato Relação (%) Tamanho da amostra 
I 50 10 4 
II 150 30 12 
III 300 60 24 
Total N= 500 100 n=40 
 
 Amostragem por Conglomerado: Algumas populações não permitem, ou tornam 
extremamente difícil que se identifiquem seus elementos, mas pode ser relativamente 
fácil separá-los na forma de grupos. Por exemplo, podem-se separar os grupos levando 
em consideração: quarteirões, famílias, organizações, agências, edifícios, etc. O 
procedimento de retirada da amostra consiste em sortear osgrupos e todos os 
elementos desses participarão da amostra. Assim, por exemplo, num levantamento da 
população de uma cidade, pode-se dispor do mapa indicando cada quarteirão e não 
dispor de uma relação atualizada dos seus moradores. Então, colhe-se uma amostra 
dos quarteirões e faz-se a coleta dos dados de todos os que residem naqueles 
quarteirões sorteados. 
 
MÉTODOS NÃO PROBABILÍSTICOS 
 São amostragens em que os elementos são retirados em situações que não possibilitem 
a seleção aleatória. Esse tipo de amostragem pode oferecer boas estimativas das 
características da população. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
6 
São utilizadas em casos como: ensaios de drogas, vacinas, técnicas cirúrgicas, 
pesquisa de opinião, etc. 
Destacam-se entre elas: 
 Amostragem por conveniência: Ocorre quando o pesquisador seleciona os membros 
da população dos quais é mais fácil se obter informações. Esse tipo de amostragem, 
embora não aleatória, é bastante utilizada na área de marketing. Neste caso, é 
importante o senso crítico do pesquisador para evitar vieses, como, não selecionar 
sempre pessoas de mesmo sexo, de mesma faixa etária, etc. 
 Amostragem por julgamento: Ocorre quando o pesquisador utiliza seu próprio 
julgamento ao selecionar os membros da população, através do estabelecimento de 
uma característica que permite identificar elementos com boas perspectivas de 
fornecer as informações necessárias. 
 Amostragem por quotas: devem–se determinar as quotas de controle dos elementos 
pelas características da população alvo, que podem ser determinada através do sexo, 
idade, raça, renda, escolaridade etc. Com esse procedimento de quotas fica assegurada 
que a composição da amostra seja a mesma que a composição da população. A seguir 
os elementos da amostra são selecionados à medida que se ajustem as quotas de 
controle. 
Exemplo: 
Quantidade Sexo Escolaridade Idade Renda 
5 Masculino Superior 30 10 s.m 
3 Feminino Médio completo 18 3 s.m 
Observação: Quanto menor o número de características da quota mais facilmente 
fecha-se a coleta. 
 
 
VARIÁVEL 
 
Representa as características dos indivíduos que pode assumir diferentes valores. 
Se um instrumento de uma pesquisa contém as seguintes perguntas: 
Perguntas 
 
Gerem informações 
para as seguintes 
variáveis 
Variáveis 
Qual a sua idade? 
Qual o número de pessoas de sua família? 
Qual a renda familiar? 
Qual é o seu estado civil? 
Você tem emprego fixo? 
Qual o tempo de trabalho na empresa? 
- Idade 
- Tamanho da família 
- Renda familiar 
- Estado civil 
- Emprego 
- Tempo de trabalho. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
7 
CLASSIFICAÇÃO DAS VARIÁVEIS 
 
Ao se fazer um estudo estatístico tem-se que considerar o tipo da variável: 
 Variáveis qualitativas são as que descrevem os atributos de um elemento. 
 Variáveis quantitativas são as provenientes de uma contagem ou mensuração. 
As variáveis qualitativas e as quantitativas dividem-se em dois tipos: 
Variáveis Tipos Descrição Exemplos 
Qualitativas 
ou 
Categóricas 
Nominal Sem ordenação. Cor dos olhos, sexo, estado civil. 
Ordinal Com ordenação. Grau de instrução; classe social. 
 
Quantitativas 
 
 
Discretas Oriunda de contagem. 
Número de funcionários; número 
acidentes de trabalho ocorrido durante um 
mês. 
Contínuas Oriunda de medição. Altura, peso, diâmetro de uma peça. 
 
ATIVIDADE 1 - AMOSTRAGEM / VARIÁVEIS 
 
 
TAMANHO DA AMOSTRA 
 
 Outro fator importante na aplicação da técnica de amostragem a ser considerado é o 
tamanho da amostra que possa representar significativamente a população. 
 Para a determinação do tamanho da amostra deve se levar em conta além do tamanho 
da população, os seguintes níveis: 
 Nível de confiança (nível de segurança) é a probabilidade associada aos resultados, 
obtidos em uma amostra, como sendo verdadeiros para os parâmetros da população. 
A probabilidade complementar é denominada de nível de significância, que consiste 
na probabilidade do erro, ou seja, afirmar um valor que não é verdadeiro para a 
população. 
 Margem de erro (nível de precisão) é a diferença máxima a ser aceita entre a 
estatística amostral e o parâmetro populacional. 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
8 
 No caso de uma pesquisa com o objetivo de analisar variáveis categóricas, onde a 
estatística de interesse na pesquisa é a proporção, onde os resultados são representados por 
porcentagem de ocorrência dos itens: 
Determina se o tamanho mínimo inicial de uma amostra baseado nos níveis definidos 
pelo pesquisador: 
 
 
2
2
0
1.
d
ppZ
n

 
Sendo: n0 tamanho inicial da amostra 
 Z (distribuição normal) associado ao nível de confiança estabelecido; 
 p proporção populacional estimada que possa ter o aspecto pesquisado (chamada de 
prevalência ou incidência). 
 d margem de erro (nível de precisão). 
 
 Caso se conheça o tamanho da população (N), adéqua o tamanho inicial da amostra ao 
tamanho da população finita pela relação: 
Nn
Nn
n


0
0 . 
Exemplos: 
 
1) Se considerar que uma pesquisa terá o nível de confiança de: 95%, com margem de 
erro de 3% para mais e para menos, sendo que a proporção populacional (incidência) 
com o atributo pesquisado seja de 15%. Determine: 
a) a amostra mínima inicial; 
b) a amostra mínima final, caso a população tenha 25.486 elementos. 
c) a amostra mínima final se a população tiver 250 elementos. 
2) Considerando nível de confiança de 90%, com margem de erro de 4% e proporção de 
incidência de 30%. Qual o tamanho mínimo da amostra para uma população infinita? 
3) Determine o tamanho da amostra inicial com nível de confiança de 95% e margem de 
erro de 3%? 
 
Quadro do tamanho mínimo da amostra conforme o tamanho da população, ao nível de 
confiança de 95% e incidência de 50%. 
POPULAÇÃO 
(N) 
AMOSTRA (n) 
MARGEM DE ERRO 
d=3% 
MARGEM DE ERRO 
d=5% 
100 91 79 
1000 516 277 
5000 879 356 
20000 1013 377 
100000 1055 383 
500000 1064 384 
1000000 1067 384 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
9 
 Todavia, algumas observações podem ser levadas em considerações, a saber: 
 Quanto maior o número de elementos numa amostra, menor a margem de erro. 
 Quanto maior a homogeneidade da população, menor o tamanho da amostra. 
 
ATIVIDADE 2: TAMANHO DA AMOSTRA 
 
 
DESCRIÇÃO E APRESENTAÇÃO DE DADOS 
 
Os dados obtidos em pesquisas devem ser analisados e interpretados com o auxílio de 
métodos estatísticos, o que consiste na análise exploratória dos dados. 
Na primeira etapa deve-se fazer uma análise descritiva que consiste na organização, 
descrição dos dados, na identificação de valores que representem o elemento típico e, na 
quantificação da variabilidade presente nos dados. 
 
DADOS 
São as informações inerentes às variáveis que caracterizam os elementos que 
constituem a população ou a amostra. 
 
Dados Brutos 
 São os dados obtidos diretamente da pesquisa, sem terem passados por nenhum 
processo de síntese ou análise. 
 O grupo dessas informações obtidas através das variáveis compõe o que se denomina 
de Banco de Dados. 
 
 
Exemplo: Banco de Dados dos funcionários da Companhia Estilo Modas. 
N Estado Civil Grau de Instrução No de filhos Salário (x s.mínimo) idade 
1 solteiro fundamental 4,00 26 
2 casado fundamental 0 4,56 32 
3 casado fundamental 2 5,25 36 
4 solteiro Médio 5,7320 
5 solteiro fundamental 6,26 40 
6 casado fundamental 1 6,66 28 
7 solteiro fundamental 6,86 41 
8 solteiro fundamental 7,39 43 
9 casado Médio 1 7,59 34 
10 solteiro Médio 7,44 23 
11 casado Médio 2 8,12 33 
12 solteiro fundamental 8,46 27 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
10 
N Estado Civil Grau de Instrução No de filhos Salário (x s.mínimo) idade 
13 solteiro Médio 8,74 37 
14 casado fundamental 3 8,95 44 
15 casado Médio 0 9,13 30 
16 solteiro Médio 9,35 38 
17 casado Médio 1 9,77 31 
18 casado fundamental 2 9,8 39 
19 solteiro Superior 10,53 25 
20 solteiro Médio 10,76 37 
21 casado Médio 1 11,06 30 
 
As variáveis: estado civil, grau de instrução são qualitativas, enquanto que o número 
de filhos é uma variável quantitativa discreta e os salários e as idades representam variáveis 
quantitativas contínuas, embora à idade esteja escrita de forma discreta. 
 
ROL 
Rol é o arranjo dos dados brutos numéricos em ordem crescente ou decrescente, se os 
dados forem qualitativos o rol é construído em ordem alfabética. 
Pode-se, pelo rol, verificar de maneira mais clara e rápida o comportamento dos dados 
do conjunto identificando o maior e o menor valor, além de alguns elementos que podem se 
repetir várias vezes. 
 
REPRESENTAÇÃO TABULAR 
 Consiste em apresentar os dados coletados através de tabelas mostrando de forma 
resumida o que ocorre com os dados observados. 
Para organizar uma série estatística ou uma distribuição de frequências existem 
algumas normas nacionais ditadas pela Associação Brasileira de Normas Técnicas (ABNT) as 
quais devem ser respeitadas. Assim, toda tabela estatística deve conter: 
Elementos essenciais 
 Título – indica a natureza do fato estudado (o quê?), o local (onde?) e a época (quando?). 
 Corpo – é o conjunto de linhas e colunas que contém as informações. 
 Cabeçalho – designa a natureza do conteúdo de cada coluna. 
 Coluna indicadora – mostra a natureza do conteúdo de cada linha. 
Elementos complementares (se necessário) 
 Os elementos complementares geralmente são colocados no rodapé da tabela, que se 
situa abaixo do traço horizontal da parte inferior da tabela, os quais são: 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
11 
 Fonte – é o indicativo da entidade responsável pela sua organização ou fornecedora dos 
dados primários. 
 Notas – são colocadas para esclarecimentos de ordem geral. 
 Chamadas – servem para esclarecer minúcias em relação às caselas, colunas ou linhas. 
Nenhuma casela da tabela deve ficar em branco, apresentando sempre um número ou 
sinal. 
 
 Exemplo: Percentuais de exportações brasileiras por Estados, Maio/2008 TÍTULO 
 
 Estados Percentuais CABEÇALHO 
 Minas Gerais 21,92 
 
 
CORPO 
 São Paulo 39,96 
 Rio Grande do Sul 17,50 
 Espírito Santo 7,68 
COLUNA INDICADORA Paraná 9,56 
 Santa Catarina 3,38 
 Total 100,00 
 Fonte: Ministério da Agricultura RODAPÉ 
 
 
Sinais Convencionais 
 - (hífen), quando o valor numérico é nulo; 
 ... (reticência), quando não se dispõe do dado; 
 0; 0,0; 0,00 (zero), quando o valor numérico é muito pequeno para ser expresso pela 
unidade utilizada, respeitando o número de casas decimais adotado; 
 
Normas de construção 
a) As tabelas devem ser fechadas acima e abaixo por linha horizontal, não sendo fechadas à 
direita e à esquerda por linhas verticais. 
b) O cabeçalho, os totais e os subtotais devem ser destacados por traços horizontais; 
c) Manter a uniformidade do número de casas decimais. 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
12 
 
 
Exemplo - Tabela univariável 
 
Tabela – Mercado brasileiro de chocolate (2000) 
Empresas Porcentagem 
Lacta 35,4 
Nestlé 31,6 
Garoto 22,0 
Neugbauer 3,6 
Ferrero Rocher 0,9 
Outras 6,5 
Total 100,0 
Fonte: ACB 
 
 
Exemplo - Tabela bivariável 
 
Tabela - Índice percentual do rendimento da Poupança no Brasil (2007) 
Meses 
Índice (%) 
Mensal Anual 
Agosto 0,65 5,29 
Setembro 0,54 5,85 
Outubro 0,61 6,50 
Novembro 0,56 7,10 
Dezembro 0,56 7,70 
Total 
Fonte: Indicadores Econômicos da Agência de notícias Dossiê-Dinheiro 
 
 
 
ATIVIDADE 3 - REPRESENTAÇÃO TABULAR 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
13 
TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS 
 
 Quando se estuda uma variável, o maior interesse do pesquisador é conhecer o 
comportamento dessa variável através da variação contida nos seus dados. A simples inspeção 
visual desses dados dificilmente trará alguma informação relevante, assim, é necessário 
sintetizá-los na forma de tabelas. 
 Uma distribuição de frequência é um sumário tabular de dados que mostra a 
frequência (o número) de observações em cada uma dos diversos intervalos ou categorias. 
 
 Para os dados qualitativos: 
 
Distribuição dos empregados da seção de orçamentos da Companhia MB 
segundo o grau de instrução – 2011 
Grau de instrução 
Frequência 
Absoluta (fi) 
Frequência 
Relativa (fr%) 
Fundamental 12 33,33 
Médio 18 50,00 
Superior 6 16,67 
Total 36 100 
 Fonte: RH 
 
Observa se de forma rápida e concisa as informações sobre o grau de instrução dos 
empregados da empresa, onde se destaca que a metade deles cursou o ensino médio (50%) e 
somente seis têm curso superior o que equivale a 17% aproximadamente de todos os 
empregados. 
 
 Para dados quantitativos 
a) discretos: 
Idade dos funcionários da Companhia MB (2011) 
Idade 
Frequência 
Absoluta (fi) 
Frequência 
Relativa (fr%) 
20 8 22,22 
22 17 47,22 
26 6 16,67 
30 4 11,11 
35 1 2,78 
Total 36 100,00 
Fonte: RH 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
14 
b) contínuos: 
Faixa salarial de empregados da seção de orçamentos da Companhia MB (2011) 
Faixa Salarial (s.m) fi fr% 
4,00 | 8,00 10 27,78 
8,00 | 12,00 12 33,33 
12,00 | 16,00 8 22,22 
16,00 | 20,00 5 13,89 
20,00 | 24,00 1 2,78 
Total 36 100 
Fonte: RH 
 
 Para se agrupar os dados selecionam-se intervalos contínuos, onde cada valor coletado 
será alocado. Estes intervalos são chamados de intervalos de classe. 
 
 Etapas para a construção tabela de distribuição de frequências: 
1a Etapa: Encontrar o menor e o maior valor do conjunto de dados e calcular a amplitude 
entre eles por: At = no do maior – no do menor 
2a. Etapa: Não existindo um critério rígido para estabelecer o número ideal de intervalos, 
sugere-se que não se utilize menos de 6 e não mais de 15 intervalos. A experiência tem 
demonstrado que se pode determinar o número de intervalos (classes) através de: 
n tamanhode amostra uma para ,nlog.3,31K ou nK  
3a. Etapa: Determinar a amplitude dos intervalos usando: 
K
At
C  
 Sempre que possível pode-se arredondar o valor da amplitude dos intervalos para 
valores inteiros, o que possibilita melhor leitura da tabela. 
4a. Etapa: Definir os limites dos intervalos que podem ser expressos: 
a) 20 ||30: contém os extremos 20 e 30; 
b) 20| 30: contém o extremo 20 e não contém o extremo 30; 
c) 20 |30: não contém o extremo 20, mas contém o extremo 30; 
d) 20  30: não contém os extremos 20 e 30. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr.José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
15 
 
Exemplo: 
1) O conjunto de dados apresenta o número de clientes atendidos na LOJA AKI-É-BARATO nos meses de 
março e abril de 2012. 
42 47 51 52 55 56 57 57 58 59 
60 60 62 62 63 63 63 63 65 67 
68 69 71 72 72 72 72 73 74 74 
75 76 77 77 77 79 80 80 80 81 
82 84 84 86 86 91 93 95 95 98 
99 100 103 105 106 107 108 110 112 113 
 
2) O conjunto de dados apresenta o número de minutos que 50 usuários de Internet gastaram na rede 
durante o dia 30 de janeiro de 2013. 
7 7 11 17 17 18 19 20 21 22 
23 28 29 29 30 30 31 31 33 34 
36 37 39 39 39 40 41 41 42 44 
44 46 50 51 53 54 54 56 56 56 
59 62 67 69 72 73 77 78 80 86 
 
3) Faturamento (R$ 1000) do Supermercado Pague e Leve Ltda. Nos 40 dias de funcionamento nos meses 
janeiro e fevereiro de 2013. 
381 389 389 418 429 430 472 486 568 623 
669 682 699 728 821 821 822 856 866 904 
904 912 924 926 968 973 989 996 1006 1007 
1028 1084 1109 1112 1148 1149 1168 1175 1201 1209 
 
 
REPRESENTAÇÃO GRÁFICA 
 
 A representação gráfica da distribuição de uma variável tem a vantagem de, rápida e 
concisamente, informar sobre sua variabilidade. Nos gráficos deve sempre: 
 Ter um título, onde se destaca o fato, o local e o tempo. 
 Ser construído em uma escala que não desfigure os fatos ou as relações que se deseja 
destacar. A altura de um gráfico deve compreender entre 60% a 80% da largura. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
16 
 Colocar a fonte de obtenção dos dados, caso não seja o próprio autor que tenha feito a 
coleta. 
 
REPRESENTAÇÃO GRÁFICA PARA VARIÁVEL QUALITATIVA (CATEGÓRICA) 
Para esse tipo de variável os gráficos mais utilizados são: de colunas, de barras, de 
setores e de linhas. 
 
a) Gráfico de Colunas 
 
Figura – Porcentagem total de produtos exportados em alguns estados do Brasil em março 
 de 2010. 
 
b) ráfico de Setores 
 
 
Figura – Porcentagem total de produtos exportados em alguns estados do Brasil 
 em março de 2010. 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
17 
c) Gráfico de Barras 
 
Figura – Porcentagem total de produtos exportados em alguns estados do Brasil em março 
 de 2010. 
 
 
d) Gráfico de Linha 
 É o tipo mais utilizado para representar a evolução de uma variável ao longo 
do tempo. 
 
Figura – Série de cotações históricas da arroba do boi gordo no estado de São Paulo, Janeiro de 1999 à 
 Dezembro 2008. 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
18 
 
DISTRIBUIÇÃO DE DUAS OU MAIS VARIÁVEIS QUALITATIVAS 
 
Figura – Produção internacional de carne bovina no Brasil e Estados Unidos entre os 
 anos de 2000 e 2005 (FAO) 
 
 
Figura – Produção internacional de carne bovina no Brasil e Estados Unidos entre os 
 anos de 2000 e 2005 (FAO) 
 
 
 
REPRESENTAÇÃO GRÁFICA DE VARIÁVEIS QUANTITATIVAS 
 
 Para variáveis contínuas organizadas em tabelas de distribuições de frequências, 
três tipos de gráficos são utilizados: histograma, polígono de frequência e ogivas. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
19 
 
 Histograma 
Figura – Faturamento em milhões de reais da empresa AJK, 2010. 
 
 
 Polígono de Frequências 
 
Figura – Faturamento em milhões de reais da empresa AJK, 2010 
 
0
10
20
30
40
50
60
3 11 13 5 7 9 15 17 21 19 23 25 27 
0
10
20
30
40
50
60
2 4 6 8 10 12 14 16 18 20 24 22 26 28 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
20 
 
 Ogiva 
Figura – Faturamento em milhões de reais da empresa AJK, 2010 
 
 
 
ATIVIDADE 4 - DISTRIBUIÇÃO DE FREQUÊNCIAS 
 
 
MÉTODOS NUMÉRICOS 
 
Vimos que o resumo dos dados por meio de tabelas, gráficos e distribuições de 
frequências nos fornece informações sobre o comportamento de uma variável, mais 
informações complementares podem ser obtidas através valores representativos do conjunto, 
determinados pelas seguintes medidas: 
 
 Medidas de Posição: média, mediana e moda. 
 Medidas de Dispersão: amplitude total, variância, desvio-padrão e coeficiente de 
variação. 
 Medidas Separatrizes: quartil, decil e percentil. 
 
0% 
20% 
40% 
60% 
80% 
100% 
2 3 5 7 9 11 13 15 17 19 21 23 25 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
21 
 
MEDIDAS DE POSIÇÃO 
 
 As medidas de posição (média, mediana, moda) descrevem apenas uma das 
características dos valores numéricos de um conjunto de observações, o da tendência central, 
pois representam os fenômenos pelos seus valores médios, em torno dos quais tendem a 
concentrar seus valores. Também são chamadas por medidas de tendência central. 
 
 
 Média Aritmética 
 Seja uma amostra de n elementos composta pelos seguintes valores: x1, x2,..., xn. A 
média aritmética simples desses elementos é a soma das observações dividida pelo número 
delas. É representada por: 
n
x
X
n
i
i
 1 ou simplesmente 
n
x
X

 
Onde: n é o número de observações da amostra. 
 
 Se os dados são relativos a uma população, a média aritmética simples é calculada por: 
N
x
 
 
Sendo N é o número de elementos da população. 
 
Exemplo: As taxas de juros recebidas por uma amostra de 10 ações durante certo período 
foram (medidas em porcentagem): 
 
2,59; 2,64; 2,60; 2,62; 2,57; 2,55; 2,61; 2,50; 2,63; 2,64. Calcule a média. 
 
X = 
 
 Mediana 
A mediana é outra medida de tendência central de uma variável. A mediana é o valor 
que fica no meio da sequencia quando os dados são arranjados na ordem ascendente. 
Com um número ímpar de observações, a mediana é o valor do meio, ou seja, que 
divide os valores em partes iguais. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
22 
 Um número par de observações não tem um valor único no meio. Neste caso, 
seguimos a convenção de definir a mediana como sendo a média dos valores das duas 
observações do meio. 
 50% 50% 
 
 Md 
Exemplo: Para ilustrar o cálculo da mediana vamos considerar os seguintes dados que se 
referem aos salários iniciais pagos para uma amostra de 11 economistas: 
 
2350; 2450; 2550; 2380; 2560; 2210; 2390; 2630; 2440; 2420; 2380 
 
Arranjando as observações na ordem crescente, obtém-se a seguinte lista, chamada de rol: 
 
2210; 2350; 2380; 2380; 2390; 2420; 2440; 2450; 2550; 2560; 2630 
 
Uma vez que o número de observações é ímpar, a mediana é o valor que se encontra 
exatamente do meio da série. Assim, a mediana dos salários é 2420. 
 
Se retirar o valor 2210 dessa amostra, teremos um número par de salários: 
 
2350; 2380; 2380; 2390; 2420; 2440; 2450; 2550; 2560; 2630 
 
Assim, a mediana será a média dos dois valores centrais, que são: 2420 e 2440. 
2430
2
24402420


 MdMediana 
 
 Moda 
 
A moda é a observação mais freqüente. Caso não haja observação mais freqüente, a 
distribuição é amodal. Podemoster um conjunto unimodal (com uma moda), bimodal (com 
duas modas) ou multimodal (com três ou mais modas). Para ilustrar a identificação da moda, 
considere a amostra dos salários iniciais para os graduados em economia, apresentados 
anteriormente, nela verifica-se que o salário mensal inicial que ocorre mais de uma vez é 238, 
portanto, ele é a moda. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
23 
 A moda é uma importante medida de posição para os dados qualitativos. 
 
Exemplo: O conjunto de dados de preferência de refrigerantes resultou na seguinte 
distribuição de frequência: 
REFRIGERANTES FREQUÊNCIA 
Coca-Cola 19 
Coca-Cola Light 8 
Pepsi-Cola 13 
Sprite 5 
TOTAL 45 
 
A moda ou o refrigerante mais comprado é a Coca-Cola. Para este tipo de dados não tem 
sentido falar em média ou mediana. A moda fornece a informação de interesse, o elemento 
que ocorre com maior freqüência. 
 
 
MEDIDAS DE DISPERSÃO 
 São valores que representam a variabilidade de um conjunto numérico, isto é, o 
afastamento dos dados em relação a medida central. 
 Quanto maior a dispersão menor poder representativo da medida central (média). 
 
 Vários grupos podem ter a mesma média, mas serem muito diferentes na composição 
dos seus valores. Por exemplo: 
GRUPO VALORES MÉDIA 
A 5 5 5 5 
B 4 5 6 5 
C 1 5 9 5 
 A média dos três grupos é a mesma (5), mas no grupo “A” não há variação entre os 
dados, enquanto no grupo “B” a variação é menor que no grupo “C”. 
Verifica se que embora a média seja a mesma, mas os elementos são diferentes em 
cada grupo, logo a medida de dispersão pode representar, através de um único valor, as 
distâncias entre os elementos e a média dos grupos. 
 Esses valores são determinados pelas seguintes medidas: 
 Amplitude total. 
 Variância. 
 Desvio padrão. 
 Coeficiente de Variação. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
24 
 
 
 Amplitude Total 
 
 A amplitude total é a medida de dispersão mais simples. É denotada por At e calculada 
pela diferença entre os valores extremos, ou seja: 
 
 At = valor máximo – valor mínimo 
 
GRUPO VALORES MÉDIA AMPLITUDE TOTAL 
A 5 5 5 5 0 
B 4 5 6 5 2 
C 1 5 9 5 8 
 
 Facilmente observa se a dispersão dos conjuntos através, da amplitude total, maior 
dispersão maior valor. 
 
Exemplo: Os seguintes dados foram obtidos para o número de minutos gastos ouvindo 
música. 
8,3 14,3 24,6 37,0 39,2 50,2 59,2 64,9 81,7 90,3 
 
Assim a amplitude total do conjunto é: At = 
 
 
 Variância 
Como a amplitude total é uma medida que não leva em consideração todos os valores 
coletados, o cálculo da variância permite que seja usado todos os valores, sendo que sua 
medida corresponde a média dos quadrados das diferenças de cada valor com a média do 
grupo. 
É calculada pelas as expressões abaixo: 
 
Amostra População 
 
 
1n
n
x
x
s
2
i2
i
2



 
 
 
 
N
N
x
x
2
i2
i
2
 
 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
25 
Exemplo 1: A amostra apresenta o preço (R$) recomendável para diversas ações comerciais 
 
20 22 14 15 25 18 40 
 
 
 
 
 
 
 
Exemplo 2: Um departamento de produção usa o procedimento de amostragem para testar a 
qualidade de seus produtos. O departamento emprega a seguinte regra de decisão em uma 
estação de inspeção: se uma amostra de 14 itens tem uma variância maior que 0,005, a linha 
de produção precisa ser interrompida para reparos. Para testar a qualidade de seus produtos 
coletou-se uma amostra conforme quadro abaixo: 
3,43 3,45 3,43 3,48 3,52 3,50 3,39 
3,48 3,41 3,38 3,49 3,45 3,51 3,50 
A linha de produção deveria ser interrompida? 
 
 
 
 
 
 Desvio – Padrão 
 
 O desvio padrão define-se como a raiz quadrada da variância o que possibilita uma 
medida na mesma unidade dos dados. 
 Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população, e o 
desvio padrão s de um subconjunto em amostra 
Amostra População 
2
ss  2  
 
Exemplo: Considerando os dados do exemplo anterior, tem-se: 
 
2
ss  = 
 
www.cliqueapostilas.com.br
http://pt.wikipedia.org/wiki/Raiz_quadrada
http://pt.wikipedia.org/wiki/Vari%C3%A2ncia
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
26 
 
 Coeficiente de Variação 
 
 Para uma variável quantitativa 
 
 O coeficiente de variação serve para nos indicar o grau de representatividade da média 
dentro de um conjunto de dados, bem como para comparar o comportamento de dois 
conjuntos com unidades diferentes, pois trata se de uma medida relativa. 
É calculado por: 
 
x
s
CV  
É uma medida descritiva que indica a magnitude do desvio-padrão em relação à 
média. 
 
Por ser uma medida sem a influência das unidades (adimensional), podendo ser 
representada na forma percentual, bastando para isso multiplicá-la por 100. 
 
Exemplo: Tomando a média e desvio padrão do Exemplo 1 anterior, o coeficiente de 
variação será: 
ESTATÍSTICAS VALOR 
Média 
Desvio padrão 
Coeficiente de Variação 
Quanto menor o coeficiente de variação maior a representatividade da média. 
 
Exemplo: Em uma semana uma empresa recebeu as seguintes quantidades de pedidos para os 
produtos A e B. Determine os coeficientes de variação para cada produto. 
PRODUTO A 39 33 25 30 41 36 37 
PRODUTO B 50 52 47 49 54 40 43 
 
 
 
 
PRODUTO MÉDIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO 
A 
B 
 
 
 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
27 
 Para duas variáveis quantitativas 
 
Exemplo para a comparação dos coeficientes de variação entre duas variáveis. 
 
A tabela a seguir apresenta as medidas de tendência central; a dispersão absoluta e 
a relativa dos pesos e alturas de funcionários: 
PARÂMETROS ALTURA PESO 
Média (X) 168 cm 53 kg 
Desvio-padrão (s) 30 cm 9,49 Kg 
Coeficiente de Variação (C.V) 17,86% 17,90% 
 
 
Observa-se então, que embora o desvio padrão das alturas, seja aproximadamente, 
três vezes maior que o desvio padrão dos pesos, os coeficientes de variação são praticamente 
iguais para as duas amostras, isso significa que, embora os desvios padrão sejam discrepantes 
e por possuírem unidades diferentes, não podemos fazer esse tipo de comparação diretamente 
nos desvios, porém o grau de concentração dos dados em torno da média em cada variável é 
aproximadamente igual é o que indicam os coeficientes de variação, onde os resultados não 
têm influencia das unidades. 
 
Exemplos: 
 1) Uma variável contábil, medida em milhares de reais, foi observada em dois grupos de 
empresas apresentando os resultados seguintes: 
 
GRUPO MÉDIA DESVIO PADRÃO 
A 20 4 
B 10 3 
Qual produto que apresenta a maior dispersão absoluta e o de maior dispersão relativa? 
2) Os dados abaixo representam o volume de vendas de dois vendedores em cinco meses. 
MÊS VENDEDOR 1 VENDEDOR 2 
Janeiro 20 30 
Fevereiro 22 14 
Março 18 20 
Abril 20 12 
Maio 20 24 
 
Verifique qual vendedor tem menor variação nas quantidades vendidas mensalmente. 
 
ATIVIDADE 5 – MEDIDAS DE POSIÇÃO E DISPERSÃO 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
28 
 MEDIDAS SEPARATRIZES: QUARTIS, DECIS EPERCENTIS 
 
 Quartis 
 
Frequentemente é desejável dividir os dados em quatro partes, cada parte contendo 
aproximadamente um quarto, ou 25% das observações. A figura abaixo mostra um 
conjunto de dados divididos em quatro partes. 
 
 25% 25% 25% 25% 
 
 Q1 Q2 Q3 
 
Os pontos da divisão são referidos como quartis e estão definidos como: 
 
 Q1 = primeiro quartil, separa 25% dos elementos abaixo do seu valor. 
 Q2 = segundo quartil, separa 50% dos elementos (também mediana). 
 Q3 = terceiro quartil, separa 75% dos elementos abaixo do seu valor. 
 
 
 Decis 
 
Os decis dividem um conjunto de dados em dez partes iguais. 
 
 10% 10% ... 10%... 10% 10% 
 
 D1 D2 ... D5 ... D9 
 
onde: D1 = 1
0 decil, deixa 10% dos elementos abaixo do seu valor. 
 D2 = 2
0 decil, deixa 20% dos elementos abaixo do seu valor. 
 ............................................................. 
 D5 = 5
0 decil, deixa 50% dos elementos (coincide com a mediana) 
 ............................................................ 
D9 = 9
0 decil, deixa 90% dos elementos abaixo do seu valor. 
 
 
 Percentis 
 
Os percentis são as medidas que dividem um conjunto de dados em cem partes iguais. 
 
 1% 1% . . . 1 % 1% 
 
 P1 P2 P50 . . . P98 P99 
 
onde: P1 = 1
0 percentil, deixa 1% dos elementos abaixo do seu valor. 
 P2 = 2
0 percentil, deixa 2% dos elementos abaixo do seu valor. 
 ............................................................. 
 P50 = 50
0 percentil, deixa 50% dos elementos. (coincide com a mediana) 
 ............................................................. 
 P99 = 99
0 percentil, deixa 99% dos elementos abaixo do seu valor. 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
29 
Exemplo: A tabela representa o tempo de espera para ser atendido. 
4,44 4,47 4,48 4,51 4,54 4,54 4,61 4,64 4,66 4,68 
4,68 4,69 4,71 4,73 4,76 4,78 4,80 4,81 4,86 4,86 
4,87 4,88 490 4,90 4,95 4,95 4,96 4,97 4,98 4,98 
4,99 5,00 5,01 5,01 5,01 5,02 5,04 5,05 5,08 5,09 
5,09 5,10 5,11 5,11 5,16 5,16 5,18 5,18 5,19 5,24 
5,24 5,26 5,27 5,27 5,29 5,32 5,35 5,46 5,50 5,85 
 
Para se determinar o valor correspondente de um percentil, deve se: 
 
1o) Ordenar os dados em rol crescente. 
2o) Determinar o indicador de localização (L), dado por: 
100
.nk
L  , 
onde: k é o percentual desejado e n é o número de valores do conjunto de dados. 
 
 Se o valor de L for decimal, deve se recorrer a um dos seguintes procedimentos: 
1) Interpolação aritmética, que calcula o valor da parte decimal a partir da diferença 
com o menor valor do intervalo a qual esta inserido o percentil. Por exemplo, se o 
valor do L for igual a 12,6, isso mostra que o valor do percentil pretendido está entre 
os valores que ocupam as posições 12a e 13a, devendo então calcular a diferença de 0,6 
a partir do valor que ocupa a 12a através de uma regra de três, ou 
 2) Arredonda se o seu valor para o maior inteiro mais próximo. 
 Se o valor de L for inteiro, deve se somar o valor correspondente a L ao valor de L+1 
e dividir o resultado por dois. 
 
Exemplo: Calcular o percentil 25, que corresponde ao primeiro quartil, que deixa 25% dos 
dados abaixo e 75% dos dados acima do seu valor, usa se: 
 15
100
60.25
L 
Por se tratar de um número inteiro, deve se usar o 15º e o 16º valor em seu cálculo. Assim: 
77,4
2
78,476,4
25 

P = Q1. 
Isto equivale a dizer que 25% das pessoas levaram até 4,77 minutos para serem atendidas. 
 
Para se calcular o percentil 78 (P78), que deixa pelo menos 78% dos dados abaixo do 
seu valor, deve se: 
Localizar a sua posição na amostra através de: 8,46
100
60.78
L . 
Como o valor de L é decimal, vamos considerar as duas possibilidades: 
 
1) Interpolação aritmética: no valor de L está entre as posições 46a e 47a, onde estão 
os valores 5,16 e 5,18, observa-se que para uma diferença de uma unidade na posição 
tem se uma diferença de 0,02 nos valores dos tempos, assim aplicando uma regra de 
três para determinar o valor para a diferença de 0,06, logo; 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
30 
Posição Tempo 
1 → 0,02 
0,06 → X 
X = 0,0012 
 
Como a diferença 0,06 é com a posição 46a então basta somar o valor 5,16 e o valor de 
X, então o valor do P78 é 5,16 +0,0012 = 5,1612. (valor exato) 
 
 
2) Arredondamento 
 
Sendo 8,46
100
60.78
L , arredonda se para 47a posição, assim o valor de P78 será o valor 
5,18 (valor aproximado). 
 
 Assim, o valor 5,18 é o P78 que representa o tempo máximo gasto para serem 
atendidos 78% dos clientes. 
 
Observação: Caso se deseja calcular o quartil ou o decil, devem-se considerar as seguintes 
maneiras de determinar a posição do valor procurado. 
 
Para o quartil: 
4
.nk
L  sendo K = 1, 2, ou 3. 
 
Para o decil: 
10
.nk
L  sendo o valor de K um número de 1 a 9. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
31 
 
BOX PLOT 
 O box plot introduzido pelo estatístico americano John Tukey em 1977 é a forma de 
representar graficamente os dados da distribuição de uma variável quantitativa em função de 
seus parâmetros. Os cinco itens ou valores: o menor valor (x1), os quartis (Q1, Q2 e Q3) e o 
maior valor (xn), é importante para se ter uma idéia da posição, dispersão e assimetria da 
distribuição dos dados. Na sua construção são considerados os quartis e os limites da 
distribuição, permitindo uma visualização do posicionamento da distribuição na escala da 
variável. Para melhor compreensão deste box plot, a figura abaixo apresenta um esquema 
sintetizado: 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura – Esquema para construção do box plot 
 
A escala de medida da variável encontra-se na linha horizontal do quadro onde está 
inserida a figura. 
Na caixa retangular da figura são fornecidos os quartis Q1, na parte esquerda, e Q3 na 
parte direita da caixa. Entre eles encontra-se a mediana da distribuição. Observe que 50% da 
distribuição têm valores dentro da caixa. 
As linhas horizontais que saem da caixa terminam nos limites: inferior (LI) e superior 
(LS) da distribuição. Esses limites são determinados em função da distância entre os dois 
quartis (Q3 e Q1), isto é, do desvio inter-quartílico dado por: DQ = Q3 – Q1 seja o tamanho da 
 
 
Q1 Md Q3 
Ponto Externo 
* 0 
Ponto Solto 
1,5DQ DQ 1,5DQ 
Valores 
LI LS 
Valores típicos 
3,0DQ 
Limite inferior 
Limite superior 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
32 
caixa. Para determinar os limites deve-se primeiramente calcular, o denominaremos de B1 = 
1,5. DQ, assim os limites serão: 
LI = Q1 – B1 e LS = Q3 + B1 
Entre esses limites encontram-se os valores considerados como típicos da distribuição. 
Valores com afastamento superior a B1, para cima ou para baixo, são considerados 
atípicos, ou possíveis outliers. 
Caso detecta a presença desses pontos, deve-se calcular o B2 = 3. DQ, e verificar a 
existência de pontos entre B1 e B2, são chamados de pontos soltos, representados por (o). 
Valores com afastamento superior a B2 para cima ou para baixo são considerados 
como pontos externos, representados na figura por (*). 
 Quanto maior for o valor do desviointer-quartílico (DQ), maior a variabilidade da 
distribuição. 
Exemplo: O objetivo do administrador é lucrar o máximo possível com o capital 
investido em sua empresa. Uma medida de bom desempenho é o retorno sobre os 
investimentos. A seguir são apresentados os mais recentes retornos em milhares (R$). 
2.210 2.255 2.350 2.380 2.380 2.390 
2.420 2.440 2.450 2.550 2.630 2.825 
 Resumo de cinco pontos: 
menor valor = 2.210, 
quartil 1 = 2.365, 
quartil 2 = 2.405, 
quartil 3 = = 2.500 
e o maior valor = 2.825. 
Desvio inter-quartílico (Tamanho da caixa) = DQ = Q3 – Q1 = 2.500 – 2365 = 135 e o 
B1 = 1,5..DQ = 1,5. 135 = 202,5, logo os limites serão: 
LI = Q1 – B1 = 2365 – 202,5 = 2162,5 e o 
LS = Q3 + B1 = 2.500 + 202,5 = 2.702,5. 
 
Verifica-se que do lado esquerdo do conjunto todos os valores são menores que o 
limite inferior calculado, assim, a semi reta não deve ultrapassar o menor valor do conjunto, 
do lado direito do conjunto existe um ponto fora de B1, então, a semi reta deve atingir o 
tamanho de LS, em seguida, deve se calcular o B2, 
 B2 = 3. DQ = 3. 135 = 405, assim os pontos de referencia para o novo limite do lado 
direito é dado por: Q3 + B2 = 2.500 + 405 = 2.905, observa-se que o valor (2825) esta entre B1 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
33 
e B2, logo se trata de um ponto solto que deve ser representado por (0). Os dados fora destes 
limites são considerados pontos fora da curva. A Figura apresenta um esquema do box plot 
com esses resultados: 
 
 
 
 
 
 
 
 
 
Figura – Resultados do desempenho de retorno de investimento da empresa 
 
Observações atípicas (outlier) 
 É muito comum aparecerem entre os dados coletados, observações atípicas (outliers), 
isto é, valores muito grandes ou muito pequenos em relação aos demais. Um conjunto de 
dados pode apresentar apenas um ou vários outliers. 
 Observações atípicas alteram enormemente a média e a variabilidade do grupo a que 
pertencem e podem até mesmo distorcer as conclusões obtidas através de uma análise 
estatística padrão. Portanto, é de fundamental importância detectar e dar um tratamento 
adequado a elas. 
 
Causas do aparecimento de outliers 
 Dentre as possíveis causas do aparecimento de outliers, pode citar as seguintes: 
 Leitura, anotação ou transição incorreta dos dados. 
 Erro na execução do experimento ou na tomada da medida. 
 Mudanças não controláveis nas condições experimentais ou dos pacientes. 
 
Medidas a serem tomadas 
Quando um outlier é detectado, duas medidas podem ser tomadas: abandoná-lo ou 
conservá-lo. Existem justificativas para cada uma dessas medidas e o tipo de análise pode 
variar, dependendo se o outlier foi ou não eliminado. 
 
 
 2.162,5 2.365 2.405 2.500 2.702,5 
Ponto fora da curva 
 2.825 2.210 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
34 
Um outlier deve ser eliminado da análise quando houver uma justificativa 
convincente, por exemplo, quando a observação é incorreta ou houve erro na execução do 
experimento ou na anotação da medida. Após a eliminação do outlier pode-se fazer a análise 
estatística usando-se apenas as observações restantes, ou uma análise mais sofisticada, que 
foge ao nível deste texto. 
Por outro lado, se nenhuma explicação pode ser dada à observação atípica, o outlier 
pode refletir uma característica do que está sendo estudado. Neste caso, tal observação deve 
ser incluída na análise e um tratamento especial deve ser dado aos dados. Por exemplo, pode-
se usar uma ponderação da influência das observações ou alternativamente uma 
transformação ( x , log x, etc.) da variável estudada. 
 
Exemplo: 
 
Considere uma amostra com os seguintes valores dos preços praticados em 13 
estabelecimentos comerciais: 
 
3 15 17 18 21 21 22 25 27 30 38 49 68 
 
a) Forneça a regra de cinco itens para os dados. 
b) Calcule os limites superior e inferior. 
c) Trace o gráfico em caixa 
 
 
 
ATIVIDADE 6 – SEPARATRIZES / BOXPLOT 
 
 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
35 
 
PROBABILIDADE E AS VARIÁVEIS ALEATÓRIAS DISCRETAS E 
CONTÍNUAS 
 
INTRODUÇÃO À PROBABILIDADE 
 
As decisões nos negócios são freqüentemente baseadas na análise de incertezas tais 
como as seguintes: 
Quais são as chances de as vendas decrescerem se aumentarmos os preços? 
Qual é a plausibilidade de um novo método de montagem aumentar a produtividade? 
Qual é a probabilidade do projeto terminar no prazo? 
Quais são as chances de um novo investimento ser lucrativo? 
 
A probabilidade é uma medida numérica associada a ocorrência de certo fato. 
Os valores da probabilidade são sempre atribuídos numa escala de 0 a 1. A 
probabilidade próxima de zero indica baixa possibilidade de ocorrência do fato; já próxima de 
1 indica a maior facilidade de ocorrência deste fato. Por exemplo, se considerarmos o fato 
"chover amanhã", entendemos que quando a previsão do tempo indica 0,05 "uma 
probabilidade próxima de zero de chover" significa "quase sem chance de chover". No 
entanto, se uma probabilidade 0,90 de chuva é anunciada, sabemos que é muito provável que 
chova. Uma probabilidade de 0,50 indica que é tão provável que chova como não. A 
probabilidade pode assumir qualquer valor dentro da seguinte escala: 
 
 
A aplicação da probabilidade está presente em qualquer área de trabalho, até na nossa 
vida particular onde nos ajuda desenvolver planejamentos, estratégias nos negócios e nas 
atitudes que iremos tomar, como no caso do motorista que anda em alta velocidade, achando 
sempre que existe pouca possibilidade de ser apanhado. Nos negócios, as pessoas se sentem 
mais estimuladas aplicar seu dinheiro onde houver maior chance de se obter lucro. Assim, a 
probabilidade mede a possibilidade de ocorrência de um determinado fato. 
Como a probabilidade está associada à ocorrência de um acontecimento, denominado 
de experimento, os possíveis resultados desse acontecimento determinam um conjunto 
0 0,5 
1,0 
Chance crescente de ocorrência 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
36 
chamado de espaço amostral, e sub grupos associados a esse espaço são chamados de 
eventos. 
Por exemplo: No caso do lançamento de um dado, todos os resultados possíveis, 
compõem o espaço amostral representado por: 
S= {1, 2, 3, 4, 5, 6} 
 
Nesse experimento a probabilidade de sair cada um desses valores é 1/6, ou 0,17. O 
valor da probabilidade é sempre expresso sem unidade de medida, pois, representa o 
relacionamento entre dois conjuntos, ou de um elemento com seu próprio conjunto. Para 
melhor entendimento dessa relação, expressa se em porcentagem, logo a probabilidade de 
cada elemento no lançamento de um dado é aproximadamente 17%. 
 
Para o experimento do lançamento de um dado sua distribuição de probabilidade é 
expressa da seguinte forma: 
 
Número 1 2 3 4 5 6 Soma 
Probabilidade 1/6 1/6 1/6 1/6 1/6 1/6 6/6 = 1 
 
Verifica se: 
 Que os elementos do espaço amostral têm a mesma probabilidade, o que determina um 
espaço amostral considerado equiprovável. 
 Todas as probabilidades são positivas. 
 A soma das probabilidades é igual a um, ou seja, para todos os espaços amostrais a 
probabilidade a será: P(S) = 1. 
 
É importante salientar que: 
A probabilidade é igual a zero quando o evento for vazio (), isto é: P() = 0. 
 SendoA , o evento complementar do evento A, a sua probabilidade pode ser calculada 
através de: P( A ) = 1 - P(A) 
 
 No caso de um evento com o seguinte atributo o número ser menor que quatro, o 
evento é: A={1, 2, 3}, para o cálculo da probabilidade associada a esse evento,usa se: 
 
amostralespaçodoelementosdeNúmero
AeventodoelementosdeNúmero
AP
 
 
)(  ou 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
37 
possíveiscasosdeNúmero
favoráveiscasosdeNúmero
AP
 
 
)(  
Assim para o evento A, tem se: %505,0
6
3
)( AP . 
Outros exemplos: 
1) Num encontro consiste 25 estudantes de administração, 10 de economia, 15 de contábeis a 
e 8 de engenharia de produção. Se uma pessoa é selecionada aleatoriamente pelo o instrutor 
para responder a uma pergunta, determine a probabilidade de que o estudante escolhido: a) 
seja da administração; b) seja da engenharia de produção ou contábeis; c) não seja da 
economia. 
 
2) Suponha que em um lote de 12 peças, 4 sejam defeituosas. Duas peças são retiradas 
aleatoriamente. Calcule a probabilidade de: a) ambas sejam defeituosas; b) ambas sejam 
perfeitas; c) pelo menos uma seja defeituosa. 
 
3) Um grupo de pessoas está numa sala e é constituído por: 5 rapazes de mais de 21 anos, 4 
rapazes com menos de 21 anos, 6 moças com mais de 21 anos e 3 moças com menos de 21 
anos. Uma pessoa é escolhida ao acaso dentre as 18. Qual a probabilidade de: a) ter mais de 
21 anos; b) ser um rapaz; c) ser uma moça; d) ser moça com menos 21 anos. 
 
4) O sistema escolar do país Só alegria fornece acesso a internet a 21.733 escolas do nível 
fundamental, 7.286 escolas do nível médio e 10.682 do nível superior. Existem no país 51.745 
escolas do nível fundamental, 14.012 do nível médio e 17.229 do nível superior. 
a) se você escolher aleatoriamente uma escola do nível fundamental para visitar, qual é a 
probabilidade de que ela tenha acesso a internet? 
b) se você escolher aleatoriamente uma escola do nível médio para visitar, qual é a 
probabilidade de que ela tenha acesso a internet? 
c) se você escolher aleatoriamente uma escola para visitar, qual é a probabilidade de que ela 
seja do nível fundamental? 
d) se você escolher aleatoriamente uma escola para visitar, qual é a probabilidade de que ela 
tenha acesso a internet? 
 
ATIVIDADE 7 - PROBABILIDADE 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
38 
 
VARIÁVEIS ALEATÓRIAS 
 
 Uma variável aleatória fornece um meio para se descrever os resultados experimentais, 
através de valores numéricos, associando um valor numérico a cada resultado do experimento. 
Essa variável aleatória se classifica como discreta ou contínua, dependendo dos valores 
numéricos que assume. 
 
 
VARIÁVEIS ALEATÓRIAS DISCRETAS 
 Uma variável que pode assumir tanto um número finito de valores como infinita 
seqüência de valores tais como 0,1,2,3,4,... é denominada variável aleatória discreta. 
 
EXEMPLOS: 
EXPERIMENTOS 
VAR. ALEATÓRIAS 
DISCRETAS 
POSSÍVEIS VALORES DA 
VARIÁVEL 
Atender cinco clientes no de clientes que compram 0,1,2,3,4,5 
Inspecionar 50 declarações de 
Imposto de Renda 
no de declarações com erros 0,1,2,3,...,49,50 
Verificar as refeições servidas num 
restaurante durante um dia 
no de refeições servidas 0,1,2,3,4,5,... 
 
 
DISTRIBUIÇÃO DE PROBABILIDADE 
Para uma variável aleatória discreta x, a distribuição de probabilidade é definida por 
uma função de probabilidade, denotada por f(x). Essa função dá a probabilidade para cada um 
dos valores da variável aleatória. 
No desenvolvimento de uma função de probabilidade para qualquer variável discreta, 
duas condições precisam ser satisfeitas: 
p(x)  0 e  p(x) = 1 
Considere as vendas de automóveis de certa empresa como exemplo de uma variável 
aleatória discreta e sua distribuição de probabilidade. 
Nos últimos 300 dias de operação, os dados de vendas mostram 54 dias sem vendas de 
automóveis, 117 dias com 1 automóvel vendido, 72 dias com 2 automóveis vendidos, 42 dias 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
39 
com 3 automóveis vendidos, 12 com 4 automóveis vendidos e 3 dias com 5 automóveis 
vendidos. Sendo a variável aleatória de interesse x o número de automóveis vendidos durante 
um dia. 
E sua distribuição de probabilidade é dada por: 
X 0 1 2 3 4 5 Total 
p(x) 54/300 117/300 72/300 42/300 12/300 3/300 300/300 
 
A principal vantagem de se definir uma variável aleatória com sua distribuição de 
probabilidade é que observando a distribuição das vendas de automóveis desta empresa, 
vemos que o número mais provável de automóveis vendidos durante um dia é um com a 
probabilidade de 0,39 (117/300). Além disso, outras probabilidades podem ser calculadas, 
pois se o gerente quiser saber qual a probabilidade de se vender três automóveis ou mais 
durante um dia, p(3) + p(4) + p(5) = 0,14 + 0,04 + 0,01 = 0,19. Essas probabilidades fornecem 
informações que possibilitam entender o processo de venda de automóveis da sua empresa. 
 Uma distribuição de probabilidades de uma variável aleatória discreta apresenta 
sempre duas características numéricas que são muito importantes para descrição do 
comportamento dessa variável, são os parâmetros das distribuições, que chamamos de 
esperança matemática e variância. 
 
 
ESPERANÇA MATEMÁTICA 
 
Denotada por E(x), que representa a média de uma variável aleatória. O valor esperado 
é uma média ponderada dos valores que a variável aleatória pode assumir, onde os pesos são 
as probabilidades. A expressão matemática para representar o valor esperado da variável 
aleatória x é: 
 )(.)( xfxxE 
Exemplo: Tendo a distribuição de probabilidade do número de automóveis vendidos durante 
um dia na SOCAR. 
X f(x) x.f(x) x2.f(x) 
0 0,18 0 0 
1 0,39 0,39 0,39 
2 0,24 0,48 0,96 
3 0,14 0,42 1,26 
4 0,04 0,16 0,64 
5 0,01 0,05 0,25 
 Total 1,5 3,5 
 
  )x(f.x)x(E 1,5. Significa que se espera vender em média 1,5 carros por dia. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
40 
VARIÂNCIA 
 A variância é uma média ponderada dos desvios da variável aleatória em relação a sua 
média, elevados ao quadrado, onde os pesos são as probabilidades. A expressão matemática 
usada para o seu cálculo está a seguir. 
 
Sendo  )x(f.x)x(E 22 = 3,5. Logo a variância é: 
 
 2222 )x(E)x(E)x(f.)x()x(V   = 3,5 – (1,5)2 = 1,25 
 
 
DESVIO – PADRÃO 
 O desvio padrão da variável x é a raiz quadrada da variância, isto é: 
 
)( xV = 12,125,1  
 
 
DISTRIBUIÇÃO BINOMIAL 
 
 Vários tipos de variável aleatória são usados com tanta freqüência que receberam 
nomes especiais. Uma distribuição de variável aleatória discreta importante é a chamada 
distribuição binomial. 
 A distribuição binomial se aplica a qualquer situação em que se realizam várias provas 
independentes, cada uma das quais comporta apenas um dentre dois resultados possíveis. 
Esses dois resultados chamam-se “sucesso” e “fracasso”. Seja X o número de sucessos. Se a 
probabilidade de sucesso em cada prova é p e a probabilidade de fracasso é q = 1 – p. Então a 
fórmula da função de probabilidade para a variável aleatória binomial é: 
xnxx
n qpCxP
 ..)( 
Onde: p = probabilidade do sucesso (o que se está sendo verificado) 
q = probabilidade do fracasso, sendo p + q = 1, logo q = 1 – p. 
 
x
nC A combinação de n elementos tomados x a x, dada por:  !xn!x!n
C xn 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
41 
Sendo a Esperança (média) dada por: pnxE .)(  e a variância qpnxV ..)(  
 
 
Exemplo 1: Sabendo-se que 80% dos clientes de uma agência bancária são homens, qual a 
probabilidade de se encontrar numa amostra de dez clientes: 
a) Exatamente sete clientes homens? b) Mais de sete clientes homens? 
c) Nenhum cliente homem? d) Calcule a média esperada e o desvio padrão de 
clientes do sexo masculino. 
 
Exemplo 2: Uma firma exportadora sabe que 5% das exportações algum problema na 
documentação. Se ela realizar negócios com seis clientes, determine a probabilidade de: 
a) Exatamente dois apresentarem problemas. b) Ao menos um apresentar problema. 
c) No mínimo quatro apresentarem problemas. d) Exatamente cinco não apresentarem 
problemas. d) Determine a média esperada e variância que descreve o comportamento deste 
negócio de exportação. 
 
Exemplo 3: O departamento de qualidade de uma empresa seleciona, aleatoriamente, alguns 
itens que chegam “a empresa e submete-os a testes”. Para avaliar um lote de 150 
refrigeradores, o departamento de qualidade selecionou 10 refrigeradores. Ele vai recomendar 
a aceitação do lote se não existir item defeituoso na amostra. Supondo que o processo 
produtivo desses refrigeradores gera um percentual de 3% de defeituosos, responda: qual a 
probabilidade de que o lote venha a ser aceito? 
 
 
ATIVIDADE 8 - DISTRIBUIÇÃO BINOMIAL 
 
 
 
VARIÁVEL ALEATÓRIA CONTÍNUA 
 
Uma variável aleatória que pode assumir qualquer valor numérico em um intervalo ou 
uma coleção de intervalos é chamada de variável aleatória contínua. Como exemplo, 
podemos considerar os resultados experimentais baseados em medição, ou seja: tempo, peso, 
distância, temperatura etc. 
 
EXEMPLOS: 
EXPERIMENTOS V. A. CONTÍNUAS 
POSSÍVEIS VALORES V. 
A. C. 
Anotar o tempo gasto no atendimento de clientes. Tempo x  0 
Anotar os volumes em recipientes de refrigerante 
(Max =300 ml). 
Volume 0  x  300 ml 
Anotar o tempo gasto nas ligações telefônicas. Tempo x  0 
 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
42 
FUNÇÃO DE DENSIDADE DE PROBABILIDADE 
 
Para as variáveis aleatórias contínuas a sua FUNÇÃO DE DENSIDADE DE 
PROBABILIDADE satisfaz as seguintes condições: 
a ) p (x)  0 ,  x  R b ) 


1 )( dxxp 
 A aplicação da integral em uma função é um cálculo matemático, que às vezes, é 
difícil devido ao tipo da função que determina o comportamento da variável, sendo que a 
probabilidade é dada pela área determinada através da integral entre dois pontos que 
determina o intervalo considerado na função. 
 
 
DISTRIBUIÇÃO NORMAL 
 
 É a mais importante distribuição de probabilidade, sendo aplicada em inúmeros 
fenômenos e utilizada para o desenvolvimento teórico da estatística. É também conhecida 
como distribuição de Gauss, Laplace ou Laplace-Gauss. 
 A distribuição normal é um exemplo de distribuição de variável aleatória contínua. Na 
verdade há muitas distribuições normais diferentes. Pode-se identificar uma distribuição 
normal especificando-se dois números: a média e a variância (ou desvio padrão). A média está 
localizada no pico da distribuição. A variância define a forma da distribuição, se ela é muito 
dispersa ou se a maior parte da área se concentra na proximidade do pico, ou seja, do valor 
médio. 
 
Se X é uma variável aleatória normal com média () e variância (2), então sua função 
de densidade é dada por: 
 














 
0
 .
2
1
)(
2
2
1




 x
paraexp
x
 
 
Onde  é a média  o seu desvio padrão. 
 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
43 
 O gráfico determinado pela função da distribuição normal assemelha-se muito a um 
sino, com o pico localizado na média () conforme figura abaixo: 
 
 
 
 
 A distribuição normal é especificada pela média e o desvio padrão. A variância (2) 
determina a forma da curva; sendo que quanto maior o valor da variância significa maior 
dispersão na curva. 
 Sua probabilidade é determinada pela área sob a curva, através da integral no intervalo 
associado aos valores da variável. 
 
 As principais características dessa função são: 
 A curva é simétrica em relação à média () 
 A média = mediana = moda 
 É assintótica em relação ao eixo das abscissas. 
 
 
 DISTRIBUIÇÃO NORMAL PADRONIZADA 
 
Na maioria das vezes em que necessitamos da área sob a curva normal, devemos 
recorrer a uma tabela. Seria impossível elaborar uma tabela para cada distribuição normal 
com todos os valores possíveis da média e da variância. Felizmente, podemos achar os 
resultados para qualquer distribuição normal apelando para uma tabela de distribuição normal 
com média  = 0 e variância 2 = 1. Essa distribuição normal especial é chamada distribuição 
normal padrão. 
Na prática, a distribuição normal apresenta um número muito grande de combinações 
entre a média e o desvio padrão. No entanto, através da mudança de variável, contornamos 
esse problema, fazendo com que todas as inúmeras distribuições normais reduzam-se a apenas 
uma, ou seja, à distribuição Z. Além da variável z ser desprovida da unidade de medida (isto 
é, constitui um número puro), ela serve para qualquer tipo de variável, independentemente de 
sua unidade usando a seguinte fórmula: 



x
 z 
Onde z tem distribuição normal reduzida com a seguinte função densidade de probabilidade. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
44 
 .e
2πσ.
1
 = p(x)
2
σ
μx
2
1





 
 Sendo 



x
 z    2
2
.
2
1 z
ezp



 
 
Exemplo 1: Usando a tabela da normal reduzida, calcule as seguintes probabilidades. 
 
a) P (-2,34 < z < 0) b) P (-0,5 < z < 1,48) 
c) P (0,86 < z < 2,89) d) P (-1,02 < z < -1,97) 
e) P (z > 1,47) f) P (z < 2,05) 
g) P (z > -2,63) h) P (z < -0,44) 
 
Exemplo 2: Os salários pagos para os funcionários em determinada empresa seguem uma 
distribuição normal com média igual a R$ 1.400,00 e desvio padrão igual a 
R$ 227,00. Calcule a probabilidade de um funcionário escolhido ao acaso apresentar salário: 
a) maior que R$ 1.680,00 
b) menor que R$ 1450,00 
c) qual o salário máximo para os 15% que detém os menores salários? 
 
Exemplo 3: O tempo para um sistema computacional execute determinada tarefa é uma 
variável aleatória com distribuição normal, com média 320 segundos e desvio padrão de 7 
segundos. 
a) Qual é a probabilidade de a tarefa ser executada entre 310 a 325 segundos. 
b) Qual o tempo mínimo que separa os 10% dos tempos que mais demoram na execução? 
 
Exemplo 4: Seja x a variável aleatória contínua com distribuição normal com um tempo 
médio de atendimento de 2 minutos por cliente e desvio padrão 0,04 min. Determine a 
probabilidade de um cliente ser atendido: 
a) Entre 2 e 2,05 min. 
b) Menos de 1,90 min. 
 
 
ATIVIDADE 9 - DISTRIBUIÇÃO NORMAL 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
45 
 
ATIVIDADE 1 - AMOSTRAGEM / VARIÁVEIS 
 
1) Classifique as seguintes variáveis como quantitativas ou qualitativas: idade, sexo, renda familiar, 
religião, cor, tempo de execução de uma tarefa e atividades esportivas. 
 
2) Identifique as situações apresentas abaixo como variávelquantitativa discreta ou contínua: 
a) cada cigarro ( Ki-Mata) tem 16,1 mg de alcatrão; 
b) o altímetro de um avião indica uma altitude de 21359 pés; 
c) uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de 
computador on-line; 
d) o radar indica que Guga executou um saque com 110 Km/h; 
e) de 1000 consumidores pesquisados, 930 reconheceram a marca da sopa Ki-delicia; 
f) o tempo total gasto anualmente por um motorista de táxi em Nova York ao dar passagem a pedestres 
é de 2,4 segundos; 
g) ao terminar uma partida de vôlei um atleta pesa 1,4 Kg a menos do início da partida 
 
3) Escreva sobre a forma de obter uma amostra de uma população que se considera organizada 
alfabeticamente. 
 
4) Destaque a característica observada na população para aplicação da amostragem estratificada ou por 
conglomerado. Escreva os procedimentos que devem ser realizados nessas amostragens. 
 
5) O Laboratório de Teste Produtos para o Consumidor seleciona uma dúzia de pilhas (indicadas como 
de nove volts) de cada um dos fabricantes, e testa a capacidade efetiva de cada uma.Que tipo de 
amostragem (aleatória, estratificada, sistemática, por conglomerado, de conveniência) está sendo 
utilizado? 
 
6) Identifique o tipo de amostragem utilizada: simples ao acaso, sistemática, estratificada, por 
conglomerado, por conveniência e por quota: 
a) Um assessor de um candidato deseja retirar uma amostra de 200 das 7.964 residências familiares de 
um município. Para isto, lhes atribui os números: 0001, 0002, ..., 7964. 
b) Um pesquisador da Universidade Estadual de Londrina pesquisa todos os estudantes de uma das 
turmas de Economia selecionada aleatoriamente. 
c) A empresa Sony seleciona um a cada 100 CDs de sua linha de produção para fazer teste de 
qualidade. 
d) O Programa de Planejamento Familiar deseja se informar sobre os pontos de vista dos homens e das 
mulheres sobre o uso de anticoncepcionais. Para isso entrevista todos os homens e mulheres desta 
comunidade. 
e) O departamento de compras de uma Empresa deseja verificar a qualidade das peças adquiridas de 
seus fornecedores. Para isto, seleciona aleatoriamente uma amostra das peças de cada um de seus 
fornecedores. 
f) Ao fazer uma pesquisa para o noticiário vespertino, um repórter da TV entrevista 20 pessoas que 
saem do auditório do Teatro Cultura. 
g) Das pessoas escaladas para um de júri, fez-se um sorteio entre as mulheres e entre os homens. 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
46 
ATIVIDADE 2 - TAMANHO DE AMOSTRA 
 
1) Em uma população de 4.780 elementos, qual o tamanho mínimo de uma amostra para que sejam 
respeitados os seguintes níveis de probabilidade: de significância de 5% e o erro amostral de 2%? 
(Z=1,96) 
 
2) Deve-se extrair uma amostra de tamanho n = 320 de uma população de tamanho N = 2000, que 
consiste de quatro estratos de tamanhos N1 = 500, N2 = 1200, N3 = 200 e N4 = 100. Se a alocação deve 
ser proporcional, qual o tamanho da amostra a ser extraída de cada um dos quatro estratos. 
 
3) Deseja-se fazer uma pesquisa junto a uma empresa para saber o interesse dos funcionários em 
realizar cursos no exterior. Existem 3 mil funcionários, sendo 1,8 mil com mais dez anos de empresa e 
1,2 mil com menos. Qual deve ser o tamanho da amostra probabilística sabendo-se que em cursos 
semelhantes 5% dos funcionários acima de dez anos e 10% dos com menos de dez anos de empresa 
participaram. Considerando 2% para o erro amostral e 90% de segurança. (Z = 1,64) 
 
4) Qual o tamanho da amostra necessária para obter o intervalo de 98% de segurança para uma 
proporção populacional se o erro tolerável é 9%?(Z=2,33) 
 
5) Em uma pesquisa recente de mercado, o analista deseja estimar a proporção de pessoas que 
compram o sabonete Cremoso e Refrescante. Pede-se: a) que tamanho de amostra devemos escolher se 
queremos que, com probabilidade de segurança de 87%, a estimativa não desvie do verdadeiro valor 
por mais de 3%? (Z=1,51), b) se tivermos a informação adicional de que a aceitação do sabonete é de 
no mínimo 82%, qual deve ser então o tamanho da amostra?(Z=1,51). c) se decidimos por uma 
amostra de tamanho 81, qual o erro máximo que cometemos com uma probabilidade 90%, caso nada 
saibamos? (Z=1,64) 
 
6) Uma pesquisa de mercado tem como objetivo estimar a proporção de pessoas que consomem o 
biscoito Delícia Total. Pede-se: a) que tamanho de amostra devemos colher se queremos que, com 
nível de confiança de 92%, a estimativa não desvie do verdadeiro valor por mais de 4%?(Z=1,75), b) 
se tivermos a informação adicional de que a proporção de consumo do tal biscoito é no máximo de 
35%, qual então deve ser o tamanho da amostra?(Z=1,75), c) decidimos colher uma amostra de 
tamanho 130. Qual o erro máximo que cometemos com nível de confiança de 96%? (Z=2,05) 
 
7) Uma empresa de pesquisa eleitoral foi contratada por u, político com o objetivo de investigar a 
preferência dos eleitores pelo candidato da situação na próxima eleição. Sabe-se que a empresa e o 
partido concordaram em usar um nível de confiança igual a 95% e um erro máximo igual a 4%. 
Calcule os tamanhos das amostras necessárias nos seguintes casos. 
Município Universo dos eleitores Valor suposto para a incidência 
Gigantópolis Muito grande Nenhum 
Miracema do Sul 5.000 6% 
Bela Morada do Oeste 30.000 Nenhum 
 
8) Um candidato a prefeito gostaria de fazer uma pesquisa eleitoral sobre a intenção de voto na sua 
cidade de 45.896 eleitores. Sabe-se que sua popularidade é muito grande e existem boas perspectivas 
para o candidato no primeiro turno das eleições. Estima-se que 72% dos eleitores pretendem votar no 
candidato. Assumindo um nível de confiança de 91% e um erro amostral de 2%, qual deveria ser o 
tamanho da amostra a ser analisada? (Z=1,70) 
www.cliqueapostilas.com.br
http://www.cliqueapostilas.com.br
Dr. José Carlos Dalmas / Ms. José da Costa Soeiro 
Centro de Ciências Exatas (CCE) – Departamento de Estatística (DSTA) 
47 
ATIVIDADE 3 - REPRESENTAÇÃO TABULAR 
 
1) Numa pesquisa visando analisar os moradores da cidade Morando Bem, um dos pontos recaiu sobre 
a renda familiar e o tamanho das famílias dos moradores. Numa amostra de 150 moradores 
entrevistados verificou-se que: 
-dos 52 moradores de renda baixa, cinco tinham famílias pequenas e 15 famílias médias; 
-dentre aqueles de renda média baixa, oito tinham famílias pequenas, 10 famílias médias e 20 famílias 
grandes; 
-dentre os 45 moradores de renda média, 25 tinham famílias médias e oito famílias grandes; 
-dos 12 que representavam os moradores de renda média alta, seis tinham famílias pequenas e apenas 
duas de famílias grandes; 
-além disso, a amostra continha três moradores de renda alta: dois com famílias pequenas e um com 
família média. 
De acordo com os dados acima, construa uma tabela que descreva os dados, apresentando as 
frequências e porcentagens em relação ao total geral. 
 
2) No ano de 2003, foram atendidos 627 clientes no setor de reclamação no Banco Money. Em 2004 
foram atendidos 813 clientes. Em 2003, 595 eram brasileiros, dos quais 185 mulheres, sendo que havia 
apenas cinco moças estrangeiras. Em 2004 foram atendidos 50 estrangeiros, dos quais apenas 6 eram 
mulheres. Dos brasileiros atendidos nesse ano, haviam 204 mulheres. Represente esses dados na forma 
tabular. 
 
3) Uma pesquisa de opinião pública entrevistou 950 pessoas a respeito da fluoração da água da cidade, 
dessas 432 mostravam-se favoráveis, 322 eram contrárias, 122 não tinham opinião formada sobre a 
questão e as restantes não responderam. Mostre esses dados através de uma representação tabular, 
apresentando as frequências e também os percentuais. 
 
4) Construa uma distribuição tabular para mostrar que, de acordo com uma pesquisa desenvolvida pelo 
PNAD (Pesquisa Nacional por Amostra de Domicílios), em 1996 havia no Brasil

Outros materiais