Prévia do material em texto
Profª. Ms,c. Cristiane de
Brito Nunes da Silva
APOSTILA DE INTRODUÇÃO À
PROBABILIDADE E ESTATÍSTICA
2
cristiane_brito_3@hotmail.com
Sumário
I – Introdução
II – Apresentação dos Dados e Tabelas
III – Representação Gráfica
IV – Medidas de Tendência Central
V – Medidas de dispersão
VI – Probabilidade
VII – Distribuição Discreta de Probabilidade
VIII – Distribuição Contínua de Probabilidade
IX – Análise de Correlação e Regressão
3
cristiane_brito_3@hotmail.com
I - Introdução:
O objetivo desta apostila é desmistificar o cálculo estatístico, tornando-o mais simples e
descomplicado, mostrando que o mesmo não é um “bicho de sete cabeças” como a maioria das
pessoas imagina.
O propósito é mostrar aos alunos do curso do Ciências Contábeis que as técnicas estatísticas
podem ajudá-los a tomar decisões.
A apostila esta dividida em capítulos com conteúdos pertinentes ao programa disciplinar
desenvolvido nesta faculdade, com exemplos e exercícios práticos.
O primeiro capítulo mostrará os conceitos e definições para o entendimento da Estatística
Descritiva.
1.1- Regras de Somatório
Muitas quantidades importantes em matemática tem a necessidade de ser escreta em
expressões que envolvem somas com um grande número de parcelas, para estas situações, uma
notação muito prática é a somatória (também chamada somatório ou notação sigma).
Em geral, a notação sigma tem a forma
Último elemento dos termos a serem somados
Termo geral do somatório
Instrução para somar
Observação individual do somatório
Primeiro elemento dos termos a serem somados
4
cristiane_brito_3@hotmail.com
1.1.1 Regras do somatório:
Somatório de uma constante: se k é uma constante, então
Exemplos:
Somatório do produto de uma constante por uma variável: se k é uma constante e xi
uma variável
Exemplo:
Somatório de uma soma algébrica: o somatório de uma soma de variáveis é igual à
soma dos somatórios de cada variável.
Se a e b são constantes e xi uma variável
5
cristiane_brito_3@hotmail.com
Exemplo:
Observações:
Exercícios:
1) Seja X = {4, 7, 9,12, 3}, Obter:
a)
b)
2) Sendo X = {7, 3, 9, 5, 6} e Y = {3, 2, 8, 1, 1}, calcular:
a)
b) =
c)
d)
e)
6
cristiane_brito_3@hotmail.com
f)
g)
h)
i)
1.2 Regra de arredondamento de dados
Os números resultam de uma mensuração, a qual só pode ser exata quando assume a forma de
contagem ou enumeração, em números naturais, de coisas ou unidades mínimas indivisíveis. Em tais
casos, a variável pode assumir valores discretos. Outras mensurações se dão numa escala contínua,
que pode teoricamente ser definidamente subdividida.
1.2.1 Arredondamento de dados
É a supressão de unidades inferiores às de determinada ordem.
De acordo com a Resolução nº 886/66 do IBGE, o arredondamento é feito da seguinte
maneira:
Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica
inalterado o último algarismo a permanecer:
Ex.: 53,24 passa a 53,2
Quando o primeiro algarismo a ser abandonado é 6, 7, 8, ou 9, aumenta-se de
uma unidade o último algarismo a permanecer.
Ex.:42,87 passa a 42,9
25,08 passa a 25,1
53,99 passa a 54,0
Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
1) Se ao 5 seguir, em qualquer casa, um número diferente de zero, aumenta-se uma unidade ao
algarismo a permanecer.
7
cristiane_brito_3@hotmail.com
Ex.: 2,352 passa a 2,4
25, 6501 passa a 25,7
2) Se o 5 for o último algarismo ou ao 5 só se seguirem zeros, o último algarismo a ser
conservado só será aumentado de uma unidade se for ímpar.
Ex.: 24,75 passa 24,8
24,65 passa a 24,6
24,75000 passa a 24,8
24,6500 passa a 24,6
Observação:
Não devemos nunca fazer arredondamentos sucessivos.
Ex.: 17,3452 passa a 17,3 (em vez de 17,35 e 17,4)
Se tiver que fazer outro arredondamento, fica recomendado a volta aos dados originais.
1.3 Conceitos e definições
Estatística: é a ciência que estuda um determinado tipo de fenômeno: os fenômenos coletivos
ou de massa. É, então, o conjunto de métodos e processos quantitativos que serve para estudar e
medir os fenômenos coletivos ou de massa. Um processo pelo qual se usa métodos e procedimentos
científicos para coletar, classificar, organizar, resumir, tabular, analisar e achar irregularidades dos
dados, pertencentes a um fenômeno coletivo, com a finalidade de auxiliar na tomada de decisões.
Fenômenos coletivos ou de massa: são os que não possuem regularidade na observação de
casos isolados, mas na massa de observações.
Exemplos: notas em estatística dos alunos de uma turma; renda dos brasileiros; lucro de
empresa brasiliense; oferta de certo produto por parte de empresas fornecedoras; etc.
População: Conjunto de todos os elementos que possui certas propriedades comuns, de
interesse para ser estudada estatisticamente.
Exemplo:
8
cristiane_brito_3@hotmail.com
Num estudo sobre satisfação por certo serviço, a população estatística é constituída
por todos os consumidores desse serviço;
Num estudo sobre hábitos de fumar de certa cidade, a população será formada por
todos os habitantes dessa cidade;
Num estudo sobre demanda por certo produto, a sociedade pode ser a população-alvo;
Num estudo sobre a oferta de certo produto, a população-alvo pode ser constituída por
estabelecimentos comerciais
Amostra: Subconjunto finito da população, selecionado adequadamente para representá-la.
Para que as conclusões sobre a população sejam fornecidas adequadamente pelas amostras é
necessário que elas sejam representativas da população.
Para obtermos amostras representativas existem vários métodos de extração, mas os mais
eficazes são aqueles e que os elementos que vao compor a amostra são selecionados por sorteio,
aleatoriamente.
Censo: estudo de uma população com base em todos os seus elementos.
Amostragem: É o estudo de uma população com base em uma parte representativa da
mesma, isto é, com base numa amostra. Em algumas ocasiões procede-se a uma coleta de dados
diretamente da origem, às vezes é impossível utilizar o universo de dados, então se recorre a métodos
e técnicas de levantamento de dados que chamamos de amostragem, que é um método de seleção dos
elementos de uma população, de modo a se obter uma amostra representativa da população ou
universo de dados.
Estatística Descritiva: Descreve, analisa e representa um grupo de dados, utilizando métodos
numéricos e gráficos que resumem e apresentam a informação contida neles. É atributo da Estatística
Descritiva a obtenção de algumas informações com médias, proporções, dispersões, tendências,
índices, taxas que resumem e representam os fenômenos observados.
9
cristiane_brito_3@hotmail.com
Estatística Inferencial: Apoiando-se no cálculo de probabilidades e nos dados de amostras,
efetuam estimativas, decisões, preferências ou outras generalidades sobre um conjunto maior de
dados.
1.4 Tipos de Amostragem
Para se retirar uma amostra é necessário determinar oscritérios que serão utilizados
para selecionar esta amostra. As regras de amostragem podem ser classificadas em duas categorias
gerais: probabilísticas e não probabilísticas.
1.4.1 Amostragens probabilísticas
O método se fundamenta no princípio de que todos os membros de uma população têm
a mesma probabilidade de serem incluídos em uma amostra.
De acordo com a técnica tem-se um tipo de amostra:
Amostra aleatória simples.
Amostra sistemática.
Amostra estratificada.
Amostra por conglomerados.
Amostragem múltipla.
1) Amostra aleatória simples
Também conhecido por amostragem ocasional, causal, randômica. É o método básico
de amostragem aleatória, pela sua facilidade de selecionar amostras, analisar dados e reduzir erros de
amostragem, mas ele não pode ser aplicado sempre e não é sempre o mais apropriado.
Procedimentos para uso da amostragem aleatória simples:
a) Numerar todos os elementos da população. Se, por exemplo, a população tiver 3.000
habitantes, temos que numerá-los de 1 a 3.000.
b) Deve-se efetuar sucessivos sorteios com ou sem reposição até completar o tamanha da
amostra (n).
10
cristiane_brito_3@hotmail.com
c) O uso da tabela de números aleatórios ajuda a retirar os elementos que comporão a amostra.
11
cristiane_brito_3@hotmail.com
Fonte: Estatística Geral e Aplicada. Gilberto de Andrade Martins. Ed. Atlas.
2) Amostra aleatória estratificada
É usada quando a população é constituída por unidades heterogêneas para a variável que
se quer estudar. Consiste em dividir a população em subgrupos mais homogêneos (estratos) e retirar
amostras aleatórias simples dos subgrupos (ou estratos). Esta amostra pode ser proporcional ou
uniforme, se a amostra for proporcional aplica-se a mesma porcentagem para cada estrato, no outro
caso retira-se a mesma quantidade em cada estrato.
Exemplo:
Imagine que você precisa obter uma amostra de 2% dos 500 pacientes de uma clínica
para entrevistá-los sobre a qualidade de atendimento da secretária. Você suspeita que homens sejam
mais bem atendidos que as mulheres. Aproximadamente metade dos pacientes é do sexo masculino.
Você quer obter dados dos dois sexos. Qual seria o procedimento?
Solução: separe os homens das mulheres, logo você terá dois estratos, um de homens, e
outro de mulheres. Retira-se uma amostra aleatória de cada estrato. Se a escolha da retirada for
12
cristiane_brito_3@hotmail.com
proporcional, retira-se 2% do estrato dos homens e 2% do estrato das mulheres, caso a escolha seja
uniforme retira-se a mesma quantidade de homens e mulheres.
Supondo que este grupo de 500 pacientes tenha 300 homens e 200 mulheres a retirada
de 2% fica da seguinte forma:
Homens = 300 x 2% = 6
Mulheres = 200 x 2% = 4 Amostragem Estratificada Proporcional
Total = 500 x 2% = 10
Total = 500 x 2% = 10
Homens = 5 Amostragem Estratificada Uniforme
Mulheres = 5
3) Amostra sistemática
É uma variação da amostragem simples, muito conveniente quando a população está
naturalmente ordenada, como fichas em um fichário, listas telefônicas, clientes de uma empresa
registrados em um banco de dados etc.; constituída por n unidades retiradas da população(N)
segundo um sistema preestabelecido.
Exemplo: em uma amostra de tamanho igual a 1.000 de uma população de 10.000,
depois de fazer a listagem dos elementos da população, poderíamos selecionar cada décimo elemento
da lista: 10º, 20º, 30º,...
Outro exemplo de obtenção de amostragem sistemática:
N = 800 N/n = 800/50 = 16
N = 50
Sorteia-se um número que caia entre 01 e 16, isto fornecerá o primeiro número da
amostra, os outros seriam retirados de 16 em 16.
13
cristiane_brito_3@hotmail.com
Exemplo:
Imagine que você precisa obter uma amostra de 2% dos 500 pacientes de uma clínica
para entrevistá-los sobre a qualidade de atendimento da secretaria. Como você obteria uma amostra
sistemática?
Solução: uma amostra de 2% dos 500 pacientes significa amostra de tamanho 10. Para
obter a amostra, você pode dividir 500 por 10, e obter 50. Sorteia então um número entre 1 e 50. Se
sair, por exemplo, o número 27, esse é o número do primeiro paciente que será incluído na amostra.
Depois, a partir do número 27, conte 50 e chame esse paciente. Proceda dessa forma até completar a
amostra de 10 pacientes.
4) Amostra por conglomerados
Quando a população apresenta uma subdivisão em pequenos grupos não
necessariamente homogêneos, mais fisicamente próximos, podemos chamar cada grupo de elementos
fisicamente próximos de conglomerados e realizar a amostragem por conglomerados. O
conglomerado é um conjunto de unidades que estão agrupadas, qualquer que seja a razão. Um asilo é
um conglomerado de idosos, uma universidade pública é um conglomerado de pessoas com nível
socioeconômico, um serviço militar é um conglomerado de adultos jovens saudáveis.
Exemplo: Um professor de Educação Física quer estudar o efeito da terapia de
reposição hormonal (uso de hormônios por mulheres depois da menopausa) sobre o desempenho nos
exercícios. Como obteria uma amostra por conglomerados?
Solução: o professor pode sortear duas academias de ginástica da cidade e avaliar o
desempenho das mulheres que frequentam a academia e já tiveram a menopausa (tanto as que fazem
como as que não fazem uso da terapia de reposição hormonal) para posterior comparação.
Exemplo: quando se pretende pesquisar a avaliação de alunos de uma faculdade quanto
ao desempenho dos professores.
Solução: considera-se cada turma da faculdade como um conglomerado e realiza-se o
sorteio de certo número de turmas, cujos alunos componentes constituirão a amostra.
Exemplo: deseja-se selecionar uma amostra de chefes de família de uma cidade e não
se dispõe de uma relação de todas as residências. Qual o procedimento?
14
cristiane_brito_3@hotmail.com
Solução: constrói-se uma relação, numerando, em um mapa, cada quarteirão da cidade
representa um conglomerado de residências. Faz-se um sorteio dos quarteirões ou conglomerados,
após a amostragem dos conglomerados são entrevistados todos os chefes de família do conglomerado
escolhido.
Exemplo: algumas empresas, quando pretendem avaliar a aceitação de um produto no
eixo Rio – São Paulo, lançam o produto em Curitiba, cuja população se comporta como uma
miniatura do mercado no eixo Rio – São Paulo.
1.4.2 Amostra não probabilísticas ou de conveniência
São amostragens em que há uma escolha não aleatória dos elementos da amostra. Não
existe o processo de sorteio.
Tipos de amostragens não – probabilísticas:
Amostragens intencionais.
Amostragem por voluntários.
Amostragem por quotas.
1) Amostragem intencional
O amostrador deliberadamente escolhe certos elementos para pertencer à amostra, por
julgar tais elementos bem representativos da população. O pesquisador inclui os sujeitos
convenientes na amostra, dela excluindo os inconvenientes.
Exemplo: preferência por determinado cosmético, o pesquisador dirige-se a um grande
salão de beleza e entrevista as pessoas que ali se encontram.
2) Amostragem por voluntários
Ocorre quando o componente da população se oferece voluntariamente para participar
da amostra, independentemente do julgamento do pesquisador.
Exemplo: caso de pesquisa experimental de uma nova droga em que pacientes são
solicitados, havendo concordância em servirem de “sujeitos” para a verificação da eficácia do novo
medicamento. Os que se interessarem se apresentarão voluntariamente ao pesquisador.15
cristiane_brito_3@hotmail.com
3) Amostragem por quotas
É a mais usada e conhecida amostragem não probabilística. Muito praticada no Brasil,
sobretudo em pesquisas de mercado e de intenção de voto.
Exemplo: Considere uma pesquisa sobre a preferência de modelo de carro. Como se faz
uma amostra por quotas?
Solução: a entrevista será feita com homens e mulheres maiores de 18 anos que vivem
em uma cidade, você então sai à rua para entrevistar determinada quota de pessoas, com
determinadas características. Você pode ser incumbido de entrevistar 30 homens com mais de 50
anos que recebem mais de seis e menos de 10 salários mínimos. O número de pessoas em
determinada quota depende do número delas na população.
Exemplo: pesquisa sobre intenções de votos em determinado município com 30.000
eleitores. Qual o procedimento?
Solução: busca-se conhecer a intenção de votos dos homens e mulheres em função de
seus níveis de escolaridade e idade para votar.
16
cristiane_brito_3@hotmail.com
Exercícios:
01- Serão selecionadas de um grupo de 124 pessoas, umas amostras, para saber se o uso da
maconha deve ou não ser liberado, retire esta amostra usando amostragem aleatória simples com 15%
da população. R: 19alunos
02- O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, deseja
conhecer as condições de vida extraescolar de seus alunos e não dispondo de tempo para entrevistar
todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Você
como especialista em estatística, vai fazer o levantamento para o diretor, usando a amostragem
estratificada proporciona e conclua o levantamento para o diretor mostrando a quantidade de
participantes em cada estrato. R: 28 homens e 32 mulheres.
03- Calcule a porcentagem de homens e mulheres que trabalham num banco, sabendo-se que
nesse banco há 45 homens e 15 mulheres. R: 75% de homens e 25% de mulheres.
04- Imagine que você tem 500 cadastros arquivados em sua empresa e você quer uma
amostra de 2% desses cadastros, como você obteria uma amostra sistemática? R: 50
05- Dada uma população de quatro pessoas, Antônio, Luis, Pedro e Carlos, escreva as
amostras casuais simples de tamanho 2 que podem ser obtidas. R: 6
06- Mostre como seria possível retirar uma amostra de 32 elementos de uma população
ordenada formada por 2432 elementos. Para tal sugiro que a amostra seja sistemática. R: 76
07- Numa faculdade há 800 alunos, entre os quais 360 fazem Administração, 160 fazem
Contábeis, 200 fazem Turismo e 80 alunos fazem Computação. Retire uma amostra aleatória
estratificada proporcional, com 60 alunos. R: 27, 12, 15, 6
08- Se uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90,
N2= 120, N3= 60 e N4= 480 e temos a possibilidade de retirar no total 100 amostras, quantas
amostras devem ser retiradas de cada estrato? R: 12, 16, 8, 64
17
cristiane_brito_3@hotmail.com
II- APRESENTACAO DOS DADOS E TABELAS
2.1- Conceito de variável
É uma condição ou característica das unidades da população. A variável pode assumir
valores diferentes em diferentes unidades. Por exemplo, a idade, peso, estado civil e salário.
As variáveis podem ser classificadas em quantitativas e qualitativas.
2.1.1 Variáveis qualitativas
Apresenta como possíveis resultados uma qualidade (ou atributo) do elemento
pesquisado. As variáveis qualitativas podem ser facilmente identificadas, quando se faz uma pergunta
a resposta é uma palavra.
Exemplos de variáveis qualitativas: time de futebol, sexo, cidade de nascimento, cor,
aparência, status social etc.
As variáveis qualitativas se classificam em nominal e ordinal.
a) Variável qualitativa nominal
Quando os dados são distribuídos em categorias, mas são indicadas em qualquer ordem.
Exemplo de variáveis nominais: cor de cabelos (loiro, castanho, preto e ruivo), tipo de
sangue (O, A, B, AB), gênero (masculino e feminino), religião (espírita, católica, evangélico, outras),
etc.
b) Variável qualitativa ordinal
Quando os dados são distribuídos em categorias que têm ordenação natural.
Exemplo de variáveis ordinais: escolaridade, classe social, gravidade de uma doença,
etc.
2.1.2 Variáveis quantitativas
Quando é expressa por números. Para identificar a variável quantitativa, basta observar
na resposta de uma pergunta, que der como resultado um valor numérico.
18
cristiane_brito_3@hotmail.com
Exemplos: idade, estatura, número de crianças numa escola, número de carros num
estacionamento.
As variáveis quantitativas se classificam em discreta e contínua.
a) Variável quantitativa discreta
São aquelas que resultam de contagens. Só pode assumir valores inteiros em um dado
intervalo.
Exemplo: número de filhos, quantidade de moedas num bolso, número de pessoas.
b) Variável quantitativa contínua
É resultado de uma contagem em que assume qualquer valor num dado intervalo.
Exemplo: peso, tempo de espera, quantidade de chuva etc.
2.2 Dados
São os resultados numéricos obtidos da variável após a aplicação da pesquisa em uma
amostra.
Os dados são do mesmo tipo que o das variáveis. Por exemplo, uma variável discreta
produz dados discretos; uma variável contínua, assume dados contínuos.
Exemplo: O dono de uma academia de ginástica quer saber a opinião de seus clientes
sobre a qualidade dos serviços que presta. O que é variável e o que são dados nesse problema?
Solução: a variável de interesse é a opinião dos clientes. Os dados serão obtidos
somente quando o dono da academia começar a pedir aos clientes que deem uma nota a cada serviço.
Então, se for pedido que o cliente dê uma nota de zero a 5 a cada serviço que utiliza.
19
cristiane_brito_3@hotmail.com
2.3 Apuração dos dados
Para obter os dados é necessários se fazer uma apuração e dependendo do tipo de
variável faz-se um tipo de apuração, se as variáveis forem qualitativas a apuração é feita pela
contagem. Quando a variável é quantitativa, é preciso anotar, na apuração, cada valor observado.
Após a escolha do fenômeno a ser estudado há uma necessidade de fazer o
levantamento ou coleta dos dados, este levantamento pode ser feito através de entrevistas,
questionários, enquetes, etc. Os dados coletados (dados brutos) necessitam ser organizados (rol) para
futuras análises.
Dados Brutos: São dados coletados de uma série de valores e apresentados de forma
desorganizada.
Para organizar tem-se que montar o rol, que é a organização dos dados brutos de forma
crescente ou decrescente.
Variáveis
Qualitativas
Quantitativas
Nominais Ordinais Discretas Contínuas
20
cristiane_brito_3@hotmail.com
Exemplo:
Dados brutos: {1, 3, 5, 2, 1, 0, 3, 5, 7, 6, 2, 1, 0}
Rol: {0, 0, 1, 1, 1, 2, 2, 3, 3, 5, 5, 6, 7}
2.4 Séries Estatísticas
É uma representação das informações em forma de tabelas. Seu objetivo é obter um
resumo organizado das informações sobre a variável: fornecer o máximo de informação em um
mínimo de espaço.
A séries estatísticas podem ser:
Séries temporais: uma determinada informação é estudada em função do tempo.
Tabela: Taxa de analfabetismo, segundo o ano – Brasil.
Ano Porcentagem
(%)
1970 33,6
1980 25,4
1991 20,1
1995 15,6
1996 14,7
Fonte: IBGE/Pnad (1996)
Nota: Faixa etária de 15 anos ou mais.
(1) Em 1995 e 1996, exclui a população rural de Rondônia, Acre, Amazonas, Roraima, Pará e Amapá. Séries geográficas: uma determinada informação é estudada em função de uma região
ou localidade. É feita para apresentar dados de diferentes regiões geográficas.
21
cristiane_brito_3@hotmail.com
Tabela: População mundial, em milhões, segundo o continente 2000.
Continente População (em milhões)
África 783,7
América 823,2
Ásia 3.678,2
Europa 745,5
Oceania 30,0
Total 6.060,6
Fonte: Almanaque Abril Mundo 2001.
Séries especificavas: as informações em estudo é dividida em categorias que a
especificam.
Tabela: Sistema Penitenciário – Perfil do preso – Brasil – 1999.
Categorias Porcentagem (%)
Reincidentes 53
Jovens (entre 18 e 30 anos) 58
Ensino fundamental incompleto 74,5
Pobres 95
Homens 96
Fonte: Ilanud (1996) e Censo Penitenciário (1994 e 1997).
(1) Dados referentes à população carcerária do Estado de São Paulo.
22
cristiane_brito_3@hotmail.com
Séries mistas: são resultantes da combinação das séries estatísticas temporais,
geográficas, especificativas ou das distribuições de frequências.
Tabela: Taxas de analfabetismo de pessoas com 15 anos e mais, segundo a cor, nos
censos demográficos de 1991 e 2000.
Cor Censos
1991 2000
Branca
Preta
Amarela
Parda
Indígena
Sem declaração
11,9
31,5
5,4
27,8
5,8
18,7
8,3
21,5
4,9
18,2
26,1
16,1
Brasil 19,4 12,9
Fonte: Retrato do Brasil.
2.5 Apresentação dos dados
2.5.1 Apresentação de dados qualitativos
As informações são resumidas em uma tabela que mostre as contagens (frequências)
em cada categoria. Tem-se então uma tabela de distribuição de frequências.
Exemplo: Foram entrevistados 2.500 brasileiros, com 16 anos ou mais, para saber a
opinião deles sobre determinado técnico de futebol.
23
cristiane_brito_3@hotmail.com
Tabela: Opinião dos brasileiros sobre determinado técnico de futebol
Respostas Frequência Frequência relativa
Bom
Regular
Ruim
Não sabe
1.300
450
125
625
0,52
0,18
0,05
0,25
Total 2.500 1,00
As frequências relativas são dadas em porcentagens, através da razão entre cada
frequência e o total de observações.
As tabelas de contingência são tabelas de dupla entrada, cada entrada relativa a uma das
variáveis.
Exemplo: Foram feitos diagnósticos de depressão em 500 estudantes com idades entre
10 e 17 anos, metade de cada sexo. Foram identificados 98 casos de depressão, sendo 62 no sexo
feminino. Apresentar os dados em uma tabela.
Tabela: Sexo e presença de depressão
Depressão
Sexo Sim Não Total Frequência
relativa
Masculino 36 214 250 12,5%
Feminino 62 188 250 2,5%
Total 98 402 500 100%
2.5.2 Apresentação de dados quantitativos
Os dados numéricos são apresentados na ordem em que são coletados ou em tabelas de
distribuição de frequências. As tabelas de distribuição de frequências reúnem informações de
24
cristiane_brito_3@hotmail.com
fenômenos que necessitam de uma grande coleta de dados numéricos. Se os dados são de variáveis
quantitativas discretas a tabela de distribuição de frequência será construída da seguinte forma:
Escrevem-se os dados em ordem crescente
Contam-se quantas vezes cada valor se repete
Constrói-se a tabela de distribuição de frequência, apresentando em cada coluna:
a) A primeira coluna de apresentar a variável de estudo (xi);
b) A segunda coluna representa a frequência simples absoluta (fi) dos dados;
c) A terceira coluna representa a frequência relativa simples dos dados (fri);
d) A quarta coluna representa a frequência acumulada absoluta dos dados (Fi); e
e) Por último representa-se a coluna da frequência relativa acumulada (Fri).
Frequência Simples Absoluta (fi): é número de observações ou repetições de um valor, em um
levantamento qualquer, representa a frequência desse valor.
Frequência Simples Relativa (fri): é a razão entre a frequência simples absoluta (fi) e o número
total de elementos ou observações.
Frequência Acumulada Absoluta (Fi): é soma acumulada dos valores da frequência simples
absoluta (fi).
Frequência Acumula Relativa (fri): é a razão entre a frequência acumulada absoluta (Fi) e o
número total de elementos ou observações.
Exemplo:
A tabela abaixo apresenta as vendas diárias de um aparelho eletrônico, durante um mês, por
uma empresa:
14 12 11 13 14 13
12 12 13 14 11 12
12 14 10 13 15 11
15 13 16 17 14 14
25
cristiane_brito_3@hotmail.com
Solução:
1º) Constrói-se o rol de elementos.
10, 11, 11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 15, 15, 16
2º) Constrói-se a tabela de distribuição de frequência.
Tabela: Distribuição do número de aparelhos eletrônicos vendidos.
Nº de aparelhos
eletrônicos
Frequência Frequência
relativa
10 1 4,2%
11 3 12,5%
12 5 20,8%
13 5 20,8%
14 6 25%
15 2 8,3%
16 1 4,2%
17 1 4,2%
Total 24 100%
As variáveis quantitativas contínuas - são variáveis que podem assumir qualquer
valor dentro de uma série de dados. O conjunto de dados que podem ser representados de forma
contínua são os dados que apresentam poucas repetições.
Para construir uma tabela de distribuição de frequências para variáveis quantitativas
contínuas:
Organize os dados em forma de rol.
Construa os passos para construir a tabela:
26
cristiane_brito_3@hotmail.com
a) 1º Passo:
Amplitude total: é a diferença entre o maior e o menor valor de uma serie ordenado de
dados.
b) 2º Passo:
Classes: é cada um dos grupos de valores do conjunto de valores observados, ou seja, são
os intervalos de variação da variável.
c) 3º Passo:
Amplitude do intervalo de classes: é a razão entre a amplitude total e o número de classes.
Além disto, pode-se encontrar a amplitude fazendo a diferença entre o limite superior e inferior de
cada classe.
d) Formas de apresentar os limites de classes:
10 |---| 20: compreende todos os valores entre 10 e 20, inclusive os extremos.
10 |--- 20: compreende todos os valores entre 10 e 20, excluindo o 20.
10 ---| 20: compreende todos os valores entre 10 e 20, excluindo o 10.
10 --- 20: compreende todos os valores entre 10 e 20, excluindo os extremos.
e) Ponto médio do intervalo de classe: é a média aritmética simples entre o limite inferior e superior
da classe.
27
cristiane_brito_3@hotmail.com
Exemplo:
Os pesos dos 40 alunos de uma classe estão abaixo descritos, organize os dados e
construa a distribuição de frequências.
69 57 72 54 93 68 72 58 64 62
65 76 60 49 74 59 66 83 70 45
60 81 71 67 63 64 53 73 81 50
67
68 53 75 65 58 80 60 63 53
Solução:
1º) At = 93 – 45 = 48
2º) K = 1 + 3,222 x log 40 = 6
3º)
Peso dos
alunos
No. de
alunos
fi
Xi fri Fi Fri
45 |---- 53 3 49 7,5 3 7,5
53 |---- 61 11 57 27,5 14 35
61 |---- 69 12 65 30 26 65
69 |---- 77 9 73 22,5 35 87,5
77 |---- 85 4 81 10 39 97,5
85 |----| 93 1 89 2,5 40 100
fi = 40 - 100 - -
Li Ls
28
cristiane_brito_3@hotmail.com
Exercícios:
01- Os resultados do lançamento de um dado 50 vezes foram os seguintes: Organize os
dados em forma de rol e construa a distribuição de frequências.
6 5 2 6 4 3 6 2 6 4
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 15 6 2 4 6 1 5 2 4 3
02- Um pesquisador quer saber que idades predominam entre as pessoas economicamente
ativas de determinada cidade. Para isso, entrevistou 100 pessoas e obtiveram os seguintes dados
brutos:
28 27 31 33 3
0
3
3
2
7
3
1
3
4
2
6
30 33 33 29 3
2
2
7
3
4
3
7
3
0
2
9
37 31 30 30 2
6
2
9
2
9
3
4
2
9
2
6
30 27 32 24 3
0
2
7
3
1
3
0
3
2
2
9
31 31 30 30 2
7
3
0
2
7
2
7
2
1
3
4
30 28 33 28 3
6
2
9
3
2
2
7
2
4
2
7
33 37 27 30 3
3
3
0
3
3
3
3
2
3
2
8
30 39 27 27 3
1
3
1
3
6
2
8
2
9
3
0
33 31 31 30 2 2 3 3 3 2
29
cristiane_brito_3@hotmail.com
8 7 2 0 0 9
29 24 33 30 3
3
2
7
3
0
3
4
3
6
3
2
Pede-se, organizar os dados e construir a tabela de distribuição de frequências.
03- Uma amostra de 50 estudantes apontou o seguinte rol de notas de Estatística, Construir a
tabela de distribuição de frequências.
04- Considerar os
dados obtidos pelas medidas das
alturas de 90 indivíduos (dadas em cm):
151 152 154 155 158 159 160 161 161
161 162 163 163 163 164 165 165 166
166 166 166 167 167 167 167 168 168
168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170
170 170 171 171 171 172 172 172 172
173 173 174 174 174 175 175 175 176
176 176 176 177 177 177 178 178 178
179 179 180 180 180 181 181 181 182
182 182 183 184 185 187 188 190 190
a) Qual é a amplitude total?
35 35 35 39
4
1 41 42 45 47 48
50 52 53 54
5
5 55 57 59 60 60
61 64 65 65
6
5 66 66 66 67 68
69 71 73 73
7
4 74 76 77 77 78
80 81 84 85
8
5 88 89 91 94 97
30
cristiane_brito_3@hotmail.com
b) Em quantas classes poderemos agrupar esse conjunto de medidas?
c) Qual será o tamanho dos intervalos de classes?
d) Determinar para cada classe a frequência relativa?
05- Conhecidas as notas de 50 alunos:
8
4
6
8
3
3
5
2
4
7
7
3
6
8
6
1
7
3
7
7
7
4
7
1
8
1
9
1
6
5
5
5
5
7
3
5
8
5
8
8
5
9
8
0
4
1
5
0
5
3
6
5
7
6
8
5
7
3
6
0
6
7
4
1
7
8
5
6
9
4
3
5
4
5
5
5
6
4
7
4
6
5
9
4
6
6
4
8
3
9
6
9
8
9
9
8
4
2
5
4
Construir a tabela de distribuição de frequências.
06- A tabela abaixo apresenta as vendas diárias de um aparelho eletrônico, durante um mês, por
uma empresa:
14 12 11 13 14 13
12 12 13 14 11 12
12 14 10 13 15 11
15 13 16 17 14 14
Construir a tabela de distribuição de frequências.
07- (TCDF-95) Assinale a opção correta.
a) Em Estatística, entende-se por população um conjunto de pessoas;
b) A variável é discreta quando pode assumir qualquer valor dentro de determinado valor;
31
cristiane_brito_3@hotmail.com
c) Frequência relativa de uma variável aleatória é o número de repetições dessa variável.
d) A série estatística é cronológica quando o elemento variável é o tempo;
e) Amplitude total é a diferença entre dois valores quaisquer do atributo.
08- A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:
Áreas
m2
300 |--- 400 |---500 |--- 600 |---700 |--- 800 |--- 900 |--- 1000 |---1100 |---
1200
No.
de
lotes
14 46 58 76 68 62 48 22 6
Com referência a essa tabela, determine:
a) Amplitude total;
b) O limite superior da quinta classe;
c) O limite inferior da oitava classe;
d) O ponto médio da sétima classe;
e) A amplitude do intervalo da segunda classe;
f) A frequência simples da quarta classe;
g) O número de lotes cuja área não atinge 700 m2;
h) O número de lotes cuja área atinge e ultrapassa 800 m2;
i) A percentagem dos lotes cuja área não atinge 600 m2;
j) A percentagem dos lotes cuja área seja maior ou igual a 900 m2;
k) A percentagem dos lotes cuja área é de 500 m2, no mínimo, mais inferior a 1000 m2;
l) A classe do 72º lote;
m) Até que classe estão incluídos 60% dos lotes.
09- A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma
empresa de ônibus:
No.
acidentes
0 1 2 3 4 5 6
7
No.
motoristas
20 10 16 9 6 5 3
1
32
cristiane_brito_3@hotmail.com
Determine:
a) O número de motoristas que não sofreram nenhum acidente;
b) O número de motoristas que sofreram pelo menos 4 acidente;
c) O número de motoristas que sofreram menos de 3 acidente;
d) O número de motorista que sofreram no mínimo 3 e no máximo 5 acidentes;
e) A percentagem dos motoristas que sofreram no máximo 2 acidente.
10- Assinale, entre as alternativas, aquela que contiver uma afirmação verdadeira.
a) A amplitude do intervalo de classe é calculada pela soma entre os limites reais inferiores e
superior de uma classe;
b) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e superior.
c) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos.
d) Intervalos de classe fechados têm seus limites superiores e inferiores excluídos dos números
que os compõem.
11- Um produto é vendido por apenas três empresas, em um determinado mercado. Em
determinado ano, para um total de 18.000 unidades vendidas, tivemos a seguinte distribuição de
vendas:
Empresas A B C
Vendas 7.200 4.800 6.000
Determinar a distribuição percentual das vendas.
12- Ouvindo-se 300 pessoas sobre o tema “Reforma da previdência, contra ou a favor”,
foram obtidas as seguintes respostas:
Construa a distribuição de frequências para esta série.
Opinião frequência
Favorável 123
Contra 72
Omissos 51
Sem opinião 54
Total 300
33
cristiane_brito_3@hotmail.com
13- Dada a tabela abaixo construa o ponto médio e a frequência relativa.
Classe frequências
100 ----| 110 2
110 ----| 120 4
120 ----| 130 6
130 ----| 140 6
140 ----| 150 2
14- Construa a distribuição de frequências e interprete a 3ª linha de cada tabela:
a)
Idade Nº de
alunos
17 3
18 18
19 17
20 8
21 4
b)
Salários Nº de
funcionários
1000 |----- 1200 2
1200 |----- 1400 6
1400 |----- 1600 10
1600 |----- 1800 5
1800 |----- 2000 2
34
cristiane_brito_3@hotmail.com
III- Representação Gráfica
3.1 Gráficos estatísticos
É a uma forma de apresentação dos dados estatísticos, com o objetivo de produzir uma
impressão mais rápida e viva do fenômeno em estudo.
A apresentação gráfica é um complemento importante da apresentação tabular. A
vantagem de um gráfico, esta em possibilitar uma avaliação visual da distribuição dos dados ou
das frequências.
3.1.1 Gráficos em Curvas ou em Linhas
São usados para representar séries temporais, principalmente quando a série cobre um
grande número de períodos de tempo.
Tabela: Taxa de analfabetismo, segundo o ano - Brasil.
Ano Porcentagem (%)
1970 33,6
1980 25,4
1991 20,1
1995
1996
15,6
14,7Fonte: IBGE/Pnad (1996).
Nota: Faixa etária de 15 anos ou mais.
(1) Em 1995 e 1996, exclui a população rural de Rondônia, Acre, Amazonas, Roraima, Pará e
Amapá.
35
cristiane_brito_3@hotmail.com
3.1.2 Gráfico de Hastes ou Bastões
São gráficos que representam dados não agrupados em classes, ou seja, de variável
discreta.
3.3- Histograma
É um gráfico que representa os dados agrupados em classes, ou seja, os de variáveis
contínuas, formado por retângulos justapostos.
3.1.3 Polígono de frequência
É o gráfico que se obtém pegando-se os pontos médios dos intervalos de classe, unindo
os pontos das bases superiores dos retângulos de um histograma.
Xi fi
0 10
1 20
2 30
3 20
4 10
5 5
Classes Fi
2 |--- 4 3
4 |--- 6 5
6 |--- 8 7
8 |--- 10 4
10 |--- 12 2
36
cristiane_brito_3@hotmail.com
3.1.4 Curva de frequências
A partir do polígono de frequências podemos representar contornos mais suaves,
utilizando curvas para mostrar uma melhor representação de uma das grandes utilidades da
Estatística.
3.1.5 Gráfico de Barras ou colunas
É um gráfico utilizado para representar dados nominais (ou categóricos) ou em séries
temporais.
Ex.: representação de uma classe de profissionais formados em uma faculdade.
3.1.6 Gráfico de Pizza ou de setores
É um gráfico utilizado quando se quer mostrar partes de um todo, e quando se utiliza
quantidades e percentuais.
37
cristiane_brito_3@hotmail.com
Exercícios:
01- Os gráficos próprios de uma distribuição de frequência são:
a) Colunas, curva de frequência e histograma;
b) Polígono de frequência e histograma;
c) Colunas, curva de frequência e polígono de frequência;
d) Gráfico em setor, gráfico em barra, curva de frequência e curva normal;
e) Colunas, barra, setor e curva de frequência.
02- Na construção de qual dos gráficos citados – histograma e polígono de frequência –
usamos, obrigatoriamente, as frequências acumuladas?
a) Só no primeiro
b) Só no segundo
c) Em ambos
d) Em nenhum
e) No primeiro, às vezes, dependendo do tipo de variável.
03- Das afirmações:
I- Tanto o histograma como o polígono de frequência são gráficos próprios da distribuição de
frequência, são gráficos de analise, os quais devem ser feitos só quando a variável for contínua.
II- Tanto o polígono de frequência como o histograma são gráficos próprios da distribuição de
frequência, são gráficos de análise, e devem ser feitos só quando a variável for discreta.
III- Tanto o histograma como o polígono de frequência são gráficos de análise, próprios da
distribuição de frequência, e podem ser feitos para qualquer tipo de variável, desde que ela seja
quantitativa.
IV- O histograma é um gráfico em colunas, mas qualquer gráfico em colunas não é
necessariamente um histograma.
a) II e III são falsas.
b) A IV é falsa.
c) Apenas a I é verdadeira.
38
cristiane_brito_3@hotmail.com
d) Todas são verdadeiras.
e) Todas são falsas.
04- Usando o Excel monte os gráficos citados na teoria usando os seguintes dados:
a) Tabela 01: idade de um grupo de alunos.
Idade Nº de alunos
17 3
18 18
19 17
20 8
21 4
b) Tabela 02: opinião de um grupo de pessoas sobre o lançamento de um programa de
televisão.
c) Tabela 03: salario dos funcionários de uma fábrica.
Salário frequências
1000 ----| 1100 2
1100 ----| 1200 4
1200 ----| 1300 6
1300 ----| 1400 6
1400 ----| 1500 2
Opinião frequência
Favorável 123
Contra 72
Omissos 51
Sem opinião 54
Total 300
39
cristiane_brito_3@hotmail.com
IV- Medidas de Tendência Central
As medidas de posição como são conhecidas também, faz uma análise do
comportamento das observações em relação a um termo central, termo este que iremos procurar
utilizando de algumas medidas que são a média aritmética, a mediana e a moda.
4.1. Média Aritmética
4.1.1. Média aritmética simples (para dados não agrupados) –
Dado que o conjunto X assume valores X1, X2, X3, ... , Xn. A média aritmética simples
será calculada somando todos os elementos do conjunto X e dividindo o resultado pela
quantidade de elementos ou observações do conjunto.
Ex.: X = {1, 3, 5, 7, 9}
Exemplo:
A produção leiteira diária de uma vaca, durante uma semana, foi de 10, 15,14, 13, 16, 19
e 18 litros. Determinar a produção média da semana.
Solução:
A produção média semanal de leite foi de 15 litros.
40
cristiane_brito_3@hotmail.com
4.1.2. Média aritmética ponderada (para dados agrupados) -
Quando os dados de uma variável estão agrupados em uma distribuição de frequências
será calculada a média pela forma ponderada, que é razão entre o somatório do produto dos
valores de cada Xi, pela sua frequência, com a soma da frequência total.
Exemplo: Variável Discreta
fi =20 xifi = 128
Exemplo: Variável Contínua
fi= 26 xifi = 182
Xi Fi xifi
2 1 2
4 5 20
6 6 36
8 5 40
10 3 30
Classe fi xi xifi
2 |---- 4 3 3 9
4 |---- 6 5 5 25
6 |---- 8 10 7 70
8 |----10 5 9 45
10 |--- 12 3 11 33
41
cristiane_brito_3@hotmail.com
4.1.3 Propriedades da Média
1ª Propriedade
Somando-se (ou subtraindo-se) a todos os valores do conjunto X uma constante K
qualquer, a média deste novo conjunto fica somada ou subtraída desta constante.
Exemplo:
X = {1, 3, 5,7,9} com, fazendo K = 10 e somando teremos:
Y = {11, 13, 15, 17, 19} com,
2ª Propriedade
Se multiplicarmos (ou dividirmos) todos os valores de um conjunto X elementos por uma
constante K qualquer, a média do novo conjunto fica multiplicada ou dividida por essa constante.
.
Exemplo:
X1 = {1, 3, 5, 7, 9} n1 = 5
X2 = {2, 4, 6, 8, 10, 12, 14} n2 = 7
4.3 Mediana – Md
É uma medida de tendência central única que divide a série de dados em duas partes
iguais, onde teremos 50% das observações abaixo do valor mediano e os outros 50% acima do
valor mediano. Este valor se localiza no centro de um conjunto de dados ordenados de forma
crescente ou decrescente.
Para encontrar o valor mediano é necessário encontrar a sua localização, esta localização
é chamada de posição da mediana.
42
cristiane_brito_3@hotmail.com
4.3.1 Posição da Mediana - Pmd
Para dados não tabulados e tabulados de forma discreta:
o Se n for impar, acrescenta-se uma unidade e divide por 2.
Exemplo: Série de Dados
X = {1, 2, 4, 5, 7} n = 5 , logo a Md = 4
o Se n for par, encontra-se duas posições e a mediana será a media aritmética
simples entre elas.
Exemplo: Série de Dados
X = {1, 2, 3, 4, 5, 6} n = 6 , logo a Md = 3 + 4 = 3,5
2
Dados agrupados de forma discreta
Exemplo: Variável Discreta
Md = 3
fi =22
Este resultado significa 50% das observações são menores ou igual a 3 e os outros 50% são
maiores ou igual a 3.
Para dados agrupados de forma contínua (ou em classes)
O cálculo da posição da mediana para este tipo dedistribuição de frequência não
necessita da verificação da frequência total, basta dividir o resultado por dois. O resultado da
posição da mediana irá informar um intervalo de classes, a qual não é satisfatória para encontrar
xi fi Fi
1 3 3
2 5 8
3 9 17
4 4 21
5 1 22
43
cristiane_brito_3@hotmail.com
a mediana, necessitando então usar um cálculo mais preciso para este fim, através da fórmula a
seguir:
Li = limite inferior da classe mediana
Fa = frequência acumulada anterior à classe mediana
fi = frequência simples da classe mediana
h = amplitude da classe mediana
Exemplo: Variável Contínua
fi = 25
Este resultado diz que 50% dos funcionários recebem um salário menor ou igual a 6,9
salários, e os outros 50% recebem um salário maior ou igual a 6,9 salários.
4.4. Moda - Mo
É uma medida de tendência central (ou de posição), que indica o valor mais frequente em
uma série de dados. Exemplo se a idade modal de um grupo de alunos é de 23 anos, isto significa
que a maioria dos alunos tem esta idade.
Moda para dados não agrupados, os valores tem que está ordenado, para que seja
identificado o valor que tem maior frequência.
Exemplos:
X = {1,1, 2, 3,4} Mo = 1, unimodal
Classe fi Fi
2 |---- 4 3 3
4 |---- 6 5 8
6 |---- 8 10 18
8 |----10 5 23
10 |--- 12 2 25
44
cristiane_brito_3@hotmail.com
Y = {1, 1, 2, 2, 3, 4} Mo = 1 e 2, bimodal
Z = {1, 1, 2, 2, 3, 3,4} Mo = 1, 2 e 3, plurimodal
H = {1,1,2, 2, 3, 3, 4, 4} Mo = amodal
Moda para dados agrupados de forma discreta verifica-se na coluna da frequência
simples (fi), qual é a maior frequência e determina a moda na coluna da variável de estudo Para
dados agrupados:
o Variável discreta: observação de imediato
Mo = 3
Esse valor encontrado indica que alunos com nota três foi o resultado mais observado.
Moda para dados agrupados de forma continua, identifica-se na coluna da frequência
simples absoluta (fi), qual é a maior frequência e determina-se um intervalo de classe como
sendo a classe onde a moda vai ser encontra, esta classe recebe o nome de classe modal,
utilizando-se um dos métodos de cálculo da moda para dados agrupados em classe que é o
Método de Czuber teremos:
Li = limite inferior da classe modal
fmo = o valor mais frequente da distribuição
fa = frequência simples anterior à classe modal
fp = frequência simples posterior à classe modal
Xi fi
1 3
2 5
3 9
4 4
5 1
45
cristiane_brito_3@hotmail.com
h = amplitude do intervalo de classe
Exemplo:
Frequência simples anterior à classe modal (fa)
Frequência modal (fmo)
Frequência simples posterior à classe modal (fp)
Classe Modal: 6 |---- 8
Classe
fi
2 |---- 4
3
4 |---- 6
5
6 |---- 8
10
8 |----10
5
10 |--- 12 3
46
cristiane_brito_3@hotmail.com
Exercícios:
01- A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém
as notas 7,5; 8,0; 6,0; 2,5; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, pergunta-se se
ele foi ou não aprovado. R: sim, com média 5,58
02- A seguir, é dada a distribuição da quantidade de defeitos por microcomputador para uma
amostra de 100 aparelhos:
Quantidade
de defeitos
por micro
0 1 2 3 4 5 6
Número de
aparelhos
15 28 20 14 10 7 6
Determinar o número médio de defeitos por microcomputador. R: 2,21
03- Calcular a média para cada uma das distribuições:
a)
Xi 3 4 7 8 12
fi 2 5 8 4 3
R: 6,82
b)
Xi 10 11 12 13
fi 5 8 10 6
R: 11,59
c)
Xi fi
2 3
3 6
4 10
5 6
6 3
R: 4
47
cristiane_brito_3@hotmail.com
04- Para cada série, determine à mediana:
a) 1, 3, 3, 4, 5, 6, 6 R: 4
b) 1, 3, 3, 4, 6, 8, 8, 9 R: 5
c) 12, 7, 10, 8, 8 R: 8
d) 82, 86, 88, 84, 91, 93 R: 87
05- (Analista Fin. e Cont. GDF-94) Os valores de quinze imóveis situados em uma
determinada quadra são apresentados a seguir, em ordem crescente: 30, 32, 35, 38, 50, 58, 64,
78, 80, 80, 90, 112, 180, 240 e 333. Então a mediana dos valores destes imóveis é: R: a)
a) 78
b) 79
c) 80
d) 100
06- Para cada distribuição, determine à mediana:
a)
Xi 2 3 4 5 7
fi 3 5 8 4 2
R: 4
b)
Xi 12 13 15 17
fi 5 13 18 20
R: 13
c)
Classes 1 |---- 3 3|---- 5 5|---- 7 7|---- 9 9|----11 11|---- 13
Fi 3 5 8 6 4 3
R: 6,63
d)
Classes 22 |---- 25 25|---- 28 28|---- 31 31|---- 34
Fi 18 25 30 20
R: 28,35
07- Para cada série, determine a moda:
a) 3, 4, 7, 7, 7, 8, 9, 10 R: 7
b) 43, 40, 42, 43, 47, 45, 45, 43, 44, 48 R: 43
48
cristiane_brito_3@hotmail.com
08- Para cada distribuição, determine a moda:
a)
Xi 72 75 78 80
fi 8 18 28 38
R: 80
b)
Xi 2,5 3,5 4,5 6,5
fi 7 17 10 5
R: 3,5
c)
Classes 7 |---- 10 10|---- 13 13|---- 16 16|---- 19 19|---- 22
fi 6 10 15 10 5
R:14,5
d)
Classes 10 |---- 20 20|---- 30 30|---- 40 40|---- 50
Fi 7 19 28 32
R: 41,11
09- Dados os conjuntos de valores:
A = {1, 1, 2, 3, 4, 5, 8, 8, 8, 9, 10}
B = {6, 7, 8, 9, 10, 11, 12}
C = { 1, 2, 4, 4, 4, 5, 6, 9, 9, 9,10}
Em relação à moda, afirmamos que:
I- A é unimodal é 8;
II- B é unimodal e a moda é 9;
III- C é bimodal e as modas são 4 e 9.
Então, em relação às afirmativas, é correto dizer que: R: b)
a) Todas são verdadeiras;
b) Todas são falsas;
c) Somente I e II são verdadeiras;
d) Somente I e III são verdadeiras;
e) Somente II e III são verdadeiras.
49
cristiane_brito_3@hotmail.com
A empresa X distribuiu seus empregados nas faixas salariais abaixo:
Salários
mínimos
No. empregados
Fi
3 15
6 40
9 10
12 5
Determine:
a) O salário médio dos empregados; R: 6,21
b) O salário mediano; R: 6
c) O salário modal. R: 6
10- A tabela abaixo apresenta a distribuição das exportações de empresa mecânicas em 1990.
Volume exportado No. de
empresas
50.000 |--- 60.000 5
60.000 |--- 70.000 10
70.000 |--- 80.000 20
80.000 |--- 90.000 10
90.000 |--- 100.000 5
Determine:
a) A média R:75.000
b) A mediana R:75.000
c) A moda R: 75.000
50
cristiane_brito_3@hotmail.com
Considere a distribuição a seguir e respondas as questões de 12 a 14:
Peso kg fi
2 |----- 4 9
4 |----- 6 12
6 |----- 8 6
8 |----- 10 2
10 |---- 12 1
11- R: b)
a) 65% das observações têm peso não inferior a 4 Kg e inferior a 10 Kg.
b) mais de 65% das observações têm peso maior ou igual a 4 kg.
c) a soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população.
d) 8% das observações têm peso no intervalo de classe 8 |--- 10.
13- A média da distribuição é igual a: R: a)
a) 5,27
b) 5,24
c) 5,21
d) 5,19
e) 5,30
14 – A mediana da distribuição é igual a: R: b)
a) 5,30
b) 5,00
c) Um valor inferior a 5
d) 5,10
e) 5,20
51
cristiane_brito_3@hotmail.com
V- MEDIDASDE DISPERSÃO
As medidas de dispersão ou de variabilidade medem o grau de variabilidade ou dispersão
dos dados observados em torno da média aritmética. O objetivo é identificar o quanto a média é
representativa e o nível de homogeneidade do grupo que esta sendo analisado.
Exemplo:
Um empresário deseja verificar o desempenho de dois dos seus funcionários, baseado na
produção de cada um deles, durante um período de 5 dias.
Funcionário A: 70, 71, 69, 70, 70 = Média = 70
Funcionário B: 60, 80, 70, 62, 83 = Média = 71
O desempenho do funcionário A é de em média 70 unidades produzidas por dia,
enquanto o funcionário B teve a suma média de 71 unidades produzidas por dia. Olhado
simplesmente para o cálculo da média poderia dizer que o funcionário B teve melhor
desempenho no período, mas se observarmos o comportamento dos dados, percebe-se que a
produção do funcionário A varia de 69 a 71 unidades produzidas, já o funcionário B tem uma
variação de 60 a 83 unidades, o que mostra que o funcionário A é mais homogêneo que o B. logo
se pergunta qual é o melhor funcionário? Pelo que foi observado o funcionário A é melhor do
que o B, ou seja, o funcionário B é mais disperso ou tem maior variabilidade.
5.1 Amplitude
Que é a relação entre o maior valor e o menor valor de uma série, conforme visto no
capítulo 2.
Funcionário A = 71 – 69 =2
Funcionário B = 83 – 60 = 23
52
cristiane_brito_3@hotmail.com
Observa-se que olhando pela amplitude total o funcionário A é mais homogêneo do que o
funcionário B, que tem uma amplitude maior, logo o funcionário A pode ser considerado melhor.
5.2 Quartil
A mediana é uma medida de tendência central que divide o conjunto de dados em dois
subconjuntos com o mesmo número de dados.
Se o número de observações for grande (maior que 30), o conceito de mediana pode ser
entendido da seguinte forma: a mediana divide o conjunto de dados em duas metades; os quart is
– como o nome diz – divide o conjuntos de dados em quatro quartos.
Para obter os quartis:
Organize os dados em ordem crescente. Ache à mediana (que é o 2º quartil);
marque esse valor.
Ache o primeiro quartil, da seguinte forma: tome o conjunto de dados à esquerda da
mediana; o primeiro quartil é a mediana do novo conjunto de dados.
Ache o terceiro quartil, tome o conjunto de dados à direita dessa mediana.
Exemplo: Determine os quartis do conjunto de dados: 1, 2, 3, 4, 5, 5, 7, 9,10.
Solução: os dados já estão ordenados. Para obter a mediana, observe que o número de
dados é impar. Então a mediana é o valor central, ou seja, é 5.
1, 2, 3, 4, 5, 5, 7, 9, 10
Para obter o primeiro quartil, separe os dados menores do que a mediana. A mediana
desses dados (2,5) é o primeiro quartil.
1, 2, 3, 4
53
cristiane_brito_3@hotmail.com
Para obter o terceiro quartil, separe os dados maiores do que a mediana. A mediana
desses dados (8) é o terceiro quartil.
5, 7, 9, 10
Como a amplitude é muito sensível aos valores discrepantes, a amplitude pode mudar se
for incluída uma observação muito maior ou muito menor do que as outras. Então se define a
distância interquartílica como medida de dispersão.
Esta medida interquartílica é a distância entre o primeiro e o terceiro quartil.
5.3 Variância Amostral
Como se deseja medir a dispersão dos dados em relação à média, é interessante
analisar os desvios de cada valor (xi) em relação à média , isto é
. Se os desvios forem baixos, teremos pouca dispersão; ao contrario se os desvios
forem altos, teremos elevada dispersão. É fácil constatar que a soma dos desvios em torno da
média é zero. Para o cálculo da variância, consideram-se os quadrados dos desvios.
Se os valores não forem tabulados o cálculo da variância e desvio padrão será de:
Se os valores forem agrupados em uma distribuição de freqüências a variância da
amostra será:
54
cristiane_brito_3@hotmail.com
5.3.1 Desvio Padrão da Amostra
É a raiz quadrada positiva da variância. Para uma variância da amostra usamos S
para o desvio padrão da amostra e para a variância da população usamos para o desvio padrão
da população, como segue:
Exemplos:
fi = 100 (xi - = 480
Exemplos:
fi = 100 (xi - = 880
5.4 Propriedades do Desvio Padrão
1º) Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores
uma constante arbitrária, o desvio padrão não se altera.
Exemplo:
X = {6, 8, 10, 10}, com Sx = 1,9
Somando 100 a cada elemento, teremos o conjunto Y:
Xi fi (xi -
1 10 (1-5 )2. 10 = 160
3 20 (3 – 5)2. 20 = 80
5 40 (5 – 5)2. 40 = 0
7 20 (7 – 5)2. 20 =80
9 10 (9 – 5)2.10 = 160
Classes fi xi (xi -
2 |--- 4 10 3 (3-5 )2. 10 = 40
4 |--- 6 20 5 (5 – 5)2. 20 = 0
6 |--- 8 40 7 (7 – 5)2. 40 = 160
8 |--- 10 20 9 (9 – 5)2. 20 =320
10 |---12 10 11 (11 – 5)2.10 = 360
55
cristiane_brito_3@hotmail.com
Y = {106, 108, 110, 110}, com Sx = 1,9, ou seja, o desvio padrão é o mesmo.
2º) Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores
por um valor constante arbitrário e diferente de zero, o desvio padrão fica multiplicado (ou
dividido) por esta constante.
Exemplo:
X = {6, 8, 10, 10}, com Sx = 1,9
Se multiplicarmos por 10 cada elemento, teremos o conjunto Y:
Y = {60, 80,100,100}, o desvio padrão será obtido pela multiplicação do desvio padrão
anterior pela constante 10.
Assim Sy = Sx . 10 = 1,9 . 10 = 19
5.5 Coeficiente de Variação de Pearson
Para comparar duas distribuições quanto a variabilidade, deve-se usar medidas de
variabilidade relativa (percentual). A medida mais utilizada é o Coeficiente de Variabilidade de
Person (CV), que é o quociente entre o desvio padrão e a média aritmética do conjunto de dados.
Exemplos:
1- Utilizando os resultados dos exemplos anteriores qual o coeficiente de variação.
Ex.: CV =
2- Para duas emissões de ações ordinárias da indústria eletrônica, o preço médio diário,
no fechamento dos negócios, durante um período de um mês, para as ações A, foi de R$ 150,00
56
cristiane_brito_3@hotmail.com
com um desvio padrão de R$ 5,00. Para as ações B, o preço médio foi de R$ 50,00 com um
desvio padrão de R$ 3,00. Qual a melhor ação A ou B?
Solução: em termos de comparação absoluta, a variabilidade do preço das ações A foi maior,
devido ao desvio padrão maior. Mas em relação ao nível de preço, devem ser comparados os
respectivos coeficientes de variação:
Conclusão: relativamente ao nível médio de preços das ações, podemos concluir que o
preço da ação B é quase duas vezes mais variável que o preço da ação A, logo a ação B é o
melhor negócio.
57
cristiane_brito_3@hotmail.com
Exercícios:
01- Dada a amostra: 2,3,4,5,7,10,12.
a) Qual é a amplitude total? R: 10
b) Calcular a variância. R:13,81
c) Determinar o desvio padrão. R: 3,72
02- A distribuição de freqüências seguinte representa o número de pecas defeituosas
produzidas por uma maquina em 31 dias de observações. Calcule o desvio padrão do número de
peças defeituosas. R:1,06
No. de peças
defeituosas
0 1 2 3 4
No. de dias 3 5 15 5 3
03- A seguir, temos a distribuição de freqüência dos pesos de uma amostra de 45 alunos:
Pesoem Kg 40|---- 45 45|---- 50 50|---- 55 55|---- 60 60|---- 65 65|---- 70
Nº de
alunos
4 10 15 8 5 3
a) Determinar o peso médio. R: 53,5
b) Determinar a variância. R: 6,71
c) Qual é o valor do coeficiente de variação? R: 12,5%
04- Um fabricante de caixas de cartolina fabrica três tipos de caixas. Testa-se a resistência de
cada caixa, tomando-se uma amostra de 100 caixas e determinando a pressão necessária para
romper cada caixa. São os seguintes resultados dos testes:
Tipos de caixas A B C
Pressão média de
ruptura (bária)
150 200 300
Desvio padrão das
pressões (bária)
40 50 60
58
cristiane_brito_3@hotmail.com
a) Que tipo de caixa apresenta a menor variação absoluta na pressão de ruptura? R: A
b) Que tipo de caixa apresenta a maior variação relativa na pressão de ruptura? R: A
05- Uma empresa tem duas filiais praticamente idênticas quanto às suas características
funcionais. Um levantamento sobre os salários dos empregados dessas filiais resultou nos
seguintes valores:
Filial A: média = 400 e desvio padrão = 20
Filial B: média = 500 e desvio padrão = 25
Podemos afirmar, com base nesses resultados, que: R: a)
a) Em termos relativos, os salários das duas filiais não diferem quanto ao grau de dispersão.
b) As dispersões dos salários, tanto a absoluta quanto a relativa são iguais;
c) A dispersão absoluta é igual à dispersão relativa, em ambos os casos;
d) A filial A apresentou menor dispersão relativa e absoluta.
06- Cronometrando o tempo para várias provas de uma gincana automobilística,
encontramos:
Equipe 1: 40 provas
Tempo médio: 45 segundos
Variância: 400 segundos ao quadrado
Equipe 2: tempo: 20 40 50 80
Nº de provas: 10 15 30 5
a) Qual o coeficiente da variação relativo à equipe 1? R: 44,4%
b) Qual a média da equipe 2? 47,5
c) Qual o desvio padrão relativo à equipe 2? R: 25
d) Qual a média aritmética referente às duas equipes consideradas em conjunto? R: 46,25
e) Qual a equipe que apresentou resultados mais homogêneos? Justificar. R: 1
f) Qual a equipe que apresentou menor dispersão relativa? R: 1
59
cristiane_brito_3@hotmail.com
07- Os salários dos empregados da empresa A são 2% maiores do que os da empresa B, para
todos os empregados comparados individualmente. Com base nessa informação podemos afirmar
que: R: c)
a) O desvio padrão dos salários dos empregados é o mesmo para ambas as empresas;
b) Não há elementos para se compararem os desvios padrões dos salários dessas empresas;
c) O desvio padrão dos salários dos empregados da empresa A é 2% maior do que o dos
salários dos empregados da empresa B;
d) O desvio padrão dos salários dos empregados da empresa A é igual ao desvio padrão dos
salários dos empregados da empresa B, multiplicados por (1,02)2.
08- Os preços do pacote de café (500g) obtidos em diferentes supermercados locais são: R$
3,50; R$ 2,00; R$ 1,50 e R$ 1,00. Dadas essas informações, julgue os itens que se seguem. R: a)
a) O preço médio do pacote de 500g de café é de R$2,00.
b) Se todos os preços tiverem uma redução de 50%, o novo preço médio será de R$ 1,50.
c) A variância dos preços é igual a 0,625.
d) Se todos os preços tiverem um aumento de R$ 1,00; o coeficiente de variação dos preços
não se alterará.
e) Se todos os preços tiverem um aumento de 50%, a nova variância será exatamente igual à
anterior, pois a dispersão não será afetada.
09- Seja a tabela abaixo:
Consumo No. de
usuários
5 ----| 25 4
25 ----| 45 6
45 ----| 65 14
65 ----| 85 26
85 ----| 105 14
105 ----| 125 8
125 ----| 145 6
145 ----| 165 2
fi = 80
Determine:
a) A variância; R: 1022,53 b) Desvio padrão. R: 31,98
60
cristiane_brito_3@hotmail.com
Exercícios de Revisão do Conteúdo de Estatística Descritiva
Para cada uma das questões a seguir, assinale a alternativa correta:
01- A média aritmética é a razão entre:
a) O número de valores e o somatório deles;
b) O somatório dos valores e o número deles;
c) Os valores extremos;
d) Os dois valores centrais.
02- Na série 60,90,80,60,50, a moda será:
a) 50
b) 60
c) 66
d) 90
03- À medida que tem o mesmo número de valores abaixo e acima dela é:
a) A moda
b) A média
c) A mediana
d) O lugar mediano
04- A soma dos desvios entre cada valor e a média é:
a) Positiva
b) Negativa
c) Diferente de zero
d) Zero
05- Na série 60,50,70,80,90, o valor 70 será:
a) A média e a moda
b) A média e a mediana
c) A mediana e a moda
d) A média, a mediana e a moda.
06- Quando queremos verificar a questão de uma prova que apresentou maior número de
erros, utilizamos:
a) A moda
b) A média
c) A mediana
d) Qualquer das anteriores.
07- Dado o histograma a seguir, no interior de cujos retângulos foram anotadas frequências
absolutas, então a mediana é:
61
cristiane_brito_3@hotmail.com
a) 6,5
b) 6,0
c) 7,5
d) 7,0
08- Na série 15,20,30,40,50, há abaixo da mediana:
a) 3 valores
b) 2 valores
c) 3,5 valores
d) 4 valores
09- O coeficiente de variação é uma medida que expressa a razão entre:
a) Desvio padrão e média
b) Média e desvio padrão
c) Amplitude semi-interquartílica e mediana
d) Desvio padrão e moda.
10- O calculo da variância supõe o conhecimento de:
a) Média
b) Mediana
c) Ponto médio
d) Moda.
11- Na série 10 ,20, 40, 50, 70, 80, a mediana será:
a) 30
b) 35
c) 40
d) 45
12- Realizou-se uma prova de Matemática para duas turmas. Os resultados foram os
seguintes:
Turma A: = 5 e S = 2,5
Turma B: = 4 e S = 2
10
25
30
20
15
2 4 6 8 10 12
62
cristiane_brito_3@hotmail.com
Com esses resultados, podemos afirmar que:
a) A turma B apresentou maior dispersão absoluta;
b) A dispersão relativa é igual à dispersão absoluta;
c) Tanto a dispersão absoluta quanto a relativa são maiores para a turma B;
d) A dispersão absoluta de A é maior do que a de B, mas em termos relativos às duas
turmas não diferem quanto ao grau de dispersão das notas.
13- O desvio padrão de um conjunto de dados é 9. A variância será:
a) 3
b) 18
c) 36
d) 81
14- Cinqüenta por cento dos dados da distribuição situam-se:
a) Abaixo da média
b) Acima da mediana
c) Abaixo da moda
d) Acima da média
15- Dada a figura a seguir (polígono de frequência), o primeiro quartil da distribuição será:
a) 5,0
b) 5,5
63
cristiane_brito_3@hotmail.com
c) 4,8
d) 3,0
16- Os coeficientes de variação dos resultados a seguir são:
Estatística: média = 80 e S = 16
Historia: média = 20 e s = 5
a) 16% e 40%
b) 20% e 25%
c) 50% e 40%
d) 80% e 40%
17- Média, mediana e moda são medidas de:
a) Dispersão
b) Posição
c) Assimetria
d) Curtose.
18- Uma empresa possui dois serventes, recebendo salários de $ 2.500,00 cada um, quatro
escriturários recebendo $ 6.000,00 cada um, um chefe de escritório com salário de $
10.000,00 e três técnico recebendo $ 22.000,00 cada um. A média desses salários é:
a) $ 1.050,00
b) $ 5.050,00
c) $ 26.250,00
d) Nenhuma das anteriores
19- Na distribuição a seguir:
Classes Frequência
30 |--------- 40 10
40 |--------- 50 20
50 |--------- 60 35
60 |--------- 70 25
70 |--------- 80 10
A moda é:
a) 56
b) 35
c) 55
d)60
64
cristiane_brito_3@hotmail.com
20- A média da distribuição é:
Classes 0 |--- 6 6|---- 12 12|--- 18
fi 1 1 3
a) 11
b) 12
c) 14
d) 20
Respostas:
1-b 2-b 3-c 4-d 5-b 6-a 7-d 8-b 9-a 10-a 11-d 12-d 13-d
14-b 15-a 16-b 17-b 18-d 19-a 20-a
65
cristiane_brito_3@hotmail.com
VI- Probabilidade
6.1 Introdução
O estudo de fenômenos necessita de modelos matemáticos que o expliquem, nas
Estatísticas os fenômenos estudados são aquele que apresentem resultados sob mesmas
condições normais de experimentação variam de observação para observação.
A justificativa para o estudo do fenômeno é uma medida numérica da chance de que um
evento ocorrerá. Logo, as probabilidades podem ser usadas como medidas do grau de incerteza
associado a chances e plausibilidade de que algo aconteça.
Os valores da probabilidade são sempre atribuídos numa escala de 0 a 1. A probabilidade
próxima de zero indica um evento improvável de ocorrer, uma probabilidade próxima de um
indica um evento quase certo.
6.1.1 Conceitos e definições
Experimento Aleatório:
Todo experimento, que repetido varias vezes sob a mesma condição, pode apresentar
diferentes resultados.
Exemplos:
Jogar uma moeda
Selecionar uma peca para inspeção
Realizar uma chamada
Lançar um dado
66
cristiane_brito_3@hotmail.com
Espaço amostral:
Quando especificamos todos os resultados experimentais possíveis, identificamos o
espaço amostral de um experimento e o conjunto de todos os resultados possíveis e é indicado
por S (inglês space).
Exemplo:
Jogar uma moeda - S ={cara, coroa}
Jogar um dado – S ={1, 2, 3, 4, 5, 6}
Técnicas de Contagem
Árvore de Possibilidades ou diagrama de árvore: é uma representação gráfica que é
útil para visualizar e enumerar os resultados em um experimento de múltipla etapa.
Exemplo:
1- Diagrama de árvore para o experimento do arremesso de duas moedas.
cara
cara coroa
coroa cara
coroa
2- Uma urna contém cinco bolas vermelhas e quatro brancas. Duas bolas são
extraídas, ao acaso, sucessivamente e sem reposição. Desenhar a retirada das bolas pelo espaço
amostral e pela árvore de possibilidades.
V = vermelha
B = branca;
Temos:
Cara, Cara
Cara, coroa
Coroa, Cara
Coroa, coroa
67
cristiane_brito_3@hotmail.com
S= {VV, VB, BB, BV} n (S) = 4
1ª retirada 2ª retirada
Vermelha Vermelha
Branca
Branca Vermelha
Branca
Evento
É qualquer subconjunto do espaço amostral é representado pelas letras maiúscula do
nosso alfabeto. O conjunto vazio e o espaço amostral são eventos. O espaço amostral é evento
certo e o conjunto vazio o evento impossível.
Exemplo:
Jogar uma moeda uma vez.
S= {c, k}
Sair a face cara voltada para cima = A = {cara}
Jogar um dado uma vez.
S = {1, 2, 3, 4, 5, 6}
Sair a face par voltada para cima = A = {2, 4, 6}
68
cristiane_brito_3@hotmail.com
Probabilidade:
É atribuída aos resultados experimentais, que está baseado em três abordagens, que
são o método clássico, empírico e o subjetivo. Independente do método utilizado os resultados
precisam satisfazer a duas exigências básicas.
1- A probabilidade precisa está entre 0 e 1 inclusive. Se E denotar o enésimo resultado
experimental e P(E) a sua probabilidade, então essa exigência pode ser escrita como
, para todo i
2- A soma das probabilidades para todos os resultados experimentais precisa ser igual a 1.
Para n resultados experimentais, esta exigência pode ser escrita como:
a) Método Empírico – é o método que trabalha com probabilidades a priori,
trabalha em cima de resultados pré-existentes.
b) Método Subjetivo - método baseado em experiências profissionais ou de vida, ou
seja, é um método que só pode ser provado após o seu acontecimento.
c) Método Clássico - é apropriado quando todos os resultados experimentais são
igualmente prováveis, ou seja, se pode provar matematicamente que o resultado é possível.
Exemplos, ao jogar uma moeda, dois resultados são possíveis – cara ou coroa – atribuídos a cada
um dos resultados o valor de ½ ou 50%.
Outro exemplo seria ao se jogar um dado têm-se seis resultados possíveis, sendo atribuídos a
cada um deles o valor de 1/6.
Logo, pelo método clássico pode-se dizer que a possibilidade de um evento acontecer, pode ser
escrito como:
Exemplos:
1- Ao jogar uma moeda, dois resultados são possíveis – cara ou coroa – atribuídos a
cada um dos resultados o valor de ½ ou 50%.
69
cristiane_brito_3@hotmail.com
2- Ao se jogar um dado uma vez têm-se seis resultados possíveis, sendo atribuídos a
cada um deles o valor de 1/6.
3- Logo, pelo método clássico pode-se dizer que a possibilidade de um evento
acontecer, pode ser escrito como:
Nº de casos favoráveis
Nº de casos possíveis
Exemplo:
1) Joga-se uma moeda honesta duas vezes, determine:
a) O espaço amostral;
S= {cc, ck, kk, kC}
a. Qual a probabilidade de sair duas caras;
P (CC) = ¼
b. Qual a probabilidade de sair uma cara e uma coroa;
P(CK) = 2/ 4 = ½
c. Qual a probabilidade de sair uma cara e uma coroa, na ordem;
P(CK) = ¼
2) Joga-se um dado não viciado uma vez, determine:
a) O espaço amostral;
S= {1, 2, 3, 4, 5, 6}
b) Qual a probabilidade de sair a face de número par;
Face par = {2, 4, 6}
P (face par) = 3/6 = ½
c) Qual a probabilidade de sair um múltiplo de 3;
Múltiplo de 3 = {3, 6}
P (múltiplo 3) = 2/6= 1/3
d) Qual a probabilidade de sair um número primo;
70
cristiane_brito_3@hotmail.com
nº primos = {2, 3, 5}
P (nº primo) = 3/6 = ½
e) Qual a probabilidade de sair um nº maior que 6.
Nº maior que 6 = { } ou Ø
P (nº maior que 6) = 0, evento impossível
Análise Combinatória
Parte da matemática que estuda os métodos de contagem.
a) Permutação Simples: são os agrupamentos formados com todos os n elementos e que
diferem uns dos outros pela ordem de seus elementos.
Exemplo:
a. Escrever todos os anagramas da palavra SOL.
P3 = 3! = 3.2.1 = 6 possibilidades
b. De quantas maneiras 5 pessoas A, B, C, D, E podem ser dispostas em fila indiana?
P5 = 5! = 5.4.3.2.1= 120 maneiras diferentes.
c. Escolhe-se, ao acaso, um dos anagramas da palavra XADREZ. Qual a probabilidade
da palavra escolhida começar por XA?
S = é o número de permutações da palavra XADREZ.
Então, n(S) = P6 = 6! = 720
Evento (A) = a palavra começa por XA:
X A __ __ __ __
Nº de permutações do restante de letras a serem preenchidas P4 = 4!
n(A) = 4! = 24
71
cristiane_brito_3@hotmail.com
P(A) = 24/720 = 3,33%
b) Combinação Simples: os agrupamentos conseguidos permanecem iguais ao se
inverte a posição dos seus elementos.
Exemplo:
1) Uma turma formada por 10 alunos. Deseja-se formar uma comissão de três alunos para
representação discente da Universidade. De quantas maneiras podemos fazer tal escolha.
2) Semanalmente são sorteados seis números de um grupo de 60 números. Quantos sãoos resultados possíveis de um sorteio semanal?
3) Se você concorrer nesse sorteio, qual a probabilidade de acertar o prêmio?
6.2 Matemática da Probabilidade
O cálculo de probabilidade usa operações em conjunto para dar seus resultados e através
dele podem-se formar novos eventos:
72
cristiane_brito_3@hotmail.com
A B - é o evento em ambos ocorrerem.
A ∩ B = é o evento que ocorre se A e B ocorrem.
A’ = é o evento que ocorre se A não ocorre.
6.2.1 Evento Complementar – A’
Dado um evento A, o complemento de A é definido como sendo todos os eventos que
não estão em A. O complemento de A é denotado por A’. O diagrama de Venn ilustra o conceito
de um complemento.
Espaço Amostral S
Evento Complemento do Evento A
Logo,
Exemplo:
1- A probabilidade de chove hoje é de 75%, qual a probabilidade de não chover?
A = evento chover
A’ = evento não chover
2- Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se, ao acaso, uma bola desta
urna, evento A é sair os “múltiplos de 5”, então qual a probabilidade do evento A não ocorrer.
S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
A = {5, 10} = P(A) = 2/10
A’
A
73
cristiane_brito_3@hotmail.com
P(A’) + P(A) = 1 = P(A’) + 2/10 = 1 = P(A’) = 1 – 2/10 = P(A’) = 8/10
3- Numa comunidade residem 100 pessoas. Uma pesquisa sobre os hábitos alimentares
dessa comunidade revelou que:
- 25 pessoas consomem carnes e verduras;
- 83 pessoas consomem verduras;
- 39 pessoas consomem carnes.
Uma pessoa da comunidade é escolhida ao acaso. Qual a probabilidade de ela:
a) Consumir exclusivamente carne?
b) Ter o habito alimentar de não comer nem carne nem verdura?
V C
25
58 14
3
As probabilidades pedidas são:
a) P(carne) = 14/ 100 = 0,14 b) P(carne’) = 3/100 = 0,03
6.2.2 Probabilidade de Adição
É a probabilidade de conhecer pelo menos um dos eventos quando temos dois, ou seja,
quando temos os eventos A e B e estamos interessados em saber a P(A) ou a P(B), ou de ambos
74
cristiane_brito_3@hotmail.com
ocorrerem. A probabilidade da Adição esta baseada na lei da união e interseção de conjuntos,
como podemos ver:
Exemplo:
No fim de um período de avaliação de desempenho, o gerente de produção descobriu que
5 dos 50 trabalhadores tinham completado o trabalho mais tarde, que 6 dos 50 trabalhadores
tinham montado produtos com defeito, e que 2 dos 50 trabalhadores tinham completado o
trabalho mais tarde como montado produtos defeituosos.
L = o evento em que o trabalho é completado mais tarde
D = o evento em que o produto montado é defeituoso
Solução: Depois de rever os dados de desempenho, o gerente de produção decidiu
atribuir uma avaliação de desempenho fraco a qualquer empregado cujo trabalho foi tanto
terminado mais tarde com defeituoso; assim, o evento de interesse é L D. Qual é a
probabilidade de que o gerente de produção tenha atribuído a um empregado uma avaliação de
desempenho fraco?
P (L) = 5/50 = 0,10
P(D) = 6/50 = 0,12
P(L D) = 2/50 = 0,04
Este cálculo informa que há uma probabilidade de 18% de que um empregado receba
uma avaliação de desempenho fraco.
75
cristiane_brito_3@hotmail.com
6.2.3 Probabilidade Condicional
Se A e B são dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido, é
definida por: P(B/A)
Se a ocorrência ou não de A não afetar a probabilidade da ocorrência de B, então P(B/A)
= P(B) e neste caso A e B são eventos independentes e em caso contrario A e B são eventos
dependentes.
Os eventos são independentes.
Eventos Independentes:
Eventos Dependentes:
Exemplo:
1- Status de promoção dos oficiais de policiais nos últimos dois anos.
Homens Mulheres Totais
Promovidos (A) 288 36 324
Não promovidos (A’) 672 204 876
Totais 960 240 1.200
a) Qual a probabilidade de que o oficial aleatoriamente selecionado seja um homem e é
promovido. P (H e A) = 288/1.200 = 0,24
76
cristiane_brito_3@hotmail.com
b) Qual a probabilidade de que o oficial aleatoriamente selecionado seja um homem e não
seja promovido. P (H e A’) = 672/1.200 = 0,56
c) Qual a probabilidade de que o oficial aleatoriamente selecionado seja promovido
sabendo-se que ele é homem.
P(A/H) =
2- Num lote de uma fábrica há 10 estatuas. Onde 3 delas estão com defeitos. O defeito
não é perceptível a olho nu. Se alguém pegar aleatoriamente 2 estatuas, qual é a probabilidade de
pegar as duas com defeito?
Solução:
77
cristiane_brito_3@hotmail.com
Exercícios:
01- Lançar um dado e uma moeda.
a) Construir o espaço amostral
b) Enumerar os seguintes eventos:
A = {coroa, marcada por número par}
B = {cara, marcada por número ímpar}
C = {múltiplo de 3}
c) Expressar os eventos:
1- B’
2- A ou B ocorrem
3- B e C ocorrem
4- [(A B)’]
d) Verificar dois a dois os evento A, B e C e dizer quais são mutuamente exclusivos.
02- Se a P(A) = ½; P(B) = ¼ e A e B mutuamente exclusivos, calcular:
a) P(A’)
b) P(B’)
c) P(A∩B)
d) P(AB)
e) P (A’ ∩ B’)
03- Se P(A) = 1/2; P(B) = 1/3 e P (A ∩ B) = ¼
Calcule:
a) P (A B)
b) P (A’ B’)
c) P (A’ ∩ B’)
78
cristiane_brito_3@hotmail.com
04- Determinar a probabilidade de cada evento:
a) Um número par aparecer no lançamento de um dado não viciado.
b) Um rei aparecer, ao extrair-se uma carta de um baralho.
c) Pelo menos uma cara aparecer no lançamento de três moedas.
d) Pelo menos uma cara aparecer no lançamento de n moedas.
e) Duas copas aparecerem, ao retirarem-se duas cartas de um baralho.
f) Uma carta de copas e uma de ouros aparece ao extraírem-se duas cartas de um baralho.
05- Um número inteiro é escolhido aleatoriamente dentre os números de 1 a 50. Qual a
probabilidade de:
a) O número ser divisível por 5?
b) O número terminar em 3?
c) O número ser primo?
d) O número ser divisível por 6 ou 8?
06- Qual a probabilidade de sair um rei ou uma carta de copas. Quando retiramos uma carta de
um baralho?
07- Considere o experimento jogar uma moeda duas vezes.
a) Determine o espaço amostral.
b) Qual a probabilidade de se obter cara e cara?
c) Qual a probabilidade de se obter uma cara e uma coroa?
08- Considere o experimento de jogar um dado duas vezes.
a) Determine o espaço amostral.
b) Qual a probabilidade do produto entre as faces ser um número menor que 6?
c) Qual a probabilidade do produto entre as faces ser um número primo?
d) Qual a probabilidade da soma das faces ser um múltiplo de 2?
e) Qual a probabilidade da soma das faces ser um número ímpar?
79
cristiane_brito_3@hotmail.com
09- Considere o experimento retirar uma carta de um baralho de 52 cartas.
a) Qual a probabilidade de sair um naipe de cor preta?
b) Qual a probabilidade de sair uma carta de ouros?
c) Qual a probabilidade de sair uma figura?
10- Um lote é formado por 10 bolas numeradas de 1 a 10. Duas bolas são retiradas sem
reposição.Qual a probabilidade de a + b = 10?
11- Um lote é formado por 10 peças boas, quatro com defeitos e duas com defeitos graves. Uma
peça é escolhida ao acaso. Calcular a probabilidade de que:
a) Ela não tenha defeitos graves;
b) Ela não tenha defeitos;
c) Ela ou seja boa, ou tenha defeitos graves.
12- Uma urna contém cinco bolas brancas e seis pretas. Três bolas são retiradas. Calcular a
probabilidade de:
a) Serem todas pretas;
b) Ser exatamente uma branca;
c) Ser ao menos uma preta.
13- Suponha que um gerente de um grande complexo de apartamentos forneça as seguintes
estimativas de probabilidade subjetiva sobre o número de vagas que haverá no próximo mês:
Vagas Probabilidade
0 0,05
1 0,15
2 0,35
3 0,25
4 0,10
5 0,10
80
cristiane_brito_3@hotmail.com
Determine a probabilidade de vagas para cada evento, a seguir:
a) Sem vagas;
b) Pelo menos quatro vagas;
c) Duas vagas ou menos.
14- De acordo com a pesquisa do Business Week/Harris, 14% dos adultos opinaram que a
chance de uma grande quebra no mercado de ações durante 1998 era muito provável e 43%
opinaram que a chance de uma grande quebra no mercado de ações era algo provável. Se
fossemos escolher aleatoriamente um adulto, qual é a probabilidade de que ele ou ela indicaria
que uma quebra não era provável?
15- Suponha que temos dois eventos, A e B, com P(A) = 0,50, P(B)= 0,60 e P (A B) =
0,40.
a) Ache P(A/B)
b) Ache P(B/A)
c) A e B são independentes? Por quê?
16- Suponha que temos dois eventos, A e B, que são mutuamente exclusivos. Suponha, além
disso, que conhecemos P(A) = 0,30 e P(B) = 0,40.
a) Qual é P(A e B)?
b) Qual é P(A/B)?
17- Um clube tem os seguintes dados sobre a idade e o estado civil de 140 clientes.
Estado Civil
Idades Solteiro Casado
Menos de 30 77 14
30 ou mais 28 21
a) Qual a probabilidade de encontrar um cliente que é solteiro e com menos de 30 anos?
81
cristiane_brito_3@hotmail.com
b) Se um cliente tem menos de 30 anos, qual é a probabilidade de que ele ou ela seja solteiro
(a)?
c) O estado civil independe da idade? Explique usando probabilidades.
18- Num lote de 12 pecas, 4 são defeituosas, duas peças são retiradas aleatoriamente.
Calcule:
a) A probabilidade de ambas serem defeituosas;
b) A probabilidade de ambas não serem defeituosas;
c) A probabilidade de ao menos uma ser defeituosa.
19- Uma bola é retirada ao acaso de uma urna que contém 6 vermelhas, 4 brancas e 5 azuis.
Determinar a probabilidade dela:
a) Ser vermelha;
b) Ser branca;
c) Ser azul;
d) Não ser vermelha;
e) Ser vermelha ou branca.
20- A probabilidade de uma mulher estar viva daqui a 30 anos é ¾ e de seu marido é 3/5.
Calcular a probabilidade de:
a) Apenas o homem estar vivo;
b) Somente a mulher esta viva;
c) Pelo menos um estar vivo;
d) Ambos estarem vivos.
82
cristiane_brito_3@hotmail.com
VII- Distribuição de Probabilidade
7.1 Introdução
A distribuição de probabilidade é uma função que determina probabilidades para eventos
ou proposições. Para qualquer conjunto de eventos ou proposições, existem muitas maneiras de
determinar probabilidades, de forma que a escolha de uma ou outra distribuição é equivalente a
criar diferentes hipóteses sobre os eventos ou proposições em questão. A distribuição de
probabilidade de uma variável descreve como as probabilidades estão distribuídas sobre os
valores da variável aleatória.
Uma distribuição é chamada de distribuição discreta se for definida em um conjunto
contável e discreto, tal como o subconjunto dos números inteiros; ou é chamada de distribuição
contínua se tiver uma função contínua.
7.2 Variável aleatória (v.a.)
É um meio para descrever valores numéricos dos resultados de um experimento,
utilizando a aleatoriedade (ou o acaso). As variáveis aleatórias podem ser discretas ou continuas.
O que vamos aprender é sobre a variável aleatória discreta.
7.3 Variável aleatória binomial
Muitas vezes contamos o número de vezes que ocorre o evento de interesse (ou sucesso),
em uma série de tentativas ou de experimentos. Por exemplo:
Um jogador conta quantas caras saem quando lança 10 moedas;
Um pesquisador conta quantos, dos 500 chefes de família que entrevistou, eram
mulheres;
Um médico conta quantos, dos 100 pacientes que tratou com nova droga, ficaram
curados;
83
cristiane_brito_3@hotmail.com
Uma biomédica conta quantos, dos 32 hemogramas que fez no dia, indicou
doença contagiosa;
Uma enfermeira conta quantos, dos nascidos vivos durante determinado ano em
uma maternidade, tinham doença ou defeito sério.
7.4 Distribuição de Probabilidades
É uma distribuição baseada em uma variável aleatória relativas a dados que podem ser
contados, uma das distribuições descontinuas que irá ser apresentada é a distribuição binomial.
É uma distribuição baseada em um binômio, que mostra situações em que os resultados
de uma v.a. podem ser agrupados em duas classes ou categorias. As categorias devem ser
mutuamente excludentes, tem que ficar claro a qual categoria pertence; e as classes devem ser
coletivamente exaustivas, tem que ficar claro que nenhum outro resultado fora dela é possível.
A distribuição binomial ajuda a mostrar o número de sucessos num conjunto de
observações. Para determinar a distribuição há necessidade de conhecer as características para
determiná-la.
Há n observações ou provas idênticas;
Cada prova tem dois resultados possíveis, sucesso e o fracasso (ou falha);
As probabilidades p de sucesso e 1-p de fracasso (falha);
Os resultados das provas são independentes uns dos outros.
A forma de se obter a distribuição binomial utiliza-se de dois métodos, o uso da fórmula
de binomial e a tabela de distribuição binomial, veremos a seguir o uso da fórmula de binomial.
a) Fórmula da binomial
A fórmula consiste em utilizar a análise combinatória, que é a probabilidade de uma das
maneiras ocorrerem.
84
cristiane_brito_3@hotmail.com
Análise Combinatória
Exemplo:
1- Uma fabricante suspeita que 2% de seu produto apresenta algum defeito. Se tal
suspeite é correta, determinar a probabilidade de que, numa amostra de nove itens.
a) Haja um item defeituoso;
b) Haja ao menos um item defeituoso.
Solução:
a) P = 2% de itens defeituosos
1-p = 98% de itens perfeitos
n = 9 itens
x = 1 defeituoso
b) P = 2%
1 – p= 98%
n = 9
x ≥ 1
85
cristiane_brito_3@hotmail.com
Logo:
2- Suponha que peças saiam de uma linha de produção e sejam classificadas como
defeituosas (def.) ou como não defeituosas (B). Admita que 5 peças sejam escolhidas ao acaso.
Se a probabilidade de que uma peça seja defeituosa é de 0,2, calcule a probabilidade de obtermos
duas peças defeituosas.
3- Um fabricante de mesas de bilhar afirma que 3% das suas mesas saem com algum
defeito. Retirou-se uma amostra de 9 mesas. Determine a probabilidade de:
a) Nenhuma apresentar defeito.
b) Todas apresentarem defeito.
c) Pelo menos uma apresentar defeitos.
d) No máximo duas apresentarem defeitos.
86
cristiane_brito_3@hotmail.com
Exercícios:
01- Dos estudantes de um colégio, 41% são fumantes. Escolhem-se 6 estudantes ao acaso
para darem sua opinião.
a) Determine aprobabilidade de todos serem fumantes. R: 0,0047
b) Determine a probabilidade de ao menos um ser fumante. R: 0,9579
c) Determine a probabilidade de ao menos a metade ser fumante. R: 0,4766
02- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são
devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos primeiros 25 dias
após a venda. De 11 carros vendidos num período de 5 dias, qual a probabilidade de que:
a) Todos voltem para reparo. R: 0,0858
b) Só um não volte para reparo. R: 0,2362
03- Os registros de uma companhia indicam que 40% das faturas por ela emitidas são pagas
após o vencimento. De 14 faturas expedidas, determine a probabilidade de:
a) Nenhum ser paga com atraso. R: 0,000002
b) No Maximo 2 serem pagas com atraso. R: 0,0316
c) Ao menos três serem pagas com atraso. R: 0,9623
04- Um teste de múltipla escolha apresenta 4 opções por questão, em 14 questões. Se a
aprovação depende de 9 ou mais respostas corretas, qual é a probabilidade de um estudante que
responde “no chute” ser aprovado? R; 0,0021
05- Uma universidade descobriu que 20% de seus estudantes retiram-se sem completar o
curso introdutório de estatística. Considere que 20 estudantes tenham se registrado para o curso
este trimestre. Determine a probabilidade de:
a) Dois ou menos estudantes se retirarão. R: 0,2060
b) Exatamente quatro se retirarão. R: 0,2178
c) Mais de três se retirarão. R:0,5888
87
cristiane_brito_3@hotmail.com
06- Uma moeda é jogada 10 vezes. Calcular as seguintes probabilidades:
a) De ocorrer seis caras; R: 0,2047
b) De dar pelo menos duas caras; R: 0,9896
c) De não dar nenhuma coroa; R: 0,0009
d) De dar pelo menos uma coroa; R: 0,9991
e) De não dar cinco caras e cinco coroas. R: 0
07- Um time X tem 2/3 de probabilidade de vitória sempre que joga. Se X jogar cinco
partidas, calcule a probabilidade de:
a) X vencer exatamente três partidas; R: 0,3275
b) X vencer ao menos uma partida; R: 0,0039
c) X vencer mais da metade das partidas. R: 0,7951
08- Seja X uma variável aleatória com distribuição binomial em 10 repetições de um
experimento. Se p = 0,3, calcule as seguintes probabilidades:
a) P (x ≤ 8) R:0,9999
b) P (x = 7) R: 0,009
c) P (x ≥ 6) R: 0,0472
09- Um jogador de basquetebol acerta um arremesso com probabilidade de 0,9. Em cinco
arremessos a probabilidade de o jogador acertar todos é: R: a)
a) 0,59
b) 0,9
c) 0,81
d) 0,9 x 5
e) 0,45
88
cristiane_brito_3@hotmail.com
VIII- Distribuição Contínua de Probabilidade
8.1 Introdução
A distribuição normal foi estudada inicialmente no século 18, quando uma análise de
erros experimentais levou a uma curva em forma de sino. Embora ela tenha aparecido pela
primeira vez em 1733 por DeMoivre, a distribuição normal recebe o nome de distribuição
gaussiana, em homenagem ao cientista alemão Karl Friedrick Gauss, que foi o primeiro a
utiliza-la em 1809.
8.2 Variáveis aleatórias contínuas
É uma variável que pode assumir qualquer valor dentro de um intervalo. Os experimentos
que são baseados em escalas como peso, altura, comprimento, etc., são considerados contínuos.
8.3 Distribuição Normal
A distribuição normal de probabilidade tem sido usada numa ampla variedade de
aplicações práticas onde as variáveis aleatórias são alturas, pesos, contagens de QI, medições
cientificas, índices de precipitações pluviométricas, etc.
8.3.1 Curva Normal
É a representação gráfica de uma distribuição normal e que tem algumas características
básicas.
Formato de sino;
Sua área corresponde a 100% de observações;
É simétrica em relação à média;
Prolonga-se de - a + ;
Cada distribuição normal fica completamente especificada por sua média e seu
desvio padrão.
89
cristiane_brito_3@hotmail.com
8.3.2 Distribuição Normal Padronizada
Uma variável aleatória que tem uma distribuição normal com uma média de zero e um
desvio padrão de 1 tem uma distribuição normal – padrão de probabilidade. A letra z é utilizada
para designar essa particular variável aleatória normal. A figura abaixo mostrará essa
padronização da curva normal.
Onde
Z = número de desvios padrões a contar da média
X = valor arbitrário
= a média da distribuição normal
= desvio padrão
8.3.3 Tabela Normal Padronizada
A tabela normal serve para achar qualquer valor sobre a curva normal, após fazer a
conversão da escala original para a escala em termos de desvios padrões, a média passa a servir
como ponto de referência-origem e o desvio padrão como unidade de medida. Como a curva
normal é simétrica em relação a média a tabela normal vai mostrar o lado direito da tabela que
90
cristiane_brito_3@hotmail.com
será o mesmo valor do lado esquerdo da curva. Por exemplo, z = +1 tem o mesmo valor tabelado
de z = - 1 que é 0,3413. A tabela normal está demonstrada nos anexos.
Exemplo:
Z = 1,25 = 0,3944
Z = - 1,33 = 0,4082
91
cristiane_brito_3@hotmail.com
92
cristiane_brito_3@hotmail.com
Exercícios:
01- Trace uma curva normal e sombreie a área desejada, obtendo então a informação.
a) Z = 1 R: 0,3413
b) Z = - 1 R: 0,3413
c) Área entre z = 0 e z = 1,5 R: 0,4332
d) Área entre z = - 0,56 e z = - 0,20 R: 0,0793
e) Área entre z = - 0,49 e z = 0,49 R: 0,3758
f) Z > 1,2 R: 0,1151
g) Z < 1,4 R: 0,9192
h) Z > - 2,3 R: 0,9893
02- Dado que uma população com média 25 e desvio padrão 2 tem distribuição normal,
determine os valores de z para os seguintes valores da população:
a) 23,0 R: 0,3413
b) 23,5 R: 0,2734
c) 24,0 R: 0,1915
03- Suponha que a renda média de uma comunidade possa ser razoavelmente aproximada por
uma distribuição normal com média de $ 1.500,00 e desvio padrão de $ 300,00. Que
porcentagem da população terá renda superior a $ 1.860,00? R: 0,1151
04- Um processo industrial produz canos com diâmetro médio de 2 polegadas e o desvio
padrão de 0,01 polegada. Os canos com diâmetros que variem de mais de 0,03 polegadas a
contar da média são considerados defeituosos.
a) Qual a porcentagem de canos defeituosos? R: 0,4987
b) Qual a probabilidade de encontrar duas peças defeituosas em sequência? R: 0,00132
c) Qual a probabilidade de encontrar duas peças perfeitas em sequência? R: 0,99872
93
cristiane_brito_3@hotmail.com
05- A vida média útil de lavadoras de pratos automáticas é de 1,5 anos, com desvio padrão de
0,3 anos. Se os defeitos se distribuem normalmente, que percentagem das lavadoras vendidas
necessitara de conserto antes de expirar o período de garantia de 1 ano? R: 0,0475
06- O numero de pessoas que almoçam num restaurante self-service é aproximadamente
normal com média de 250 e desvio padrão de 20 por dia.
a) Qual a probabilidade de haver ao menos 200 clientes em determinado dia? R: 0,0062
b) Determine a probabilidade de comparecerem entre 225 e 275 clientes. R: 0,7888
c) Se o preço médio pago por cada cliente é $ 4,00, qual a receita diária esperada? R: $ 1000
07- Um adulto tem em média 1,75 m de altura, o desvio padrão é de 8 cm, determine a
probabilidade de:
a) Um homem adulto tenha mais de 1,83m? R: 0,1587
b) Um homem adulto tenha mais de 1,52m? R: 0,9979
c) Um homem adulto esteja entre 1,68 e 1,78m? R: 0,4521
d) Um homem adulto não tenha mais de 1,83m? R: 0,8413
94cristiane_brito_3@hotmail.com
IX- Análise de Correlação e Regressão
9.1 Introdução
Quando se considera duas ou mais variáveis, surge um novo problema: as relações que
podem existir entre as variáveis estudadas. Para avaliar esta relação entre as variáveis utiliza-se
de novas medidas como instrumento adequado para análise da relação dessas variáveis, que é
chamada de analise de correlação.
Apos caracterizada a relação, procuramos descrevê-la através de uma função matemática.
A regressão é o instrumento adequado para a determinação dos parâmetros dessa função.
9.2 Coeficiente de Correlação de Pearson
Um indicador da força de uma relação linear entre duas variáveis intervalares é o
coeficiente de Correlação de Produto de Momento de Pearson, ou simplesmente Coeficiente de
Pearson. Trata-se de uma medida de associação que independe das unidades de medidas do
coeficiente r próximo de zero.
A interpretação do Coeficiente de Correlação como medida da intensidade da relação
linear entre duas variáveis é puramente matemática e está completamente isenta de qualquer
implicação de causa e efeito. O fato de duas variáveis aumentarem ou diminuírem juntas não
implica que uma delas tenha algum efeito direto, ou indireto, sobre a outra.
9.2.1 Cálculo do Coeficiente de correlação
Para julgar o coeficiente de correlação (r), podemos analisar desta forma:
0 < r < 0,25 ou -0,25 < r < 0: correlação pequena ou nula.
95
cristiane_brito_3@hotmail.com
0,25 < r < 0,50 ou -0,50 < r < -0,25: correlação fraca.
0,50< r < 0,75 ou -0,75 < r < -0,50: correlação moderada.
0,75 < r < 1,00 ou -1 < r < -0,75: correlação forte ou perfeita ( perfeita se r = +1
ou r = -1).
Exemplo:
Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe da faculdade
A e pelas notas obtidas por eles em Matemática e Estatística:
Matemática (x) Estatística (y) XY X2 Y2
5 6
8 9
7 8
10 10
6 5
7 7
9 8
3 4
8 6
2 2
x = y= xy= x2= y2=
96
cristiane_brito_3@hotmail.com
Exercícios:
01- Oito programas foram monitorados para estudar a demanda por recursos. Neste trabalho,
a variável resposta (dependente) é o tempo de CPU, e a variável independente é o número de
acessos ao disco (disk I/O)
Tempo de CPU (Y) Número de acessos ao disco (X)
2,0 14
4,6 15
5,7 23
7,3 31
9,8 38
10,9 40
12,6 53
13,2 51
Calcule o coeficiente de correlação de Pearson. Conclua sobre a correlação entre as duas
variáveis. R: 0,98
02- Calcule a correlação existente entre as variáveis apresentadas:
a) Preços e Quantidades vendidas do mesmo produto verificadas em vários locais de
vendas:
97
cristiane_brito_3@hotmail.com
b) Dados os valores x (5, 10,20, 8, 4, 6, 12 e 15) e y (27, 46,73, 40, 30, 28, 46 e 59), nesta
ordem respectivamente, e supondo que x expresse os valores de aquisição de plano de saúde
numa determinada empresa e y a produtividade de seus empregados, determine a correlação
entre os dados.
c) Uma amostra aleatória de 10 alunos foi retirada de uma sala de 98 alunos. Deste foi
verificado as notas de matemática e estatística:
Existe correlação entre as duas disciplinas? Qual?
03- Tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço
varia conforme a temperatura
Determine o coeficiente de correlação.
98
cristiane_brito_3@hotmail.com
9.3 Análise de Regressão
Sempre que desejamos estudar determinada variável em função de outra fazemos uma
analise de regressão. Ela tem por objetivo descrever através de um modelo matemático, a relação
entre duas variáveis, partindo de n observações das mesmas.
9.3.1 Diagrama de Dispersão
Para análise de regressão linear simples, é desejável a construção de um gráfico
bidimensional denominado diagrama de dispersão. Cada valor é marcado em função das
coordenadas X e Y.
Exemplo:
Um administrador de entrevistadores deseja desenvolver um modelo para prever o
número de entrevistas em um dado dia. Ele acredita que a experiência do entrevistador (medida
em semanas trabalhadas) é determinante do número de entrevistas realizadas. Uma amostra de 10
entrevistadores revelou os seguintes dados:
Semanas
de
experiência
15 41 58 18 37 52 28 24 45 33
Nº de
entrevistas
realizadas
4 9 12 6 8 10 6 5 10 7
Denominado Y= número de entrevistas realizadas e X= semanas de experiência, podem
construir o diagrama de dispersão.
99
cristiane_brito_3@hotmail.com
Um exame do gráfico indica uma relação entre X e Y. Quando o número de semanas
aumenta, entrevistas realizadas aumentaram.
9.3.2 Modelo de regressão linear simples
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável
dependente e a outra recebe o nome de variável independente.
Assim, supondo X a variável independente e Y a variável dependente, vamos procurar
determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma
função definida por:
Onde a e b são parâmetros.
100
cristiane_brito_3@hotmail.com
9.3.3 Coeficiente de regressão
O r2 expressa a proporção da variação total que é explicada (devida) à reta de regressão de X
sobre Y.
Exemplo:
01- Desejamos conhecer uma possível relação linear entre o preço de venda (Y) e o valor
estimado ou valor contábil (X) de residências em determinado bairro. Escolhemos uma amostra
de cinco residências que foram vendidas no ultimo ano. Os valores estão em unidade de $
100.000.
Residências Valor estimado (X) Preço de venda
(Y)
1 2 2
2 3 5
3 4 7
4 5 10
5 6 11
Determine a equação da reta e o coeficiente de determinação.
101
cristiane_brito_3@hotmail.com
Exercícios:
01- 04- Calcular a propaganda necessária para se alcançar uma venda prevista R$ 3.200,00
para2007, sabendo-se que existe forte correlação direta entre as vendas e propaganda.
02- Tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço
varia conforme a temperatura
Determine:
a) A reta ajustada a essa correlação;
b) O valor estimado do comprimento da barra para a temperatura de 18°C
c) O valor estimado do comprimento da barra para a temperatura de 35°C
03- Para uma empresa manter-se competitiva, gastos em pesquisas e desenvolvimento (P&D)
são essenciais. Para determinar o nível ótimo de gastos em (P&D) e seu efeito sobre o valor da
empresa, foi aplicada análise de regressão linear simples, onde:
Y= razão entre preços e ganhos
X= razão entre gastos com (P&D) e vendas
102
cristiane_brito_3@hotmail.com
Os dados das 20 empresas usadas no estudo são os seguintes:
Empresas Y X
1 5,6 0,003
2 7,2 0,004
3 8,1 0,009
4 9,9 0,021
5 6,0 0,023
6 8,2 0,030
7 6,3 0,035
8 10,0 0,037
9 8,5 0,044
10 13,2 0,051
a) Determinar o coeficiente de correlação.
b) Determinar a equação da reta
c) Faça uma previsão para o valor de Y, quando X = $ 0,070.
04- Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A:
X Y
11 13
14 14
19 18
19 15
22 22
28 17
30 24
103
cristiane_brito_3@hotmail.com
31 2234 24
37 25
a) Calcule o coeficiente de correlação;
b) Calcule o coeficiente de regressão.
05- Certa empresa, estudando a variação da demanda de seu produto em relação à variação de
preço de venda, obteve a tabela:
Preço Demanda
38 350
42 325
50 297
56 270
59 256
63 246
70 238
80 223
95 215
110 208
a) Determine o coeficiente de correlação;
b) Estabeleça a equação de reta ajustada;
c) Estime Y para X =60 e X =120.