Prévia do material em texto
Estatística Aplicada
Estatística Aplicada
Adriana Santos Augusto
2ª
e
di
çã
o
Estatística Aplicada
DIREÇÃO SUPERIOR
Chanceler Joaquim de Oliveira
Reitora Marlene Salgado de Oliveira
Presidente da Mantenedora Jefferson Salgado de Oliveira
Pró-Reitor de Planejamento e Finanças Wellington Salgado de Oliveira
Pró-Reitor de Organização e Desenvolvimento Jefferson Salgado de Oliveira
Pró-Reitor Administrativo Wallace Salgado de Oliveira
Pró-Reitora Acadêmica Jaina dos Santos Mello Ferreira
Pró-Reitor de Extensão Manuel de Souza Esteves
Pró-Reitor de Pós-Graduação e Pesquisa Marcio Barros Dutra
DEPARTAMENTO DE ENSINO A DISTÂNCIA
Gerência Nacional do EAD Bruno Mello Ferreira
Gestor Acadêmico Diogo Pereira da Silva
FICHA TÉCNICA
Direção Editorial: Diogo Pereira da Silva e Patrícia Figueiredo Pereira Salgado
Texto: Adriana Santos Augusto
Revisão: Lívia Antunes Faria Maria e Walter P. Valverde Júnior
Projeto Gráfico e Editoração: Andreza Nacif, Antonia Machado, Eduardo Bordoni e Fabrício Ramos
Supervisão de Materiais Instrucionais: Janaina Gonçalves de Jesus
Ilustração: Eduardo Bordoni e Fabrício Ramos
Capa: Eduardo Bordoni e Fabrício Ramos
COORDENAÇÃO GERAL:
Departamento de Ensino a Distância
Rua Marechal Deodoro 217, Centro, Niterói, RJ, CEP 24020-420 www.universo.edu.br
Ficha catalográfica elaborada pela Biblioteca Universo – Campus Niterói
Bibliotecária: Elizabeth Franco Martins – Crb 7/4990
© Departamento de Ensino a Distância - Universidade Salgado de Oliveira
Todos os direitos reservados. Nenhuma parte desta publicação pode ser reproduzida, arquivada ou transmitida
de nenhuma forma ou por nenhum meio sem permissão expressa e por escrito da Associação Salgado de
Oliveira de Educação e Cultura, mantenedora da Universidade Salgado de Oliveira (UNIVERSO).
A923e Augusto, Adriana Santos.
Estatística aplicada / Adriana Santos Augusto ; revisão de
Lívia Antunes Faria Maria e Walter P. Valverde Júnior. 2. ed.
– Niterói, RJ: UNIVERSO, 2011.
242 p. ; il.
1. Estatística aplicada. 2. Gráficos estatísticos. 3. Medidas
estatísticas. 4. Amostragem (Estatística). I. Maria, Lívia
Antunes Faria. II. Valverde Júnior, Walter P. III. Título.
CDD 519.5
Estatística Aplicada
Palavra da Reitora
Acompanhando as necessidades de um mundo cada vez mais complexo,
exigente e necessitado de aprendizagem contínua, a Universidade Salgado de
Oliveira (UNIVERSO) apresenta a UNIVERSO EAD, que reúne os diferentes
segmentos do ensino a distância na universidade. Nosso programa foi
desenvolvido segundo as diretrizes do MEC e baseado em experiências do gênero
bem-sucedidas mundialmente.
São inúmeras as vantagens de se estudar a distância e somente por meio
dessa modalidade de ensino são sanadas as dificuldades de tempo e espaço
presentes nos dias de hoje. O aluno tem a possibilidade de administrar seu próprio
tempo e gerenciar seu estudo de acordo com sua disponibilidade, tornando-se
responsável pela própria aprendizagem.
O ensino a distância complementa os estudos presenciais à medida que
permite que alunos e professores, fisicamente distanciados, possam estar a todo
momento ligados por ferramentas de interação presentes na Internet através de
nossa plataforma.
Além disso, nosso material didático foi desenvolvido por professores
especializados nessa modalidade de ensino, em que a clareza e objetividade são
fundamentais para a perfeita compreensão dos conteúdos.
A UNIVERSO tem uma história de sucesso no que diz respeito à educação a
distância. Nossa experiência nos remete ao final da década de 80, com o bem-
sucedido projeto Novo Saber. Hoje, oferece uma estrutura em constante processo
de atualização, ampliando as possibilidades de acesso a cursos de atualização,
graduação ou pós-graduação.
Reafirmando seu compromisso com a excelência no ensino e compartilhando
as novas tendências em educação, a UNIVERSO convida seu alunado a conhecer o
programa e usufruir das vantagens que o estudar a distância proporciona.
Seja bem-vindo à UNIVERSO EAD!
Professora Marlene Salgado de Oliveira
Reitora
Estatística Aplicada
Estatística Aplicada
Sumário
1. Apresentação da disciplina ....................................................................................... 07
2. Plano da disciplina ..................................................................................................... 09
3. Unidade 1 – Elementos de Estatísticas Descritiva.................................................. 11
4. Unidade 2 – Representação Gráfica ......................................................................... 49
5. Unidade 3 – Medidas de Tendência Central ........................................................... 63
6. Unidade 4 – Medidas de Dispersão ........................................................................ 85
7. Unidade 5 – Noções de Amostragem ..................................................................... 103
8. Unidade 6 – Cálculo das Probabilidades. ................................................................ 121
9. Unidade 7 – Distribuição . ......................................................................................... 141
10. Unidade 8 – Correlação e Regressão. ...................................................................... 171
11. Considerações finais .................................................................................................. 187
12. Conhecendo o autor .................................................................................................. 189
13. Referências .................................................................................................................. 191
14. Anexos ......................................................................................................................... 193
Estatística Aplicada
6
Estatística Aplicada
7
Apresentação da Disciplina
Caro aluno,
Seja bem-vindo à disciplina Estatística Aplicada.
Muitos falam em estatística, mas poucos sabem o que é e para que ela
serve. A estatística é um ramo da matemática aplicada que desempenha um papel
fundamental para a compreensão da realidade. Ela nos fornece métodos para
coleta, organização, análise e interpretação de dados para posterior utilização dos
mesmos em tomada de decisões.
Na Antigüidade, assim como hoje, os povos mantinham um registro
permanente do número de habitantes, nascimentos e óbitos. O que faziam ainda
não tinha nome. A palavra ESTATÍSTICA surgiu na Idade Média, quando as
informações eram tabuladas com finalidades bélicas e tributárias, ou seja, sua
importância maior era servir ao Estado, daí o nome.
A estatística será de grande utilidade para você, pois é uma ferramenta
indispensável não só nos negócios, mas em todas as ciências, afinal de contas, você
poderia imaginar o mundo de hoje sem registros numéricos? Já se deu conta da
facilidade com que "projetamos" o futuro muito antes de ele acontecer? E isso
acontece em todos os ramos da nossa vida.
Assim, desejamos que você realize um ótimo estudo e, lembre-se: a
aprendizagem é infinita! Utilize nossas referências bibliográficas para aprofundar e
engrandecer seus conhecimentos sobre os assuntos aqui estudados, pois isso lhe
acrescentará muito, não só como aluno, mas também como profissional e cidadão.
Tenha um excelente estudo! Sucesso!
Estatística Aplicada
8
Estatística Aplicada
9
Plano da Disciplina
A disciplina Estatística possui objetivos próprios no que diz respeito ao
processo ensino-aprendizagem, desenvolvendo competências e habilidades
necessárias à formação de futuros profissionais que atuarão na sociedadecontemporânea. São objetivos gerais da disciplina: capacitar o aluno para o uso da
metodologia estatística mediante aplicação de técnicas de análise estatística de
dados, de projeção e metodologia de tomada de decisão; utilizar os conceitos e o
conteúdo prático dos Métodos Quantitativos aplicados para o desenvolvimento de
trabalhos pedagógico-científicos e proporcionar melhor aplicabilidade
interdisciplinar durante o exercício do curso.
O conteúdo programático foi divido em oito unidades que abordarão
desde os Elementos da Estatística Descritiva até a Correlação e Regressão.
Seguiremos, agora com a apresentação de cada unidade:
Unidade 1 – Elementos da Estatística Descritiva
Objetivo: identificar conceitos básicos da disciplina; compreender o que é
exatamente a estatística e para que ela serve; interpretar um levantamento
estatístico; conhecer as séries estatísticas; trabalhar os dados estatístico através da
montagem de uma distribuição de freqüências.
Unidade 2 – Representação Gráfica
Objetivo: construir e analisar os gráficos que você tanto conhece e que fazem
parte da sua vida cotidiana.
Unidade 3 – Medidas de Tendência Central
Objetivo: compreender as medidas de tendência central e calculá-las para
dados não agrupados e dados agrupados em classes de freqüências.
Estatística Aplicada
10
Unidade 4 - Medidas de Disperção
Objetivo: compreender as medidas de dispersão, calcular essas medidas para
dados não agrupados e dados agrupados em classes de freqüências.
Unidade 5 - Noções de Amostragem
Objetivo: conhecer mais sobre o cálculo e os tipos de amostra e os métodos
probabilísticos.
Unidade 6 - Cálculo das Probabilidades
Objetivo: caracterizar os experimentos aleatórios; calcular as possibilidades de
acontecimento de tais experimentos, a chance de um evento ocorrer ou não, ou
seja, a probabilidade de sucesso ou insucesso.
Unidade 7- Distribuição de Probabilidade
Objetivo: identificar e calcular problemas relacionados à contagem –
Distribuição Binomial; identificar e calcular problemas relacionados a espaços
amostrais contínuos e às variáveis contínuas – Distribuição Normal.
Unidade 8 – Correlação e Regressão
Objetivo: ajustar uma reta a um conjunto de dados e determinar a equação da
reta que constitui o melhor ajuste; calcular e classificar o grau de correlação
existente entre duas variáveis.
Estatística Aplicada
11
Elementos de Estatística
Descritiva
Conceitos básicos da Estatística
Séries estatísticas
Distribuição de frequências
1
Estatística Aplicada
12
Nesta primeira unidade, estudaremos o que é o método estatístico, bem
como as suas fases. Aprenderemos as definições de variável, população e amostra,
assim como algumas técnicas para o cálculo de uma amostra. Também iremos
estudar as séries estatísticas e a distribuição de frequências .
OBJETIVOS DA UNIDADE:
Identificar conceitos básicos da disciplina.
Compreender o que é exatamente a estatística e para que ela serve.
Interpretar um levantamento estatístico.
Conhecer as séries estatísticas.
Trabalhar os dados estatístico através da montagem de uma distribuição
de frequências.
PLANO DA UNIDADE :
Conceitos básicos da estatística
Séries estatísticas
Distribuição de frequências
Bem-vindo à primeira unidade de estudo
Estatística Aplicada
13
Conceitos Básicos
Estatísticas são feitas todos os dias em jornais e revistas, algumas vezes por
órgãos que não conhecemos e que não sabemos se são confiáveis ou não. O dia-a-
dia de um cidadão está cheio de “armadilhas” espalhadas na mídia de modo a levá-
lo a percorrer caminhos nem sempre corretos. Para não cair nessas “armadilhas”, a
primeira coisa que devemos saber é distinguir os dois tipos de estatística - a que
envolve a contagem pura e simples, como o censo da população, feito de tempos
em tempos pelo IBGE e a calculada por amostragem, como, por exemplo, as
pesquisas sobre a intenção de voto.
A decisão quanto à metodologia a ser utilizada, se recenseamento ou amostra,
vai depender principalmente dos custos e do tempo para apuração dos dados. É
óbvio que o ideal seria consultar toda a população, porém isso custa caro e nem
sempre os recursos existentes são suficientes para isso. Por isso, normalmente
utiliza-se a pesquisa amostral.
Deve-se saber também que há algumas regras básicas empregadas na
"contabilidade" e na generalização dos dados obtidos.
A coleta, a organização, a descrição, o cálculo, a análise e interpretação dos
coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto que a análise e a
interpretação dos dados amostrais, associado a uma margem de incerteza, ficam a
cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, que se fundamenta na teoria da
probabilidade e é muito útil na análise de jogos, entre outros. Por exemplo, não é
preciso provar todas as caixas de bombom produzidas numa fábrica para se saber
se o chocolate é bom. A amostragem nos permite mensurar o que queremos
apenas sobre uma parcela pequena de determinada “população”, denominada
amostra e utilizar essa informação para fazer inferência sobre toda a população.
Estatística Aplicada
14
MÉTODO ESTATÍSTICO
Método: é o meio mais eficaz para atingir determinada meta. Dos métodos
científicos destacamos o método experimental e o método estatístico.
Método Experimental: consiste em manter constante todas as
causas, menos uma, que sofre variação para se observar seus efeitos,
caso existam. Ex: Estudos da Química, Física, etc. Em laboratório é fácil
mantermos constantes, por exemplo, a pressão e variarmos a
temperatura para estudar o efeito dessa variação .
Método Estatístico: diante da impossibilidade de manter as causas
constantes, admitem todas essas causas presentes variando-as,
registrando essas variações e procurando determinar, no resultado final,
que influências cabem a
cada uma delas. Ex.: Quais as causas que definem o preço de uma
mercadoria quando a sua oferta diminui? É um método muito usado nas
ciências sociais, pois seria impossível, no momento da pesquisa, manter
constantes a uniformidade dos salários, o gosto dos consumidores, nível
geral de preços de outros produtos, etc.
FASES DO MÉTODO ESTATÍSTICO
Definição do Problema
O que exatamente se pretende pesquisar? Ou seja, é preciso definir
corretamente o problema.
Estatística Aplicada
15
Planejamento
Como levantar informações ? Que dados deverão ser obtidos? Qual
levantamento a ser utilizado? Censo? Amostragem? Qual é o cronograma de
atividades? Quais são os custos envolvidos no processo?
Coleta
É o registro de dados com um objetivo determinado. A coleta de dados pode ser
Direta ou Indireta.
Coleta Direta: é feita pelo próprio pesquisador (censo) ou através de
registros permanentes quando é obtida diretamente da fonte. Ex:
empresa que realiza uma pesquisa para saber a preferência dos
consumidores pela sua marca. A coleta direta de dados pode ser
classificada quanto ao fator tempo em contínua, periódica ou ocasional.
Coleta Contínua: quando é feita continuamente. Ex.: registros de
nascimento, óbitos, casamentos;
Coleta Periódica: quando é feita em intervalos constantes de tempo. Ex.:
censo (de 10 em 10 anos);
Coleta Ocasional: quando é feita a fim de atender a uma emergência. Ex.:
coleta de dados epidemiológicos.
Coleta Indireta: é feita por deduções a partir de dados que são
conhecidos, conseguidos pela coleta direta, por analogia, por avaliação,
indícios ou proporcionalização.
Estatística Aplicada
16
Quanto aos dados coletados, ou seja, a matéria-prima sobre a qual iremos
aplicar os métodos estatísticos, eles podem ser primários ou secundários.
Dados primários: quandosão publicados pela própria pessoa
ou organização que os haja recolhido. Ex: tabelas do censo
demográfico do IBGE.
Dados secundários: quando são publicados por outra
organização.
EXEMPLIFICANDO
Quando determinado jornal publica estatísticas referentes ao censo demográfico
extraídas do IBGE.
IMPORTANTE
Trabalhar com fontes primárias é sempre mais seguro!
Crítica
Os dados coletados devem ser cuidadosamente criticados para evitar erros
que possam vir a alterar os resultados. Ex.: numa pesquisa feita numa academia
perguntou-se o peso dos atletas. Resposta: 765 kg. É obvio que houve algum tipo
de erro na coleta do dado, este deve ser, então, descartado.
Estatística Aplicada
17
Apuração
É a organização dos dados obtidos na coleta, através de sua contagem e
agrupamento.
Apresentação dos Dados
Há duas formas de apresentação. A apresentação tabular segundo regras práticas
fixadas pelo Conselho Nacional de Estatística e a apresentação gráfica dos dados.
Uma não exclui a outra.
Análise dos Resultados
Esta é a última fase do método estatístico. Refere-se ao cálculo de medidas e
coeficientes, cuja finalidade principal é descrever o fenômeno (estatística
descritiva).
Nesta etapa obteremos conclusões sobre o todo (população), a partir das
informações fornecidas pela parte que representa o todo (amostra).
População ou Universo Estatístico
É o conjunto total de elementos portadores de pelo menos uma
característica em comum. Ex.: o universo dos alunos de uma escola.
Variáveis
Variável é o conjunto de resultados possíveis de um fenômeno. Ex.: sexo,
cor da pele, idade...Pode ser classificada de variável quantitativa ou variável
qualitativa.
Variável Qualitativa: quando seu valores são expressos por atributos:
sexo, cor da pele,etc.
Estatística Aplicada
18
Variável Quantitativa: quando os dados são de caráter quantitativo, e o
conjunto dos resultados possui uma estrutura numérica, se divide em
variável discreta e variável contínua.
Variável Discreta ou Descontínua: seus valores são expressos
geralmente através de números inteiros não-negativos. Resulta
normalmente de contagens. Ex: número de filhos de um casal - pode
assumir valores como 0; 1; 2; 3;..., mas nunca valores como: 1,5; 3,72; etc.
Variável Contínua: pode assumir qualquer valor entre dois limites, ou
seja, assume valores em um intervalo real. Resulta normalmente de uma
mensuração, ou seja, podem assumir, teoricamente, qualquer valor entre
dois limites. Ex.: temperatura. Normalmente as medições dão origem a
variáveis contínuas e as contagens a variáveis discretas.
Amostragem
Amostra é uma parcela representativa da população que é examinada com o
propósito de tirarmos conclusões sobre essa população. É um subconjunto finito
de uma população. Uma amostra deve ser cuidadosamente planejada a fim de
garantir a menor margem de erro na pesquisa. A margem de erro é um intervalo
controlado dentro do qual podem variar os resultados finais. Nenhum
levantamento estatístico feito por amostragem é perfeito, ou melhor dizendo, um
estudo bem planejado não elimina o erro, apenas o limita.
Estatística Aplicada
19
Para selecionar uma amostra é preciso levar em conta as características de
distribuição física da população, ou seja, algumas áreas têm uma população maior
que outras. É preciso levantar os dados em proporção à densidade populacional
das regiões. Por exemplo, se o objeto de estudo é o tipo de programa de TV mais
assistido, não adianta fazer o estudo apenas em uma turma de escola de educação
infantil, pois o resultado obviamente seria desenho animado. Crianças não
costumam assistir a telejornais ou a filmes da madrugada. Se a pesquisa fosse feita
dessa forma, o resultado não estaria correto.
Assim, no caso de uma população ser composta de 35% de crianças, 40% de
adultos e os outros 25% de idosos, uma amostra dessa população também deve
conter crianças, adultos e idosos na mesma proporção.
Amostragem Casual ou Aleatória Simples
É o processo mais utilizado. Equivale a um sorteio lotérico. Pode ser
realizada da seguinte forma: numera-se a população de 1 a n e sorteando-se, a
seguir, por meio de um dispositivo aleatório qualquer, n números dessa sequência,
que corresponderão aos elementos pertencentes da amostra.
EXEMPLIFICANDO
Obter uma amostra de 10% dos 580 alunos de uma escola:
1º - numeramos os alunos de 1 a 580.
2º - escrevemos os números dos alunos de 1 a 580 em pedaços iguais de papel,
colocamos na urna e após mistura, retiramos, um a um, cinquenta e oito números
que formarão a amostra.
Estatística Aplicada
20
IMPORTANTE
Quando o número de elementos da amostra é muito grande como neste caso,
esse tipo de sorteio é muito trabalhoso. Então, utiliza-se uma tabela de números
aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao
acaso nas linhas e colunas.
Amostragem Proporcional Estratificada:
Quando a população se divide em estratos (subconjuntos da população),
é imprescindível que o sorteio dos elementos da amostra leve em consideração tais
estratos, daí obtemos os elementos da amostra proporcional ao número de
elementos desses estratos.
EXEMPLIFICANDO
Vamos obter uma amostra proporcional estratificada, de 10%, dos pacientes
internados em um SPA. Supondo que sejam 106 mulheres e 54 homens. São,
portanto, dois estratos (sexo masculino e sexo feminino). Logo, temos:
SEXO POPULAÇÃO 10 % AMOSTRA
MASCULINO 54 5,4 5
FEMININO 106 10,6 11
Total 160 16 16
Numeramos, então, os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a
160, mulheres e procedemos o sorteio casual com urna ou tabela de números
aleatórios, que será vista na unidade VII.
Estatística Aplicada
21
IMPORTANTE
No caso da tabela acima, estamos selecionando uma amostra composta por
pessoas, portanto não podemos selecionar 5,4 pessoas do sexo masculino.
Devemos, então, “arredondar” o número 5,4 para um número inteiro, ou seja, 5.
Dúvidas no arredondamento?
Existem duas formas de representar um número quando não podemos
representá-lo com todos os seus dígitos, o truncamento e o arredondamento.
O truncamento - Truncar um número é “quebrá-lo” de acordo com o número de
dígitos que queremos representar.
EXEMPLIFICANDO
Representar os números abaixo com apenas dois dígitos.
27,283 → 27
27,575 → 27
27,897 → 27
Em todos os casos o número será representado da mesma forma, não
importando o tamanho do erro.
Erro- Toda vez que um número não é representado com todos os seus
algarismos, estamos cometendo um erro. Por exemplo: ao aproximarmos o
número 2,7 para 3 estamos aumentando esse número em 0,3 (erro!), ou então, ao
aproximarmos o número 2,2 para 2 estamos diminuindo esse número em 0,2
(erro!). O erro cometido deve ser o menor possível!!!
Estatística Aplicada
22
Arredondamento - Para arredondar um número, devemos seguir a seguinte
regra: Observe o primeiro algarismo que será “descartado”. Se esse algarismo for 0,
1, 2, 3 ou 4 mantemos a mesma ordem. Se esse algarismo for 5, 6, 7, 8 ou 9,
aumentamos a ordem em 1.
EXEMPLIFICANDO
Arredondar os números abaixo para duas casas decimais.
2,232 → 2,23
2,235 → 2,24
Amostragem Sistemática:
Quando os elementos da população já se acham ordenados, não há
necessidade de sorteio.
EXEMPLIFICANDO
Suponhamos um prédio com 200 apartamentos, dos quais desejamos
obter uma amostra formada por 20 apartamentos para uma pesquisa de opinião.
Podemos, neste caso, usar o seguinte procedimento: como 200/20 = 10,
escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro
elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 10 em 10. Assim,suponhamos que o número sorteado fosse 6, a
amostra seria: 6o apartamento, 16o apartamento, 26o apartamento, etc.
Até aqui, vimos como se faz um levantamento estatístico, o que é e para
que serve. Vimos ainda como é selecionada uma amostra e qual a importância
desta.
Veremos agora o que são séries estatísticas
Estatística Aplicada
23
Vamos, então, passo a passo.
Você sabe o que é uma tabela ?
TABELA - É um quadro que resume um conjunto de observações organizados
segundo linhas e coluna
Veja o exemplo de tabela abaixo :
Ex.: Equipamentos existentes, disponíveis ao SUS, por tipo, segundo as grandes
regiões – Brasil - 2002
IMPORTANTE
O lado direito e esquerdo de uma tabela oficial deve ser
aberto.
Na construção das tabelas, devemos colocar:
um traço horizontal ( - ) quando o valor for zero;
Estatística Aplicada
24
três pontos ( ... ) quando não tivermos os dados;
zero ( 0 ) quando o valor for muito pequeno em relação à unidade
utilizada;
um ponto de interrogação quando não tivermos certeza quanto à
exatidão de determinado valor.
Agora que você já sabe o que é uma tabela e como construí-la vamos
conhecer as séries estatísticas .
Série Estatística
É uma tabela que apresenta um conjunto de dados estatísticos em função da
época, local ou espécie.
TIPOS DE SÉRIES ESTATÍSITICAS
SÉRIES HOMÓGRADAS
São as séries em que a variável estudada é discreta, ou seja, não contínua.
Pode ser temporal, geográfica ou específica.
Série Temporal: o que está em estudo é o fator tempo. O local e a
espécie são elementos fixos.
Estatística Aplicada
25
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS
PERÍODO UNIDADES
1O/2002 300
2O/2002 250
1O/2003 225
2O/2003 289
1O/2004 352
2O/2004 458
TOTAL 1874
Fonte: dados fictícios.
Série Geográfica: o que está em estudo é o fator geográfico. A
época e a espécie são elementos fixos.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS - 2004
FILIAIS UNIDADES
São Paulo 356
Rio de Janeiro 229
Curitiba 225
TOTAL 810
Fonte: dados fictícios.
Série Específica: a variável em estudo é o fator ou a espécie.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS - 2004
TIPO UNIDADES
ARTEFATOS EM BRONZE 365
TELAS 445
TOTAL 810
Fonte: dados fictícios.
Estatística Aplicada
26
SÉRIES CONJUGADAS OU TABELAS DE DUPLA ENTRADA: apresentam duas ou
mais séries em uma mesma tabela, havendo duas ordens de classificação: uma
horizontal e outra vertical. O exemplo abaixo é de uma série geográfica temporal.
ARTE E COMÉRCIO LTDA
UNIDADES EXPORTADAS
FILIAIS 2003 2004
São Paulo 236 356
Rio de Janeiro 153 229
Curitiba 125 225
TOTAL 514 810
Fonte: dados fictícios.
Conhecidas as séries estatísticas, vamos estudar agora a distribuição de
frequências, em que aprenderemos a organizar os dados coletados através ou não
da amostra, faremos também uma breve revisão de como calcular porcentagem.
Vamos em frente !
Mas, afinal, o que é uma distribuição de frequências?
A distribuição de frequências é um tipo de tabela que condensa uma
série de dados de acordo com a repetição de seus valores (frequências).
Estatística Aplicada
27
1. Dados brutos ou Tabela primitiva
Trata-se de uma relação de elementos ou tabela que não foram
numericamente organizados. São os dados coletados sem nenhuma arrumação.
Apenas olhando para os números, é difícil ter uma ideia do comportamento da
amostra. Não sabemos, por exemplo, quem é o menor, quem é o maior, quais são
os números que mais se repetem, etc.
EX.: 25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31
2. ROL
Se olharmos no dicionário veremos como definição que o rol é a relação
obtida após a ordenação dos dados (crescente ou decrescente). Ordenando os
dados podemos ter uma ideia melhor do comportamento da amostra.
Percebemos, desta forma, os dados que mais se repetem, os que aparecem menos,
quem é o menor deles e quem é o maior, etc.
EX.: 21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40
3. Os tipos de distribuição de freqüência
Distribuição de frequência sem intervalos de classe
Essa distribuição é usada quando o número de dados diferentes que aparecem
é pequeno. Trata-se de uma simples condensação dos dados, conforme as
repetições de seu valores. No exemplo dado, ao invés de escrevermos o número 21
três vezes, escrevemos apenas uma e indicamos que ele se repete três vezes, ou
seja, a frequência do número 21 é igual a três.
Estatística Aplicada
28
EX.: Tabela Primitiva
Distribuição de frequência com
intervalos de classe
Quando o tamanho da amostra é grande, com vários números diferentes se
repetindo, uma tabela de distribuição de frequências como a vista acima seria
muito longa (comprida). Dessa forma, agrupamos os valores em vários intervalos
de classe, diminuindo o tamanho da tabela.
Dados Frequência
21 3
22 2
23 1
24 1
25 1
26 2
30 2
31 1
32 1
34 1
37 1
38 2
40 2
Total 20
Estatística Aplicada
29
No exemplo dado, temos:
i Classes Frequências
1 21 | 25 7
2 25 | 29 3
3 29 | 33 4
4 33 | 37 1
5 37 | 41 5
Total 20
Como você já deve ter percebido, a Estatística utiliza alguns nomes que talvez
lhe sejam desconhecidos. Mas, a partir de agora, com certeza, você os aprenderá.
Afinal de contas, é para isto que estamos aqui: para ensinar e também aprender!
NOMECLATURAS
CLASSE (i)
É cada um dos intervalos de variação da variável analisada. Ex.: na tabela
anterior, a 3ª classe, simbolizada por i = 3, varia de 29 até 33, ou seja, (29 | 33). O
símbolo | significa intervalo aberto à direita e fechado à esquerda, ou seja, nessa
classe estão contidos os valores de 29 (inclusive) até 33 (exclusive). Por exemplo,
dado o número 33 do ROL, este não pertence a classe 3 e sim a classe 4
representada por 33 | 37. Sempre utilizaremos o intervalo fechado à esquerda e
aberto à direita.
Estatística Aplicada
30
4.2. LIMITES DE CLASSE
Os limites de classe são os extremos de cada classe. O menor número é o
limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ).
No intervalo 29 | 33, l3 = 29 e L3 = 33.
4.3. AMPLITUDES
Aqui, podemos citar a amplitude do intervalo de classe, a amplitude
amostral e amplitude total da distribuição. Vejamos, então, cada uma delas.
AMPLITUDE DO INTERVALO DE CLASSE (hi)
É calculado após conhecermos o valor de i (nº de classes) e o valor de AA
(amplitude amostral).
i
AA
hi
Se a distribuição por classes já estiver construída, nesse caso, hi = Li - li, ou
seja, a diferença entre os limites de cada classe.
Ex.: na tabela anterior.
h1 = 25-21=4
h2 = 29-25=4
h3 = 33-29=4
h4 = 37-33=4
h5 = 41-37=4
IMPORTANTE
Na distribuição de frequência com classe, devemos sempre que
possível ter hi igual em todas as classes.
Estatística Aplicada
31
AMPLITUDE AMOSTRAL (AA = Xmáx - Xmin)
Trata-se da diferença entre o valor máximo e o valor mínimo da amostra
(ROL). No nosso exemplo: AA=40-21=19.
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT = L(max) - l(min))
É a diferença entre o limite superior da última classe e o limite inferior da
primeira classe.
EX.: na tabela anterior, AT = 41 - 21= 20.
Obs.: AT sempre será maior ou igual a AA.
PONTO MÉDIO DE CLASSE
2
ii
i
Ll
x
O ponto médio de classe é o ponto que divide o intervalo de classe em
duas partes iguais.
EX.: considerea 3ª classe da tabela em 29 | 33, o ponto médio x3 = (29+33)/2 =
31.
IMPORTANTE
O ponto médio será de suma importância para o cálculo da média, pois,
como dito anteriormente, na tabela organizada com intervalos de classe, não
sabemos mais, exatamente, quais são os valores representados em cada
Estatística Aplicada
32
intervalo. Assim, consideraremos esses valores como sendo o ponto médio
dos intervalos para que o erro seja o menor possível.
Cálculo do número de intervalos de classe
Podemos calcular o número de intervalos de classe de duas formas: pela Regra
de Sturges ou pela raiz quadrada de n.
DICA
Regra de Sturges - Número de Classes
Para determinar o número de classes ideal de uma distribuição, utiliza-se a
Regra de Sturges, de acordo com o tamanho da amostra.
i 1 + 3,3 log.n
Onde n é o número de elementos da relação de dados brutos. Para o exemplo
dado, temos:
i 1 + 3,3 log20 = 5,29 5.
i Classes Frequências
1 21 | 25 7
2 25 | 29 3
3 29 | 33 4
4 33 | 37 1
5 37 | 41 5
Total 20
DICA
Se você não possui uma calculadora científica para calcular o valor do
logaritmo de n, busque nos anexos os respectivos valores.
Estatística Aplicada
33
Regra da Raiz Quadrada de n - Número de Classes
Para determinar o número de classes ideal de uma distribuição, utiliza-se
a regra da Raiz Quadrada de n, de acordo com o tamanho da amostra.
i n
Onde n é o número de elementos da relação de dados brutos. Para o exemplo
dado, temos: i 20 = 4,47 4.
DICA
Valores da raiz de n encontram-se previamente calculados nos anexos.
i Classes Frequências
1 21 | 26 8
2 26 | 31 4
3 31 | 36 3
4 36 | 41 5
Total 20
Se i=4 deve-se calcular o novo hi.
Ex.: na tabela anterior.
h1= 26-21=5
h2= 31-26=5
h3= 36-31=5
h4= 41-36=5
Estatística Aplicada
34
Na tabela de distribuição de frequências sem intervalo de classes tínhamos um
total de treze linhas com dados obtidos, já na tabela com intervalos de classe,
apenas 5 ou 4 de acordo com a regra que for utilizada. Apesar de ser uma tabela
mais “legível”, a precisão dos valores se perde um pouco, pois não sabemos mais
quais são exatamente os sete números que aparecem no primeiro intervalo de
classe, por exemplo. Mesmo assim, é a tabela mais usada, pois num levantamento
de grande porte, seria inviável e incompreensível trabalharmos com os inúmeros
valores que aparecem.
Para a construção de uma tabela de distribuição de frequências com intervalos
de classe, é muito importante o cálculo do número de intervalos de classe ou pela
regra de Sturges ou pela raiz quadrada de n. Qualquer regra para determinação do
número de intervalos de classes não determina com exatidão o valor de i, mas dá
ao pesquisador uma noção do tamanho da tabela. Cabe ao pesquisador decidir
com quantos intervalos de classe irá trabalhar. Na verdade, o número de intervalos
de classe vai depender do tipo de dado que está sendo trabalhado. Por exemplo, se
os dados referirem-se às notas de uma prova, talvez seja conveniente que os
arrumemos em intervalos de 1 em 1 para que possamos ter uma ideia do número
de alunos aprovados (nota maior que sete), o número de alunos em recuperação
(nota entre quatro e sete) e o número de alunos reprovados (nota inferior a quatro).
Para construção de uma Distribuição de Frequências c/ intervalos de Classes
devemos seguir os seguintes passos ( roteiro ):
1º passo - Organize os dados brutos em um ROL.
Dados Brutos:
25, 21, 22, 21, 22, 23, 24, 21 ,30, 26, 30, 26, 40, 34, 32, 38, 37, 38, 40, 31
Rol:
21, 21, 21, 22, 22, 23, 24, 25, 26, 26, 30, 30, 31, 32, 34, 37, 38, 38, 40, 40
Estatística Aplicada
35
2º passo - Calcule a amplitude amostral AA (maior valor da amostra menos o
menor).
AA = 40 - 21 = 19
3º passo - Calcule o número de classes através da "Regra de Sturges" ou
da raiz quadrada de n.
i 1 + 3,3 log20 = 5,29 5 ou i n = 20 =4,47 4
IMPORTANTE
O número de intervalos de classe pode ser diferente se calculado por uma
regra ou por outra. Cabe ao pesquisador definir o número de intervalos de classe
com que irá trabalhar.
4º passo - Calcule a amplitude dos intervalos de classe (amplitude amostral
dividida pelo número de intervalos de classe).
hi = AA/i = 19/5 = 3,8 4
No caso de termos que arredondar o valor de hi, este deve ser
arredondado sempre para mais para que haja folga na última classe, no contrário
corre-se o
risco de a tabela montada não incluir o último valor, e nenhum valor pode ser
descartado.
i Classes
1
2
3
4
5
Estatística Aplicada
36
5º passo - Montemos, então, a tabela. O menor número da amostra será o
limite inferior do 1º intervalo de classe e de h em h, no nosso exemplo, de 4 em 4,
montamos, então, os limites de todos os intervalos de classe. O primeiro elemento
das classes seguintes sempre será formado pelo último elemento da classe
anterior.
6o passo - Agora é só marcar quantos números temos em cada intervalo de
classe. A maneira mais simples de fazer é através de marcações da seguinte forma:
lemos o primeiro número e identificamos qual a classe a que ele pertence.
Identificada a classe, riscamos o número e o marcamos na classe a que ele
pertence.
i Classes Marcação Frequências
1 21 | 25 /////// 7
2 25 | 29 /// 3
3 29 | 33 //// 4
4 33 | 37 / 1
5 37 | 41 ///// 5
Total 20
i Classes
1 21 | 25
2 25 | 29
3 29 | 33
4 33 | 37
5 37 | 41
Estatística Aplicada
37
Agora é só apagar a coluna de marcação e está pronta a tabela!
i Classes Frequências
1 21 | 25 7
2 25 | 29 3
3 29 | 33 4
4 33 | 37 1
5 37 | 41 5
Total 20
DADOS ABSOLUTOS E DADOS RELATIVOS
Os dados absolutos são os resultantes da coleta direta da fonte, sem outra
manipulação senão a contagem ou medida. Já os dados relativos são razões que se
estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades. Os dados relativos são de fácil compreensão.
Como o nome mesmo diz, relativo, em relação a.
Porcentagem
As porcentagens são partes proporcionais calculadas sobre cem unidades. O
emprego da porcentagem é de suma importância quando o intuito é destacar a
participação da parte no todo.
Estatística Aplicada
38
Exemplo:
Considere a série:
Clínica A - 2005
Número de Pacientes Atendidos no Mês de Março por Setor
Setor Número de pacientes
Pediatria 225
Alergologia 175
Radiologia 135
Total 535
Fonte: Dados Fictícios.
Porcentagens dos pacientes atendidos em cada setor:
Pediatria: %06,42
535
100225
42%
Alergologia: %71,32
535
100175
33%
Radiologia: %23,25
535
100135
25%
Podemos inserir esses dados na nossa tabela através de uma nova coluna:
Clínica A - 2005
Número de pacientes atendidos no mês de março por setor
Setor Número de pacientes %
Pediatria 225 42
Alergologia 175 33
Radiologia 135 25
Total 535 100
Fonte: Dados Fictícios.
Estatística Aplicada
39
TIPOS DE FREQUÊNCIAS
Frequência Simples ou Absoluta (fi) - É o número de observações
correspondentes a uma classe ou a um valor.
Frequência Simples Relativa (fri) - É o número de observações de um valor
ou de uma classe, em relação ao número total de observações.
Em porcentagens temos:
n
f
f iri
100
%
ou 100% riri ff
Obs.: a soma das frequências relativas é sempre igual a 1 ou 100%. Devido a erros
de arredondamento pode acontecer de o somatório das frequências relativas dar
diferente de 1 ou 100%. Por exemplo: %8,99rif ou
%02,100rif Se isso acontecer, devemos retirar ou acrescentar a
diferença no intervalo de maior frequência, pois dessa forma cometeremos um erro
menor do que cometeríamos se alterássemos o intervalo de menor frequência. O
ideal é trabalharmos com pelo menos 4 casas após a vírgula.
n
f
f iri
Estatística Aplicada
40
Frequências Acumuladas (Fi.)
É a soma das frequências anteriores até a classe ou valor inclusive. Na
tabela mais a frente, quantas pessoas tiraram nota até o limite superior do
intervalo?
Frequência Acumulada Relativa (Fri)
Trata-se da frequência acumulada de uma classe dividida pela frequência
total. Podemos, ainda, representá-la em valores percentuais multiplicando a
frequência acumulada relativa por 100. No exemplo abaixo, qual o percentual das
notas até o limite superior do intervalo?
Exemplo: notas de um teste de estatística aplicado em uma turma do curso de
Nutrição.
No exemplo abaixo, temos as frequências simples (absoluta - fi ; relativa - fri e
relativa percentual - fri %).
i Notas fi fri fri %
1
2
3
4
5
18 ├─ 34
34 ├─ 50
50 ├─ 66
66 ├─ 82
82 ├─ 98
2
5
3
8
2
2/20=0,10
5/20=0,25
3/20=0,15
8/20=0,40
2/20=0,10
10
25
15
40
10
- Σ 20 1 100
Estatística Aplicada
41
No exemplo a seguir, temos as frequências acumuladas (acumuladas – Fi;
acumulada relativa – Fri e acumulada relativa percentual – Fri%).
i Notas fi Fi Fri Fri %
1
2
3
4
5
18 ├─ 34
34 ├─ 50
50 ├─ 66
66 ├─ 82
82 ├─ 98
2
5
3
8
2
2
7
10
18
20
2/20=0,10
7/20=0,35
10/20=0,50
18/20=0,90
20/20=1
10
35
50
90
100
- Σ 20 - - -
No exemplo seguinte, vamos calcular também para completarmos o cálculo da
distribuição de frequências, o ponto médio – xi.
NOTAS DE UM TESTE DE ESTATÍSTICA APLICADO EM UMA TURMA DO
CURSO DE NUTRIÇÃO.
i Notas fi xi
1
2
3
4
5
18 ├─ 34
34 ├─ 50
50 ├─ 66
66 ├─ 82
82 ├─ 98
2
5
3
8
2
18+34/2 = 26
34+50/2 = 42
50+66/2 = 58
66+82/2 = 74
82+98/2 = 90
- - Σ20 -
i Notas fi xi fri fri % Fi Fri Fri %
1
2
3
4
5
18 ├─ 34
34 ├─ 50
50 ├─ 66
66 ├─ 82
82 ├─ 98
2
5
3
8
2
26
42
58
74
90
2/20=0,10
5/20=0,25
3/20=0,15
8/20=0,40
2/20=0,10
10
25
15
40
10
2
7
10
18
20
2/20=0,10
7/20=0,35
10/20=0,50
18/20=0,90
20/20=1
10
35
50
90
100
- Σ 20 - 1 100 - - -
Estatística Aplicada
42
Onde:
fi → Frequência simples absoluta.
xi → Ponto médio de uma classe.
fri → Frequência relativa.
Fi → Frequência acumulada.
Fri → Frequência acumulada relativa .
Chegamos ao fim da unidade I, onde estudamos os elementos da Estatística
descritiva. Espero que você tenha gostado .Vamos em frente.
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Na próxima unidade estudaremos os gráficos Estatísticos . Vamos lá.
Estatística Aplicada
43
Exercícios - Unidade 1
1. Classifique as variáveis em qualitativa e quantitativa.
( ) Cor preferida.
( ) Índice de liquidez.
( ) Sexo.
a) qualitativa, qualitativa, quantitativa.
b) quantitativa, quantitativa, qualitativa.
c) quantitativa , qualitativa, quantitativa.
d) qualitativa, qualitativa, qualitativa.
e) qualitativa, quantitativa, qualitativa .
2. Classifique as variáveis quantitativas em contínuas (c) ou discretas (d).
( ) População: atletas
Variável: altura
( ) P.: pacientes de um hospital
Variável: pacientes com insuficiência cardíaca.
( ) P.: bebês monitorados em uma UTI neonatal
Variável: peso
a) contínua, contínua, contínua.
b) contínua, discreta, contínua.
c) contínua, discreta, discreta.
d) discreta, contínua, contínua.
e) discreta,discreta, contínua.
Estatística Aplicada
44
3. Em uma escola de ensino médio, há 300 alunos divididos em 6 turmas, como no
quadro abaixo. Selecionando uma amostra de 12% dessa população, acharemos o
seguinte número:
a) 10
b) 36
c) 40
d) 12
e) 20
4. São fases do método estatístico:
1. A apuração.
2. A coleta.
3. A crítica.
4. A definição do problema.
5. O planejamento.
Qual a ordem correta dessas fases?
a. 1, 2, 3, 4, 5
b. 4, 5, 2, 3, 1
c. 5, 4, 3, 2, 1
d. 4, 3, 5, 2, 1
e. 4, 5, 3, 1, 2
População
TURMA MENINOS MENINAS
1001 25 20
1002 30 25
2001 29 28
2002 32 15
3001 26 22
3002 23 25
TOTAL 165 135
Estatística Aplicada
45
5. Considere a série abaixo. Podemos classificá-la em:
Cidade AAA
Ano Número de Habitantes
1999 1.125.235
2000 2.365.128
2001 2.535.548
2003 2.874.100
2004 3.258.003
2005 3.356.259
a) Geográfica.
b) Categórica.
c) Específica.
d) Ocasional.
e) Temporal.
6. Os dados abaixo se referem a uma série:
Programa preferido N.º de entrevistados
novela 35
telejornal 15
desenho 10
filme 27
esporte 15
a) Temporal.
b) Geográfica.
c) Periódica.
d) Específica.
e) Histórica.
Estatística Aplicada
46
7. Uma população encontra-se dividida em três estratos de tamanhos,
respectivamente, e1=400, e2=350 e e3=225. Retirando 50 elementos do 3º estrato, a
proporção encontrada neste estrato deve ser aplicada aos estratos 1 e 2. No total,
quantos elementos serão retirados dos três estratos?
a) 292 elementos.
b) 705 elementos.
c) 207 elementos.
d) 755 elementos.
e) 217 elementos.
8. Identifique o item errado:
a) A coleta periódica é aquela feita em intervalos constantes de tempo.
b) A coleta ocasional é feita a fim de atender a uma emergência.
c) A coleta direta de dados pode ser classificada quanto ao fator tempo em
contínua, periódica ou ocasional.
d) Os registros de casamentos são exemplos de coleta periódica.
e) A coleta contínua é aquela feita continuamente.
9- Considerando as notas de estatística de uma turma de 80 alunos:
6,4 7,8 7,3 8,7 9,5 8,2 8,9 8,1 9,0 7,8
6,6 8,2 8,6 9,2 8,5 8,0 7,3 8,5 9,6 7,6
1,3 7,4 8,6 1,1 7,8 8,6 7,0 6,8 7,4 9,4
9,8 9,9 8,5 9,0 8,6 8,2 8,7 7,0 7,2 7,5
7,3 7,5 7,8 8,4 8,6 7,2 8,5 8,6 9,9 6,7
7,6 7,6 8,3 3,3 8,5 8,1 8,1 8,9 7,1 9,5
8,6 8,4 8,0 4,2 9,0 9,3 9,6 8,1 6,3 8,8
8,5 7,6 9,2 7,3 3,3 7,9 8,1 8,4 7,3 6,2
Forme uma distribuição de frequência com intervalos de classe seguindo o que se pede:
a) Calcule a amplitude amostral.
b) Calcule o número de classes através da "Regra de Sturges".
Estatística Aplicada
47
c) Calcule a amplitude dos intervalos de classe.
d) Calcule as frequências de cada um dos intervalos de classe.
e) Monte a tabela.
Estatística Aplicada
48
10. Complete a distribuição de frequências abaixo:
Classes fi fri fri (%) Fi xi
10 | 14 14 15
| 12 25
| 12 35
| 0,14 39 45
| 55
| 70 1 0,02 2 50 65
1,00 - -
Estatística Aplicada
49
Gráfico em linha Curva.
Gráficos em barra vertical.
Gráficos em barra horizontal.
Gráficos de setores.
Cartogramas.
Histograma.
Polígono de Frequência.
Ogivograma.
Ogiva de Galton.
2 Representação Gráfica
Estatística Aplicada
50
Esta é uma unidade importante para o entendimento da estatística, pois
grande parte dos dados estatísticos são apresentados através de gráficos. Nela
aprenderemos a montar e a interpretar alguns dos gráficos mais utilizados e os
gráficos estatísticos específicos. Esperamos que vocês gostem.
OBJETIVO DA UNIDADE :
Construir e analisar os gráficos que você tanto conhece e que
fazem parte da sua vida cotidiana.
PLANO DA UNIDADE :
Gráfico em linha Curva.
Gráficos em barra vertical.
Gráficosem barra horizontal.
Gráficos de setores.
Cartogramas.
Histograma.
Polígono de Frequência.
Ogivograma.
Ogiva de Galton.
Bons estudos!
Estatística Aplicada
51
Os gráficos são representações visuais dos dados estatísticos e não substituem
as tabelas. Devem corresponder aos dados de uma forma simples, clara e objetiva.
DICA
Muito cuidado com os gráficos, pois se mal elaborados podem trazer uma
ideia falsa dos dados que estão sendo analisados, chegando mesmo a
confundir o leitor.
Por falar gráficos, quais você conhece? Você sabe qual é a funcionalidade
deles? Vejamos então.
Alguns Tipos de Gráficos
Gráfico em linha ou curva
Estatística Aplicada
52
Estes gráficos são frequentemente usados para a representação de séries
cronológicas com um grande número de períodos. Nos dão uma visualização clara
da variação dos dados existentes nas séries. Também são ideais quando há
necessidade de se representarem várias séries em um mesmo gráfico.
Gráficos em barras verticais (coluna).
Gráficos em barras horizontais.
Estatística Aplicada
53
Quando as legendas são longas usa-se de preferência os gráficos em barras
horizontais. Os retângulos (barras) têm a mesma base e as alturas são
proporcionais aos respectivos dados.
Gráficos em setores
Estes gráficos são construídos em uma circunferência e empregados sempre
que desejamos ressaltar a participação do dado no total. O total é representado
pelos 360 graus de um círculo, que fica dividido em tantos setores quantas são as
partes. Os setores são tais que seus ângulos são respectivamente proporcionais aos
dados da série.
DICA
Devemos evitar o gráfico de setores quando tivermos mais de sete dados.
IMPORTANTE
As séries temporais, geralmente, não são representadas por este tipo
de gráfico.
Cartogramas
São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico
é o de figurar os dados estatísticos diretamente relacionados com áreas
geográficas ou políticas.
Estatística Aplicada
54
Histograma
É formado por um conjunto de retângulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam
com os pontos médios dos intervalos de classe. É o gráfico que melhor representa
uma distribuição de frequências com intervalos de classe ( este assunto será
abordado na unidade 3). No eixo horizontal (eixo x), representamos as classes da
distribuição e no eixo vertical (eixo y), representamos as frequências. A área de um
histograma é proporcional à soma das frequências simples ou absolutas.
IMPORTANTE
O histograma assemelha-se ao gráfico de colunas, a diferença é que não há
espaçamento entre as colunas.
Estatística Aplicada
55
Polígono de frequência
É um gráfico em linha, sendo as frequências marcadas sobre perpendiculares
ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para
realmente obtermos um polígono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos médios da classe anterior à
primeira e da posterior à última da distribuição.
Ogivograma
É o gráfico de frequências acumuladas. Ele é construído da mesma forma que
o histograma, porém no eixo vertical (eixo y), representaremos as frequências
acumuladas.
Estatística Aplicada
56
Ogiva de galton
A Ogiva de Galton ou polígono de frequência acumulada é um gráfico de
linhas traçado marcando-se as frequências acumuladas sobre perpendiculares ao
eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos
intervalos de classe.
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Nessa unidade, vimos os principais e os mais importantes gráficos estatísticos.
Com uma ferramenta computacional é muito simples representar dados
graficamente. Na próxima unidade veremos as medidas de tendência central.
Estatística Aplicada
57
Exercícios - Unidade 2
1. Considere a tabela abaixo que representa as idades de vinte duas crianças
atendidas em um posto de saúde do município de Itaboraí. Ao construir o gráfico
de setores relativo à tabela dada, o setor correspondente à classe 3 será de
aproximadamente:
Idade 0 1 2 3 4 5
Crianças 4 3 6 3 0 6 22
a) 6o
b) 16,6o
c) 30º
d) 20o
e) 98º
2. Na administração de uma empresa, 50% do orçamento vai para a compra de
equipamentos, 22% para a manutenção e 28% para pagamento de pessoal. O
gráfico que melhor representa essa situação é:
a) o de barras.
b) o de setores.
c) o linear simples.
d) o de colunas.
e) o de barras múltiplas.
Estatística Aplicada
58
3. O gráfico estatístico designado a representar a série abaixo chama-se:
Nota fi
1├─ 3
3├─ 5
5├─ 7
7├─ 9
3
5
9
8
Σ 25
a) Cronograma.
b) Gráfico de colunas compostas.
c) Histograma.
d) Gráfico de colunas.
e) Gráfico de barras.
4. Gráficos são instrumentos úteis na estatística. Assinale a afirmação incorreta:
a. Um histograma é um gráfico de linhas.
b. O gráfico de setores é apropriado quando se quer representar as divisões
de um montante total.
c. Um polígono de frequências acumuladas é construído unindo-se os
pontos correspondentes aos limites superiores dos intervalos de classe
da distribuição de frequência.
Estatística Aplicada
59
d. Um polígono de frequências é construído unindo-se os pontos
correspondentes aos pontos médios dos intervalos de classes.
e. O gráfico de barras é usado para séries geográficas.
5. Observe a série abaixo. O gráfico que melhor representa tal série é:
Ano Número de Infectados pela Doença AXZ
2000 2.236.215
2001 2.126.128
2002 2.035.265
2003 1.958.254
2004 1.532.126
2005 1.125.258
a) O gráfico de linhas.
b) O histograma.
c) O gráfico de setores.
d) O cartograma.
e) O pictograma.
6- Assinale a alternativa correta.
a) O histograma assemelha-se ao gráfico de barras, a diferença é que não há
espaçamento entre as barras.
b) O histograma assemelha-se ao gráfico de colunas, a diferença é que não
há espaçamento entre as colunas.
c) O histograma assemelha-se ao gráfico de setores, a diferença é que não
há espaçamento entre os setores.
Estatística Aplicada
60
d) O histograma assemelha-se ao gráfico de linhas, a diferença é que não há
espaçamento entre as linhas.
e) O histograma assemelha-se ao ogivograma, a diferença é que não há
espaçamento entre as linhas.
7. Assinale a alternativa verdadeira.
a) O gráfico que melhor representa uma série histórica é o gráfico de setores
de barras.
b) Um polígono de frequências é construído unindo-se os pontos
correspondentes aos limites inferiores dos intervalos de classe da
distribuição de frequência.
c) Um polígono de frequências acumuladas é construído unindo-se os
pontos correspondentes aos limites superiores dos intervalos de classe da
distribuição de frequência.
d) O gráfico de linhas é usado quando queremos destacar uma parte do
todo.
e) O gráfico que melhor representa uma distribuição de frequências é o
gráfico de barras.
8) O que podemos afirmar sobre o Polígono de Frequências? Assinale a alternativa
correta:
a) É formado por linhas que ligam ponto a ponto.
b) É formado por colunas simples.
c) É um gráfico em linha, sendo as frequências marcadas sobre
perpendiculares ao eixo horizontal, levantadas pelos pontos médios
dos intervalos de classes.
Estatística Aplicada
61
d) É formado por um conjunto de retângulos, um colado ao outro, cujas
bases se localizam sobre o eixo horizontal.e) É uma linha poligonal aberta.
9. Os gráficos abaixo mostram o perfil dos doentes de Aids no Brasil. Faça um breve
comentário sobre o assunto, levando em consideração os dados contidos nos
gráficos.
Estatística Aplicada
62
10. A distribuição a seguir indica o número de dias afastados por motivo de doença
de 40 funcionários de uma empresa alimentícia durante o período de um ano.
No de dias afastados 1 2 3 4 5 6 7
No de funcionários 13 7 10 4 3 2 1
a) Construa um gráfico de colunas.
b) Construa um gráfico de setores.
Estatística Aplicada
63
Medidas de Tendência
Central 3
Média Aritmética.
Moda.
Mediana.
Estatística Aplicada
64
Estudaremos aqui três tipos de medidas de tendência central: média
aritmética, moda e mediana. Essas medidas servem para visualizarmos a
distribuição de frequências no eixo de variação da variável estudada.
OBJETIVOS DA UNIDADE:
Compreender as medidas de tendência central e calculá-las para
dados não agrupados e dados agrupados em classes de frequências.
PLANO DA UNIDADE:
Média Aritmética.
Moda.
Mediana.
Bons estudos!
Estatística Aplicada
65
As Medidas de Posição ou Tendência Central são denominadas dessa forma
devido aos dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais. As outras medidas de posição são as separatrizes, que englobam
a própria mediana, os decis, os quartis e os percentis.
Média Aritmética
A Média Aritmética ( X ) é a medida de posição que possui maior
estabilidade e é igual ao quociente entre a soma dos valores da variável e o
número total de observações. Veja, abaixo, a fórmula:
n
x
n
xxx
X
n
i
i
n
121
...
Em que xi são os valores da variável e n o número de observações.
Para dados não agrupados a Média Aritmética Simples ( x ) é calculada
da seguinte forma:
EXEMPLIFICANDO
Ex.: Um aluno de determinada instituição de ensino tirou as seguintes
notas em estatística: 7, 10 e 6. Sabendo-se que a nota final desse
aluno é calculada através da média aritmética das três avaliações
feitas no período, temos como média final do aluno:
x1 = 7; x2 = 10 e x3 = 6
7,7
3
6107
X
Estatística Aplicada
66
Em relação aos dados agrupados sem intervalos de classe, consideremos a
distribuição relativa a 38 crianças pacientes de uma clínica pediátrica com idades
entre 0 e 4 anos.
Idades fi
0 2
1 6
2 12
3 14
4 4
Total 38
As frequências representam quantas vezes ocorreu determinada idade, por
exemplo, ao invés de escrevermos 0,0,1,1,1,1,1,1 etc., atribuímos a frequência, logo,
a idade 0 (zero) ocorre duas vezes; a idade 1 ocorre seis vezes e assim por diante. As
frequências funcionam como fatores de ponderação. A média aritmética, nesse
caso, é a média aritmética ponderada, ou seja, em vez de somarmos o número 0
duas vezes, o número 1 seis vezes, o número 2 doze vezes e assim por diante,
ponderamos os valores da variável com suas respectivas frequências. Esta
ponderação é dada pela fórmula:
k
i
i
k
i
ii
k
kk
f
fx
fff
fxfxfx
X
1
1
21
2211
)(
...
...
Obs.:
k
i
if
1
= n, ou seja, a soma das frequências é igual a n.
if = 38, n = 38.
Estatística Aplicada
67
xi fi xi.fi
0 2 0
1 6 6
2 12 24
3 14 42
4 4 16
38 88
A idade média das crianças atendidas na clínica será anosX 3,2
38
88
.
Agora, vejamos os dados agrupados com intervalos de classe. Observe a seguir
as notas de 50 alunos de uma turma de estatística:
Notas fi
0 ├─ 2
2 ├─ 4
4 ├─ 6
6 ├─ 8
8 ├─ 10
7
11
25
12
6
Σ 61
Neste caso não temos como saber se os sete alunos da primeira classe tiveram
notas, por exemplo, zero ou 1,9. Então, para diminuirmos o erro cometido com o
agrupamento, utilizamos como valor representativo de cada intervalo o seu ponto
médio (xi). Utilizamos, então, a mesma fórmula, sendo que xi agora não é mais o
valor da variável e sim o ponto médio de cada classe. A média aritmética é
calculada, então, da seguinte forma:
k
i
i
k
i
ii
f
fx
X
1
1
)(
Estatística Aplicada
68
Em que ix é o ponto médio da classe.
No nosso exemplo: 1
2
20
1
x , 3
2
42
2
x , 5
2
64
3
x ,
7
2
86
4
x , 9
2
108
5
x .
Notas fi
ix ii fx
0 ├─ 2
2 ├─ 4
4 ├─ 6
6 ├─ 8
8 ├─ 10
7
11
25
12
6
1
3
5
7
9
7
33
125
84
54
Σ 61 - 303
9,4
61
5484125337
)(
1
1
k
i
i
k
i
ii
f
fx
X
Outros tipos de médias menos usados são as médias geométrica, harmônica,
quadrática, cúbica e biquadrática.
IMPORTANTE
A média aritmética para a população é denotada por .
Você já ouviu falar em moda? Não, não é bem dessa moda que vamos
falar! É a Moda na Estatística. Vamos estudar sobre ela, agora?
Estatística Aplicada
69
Moda (Mo)
A Moda é o valor que mais aparece em uma série de valores. Você
deve estar se perguntando: Como assim o valor que mais aparece? É isso mesmo!
EXEMPLIFICANDO
Por exemplo: o número de calçado mais vendido em uma sapataria é a moda.
Até os vendedores ambulantes, mesmo sem saber, utilizam-se da moda. De uma
maneira grosseira, podemos nos lembrar daquilo que está na moda, ou seja,
daquilo que mais aparece.
Viu como é simples?
Podemos calcular a Moda para diversos tipos de dados. Veja como fazer isso:
Moda para dados não agrupados
A moda de uma distribuição para dados não agrupados é fácil de ser vista, é só
procurarmos o valor que mais aparece. Uma distribuição pode ter nenhuma
(amodal), uma (unimodal), duas (bimodal) ou mais modas.
Estatística Aplicada
70
EXEMPLIFICANDO
Exemplos:
Na série {6, 7, 9, 11, 11, 11, 12, 12} a moda é igual a 11. A distribuição é
unimodal;
A série {2, 5, 7, 11,12} não possui um número que apareça mais que os
outros. A série é amodal;
A série {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7. A série
é bimodal;
Em outros casos, pode haver três ou mais valores que mais se repetem.
Nesse caso, a série tem três ou mais modas.
Moda para dados agrupados sem intervalos de classe
Uma vez agrupados os dados, a moda é o valor da variável de maior
frequência.
EXEMPLIFICANDO
Ex.: Manequim de roupa feminina mais vendida em uma loja de departamentos:
Manequim Frequência
34 3
36 9
38 16
40 6
42 4
44 1
Resposta: 38 é o manequim modal, pois é o de maior frequência.
Estatística Aplicada
71
Moda para dados agrupados com intervalos de classe
Classe modal é a classe que apresenta a maior frequência. Nesse caso, a moda
está compreendida entre os limites da classe modal. O método mais simples para o
cálculo consiste em tomarmos o ponto médio da classe modal como sendo a
própria moda. A este valor chamamos de moda bruta.
2
** Ll
Mo
Em que l* é o limite inferior da classe modal e L* o limite superior da classe
modal.
EXEMPLIFICANDO
Ex.: Como podemos calcular o peso modal da tabela abaixo?
Peso (kg) fi
45 |— 50 9
50 |— 55 11 Classe modal
55 |— 60 8
60 |— 65 6
65 |— 70 5
Resposta: A classe modal é 50|— 55, pois é a de maior frequência. l2 = 50 e L2 = 55
Mo = 5,52
2
5550
kg
Estatística Aplicada
72
IMPORTANTE
Não temos como saber o real valor da moda, pois não conhecemos mais os
valores que estão compreendidos em um determinado intervalo. Portanto, este
valor é apenas estimado.
Você conhece a fórmula de Czuber? Pois, então conhecerá agora.
Fórmula de CZUBER (processo mais elaborado)
*
21
1 h
DD
D
lM io
Em que:li é o limite inferior da classe modal.
D1 = f* - f(ant)
D2 = f* - f(post)
h* é a amplitude da classe modal.
f* é a frequência simples da classe modal.
f(ant) é a frequência simples da classe anterior à classe modal.
f(post) é a frequência simples da classe posterior à classe modal.
Para o cálculo do peso modal da tabela anterior temos:
kgM o 525811911
911
50
Estatística Aplicada
73
Passemos a estudar, agora, a mediana para dados não-agrupados, agrupados sem
intervalos de classe e agrupados em classes.
Mediana (Md)
A mediana de um conjunto de valores previamente ordenados. É o
valor situado bem no meio do conjunto de valores de tal forma a separá-los em
dois subconjuntos de mesmo número de elementos.
Mediana para dados não-agrupados
Quando o número de valores for ímpar:
EXEMPLIFICANDO
Ex.: Dada uma série de valores {7, 2, 8, 13, 11, 7, 15, 12, 1} o primeiro passo a ser
dado é a construção do rol: {1, 2, 7, 7, 8, 11, 12, 13, 15}.
O valor que divide a série em duas partes iguais é o 8, logo a mediana Md = 8.
Na prática, o valor mediano é dado por 5
2
19
2
1
n
, ou seja, a
mediana será o quinto elemento da série ordenada, que é 8. Md = 8
Quando o número de valores for par:
EXEMPLIFICANDO
Ex.: Calcular a mediana da série {1, 2, 0, 0, 2, 4, 4, 3, 6, 4, 5, 6}
Estatística Aplicada
74
Rol - {0, 0, 1, 2, 2, 3, 4, 4, 4, 5, 6, 6} - Md 5,3
2
43
Temos, aqui, duas observações a serem feitas, por isso preste bastante atenção:
A mediana coincidirá com um dos elementos da série quando o
número de elementos for ímpar. Quando o número de elementos da
série for par, a mediana nunca coincidirá com um dos elementos da
série. Neste caso, a mediana será sempre a média aritmética dos 2
elementos centrais da série;
A média aritmética, a mediana e a moda de uma série de valores
não têm, necessariamente, o mesmo valor.
Mediana para dados agrupados sem intervalos de classe
Neste caso, basta identificarmos a frequência acumulada (Fi) igual ou
imediatamente superior à
2
if
. A mediana será o valor da variável que
corresponder a essa frequência acumulada.
EXEMPLIFICANDO
Ex.: Veja a tabela a seguir:
Estatística Aplicada
75
Xi fi Fi
0 2 2
1 5 7
2 8 15
3 15 30 Classe Mediana
4 5 35
5 4 39
total 39
2
if
= 5,19
2
39
, logo a mediana será Md = 3.
Mediana para dados agrupados em classes
Para esse tipo de dado é preciso determinar a classe da mediana, que será
aquela que corresponder à frequência acumulada igual ou imediatamente superior
à
2
if
.
idades fi FAi
10 ├─ 15 6 6
15 ├─ 20 11 17
20 ├─ 25 16 33 classe mediana
25 ├─ 30 13 46 (frequência acumulada
imediatamente superior
a 27
2
54
30 ├─ 35 5 51
35 ├─ 40 3 54
54 -
Estatística Aplicada
76
A mediana é dada pela fórmula: *
*
)(
.2l h
f
F
f
M
ant
i
id
Em que:
li é o limite inferior da classe mediana.
F(ant) é a frequência acumulada anterior à classe mediana.
f* é a frequência simples da classe mediana.
h* é a amplitude do intervalo da classe mediana.
EXEMPLIFICANDO
Exemplo:
1,235
16
17
2
54
20
Md
IMPORTANTE
Neste caso a mediana é estimada, pois não temos todos os valores da
distribuição.
Qual é a medida que devemos usar?
Todas as médias são valores que estão compreendidos entre o menor e o
maior valor observado. Todas são igualmente importantes, portanto uma não deve
prevalecer sobre a outra. Devemos saber que:
Estatística Aplicada
77
A média aritmética é a mais empregada apenas pelo fato de ser mais
simples o seu cálculo e mais compreensível o seu resultado. É a medida
de posição que possui a maior estabilidade;
A moda será utilizada quando a medida de posição for o valor mais típico
da distribuição. É uma medida de rápida obtenção;
Quando desejamos obter o ponto que divide a distribuição em duas
partes iguais, quando há valores extremos que afetam de maneira
acentuada a média aritmética ou quando a variável em estudo é salário,
usamos a mediana.
A média aritmética de uma série de valores, por exemplo, é influenciável pelos
seus extremos, enquanto que a mediana depende da posição e não dos valores
dos elementos na série ordenada. É por isso que, no caso de séries com extremos
muito distantes, usamos mais a mediana do que a média aritmética, para que não
haja influência dos extremos.
EXEMPLIFICANDO
Ex.: Na série { 8, 9, 10, 15, 18}, a média = 12 e a mediana = 10. Já na série
{6, 8, 10, 11, 75 }, a média = 22 e a mediana = 10.
A média do segundo conjunto de valores é maior do que a do primeiro por
influência do valor extremo (75), porém, nas duas séries, a mediana é a mesma, ou
seja, não adianta analisarmos apenas as médias aritméticas de uma série de
valores, é preciso analisar também a mediana.
Estatística Aplicada
78
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Vimos nesta unidade as medidas de tendência central. A média de um
conjunto de valores ou de uma distribuição de classes é fundamental dentro do
estudo da Estatística. Ela é um dos principais parâmetros de estudo e pesquisas. Na
próxima unidade, veremos as medidas de dispersão – o cálculo dessas medidas nos
permite a verificação de quão representativa é a média de uma distribuição em
relação a todas as suas observações.
Estatística Aplicada
79
Exercícios - Unidade 3
1. Uma empresa possui dois serventes recebendo salários de R$250,00 cada um,
quatro escriturários recebendo R$600,00 cada um, um chefe de escritório com
salário de R$ 1000,00 e três técnicos recebendo R$ 2200,00 cada. A média desses
salários é de:
a. R$ 1050,00
b. R$ 505,00
c. R$ 262,50
d. R$ 600,00
e. R$ 105,00
O quadro abaixo se refere às questões 2 e 3.
A B C
2 0 7
4 2 5
5 8 2
6 9 6
3 3 1
2. As médias aritméticas das sequências A, B e C são, respectivamente:
a. 4,0; 4,4 e 4,2
b. 4,4, 4,2 e 4,0
c. 4,2; 4,0 e 4,4
d. 5,0; 8,0 e 2,0
e. 4,0; 3,0 e 5,0
Estatística Aplicada
80
3. As medianas das sequências A, B e C são, respectivamente:
A B C
2 0 1
3 2 2
4 3 5
5 8 6
6 9 7
a. 4,0; 4,4 e 4,2
b. 4,4, 4,2 e 4,0
c. 4,2; 4,0 e 4,4
d. 5,0; 8,0 e 2,0
e. 4,0; 3,0 e 5,0
O quadro abaixo representa as informações cadastrais de 5(cinco) cidadãos de
ambos os sexos:
Estado
Civil
sexo Grau de
instrução
Número de
filhos
Salários
em S.M *
Idade
Solteiro F 2º Grau 2 4,00 29
Casado F 2º Grau 1 4,56 32
Solteiro M Superior 0 5,75 36
Casado M Superior 4 5,60 40
Solteiro M Superior 3 6,00 28
* o valor correspondente à variável salário representa o número de salário mínimo ( S.M )
Considerando as informações do quadro, marque a alternativa correta.
4) As Medianas das variáveis salário e idade são respectivamente:
a) 28 e 5,75.
b) 5,75 e 36.
c) 5,60 e 32.
d) 32 e 5,0.
e) 32 e 5,75.
Estatística Aplicada
81
A tabela abaixo dá a distribuição de frequências dos salários dos 83 enfermeiros de
um hospital localizado em Rio Claro, por faixa de salário.
Classe de Salários (R$) fi
500 650 15
650 800 18
800 950 23
950 1100 19
1100 1250 8
83
Com base nessas informações da tabela, marque a alternativa correta:
5) Qual o valor modal da distribuição?
Classe de Salários (R$) fi
500 650 15
650 800 18
800 950 23
950 1100 19
1100 1250 8
83
a) R$ 870,55
b) R$ 866,67
c) R$ 883,33
d) R$ 855,43
e) R$ 843,90Estatística Aplicada
82
6) Qual o valor mediano da distribuição?
Classe de Salários (R$) fi FI
500 650 16 16
650 800 19 16 + 19 = 35
800 950 23 35 + 23 = 58
950 1100 19 58 + 19 = 77
1100 1250 8 77 + 8 = 85
85
a) R$ 870,55
b) R$ 848,91
c) R$ 883,33
d) R$ 855,43
e) R$ 843,90
7-Vinte empregados de uma cadeia de hotéis que frequentaram um curso de
atendimento com alegria obtiveram as seguintes notas em uma prova dada ao
final do curso:
17 19 14 20 17 17 12 15 15 16
16 19 18 15 16 16 17 13 14 19
Com base nas notas da tabela acima, responda:
Qual foi a nota média?
a) 16,25
b) 17,28
c) 16,75
d) 19,15
e) 17,26
Estatística Aplicada
83
8) Pesquisa elaborada recentemente revela que, nos últimos anos, o consumo de
cigarros vem aumentando entre as mulheres. Com base nesse estudo, permitiu-se
o esboço de uma tabela de distribuição de frequência, que relaciona a quantidade
de cigarros consumidos diariamente entre 1000 mulheres fumantes. A média
aritmética é, aproximadamente:
CIGARROS CONSUMIDOS DIARIAMENTE FREQUÊNCIA
15 | 20
20 | 25
25 | 30
30 | 35
35 | 40
150
300
250
200
100
Total 1000
(Dados Fictícios)
a) 21,6.
b) 23,5.
c) 24,6.
d) 26,5.
e) 27,6.
9 - Sejam os pesos (kg) de 50 alunos de uma determinada classe:
PESO (kg) f i
40 | 50
50 | 60
60 | 70
70 | 80
80 | 90
4
12
20
12
2
Estatística Aplicada
84
a) Calcule a amplitude total.
10 - Calcule as frequências relativas.
PESO (kg) f i Fr
40 | 50
50 | 60
60 | 70
70 | 80
80 | 90
4
12
20
12
2
4/50 = 0,08
12/50 = 0,24
20/50 = 0,40
12/50 = 0,24
2/50 = 0,04
50 1,00
Estatística Aplicada
85
Medidas de Dispersão 4
Amplitude total.
Variância.
Desvio padrão.
Coeficiente de variação
Estatística Aplicada
86
Estudaremos aqui as medidas de dispersão. Elas permitem calcular a dispersão
(como os dados estão espalhados) existente entre os dados observados, estejam
eles agrupados ou não, em relação à média aritmética.
OBJETIVOS DA UNIDADE:
Compreender as medidas de dispersão, calcular essas medidas, para
dados não agrupados e dados agrupados em classes de frequências.
PLANO DA UNIDADE:
Amplitude total.
Variância.
Desvio padrão.
Coeficiente de variação.
Bons estudos!
Estatística Aplicada
87
A média aritmética, a moda e a mediana são valores representativos do todo,
portanto a obtenção desses valores se faz fundamental no estudo de um conjunto
de valores. Porém, para analisarmos um fenômeno estatístico, não basta obtermos
apenas medidas de posição ou gráficos estatísticos. Para uma análise mais
profunda, devemos saber como esses dados estão distribuídos no todo. As
medidas de variabilidade ou dispersão nos dão exatamente isso. Elas fazem uma
descrição de como os dados estão espalhados no todo. Existem diversas medidas
de dispersão, porém, em nossa disciplina, estudaremos quatro delas, que são:
Amplitude total;
Variância;
Desvio padrão;
Coeficiente de variação;
EXEMPLIFICANDO
Ex.: Observe os seguintes conjuntos de valores referentes à mesma variável:
X = {20, 20, 20, 20, 20}
Y = {05, 15, 20, 30 ,30}
Z = {01, 01, 03, 05, 90}
Estatística Aplicada
88
Os três conjuntos apresentam a mesma média aritmética 20
5
100
x ,
porém é fácil notar que o primeiro conjunto de valores é mais homogêneo que os
outros dois, pois todos os valores são iguais. Já o segundo é mais homogêneo que
o terceiro, pois este é o mais disperso de todos. Portanto não adianta dois ou mais
conjuntos de valores terem a mesma média aritmética, algumas outras análises se
fazem necessárias.
Amplitude Total (AT)
Amplitude Total (AT) é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe, ou seja, é a diferença entre os valores
extremos de um conjunto de dados mínmáx lLAT .
Trata-se da única medida de dispersão que não tem a média como ponto de
referência. A amplitude total é instável, pois só leva em consideração os valores
extremos dos conjuntos de dados, descuidando do conjunto de valores
intermediários, por isso é pouco utilizada.
Uma de suas utilizações é na hora de decidirmos por uma distribuição de
frequência com ou sem intervalos de classes. Fazemos uso da amplitude total
quando queremos determinar a amplitude da temperatura em um dia, por
exemplo, medida de cálculo rápido sem muita exatidão.
EXEMPLIFICANDO
Ex.:
Dada a série 2, 3, 5, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 21, 22, 23, 23, 23, 24, 25, 25, 27, 27,
48, 60 e 70 a amplitude amostral será:
68270 AA
Estatística Aplicada
89
Agrupando os dados sem intervalos de classe:
xi fi
2 1
3 1
5 1
6 1
7 2
8 3
9 3
10 2
21 1
22 1
23 3
24 1
25 2
27 2
48 1
60 1
70 1
∑ 27
Com intervalos de classe:
Classes fi
2|— 14 14
14|—26 8
26|—38 2
38|—50 1
50|—62 1
62|—74 1
Σ 27
72274 mínmáx lLAT
Estatística Aplicada
90
Variância (s2)
A variância mede o grau de variabilidade em torno da média. É a
média aritmética dos quadrados dos desvios (cada valor menos a média). Diferente
da amplitude total que se deixa influenciar pelos extremos, a variância leva em
consideração todos os valores da variável em estudo. Ela baseia-se nos desvios em
torno da média.
Variância Amostral
Para dados isolados:
1
(
1
2
2
n
Xx
s
n
i
i
ix = cada valor observado.
X = média dos valores observados.
n = tamanho da amostra.
Para dados agrupados:
k
i
k
i
fi
fiXxi
s
1
1
2
2
1
.
IMPORTANTE
No denominador da fórmula da variância trabalhamos sempre com n-1
graus de liberdade para diminuir o erro do cálculo da variância com agrupamento
da distribuição.
Estatística Aplicada
91
Em que:
ix = cada valor observado, no caso de dados agrupados com intervalos de classe,
ix é o ponto médio do intervalo de classe.
X = média dos valores observados.
fi = somatório das frequências (n).
fi = frequência de cada classe.
EXEMPLIFICANDO
Ex.: Ao analisarmos as idades dos pacientes atendidos num dia em duas
clínicas de saúde A e B, temos:
Clínica A
5,38
33
1272
X 81,135
133
43462
s
Classes fi i
x ).( ii fx
)( Xxi
2)( Xxi ii fXx .)(
2
02|— 14 1 8 8 -30,5 930,25 930,25
14|—26 3 20 60 -18,5 342,25 1026,75
26|—38 10 32 320 -6,5 42,25 422,5
38|—50 16 44 704 5,5 30,25 484
50|—62 2 56 112 17,5 306,25 612,5
62|—74 1 68 68 29,5 870,25 870,25
33 1272 4346
Estatística Aplicada
92
Clínica B
Classes fi i
x ).( ii fx
)( Xxi
2)( Xxi ii fXx .)(
2
02|— 14 5 8 40 -30,5 930,25 4651,25
14|—26 4 20 80 -18,5 342,25 1369
26|—38 7 32 224 -6,5 42,25 295,75
38|—50 7 44 308 5,5 30,25 211,75
50|—62 5 56 280 17,5 306,25 1531,25
62|—74 5 68 340 29,5 870,25 4351,25
33 1272 25,12410
5,38
33
1272
X 82,387
133
25,124102
s
Podemos observar que a variância da Clínica A é bem menor do que a
variância da Clínica B, apesar de as médias aritméticas serem iguais. Isso significa
que os dados referentes às idades dos pacientes atendidos na primeira clínica são
mais homogêneos, ou seja, mais concentrados em torno da média que os da
segunda clínica, que são mais dispersos.
Desvio Padrão
O desvio padrão é a medida de dispersão mais empregada, pois leva em
consideração a totalidade dos valores da variável em estudo e o seu resultado está
na mesma unidade de medida da variável, diferente da variância, que é uma
medida quadrática. Quanto maior o desvio padrão mais heterogêneos são os
dados.O desvio é um indicador de variabilidade bastante estável. Ele baseia-se nos
desvios em torno da média aritmética. É a média quadrática dos desvios, isto é, a
raiz quadrada da variância.
Estatística Aplicada
93
2ss
EXEMPLIFICANDO
No nosso exemplo temos:
Clínica A
s = 135,81 = 11,65
Clínica B
s = 387,82 = 19,69
Propriedades do desvio padrão
1ª = Somando-se (ou subtraindo-se) uma constante a todos os
valores de uma variável, o desvio padrão não se altera;
2ª = Multiplicando-se (ou dividindo-se) todos os valores de uma
variável por uma constante (diferente de zero), o desvio padrão fica
multiplicado (ou dividido) por essa constante.
Coeficiente de Variação de Pearson - CVP
O desvio padrão tem algumas limitações. Um desvio padrão de 5 unidades,
por exemplo, pode ser considerado pequeno para uma série de valores cujo valor
médio é 500, porém, se a média for igual a 15, essa relação muda completamente.
IMPORTANTE
Outra questão a ser considerada é que o fato de o desvio padrão ser
expresso na mesma unidade dos dados, o que não nos permite
comparar duas ou mais séries de valores expressas em unidades
diferentes.
Estatística Aplicada
94
Para contornar essas dificuldades e limitações, utilizamos o coeficiente de
variação CV. O coeficiente de variação é uma medida de dispersão relativa, ou
seja, é admensional, é a relação entre o desvio padrão e uma medida de
tendência central. Portanto, existem diversos tipos de coeficientes de variação.
Aqui, estudaremos apenas um: o coeficiente de variação de Pearson.
100
X
s
CVP
OBS.: O CV pode ser expresso em decimal ou em porcentagem.
EXEMPLIFICANDO
Ex.: Consideremos os pesos e as alturas de um grupo de jovens
atletas de uma escola de ensino fundamental da baixada fluminense:
qual das medidas (Estatura ou Peso) possui maior homogeneidade?
DISCRIMINAÇÃO M É D I A DESVIO PADRÃO
ESTATURAS 185 cm 5,0 cm
PESOS 68 kg 2,0 kg
Apenas através do desvio padrão não podemos dizer nada, pois este só pode
ser comparado no caso de dados com a mesma unidade de medida. Teremos,
então, que calcular o CVP da Estatura e o CVP do Peso. O menor resultado será o de
menor dispersão ou variabilidade, ou seja, o de maior homogeneidade.
%70,2100
185
5
)(
estaturaCVP
Estatística Aplicada
95
%94,2100
68
2
)(
pesoCVP
Comparando os CVP, concluímos que as estaturas apresentam maior
homogeneidade que os pesos. Se levarmos em consideração o coeficiente de
variação das duas variáveis, podemos afirmar que a média dos dados é
representativa, pois o CV é bem pequeno, tanto para estaturas quanto para os
pesos.
Estudamos nesta unidade as medidas de dispersão. O cálculo do desvio
padrão é de grande importância no estudo da Estatística. Por ser um valor que se
encontra na mesma unidade da variável, fica fácil seu entendimento. Ele mostra,
em valores, o afastamento das observações em relação à média aritmética.
Quando precisamos trabalhar variáveis diferentes, podemos compará-las
através do coeficiente de variação. O estudo da dispersão ou afastamento dos
dados é muito importante na nossa disciplina.
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas
irão ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo
de ensino-aprendizagem.
Veremos, na próxima unidade, como calcular uma amostra.
Estatística Aplicada
96
Estatística Aplicada
97
Exercícios - Unidade 4
1) Uma determinada editora pesquisou o número de páginas das revistas mais
vendidas de uma cidade. Sendo fornecida a distribuição de frequência de número
de páginas, o valor do desvio padrão é aproximadamente:
Revistas A B C D E F
Nº de páginas 62 90 88 92 110 86
a) 16
b) 18
c) 20
d) 25
e) 15
2) Dado o conjunto de valores 3, 5, 2, 1, 3, 4, 6, 9, 3. O desvio-padrão é
aproximadamente:
a) 1,6
b) 1,7
c) 1,8
d) 2,4
e) 2,7
Estatística Aplicada
98
3- Após calcular o Coeficiente de variação da amostra B e da amostra C do quadro
abaixo, marque a alternativa correta:
Amostra n Amplitude
total
Media Variância Desv.Pad. C.V
A 500 150 42 625 25 59,52%
B 800 120 53 196 14
C 900 90 25 169 13
a) O CV da amostra B está no intervalo 26,00% a 27,00%, da amostra C está
no intervalo 49,00% a 51.00%;
b) O CV da amostra B está no intervalo 26,48% e 26,50%, da amostra C está
no intervalo 50,00% a 52,50%;
c) O CV da amostra B está no intervalo 26,00% e 26,50%, da amostra C está
no intervalo 50,00% a 52,50%;
d) O CV da amostra B está no intervalo 26,00% e - 26,00%, da amostra C está
no intervalo 49,00% a 51.00%;
e) O CV da amostra B está no intervalo 26,01% e 26,31%, da amostra C está
no intervalo 50,00% a 51,50%;
4) Observe o desenho abaixo e assinale a alternativa correta com base nos dados
observados em torno da média.
MÉDIA
Estatística Aplicada
99
a) O segmento representado por “A” tem dispersão mínima;
b) No segmento representado pela letra “C” a dispersão é máxima;
c) Os segmentos “A” e “D” mostram maior dispersão;
d) Nada se pode afirmar quanto aos pontos alocados em torno da média,
para observar a dispersão;
e) Os segmentos “A” e “C” apresentam dispersões iguais.
Enunciado das questões 5 e 6
A tabela abaixo mostra a relação de idade dos funcionários e o salário que
recebem na empresa em que trabalham:
Idade 24 32 35 43 48
Salário
(RS)
1.452,03 1.893,45 2.645,70 3.890,56 4.125,00
5. Calcule o desvio padrão das variáveis salário e idade.
a) aproximadamente R$993,02 e 8,23 anos.
b) aproximadamente R$1.234,89 e 3 anos.
c) aproximadamente R$1.184,02 e 9,40 anos.
d) aproximadamente R$1.343,09 e 7,23 anos.
e) aproximadamente R$1.454,26 e 4,32 anos.
A
B
C
D
Estatística Aplicada
100
6. O coeficiente de variação é a relação entre a média aritmética e o desvio padrão.
O que podemos afirmar quanto as variáveis salário e idade?
a) Nada se pode afirmar quanto aos coeficientes de variação das variáveis
salário e idade, uma vez que a variável idade não é contínua.
b) O coeficiente de variação da variável idade é igual ao da variável salário.
c) O coeficiente de variação da variável idade é 20% e salário 17%.
d) O coeficiente de variação da variável idade é 25,82% e salário 42,27%.
e) O coeficiente de variação da variável idade é 15,15% e salário 23,89%
Enunciado das questões 7 e 8
Suponha que uma voluntária visite residências de sua vizinhança, em um
trabalho beneficente, recebendo os seguintes donativos (em Reais).
7 7 5 13 10 18
12 3 6 15 11 17
7) Qual o valor da variância para os donativos?
a) aproximadamente 23,52
b) aproximadamente 25,13
c) aproximadamente 26,89
d) aproximadamente 28.56
e) aproximadamente 29,43
8) Qual a variabilidade relativa para os valores doados?
a) aproximadamente 24,56%
b) aproximadamente 32,67%
c) aproximadamente 35,87%
d) aproximadamente 41,89%
e) aproximadamente 46,95%
Estatística Aplicada
101
9) Carlos e Pedro, dois amigos, foram a uma loja de eletro-eletrônicos para comprar
uma TV de 42’ para assistir aos jogos da Copa do Mundo/2006. Mesmo tendo
gostos parecidos, cada um escolheu um modelo de TV. Nas especificações do
produto continha como informação a média de consumo e o desvio-padrão do
consumo. A TV que Carlos escolheu tem um consumo mês de 120 kw com desvio
de 3,7 kw, enquanto que a TV que Pedro escolheu tem um consumo mês de 115 kw
com desvio de 5,2 kw. Com base nas informações, qual dos amigos pagará mais
pelo consumo de energia da televisão? Justifique sua resposta.
Estatística Aplicada
102
10) Calcule o desvio padrão para a série abaixo:2, 3, 4, 5, 7, 8 e 13
Estatística Aplicada
103
Noções de Amostragem 5
Amostragem Casual ou Aleatória Simples.
Amostragem por Conglomerados.
Amostragem Acidental.
Amostragem Intencional.
Amostragem por Quotas.
Amostragem Estratificada.
Estatística Aplicada
104
Esta unidade talvez seja uma das mais importantes da nossa disciplina, pois,
num levantamento estatístico, a amostra deve ser representativa da realidade, se
isso não ocorrer, não poderemos tirar nenhuma conclusão do comportamento de
toda a população. Aqui aprenderemos mais um pouco sobre o cálculo de amostra
e como poderemos confiar em seus resultados.
OBJETIVO DA UNIDADE:
Conhecer mais sobre o cálculo e os tipos de amostra e os métodos
probabilísticos.
PLANO DA UNIDADE:
Amostragem Casual ou Aleatória Simples.
Amostragem por Conglomerados.
Amostragem Acidental.
Amostragem Intencional.
Amostragem por Quotas.
Amostragem Estratificada.
Bons estudos!
Estatística Aplicada
105
Conceitos básicos
Nem sempre a realização de um censo é possível, ou seja, obter informações
referentes a todos os elementos de uma população torna-se, muitas vezes,
praticamente impossível. Limitações de tempo e custo justificam o uso de técnicas
amostrais.
Amostra é uma parcela representativa da população que é examinada com o
propósito de tirarmos conclusões sobre a mesma. É um subconjunto finito de uma
população. Uma amostra deve ser cuidadosamente planejada a fim de garantir a
menor margem de erro na pesquisa.
A margem de erro é um intervalo controlado dentro do qual podem variar os
resultados finais. Um estudo bem planejado é capaz de reduzir o erro de
amostragem.
Para selecionar uma amostra é preciso levar em conta as características de
distribuição física da população, ou seja, algumas áreas têm uma população maior
que outras. É preciso levantar os dados em proporção à densidade populacional
das regiões.
EXEMPLIFICANDO
Por exemplo, se o objeto de estudo é o tipo de programa de TV mais
assistido, não adianta fazer o estudo apenas em uma turma de escola de
educação infantil, pois o resultado obviamente seria desenho animado. Crianças
não costumam assistir a telejornais ou filmes da madrugada. Se a pesquisa fosse
feita dessa forma, o resultado não estaria correto. Assim, no caso de uma
população ser composta de 35% de crianças, 40% de adultos e os outros 25% de
idosos, uma amostra dessa população também deve conter crianças, adultos e
idosos na mesma proporção.
Estatística Aplicada
106
Tipos de amostragem
Existem basicamente dois métodos para composição da amostra: o
método probabilístico e o não-probabilístico ou intencional.
MÉTODOS PROBABILÍSTICOS
Neste método, faz-se necessário que cada elemento da população possua
determinada probabilidade de ser selecionado, ou seja, se o tamanho da
população for N, a probabilidade de cada elemento ser selecionado será
N
1
. Esse
método garante que cada elemento da população tenha a mesma chance de ser
selecionado como elemento da amostra. Assim, podemos garantir cientificamente
a aplicação das técnicas estatísticas de inferências. Somente com base em
amostragens probabilísticas é que se podem realizar inferências ou induções sobre
a população a partir do conhecimento da amostra.
Amostragem casual ou aleatória simples
Aamostragem casual ou aleatória simples é o processo mais utilizado.
Equivale a um sorteio lotérico. Ela pode ser realizada da seguinte forma: numera-
se a população de 1 a n e sorteiam-se, a seguir, por meio de um dispositivo
aleatório qualquer, n números dessa sequência, que corresponderão aos
elementos pertencentes à amostra.
Estatística Aplicada
107
Obs.: Quando o número de elementos da amostra é muito grande como, por
exemplo, neste caso, tal tipo de sorteio é muito trabalhoso. Neste caso, utiliza-se
uma tabela de números aleatórios, construída de modo que os algarismos de 0 a
9 sejam distribuídos ao acaso nas linhas e colunas.
Tabela de números aleatórios
5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1 3 9 7 5 6
2 8 8 0 5 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7 1 7 7 1
7 4 5 4 1 2 8 5 4 9 6 3 7 5 5 1 2 0 4 5 8 7 4 1 2 9 6 3 8 4
9 1 2 0 5 0 8 0 7 0 4 0 6 9 4 6 3 9 8 2 0 7 1 4 5 6 8 4 5 2
0 4 2 5 8 4 2 5 9 6 3 0 1 5 2 0 4 5 7 8 0 6 0 1 9 0 1 5 0 4
1 2 0 5 0 1 5 0 8 0 4 0 3 6 9 8 7 4 5 2 1 0 3 6 9 5 8 4 7 5
5 2 5 4 0 1 2 5 8 9 6 3 0 7 0 5 1 2 5 8 9 6 3 0 2 1 5 4 8 7
7 1 2 5 4 6 0 3 0 2 5 0 1 9 0 1 2 0 7 0 4 5 6 9 8 8 5 2 0 3
2 5 4 1 0 3 6 9 8 4 8 0 2 1 5 4 6 9 8 7 5 4 6 3 0 2 1 0 1 2
4 8 7 4 5 2 5 5 8 5 2 2 2 1 5 4 8 5 2 0 3 6 9 8 5 4 2 0 3 2
9 2 5 5 2 1 0 3 0 6 8 7 9 8 7 5 0 2 1 7 6 5 2 1 0 3 6 9 8 5
2 0 1 3 6 5 8 9 7 8 5 4 1 2 3 6 9 8 5 2 1 4 5 8 7 9 6 8 5 5
4 9 8 6 5 4 0 8 9 3 2 9 6 2 4 5 1 2 1 5 8 7 9 5 4 4 5 2 6 6
7 0 6 3 2 0 2 7 8 6 2 1 6 8 7 4 1 5 8 9 0 3 2 5 4 6 6 8 4 9
5 2 0 4 5 7 4 5 2 0 0 7 4 4 4 5 1 1 5 7 9 6 3 0 1 4 5 7 5 6
3 4 8 7 0 2 8 4 5 2 0 2 8 1 1 4 5 4 2 4 5 7 0 1 9 1 4 8 5 3
8 0 2 0 1 5 9 6 3 0 1 4 7 2 8 5 4 5 4 1 0 3 1 5 4 0 9 0 5 2
2 3 2 5 8 4 5 6 8 7 5 2 1 5 9 2 8 1 5 7 8 9 0 2 1 5 3 6 8 5
5 5 0 1 2 5 8 9 6 3 0 1 4 8 6 1 9 2 0 4 5 0 3 6 9 2 2 5 5 1
1 4 9 5 8 4 5 2 0 3 1 5 6 5 5 2 6 6 2 1 5 9 5 3 0 1 4 7 1 5
0 8 0 2 5 8 9 6 3 2 0 1 5 2 0 3 3 3 1 2 5 8 7 0 2 6 3 6 9 5
5 7 2 1 0 3 6 9 8 5 4 7 8 5 1 6 2 1 1 4 5 8 7 9 6 2 5 0 4 1
4 8 4 5 9 6 5 8 7 4 1 2 0 5 8 7 4 5 9 6 3 0 1 2 5 4 1 2 5 9
EXEMPLIFICANDO
Exemplo: Uma determinada universidade possui 7000 alunos. Pretende-se
fazer uma pesquisa para verificar como vai a saúde dos alunos. Serão
selecionados, aleatoriamente, 5% dos alunos. Deslocar um funcionário
para escrever 7000 números de matrícula em um pedaço de papel e
depois sortear 350 pedaços é algo praticamente inviável e desnecessário.
Então, a amostra é sorteada com o uso de uma tabela de números
aleatórios da seguinte forma: os números de matrícula existentes
possuem 4 dígitos, escolhemos 4 linhas ou colunas da tabela e
selecionamos os números que correspondem a alunos matriculados na
instituição. Os números que não correspondem são descartados. Se
selecionarmos, por exemplo, as 4 primeiras colunas teremos como
números selecionados 5772, 2880, 7454, 9120, 0425, 1205, 5254 ... Estas
são, então, as matrículas selecionadas, caso existam.
Estatística Aplicada
108
Amostragem proporcional estratificada
Quando a população se divide em estratos (subconjuntos da população)
é imprescindível que o sorteio dos elementos da amostra leve em consideração tais
estratos. Daí, obteremos os elementos da amostra proporcional ao número de
elementos desses estratos.
EXEMPLIFICANDO
Ex.: Vamos obter uma amostra de 10% dos pacientes internados em um SPA,
supondo que sejam 106 mulheres e 54 homens. São, portanto, dois estratos (sexo
masculino e sexo feminino). Logo, temos:
SEXO POPULAÇÃO 10 % AMOSTRA
MASCULINO 54 5,4 5
FEMININO 106 10,6 11
Total 160 16 16
Numeramos os pacientes de 01 a 160, sendo 01 a 54 homens e 55 a 160,
mulheres e, fazemos o sorteio casual com urna ou tabela de números aleatórios.
Amostragem sistemática
Quando os elementos da população já se acham ordenados, não há
necessidade de sorteio. Neste caso, calcula-se o número de elementos da amostra
e divide-se o número de elementos da população pelo de elementos da amostra
(x), assim, escolhemos os elementos ordenados de x em x.
Estatística Aplicada
109
EXEMPLIFICANDO
Ex.: Imaginemos um prédio com 200 apartamentos dos quais
desejamos obter uma amostra formada por 20 apartamentos para uma
pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento:
como 200/20 = 10. Escolhemos por sorteio casual um número de 01 a 10,
o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam, periodicamente,considerados de 10 em 10. Assim,
suponhamos que o número sorteado fosse 6, a amostra seria: 6º.
apartamento, 16º. apartamento, 26º. apartamento etc.
Amostragem por conglomerados (ou agrupamentos)
Algumas populações não permitem ou dificultam extremamente a
identificação de seus elementos. Não obstante, pode ser relativamente fácil
identificar alguns subgrupos da população. Em tais casos, uma amostra aleatória
simples desses subgrupos (conglomerados) pode ser colhida e uma contagem
completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são
quarteirões, famílias, organizações, agências, edifícios etc.
EXEMPLIFICANDO
Ex.: Num levantamento da população de determinada cidade,
podemos dispor do mapa indicando cada quarteirão e não dispor de uma
relação atualizada dos seus moradores. Pode-se, então, colher uma
amostra dos quarteirões e fazer a contagem completa de todos os que
residem naqueles quarteirões sorteados.
Estatística Aplicada
110
MÉTODOS NÃO-PROBABILÍSTICOS
São amostragens nas quais há uma escolha deliberada dos elementos da
amostra. Não é possível generalizar os resultados das pesquisas para a população,
pois as amostras não-probabilísticas não garantem a representatividade da
população.
Amostragem acidental
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo,
que são possíveis de se obter até completar o número de elementos da amostra.
Ela é geralmente utilizada em pesquisas de opinião, em que os entrevistados são
acidentalmente escolhidos.
EXEMPLIFICANDO
Ex.: Pesquisas de opinião em praças públicas, ruas de grandes cidades.
Amostragem intencional
De acordo com determinado critério, é escolhido intencionalmente um
grupo de elementos que irão compor a amostra. O investigador se dirige
intencionalmente a grupos de elementos dos quais deseja saber a opinião.
Estatística Aplicada
111
EXEMPLIFICANDO
Ex.: Numa pesquisa sobre preferência por determinado cosmético, o
pesquisador se dirige a um grande salão de beleza e entrevista as pessoas
que ali se encontram.
Amostragem por cotas
Trata-se de um dos métodos de amostragem mais comumente usados em
levantamentos de mercado e em prévias eleitorais. Ele abrange três fases:
primeiramente classifica a população, ou seja, verifica o que é relevante para a
característica a ser estudada; em segundo lugar ele determina a proporção da
população para cada característica com base no que se conhece sobre a
população; em terceiro e último lugar, o pesquisador fixa cotas para cada
entrevistador de modo que a amostra total observada contenha a proporção da
população determinada na fase anterior.
EXEMPLIFICANDO
Ex.: Numa pesquisa sobre programa de TV mais assistido,
provavelmente, será interessante dividirmos a população em homens e mulheres,
cidade e campo, idade, renda média, faixas etárias etc.
Estatística Aplicada
112
Cálculo para o dimensionamento da amostra
Para se dimensionar uma amostra, devemos saber:
A população é finita ou infinita?
Por exemplo: A população constituída por todos os brinquedos produzidos
em um dia de trabalho em uma fábrica é finita, enquanto que a população
constituída por todos os resultados (cara e coroa) em sucessivos lances de
uma moeda é infinita.
A variável estudada é discreta ou contínua?
Variável Discreta ou Descontínua: seus valores são expressos, geralmente,
através de números inteiros não negativos. Resulta normalmente de
contagens. Ex.: Número de filhos de um casal - pode assumir valores como 0;
1; 2; 3... mas nunca valores como: 1,5; 3,72 etc.
Variável Contínua: pode assumir qualquer valor entre dois limites, ou seja,
assume valores em um intervalo real. Resulta, normalmente, de uma
mensuração, ou seja, podem assumir, teoricamente, qualquer valor entre dois
limites. Ex.: Temperatura. Normalmente, as medições dão origem a variáveis
contínuas e as contagens a variáveis discretas.
O erro amostral – expresso na unidade da variável estudada;
O erro amostral é a máxima diferença que o pesquisador admite entre a média
da população (μ) e a média da amostra ( X ).
O desvio padrão da população – expresso na unidade da variável;
O desvio padrão da população pode ser determinado através de estudos
anteriormente feitos ou de suposições sobre o assunto.
Estatística Aplicada
113
A abscissa da curva normal padrão (Z) para um determinado nível de
confiança.
Normalmente utilizamos os níveis de confiança:
Para 95% → Z = 1,96
99% → Z = 2,58
Fórmulas para o cálculo da amostra
Variável / População
Infinita Correção
Contínua 2
0
d
Z
n
N
n
n
n
0
0
1
Discreta
2
2
0
ˆˆ
d
qpZ
n
Em que:
Z é a abscissa da curva normal padrão.
é o desvio padrão da população.
N é o tamanho da população.
d é o erro amostral.
p̂ é a estimativa da proporção verificada em pesquisa anterior. Por
exemplo: se a variável analisada for a proporção de crianças míopes de
uma determinada cidade e em uma pesquisa anterior essa proporção foi
de 20%, então, p̂ = 0,20. Quando se tratar de um trabalho original e o
pesquisador não dispuser de nenhum valor, faz-se p̂ =50% = 0,50.
pq ˆ1ˆ
Estatística Aplicada
114
Obs. 1: Quando a população for infinita, usaremos as fórmulas
2
0
d
Z
n
e
2
2
0
ˆˆ
d
qpZ
n
para variáveis contínuas e discretas, respectivamente. Quando
a população for finita, poderemos usar estas mesmas fórmulas, porém fazendo
uma pequena correção depois com a fórmula
N
n
n
n
0
0
1
.
Obs. 2: Quando o pesquisador não dispõe de uma pesquisa inicial e, portanto, não
tem o valor do desvio padrão, ele toma aleatoriamente 30 indivíduos desta
população e calcula o desvio padrão.
EXEMPLIFICANDO
Ex.: Uma pesquisa de opinião sobre a relação universidade e comunidade
será realizada com a participação dos alunos e professores do curso de estatística. É
necessário dimensionar a amostra, tendo em vista a impossibilidade de realização
de um senso. Sabe-se que uma mesma pesquisa foi feita no ano anterior e
registrou 30% de satisfação da população em relação ao trabalho que a
universidade desenvolve com a comunidade. Qual será o número de indivíduos
que farão parte desta amostra se a comunidade é de aproximadamente 8000
pessoas? Considere o nível de confiança de 95% e o erro de amostragem de 5%.
Solução: Considerando que os dados são discretos, usaremos a fórmula
2
2
0
ˆˆ
d
qpZ
n
e corrigiremos depois com a fórmula
N
n
n
n
0
0
1
.
Estatística Aplicada
115
Em que:
0n amostra inicial.
n = amostra corrigida.
p̂ = valor obtido do trabalho anterior. Probabilidade de sucesso estimado.
pq ˆ1ˆ = 1 – 0,30 = 0,70
d = precisão (erro de amostragem).
z = nível de confiança – abscissa da curva normal para 95% → z = 1,96
O valor da amostra inicial é:
A amostra corrigida é:
Resultado: A amostra calculada terá 311 indivíduos.
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Vimos, nesta unidade, vários processos para o cálculo de n (tamanho da amostra).
Em uma pesquisa, o tamanho da amostra deve ser cuidado somente e calculado, pois
do contrário, pode comprometer todo um trabalho. Na próxima unidade vamos
estudar o cálculo das Probabilidades.
311
04,1
323
8000
323
1
323
1
N
n
n
n
323
0025,0
8067,0
)05,0(
70,030,096,1ˆˆ
2
2
2
2
0
d
qpZ
n
Estatística Aplicada
116
Exercícios - Unidade 5
1. Considere uma população com 1000 pessoas do sexo feminino na faixa etária de
20 a 30 anos, 800 pessoasque trabalham na área da saúde e 1200 pessoas no
comércio de medicamentos. Na amostra dessa população:
a) deve conter a maior parte de pessoas do sexo feminino na faixa etária de
20 a 30 anos.
b) deve somente considerar as pessoas que trabalham com comércio de
medicamentos, tendo em vista a sua quantidade.
c) a amostra não deve ser proporcional a cada categoria da população.
d) deve conter um número total de pessoas sem considerar parte
proporcional, porque a população é formada por apenas três categorias,
não havendo necessidade técnica de calcular uma amostra estratificada.
e) a amostra deve ser proporcional ao número de pessoas do sexo feminino
na faixa etária de 20 a 30, de pessoas que trabalham na saúde e pessoas
que trabalham no comércio de medicamentos.
2 No cálculo para dimensionar uma amostra é importante que se conheçam
inicialmente as informações sobre a população, se é finita ou infinita. Marque a
alternativa que não caracteriza uma população finita:
a) número de parafusos fabricados por uma metalúrgica em 24 horas.
b) lançamento de um dado até ocorrer a face 1 ( um).
c) num jogo de bingo, ocorrer a bola 9.
d) número de todas as bactérias que estão na Terra.
e) número de ossos do corpo humano.
Estatística Aplicada
117
3-Numa população dividida em estratos A1, A2 , A3 e A4 , podemos afirmar que:
a) pode ocorrer de um dos estratos não pertencer à população.
b) todos os estratos, obrigatoriamente, têm os mesmos números de
elementos.
c) não deve haver qualquer tipo de relação entre os estratos e a amostra
que será calculada.
d) a soma dos estratos é maior que a população.
e) os estratos são subconjuntos da população.
4. Considere uma agremiação esportiva com uma equipe de 500 atletas praticantes
de todas as modalidades esportivas desenvolvidas na região. Essa instituição
calculou uma amostra de “n” atletas para participar de atividades recreativas e
esportivas em diversas modalidades. No dia do evento, faltaram atletas para
algumas atividades em decorrência do custo por atleta. Marque a alternativa
correta:
a) Nada se pode afirmar quanto ao custo em relação ao tamanho da
amostra.
b) A amostra foi cuidadosamente dimensionada com erro de amostragem
bem calculado.
c) A amostra foi calculada tomando cuidado com o menor erro amostral.
d) Não houve cuidado em planejar a menor margem de erro.
e) Nunca se calcula amostra para esse tipo de atividade, tendo em vista que
a população é finita e a atividade está inclusa no custo total.
Estatística Aplicada
118
5. No cálculo de uma amostra, o erro amostral é a diferença que se admite entre:
a) o desvio padrão e o coeficiente de correlação.
b) a média e o coeficiente de correlação.
c) nada se pode afirmar sobre o erro de amostragem, pois a amostra é
sempre 10% da população em qualquer situação.
d) a média da amostra e o desvio padrão.
e) entre os parâmetros da população e da amostra, como média.
6. Na amostragem “Casual ou Aleatória Simples” utiliza-se um tipo de sorteio
equivalente a um “Sorteio Lotérico”. Quando o número de elementos da amostra é
muito grande, qual o instrumento utilizado?
a) Tabela de números aleatórios.
b) Nenhuma tabela é aplicada.
c) Nada se afirma quanto ao cálculo de amostra nesses casos.
d) Tabela da distribuição Normal.
e) Tabela de logaritmo.
7- Em uma turma com 68 alunos, ordenados por n° de matrícula, cursando a
disciplina de Estatística, calculou-se uma amostra de 12 alunos com o propósito de
saber a opinião dos estudantes em relação à disciplina de Estatística. Foi aplicado o
procedimento de amostragem 0,66,5
12
68
n
N , em que o aluno escolhe um
número de 0 a 6 para proceder à seleção da amostra.
Marque alternativa correta:
a) Trata-se de uma Amostragem Estratificada.
b) Como se trata de parte da turma aplica-se a Amostragem por Área.
c) Está explícito que deve ser aplicada a Técnica de Amostragem por
Conglomerado.
d) Certamente aplica-se a Amostragem Sistemática.
e) As alternativas não estão associadas à questão formulada.
Estatística Aplicada
119
8 - Nas alternativas abaixo, podemos considerar como Amostra:
a) É o mesmo que população e sempre será.
b) A população sempre a amostra.
c) A Amostra na População.
d) Amostra é uma fração da população que deverá conter elementos que
representem fielmente a população a ser analisada.
e) Amostra é todo conjunto de elementos maior que a população
9- Determine o tamanho da amostra no levantamento do peso de uma
determinada peça produzida em larga escala. Pelas especificações técnicas do
produto, o desvio-padrão é de 15 kg. Admita um erro amostral de 1,5 kg e
considere um nível de confiança de 95%.
10- No problema anterior, admita que a população seja finita de 1600 peças.
Calcule o tamanho da amostra.
Estatística Aplicada
120
Estatística Aplicada
121
Cálculo das Probabilidades 6
Caracterização de um experimento aleatório
Espaço amostral
Evento
Eventos mutuamente exclusivos
Definição de Probabilidade
Principais teoremas
Probabilidades finitas dos espaços amostrais finitos
Espaços amostrais finitos equiprováveis
Probabilidade condicional
Teorema do produto
Independência estatística
Estatística Aplicada
122
Todas as vezes que se estudam fenômenos de observação, cumpri-se
distinguir o próprio fenômeno e o modelo matemático (determinístico ou
probabilístico), que melhor o explica.
Os fenômenos estudados pela estatística, são fenômenos que estão sujeitos ao
acaso (fenômenos aleatórios), porque mesmo em condições normais de
experimentação variam de uma observação para outra.
Para fenômenos aleatórios adotar-se-á um modelo matemático probabilístico
chamado de: Cálculo das Probabilidades. Este é o objeto de estudo de nossa
unidade.
OBJETIVO DA UNIDADE:
Caracterizar os experimentos aleatórios calcular as possibilidades de
acontecimento de tais experimentos, a chance de um evento ocorrer
ou não, ou seja, a probabilidade de sucesso ou insucesso.
PLANO DA UNIDADE :
Caracterização de um experimento aleatório
Espaço amostral
Evento
Eventos mutuamente exclusivos
Definição de Probabilidade
Principais teoremas
Probabilidades finitas dos espaços amostrais finitos
Espaços amostrais finitos equiprováveis
Probabilidade condicional
Teorema do produto
Independência estatística
Bons estudos!
Estatística Aplicada
123
Caracterização de um Experimento Aleatório
A fim de se entender melhor a caracterização dos experimentos, convém
observar o que há de comum nos seguintes experimentos:
1 Retirar uma carta de um baralho de 52 cartas e
observar o seu naipe.
2 Retirar com ou sem reposição, bolas de uma urna,
que contém 5 bolas brancas e 6 pretas.
3 Jogar um dado e observar o número mostrado na
face de cima.
A análise desses experimentos revela:
a) cada experimento poderá ser repetido indefinidamente sob as mesmas
condições;
b) não se conhece um particular valor do experimento a priori, porém podem-se
descrever todos os possíveis resultados – as probabilidades.
c) quando o experimento for repetido um grande número de vezes, surgirá uma
regularidade, isto é, haverá uma estabilidade da fração
f = r/n (frequência relativa), em que n é o número de repetições e r o número de
sucesso de um particular resultado estabelecido antes da realização.
– o símbolo
significa experimento
Estatística Aplicada
124
n
f
Como veremos adiante, a característica (c) é de fundamental importância
para a avaliação da probabilidade de certo evento.
Espaço Amostral
Para cada experimento , define espaço amostral S o conjunto de todos
os possíveis resultados desse experimento.
EXEMPLIFICANDO
a) Jogar um dado e observaro número da face de cima.
S = {1, 2, 3, 4, 5, 6}
b) jogar duas moedas e observar o resultado.
S = {(ca, ca); (ca, co); (co, ca); (co, co)}, onde ca = cara e co = coroa.
Obs: S poderá ser um conjunto finito ou infinito enumerável. Trataremos de
conjuntos finitos.
Estatística Aplicada
125
Evento
É um conjunto de resultados do experimento, isto é, um subconjunto de
S. Inclusive e o próprio S.
Usando as operações com conjuntos, podemos formar novos eventos.
Assim:
BA É o evento que ocorre se pelo menos um deles ocorrer.
BA É o evento que ocorre se ambos ocorrerem simultaneamente.
A É o evento que ocorre se A não ocorre.
EXEMPLIFICANDO
a) jogar três moedas e observar o resultado.
S = {(ca, ca, ca); (ca, ca, co); (ca, co, ca); (co, ca, ca);
( co, co, ca); (co, ca, co); (ca, co, co); (co, co, co)}
A = Evento ocorrer pelo menos duas caras.
A = {(ca, ca, ca); (ca, ca, co); (ca, co, ca) ; (co, ca, ca)}
b) lançar um dado e observar o número da face de cima.
S = {1, 2, 3, 4, 5, 6}
B = Evento ocorrer número par.
B = {2, 4, 6}
Sendo S um espaço amostral finito com n elementos, pode-se verificar
que o número total de eventos extraído de S é 2n.
Eventos Mutuamente Exclusivos
Dois eventos A e B são ditos mutuamente exclusivos se A e B não
puderem ocorrer simultaneamente, isto é, BA =.
Estatística Aplicada
126
EXEMPLIFICANDO
jogar um dado e observar o resultado
S = {1, 2, 3, 4, 5, 6}
A ocorrer número par – {2, 4, 6}
B ocorrer número ímpar – {1, 3, 5}
BA = Eventos mutuamente exclusivos ou disjuntos.
Definição de Probabilidade
Dado um experimento aleatório e S o espaço amostral, a probabilidade
de um evento, Pr(A) é uma função definida em S, que associado a cada evento um
número real, satisfaz os seguintes axiomas:
1)Pr(0 A
Pr(S) = 1
BAseBABA )Pr()Pr()Pr(
Principais Teoremas
P() = 0
)Pr(1)Pr( AA
Se ,BA logo Pr(A) Pr(B)
Pr(AB) = Pr(A) + Pr(B) – Pr(AB)
Até o momento, já postulamos a existência do número Pr(A) e temos
várias propriedades associadas a ele, mas não mencionamos como calcular Pr(A).
A frequência relativa será de grande valor para aproximarmos o cálculo
de Pr(A). Nota-se que não se está afirmando que fA é a mesma coisa que Pr(A).
Mesmo que a aproximação seja grosseira, em nada abalará a lógica do modelo
estabelecido acima.
Estatística Aplicada
127
Probabilidades finitas dos espaços amostrais finitos
Seja S um espaço amostral finito S= {a1, a2, ..., an}. Considera-se o evento
formado por um resultado simples A = {ai}.
A cada evento simples {ai}, associa-se um número pi denominado de
probabilidade de {ai}, satisfazendo as seguintes condições:
pi ≥ 0, onde i = 1, 2, ..., n
p1 + p2 + ...+ pn = 1
A probabilidade Pr(A) de cada evento composto (mais de um evento) é
então definida pela soma das probabilidades dos pontos de A.
EXEMPLIFICANDO
Três cavalos A, B e C estão em uma corrida. A probabilidade de A
ganhar a corrida é duas vezes mais do que B; e B tem duas vezes mais
probabilidades de ganhar a corrida do que C. Quais são as
probabilidades de vitória de cada um?
Solução:
Pr(C) = p
Pr(B) = 2p
Pr(A) = 4p
p + 2p + 4p = 1
7p = 1 → p =
7
1
logo, Pr(A) =
7
4
, Pr(B) =
7
2
e Pr(C) =
7
1
Estatística Aplicada
128
Espaços amostrais finitos equiprováveis
Quando se associa a cada ponto amostral a mesma probabilidade, o
espaço amostral chama-se equiprovável. Em particular se S contém n pontos,
então a probabilidade de cada ponto será
n
1
.
Por outro lado, se um evento A contém r pontos, então:
Pr(A) = .r
n
r
n
1
.
Este método de avaliar Pr(A) é teoricamente enunciado da seguinte
maneira:
Pr(A) =
ocorreSamostralespaçooqueemvezesdeNúmero
ocorrerpodeAeventooquevezesdeNúmero
ou
Pr(A) =
possíveiscasosdeNúmero
favoráveiscasosdeNúmero
EXEMPLIFICANDO
Escolhe-se aleatoriamente (a expressão “aleatória” indica que o
espaço amostral é equiprovável), uma carta de um baralho que contém 52 cartas.
Seja A = {a carta ser de ouros}
B = {a carta ser uma figura}
Pr(A) = número de ouros = 13 = 1
número de cartas 52 4
Pr(B) = número de figuras = 12 = 3
número de cartas 52 13
Estatística Aplicada
129
DICA
Vale lembrar que um baralho possui 4 naipes, cada naipe possui
13 cartas onde 13x4 = 52 cartas. As figuras são: Dama, Rei e Valete, considerando os
4 naipes, temos 12 figuras, pois 3x4=12.
Em muitos problemas, o cálculo das probabilidades de um evento reduz-
se a um problema de contagem. Assim é que a análise combinatória (teoria da
contagem), tem fundamental importância para se contar o número de casos
favoráveis e possíveis.
EXEMPLIFICANDO
Num lote de 12 peças 4 são defeituosas, duas peças são retiradas
aleatoriamente. Calcular:
a) a probabilidade de ambas serem defeituosas;
b) a probabilidade de ambas não serem defeituosas;
c) a probabilidade de ao menos uma ser defeituosa.
Solução:
a) A = ambas serem defeituosas.
A pode ocorrer =
C4,2= 6
4
24
22
24
)12).(12(
1234
!2!2
!4
)!24(!2
!4
S pode ocorrer = C12,2= 66
!10!2
!12
Estatística Aplicada
130
Logo a probabilidade de ambas serem defeituosas é:
Pr(A) =
11
1
66
6
b) B = Ambas não serem defeituosas.
B pode ocorrer = C8,2= 28
!6!2
!8
S pode ocorrer = C12,2= 66
!10!2
!12
Logo a probabilidade de ambas não serem defeituosas é:
Pr(B) =
33
14
66
28
c) C = ao menos uma ser defeituosa.
C = B ou seja, Pr(C) = Pr(B )
Pr(B ) = 1 – Pr(B) como já conhecemos Pr(B) que é a probabilidade de ambas
não serem defeituosas, temos que:
Pr(B ) = 1 -
33
19
33
14
Vimos, com este exemplo, a necessidade de utilizamos análise
combinatória. Precisamos, através da combinação, calcular o número de casos
favoráveis e o número de casos possíveis. Sem o auxílio da teoria de contagem, não
seria possível.
Estatística Aplicada
131
Probabilidade Condicional
Seja → Lançar um dado
A = saia o número 3 → Pr(A) = 1/3
B = saia número impar → Pr(B) = 1/2
É de grande importância para o cálculo das probabilidades se calcular a
probabilidade condicional. Neste exemplo, podemos estar querendo a
probabilidade do evento A condicionada ao evento B, isto é:
Pr(A/B) → (Lê-se: probabilidade de A condicionada a B ou probabilidade
de A dado B). Assim, Pr(A/B) = 1/3
Podemos observar que na probabilidade condicional, há uma redução no
espaço amostral, pois neste caso passamos de
S = {1, 2, 3, 4, 5, 6} para S’ = {1, 3, 5} e é neste espaço que calcularmos a
probabilidade condicional.
Definição:
)Pr(
)Pr(
)/Pr(
B
BA
BA
Pr(B) > 0
Podemos constatar que P(A/B) assim definida satisfaz os axiomas de
probabilidades já mencionadas.
É usual utilizarmos uma ferramenta mais prática para calcularmos Pr(A/B):
Pr(A) =
possíveiscasosdeNúmero
favoráveiscasosdeNúmero
Estatística Aplicada
132
EXEMPLIFICANDO
Seja ξ → Lançar dois dados
A = {(x1, x2)} / x1 + x2 = 10
B = {(x1, x2)} / x1 > x2
Avaliar Pr(A), Pr(B), Pr(A/B) e Pr(B/A)
(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
S = (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Pr(A) =
12
1
36
3
(ocorrências: (5,5); (4,6) e (6,4))
Pr(B) =
12
5
36
15
(ocorrências: (2,1); (3,1); (3,2); (4,1); (4,2); (4,3); (5,1); (5,2); (5,3);
(5,4); (6,1); (6,2); (6,3); (6,4); (6,5))
Pr(A/B) =
15
1
(ocorrência: (6,4))
Pr(B/A) =
3
1
(ocorrência:(6,4))
Pr(A )B =
36
1
(ocorrência: (6,4))
Estatística Aplicada
133
Teorema do Produto
A partir da probabilidade condicional, podemos calcular a probabilidade
de dois eventos simultaneamente.
)/Pr().Pr()Pr(
)Pr(
)Pr(
)/Pr( BABBA
B
BA
BA
)/Pr().Pr()Pr(
)Pr(
)Pr(
)/Pr( ABABA
A
BA
AB
EXEMPLIFICANDO
Em um lote de 12 peças, 4 são defeituosas, duas peças são retiradas, uma
após a outra sem reposição. Qual a probabilidade de ambas serem defeituosas?
A = a primeira ser defeituosa.
B = a segunda ser defeituosa.
Pr(A B) = Pr(A) . Pr(B/A)
Pr(A B) = (4/12) . (3/11) = 1/11
Independência Estatística
Um evento A é considerado independente de um outro evento B, se a
probabilidade de A for igual à probabilidade condicionada de A dado B, isto é, se
Pr(A) = Pr(A/B). É evidente que se A é independente de B, B é independente de A,
isto é, Pr(B) = Pr(B/A).
Estatística Aplicada
134
Teorema:
Se A e B são independentes, então: Pr(A B) = Pr(A). Pr(B).
Dado n eventos A1, A2, ..., An, diz-se que eles são independentes se
forem 2 a 2, 3 a 3, n a n, isto é:
Pr(Ai Aj) = Pr(Ai) . Pr(Aj) i ≠ j
Pr(Ai Aj Ak) = Pr(Ai) . Pr(Aj) . Pr(Ak) i ≠ j ≠ k
Pr(A1 A2 An) = Pr(A1) . Pr(A2) … Pr(An)
EXEMPLIFICANDO
ξ → Lançar um dado duas vezes.
A → tirar face 5 no primeiro lançamento.
B → tirar soma 7.
C → tirar soma 8.
Pr(A) = 6/36 = 1/6
Pr(B) = 6/36 = 1/6
Pr(C) = 5/36
Pr(A B) = 1/36
Pr(A C) = 1/36
Pr(A B) = P(A) . P(B) → A e B são independentes.
Pr(A C) ≠ P(A) . P(C) → A e C não são independentes.
Estatística Aplicada
135
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Nesta unidade, aprendemos como caracterizar um experimento aleatório e
como descrever e calcular os possíveis resultados de um fenômeno. Na próxima
unidade, veremos duas distribuições de probabilidade. As distribuições Binomial e
Normal.
Estatística Aplicada
136
Exercícios - Unidade 6
1. Uma urna contém duas bolas brancas e três bolas vermelhas. Suponha que são
sorteadas duas bolas ao acaso, sem reposição. (Enunciado das questões 1 e 2).
1. Qual a probabilidade das duas bolas serem brancas?
a) 0,05
b) 0,08
c) 0,10
d) 0,12
e) 0,15
2. Qual a probabilidade das duas bolas serem vermelhas?
a) 0,30
b) 0,35
c) 0,40
d) 0,45
e) 0,50
3. Uma urna contém 2 bolas brancas e 3 bolas vermelhas. Retira-se 2 bolas sem
reposição. Qual a probabilidade da 2ª ser vermelha, dado que a 1ª é branca?
a) 0,20
b) 0,30
c) 0,35
d) 0,40
e) 0,45
Estatística Aplicada
137
4. Uma companhia de seguros analisou a frequência com que 3.000 segurados
(1.500 homens e 1.500 mulheres) usaram o hospital no último ano. Os resultados
são apresentados na tabela:
Homens Mulheres
Usaram o hospital 250 320
Não usaram o hospital
1250 1180
5. Qual a probabilidade de que uma pessoa segurada use o hospital?
a) Pr= 0,19
b) Pr= 0,22
c) Pr= 0,26
d) Pr= 0,30
e) Pr= 0,31
5. Com base nos dados do exercício anterior, qual a probabilidade de uma mulher
ter usado o hospital?
a) Pr= 0,08
b) Pr= 0,09
c) Pr= 0,107
d) Pr= 0,153
e) Pr= 0,166
Estatística Aplicada
138
6. No posto de saúde de uma cidadezinha do interior, 15.800 crianças foram
atendidas no último ano. A tabela abaixo relaciona a idade das crianças atendidas.
Sexo
Masculino Feminino Total
Idade
< de 1 ano 2.000 800 2.800
1 – 4 anos 4.500 2.500 7.000
> 4 anos 1.800 4.200 6.000
Total 8.300 7.500 15.800
Qual a probabilidade de uma criança selecionada ao acaso ter 4 anos ou menos e
ser do sexo feminino?
a) Pr= 0,209
b) Pr= 0,309
c) Pr= 0,410
d) Pr= 0,433
e) Pr= 0,456
7. Considere o problema 6 e suponha que escolhamos duas crianças ao acaso, com
reposição. Qual a probabilidade de que ambos sejam do sexo masculino?
a) Pr=0,18
b) Pr= 0,20
c) Pr= 0,28
d) Pr= 0,31
e) Pr= 0,35
8. A tabela abaixo dá a distribuição de probabilidades dos quatro tipos de sangue
de indivíduos numa comunidade.
Probabilidades
Tipos de Sangue
A B AB O
De ter o tipo especificado
De não ter o tipo especificado
0,30
0,70
0,20
0,80
0,10
0,90
0,40
0,60
Estatística Aplicada
139
Qual a probabilidade de que dois indivíduos desta comunidade, sorteados ao
acaso, tenham o tipo A e outro o tipo B?
a) Pr= 0,06
b) Pr= 0,20
c) Pr= 0,30
d) Pr= 0,32
e) Pr= 0,35
9. Na tabela abaixo, os números que aparecem são probabilidades relacionadas
com a ocorrência de A, B, A B, etc. Assim, P(A)=0,15, enquanto P(A B)= 0,06.
B B Total
A
A
0,06
0,17
0,09
0,68
0,15
0,85
Total 0,23 0,77 1,00
Verifique se A e B são independentes. Justifique sua resposta.
Estatística Aplicada
140
10. Os dados da tabela são referentes ao estudo efetuado por um psicólogo para
verificar a eficiência do tratamento com seus pacientes.
Sexo Homens
(M)
Mulheres
(F)
Total
Tipo de tratamento
Terapias Alternativas - (T)
70 43 113
Uso de remédios - (R) 25 40 65
Somente análise - (A) 80 42 122
Total 175 125 300
Um paciente é escolhido ao acaso. Qual a probabilidade deste paciente fazer
somente análise, dado que é mulher?
Estatística Aplicada
141
Distribuição de Probabilidade 7
Definição e classificação de variáveis.
Distribuição Binomial.
Distribuição Normal de Probabilidade.
Estatística Aplicada
142
Estudaremos nesta unidade duas importantes distribuições de probabilidade:
Distribuição Binomial e Distribuição Normal.
Quando estudamos fenômenos aleatórios, estamos interessados em
algum resultado ou alguns resultados relacionados ao experimento. As
distribuições de probabilidade permite-nos através de experimentos quantificar os
possíveis resultados de uma variável discreta ou contínua.
OBJETIVOS:
Identificar e calcular problemas relacionados à contagem – Distribuição
Binomial.
Identificar e calcular problemas relacionados a espaços amostrais
contínuos e as variáveis contínuas – Distribuição Normal.
PLANO DA UNIDADE:
Definição e classificação de variáveis.
Distribuição Binomial.
Distribuição Normal de Probabilidade.
Bons estudos.
Estatística Aplicada
143
Definição e classificação de variáveis
Quando estudamos estatística uma das primeiras coisas que aprendemos é
a definição e classificação de uma Variável. Uma variável pode ser classificada como
Variável Qualitativa ou Variável Quantitativa. As variáveis quantitativas são
classificadas como: Quantitativa Discreta e Quantitativa Contínua. Vamos
relembrar:
1. Variável Qualitativa → É aquela que os valores são expressos por
atributos, por exemplo: cor de cabelo, sexo, etc.
2. Variável Quantitativa → É a variável quantificável, ou seja, assume valor
numérico.
Discreta – É a variável que assume valor inteiro. Os dados discretos são
resultados de contagem, por exemplo: número de carros que passam na
ponte Rio de Janeiro – Niterói; atletas que cruzam a linha de chegada da
maratona de São Silvestre, etc.
Contínua – É a variável que assume qualquer valor num intervalo
contínuo, por exemplo: índice da bolsa de valores de New York; pressão
sistólica arterial, etc.
Como existem dois tipos de variáveis quantitativas, ao darmos início ao
estudo das distribuições de probabilidade, essas distribuições também tratam as
variáveis de acordo com a sua classificação. As principais distribuições de
probabilidade são: Binomial, Normal, Uniforme, Bernoulli, Poison, Hipergeométrica,
Beta, Gama, etc.
Estatística Aplicada144
Para a variável discreta a principal distribuição de probabilidade é a
Distribuição Binomial.
Para a variável contínua a principal distribuição de probabilidade é a
Distribuição Normal.
Nosso objeto de estudo nesta unidade são as distribuições Binomial e
Normal, e por que não trabalharmos com as outras distribuições de probabilidade?
Quando trabalhamos com uma variável aleatória discreta, normalmente
temos um problema de contagem. A distribuição Binomial utiliza os parâmetros n
e p, onde n é o tamanho da amostra ou o número de vezes que se faz um
experimento e p a probabilidade de sucesso de um evento acontecer. Com isso,
podemos efetuar experimentos para verificar a probabilidade de sucesso de um
evento acontecer (p) e a probabilidade de insucesso de um evento acontecer (1-p),
quantas vezes forem necessárias.
Quando trabalhamos com uma variável aleatória contínua estamos com
uma variável que pode assumir qualquer valor dentro de um intervalo real. Por
exemplo, velocidade de um Boeing a determinada altitude no período de 1 hora. O
que se observa no emprego de testes estatísticos com este tipo de variável é que as
ocorrências de uma variável qualquer estudada ao acaso, ao longo do experimento
desta variável, em um dado momento, observa-se um comportamento regular nas
ocorrências. E este comportamento regular permitiu que, no estudo de grandes
amostras, criasse um padrão onde o erro de mensuração para estas variáveis
poderiam ser agrupados e classificados dentro de um padrão considerado normal.
As variáveis aleatórias contínuas que seguem a um padrão normal
possuem uma característica gráfica que se enquadra dentro de uma curva,
chamada de curva normal de erros. Esta curva tem a forma de um sino e os erros de
mensuração vão de -3σ a +3σ (lê-se: menos 3 desvios a mais 3 desvios). O desvio
padrão, aqui representado por σ (sigma) significa quanto para + ou para – estamos
afastados da média μ.
Estatística Aplicada
145
Na distribuição normal os parâmetros são: o desvio padrão σ e a média μ.
Área sob uma curva normal a 1, 2 e 3 desvios padrões a contar de cada
lado da média.
Distribuição Binomial
Definição: considere um experimento ξ, e seja A algum evento associado a ξ.
Admitamos que P(A) = p e consequentemente P( A ) = 1-p. Considere n repetições
de ξ. O espaço amostral S será formado por todas as sequências possíveis {a1, a2, ...,
an}, onde cada ai é o evento A ou A , dependendo do que tenha ocorrido na iésima
repetição do experimento (existem 2n dessas sequências). Suponha que P(A) = p
permaneça a mesma para todas as repetições. Seja a variável aleatória que indica o
número de vezes que o evento A tenha ocorrido. Definiremos a variável aleatória
discreta X como variável aleatória Binomial de Parâmetro n e p. Os valores de X
são evidentemente: 0, 1, 2, ..., n; e X~b(n,p) significa que X tem distribuição
binomial de parâmetros n e p.
Estatística Aplicada
146
Teorema:
Seja X uma variável aleatória binomial, então:
Pr{X = k} = Cn,k . pk . (1 – p)n-k k= 0, 1, 2, ..., n.
Cn,k =
)!(!
!
knk
n
EXEMPLIFICANDO
ξ → Lançar um dado 3 vezes
X→ Número de vezes que aparece a face 2.
Determine a probabilidade de X = 0, ou seja, a probabilidade de não aparecer a
face 2 ao lançar o dado 3 vezes.
Temos uma distribuição binomial: X~b(3,1/6)
n =3 p=1/6 X~b(3, 1/6)
Pr{X = k} = Cn,k . pk . (1 – p)n-k
Pr{X = 0} = C3,0 . (1/6)0 . (5/6)3
Pr{X = 0} = 1 . 1 . 125
216
Pr{X = 0} =
216
125
No cálculo efetuado acima, para facilitar as contas, podemos buscar no
anexo a tabela com combinações previamente calculadas.
Estatística Aplicada
147
C3,0→n=3 e k=0
n
0
n
1
n
2
n
3
n
4
n
5
n
6
n
7
n
8
n
9
n
19
n
0
1
2
3 1 3 3 1
.
.
20
EXEMPLIFICANDO
O setor de saúde do trabalhador, ao acompanhar por um longo período a
aplicação de um produto químico domiciliar, verificou que este produto causa
lesões na pele de 40% dos funcionários que trabalham com ele. Ao examinar uma
amostra de 15 destes profissionais, pede-se determinar a probabilidade de causar
lesões na pele em mais de 3 e no máximo em 6 deles.
Temos uma distribuição binomial: X~(15,0,40)
P(3< X ≤6) = Pr(X=4) + Pr(X=5) + Pr(X=6)
osfuncionáridosouCX %58,121258,06,04,0)4Pr( 1144,15
osfuncionáridosouCX %59,181859,06,04,0)5Pr( 1055,15
osfuncionáridosouCX %66,202066,06,04,0)6Pr( 966,15
Então: Pr(X=3) + Pr(X=4) + Pr(X=5) + Pr(X=6) = 0,5817 ou 58,17%
Estatística Aplicada
148
Distribuição Normal de Probabilidade
Vamos apresentar uma distribuição de probabilidade sendo aplicada em
inúmeros fenômenos e utilizada para o desenvolvimento técnico da estatística.
Esta distribuição de Gauss, Laplace ou Gauss Laplace.
Seja X uma variável aleatória contínua com função de densidade dada
por: f(X) =
2
2
1
2
1
X
e x
onde: μ = média distribuição
σ = desvio padrão de X
= 3,71416.....
e = 2,71....
Sendo o seu gráfico:
Para o cálculo das probabilidades, surgem dois grandes problemas:
1. a integração de f(x), pois seria necessário para o desenvolvimento de
séries;
2. a criação de uma tabela, pois f(x) depende de dois parâmetros e isto
provocaria um grande trabalho, por causa das diversas combinações que
poderiam surgir com e .
Estatística Aplicada
149
A maneira de solucionarmos este problema é por meio de uma transformação
de variável e pelo uso de uma particular distribuição chamada de DISTRIBUIÇÃO
NORMAL PADRÃO ou REDUZIDA.
Distribuição Normal Padrão
Seja Z uma variável aleatória, tal que:
ii
X
Z , onde X é uma variável
aleatória normal com média μ e variância
2 .
Média de Z será dada por:
E[Z] = E
X
→ E[Z] significa valor esperado, esperança ou média.
E[Z] =
][(
1
XE
E[Z] = )(
1
E[Z] = 0
Variância de Z será dada por:
XVZ ][2
])[][(
1
][ 2
2
VXVZ
)0(
1
][ 22
2
Z
1][2 Z logo, temos uma função de densidade.
Estatística Aplicada
150
zeZf
x
2
2
2
1
)(
Chamamos de função de densidade Normal Padrão, isto é:
Z~N(0; 1), lê-se: Z tem distribuição normal com μ = 0 e 2 = 1.
Como a média de Z é zero e a variância de Z é 1, as probabilidades sob
Φ(Z) são calculadas e tabeladas, obtendo a função de distribuição de Z.
A notação de uma variável aleatória contínua normal qualquer, será dada
por: X~N(μ;
2 ), lê-se: X tem distribuição normal com média μ e variância 2 .
Φ(Z) = valores tabelados da distribuição normal padrão.
Propriedades da Distribuição Normal
Como foi visto, o gráfico de f(x) de uma V.A.C. (variável aleatória contínua)
normal tem a forma de um sino e é simétrica em relação a média μ. Fixando-se a
média, verifica-se que o “achatamento” está diretamente ligado ao valor do desvio
padrão σ, assim:
21
Estatística Aplicada
151
1a Propriedade:
f(x) é simétrica em relação a μ.
Φ(z) é simétrica em relação a 0.
Estatística Aplicada
152
2a Propriedade:
F(x) tem dois pontos de inflexão cujas abscissas valem μ + σ e μ - σ.
Φ(z) tem dois pontos de inflexão cujas abscissas valem +1 e -1.
Exemplificação de consulta à tabela de Φ(z) através de um exemplo:
P(z ≤ -2,62) = Φ(-2,62)
Z 0 1 2 3 4 5 6 7 8 9
-3,0
-2,9
-2,8
-2,7
-2,60,0044
.
.
.
.
.
.
-0,0
Estatística Aplicada
153
Na primeira coluna à direita, tomamos o número com a casa decimal e na
primeira linha tomamos o número da casa das centenas (após a vírgula), a
interseção desses dois elementos é a probabilidade procurada.
P(z ≤ -2,62) = 0,0044
-Propriedades:
P(z1 ≤ Z ≤ z2) = P(z1 < Z < z2) = Φ(z2) – Φ(z1)
P(Z > z1) = P(Z ≥ z1) = 1 – P(Z ≤ z1) = 1 - Φ(z1)
EXEMPLIFICANDO
1) P(-2 ≤ Z ≤ 1) = Φ(1) – Φ(-2)
P(-2 ≤ Z ≤ 1) = 0,8413 – 0,02275 = 0,81855
P(-2 ≤ Z ≤ 1) = 0,81855
2) P(Z > 1) = 1 – p(Z ≤ 1)
P(Z > 1) = 1 – Φ (1)
P(Z > 1) = 1 – 0,8413
P(Z > 1) = 0,1517
Caso X~N(µ; σ2) o cálculo de qualquer probabilidade será feito
através da normal padrão e a transformação:
Z =
X
~ N(0; 1) isto é, z =
x
logo:
P(X ≤ x) = P(Z ≤ z)
z =
x
P(x1 < X < x2) = P(z1 < Z < z2)
Estatística Aplicada
154
z1 =
1x
z2 =
2x
P(X > x) = P(Z > z)
z =
x
Nas probabilidades anteriores em nada se altera, caso tivéssemos ≥
ou ≤ em vez de > ou <.
Exemplo: X~N(10;25), determine:
X~N(10;25) significa que X tem distribuição normal de média µ=10 e variância
σ2=25, logo σ=5.
a) P(8< x < 11)
b) P(X > 6)
c) P(X < 9)
d) P(X < x) = 0,9918 determine x
a)
40,0
5
2
5
108
25
108
1
z
20,0
5
1
5
1011
2
z
P(8 < X < 11) = P(-0,40 < x < 0,20)
P(8 < X < 11) = Φ(0,20) – Φ(-0,40)
Estatística Aplicada
155
P(8 < X < 11) = 0,5793 – 0,3446 = 0,2347
b)
P(X > 6) = P(Z > z)
8,0
5
106
z
P(Z > -0,8) = 1 – P(Z ≤ -0,8)
P(Z > -0,8) = 1 – Φ (-0,8)
P(Z > -0,8) = 1 – 0,2119 = 0,7881
c)
P(X < 9) = P(Z < z)
2,0
5
109
z
P(X < 9) = P(Z – 0,2)
P(X < 9) = Φ (-0,2)
P(X < 9) = 0,4207
d)
P(X < x) = P(Z < z) = 0,9918
P(Z < z) = 0,9918
Φ(z) = 0,9918 → z=2,4
z =
x
logo, 2,4 =
5
10x
12 = x – 10
12 + 10 = x → x = 22
Estatística Aplicada
156
EXEMPLIFICANDO
Carlos Eduardo e Camélia irão se casar no próximo fim de semana. Eles
ganharam muitos presentes, mas infelizmente ficou faltando um eletroeletrônico
muito importante. Eles não tinham ainda geladeira. Dirigiram-se até uma loja e lá
observaram que os modelos vinham indicando o consumo de energia. O modelo
que eles gostaram possuía as seguintes especificações: o consumo desta geladeira
tende a uma distribuição normal com média de consumo de 220v/dia, com desvio
padrão 20,02. Com essas informações, como Carlos conhecia um pouquinho de
cálculo de distribuição normal, ele ficou curioso em saber qual a probabilidade da
geladeira consumir mais do que 250v/dia.
P(X > 250)= P(Z > z)
50,1
02,20
220250
z
P(X < 250) = 1 –Φ(1,50
P(X < 250) = 1- 0,9332 = 0,0668 ou 6,68%
Estatística Aplicada
157
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Vimos nesta unidade duas distribuições de probabilidade que são de extrema
importância. Para problemas de contagem, a distribuição Binomial e a distribuição
Normal. Vocês verão nas próximas unidades como a distribuição Normal é
importante no estudo da estatística, pois os testes paramétricos seguem um
padrão baseado em uma normalidade que é a curva da distribuição Normal, em
que suas probabilidades já são conhecidas e calculadas dentro da curva da normal.
Estudaremos, na próxima unidade, problemas de correlação e regressão.
Estatística Aplicada
158
Estatística Aplicada
159
Exercícios - Unidade 7
1. Consulte nas tabelas as probabilidades para os seguintes valores de Z: (z=-0,33;
z=0,00; z=3,00 e z=1,12).
a) 0,37070, 0,50000, 0,99865 e 0,86864
b) 0,25700, 0,50000, 0,78956 e 0,86864
c) 0,34570, 0,45674, 0,34564 e 0,98567
d) 0,23450, 0,68743, 0,99865 e 0,23476
e) 0,12364, 0,98765, 0,26777 e 0,12966
2. Consulte nas tabelas o valor de z para as seguintes probabilidades: ( Pr=0,23576,
Pr=0,42858 e Pr=0,85543).
a) z=-0,45, z=-0,24 e z=2,06
b) z=-0,57, z=-0,45 e z=1,76
c) z=-0,72, z=-0,18 e z=1,06
d) z=-0,68, z=-0,35 e z=2,08
e) z=-0,45, z=-0,56 e z=1,06
3. Sabe-se que a probabilidade de um estudante que entra na universidade se
formar é de 12,5%. Determine a probabilidade de que dentre seis estudantes
escolhidos aleatoriamente, nenhum se forme.
a) 0,4390
b) 0,4689
c) 0,4488
d) 0,6388
e) 0,6773
Estatística Aplicada
160
4.Se uma variável aleatória tem distribuição normal com média μ=70 e desvio
padrão σ=4,8. Determine a probabilidade de ela assumir um valor superior a 66,4.
a) 0,7734
b) 0,7844
c) 0,7964
d) 0,8734
e) 0,8994
5. Na manufatura de certo artigo, é sabido que 2 entre dez dos artigos são
defeituosos. Qual a probabilidade de que uma amostra casual de tamanho quatro
contenha exatamente um defeituoso?
a) 0,3105
b) 0,3405
c) 0,4100
d) 0,4096
e) 0,4356
6.No bairro de Buriti, a probabilidade de um carro furtado ser recuperado é de 0,40.
Dentre 10 carros furtados, qual a probabilidade de 3 carros serem recuperados?
a) 0,034
b) 0,304
c) 0,382
d) 0,413
e) 0,423
Estatística Aplicada
161
7. Em um tratamento para alergia em crianças, é ministrado um remédio.
Observou-se que 20% das crianças que tomam tal medicamento ficam sonolentas
em 5 minutos. Determine a probabilidade de que, dentre 20 crianças que tomam o
remédio, no máximo duas ficarem sonolentas dentro de 5 minutos.
a) 0,207
b) 0,227
c) 0,277
d) 0,287
e) 0,297
8. Uma moeda é lançada 5 vezes. Qual a probabilidade de aparecer face cara em
pelo menos 3 lançamentos?
a) 0,452
b) 0,500
c) 0,620
d) 0,660
e) 0,683
9. Em um grupo de 1000 pacientes com idade acima de 60 anos, todos com
diabetes, verificou-se que a glicose média dos pacientes era de 175 mg/dl de
sangue com um desvio padrão de 15 mg/dl. Quantos pacientes possuem glicose
acima de 180 mg/dl?
Estatística Aplicada
162
10. O enfermeiro chefe de um hospital de emergência verificou que 60% de todos
os pacientes que procuram a emergência nos fins de semana não estão em
condições emergenciais. Determine as probabilidades de que, dentre oito
pacientes que dão entrada na sala de emergência, 0, 1, 2, …, 7, 8 não estejam em
condições de emergência.
Estatística Aplicada
163
Correlação e Regressão 8
Correlação.
Regressão.
Métodos dos Mínimos Quadrados.
Estatística Aplicada
164
Estudaremos, nesta unidade, o comportamento de uma variável em
relação à outra através de uma equação linear e a relação existente entre elas e
aprenderemos também, como estimar valores para duas variáveis.
OBJETIVOS DA UNIDADE:
Ajustar uma reta a um conjunto de dados e determinar a equação da reta que
constitui o melhor ajuste.
Calcular e classificar o grau de correlação existente entre duas variáveis.
PLANO DA UNIDADE:
Correlação.
Regressão.
Métodos dos Mínimos Quadrados.
Bons estudos!
Estatística Aplicada
165
Correlação
Quando precisamos estudar a relação existente entre duas variáveis, por
exemplo, peso e altura, com o objetivo de identificar o comportamento entre essas
variáveis, podemos representá-las graficamente e verificar a dispersão existente
entre elas. Para medir esta dispersão temos o Coeficiente de Correlação.
Hoje, com o auxílio da informática podemos rapidamente construir um
gráfico de dispersão. Não havendo uma ferramenta computacional para facilitar
este processo, é bem simples construí-lo manualmente.
EXEMPLIFICANDODada as variáveis X e Y, construa um gráfico de dispersão para representá-
las.
Observações (n) X Y
1 2 3
2 5 4
3 3 2
4 4 5
5 6 8
6 7 10
1o Trace o sistema de eixos cartesianos.
2o Relacione as variáveis aos eixos.
Eixos das abcissas – Variável X.
Eixo das ordenadas – Variável Y.
3o Represente com um ponto, cada par de valores.
Estatística Aplicada
166
O gráfico de dispersão mostra o comportamento entre as duas variáveis,
isto é, se estão relacionadas. Como se comportam? Se X cresce, Y também cresce?
Para respondermos estas perguntas, precisamos calcular o Coeficiente de
Correlação de Pearson - r.
n
y
y
n
x
x
n
yx
xy
r
2
2
2
2 )(.
)(
)).((
Para o exemplo, qual valor de r?
N x Y Xy X2 y2
1 2 3 6 4 9
2 5 4 20 25 16
3 3 2 6 9 4
4 4 5 20 16 25
5 6 8 48 36 64
Diagrama de Dispersão
0
2
4
6
8
10
12
0 2 4 6 8
X
Y
Estatística Aplicada
167
6 7 10 70 49 100
Total 27 32 170 139 218
90,0
275,828
26
33,475,17
26
6
)32(
218
6
)27(
139
6
3227
170
22
x
x
x
r
O que significa r=0,90? Significa que existe uma forte relação positiva
entre as variáveis X e Y, ou seja, quando X cresce Y também cresce.
Intervalo de Variação de r
Os valores de r estão compreendidos dentro de um intervalo que varia de -1 a
+1 ou seja, -1 ≤ r ≤ +1.
Possíveis valores de r.
i)
r > 0 existe forte relação positiva
Estatística Aplicada
168
ii)
iii)
iv)
r < 0 fraca relação negativa
r = 0 ausência de relação
r = 1 relação linear perfeita
Estatística Aplicada
169
Para entender o significado do valor de r, não basta apenas conhecer r, é
preciso uma análise profunda entre as variáveis. O valor indica o tipo de relação
existente, com isso, o pesquisador pode se aprofundar no sentido de estudar a real
relação entre essas variáveis. Vários fatores podem, num dado momento, fazer com
que variáveis que aparentemente possuiriam uma forte relação não atingir esse
resultado. Esses fatores podem ser de causas externas, naturais, etc. É preciso
sensibilidade e conhecimento do estudo que está sendo feito para permitir uma
boa análise dos resultados.
EXEMPLIFICANDO
Foi feito um levantamento com 10 jovens atletas para verificar se
existe relação entre o consumo de proteínas e a perda de peso, no período de 1
semana. Os dados revelados são:
Jovens
Consumo de
proteínas (mg)
X
Peso (kg)
Y
XY
X2
Y2
1 300 4 1200 90000 16
2 250 3,5 875 62500 12,25
3 400 5,5 2200 160000 30,25
4 560 4 2240 313600 16
5 450 2 900 202500 4
6 320 5 1600 102400 25
7 200 1 200 40000 1
8 420 2 840 176400 4
9 320 5 1600 102400 25
10 480 3 1440 230400 9
Total 3700 35 13095 1480200 142,5
Estatística Aplicada
170
Gráfico de dispersão
Coeficiente de correlação r = 0,097
Conclusão: se o atleta fizer uma dieta à base somente de proteínas, com o r
calculado podemos verificar que o grau de correlação é quase nula, ou seja, r é
muito próximo de zero. Mas somente com este resultado, é possível afirmarmos
que não existe realmente nenhuma relação entre as variáveis? É preciso conhecer
uma série de fatores para se chegar a uma conclusão precisa. O que concluímos
com isso? O objetivo é demonstrar que não basta somente obter o valor de r, é
preciso ter conhecimento de vários outros fatores que envolvem a variável em
estudo. A aplicação da teoria da relação entre as variáveis necessita de fatores
externos para uma análise precisa do fato em estudo. É necessário que tenhamos
muito cuidado ao afirmarmos que variáveis que possuem forte relação entre elas,
somente o valor de r basta para comprovar esta relação.
Perda de peso em relação ao consumo de
proteínas
0
1
2
3
4
5
6
0 100 200 300 400 500 600
Proteínas (mg)
Peso
Estatística Aplicada
171
Regressão
O modelo de regressão serve para permitir que possamos examinar o
comportamento de uma variável em relação à outra, ou seja, verificar a existência
de relação entre as variáveis. Por exemplo, existe relação entre:
1. Valor do dólar e exportação de carros.
2. Peso de um atleta e altura.
3. Produção de papel e tempo.
O objetivo é poder verificar se existe relação forte ou fraca entre as
variáveis, existindo esta relação, se ela é funcional ou não, e ainda poder prever
essa relação funcional entre elas.
A análise de regressão permite a verificação dessa relação das variáveis
em estudo, permitindo a interpretação de tais resultados. Como existem duas
variáveis, a análise de regressão mede a dependência existente de uma das
variáveis em relação à outra.
Teremos uma variável dependente (y) que sofrerá influência da variável
independente (x).
Para representarmos as variáveis graficamente utilizamos o mesmo
procedimento do gráfico de dispersão, o que diferencia é que no eixo das abscissas
representamos a variável independente (x) e no eixo das ordenadas, apresentamos
a variável dependente (y). Para representarmos graficamente, marcamos os pares e
ligamos os pontos para formar um gráfico de linhas.
Estatística Aplicada
172
EXEMPLIFICANDO
Os dados são referentes à pressão arterial de pacientes hipertensos
do sexo feminino, segundo a faixa etária, entre 30 e 60 anos, do hospital X.
Paciente Idade (x) PSA (y)
1 30 142
2 32 146
3 43 152
4 45 163
5 50 168
6 53 178
7 51 182
8 55 189
9 60 192
10 60 231
De acordo com o gráfico, que representa a relação existente entre a PSA
(pressão sistólica arterial) das pacientes entre 30 e 60 anos, observamos uma reta.
Os dados poderiam ter qualquer tipo de comportamento, uma reta, uma parábola,
etc. Neste estudo de regressão, vamos trabalhar com equações lineares. Como os
dados representam uma reta, esta é chamada de reta de regressão. E como ajustar
a equação de uma reta? Precisamos, inicialmente, conhecer o coeficiente angular e
o coeficiente linear da reta.
Estatística Aplicada
173
Equação linear → y = a + bx
Coeficiente angular – representado por b, permite medir a inclinação da
reta.
Coeficiente linear – representado por a, é o intercepto de y.
A vantagem da equação linear se deve ao fato de que permite com
facilidade a aproximação, existente entre as variáveis, de uma linearidade. O que
significa esta aproximação? Quando estudamos análise de regressão estamos
estudando o comportamento de uma variável dependente (y) em função da
variável independente (x), logo conhecendo os valores observados para a variável
x, podemos calcular e “estimar” os valores previstos para y.
Pressão Arterial de Mulheres com Idade entre 30 e 60
anos
0
50
100
150
200
250
0 10 20 30 40 50 60 70
Idade
P
S
A
Estatística Aplicada
174
Método dos Mínimos Quadrados
EXEMPLIFICANDO
Número de anos que os alunos de um curso de Engenharia estudaram até
a colação de grau e o coeficiente de rendimento (CR) obtido ao final do
curso.
Alunos n
Anos de estudo x
Coef. de rendimento (CR) y
1 3 57
2 4 78
3 4 72
4 3 58
5 5 89
6 3 63
7 4 73
8 5 84
9 4 76
10 3 48
Total 38 698
Estatística Aplicada
175
Representando os dados graficamente, ou seja, os pares x e y, observamos que
há uma linha reta mesmo não estando todos os
valores sobre ela. Como não há uma dispersão muito acentuada dos valores no
diagrama de dispersão, podemos concluir que a relação existente entre as variáveis
pode ser uma linha reta.
Se os dados observados tendem a uma linha reta, podemos, então, determinar
a equação da reta. Com a equação da reta, podemos prever os valores de y com
relação a x, ou seja, podemos prever, estimar o CR de um aluno de engenharia em
relação aotempo que ele leva para concluir o curso de graduação. O nosso
problema é encontrar um ajuste que seja bem considerável em relação aos dados
observados.
Para ajustarmos a reta dos mínimos quadrados, iremos considerar o conjunto
de n pontos (x1, y1), (x2, y2) , ..., (xn, yn).
Número de Anos de Estudo em Relação ao
Coeficiente de Rendimento dos Alunos
0
20
40
60
80
100
0 1 2 3 4 5 6
Anos
C
R
Estatística Aplicada
176
Equação da reta → ŷ = a + bx.
O ŷ (lê-se: y chapéu) é um valor estimado de y e y, efetivamente, é o valor
observado. O objetivo é que a diferença entre o valor observado de y e o valor
estimado ŷ seja o mínimo possível.
Como calcular o valor estimado de y que será ŷ?
-Equações normais:
Σy = na + b(Σx)
Σ(xy) = a (Σx) + b (Σx2)
Nessas equações, chamadas de equações normais, n é o número de pares
observados, Σ(x) é o somatório dos valores observados de x (variável
independente), e Σ(y) é o somatório dos valores observados de y (variável
dependente). Σx2 é a soma dos valores ao quadrado de x e Σ(xy) é a soma do
produto da variável x pela variável y.
Estatística Aplicada
177
Tomando o exemplo dos alunos de engenharia e calculado os somatório
necessário temos:
Anos de estudo Coef. de rendimento x2 xy
X (CR)
Alunos y
1 3 57 9 171
2 4 78 16 312
3 4 72 16 288
4 3 58 9 174
5 5 89 25 445
6 3 63 9 189
7 4 73 16 292
8 5 84 25 420
9 4 76 16 304
10 3 48 9 144
Total 38 698 150 2739
Σx = 38 Σy = 698 Σx2 = 150 Σxy = 2739 n = 10
Substituindo os valores nas equações normais:
Σy = na + b(Σx)
698 = 10a + b38 →arrumando a equação temos:
698 = 10a + 38b (1)
Σ(xy) = a (Σx) + b (Σx2)
2739 = a38 + b150 →arrumando a equação temos:
2739 = 38a + 150b (2)
Estatística Aplicada
178
Para o cálculo de a e b temos um sistema de equações lineares:
ba
ba
150382739
3810698
Para encontrar os valores de a e b, é necessário igualarmos as duas equações e
efetuar operações matemáticas, simples, que elimine a ou b e, assim, calculado o
valor de a ou de b, permita-se a substituição na equação para o cálculo do outro
valor.
Como precisamos eliminar a ou b faremos a seguinte operação:
Multiplicamos a primeira equação por -3,8, assim podemos eliminar a,
permitindo o cálculo de b.
)8,3(3810698 ba com isso teremos:
ba
ba
150382739
40,1443840,2652
86,60 = 5,6b
46,15
6,5
60,86
60,866,5
b
b
b = 15,46
Substituindo em qualquer uma das equações (1) ou (2), teremos o valor de a.
a = 11,05
05,11
10
52,110
1052,110
1048,587698
48,58710698
46,153810698
3810698
a
a
a
a
xa
ba
Estatística Aplicada
179
Podemos calcular os valores de a e b utilizando sistemas de equações
lineares ou pelo cálculo dos mínimos quadrados.
Fórmulas para o cálculo dos mínimos quadrados
n
x
x
→ média da variável independente.
n
y
y
→ média da variável dependente.
n
x
xSxx
2
2 )(
n
y
yS yy
2
2 )(
n
yx
xySxy
)).((
Os valores das médias, já conhecemos, yex , as outras expressões
permitem uma facilidade para resolução pelo cálculo dos mínimos quadrados.
Cálculo de a e b
xx
xy
S
S
b
xbya
Estatística Aplicada
180
Utilizando o mesmo exemplo, precisamos calcular as médias de x e y e os
valores de y2.
Anos de estudo Coef. de rendimento x2 xy y2
X (CR)
Alunos Y
1 3 57 9 171 3249
2 4 78 16 312 6084
3 4 72 16 288 5184
4 3 58 9 174 3364
5 5 89 25 445 7921
6 3 63 9 189 3969
7 4 73 16 292 5329
8 5 84 25 420 7056
9 4 76 16 304 5776
10 3 48 9 144 2304
Total 38 698 150 2739 50236
8,3
10
38
n
x
x
8,69
10
698
n
y
y
6,54,144150
10
)38(
150
)( 222
n
x
xSxx
6,864,26522739
10
)698).(38(
2739
)).((
n
yx
xySxy
46,15
6,5
6,86
xx
xy
S
S
b → b=15,46
05,1175,588,698,346,158,69 xbya → a=11,05
Estatística Aplicada
181
Vimos duas formas de calcular os valores de a e b para estimação dos
valores da variável dependente y. A escolha do processo de cálculo fica a critério de
quem está calculando. Podemos optar pelo cálculo através do sistema de equações
normais ou pelo método dos mínimos quadrados.
Agora podemos estimar qualquer valor para y.
EXEMPLIFICANDO
Suponha que um aluno leve x=3,5 anos para concluir seu curso de engenharia.
Qual seria o valor estimado do seu coeficiente de rendimento?
x = 7 a = 11,05 b = 15,46 ŷ = a + bx
ŷ = 11,05 + 15,46 x 3,5 = 65,16 → Coeficiente de rendimento estimado = 65,16
Nesta unidade, aprendemos como calcular e analisar o grau de correlação
entre duas variáveis, verificando seu comportamento e se estão ou não
relacionadas.
Vimos, ainda, a relação existente entre duas variáveis e a influência da
variável independente sobre a variável dependente, permitindo, assim, estimar
valores para esta variável através do estimador ŷ.
É HORA DE SE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Estatística Aplicada
182
Exercícios - Unidade 8
1. A tabela abaixo é referente ao número de crianças nascidas vivas (X) e o número
de crianças que morreram (Y), no mesmo período, em um município do interior do
país.
Período Nascidas Vivas Morte por todos os tipos e causas
1985 1100 540
1986 840 720
1987 480 640
1988 2200 380
1989 1840 560
1990 1790 120
Com base na tabela, calcule o coeficiente de correlação.
a) r= -0,6713
b) r= -0,7893
c) r= 0,6713
d) r=0,7893
e) r= 0,8764
2. Com base no r calculado da questão 1, qual o tipo de correlação?
a) Forte relação positiva.
b) Fraca relação positiva.
c) Fraca relação negativa.
d) Ausência de relação.
e) Relação linear perfeita.
Estatística Aplicada
183
3. Nos casos abaixo, que tipo de correlação se espera: correlação positiva,
correlação negativa ou não existe correlação?
1o Número do calçado e QI;
2o Renda e Educação.
a) 1o não há correlação e 2o não há correlação.
b) 1o não há correlação e 2o correlação positiva.
c) 1o correlação positiva e 2o não há correlação.
d) 1o correlação negativa e 2o não há correlação.
e) 1o correlação positiva e 2o correlação positiva.
4. Um estudante de estatística calculou a correlação entre altura e peso de um
grande grupo de alunos do curso de enfermagem de sua faculdade, obtendo
r=0,32, mas não conseguiu decidir se é a altura que faz com que os alunos pesem
mais ou se é o excesso de peso que faz com que os alunos sejam mais altos. O que
você poderia dizer para ele que está desconsolado por não conseguir decidir quem
influencia quem?
a) Ele não tem como saber se o peso influencia a altura ou se a altura
influencia o peso, pois a correlação permite-nos apenas mostrar a
associação entre as variáveis.
b) Ele informa que o peso influencia a altura, pois pessoas com peso elevado
tendem a ser mais baixas.
c) Ele informa que a altura influencia o peso, pois pessoas com estatura
elevada tendem a ter baixo peso.
d) Ele informa que o peso influencia a altura, pois pessoas com peso elevado
tendem a ser mais altas.
e) Ele informa que a altura influencia o peso, pois pessoas de estatura
elevada tendem a ter peso também elevado.
Estatística Aplicada
184
5. A tabela a seguir mostra a quantidade de carros que cada um dos 5 funcionários
vistoriou, em um posto do Detran, entre 16 e 18 horas, em determinado dia.
Número de semanas
trabalhadas (X)
Número de carros inspecionados
(Y)
2 13
7 20
9 22
5 15
12 20
Com base na tabela, estabeleça a equação da reta dos mínimos quadrados que
permiteestimarmos y em termos de x. (Equação da reta → bxay
^
).
a) ŷ=10,10+0,974x
b) ŷ=12,09+0,844x
c) ŷ=15,34+1,163x
d) ŷ=18,34+0,884x
e) ŷ=18,87+1,234x
6. Com a equação da reta do problema 5, estime quantos carros um funcionário
trabalhando 8 semanas poderá inspecionar no mesmo período.
a) Aproximadamente 19 carros.
b) Aproximadamente 20 carros.
c) Aproximadamente 21 carros.
d) Aproximadamente 22 carros.
e) Aproximadamente 23 carros.
Estatística Aplicada
185
7. Considere o quadro abaixo:
x y
90 90
140 150
180 ?
Observamos que um dos valores de y não foi colocado na tabela. Sabendo
que a equação de mínimos quadros é ŷ=28+0,5x, determine o valor de y que falta.
a) 49
b) 58
c) 67
d) 110
e) 120
8. Na análise de regressão as variáveis são classificadas de que forma?
a) X – variável independente Y – variável independente.
b) X – variável independente Y – variável dependente.
c) X – variável dependente Y – variável independente.
d) X – variável dependente Y – variável dependente.
e) X – variável pendente Y – variável independente.
9. Seja a tabela abaixo composta pelo peso (kg) e altura (cm) de crianças com 10
meses de idade.
Altura (cm) Peso (kg)
75 9,0
70 9,2
73 8,9
78 8,5
80 9,5
69 9,6
71 9,1
72 10,0
74 8,7
77 9,4
Estatística Aplicada
186
Determine o coeficiente de correlação de Pearson e verifique que tipo de
correlação existe entre as variáveis peso e altura.
10. Vamos considerar os mesmos dados do exercício anterior. Altura é a variável
Independente e Peso a variável dependente. O objetivo é estimar qual o peso de
uma criança que tem altura de 85 cm. Desenvolva os cálculos necessários e através
da equação da reta ŷ = a + bx e diga qual é o valor.
Estatística Aplicada
187
Considerações finais
Chegamos ao final dos estudos de Estatística.
Ao longo das Unidades de Estudo você aprendeu o quanto a estatística é
importante para compreendermos as pesquisas. Você também aprendeu a fazer
suas próprias pesquisas e discutir seus resultados.
A Universo EAD o parabeniza por ter concluído seus estudos, aumentando sua
bagagem com conhecimentos e habilidades que irão beneficiá-lo por toda a vida.
Mas a aprendizagem não pára por aqui. Mantenha o hábito de ler, atualize-se
sempre e não esqueça de praticar o que foi aprendido.
“Uma visão sem ação é meramente um sonho.
Uma ação sem visão carece de sentido.
Uma visão com ação pode mudar o mundo.”
(Arthur Joel Barker – do filme Descobrindo o futuro)
Sucesso!
Estatística Aplicada
188
Estatística Aplicada
189
Conhecendo o autor
A professora Adriana Santos Augusto é formada em Engenharia Civil pela
UFRJ, pós-graduada em Engenharia Econômica e Administração Industrial,
Engenheira de Segurança do Trabalho pela UFF, Mestre em Engenharia de
Produção pela COPPE/UFRJ e licenciada em Matemática pela UNIVERSO.
Atualmente é coordenadora do Curso de Segurança do Trabalho da Universo,
campus São Gonçalo, tutora do Ensino a Distância e professora da rede de ensino
do Estado do Rio de Janeiro.
Estatística Aplicada
190
Estatística Aplicada
191
Referências
SPIEGEL, M. R.. Estatística. São Paulo: Mc Graw-Hill, 2004
FONSECA, J. S.. Curso de Estatística. São Paulo: Ed. Atlas, 1996.
BIBLIOGRAFIA COMPLEMENTAR:
BUSSAB, W. O. & MORETTIN, P. A. Estatística Básica (Métodos Quantitativos). SP:
Ed. Atual, 1997.
CRESPO, A.A. Estatística Fácil. São Paulo: Ed. Atlas, 2003.
MILONE, G. & ANGELINI, F. Estatística Aplicada. SP: Ed. Atlas, 1995.
STEVENSON, W. J. Estatística Aplicada à Administração. SP: Ed. Harbra, 1986.
TOLEDO, G. L. Estatística Básica. SP: Ed. Atlas, 1985.
Estatística Aplicada
192
Estatística Aplicada
193
nexos A
Estatística Aplicada
194
Material de Apoio
FERRAMENTAS BÁSICAS DA MATEMÁTICA
Um homem musculoso.
Potências.
Um número n elevado a x significa que devemos multiplicar n por n, x vezes.
Ex.:
322.2.2.2.225 , onde 2 é a base 5 é o expoente e 32 é a potência.
Propriedades das Potências.
1ª Propriedade: divisão de potências de mesma base:
Conservamos a base e subtraímos os expoentes.
Ex.: 6
10
2
2
1ª solução: aplicando o conceito inicial.
6
10
2
2
= 16
64
1024
2.2.2.2.2.2
2.2.2.2.2.2.2.2.2.2
2ª solução: aplicando a propriedade.
162.2.2.222
2
2 4610
6
10
(menos trabalhoso)
Estatística Aplicada
195
Ex.: 1
81
81
3.3.3.3
3.3.3.3
3
3
4
4
Pela propriedade temos:
044
4
4
33
3
3
, comparando com a resposta anterior, temos que 130 .
Podemos concluir que: todo número diferente de zero elevado a zero é igual a
um.
Logaritmos.
Um homem sentado pensando. (o Pensador Rodin)
Para entendermos o que seja logaritmo de um número, vamos resolver o seguinte
problema:
Qual é o número que devemos elevar 2 , para dar 8?
Solução:
Vamos chamar de x o número procurado. Podemos, então, escrever:
82 x , como 8 é igual a 32 , chegamos a conclusão de que o número procurado
é 3.
Uma outra forma de enunciar esse problema seria:
Quanto vale o logaritmo de 8 na base 2?
Solução:
Perguntar quanto vale o logaritmo de 8 na base 2 é o mesmo que perguntar qual é
o número que devemos elevar 2 para dar 8?
Portanto o logaritmo de 8 na base 2 é 3.
Estatística Aplicada
196
A simbologia usada neste caso será:
2
8238log 3
De uma forma geral temos:
b
bebncomnbxn x 10,0log
Ex.:
3
813481log 4
Logaritmos Decimais.
São os logaritmos cuja base é 10. São os mais utilizados.
10
loglog nn
A calculadora nos dá o logaritmo na base 10.
Ex.:
103029995,02log
Nos logaritmos decimais não há a necessidade de escrevermos a base, basta
indicarmos nlog .
Propriedades dos Logaritmos.
bbb
mnmn ).(logloglog)ª1
Estatística Aplicada
197
Ex.:
555
12log6log2log
bbb
m
n
mn logloglog)ª2
Ex.
2log3log6log (a base, neste caso, é 10)
bb
nnx xloglog.)ª3
Ex.:
33
25log5log.2
Obtenção do logaritmo através da calculadora
Sugestão: uma calculadora saindo fumaça
A calculadora possui uma tecla com o ícone log (base 10). Para calcularmos
logaritmos com bases diferentes de 10, devemos aplicar a fórmula para mudar a
base, ou seja, passarmos para base 10.
Fórmula para mudança de base:
b
nlog
b
n
log
log
Estatística Aplicada
198
Ex.:
Usando a calculadora, obtenha os seguintes valores:
32
5log)3log) ba
Solução:
5850,1
3010,0
4771,0
2log
3log
) a
4651,1
4771,0
6990,0
3log
5log
) b
Resolução de expressões matemáticas
Certos problemas, que envolvem cálculos de expressões matemáticas, deverão ser
resolvidos da seguinte maneira:
1º) calculamos as potências, os logaritmos e os radicais.
2º) calculamos as multiplicações e as divisões.
3º) calculamos as somas e as subtrações.
Ex.1:
Utilizando uma calculadora, resolva a expressão abaixo, com 5 casas decimais.
2
13
6
8log.426
Estatística Aplicada
199
84918,58
:
246154,061236,364
:
2
13
6
90309,0.464
:log
:
teremossubtraçõesasesomasasCalculando
teremosdivisõesaseçõesmultiplicaasCalculando
teremosarítmososepotênciasasCalculando
Solução
Ex. 2:
Utilizando uma calculadora, resolva a expressão abaixo, com 3 casas decimais
25175,3log.578,6
Resolvendo na ordem temos:
47,28
24187,260,2
241574,0.560,2
Expressões com parêntesis, colchetes e chaves
Resolvemos primeiro o que estiver dentro dos parêntesis, depois o que estiver
dentro do colchete e finalmente o que estiver dentro das chaves.
Ex.:utilizando a calculadora, resolva a expressão abaixo com 4 casas decimais.
}5,42]2,4)12log3.(28,5[log5.4,6{ 34
Solução:
Resolvendo o parêntesis:
}5,42]2,4)0792,181.(28,5[log5.4,6{ 3
}5,42]2,49208,79.28,5[log5.4,6{ 3
Estatística Aplicada
200
Resolvendo o colchete:
}5,42]2,49208,79.27634,0[5.4,6{ 3
}5,42]2,48416,1597634,0[5.4,6{ 3
}5,428050,1645.4,6{ 3
Resolvendo a chave:
}5,488050,1645.4,6{
}5,488050,16432{
3050,193
Equação do 1º grau
Forma da equação:
ax + b = 0 (a e b são números reais, )0( a , e x é valor a ser determinado)
Para calcularmos o valor de x, usarmos a fórmula:
a
b
x
Ex.:
1º) Resolva a equação 2x + 3 = 0
Solução:
Temos a = 2 e b = -3, portanto x = 5,1
2
3
xx
a
b
Podemos verificar que x = -1,5 é o único valor de x que torna o binômio 2x – 3 igual
a zero.
Equação do 2º grau.
Forma da equação:
02 cbxax (onde a, b, c são números reais, ( 0a ) e x é o valor a ser
determinado.
Estatística Aplicada
201
Para calcularmos o valor de x usamos a fórmula:
a
acbb
x
2
42
Ex.: 1º) Resolva a equação: 0642 2 xx .
Solução:
Temos a = 2; b = -4 ; c = -6.
Aplicando a fórmula:
1
4
84
3
4
84
4
84
4
644
2.2
)6.(2.4)4()4(
2
1
2
x
x
x
x
x
Podemos afirmar que -1 e 3 são os únicos valores que tornam a expressão
642 2 xx igual a zero.
Estatística Aplicada
202
2º) O quadrado de um número positivo menos o seu dobro vale 8. Calcule esse
número.
Solução:
Quadrado de um número =
2x
Dobro do número = 2x
Podemos, então, escrever: 822 xx . Devemos passar o 8 para o outro lado
da igualdade trocando o sinal.
0822 xx
Conseguimos com isso uma equação do 2º grau.
8
2
1
0822
c
b
a
xx
Aplicando a fórmula:
2
2
62
4
2
62
2
62
2
362
1.2
)8.(1.4)2()2( 2
x
x
Estatística Aplicada
203
Como o exercício afirma que o número é positivo a resposta será 4.
Razão e Proporção.
Razão é uma fração em que o numerador e o denominador representam uma
mesma unidade (área, volume, comprimento, valor, temperatura, tempo, etc.),
sendo que o denominador não pode ser zero.
Ex.: o salário de um mecânico é R$ 1500,00 e de seu ajudante é R$ 500,00.
Calcule a razão entre o seu salário e o reajuste.
Solução:
3
1
15
5
1500
500
A razão entre o salário e o reajuste será
3
1
Proporção é a igualdade entre duas razões.
Ex.: no exemplo anterior temos uma proporção, ou seja,
3
1
15
5
Dizemos que 5 está para 15 assim como 1 está para 3.
De uma forma geral temos:
q
p
n
m
meiospen
extremosqem
esconsequentqen
esantecedentpem
Estatística Aplicada
204
Em toda proporção, o produto dos meios é igual ao produto dos extremos.
n.p = m.p
Ex.: vamos calcular o valor de x, conhecendo a proporção:
5
2
3
8
x
Solução:
Como o produto dos meios é igual ao produto dos extremos, temos:
2.(x + 3) = 5.8
2x + 6 = 40
Resolvendo a equação do 1º grau, encontramos x = 17.
É HORA DE AVALIAR!
Lembre-se de realizar as atividades desta unidade de estudo. Elas irão
ajudá-lo a fixar o conteúdo, além de proporcionar sua autonomia no processo de
ensino-aprendizagem.
Caro aluno, chegamos ao fim do nosso material. Aprendemos os recursos
básicos da matemática para darmos início ao estudo da matemática financeira. No
próximo material estudaremos os regimes de capitalização.
Estatística Aplicada
205
Valores da Raiz Quadrada de n
N Raiz n Raiz n Raiz n Raiz
1 1,000000 26 5,099020 51 7,141428 76 8,717798
2 1,414214 27 5,196152 52 7,211103 77 8,774964
3 1,732051 28 5,291503 53 7,280110 78 8,831761
4 2,000000 29 5,385165 54 7,348469 79 8,888194
5 2,236068 30 5,477226 55 7,416198 80 8,944272
6 2,449490 31 5,567764 56 7,483315 81 9,000000
7 2,645751 32 5,656854 57 7,549834 82 9,055385
8 2,828427 33 5,744563 58 7,615773 83 9,110434
9 3,000000 34 5,830952 59 7,681146 84 9,165151
10 3,162278 35 5,916080 60 7,745967 85 9,219544
11 3,316625 36 6,000000 61 7,810250 86 9,273618
12 3,464102 37 6,082763 62 7,874008 87 9,327379
13 3,605551 38 6,164414 63 7,937254 88 9,380832
14 3,741657 39 6,244998 64 8,000000 89 9,433981
15 3,872983 40 6,324555 65 8,062258 90 9,486833
16 4,000000 41 6,403124 66 8,124038 91 9,539392
17 4,123106 42 6,480741 67 8,185353 92 9,591663
18 4,242641 43 6,557439 68 8,246211 93 9,643651
19 4,358899 44 6,633250 69 8,306624 94 9,695360
20 4,472136 45 6,708204 70 8,366600 95 9,746794
21 4,582576 46 6,782330 71 8,426150 96 9,797959
22 4,690416 47 6,855655 72 8,485281 97 9,848858
23 4,795832 48 6,928203 73 8,544004 98 9,899495
24 4,898979 49 7,000000 74 8,602325 99 9,949874
25 5,000000 50 7,071068 75 8,660254 100 10,000000
Estatística Aplicada
206
Valores do Logaritmo de n
N log n log n log n log
1 0,000000 26 1,414973 51 1,707570 76 1,880814
2 0,301030 27 1,431364 52 1,716003 77 1,886491
3 0,477121 28 1,447158 53 1,724276 78 1,892095
4 0,602060 29 1,462398 54 1,732394 79 1,897627
5 0,698970 30 1,477121 55 1,740363 80 1,903090
6 0,778151 31 1,491362 56 1,748188 81 1,908485
7 0,845098 32 1,505150 57 1,755875 82 1,913814
8 0,903090 33 1,518514 58 1,763428 83 1,919078
9 0,954243 34 1,531479 59 1,770852 84 1,924279
10 1,000000 35 1,544068 60 1,778151 85 1,929419
11 1,041393 36 1,556303 61 1,785330 86 1,934498
12 1,079181 37 1,568202 62 1,792392 87 1,939519
13 1,113943 38 1,579784 63 1,799341 88 1,944483
14 1,146128 39 1,591065 64 1,806180 89 1,949390
15 1,176091 40 1,602060 65 1,812913 90 1,954243
16 1,204120 41 1,612784 66 1,819544 91 1,959041
17 1,230449 42 1,623249 67 1,826075 92 1,963788
18 1,255273 43 1,633468 68 1,832509 93 1,968483
19 1,278754 44 1,643453 69 1,838849 94 1,973128
20 1,301030 45 1,653213 70 1,845098 95 1,977724
21 1,322219 46 1,662758 71 1,851258 96 1,982271
22 1,342423 47 1,672098 72 1,857332 97 1,986772
23 1,361728 48 1,681241 73 1,863323 98 1,991226
24 1,380211 49 1,690196 74 1,869232 99 1,995635
25 1,397940 50 1,698970 75 1,875061 100 2,000000
Estatística Aplicada
207
Distribuição Normal Padrão - Valores Negativos de Z
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,0 0,00135 0,00131 0,00126 0,00122 0,00118 0,00114 0,00111 0,00107 0,00104 0,00100
-2,9 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139
-2,8 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193
-2,7 0,00347 0,00336 0,00326 0,00317 0,00307 0,00298 0,00289 0,00280 0,00272 0,00264
-2,6 0,00466 0,00453 0,00440 0,00427 0,00415 0,00402 0,00391 0,00379 0,00368 0,00357
-2,5 0,00621 0,00604 0,00587 0,00570 0,00554 0,00539 0,00523 0,00508 0,00494 0,00480
-2,4 0,00820 0,00798 0,00776 0,00755 0,00734 0,00714 0,00695 0,00676 0,00657 0,00639
-2,3 0,01072 0,01044 0,01017 0,00990 0,00964 0,00939 0,00914 0,00889 0,00866 0,00842
-2,2 0,01390 0,01355 0,01321 0,01287 0,01255 0,01222 0,01191 0,01160 0,01130 0,01101
-2,1 0,01786 0,01743 0,01700 0,01659 0,01618 0,01578 0,01539 0,01500 0,01463 0,01426
-2,0 0,02275 0,02222 0,02169 0,02118 0,02068 0,02018 0,01970 0,01923 0,01876 0,01831
-1,9 0,02872 0,02807 0,02743 0,02680 0,02619 0,02559 0,02500 0,02442 0,02385 0,02330
-1,8 0,03593 0,03515 0,03438 0,03362 0,03288 0,03216 0,03144 0,03074 0,03005 0,02938
-1,7 0,04457 0,04363 0,04272 0,04182 0,04093 0,04006 0,03920 0,03836 0,03754 0,03673
-1,6 0,05480 0,05370 0,05262 0,05155 0,05050 0,04947 0,04846 0,04746 0,04648 0,04551
-1,5 0,06681 0,06552 0,06426 0,06301 0,06178 0,06057 0,05938 0,05821 0,057050,05592
-1,4 0,08076 0,07927 0,07780 0,07636 0,07493 0,07353 0,07215 0,07078 0,06944 0,06811
-1,3 0,09680 0,09510 0,09342 0,09176 0,09012 0,08851 0,08691 0,08534 0,08379 0,08226
-1,2 0,11507 0,11314 0,11123 0,10935 0,10749 0,10565 0,10383 0,10204 0,10027 0,09853
-1,1 0,13567 0,13350 0,13136 0,12924 0,12714 0,12507 0,12302 0,12100 0,11900 0,11702
-1,0 0,15866 0,15625 0,15386 0,15151 0,14917 0,14686 0,14457 0,14231 0,14007 0,13786
-0,9 0,18406 0,18141 0,17879 0,17619 0,17361 0,17106 0,16853 0,16602 0,16354 0,16109
-0,8 0,21186 0,20897 0,20611 0,20327 0,20045 0,19766 0,19489 0,19215 0,18943 0,18673
-0,7 0,24196 0,23885 0,23576 0,23270 0,22965 0,22663 0,22363 0,22065 0,21770 0,21476
-0,6 0,27425 0,27093 0,26763 0,26435 0,26109 0,25785 0,25463 0,25143 0,24825 0,24510
-0,5 0,30854 0,30503 0,30153 0,29806 0,29460 0,29116 0,28774 0,28434 0,28096 0,27760
-0,4 0,34458 0,34090 0,33724 0,33360 0,32997 0,32636 0,32276 0,31918 0,31561 0,31207
-0,3 0,38209 0,37828 0,37448 0,37070 0,36693 0,36317 0,35942 0,35569 0,35197 0,34827
-0,2 0,42074 0,41683 0,41294 0,40905 0,40517 0,40129 0,39743 0,39358 0,38974 0,38591
-0,1 0,46017 0,45620 0,45224 0,44828 0,44433 0,44038 0,43644 0,43251 0,42858 0,42465
0,0 0,50000 0,49601 0,49202 0,48803 0,48405 0,48006 0,47608 0,47210 0,46812 0,46414
Estatística Aplicada
208
Distribuição Normal Padrão - Valores Positivos de Z
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,99900
Estatística Aplicada
209
Coeficientes Binomiais - Cn,k =
)!(!
!
knk
n
n
0
n
1
n
2
n
3
n
4
n
5
n
6
n
7
n
8
n
9
n
19
n
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
9 1 9 36 84 126 126 84 36 9 1
10 1 10 45 120 210 252 210 120 45 10 1
11 1 11 55 165 330 462 462 330 165 55 11
12 1 12 66 220 495 792 924 792 495 220 66
13 1 13 78 286 715 1287 1716 1716 1287 715 286
14 1 14 91 364 1001 2002 3003 3432 3003 2002 1001
15 1 15 105 455 1365 3003 5005 6435 6435 5005 3003
16 1 16 120 560 1820 4368 8008 11440 12870 11440 8008
17 1 17 136 680 2380 6188 12376 19448 24310 24310 19448
18 1 18 153 816 3060 8568 18564 31824 43758 48620 43758
19 1 19 171 969 3876 11628 27132 50388 75582 92378 92378
20 1 20 190 1140 4845 15504 38760 77520 125970 167960 184756
Estatística Aplicada
210
Alfabeto Grego
Maiúsculo Minúsculo Nome
alfa
beta
gama
delta
épsilon
dzeta
eta
teta
iota
kapa
lâmbda
mü(mi)
nü (ni)
Ksi
ônicron
pi
rô
sigma
tau
úpsilom (ipsilon)
fi
chi (qui)
psi
ômega
Estatística Aplicada
211
Medidas de Tendência Central
n
f
x i
i
ii
f
fx
x
)(
*
*
)(2 h
f
F
f
lMd
ant
i
i
2
** Ll
Mo
*
21
1* h
DD
D
lMo
)(
*
2
)(
*
1
post
ant
ffD
ffD
Medidas de Dispersão
1
)( 22
n
xx
s i
1
)( 22
n
fxx
s ii
2ss
100
x
s
CV
Estatística Aplicada
212
Amostragem
Contínua Discreta Correção
2
0
d
Z
n
2
^^
2
0 d
qpZ
n
N
n
n
n
1
0
Probabilidade
Pr(A) =
possíveiscasosdeNúmero
favoráveiscasosdeNúmero
Pr(AB) = Pr(A) + Pr(B) – Pr(AB)
Pr(B ) = 1 – Pr(B)
)Pr(
)Pr(
)/Pr(
B
BA
BA
)/Pr().Pr()Pr(
)Pr(
)Pr(
)/Pr( BABBA
B
BA
BA
)/Pr().Pr()Pr(
)Pr(
)Pr(
)/Pr( ABABA
A
BA
AB
Pr(A B) = Pr(A) . Pr(B)
Pr{X = k} = Cn,k . p
k . (1 – p)n-k k= 0, 1, 2, ..., n.
z =
x
→ P(z1 ≤ Z ≤ z2) = P(z1 < Z < z2) = Φ(z2) – Φ(z1)
Estatística Aplicada
213
n
y
y
n
x
x
n
yx
xy
r
2
2
2
2 )(.
)(
)).((
y = a + bx
ŷ = a + bx
Equações normais:
Σy = na + b(Σx) e Σ(xy) = a (Σx) + b (Σx2)
Cálculo dos mínimos quadrados:
n
x
x
n
y
y
n
x
xSxx
2
2 )(
n
yx
xySxy
)).((
Cálculo de a e b
xx
xy
S
S
b
xbya
Estatística Aplicada
214
Material de Apoio - Exercícios
Ferramentas básicas da matemática
1. Sabendo que 203 x , com o auxílio da calculadora, podemos afirmar que
x vale aproximadamente:
a) 1,86
b) 2,73
c) 3,49
d) 4,52
e) 5,15
2. Se 4log 2 x , então x vale:
a) 0
b) 2
c) 10
d) 100
e) 1000
3. O valor de 5log2log é:
a) 0
b) 1
c) 7log
d) 32log
e) log 20
4. O valor da expressão 7log5log 23 é, aproximadamente, igual a:
a) 2,1
b) 3,2
c) 4,7
d) 5,7
e) 6,8
Estatística Aplicada
215
5. O valor da expressão 32})]238[(150{ é, aproximadamente, igual
a:
a) 0
b) 5
c) 10
d) 26
e) 59
6. Usando uma calculadora para resolver a equação 0,12567901x +
1,35571761x = 3, encontramos para x o valor:
a) 2,025116002
b) 3,046716334
c) 4,015699115
d) 5,31476601
e) 6,77163725
7. 15% de xvale 0,384. O valor de x é:
a) 1,46
b) 2,56
c) 4,82
d) 5,78
e) 8,14
8. Qual item representa uma proporção?
a)
3
4
5
2
b)
5
8
2
3
c)
9
12
3
4
d)
6
8
5
7
e)
3
10
9
5
Estatística Aplicada
216
9. Considere as equações 01282 xx e 043 x . Calcule a soma
das raízes das duas equações.
10. Calcule o valor de k na expressão
7
5
3
1
k
Estatística Aplicada
217
Gabarito Material de Apoio
1 (b) – 2 (d) – 3 (b) – 4 (d) – 5 (a) – 6 (a) – 7(b) – 8 (c)
9 -
6
2
2
48
2
12.1.4648
0128
ª.1
2
1
2
x
x
x
x
xx
Equação
3
4
043
ª.2
x
x
Equação
Resposta: A soma será
3
28
3
4
26
10 -
8
715
157
k
k
k
Estatística Aplicada
218
Gabaritos – Unidades de Estudo
UNIDADE 1
1. e
2. b
3. b
4. b
5. e
6.. d
7. e
8. d
9.
a) AA = 9,9 – 1,1 = 8,8
b) Através da Regra de Sturges
i 1 + 3,3 lo80 = 7,27 7
c) h = AA/i = 8,8/7 = 1,25 1,3
d)
i Classes Marcação fi
1 1,1 | 2,4 // 02
2 2,4 | 3,7 // 02
3 3,7 | 5,0 / 01
4 5,0 | 6,3 / 01
5 6,3 | 7,6 ////////// ///////// 19
6
7,6 | 8,9
////////// ////////// //////////
///////// 39
7 8,9 |10,2 ////////// ////// 16
80
e)
i Classes fi
1 1,1 | 2,4 02
2 2,4 | 3,7 02
3 3,7 | 5,0 01
4 5,0 | 6,3 01
5 6,3 | 7,6 19
6 7,6 | 8,9 39
7 8,9 |10,2 16
80
Estatística Aplicada
219
10.
Classes fi fri fri (%) Fi xi
10 | 20 14 0,28 28 14 15
20 | 30 6 0,12 12 20 25
30 | 40 12 0,24 24 32 35
40 | 50 7 0,14 14 39 45
50 | 60 10 0,2 20 49 55
60 | 70 1 0,02 2 50 65
1,00 - -
UNIDADE 2
1.
Idade 0 1 2 3 4 5
Crianças 4 3 6 3 0 6 22
A terceira classe é a classe cuja idade é 2. Para resolver esta questão utilizamos a
regra de três:
9818,9822160.2160.222360622
360
6
22 xxxx
x
2. b - Devemos usar o gráfico de setores quando queremos destacar uma parte do
todo.
3. c
4. a
5. a
6. b
7. c
8. c
9. Observe o percentual de transmissão da doença através do sexo. Observe
também a divisão das idades e de sexo. Por exemplo: A maioria dos doentes é do
sexo masculino, assim como a maioria têm de 20 à 39 anos de idade. A maior fonte
de contágio é por via sexual. Comente os dados do gráfico e tente tirar conclusões
sobre ele. Não diga coisas do tipo “os homens são mais promíscuos do que as
mulheres, pois os gráficos não dizem isso.
Estatística Aplicada
220
10.
a)
b)
UNIDADE 3
1. a
00,1050
10
500.10
10
600.6000.1400.2500
3142
200.23000.1160042502
X
2. a
dias afastados
Estatística Aplicada
221
0,4
5
20
5
36542 AX
4,4
5
22
5
39820 BX
2,4
5
21
5
16257 CX
3. e
Ordenando o rol, a mediana será o valor que estiver no meio do rol.
A B C
2 0 1
3 2 2
4 3 5
5 8 6
6 9 7
4. c - Ordenando o rol, a mediana será o valor que estiver no meio do rol.
Salários em S.M * Idade
4,00 28
4,56 29
5,60 32
5,75 36
6,00 40
5. c - Quando não se especifica nada a respeito da moda, calcula-se a moda de
Czuber por ser mais correta. A classe modal será aquela que tiver a maior
frequência.
Classe de Salários (R$) fi
500 650 15
650 800 18
800 950 23
950 1100 19
1100 1250 8
83
Estatística Aplicada
222
*
21
1* h
DD
D
lMo
)800950(
54
5
800
oM
150
9
4
800 oM
9
600
800 oM 33,883oM
em que: D1 = f* - f(ant) D1 = 23 – 18 = 5
D1 = f* - f(post) D2 = 23 – 19 = 4
6.. b
Para o cálculo da mediana, precisamos saber primeiro qual a classe mediana, para
isso calculamos as frequências acumuladas.
Classe de Salários (R$) fi FI
500 650 16 16
650 800 19 16 + 19 = 35
800 950 23 35 + 23 = 58
950 1100 19 58 + 19 = 77
1100 1250 8 77 + 8 = 85
85
A posição da mediana será 435,42
2
85 . O 43º número está na terceira
classe que é a classe mediana.
*
*
)(
.2 h
f
F
f
lM
ant
i
id
= 150.
23
35
800 2
85
= dM =
848,91
Estatística Aplicada
223
7. a
Para o cálculo da nota média, basta somar todos os números e dividir por 20.
20
325
20
1914131716161518191616151512171720141917
X
25,16
8. d
Para calcular a média aritmética para distribuição de frequência com intervalos de
classe, temos primeiramente que calcular o ponto médio das classes.
CIGARROS CONSUMIDOS DIARIAMENTE FREQUÊNCIA
if
ix ii fx
15 | 20
20 | 25
25 | 30
30 | 35
35 | 40
150
300
250
200
100
(15 + 20)/2 = 17,5
22,5
27,5
32,5
37,5
150 x 17,5 =
2625
6750
6875
6500
3750
Total 1000 26500
A média aritmética será, então: 5,26
1000
26500 X
Estatística Aplicada
224
9.
504090 AT
10.
PESO (kg) f i Fr
40 | 50
50 | 60
60 | 70
70 | 80
80 | 90
4
12
20
12
2
4/50 = 0,08
12/50 = 0,24
20/50 = 0,40
12/50 = 0,24
2/50 = 0,04
50 1,00
UNIDADE 4
1. e
Para o cálculo do desvio padrão, devemos primeiro calcular a média aritmética.
88
6
528
6
8611092889062
n
fx
X
ii
páginas.
Como o desvio padrão é a raiz quadrada da variância, calculamos primeiro a
variância, que será:
16
8886881108892888888908862
1
222222
2
2
n
Xx
s i
8.236
5
1184
5
44841604676
5
22240226
222222
2 s
1539.158.2362 ss páginas.
2. d
Como no exercício anterior, para o cálculo do desvio padrão devemos primeiro
calcular a média aritmética.
4
9
36
9
396431253
n
fx
X ii .
Estatística Aplicada
225
Como o desvio padrão é a raiz quadrada da variância, calculamos primeiro a
variância que será:
19
434946444341424543
1
222222222
2
2
n
Xx
s i
75.5
8
46
8
1254019411
8
152013211 222222222
s
4.275.52 ss .
3. c
%42,26100
53
14
%100
X
CVPB
%52100
25
13
%100
X
CVPC
4. d
Pontos dispersos ao redor da média são pontos distantes da média. Quando
os pontos de uma distribuição estão próximos da média, a distribuição possui
menor dispersão, quando estão distantes da média, a distribuição possui maior
dispersão. Ou seja, no caso acima, os pontos A e D possuem maior dispersão ao
redor da média.
5. d
Para o cálculo do desvio padrão, devemos primeiro calcular a média aritmética.
Variável Idade
4,36
5
182
5
4843353224
n
fx
X ii anos.
Como o desvio padrão é a raiz quadrada da variância, calculamos primeiro a
variância, que será:
15
4,36484,36434,36354,36324,3624
1
222222
2
n
Xx
s i
Estatística Aplicada
226
3,88
4
2,353
4
56,13456,4396,136,1976,153
4
6,116,64,14,44,12 222222
s
4,93,882 ss anos.
Variável Salário
35,801.2 $
5
74,006.14
5
00,125.4...45,893.103,452.1
R
n
fx
X ii
Como o desvio padrão é a raiz quadrada da variância, calculamos primeiro a
variância, que será:
39,900.401.1
4
54,601.607.5
4
65,323.1...32,349.1 222 s
02,184.1 $39,14019002 Rss
6.. e
Para a variável idade temos:
%82,25100
4,36
4,9
%100
X
CVP
Para variável salário temos:
%27,42100
35,801.2
02,184.1
%100
X
CVP
7. a
Para o cálculo da variância devemos primeiro calcular a média aritmética.
33,10$
12
124
12
1711156312181013577
R
n
fx
X ii
A variância será:
52,23
11
67,258
112
33,1017...33,107 222
s
Estatística Aplicada
227
8. e
Para o cálculo da variabilidade relativa precisaremos da média e do desvio padrão.
33,10 $
12
124
12
1711156312181013577
R
n
fx
X ii
O desvio padrão será:
52,23
11
67,258
112
33,1017...33,107 222
s
85,4 $52,232 Rss
O CVP então será:
%95,46100
33,10
85,4
%100
X
CVP
9.
Para resolver esta questão precisamos calcular o coeficiente de variação.
TV do Carlos → %08,3100
120
7,3 CV
TV do Pedro → %52,4100
115
2,5 CV
Justificativa: O Pedro pagará mais pelo consumo de energia da televisão, pois o
coeficiente de variação é maior. Significa que a chance da TV do Pedro consumir os
115 kw é menor do que a do Carlos, ou seja, quanto maior o coeficiente de variação
mais heterogêneo são os valores.
Estatística Aplicada
228
10
Para o cálculo do desvio padrão devemos primeiro calcular a média aritmética.
6
7
42
7
13875432
n
fx
X ii
Como o desvio padrão é a raiz quadrada da variância, calculamos primeiro a
variância que será:
17
613686765646362
1
22222222
2
n
Xx
s i
14
6
84
6
494114916
6
)7(211234 2
222222
2
s
74,3142 ss
Aproximadamente 3,74.
UNIDADE 5
1. e
2. d
3. e
4. d
5. e
6.. a
7. d
8. d
9.
Nesse caso, a variável escolhida é contínua e a população estudada é infinita. O
desvio padrão é 15, o erro amostral é de 1,5 e Z = 1,96. Sendo assim:
Normalmente utilizamos os níveis de cobrança:
Para 95% Z=1,96
99% Z=2,58
2
d
Z
n
= 38416,384
5,1
1596,1
2
n
O tamanho da amostra é, então, de 384 peças.
Estatística Aplicada
229
10
Nesse caso, a variável é contínua e a população estudada é finita de 1600 peças. O
desvio padrão é 15, o erro amostral é de 1,5 e Z = 1,96. Sendo assim, a fórmula
usada será:
16,3846,19
5,1
4,29
5,1
1596,1 2
222
0
d
Z
n
Como a população é finita devemos fazer a devida correção:
N
n
n
n
0
0
1
31078,309
2401,1
16,384
2401,01
16,384
1600
16,384
1
16,384
1 0
0
N
n
n
n
Estatística Aplicada
230
UNIDADE 6
1. c
12,2 C (observar tabela de coeficientes Binomiais)
102,5 C (observar tabela de coeficientes Binomiais)
10,0
10
1 RBP
Coeficientes Binomiais - Cn,k =
)!(!
!
knk
n
2. a
32,3 C (observar tabela de coeficientes Binomiais)
102,5 C (observar tabela de coeficientes Binomiais)
30,0
10
3 RVP
3. b
4,0
5
2
BP
75,0
4
3
)/( PVP
30,05,06,0Pr )( BA
4. a
19,0...193333,0
3000
320250 SP
Estatística Aplicada
231
5. c
107,0...10666,0
3000
320 SP
6.. a
209,0
800.15
500.2800
4
MaP
7. c
28,0
800.15
300.8
800.15
300.8
2 MoP
8. a
06,020,030,0, BAP
9.
Para A e B serem independentes P(A B)= P(A).P(B)
P(A).P(B) = 0,15.0,0,23=0,03 ≠ 0,06 não são independentes.
10.
P(A/F) =
)(
)(
FP
FAP
= 33,0
42,0
14,0
300/125
300/42
UNIDADE 7
1. a
Buscamos na tabela da normal as probabilidades correspondentes aos valores de z.
Z= -0,33
2. c
Fazemos agora, o contrário, a partir da probabilidade buscamos na tabela o valor
de z correspondente.
Pr= 0,23576
3. c
Distribuição Binomial
p=0,125 (12,5%)
q=0,875 (1-p=1-0,125=0,875)
n=6
Teorema:
Seja X uma variável aleatória binomial, então:
Estatística Aplicada
232
Pr{X = k} = Cn,k . pk . (1 – p)n-k k= 0, 1, 2, ..., n. - Cn,k =
)!(!
!
knk
n
A probabilidade de nenhum estudante se formar é k=0, ou seja, Pr{X=0}.
Pr{X=0}= 4488,04488,011875,0125,0 600,6 C
Pr{X=0}=0,4488
Para o cálculo de
!6!0
!6
0,6
C , pode-se consultar a tabela de binomial e buscar
o resultado.
Coeficientes Binomiais - Cn,k =
)!(!
!
knk
n
4. a
Sempre que estamos trabalhando com a probabilidade do valor estar acima
(superior a 66,4), temos que levar em consideração que:
O espaço amostral possui 100% ou 1;
Buscamos o valor da probabilidade que está a partir do valor especificado;
Subtraímos 1 - a probabilidade calculada.
z =
x
Pr{X>66,4) = 1- Pr{Z<z)
Pr{X>66,4) = 1- Φ(z)
Pr{X>66,4) = 1- Pr{X≤66,4) =
7734,022663,01)75,0(1
8,4
704,66
1
Pr{X>66,4) = 0,7734
5. d
p=0,2
q=0,8
n=4
k=1
Estatística Aplicada
233
Pr{X=1}=
4096,0512,02,04512,02,0
!3!1
!4
8,02,0 311,4
C
Pr{X=1}= 0,4096
6.. c
p=0,40
q=0,60
n=10
k=0
k=1
k=2
k=3
Pr{X≤3} = Pr{X=0} + Pr{X=1} + Pr{X=2} + Pr{X=3}
Pr{X=0}= 00605,060,040,0 1000,10 C
Pr{X=1}= 04031,060,040,0 911,10 C
Pr{X=2}= 12093,060,040,0 822,10 C
Pr{X=3}= 21499,060,040,0 733,10 C
Pr{X≤3}= 0,38228 ou 0,382
7. a
p=0,20
q=0,80
n=20
k=0
k=1
k=2
Pr{X≤2} = Pr{X=0} + Pr{X=1} + Pr{X=2}
Pr{X=0}= 01153,080,020,0 2000,20 C
Pr{X=1}= 05765,080,020,0 1911,20 C
Pr{X=2}= 13691,080,020,0 1822,20 C
Pr{X≤2} = 0,20609 ou 0,207
8. b
Estatística Aplicada
234
Uma moeda possui dois lados, logo a probabilidade de ocorrência de qualquer face
é de 50,0
2
1 .
p=0,50
q=0,50
n=5
k=0
k=1
k=2
Pr{X≥3} = 1- Pr{X<3} = 1- [Pr{X=0} + Pr{X=1} + Pr{X=2}]
Pr{X=0}= 03125,05,05,0 500,5 C
Pr{X=1}= 15625,05,05,0 411,5 C
Pr{X=2}= 3125,05,05,0 322,5 C
Pr{X≥3} = 1- Pr{X<3}= 1-0,500=0,500
9.
z =
x
P(X>180) = 1- P(Z<z)
z= 33,0
15
175180
P(X>180) = 1 –Φ(0,33) = 1-0,6293 = 0,37
No total de 1000 pacientes = 1000 x 0,37 371 pacientes
10.
Dentre os 8 pacientes que deram entrada na sala de emergência, os 8 não estejam
em condições de emergência.
p=0,6
q=0,4
n=8
Pr{X≤8} = Pr{X=0} + Pr{X=1} + Pr{X=2} + Pr{X=3} + Pr{X=4} + Pr{X=5} + Pr{X=6} +
Pr{X=7} + Pr{X=8}
Estatística Aplicada
235
800,8 4,0.6,0.}0{ CXP 0,001
711,8 4,0.6,0.}1{ CXP 0,008
622,8 4,0.6,0.}2{ CXP 0,041
533,8 4,0.6,0.}3{ CXP 0,124
444,8 4,0.6,0.}4{ CXP 0,232
355,8 4,0.6,0.}5{ CXP 0,279
266,8 4,0.6,0.}6{ CXP 0,209
177,8 4,0.6,0.}7{ CXP 0,090
088,8 4,0.6,0.}8{ CXP 0,017
Pr{X≤8} = 1 ou 100%
Obs: Como já dito anteriormente, o espaço amostral tem uma probabilidade de 1
ou 100%. No caso do problema, como pegamos uma amostra de tamanho 8 e
verificamos a probabilidade de todos os 8 pacientes, a soma dessas probabilidades
só poderia ser igual a 1 ou 100%, pois verificamos todo o espaço amostral.
UNIDADE 8
1. a
Desenvolvimento:
Precisamos calcular os somatórios. Feito isso, substituímos os valores
na fórmula para o cálculo de correlação r.
Período
Nascidas
Vivas
Morte por todos os
tipos e causas X2 Y2 XY
1985 1100 540 1210000 291600 594000
1986 840 720 705600 518400 604800
1987 480 640 230400 409600 307200
1988 2200 380 4840000 144400 836000
1989 1840 560 3385600 313600 1030400
1990 1790 120 3204100 14400 214800
Total 8250 2960 13575700 1692000 3587200
Estatística Aplicada
236
Para o cálculo do coeficiente de correlação r, precisamos dos somatórios
de: x, y, x2, y2 e xy. O ideal é utilizarmos uma planilha eletrônica
por facilitar o cálculo de valores, mas, independente de possuir ou não
recurso de informática, podemos calcular o valor de r utilizando apenas a
calculadora.
n
y
y
n
x
x
n
yx
xy
r
2
2
2
2 )(.
)(
)).((
r=
6713,0
15,178.719
800.482
6
)960.2(
000.692.1
6
)250.8(
700.575.13
6
29608250
200.587.3
22
2.
Comentário: Somente com o valor do r calculado já poderíamos dizer que a série
possui uma relação negativa.
Outra forma seria construindo o gráfico de dispersão com a linha de
tendência. Ele demonstra claramente que a relação é negativa.
Gráfico de Tendência
0
200
400
600
800
0 500 1000 1500 2000 2500
Estatística Aplicada
237
3. b
Desenvolvimento:
Buscamos analisar a relação existente entre as variáveis, pois o objetivo
da correlação é verificar a associação existente entre elas. Número do
calçado e QI são duas variáveis que dispensam qualquer tipo de cálculo,
pois elas não se relacionam, ou seja, não há nenhuma associação entre
elas.
No caso de Renda e Educação, são duas variáveis que possuem
associação, pois, por exemplo, se um indivíduo possui baixa escolaridade,
provavelmente a renda dele também é baixa; se um indivíduo possui
uma graduação, por exemplo, provavelmente a renda dele é superior ao
caso anterior, e assim sucessivamente. A questão “educação” leva o
indivíduo, normalmente, a obter uma alavancagem cultural, social e
financeira, por isso, são variáveis que se correlacionam.
4. a
5. b
Para estimarmos a reta, iremos trabalhar com as equações normais:
-Equações normais:
Σy = na + b(Σx)
Σ(xy) = a (Σx) + b (Σx2)
Vamos calcular os somatórios e encontrar os valores de a e b:
Número de semanas
trabalhadas (X)
Número de carros
inspecionados (Y)
X2 XY
2 13 4 26
7 20 49 140
9 22 81 198
5 15 25 75
12 20 144 240
35 90 303 679
Estatística Aplicada
238
∑x=35
∑y=90
∑x2=303
∑xy=679
Σy = na + b(Σx)
Σ(xy) = a (Σx) + b (Σx2)
Substituindo os valores temos:
)303()35(679
)35(590
ba
ba
Precisamos eliminar uma das variáveis a ou b. Vamos multiplicar a 1a linha do
sistema por (-7); após a multiplicação somar a 1a do sistema com a 2a linha do
sistema. Assim eliminamos a e encontramos o valor de b. Em seguida, substituindo
o valor de b em qualquer uma das linhas, encontramos o valor de a.
)303()35(679
)7()35(590
ba
ba
844,0
58
49
4958
5849
30335679
24535630
b
b
b
ba
ba
b=0,844
Substituindo o valor de b na 1a ou 2a equação do início do problema, temos:
Estatística Aplicada
239
09,12
5
46,60
46,605
546,60
554,2990
54,29590
35844,0590
a
a
a
a
a
a
a=12,09
Logo a equação da reta será: xy 844,009,12
^
6. a
Utilizando a equação da reta calculada no exercício 5, xy 844,009,12
^
,
iremos estimar quantos carros um funcionário trabalhando 8 semanas irá
inspecionar:
carrosy
y
y
19842,18
752,609,12
8844,009,12
^
^
^
7. a
Para o cálculo do valor de x utilizamos uma das equações normais que nos permite
o cálculo do valor de y. Através do problema, temos as seguintes informações:
289
)4105,0()283(
:)(
34105,028
y
y
stituindosubxbnay
nxba
Se o somatório de y é igual a 289, não podemos esquecer de subtrair os valores já
existentes na tabela. Logo: 4915090289 YY .
8. b
Estatística Aplicada
240
9.
Solução:
Crianças Altura (cm) - X Peso (kg) - Y XY X2 Y2
1 75 9 675 5625 81
2 70 9,2 644 4900 84,64
3 73 8,9 649,7 5329 79,21
4 78 8,5 663 6084 72,25
5 80 9,5 760 6400 90,25
6 69 9,6 662,4 4761 92,16
7 71 9,1 646,1 5041 82,81
8 72 10 720 5184 100
9 74 8,7 643,8 5476 75,69
10 77 9,4 723,8 5929 88,36
Total 739 91,9 6787,8 54729 846,37
Vamos calcular o valor de r
n
y
y
n
x
x
n
yx
xy
r
2
2
2
2 )(.
)(
)).((
10
)9,91(
37,846
10
)739(
54729
10
9,91739
8,6787
22
r
2482,0
5421,14
61,3
4721,211
61,3
809,190,116
41,67918,6787
r
r= -0,2482
Estatística Aplicada
241
O valor de r indica que a relação é negativa mais é fraca. Isso não significa não
haver correlação nenhuma entre as variáveis. Para uma análise mais aprofundada
seria necessário o domínio de diversas informações que não estão sendo levadas
em consideração. Por exemplo: aos 10 meses as crianças, normalmente, já ingerem
diversos tipos de alimentos. Será que todas as crianças têm o mesmo tipo de
alimentação? Será que todas as crianças ainda bebem leite materno, ou seja,
mamam no peito? Vale lembrar que é muito importante o domínio da informação
acerca de um grupo que estamos analisando para evitar erros grosseiros de análise.
10.
Solução:
Crianças Altura (cm) - X Peso (kg) - Y XY X2
1 75 9 675 5625
2 70 9,2 644 4900
3 73 8,9 649,7 5329
4 78 8,5 663 6084
5 80 9,5 760 6400
6 69 9,6 662,4 4761
7 71 9,1 646,1 5041
8 72 10 720 5184
9 74 8,7 643,8 5476
10 77 9,4 723,8 5929
Total 739 91,9 6787,8 54729
Para o cálculo da equação da reta, que permitirá a estimativa do peso de crianças
com 85 cm de altura, vamos utilizar as equações normais e encontrar os valores de
a e b, como já desenvolvido em exercício anterior.
Σy = na + b(Σx)
Σ(xy) = a (Σx) + b (Σx2)
Estatística Aplicada
242
b
ba
547297398,6787
)9,73(739109,91
b
ba
ba
90,11661,3
547297398,6787
10,5461273941,6791
0309,0
90,116
61,3
61,390,116
b
b
Substituindo encontramos o valor de a.
47351,11
10
7351,114
7351,11410
108351,229,91
8351,22109,91
)0309,0(739109,91
a
a
a
a
a
a= 11,47
b= -0,03
ŷ = a + bx= 11,47 - 0,03 x 85 = 8,92 9 kg