Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

ensino e exercicio de estatistica
Matemática
98 pag.
Document shared on www.docsity.com Downloaded by: josi-fernandes-de-souza (josi79@gmail.com)
FACULDADES KENNEDY
PROBABILIDADE E ESTATÍSTICA PARA BACHARELADO EM SISTEMAS DE INFORMAÇÃO
PROF. AMINTAS PAIVA AFONSO
IPATINGA 2006
ÍNDICE
- 1 -
1 ESTATÍSTICA
1.1 Introdução à Estatística
1.1.1 Método Estatístico
1.1.2 A Estatística
1.1.3 Fases do Método Estatístico
1.1.4 A Estatística nas Empresas
1.1.5 Atividades Complementares
1.2 População e Amostra
1.2.1 Atividades Complementares
1.3 Variáveis quantitativas contínuas e discretas
1.3.1 Atividades Complementares
1.4 Variáveis qualitativas nominais e ordinais
1.4.1 Atividades Complementares
1.5 Planejamento de experimento e amostragem
1.5.1 Controlando os Efeitos das Variáveis
1.5.2 Replicação e Tamanho da Amostra
1.5.3 Aleatorização e Outras Estratégias Amostrais
1.5.4 Erros Amostrais
1.5.5 Atividades Complementares
1.6 Tabelas de freqüência
1.6.1 Tabelas
1.6.2 Séries Estatísticas
1.6.3 Séries Conjugadas. Tabela de Dupla Entrada
1.6.4 Dados Absolutos e Dados Relativos
1.6.5 Atividades Complementares
1.6.6 Distribuição de Freqüência
1.6.7 Atividades Complementares
1.7 Gráficos Estatísticos
1.7.1 Diagramas
1.7.2 Gráfico Polar
1.7.3 Cartograma
1.7.4 Pictograma
1.7.5 Atividades Complementares
2 MEDIDAS ESTATÍSTICAS
2.1 Medidas de tendência central (média, mediana, moda)
- 2 -
2.1.1 Média Aritmética (X)
2.1.2 Moda (Mo)
2.1.3 Mediana (Md)
2.1.4 Atividades Complementares
2.2 Medidas de Dispersão ou de Variabilidade
2.2.1 Amplitude Total
2.2.2 Variância e Desvio Padrão
2.2.3 Coeficiente de Variação
2.2.4 Atividades Complementares
3 PROBABILIDADE
3.1 Experimento Aleatório
3.2 Espaço Amostral
3.3 Eventos
3.4 Probabilidade
3.5 Eventos Complementares
3.6 Eventos Independentes
3.7 Eventos Mutuamente Exclusivos
3.8 Exercícios resolvidos
3.9 Atividades Complementares
3.10 Teorema de Bayes
1 CONCEITOS FUNDAMENTAIS
1.1 Introdução à Estatística
- 3 -
Todas as ciências têm suas raízes na história do homem.
A Matemática, que é considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante.
Embora a palavra ESTATÍSTICA ainda não existisse, há indícios de que 3.000 anos a.C. já se faziam censos na Babilônia, China e Egito, objetivando a taxação de impostos.
A própria Bíblia leva-nos a essa recuperação histórica: O livro quarto (Números) do velho testamento começa com uma instrução a Moisés: Fazer um levantamento dos homens de Israel que estivessem aptos para guerrear.
Na época do imperador César Augusto, saiu um edito para que se fizesse um censo em todo o império romano. (A palavra “CENSO” deriva de “CENSERE” que em latim, significa “TAXAR”.)
Por isso, diz a Bíblia, Maria e José viajaram para Belém.
A palavra ESTATÍSTICA vem de “STATUS” (ESTADO, em latim). Sob essa palavra acumularam-se descrições e dados relativos ao Estado. A ESTATÍSTICA, nas mãos dos estadistas, constituiu-se uma verdadeira ferramenta administrativa.
Em 1805, Guilherme, o conquistador, ordenou que se fizesse um levantamento estatístico da Inglaterra. Esse levantamento deveria incluir informações sobre terras, proprietários, uso da terra, empregados e animais. Serviria, também, de base para o cálculo de impostos. Tal levantamento originou um volume intitulado “Domesday Book”.
No século XVII ganhou destaque na Inglaterra, a partir das tábuas de mortalidade, a aritmética política, de John Graunt, que consistiu de exaustivas análises de nascimentos e mortes. Dessas análises resultou a conclusão, entre outras, de que a porcentagem de nascimentos de crianças do sexo masculino era ligeiramente superior à de crianças do sexo feminino.
E saibam que as Tábuas de Mortalidade usadas hoje pelas companhias de seguros originam-se de estudos como esse.
A palavra ESTATÍSTICA (“STATISTICS”) foi cunhada pelo acadêmico alemão GOTTFIRIED ACHENWALL (Godofredo) por volta da metade do século XVIII. Deixaram-se de lado o simples levantamento e o registro de dados numéricos para proceder ao estudo de como tirar conclusões sobre o todo, observando parte desse todo. O todo seria a população e a parte do todo, a amostra.
1.1.1 Método Estatístico
1.1.1.1 O Método Científico
Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja.
Dos métodos científicos, vamos destacar o método experimental e o estatístico.
1.1.1.2 O Método Experimental
O método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam.
É o método preferido no estudo da Química, da Física etc.
- 4 -
1.1.1.3 O Método Estatístico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa.
Exemplo:
→ A determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos que fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço.
Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades etc. Mas isso tudo é impossível.
Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso, denominado método estatístico.
O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas.
1.1.2 A Estatística
A utilização das PESQUISAS é muito comum nas mais diversas atividades humanas. Muitas decisões são tomadas tendo como ponto de partida a análise de resultados de cuidadosas pesquisas.
Exemplos:
→ Na época das eleições, as pesquisas eleitorais fornecem elementos para que os partidos e os candidatos redimensionem a campanha eleitoral.
→ Quando do levantamento de um novo produto, as indústrias realizam pesquisas junto aos consumidores para sondar a aceitação desse produto.
→ Emissoras de televisão frequentemente fazem pesquisas com os espectadores, a fim de observarem a aceitação de seus programas.
Conclusão:
A Estatística é uma parte da Matemática Aplicada que estuda métodos para a coleta, a organização, descrição, análise e interpretação de dados. Todo o seu estudo objetiva, entre outros, a tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
A análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de uma empresa.
Exemplo:
→ Na Faculdade Pereira de Freitas, o conhecimento de seus problemas (condições de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamento objetivo de ação.
- 5 -
1.1.3 Fases do Método Estatístico
Podemos distinguir no método estatístico as seguintes fases:
1.1.3.1 Coleta de Dados
A coleta de dados numéricos pode ser direta ou indireta.
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma faculdade ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc.
A coleta direta de dadosem uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna).
TERMINAIS TELEFÔNICOS EM SERVIÇO 1991-93
	REGIÕES
	1991
	1992
	1993
	Norte
	342.938
	375.678
	403.494
	Nordeste
	1.287.813
	1.379.101
	1486.649
	Sudeste
	6.234.501
	6.729.467
	7231.634
	Sul
	1.497.315
	1.608.989
	1.746.232
	Centro-Oeste
	713.357
	778.925
	884.882
FONTE: Ministério das Comunicações.
A conjugação, no exemplo dado, foi série geográfica-série histórica, que dá origem à série geográfico-histórica ou geográfico-temporal.
Podem existir, se bem que mais raramente, pela dificuldade de representação, séries compostas de três ou mais entradas.
1.6.3 Dados Absolutos e Dados Relativos
Definições:
- 31 -
Dados Absolutos, são dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação se não a contagem ou medida. A leitura dos dados absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um resultado exato e fiel, não têm a virtude de ressaltar de imediato as suas conclusões numéricas. Daí o uso imprescindível que faz a Estatística dos dados relativos. O número de vezes que um valor da variável, de uma pesquisa, é citado representa a freqüência absoluta daquele valor.
Dados Relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. A freqüência relativa é o quociente entre a freqüência absoluta de uma variável e o total de citações de todas as variáveis da pesquisa.
1.6.3.1 As percentagens
Consideremos a série:
MATRÍCULAS NAS ESCOLAS DA CIDADE A - 2007
	CATEGORIAS
	Nº DE ALUNOS
	Ensino Fundamental
	19.286
	Ensino Médio
	1.681
	Ensino Superior
	234
	Total
	21.201
Dados fictícios.
Calculemos as percentagens de alunos de cada grau:
Ensino Fundamental → 19286 x 100  21201 = 90,96 = 91,0
Ensino Médio → 1681 x 100  21201 = 7,92 = 7,9
Ensino Superior → 234 x 100  21201 = 1,10 = 1,1
Com esses dados, podemos formar uma nova coluna na série em estudo;
MATRÍCULAS NAS ESCOLAS DA CIDADE A - 2007
	CATEGORIAS
	Nº DE ALUNOS
	%
	Ensino Fundamental
	19.286
	91,0
	Ensino Médio
	1.681
	7,9
	Ensino Superior
	234
	1,1
	Total
	21.201
	100
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91 estão matriculados no 1º grau, 8, aproximadamente, no 2º grau e 1 no 3º grau.
O emprego da percentagem é de grande valia quando é nosso intuito destacar a participação da parte no todo.
Consideremos, agora, a série:
MATRÍCULAS NAS ESCOLAS DA CIDADE A e B - 2007
CATEGORIAS
Nº DE ALUNOS
- 32 -
	
	CIDADE A
	CIDADE B
	Ensino Fundamental
	19.286
	38.660
	Ensino Médio
	1.681
	3.399
	Ensino Superior
	234
	424
	Total
	21.201
	42.483
Dados fictícios.
Qual das cidades tem, comparativamente, maior número de alunos em cada período?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas correspondentes às percentagens, obtemos:
MATRÍCULAS NAS ESCOLAS DA CIDADE A e B - 2007
	CATEGORIAS
	CIDADE A
	CIDADE B
	
	Nº DE ALUNOS
	%
	Nº DE ALUNOS
	%
	Ensino Fundamental Ensino Médio Ensino Superior
	
19.286
1.681
234
	
91,0
7,9
1,1
	
38.660
3.399
424
	
91,0
8
1
	Total
	21.201
	100
	42.483
	100
Dados fictícios.
O que nos permite dizer que, comparativamente, contam, praticamente, com o mesmo número de alunos em cada grau.
1.6.3.2 Os Índices - Índices Econômicos
Definição:
Os Índices são razões entre duas grandezas tais que uma não inclui a outra.
Exemplos:
→ Índice Cefálico = (diâm. transverso da cabeça diâm. longitudinal do crânio) x 100
→ Quociente Intelectual = (idade mental  idade cronológica) x 100
→ Densidade Demográfica = população  superfície
→ Índices Econômicos:
· Produção per capta = valor total da produção  população
· Consumo per capta = consumo do bem  população
· Renda per capta = renda  população
· Receita per capta = receita  população
1.6.3.3 Os Coeficientes
Definição:
Os Coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e número de não ocorrências).
- 33 -
Exemplos:
→ Coeficiente de Natalidade = número de nascimentos  população total
→ Coeficiente de Mortalidade = número de óbitos  população total
→ Coeficientes Educacionais:
· Coeficiente de evasão escolar = nº de alunos evadidos  nº inicial de matrículas
· Coeficiente de aproveitamento escolar = nº de alunos aprovados  nº final de matrículas
· Coeficiente de recuperação = nº de alunos recuperados  nº de alunos em recuperação
1.6.3.4 Os Coeficientes
Definição:
As Taxas são os coeficientes multiplicados por uma potência de 10 (10, 100, 1, 1000 etc.) para tornar o resultado mais inteligível..
Exemplos:
→ Taxa de Mortalidade = coeficiente de mortalidade x 1000
→ Taxa de Natalidade = coeficiente de natalidade x 1000
→ Taxa de Evasão Escolar = coeficiente de evasão escolar x 100
Exercício Resolvido:
O Estado A apresentou 733.986 matrículas na 1ª série, no início do ano de 1994, e 683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e 412.457 matrículas. Qual o Estado que apresentou maior evasão escolar?
A → TEE = (733.986 – 683.816) x 100  733.986 = 6,83 = 6,8%
B → TEE = (436.127 – 412.457) x 100  436.127 = 5,42 = 5,4%
O Estado que apresentou maior evasão escolar foi A.
1.6.4 Atividades Complementares
1. Classifique as séries:
a. Histórica
PRODUÇÃO DE BORRACHA NATURAL 1991-93
b. Específica
AVICULTURA BRASILEIRA - 1992
	ANOS
TONELADAS
ESPÉCIES
NÚMERO (1.000
- 34 -
	1991
	29.543
	1992
	30.712
	1993
	40.663
FONTE: IBGE.
CABEÇAS)
Galinhas
204.160
Galos, frangos e pintos
435.465
Codornas
2.488
FONTE: IBGE.
c. Geográfica
VACINAÇÃO CONTRA A POLIOMELITE - 1993
	REGIÕES
	QUANTIDADE
	Norte
	211.209
	Nordeste
	631.040
	Sudeste
	1.119.708
	Sul
	418.785
	Centro-Oeste
	185.823
FONTE: Ministério da Saúde.
e. Específica - Histórica
d. 
Histórica
AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA X
	MINUTOS
	TEMPERATURA
(ºC)
	0
	20
	1
	27
	2
	34
	3
	41
	4
	49
	5
	56
	6
	63
Dados fictícios.
PRODUÇÃO BRASILEIRA DE AÇO BRUTO 1991-93
	PROCESSOS
	QUANTIDADE (1.000 t)
	
	1991
	1992
	1993
	Oxigênio básico
	17.934
	18.849
	19.698
	Forno elétrico
	4.274
	4.637
	5.065
	EOF
	409
	448
	444
FONTE: Instituto Brasileiro de Siderurgia.
f. Geográfica - Histórica
EXPORTAÇÃO BRASILEIRA 1985-1990-1995
	IMPORTADORES
	1991
	1992
	1993
	América Latina
	13,0
	13,4
	25,6
	EUA e Canadá
	28,2
	26,3
	22,2
	Europa
	33,9
	35,2
	20,7
	Ásia e Oceania
	10,9
	17,7
	15,4
	África e Oriente Médio
	14,0
	8,8
	5,5
FONTE: MIC e SECEX.
2. Procure exemplos de séries estatísticas em jornais e revistas e copie-os, classificando essas séries.
3. Pesquise, junto à secretaria da faculdade, os dados necessários ao preenchimento da tabela abaixo:
MATRÍCULAS NA FACULDADE EM 20....
	PERÍODOS
	SEXO
	
	MASCULINO
	FEMININO
	1º
	
	
- 35 -
	2º 3º 4º 5º 6º
	
	
4. 	Verificou-se, em 1993, o seguinte movimento de importação de mercadorias: 14.839.804 t, oriundas da Arábia Saudita, no valor de US$ 1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de US$ 6.034.946 e; 561.024 t, do Japão, no valor de US$ 1.518.843.000. Confeccione a série correspondente e classifique-a, sabendo que os dados a cima forma fornecidos pelo Ministério da Fazenda.
IMPORTAÇÃO DE MERCADORIAS BRASIL - 1993
	PAÍSES
	QUANTIDADE
(t)
	VALOR
(US$ 1.000)
	Arábia Saudita
	14.838.804
	1.469.104
	Estados Unidos
	10.547.889
	6.034.946
	Japão
	561.024
	1.519.943
Fonte: Ministério da Fazenda
5. Complete a tabela abaixo:
	ESCOLA S
	Nº DE ALUNOS
	DADOS RELATIVOS
	
	
	POR. 1
	POR 100
	A
	175
	0,098
	9,8
	B
	222
	...
	...
	C
	202
	...
	...
	D
	362
	......
	E
	280
	...
	...
	F
	540
	...
	...
	Total
	1781
	1,000
	100,0
Cálculos: A → 175 x 1  1781 = 0,098
6. 	Uma faculdade registrou em março, no 1º período, a matrícula de 40 alunos e a matrícula efetiva, em dezembro, de 35 alunos. A taxa de evasão foi de:
TEE = nº de evadidos  nº inicial de matrículas x 100 = (40 – 35) x 100  40 =	%
7. Calcule a taxa de aprovação de um professor de uma classe de 45 alunos, sabendo que obtiveram aprovação 36 alunos.
TAE = nº de aprovação  nº final de matrículas x 100 = (...... – .....) x 100  ..... =	%
8. Considere a série estatística:
	PERÍODOS
	ALUNOS
	%
- 36 -
	
	MATRICULADOS
	
	1ª
	546
	
	2ª
	328
	
	3ª
	280
	
	4ª
	120
	
	Total
	1.274
	
Complete-a, determinando as porcentagens com uma casa decimal e fazendo a compensação, se necessário. 42,9 + 25,7 + 22,0 + 9,4 = 100
9. Uma faculdade apresentava, no final do ano, o seguinte quadro:
	PERÍODOS
	MATRÍCULAS
	
	MARÇO
	NOVEMBRO
	1º
	480
	475
	2º
	458
	456
	3º
	436
	430
	4º
	420
	420
	Total
	1.794
	1.781
a. Calcule a taxa de evasão por período. 1,0%; 0,4%; 1,4%; 0%
b. Calcule a taxa de evasão da faculdade. 0,7%
10. Considere a tabela abaixo:
EVOLUÇÃO DAS RECEITAS DO CAFÉ INDUSTRIALIZADO JAN./ABR. - 2007
	MESES
	VALOR
(US$ milhões)
	Janeiro
	33,3
	Fevereiro
	54,1
	Março
	44,5
	Abril
	52,9
	Total
	184,8
Dados fictícios.
a. Complete-a com uma coluna de taxas percentuais.
b. Como se distribuem as receitas em relação ao total? 18,0 + 29,3 + 24,1 + 28,6 = 100,0
c. Qual o desenvolvimento das receitas de um mês para o outro? 162,5 ; 82,3; 118,9
d. Qual o desenvolvimento das receitas em relação ao mês de janeiro?
100,0; 162,5; 133,6; 158,9
11. São Paulo tinha, em 1992, uma população de 32.182,7 mil habitantes. Sabendo que sua área terrestre é de 248.256 km2, calcule a sua densidade demográfica.
129,6 hab/km2
12. Considere que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):
· população: 15.957,6 mil habitantes;
· superfície: 586.624 km2;
· nascimentos: 292.036;
- 37 -
· óbitos: 92.281.
Calcule:
a. o índice de densidade demográfica; 27,2 hab/km2
b. a taxa de natalidade; 18,3%
c. a taxa de mortalidade. 6,2%
13. Uma frota de 40 caminhões, transportando, cada um, 8 toneladas, dirige-se a duas cidades A e B. Na cidade A são descarregados 65% desses caminhões, por 7 homens, trabalhando 7 horas. Os caminhões restantes seguem para a cidade B, onde 4 homens gastam 5 horas para o seu descarregamento. Em que cidade se obteve melhor produtividade? Cidade B
14. Um professor preencheu um quadro, enviado pela D.F., com os seguintes dados:
	SÉRIE E TURM
A
	Nº DE ALUNOS 30.03
	Nº DE ALUNOS 30.11
	PROMOVI- DOS SEM RECUPE-
RAÇÃO
	RETIDOS SEM RECU-
PERAÇÃO
	EM RECU-
PERAÇÃO
	
RECUPE- RADOS
	NÃO- RECU- PERADOS
	TOTAL GERAL
	
	
	
	
	
	
	
	
	PROMO- VIDOS
	
RETIDOS
	1º PER
	49
	44
	35
	03
	06
	05
	01
	40
	04
	2º PER
	49
	42
	42
	00
	00
	00
	00
	42
	00
	3º PER
	47
	35
	27
	00
	08
	03
	05
	30
	05
	4º PER
	47
	40
	33
	06
	01
	00
	01
	33
	07
	Total
	192
	161
	137
	09
	15
	08
	07
	145
	16
Calcule:
a. a taxa de evasão, por período; 10,2%; 14,3%; 25,5%; 14,9%
b. a taxa de evasão total; 16,1%
c. a taxa de aprovação, por período; 90,9%; 100%; 85,7%; 82,5%
d. a taxa de aprovação geral; 90,1%
e. a taxa de recuperação, por período; 83,3%; -; 37,5%; 0%
f. a taxa de recuperação geral; 53,3%
g. a taxa de reprovação na recuperação geral; 46,7%
h. a taxa de aprovação, sem a recuperação; 85,1%
i. a taxa de retidos, sem a recuperação. 5,6%
1.6.5 Distribuição de Freqüência
1.6.5.1 Tabela Primitiva
Vamos considerar, neste capítulo, a forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantitativas, como é o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salários recebidos pelos operários de uma fábrica etc.
Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando a seguinte tabela de valores:
TABELA 1
ESTATURAS DE 40 ALUNOS DA FACULDADE A
166	160	161	150	162	160	165	167	164	160
162	168	161	163	156	173	160	155	164	168
- 38 -
155	152	163	160	155	155	169	151	170	164
154	161	156	172	153	157	156	158	158	161
A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva.
1.6.5.2 Rol
Partindo dos dados acima – tabela primitiva – é difícil averiguar em torno de que valor tende a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura.
Assim, conhecidos os valores de uma variável, é difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir dos dados não ordenados. A maneira mais simples de organizar os dados é através de uma certa ordenação (crescente ou decrescente). A tabela obtida através da ordenação dos dados recebe o nome de rol.
TABELA 2
ESTATURAS DE 40 ALUNOS DA FACULDADE A
150	154	155	157	160	161	162	164	166	169
151	155	156	158	160	161	162	164	167	170
152	155	156	158	160	161	163	164	168	172
153	155	156	160	160	161	163	165	168	173
Agora, podemos saber, com relativa facilidade, qual a menor estatura (173 cm); que a amplitude de variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Com um exame mais acurado, vemos que há uma concentração das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm.
1.6.5.3 Distribuição de Freqüência
No exemplo que trabalhamos, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido.
Denominamos freqüência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência:
TABELA 3
	ESTATURAS
(cm)
	FREQ
	150
	1
	151
	1
	152
	1
	153
	1
	154
	1
	155
	4
	156
	3
	157
	1
	158
	2
	160
	5
	161
	4
	162
	2
	163
	2
	164
	3
- 39 -
	165
	1
	166
	1
	167
	1
	168
	2
	169
	1
	170
	1
	172
	1
	173
	1
	Total
	40
Mas o processo dado é ainda inconveniente, já que exige muito mais espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos.
Assim, se um dos intervalos for, por exemplo, 154
158
—׀ (é um intervalo fechado à
esquerda e aberto à direita, tal que: 154 ≤ xa estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados.
Notas:
· Se nosso intuito é, desde o início, a obtenção de uma distribuição de freqüência com intervalos de classe, basta, a partir da Tabela 1, fazemos uma tabulação.
· Quando os dados estão organizados em uma distribuição de freqüência, são comumente denominados dados agrupados.
1.6.5.4 Elementos de uma Distribuição de Freqüência
1) Classes de freqüência ou, simplesmente, classes são intervalos de variação da variável.
As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k é o número total de classes da distribuição).
Assim, em nosso exemplo, o intervalo 154 ι— 158 define a segunda classe (i = 2). Como a distribuição é formada de seis classes, podemos afirmar que k = 6.
2) Denominamos limites de classe os extremos de cada classe.
O menor número é o limite inferior da classe (li) e o maior número, o limite superior da classe (Li).
Na segunda classe, por exemplo, temos:
l2 = 154 e L2 = 158
Nota:
· Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos desta quantidade até menos aquela, empregando, para isso, o símbolo ׀— (inclusão de li e exclusão de Li). Assim, o indivíduo com uma estatura de 158 cm está incluído na terceira classe (i = 3) e não na segunda.
3) Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe.
Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi. Assim:
hi = Li - li
Na distribuição da Tabela 1.6.5.4, temos: h2 = L2 – l2 ⟶ h2 = 158 – 154 = 4 cm
4) Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo):
AT = L(máx) – l(mín)
- 41 -
Em nosso exemplo, temos: AT = 174 – 14501 = 24 ⟶ AT = 24 cm
Nota:
· É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação: AT  hi = k
5) Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra:
AA = x(máx) – x(mín)
Em nosso exemplo, temos: AA = 173 - 150 = 23 ⟶ AA = 23 cm
Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral.
6) Ponto médio de uma classe (xi) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais.
Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites de da classe (média aritmética):
xi = (li + Li)  2
Assim, o ponto médio da segunda classe, em nosso exemplo, é: xi = (li + Li)  2 ⟶ x2 = (154 + 158)  2 = 156 cm
Nota:
· O ponto médio de uma classe é o valor que a representa.
7) Freqüência simples ou freqüência absoluta ou, simplesmente, freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor.
A freqüência simples é simbolizada por fi (lemos: f índice i ou freqüência da classe i).
Assim, em nosso exemplo, temos: f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3 A soma de todas as freqüências é representada pelo símbolo de somatório (∑):
∑(i=1 → k)fi = n
Para a distribuição em estudo, temos: ∑(i=1 → 6)fi = 40 ou ∑fi = 40
Podemos, agora, dar à distribuição de freqüência das estaturas dos quarenta alunos da faculdade A, a seguinte representação tabular técnica:
TABELA 5 ESTATURAS DE 40 ALUNOS DA
FACULDADE A
	i
	ESTATURAS
(cm)
	fi
	1
	150 154 —׀
	4
	2
	154 158 —׀
	9
	3
	158 162 —׀
	11
	4
	162 166 —׀
	8
	5
	166 170 —׀
	5
	6
	170 174 —׀
	3
	
	
	∑fi = 40
- 42 -
1.6.5.5 Número de Classes – Intervalos de Classe
A primeira preocupação que temos, na construção de uma distribuição de freqüência, é a determinação do número de classes e, consequentemente, da amplitude e dos limites dos intervalos de classe.
Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturges, que nos dá o número de classes em função do número de valores da variável: i ≈ 1 + 3,3 . log n
onde:
i é o número de classe;
n é o número total de dados.
Essa regra nos permite obter a seguinte tabela:
TABELA 6
	ESTATURAS
(cm)
	fi
	3 5׀ —׀
	3
4
5
6
7
8
9
...
	6 11׀ —׀
	
	12 22׀ —׀
	
	23 46׀ —׀
	
	47 90׀ —׀
	
	91 181׀ —׀
	
	182 362׀ —׀
	
	...
	
Além da regra de Sturges, existem outras fórmulas empíricas que pretendem resolver o problema da determinação do número de classes que deve ter a distribuição (há quem prefira: i = √h). Entretanto, a verdade é que essas fórmulas não nos levam a uma decisão final; esta vai depender, na realidade, de um julgamento pessoal, que deve estar ligado à natureza dos dados, da unidade usada para expressa-los e, ainda, do objetivo que se tem em vista, procurando, sempre que possível, evitar classe com freqüência nula ou com freqüência relativa muito exagerada etc.
Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes:
h ≈ AT / i
Quando o resultado não é exato, devemos arredondá-lo para mais.
Outro problema que surge é a escolha dos limites dos intervalos, os quais deverão ser tais que forneçam, na medida do possível, para pontos médios, números que facilitem os cálculos – números naturais.
Em nosso exemplo, temos:
Para n = 40, pela Tabela 6, i = 6
Logo: h = (173 -150) / 6 = 23/6 = 3,8 ≈ 4
Isto é, seis classes de intervalos iguais a 4.
Resolva:
1) As notas obtidas por 50 alunos de uma classe foram:
1 2 3 4 5 6 6 7 7 8
2 3 3 4 4 6 6 7 8 8
2 3 4 4 5 6 6 7 8 9
2 3 4 5 5 6 6 7 8 9
- 43 -
2 3 4 5 5 6 7 7 8 9
a. Complete a distribuição de freqüência abaixo:
	i
	NOTAS
	xi
	fi
	1
2
3
4
5
6
	
0 2 —׀
2 4 —׀
4 6 —׀
6 8 —׀
8 10 —׀
	
1
....
....
....
....
	
1
....
....
....
....
	
	
	
	∑fi = 50
b. Agora responda:
1. Qual a amplitude amostral?
2. Qual a amplitude da distribuição?
3. Qual o número de classes da distribuição?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo da classe?
c. Complete:
1. h3 = ....	2. n = ....	3. l1 = ....	4. L3 = ....	5. x2 = ....	6. f5 = ....
1.6.5.6 Tipos de Freqüências
1) Freqüências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe.
Como vimos, a soma das freqüências simples é igual ao número total dos dados:
∑ fi = n
2) 	Freqüências relativas (fri) são os valores das razões entre as freqüências simples e a freqüência total:
Como vimos, a soma das freqüências simples é igual ao número total dos dados:
fri = fi /∑ fi
Logo, a freqüência relativa da terceira classe, em nosso exemplo (Tabela 5), é: fr3 = f3 /∑ f3 ⟶ fr3 = 11 / 40 = 0,275
Evidentemente: ∑ fri = 1 ou 100%
Nota:
· O propósito das freqüências relativas é o de permitir a análise ou facilitar as comparações.
3) Freqüência acumulada (Fi) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe:
Fk = f1 + f2 + ... + fk	ou	Fk = ∑ fi (i = 1, 2, ..., k)
- 44 -
Assim, no exemplo apresentado no início deste capítulo, a freqüência acumulada correspondente à terceira classe é:
F3 = ∑(i=1 → 3) fi = f1 + f2 + f3 ⟶ F3 = 4 + 9 + 11 = 24,
O que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe).
4) Freqüência acumulada relativa (Fri) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição:
Fri = Fi / ∑ fi
Assim, para a terceira classe, temos: Fri = Fi / ∑ fi ⟶ Fri = 24/40 = 0,6
Considerando a Tabela 3, podemos montar a seguinte tabela com as freqüências estudadas:
TABELA 7
	
i
	ESTATURA S
(cm)
	
fi
	
xi
	
fri
	
Fi
	
Fri
	1
	150 154 —׀
	4
	152
	0,100
	4
	0,100
	2
	154 158 —׀
	9
	156
	0,225
	913
	0,325
	3
	158 162 —׀
	11
	160
	0,275
	24
	0,600
	4
	162 166 —׀
	8
	164
	0,20032
	0,800
	5
	166 170 —׀
	5
	168
	0,125
	37
	0,925
	6
	170 174 —׀
	3
	172
	0,075
	40
	1,000
	
	
	∑ = 40
	
	∑ = 1,000
	
	
O conhecimento dos vários tipos de freqüência ajuda-nos a responder a muitas questões com relativa facilidade, como as seguintes:
a. Quantos alunos têm estatura entre 154 cm, inclusive, e 158 cm?
Esses são os valores da variável que formam a segunda classe. Como f2 = 9, a resposta é : 9 alunos.
b. Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm?
Esses valores são os que formam a primeira classe. Como fr1 = 0,100, obtemos a resposta multiplicando a freqüência relativa por 100:
0,100 x 100 = 10
Logo, a percentagem de alunos é 10%.
c. Quantos alunos têm estatura abaixo de 162?
É evidente que as estaturas consideradas são aquelas que formam as classes de ordem 1, 2 e 3. Assim, o número de alunos é dado por:
F3 = ∑(i=1 → 3) fi = f1 + f2 + f3 ⟶ F3 = 24
Portanto, 24 alunos têm estatura abaixo de 162 cm.
d. Quantos alunos têm estatura não-inferior a 158 cm? O número de alunos é dado por:
∑(i=1 → 6) fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27
- 45 -
Ou, então:
∑(i=1 → 6) fi – F2 = n - F2 = 40 – 13 = 27
1.6.5.7 Distribuição de Freqüência sem Intervalos de Classe
Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuição é chamada distribuição sem intervalos de classe, tomando a seguinte forma:
TABELA 8
	xi
	fri
	x1
	f1
	x2
	f2
	.
	.
	.
	.
	.
	.
	xn
	fn
	
	∑ fi = n
Exemplo:
Seja x a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:
TABELA 9
	i
	xi
	fi
	1
	2
	4
	2
	3
	7
	3
	4
	5
	4
	5
	2
	5
	6
	1
	6
	7
	1
	
	
	∑ = 40
Completada com vários tipos de freqüência, temos:
TABELA 10
	i
	xi
	fi
	fri
	Fi
	Fri
	1
	2
	4
	0,20
	4
	0,20
	2
	3
	7
	0,35
	11
	0,55
	3
	4
	5
	0,25
	16
	0,80
	4
	5
	2
	0,10
	18
	0,90
	5
	6
	1
	0,05
	19
	0,95
	6
	7
	1
	0,05
	20
	1,00
	
	∑ = 20
	
	∑ = 1,00
	
	
Nota:
· Se a variável toma numerosos valores distintos, é comum trata-la como uma variável contínua, formando intervalos de classe de amplitude diferente de um.
- 46 -
Este tratamento (arbitrário) abrevia o trabalho, mas acarreta alguma perda de precisão.
Resolva:
1) Complete a distribuição abaixo, determinando as freqüências simples:
	i
	xi
	fi
	Fi
	1
	2
	....
	2
	2
	3
	....
	9
	3
	4
	....
	21
	4
	5
	....
	29
	5
	6
	....
	34
	
	
	∑ = 20
	
1.6.6 Atividades Complementares
1) Conhecidas as notas de alunos:
84 68 33 52 47 73 68 61 73 77
74 71 81 91 65 55 57 35 85 88
59 80 41 50 53 65 76 85 73 60
67 41 78 56 94 35 45 55 64 74
65 94 66 48 39 69 89 86 42 54
Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.
xi fi
30 ι— 40 ι— 50 ι— 60 ι— 70 ι— 80 ι— 90 ι— 100
4
6
9
11
9
7
4
2) Os resultados do lançamento de um dado 50 vezes foram os seguintes:
6 5 2 6 4 3 6 2 6 5
1 6 3 3 5 1 3 6 3 4
5 4 3 1 3 5 4 4 2 6
2 2 5 2 5 1 3 6 5 1
5 6 2 4 6 1 5 2 4 3
Forme uma distribuição de freqüência sem intervalos de classe.
	xi
	1
	2
	3
	4	5	6
	fi
	6
	8
	9
	7 10 10
3) Considere as notas de um teste de inteligência aplicada a 100 alunos:
	64 78 66
	82
	74
	103
	78
	86
	103
	87
	73 95 82
	89
	73
	92
	85
	80
	81
	90
	78 86 78
	101
	85
	98
	75
	73
	90
	86
	86 84 86
	76
	76
	83
	103
	86
	84
	85
	76 80 92
	102
	73
	87
	70
	85
	79
	93
	82 90 83
	81
	85
	72
	81
	96
	81
	85
	68 96 86
	70
	72
	74
	84
	99
	81
	89
- 47 -
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
Forme uma distribuição de freqüência.
xi fi
62 ι— 68 ι— 74 ι— 80 ι— 86 ι— 92 ι— 98 ι— 104 ι— 110
5
14
16
24
16
13
10
2
4) A tabela abaixo apresenta as vendas abaixo de um determinado aparelho elétrico, durante um mês, por uma firma comercial:
14 12 11 13 14 13
12 14 13 14 11 12
12 14 10 13 15 11
15 13 16 17 14 14
Forme uma distribuição de freqüência sem intervalos de classe.
	xi
	10
	11
	12
	13
	14
	15
	16
	17
	fi
	1
	3
	4
	5
	7
	2
	1
	1
5) Complete a tabela abaixo:
	i
	CLASSES
	fi
	fri
	Fi
	Fri
	1
	0 8 —׀
	4
	....
	....
	....
	2
	8 16 —׀
	10
	....
	....
	....
	3
	16 24 —׀
	14
	....
	....
	....
	4
	24 32 —׀
	9
	....
	....
	....
	5
	32 40 —׀
	3
	....
	....
	....
	
	
	∑ = 40
	∑ = 1,00
	
	
fri: 0,1; 0,25; 0,35; 0,225; 0,075
Fi: 4; 14; 28; 37; 40
Fri: 0,1; 0,35; 0,70; 0,925; 1,000
6) Dada a distribuição de freqüência:
	xi
	3	4
	5	6
	7	8
	fi
	2	5
	12 10
	8	3
Determine:
a. ∑ fi 40
b. As freqüências relativas; 0,05; 0,125; 0,3; 0,25; 0,2; 0,075
c. As freqüências acumuladas; 2; 7; 19; 29; 37; 40
d. As freqüências relativas acumuladas. 0,05; 0,175; 0,475; 0,725; 0,925; 1,000
7) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes:
ÁREAS (m2) Nº DE LOTES
300 ι— 400 ι— 500 ι— 600 ι— 700 ι—800 ι— 900 ι— 1.000 ι— 1.100 ι— 1.2000
14
46
58
76
68
62
48
22
6
Com referência a essa tabela, determine:
- 48 -
a. a amplitude total; 900
b. o limite superior da quinta classe; 800
c. o limite inferior da oitava classe; 1000
d. o ponto médio da sétima classe; 950
e. a amplitude do intervalo da segunda classe; 100
f. a freqüência da quarta classe; 76
g. a freqüência relativa da sexta classe; 0,155
h. a freqüência acumulada da quinta classe; 0,262
i. o número de lotes cuja área não atinge 700 m2; 194
j. o número de lotes cuja área atinge e ultrapassa 800 m2; 138
k. a percentagem dos lotes cuja área não atinge 600 m2; 29,5%
l. a percentagem dos lotes cuja área seja maior ou igual a 900 m2; 19%
m. a percentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1.000 m2; 78%
n. a classe do 72º lote; i = 3
o. até que classe estão incluídos 60% dos lotes. i = 5
8) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:
	Nº ACIDENTES
	0	1	2
	3
	4
	5
	6
	7
	Nº MOTORISTAS
	20 10 16
	9
	6
	5
	3
	1
Determine:
a. o número de motoristas que não sofreram nenhum acidente; 20
b. o número de motoristas que sofreram pelo menos 4 acidentes; 15
c. o número de motoristas que sofreram menos de 3 acidentes; 46
d. o número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; 20
e. a percentagem dos motoristas que sofreram no máximo 2 acidentes. 65,7%
9) Complete os dados que faltam na distribuição de freqüência: a.
	i
	xi
	fi
	fri
	Fi
	1
	0
	1
	0,05
	....
	2
	1
	....
	0,15
	4
	3
	2
	4
	....
	....
	4
	3
	....
	0,25
	13
	5
	4
	3
	0,15
	....
	6
	5
	2
	....
	18
	7
	6
	....
	....
	19
	8
	7
	....
	....
	....
	
	
	∑ = 20
	∑ = 1,00
	
fi: 1; 3; 4; 5; 3; 2; 1; 1
fri: 0,05; 0,15; 0,2; 0,25; 0,15; 0,1; 0,05; 0,05
Fi: 1; 4; 8; 13; 16; 18; 19; 20
b.
	i
	CLASSES
	xi
	fi
	Fi
	fri
	1
2
	0 2 —׀
2 4 —׀
	1
....
	4
8
	....
....
	0,04
....
- 49 -
	3
	4 6 —׀
	5
	....
	30
	0,18
	4
	....
	7
	27
	....
	0,27
	5
	8 10 —׀
	....
	15
	72
	....
	6
	10 12 —׀
	....
	....
	83
	....
	7
	....
	13
	10
	93
	0,10
	8
	14 16 —׀
	....
	....
	....
	0,07
	
	
	
	∑ = ....
	
	∑ = ....
xi: 3; 9; 11; 15
fi: 18; 11; 7
Fi: 4; 12; 57; 100
fri: 0,08; 0,15; 0,11
1.7 Gráficos Estatísticos
Definição:
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que às séries.
Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:
a. Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levaro observador a uma análise morosa ou com erros.
b. Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.
c. Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo.
Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas.
1.7.1 Diagramas
Definição:
Os diagramas são gráficos geométricos de, no máximo, duas dimensões: para sua construção, em geral, fazemos uso do sistema cartesiano.
Dentre os principais diagramas, destacamos:
1.7.1.1 Gráfico em Linha ou em Curva
Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística.
O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas.
Exemplo:
a. Para tornar bem clara a explanação, consideremos a seguinte série:
 PRODUÇÃO BRASILEIRA 
- 50 -
DE ÓLEO DE DENDÊ 1987-92
	ANOS
	QUANTIDADE (1.000 t)
	1987
	39,3
	1988
	39,1
	1989
	53,9
	1990
	65,1
	1991
	69,1
	1992
	59,5
FONTE: Agropalma.
Vamos tomar os anos como abscissas e as quantidades como ordenadas.
Assim, um ano dado (x) e a respectiva quantidade (y) formam um par ordenado (x, y), que pode ser representado num sistema cartesiano.
FONTE: Agropalma.
b. No mundo, diversas aeronaves, incluindo grandes jatos de transporte, foram perdidas e centenas de pessoas, dentre tripulantes e passageiros, faleceram devido aos acidentes provocados pela colisão com aves.
Em 2005 as grandes empresas aéreas sofreram prejuízos superiores a U$ 5.000.000,00 de acordo com o SNEA.
- 51 -
c. 
1.7.1.2 Gráfico em Colunas ou em Barras
É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras).
Exemplos:
a. Gráfico em colunas
PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1987-92
- 52 -
	
ANOS
	QUANTIDADE PRODUZIDA
(1.000 t)
	1989
	18.196
	1990
	11.169
	1991
	10.468
	1992
	9.241
FONTE: Ministério da Agricultura.
FONTE: Ministério da Agricultura.
b. Gráfico em Barras
EXPORTAÇÕES BRASILEIRAS MARÇO-1995
	ESTADOS
	VALOR
(US$ milhões)
	São Paulo
	1.344
	Minas Gerais
	542
	Rio Grande do Sul
	332
	Espírito Santo
	285
- 53 -
	Paraná
	250
	Santa Catarina
	202
FONTE: SECEX
FONTE: SECEX
Notas:
· Sempre que os dizeres a serem inscritos são extensos, devemos dar preferência ao gráfico em barras (séries geográficas e específicas). Porém, se ainda assim preferirmos o gráfico em colunas, os dizeres deverão ser dispostos de baixo para cima, nunca ao contrário.
· A ordem a ser observada é a cronológica, se a série for histórica, e a
decrescente, se for geográfica ou categórica.
· A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade nem maior que os dois terços da largura (ou da altura) dos retângulos.
- 54 -
1.7.1.3 Gráfico em Colunas ou em Barras Múltiplas
Este	tipo	de	gráfico	é	geralmente	empregado	quando	queremos	representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.
Exemplo:
BALANÇA COMERCIAL DO BRASIL 1989-93
	ESPECIFICAÇÕES
	VALOR (US$ 1.000.000)
	
	1989
	1990
	1991
	1992
	1993
	Exportação (FOB) Importação
	34.383
18.263
	31.414
20.661
	31.620
21.041
	35.793
20.554
	38.783
25.711
FONTE: Ministério da Fazenda.
FONTE: Ministério da Fazenda.
- 55 -
1.7.1.4 Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série.
Obtemos cada setor através de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º.
Exemplo:
Dada a série:
	
	REBANHO SUÍNO DO SUDESTE
DO BRASIL 1992
	
	ESTADOS
	QUANTIDADE
(mil cabeças)
	
	Minas Gerais Espírito Santo Rio de Janeiro São Paulo
	3.363,7
430,4
308,5
2.035,9
	
	Total
	6.138,5
FONTE: IBGE.	FONTE: IBGE.
Notas:
· O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
- 56 -
· Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus multiplicando o valor percentual por 3,6.
1.7.2 Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade.
Exemplos:
→ a variação da precipitação pluviométrica ao longo do ano ou da temperatura ao longo do dia;
→ o consumo de energia elétrica durante o mês ou o ano;
→ o número de passageiros de uma linha de ônibus ao longo da semana.
O gráfico faz uso do sistema de coordenadas polares.
Exemplo:
→ Dada a série:
PRECIPITAÇÃO PLUVIOMÉTRICA RECIFE - 1993
	MESES
	MILÍMETROS
	Janeiro
	49,6
	Fevereiro
	93,1
	Março
	63,6
	Abril
	135,3
	Maio
	214,7
	Junho
	277,9
	Julho
	183,6
	Agosto
	161,3
	Setembro
	49,2
	Outubro
	40,8
	Novembro
	28,6
	Dezembro
	33,3
- 57 -
FONTE: Ministério da Agricultura.
· Traçamos uma circunferência de raio arbitrário (em particular, damos preferência ao raio de comprimento proporcional à media dos valores da série);
· Construímos uma semi-reta (de preferência na horizontal) partindo de O (pólo) e com uma escala (eixo polar);
· Dividimos a circunferência em tantos arcos quantas forem as unidades temporais;
· Traçamos a partir do centro 0 (pólo), semi-retas passando pelos pontos de divisão;
· Marcamos os valores correspondentes da variável, iniciando pela semi-reta horizontal (eixo-polar);
· Ligamos os pontos encontrados com segmentos de reta;
· Se, pretendemos fechar a poligonal obtida, empregamos uma linha interrompida.
PRECIPITAÇÃO PLUVIOMÉTRICA RECIFE - 1993
SET
OUT
NOV
AGO
DEZ
JUL
JAN
300
JUN
FEV
MAI
MAR
ABR
FONTE: Ministério da Agricultura
1.7.3 Cartograma
O cartograma é a representação sobre uma carta geográfica.
- 58 -
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
Distinguimos duas aplicações:
a. Representar dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados.
b. Representar dados relativos (densidade) – neste caso, lançamos mão, em geral, de hachuras ou cores.
Exemplo:
Nota:
· Quando os números absolutos a serem representados forem muito grandes, no lugar de pontos podemos empregar hachuras.
- 59 -
1.7.4 Pictograma
O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.
Exemplos:
1.7.5 Atividades Complementares (Respostas: pág 211 do livro Estatística Fácil)
1. Represente a série abaixo usando o gráfico em linha:
COMÉRCIO EXTERIOR BRASIL – 1984-93
	ANOS
	QUANTIDADE (1.000 t)
	
	EXPORTAÇÃO
	IMPORTAÇÃO
	1984
	141.737
	53.988
	1985
	146.351
	48.870
	1986
	133.832
	60.597
	1987
	142.378
	61.975
	1988
	169.666
	58.085
	1989
	177.033
	57.293
	1990
	168.095
	57.184
	1991
	165.974
	63.278
	1992
	167.295
	68.059
	1993
	183.561
	77.813
	Total
	1.794
	1.781
Fonte: Min. Indústria, Comércio e Turismo.
2. Represente as tabelas usando o gráfico em colunas:
a.
PRODUÇÃO BRASILEIRA DE PETRÓLEO BRUTO 1991-93
b.
ENTREGA DE GASOLINA
	PARA CONSUNO	
- 60 -
FONTE: Petrobrás.ANOS
QUANTIDADE
(1.000 m3)
1991
36.180,4
1992
36.410,5
1993
37.164,3
BRASIL - 1988-91
	ANOS
	VOLUME
(1.000 m3)
	1988
	9.267,7
	1989
	9.723,1
	1990
	10.121,3
	1991
	12.345,4
FONTE: IBGE.
3. Usando o gráfico em barras, represente as tabelas:
a.
PRODUÇÃO DE OVOS DE GALINHA BRASIL - 1992
b.
PRODUÇÃO DE VEÍCULOS DE AUTOPROPULSÃO
BRASIL - 1993
	TIPOS
	QUANTIDADE
	Automóveis
	1.100.278
	Comerciais leves
	224.387
	Comerciais pesados
	66.771
FONTE: ANFAVEA.REGIÕES
QUANTIDADE
(1.000 dúzias)
Norte
57.297
Nordeste
414.804
Sudeste984.659
Sul
615.978
Centro-Oeste
126.345
FONTE: IBGE.
4. Represente as tabelas por meio de gráficos em setores:
a.
ÁREA TERRESTRE BRASIL
b.
PRODUÇÃO DE FERRO GUSA BRASIL - 1993
	UNIDADES DA
FEDERAÇÃO
	PRODUÇÃO
(1.000 t)
	Minas Gerais
	12.888
	Espírito Santo
	3.174
	Rio de Janeiro
	5.008
	São Paulo
	2.912
FONTE: Instituto Brasileiro de Siderurgia.REGIÕES
RELATIVA
(%)
Norte
45,25
Nordeste
18,28
Sudeste
10,85
Sul
6,76
Centro-Oeste
18,86
Total
100,00
FONTE: IBGE.
5. Represente a tabela por meio de um gráfico de colunas múltiplas:
EXPORTAÇÃO BRASILEIRA 1985-1990-1995
	ANOS
	NATUREZA
	
	PRÓPRIOS (%)
	ALUGADOS (%)
	CEDIDOS (%)
	1990
	62,7
	22,9
	14,4
	1991
	70,3
	16,5
	13,2
FONTE: IBGE.
- 61 -
6. Represente as tabelas por meio de gráficos polares:
a.
VENDA DE VACINA CONTRA AFTOSA
BRASIL - 1992
b.
PRECIPITAÇÃO PLUVIOMÉTRICA FLORIANÓPOLIS - 1993MESES
MILÍMETROS
Janeiro
165,7
Fevereiro
106,6
Março
71,6
Abril
34,7
Maio
184,9
Junho
102,7
Julho
198,3
Agosto
36,8
Setembro
72,2
Outubro
147,8
Novembro
175,1
Dezembro
198,3
FONTE: Ministério da Agricultura.MESES
MILÍMETROS
Janeiro
37,30
Fevereiro
41,20
Março
38,55
Abril
47,70
Maio
40,65
Junho
44,70
Julho
41,20
Agosto
46,00
Setembro
41,00
Outubro
55,00
Novembro
52,80
Dezembro
35,40
FONTE: Sindam.
2 MEDIDAS ESTATÍSTICAS
2.1 Medidas de Tendência Central
Podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza no início, no meio ou no final, ou, ainda, se há uma distribuição por igual.
Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se expressem através de números que nos permitem traduzir essas tendências. Esses conceitos são denominados elementos típicos da distribuição e são as:
a. medidas de posição;
b. medidas de variabilidade ou dispersão;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos típicos, destacamos, neste capítulo, as medidas de posição – estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal (eixo das abscissas).
As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos:
a. a média aritmética;
b. a mediana;
c. a moda.
As outras medidas de posição são as separatrizes, que englobam:
a. a própria mediana;
- 62 -
b. os quartis;
c. os percentis.
2.1.1 Média Aritmética (X)
Definição:
Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número deles:
X =  xi  n
Sendo:
X a média aritmética;
xi os valores da variável;
n o número de valores.
2.1.1.1 Dados Não-Agrupados
Quando desejamos conhecer a média dos dados não-agrupados, determinamos a média aritmética simples.
Exemplos:
→ Sabendo-se que a produção leiteira diária de vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 1 litros, temos, para produção média da semana:
X = (10 + 14 + 13 + 15 + 16 + 18 +1) : 7 = 14
Logo: X = 14 litros
2.1.1.2 Desvio em Relação à Média
Desvio em relação ã média é a diferença entre cada elemento de um conjunto de valores e a média aritmética.
Designando o desvio por d1, temos:
d1 = x1 – X
d1 = 10 – 14 = -4
d2 = 0	d7 = -2
2.1.1.3 Propriedades da Média
1) A soma algébrica dos desvios tomados em relação a média é nula: d1 = 0 No exemplo anterior, temos: d1 = (-4) + 0 + (-1) +	+ 7 = 0
2) 	Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante:
y1 = xi ± c => Y = X ± c
- 63 -
Somando 2 a cada um dos valores da variável do exemplo dado, temos:
y1 = 12, y2 = 16, y3 = 15, ..., y7 = 14
Daí: y1 = 12 + 16 + 15 + ... + 14 = 112
Como n = 7, vem: Y = 112 ÷ 7 = 16 => Y = 14 + 2 => Y = x + 2
3) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante:
y1 = x1 . c => Y = X . c	ou	y1 = x1 ÷ c => Y = X ÷ c Multiplicando por 3 cada um dos valores da variável do exemplo dado, obtemos:
y1 = 30, y2 = 42, y3 = 39, ..., y7 = 36
Daí:	 y1 = 30 + 42 + 39 + ... + 36 = 294
Como n = 7, vem: y= 294 ÷ 7 = 42 => y= 14 x 3 => y= x . 3
2.1.1.3 Dados Agrupados
2.1.1.3.1 Sem Intervalos de Classe
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino:
TABELA 2.1
	No DE
MENINOS
	fi
	0
	2
	1
	6
	2
	10
	3
	12
	4
	4
	
	∑ = 34
Neste caso, como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fator de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:
X = (∑ xifi) ÷ (∑ fi)
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente ao produto xifi:
TABELA 2.2xi
fi
xifi
0
2
0
1
6
6
2
10
20
3
12
36
4
4
16
∑ = 34
∑ = 78
•
Temos, então: ∑ xifi = 78 e ∑ fi
Logo: X = (∑ xifi) ÷ (∑ fi) = 78 ÷ 34 = 2,3
Nota:
Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino?
- 64 -
O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos.
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
xi	1	2	3	4	5	6
fi	2	4	6	8	3	1
Temos:
	xi
	fi
	xifi
	1
	2
	2
	2
	4
	...
	3
	6
	...
	4
	8
	...
	5
	3
	...
	6
	1
	...
	
	∑ = ...
	∑ = ...
Como: ∑ xifi = ...., ∑ xifi = ....	e	X = (∑ xifi) ÷ (∑ fi)
Temos: X = .... ÷	= 3,4
2.1.2.4.2 Com Intervalos de Classe
Neste caso, convencionamos que todos os valores excluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: = (∑ xifi) ÷ (∑ fi)
Onde xi é o ponto médio da classe. Consideremos a distribuição:
TABELA 2.3
	
i
	ESTATURA S
(cm)
	
fi
	1
	150 ι— 154
	4
	2
	154 ι— 158
	9
	3
	158 ι— 162
	11
	4
	162 ι— 166
	8
	5
	166 ι— 170
	5
	6
	170 ι— 174
	3
	
	
	∑ = 40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os pontos xifi:
TABELA 2.4
	i
	ESTATURAS
(cm)
	fi
	xi
	xifi
	1
	150 ι— 154
	4
	152
	608
- 65 -
	2
3
4
5
6
	154 ι— 158
158 ι— 162
162 ι— 166
166 ι— 170
170 ι— 174
	9
11
8
5
3
	156
160
164
168
172
	1.404
1.760
1.312
840
516
	
	
	∑ = 40
	
	∑ = 6.440
Como, neste caso: ∑ xifi = 6.440, ∑ fi = 40	e	X = (∑ xifi) ÷ (∑ fi) Temos: X = 6.440 ÷ 40 = 161 cm
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
xi fi
450 ι— 550 ι— 650 ι— 750 ι— 850 ι— 950 ι— 1.050 ι— 1.150
8
10
11
16
13
5
1
Temos:
	i
	xi
	fi
	xifi
	1
	500
	8
	4.000
	2
	....
	10
	....
	3
	....
	11
	....
	4
	....
	16
	....
	5
	....
	13
	....
	6
	....
	5
	....
	7
	1.100
	1
	....
	
	∑ = ....
	
	∑ = ....
Logo: X = .... ÷	= R$ 755,00
2.1.2.4.3 Processo Breve
Com o intuito de eliminarmos o grande número de cálculos que as vezes se apresentam na determinação da média, empregamos o que denominamos processo breve (em oposição ao processo utilizado anteriormente – processo longo), baseado em uma mudança da variável x por outra y, tal que:
y1 = (x1 – x0) ÷ h
onde x0 é uma constante arbitrária escolhida convenientemente dentre os pontos médios da distribuição – de preferência o de maior freqüência.
Fazendo essa mudança de variável, de acordo com a segunda e a terceira propriedades da média, ela resulta diminuída de x0 e dividida por h; mas isso pode ser compensado somando x0 a média da nova variável e, ao mesmo tempo, multiplicando-a por h. Resulta, então, a fórmula modificada.
X = x0 + (∑ yifi x h) ÷ (∑ fi)
Assim, a distribuição da Tabela 2.3, tomando para o valor x0o ponto médio de maior freqüência (se bem que podemos tomar qualquer dos valores do ponto médio), isto é:
x0 = 160
como h = 4, temos para valores da nova variável:
y1 =(152 – 160) ÷ 4 = -2	y2 =(156 – 160) ÷ 4 = -1	y6 =(172 – 160) ÷ 4 = 3
Vamos, então, calcular a média da distribuição da Tabela 2.3 pelo processo breve.
- 66 -
Começamos por completar a tabela dada com as colunas correspondentes aos pontos médios (xi), aos valores da nova variável (yi) e aos produtos yifi:
TABELA 2.5
	
i
	ESTATURA S
(cm)
	
fi
	
xi
	
fi
	
xifi
	
	1
	150 ι— 154
	4
	152
	-2
	-8
	0
	2
	154 ι— 158
	9
	156
	-1
	-9
	-17
	3
	158 ι— 162
	11
	160
	0
	0
	0
	4
	162 ι— 166
	8
	164
	1
	8
	0
	5
	166 ι— 170
	5
	168
	2
	10
	0
	6
	170 ι— 174
	3
	172
	3
	9
	27
	
	x0 = 160
	∑ = 40
	
	
	∑ = 10
	
Temos, então, x0 = 160, ∑ yifi = 10, ∑ fi = 40 e h = 4. Substituindo esses valores na fórmula:
X = x0 + (∑ yifi x h) ÷ (∑ fi) Vem: X = 160 + 10 x 4 ÷ 40 = 160 + 1 = 161 cm
Notas:
· O processo breve, com a nova variável definida por nós, só pode ser usado em distribuições que apresentam intervalos de classe de mesma amplitude.
· O processo breve pode, também, ser aplicado para as distribuições sem intervalos de classe, bastando fazer h = 1.
Fases para o cálculo da média pelo processo breve:
1) Abrimos uma coluna para os valores xi
2) Escolhemos um dos pontos médios (de preferência o de maior freqüência) para o valor de x0.
3) Abrimos uma coluna para os valores de y1 e escrevemos zero na linha
4)
5)
correspondente a classe onde se encontra o valor de x0; a seqüência -1, -2, -3, ..., logo acima do zero, e a seqüência 1, 2, 3, ..., logo abaixo.
Abrimos uma coluna para os valores do produto yifi, conservando os sinais + ou -, e, em seguida, somamos algebricamente esses produtos.
Aplicamos a fórmula.
Exercício Resolvido:
1) Calcule a média aritmética, pelo processo breve, da distribuição:
xi fi
450 ι— 550 ι— 650 ι— 750 ι— 850 ι— 950 ι— 1.050 ι— 1.150
8
10
11
16
13
5
1
- 67 -
Temos:
	i
	xi
	fi
	yi
	xifi
	
	1
	500
	8
	-3
	-24
	0
	2
	600
	10
	-2
	-20
	0
	3
	700
	1
	-1
	-11
	-55
	4
	800
	16
	0
	0
	0
	5
	900
	13
	1
	13
	0
	6
	1.000
	5
	2
	10
	0
	7
	1.100
	1
	3
	3
	26
	x0 = 800
	
	∑ = 64
	
	∑ = -29
	
Como: h = 100
Vem: X = x0 + (∑ yifi x h) ÷ (∑ fi) = 800 + (-29) 100 ÷ 64 = 754,69 = R$ 755,00
Resolva:
Complete o esquema para o cálculo da média aritmética da distribuição:
xi fi
30 ι— 50 ι— 70 ι— 90 ι— 110 ι— 130
2
8
12
10
5
Temos:
	i
	xi
	fi
	yi
	xifi
	1
	40
	...
	...
	...
	2
	...
	...
	...
	... ...
	3
	...
	12
	...
	...
	4
	...
	...
	...
	...
	5
	...
	...
	2
	... ...
	x0 = ...
	∑ = ...
	
	
	∑ = ...
Como: h = ...
Vem: X = x0 + (∑ yifi x h) ÷ (∑ fi) = ... + ... x ... ÷ ... = 84,3
Emprego da Média
A média é utilizada quando:
a) Desejamos obter a medida de posição que possui a maior estabilidade;
b) Houver a necessidade de um tratamento algébrico ulterior.
2.1.2 A Moda (Mo)
Definição:
- 68 -
Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.
Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa indústria.
2.1.2.1 Dados Não-Agrupados
Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete.
A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nos quais nenhum valor apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13
Que não apresenta moda (amodal).
Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série:
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
Temos duas modas: 4 e 7 (bimodal).
2.1.2.1 Dados Agrupados
2.1.2.1.1 Sem Intervalos de Classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência.
Na distribuição da Tabela 1, a freqüência máxima (12) corresponde o valor 3 da variável. Logo: Mo = 3
2.1.2.1.2 Com Intervalos de Classe
A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal.
Damos a esse valor a denominação de moda bruta. Temos, então: Mo = (l* + L*) ÷ 2
Onde: l* é o limite inferior da classe modal.	L* é o limite superior da classe modal. Assim, para a distribuição:
TABELA 2.5
	
i
	ESTATURA S
(cm)
	
fi
	1
	150
	ι—
	154
	4
	2
	154
	ι—
	158
	9
	3
	158
	ι—
	162
	11
	4
	162
	ι—
	166
	8
	5
	166
	ι—
	170
	5
	6
	170
	ι—
	174
	3
	
	
	∑ = 40
- 69 -
Temos que a classe modal é i = 3, l* = 158 e L* =162. Como: Mo = (l* + L*) ÷ 2
Vem: Mo = (158 + 162) ÷ 2 = 160 cm
Nota:
· Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de Czuber:
Mo = l* + D1 ÷ (D1 + D2) x h* Na qual:
l* é o limite inferior da classe modal; h* é a amplitude da classe modal; D1 = f* - f(ant);
D2 = f* - f(post).
Sendo:
f* a frequência simples da classe modal;
f(ant) a freqüência simples da classe anterior à classe modal;
f(post) a freqüência simples da classe posterior à classe modal.
Assim, para a distribuição da Tabela 1, temos: D1 = 11 – 9 = 2 e D2 = 11 – 8 = 3
Donde: Mo = 158 + 2 (2 + 3) x 4 = 158 + 2 x 4 (2 + 3) = 158 + 8 ÷ 5 = 159,6 cm
Resolva:
Complete o esquema para o cálculo da moda da distribuição de freqüência:
	i
	CUSTOS
(R$)
	fi
	1
	450 ι— 550
	8
	2
	550 ι— 650
	10
	3
	650 ι— 750
	11
	4
	750 ι— 850
	16
	5
	850 ι— 950
	13
	6
	950 ι— 1050
	5
	7
	1050 ι— 1150
	1
	
	
	∑ = 64
A classe modal é a de ordem ....... Logo: l* = .... e L = ....
Temos, pois: Mo = (.... + ....) ÷ 2 = .... ÷ 2 = R$ ....
Emprego da Moda A moda é utilizada:
a) Quando desejamos obter uma medida rápida e aproximada de posição;
b) Quando a medida de posição deve ser o valor mais típico da distribuição.
- 70 -
2.1.3 A Mediana (Md)
Definição:
A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que separa em dois subconjuntos de mesmo número de elementos.
2.1.3.1 Dados Não-Agrupados
Dada uma série de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9
De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo.
Temos, então: Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio.
Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 Tem para mediana a média aritmética entre 10 e 12. Logo: Md = (10 + 12) ÷ 2 = 11
Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será:
· o termo de ordem (n + 1) ÷ 2, se n for ímpar;
· a média aritmética dos termos de ordem n ÷ 2 e (n ÷ 2) + 1, se n for par. Podemos comprovar tal fato nas séries dadas:
· para n = 9, temos (9 + 1) ÷ 2 = 5. Logo, a mediana é o quinto termo da série, isto é: Md = 10
· para n = 8, temos 8 ÷ 2 = 4 e (8 ÷ 2) + 1= 5. Logo, a mediana é a média aritmética do quarto e do quinto termos da série, isto é: Md = (10 + 2) ÷ 2 = 11
Notas:
· O valor da mediana pode coincidir ou não com um elemento da série, como vimos. Quando o númerode elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par.
· A mediana e a média aritmética não têm, necessariamente, o mesmo valor. Na primeira série apresentada, por exemplo, temos: X = 10,4 e Md = 10
· A mediana, como vimos, depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes da mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). Essa propriedade das medianas pode ser constatada através dos exemplos a seguir: 5, 7, 10, 13, 15 ⟶ X = 10 e Md = 10
- 71 -
5, 7, 10, 13, 65 ⟶ X= 20 e Md = 10
Isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos valores extremos, ao passo que a mediana permanece a mesma.
· A mediana é designada, muitas vezes, por valor mediano.
2.1.3.2 Dados Agrupados
Se os dados se agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos.
Para o caso de uma distribuição, porém, a partir de qualquer um dos extremos, é dada por: (∑ f1) ÷ 2
2.1.3.3 Sem intervalos de classe
Neste caso, é o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada:
TABELA 2.6
	Nº DE
MENINOS
	fi
	Fi
	0
	2
	2
	1
	6
	8
	2
	10
	18
	3
	12
	30
	4
	4
	34
	
	∑ = 34
	
Sendo: (∑ f1) ÷ 2 = 34 ÷ 2 = 17
A menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo: Md = 2 meninos
Nota:
· 	No caso de existir uma freqüência acumulada (F1), tal que: F1 = (∑ f1) ÷ 2 A mediana será dada por: Md = (xi + xi + 1) ÷ 2
Isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte.
Exemplo:
TABELA 2.7
	xi
	fi
	Fi
	12
	1
	1
	14
	2
	3
	15
	1
	4
	16
	2
	6
	17
	1
	7
	20
	1
	8
	
	∑ = 8
	
- 72 -
Temos: 8 ÷ 2 = 4 = F3
Logo: Md = (15 + 16) ÷ 2 = 31 ÷ 2 = 15,5
Resolva:
1) Complete o esquema para o cálculo da mediana das distribuições:
	a.
	
	
	
	
	
	
	b.
	
	
	xi
	2
	4
	6
	8
	10
	
	xi
	0	1
	2
	3
	4
	5
	
	fi
	3
	7
	12
	8
	4
	
	fi
	2	5
	9
	7
	6
	3
Temos:
	xi
	fi
	Fi
	2
	3
	...
	4
	7
	10
	6
	12
	...
	8
	8
	30
	10
	4
	...
	
	∑ = ...
	
Como: ∑ fi ÷ 2 =	÷ 2
Vem: Md = ....
Temos:
	xi
	fi
	Fi
	0
	2
	2
	....
	....
	....
	....
	9
	....
	....
	....
	....
	4
	....
	....
	....
	....
	....
	
	∑ = ...
	
Como: ∑ fi ÷ 2 = .... ÷ 2 = .... Vem: Md = ....
2.1.3.4 Com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente à freqüência acumulada imediatamente superior a (∑ f1) ÷ 2.
Feito isto, um problema de interpolação (inserção de uma determinada quantidade de valores entre dois números dados) resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe.
Assim, considerando a distribuição da Tabela 3, acrescida das freqüências acumuladas:
TABELA 6
	i
	ESTATURAS
(cm)
	fi
	Fi
	1
	150 ι— 154
	4
	4
	2
	154 ι— 158
	9
	13
	3
	158 ι— 162
	11
	24  classe mediana
	4
	162 ι— 166
	8
	32
	5
	166 ι— 170
	5
	37
	6
	170 ι— 174
	3
	40
	
	
	∑ = 40
	
Temos: (∑ f1) ÷ 2 = 40 ÷ 2 = 20
Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos
- 73 -
que este deve estar localizado na terceira classe (i =3), supondo que as seqüências dessas classes estejam uniformemente distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, z partir do limite inferior, a distância:
(20 – 13) ÷ 11 x 4 = 7 ÷ 11 x 4
E a mediana será dada por:
Md = 158 + 7 x 11 ÷ 4 = 160,54 = 165 cm
Na prática, executamos os seguintes passos:
Fases para o cálculo da média pelo processo breve:
1) Determinamos as freqüências acumuladas.
2) Calculamos (∑ f1) ÷ 2.
3) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (∑ f1) ÷ 2 − classe mediana − e, em seguida, empregamos a fórmula:
Na qual:
l* é o limite inferior da classe mediana;
F* (ant) é a freqüência acumulada da classe anterior à classe mediana; f* é a freqüência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
Tomando como exemplo a distribuição anterior, temos: (∑ fi) ÷ 2 = 40 ÷ 2 = 20
Logo, a classe mediana é a de ordem 3. Então: l* = 158, F(ant) = 13, f* = 11 e h* = 4 Substituindo esses valores na fórmula, obtemos: Md = 158 + (20 – 13) 4 ÷ 11 = 160,54
= 160,5 cm
Resolva:
1) Complete o esquema para o cálculo da mediana da distribuição de freqüência.
xi fi
450 ι— 550 ι— 650 ι— 750 ι— 850 ι— 950 ι— 1.050 ι— 1.150
8
10
11
16
13
5
1
Temos:
	i
	CUSTOS (R$)
	fi
	Fi
	1
2
3
4
5
6
7
	450 ι— 550
550 ι— 650
650 ι— 750
750 ι— 850
850 ι— 950
950 ι— 1.050
1.050 ι— 1.150
	8
....
....
....
.... - 74
....
....
	8
18
....
....
-	....
....
....
	
	
	
	∑ =....
(∑ fi) ÷ 2= .... ÷ 2 = ....
l* = ...., F(ant) = .... e h* = ....
Logo: Md = .... + (.... - ....) .... ÷ .... = ....
Isto é: Md = R$ 769,00
Nota:
* No caso de existir uma freqüência acumulada exatamente igual a (∑ fi) ÷ 2, a mediana será o limite superior da classe correspondente.
Exemplo:
	i
	CLASSES
	fi
	Fi
	1
	0 ι— 10
	1
	1
	2
	10 ι— 20
	3
	4
	3
	20 ι— 30
	9
	13
	4
	30 ι— 40
	7
	20
	5
	40 ι— 50
	4
	24
	6
	50 ι— 60
	2
	26
	
	
	∑ = 20
	
(∑ fi) ÷ 2 = 26 ÷ 2 = 13
Logo: Md = L* = 30
Emprego da Mediana Empregamos a mediana quando:
a) desejamos obter o ponto que divide a distribuição em partes iguais;
b) há valores extremos que afetam de uma maneira acentuada a média;
c) a variável em estudo é salário.
2.1.4 Atividades Complementares
1) Considerando os conjuntos de dados:
a. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 x = 5,1; Md = 5; Mo = 5
b. 20, 9, 7, 2, 12, 7, 2, 15, 7 x = 11; Md = 9; Mo = 7
- 75 -
c. 51,6; 48,7; 50,3; 49,5; 48,9 x = 49,8; Md = 49,5; Mo = Ө
d. 15, 18, 20, 13, 10, 16, 14 x = 15,1; Md = 15; Mo = Ө
Calcule:
I. a média;	II. a mediana;	III. a moda.
2) O salário-hora de cinco funcionários de uma companhia, são: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00 e R$88,00
Determine:
a. a média dos salários-hora; R$ 96,00
b. o salário-hora mediano. R$ 88,00
3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2.
Determine:
a) a nota média; 7,9
b) a nota mediana; 7,8
c) a nota modal. 7,2
4. Considerando a distribuição abaixo:
	xi
	3
	4
	5	6
	4
	8
	fi
	4
	8
	11 10
	8
	3
Calcule:
a) a média; 5,4
b) a mediana; 5
c) a moda. 5
5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição:
NOTAS	2	3	4	5	6	7	8	9	10
Nº DE ALUNOS
1
3	6 10 13	8	5	3	1
Determine:
a) a nota média; 5,9
b) a nota mediana; 6
c) a nota modal. 6
6. Determine a média aritmética de:
a. 64,5
	VALORES
	50
	60
	80
	90
	QUANTIDADES
	8
	5
	4
	3
b. 58,8
xi
50	58	66
- 76 -
fi
20	50	30
7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4,
15. Determine a soma dos desvios. -2,5; -0,5; -3,5; 3,5; 2,5; -1,5; -4,5; 6,5
8. Calcule a média aritmética das distribuições de freqüência abaixo:
a. 5,3
	NOTAS
	fi
	0 ι— 2
	5
	2 ι— 4
	8
	2 ι— 4
	14
	2 ι— 4
	10
	2 ι— 4
	7
	
	∑ = 44
c. R$ 843,00
b. 
172,4 cm
	ESTATURA
S (cm)
	fi
	150 ι— 158
	5
	158 ι— 166
	12
	166 ι— 174
	18
	174 ι— 182
	27
	182 ι— 190
	8
	
	∑ = 70
d. 159,4 kg
	SALÁRIOS (R$)
fi
500 ι— 700
18
700 ι— 900
31
900 ι— 1.100
15
1.100 ι— 1.300
3
1.300 ι— 1.500
1
1.500 ι— 1.700
1
1.700 ι— 1.900
1
∑ = 70
PESOS(kg)
fi
145 ι— 151
10
151 ι— 157
9
157 ι— 163
8
163 ι— 169
6
169 ι— 175
3
175 ι— 181
3
181 ι— 187
1
∑ = 40
9. Calcule a mediana de cada uma das distribuições do exercício 8.
a. 5,3	b. 174 cm	c. R$ 810,00	d. 157,8 kg
10. Calcule a moda de cada uma das distribuições do exercício 8.
a. 5	b. 178 cm	c. R$ 800,00	d. 148 kg
11. Você fez dois trabalhos num semestre e obteve as notas 8,5 e 5,5. Qual deve ser a nota que você deve tirar no 3º trabalho para que a média dos três seja 7: 7
12. Numa empresa, vinte operários têm salário de R$ 4.000,00 mensais; dez operários têm salário de R$ 3.000,00 mensais e trinta têm salário de R$ 2.000,00 mensais. Qual é o salário médio desses operários: X = 2.833,33
13. Explique a relação média aritmética e média ponderada. Pesquise caso necessário.
A média ponderada nada mais é do que a média aritmética considerando o valor xn ocorrendo pn vezes.
14. 	Numa grande empresa, em três setores pesquisados num determinado dia, foram constatadas faltas de funcionários, assim distribuídos:
· 4% no setor administrativo;
· 8% no setor de produção;
· 12% no setor comercial.
Calcule a média de faltas desse dia, considerando que, no setor de produção, há 200 funcionários, o setor administrativo tem 50 funcionários e o setor comercial tem 75 funcionários. X = (16 + 2 + 9) / 325 = 8,3%
- 77 -
15. Um carro, numa viagem, andou 5 horas a 60 km por hora. Determine a velocidade horária média nessas 8 horas de viagem. 76,25 km/h
16. A média aritmética entre 50 números é igual a 38. Dois números são retirados: o número 55 e o 21. Calcule a média aritmética dos números que restaram. 38
17. Um ourives fez uma liga fundindo 200 g de ouro 14 k (quilates) com 100 g de ouro 16
k. O número que dá a melhor aproximação em quilates de ouro obtido é: positivo
a) 14,5 k	b) 14,6 k	xc) 14,7 k	d) 15,0 k	e) 15,5 k
18. Num concurso de vestibular para dois cursos A e B, compareceram 500 candidatos para o curso A e 100 candidatos para o curso B. Na prova de Matemática, a média aritmética geral, considerando os dois cursos, foi 4,0.
Mas, considerando apenas os candidatos ao curso A, a média cai para 3,8.
A média dos candidatos ao curso B, na prova de Matemática, foi: positivo
a) 4,2	xb) 5,0	c) 5,2	d) 6,0	e) 6,2
19. Seja M a média aritmética de 15 números quaisquer. Subtraindo-se 10 unidades de cada um desses números, obtêm-se 15 novos números, cuja média aritmética é:
a) M – 15	b) M + 150	xc) M – 10	d) M + 10	e) 10 M positivo
20. Considere um grupo formado por cinco amigos com idade de 13, 13, 14, 14 e 15 anos. O que acontece com a média de idade desse grupo, se um sexto amigo com 16 anos juntar-se ao grupo? positivo
a) Permanece a mesma	b) Diminui 1 ano	c) Aumenta 12 anos
d) Aumenta mais de 1 ano xe) Aumenta menos de 1 ano
21. A média aritmética dos números pares de dois algarismos é: positivo
a) 50 b) 51 c) 52 d) 53 xe) 54
22. A média aritmética de um grupo de 120 pessoas é de 40 anos. Se a média aritmética das mulheres é de 35 anos e dos homens é de 50 anos, qual o número de pessoas de cada sexo, no grupo?
(∑ ih + ∑ im)/120 = 40 .: ∑ ih/h = 50 .: ∑ im/m = 50 .: h + m = 120 → 80 homens e 40 mulheres
23. Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é: positivo
a) 16 b) 20 c) 10 xd) 70 e) 100
24. Num país, a população feminina é 51% do total. A idade média da população feminina é 38 anos e da masculina é 36. Então, a idade média da população, em anos, é: positivo
xa) 37,02	b) 37,00	c) 37,20	d) 36,60	e) 37,05
25. Numa população, a razão do número de mulheres para o de homens é de 11 para 10. A idade média das mulheres é 34 e a idade média dos homens é 32. Então, a idade média da população é aproximadamente: positivo
a) 32,9 b) 32,95 c) 33,00 xd) 33,05 e) 33,10
2.2 Medidas de Dispersão ou de Variabilidade
Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, média e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se apresentavam esses mesmos dados nas tabelas.
- 78 -
Assim, não é convenientemente dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a mesma, e igual a 24ºC. A outra poderá ter uma variação pequena de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável.
Vemos, então, que a média – ainda que considerada como um número que tem a faculdade de representar uma série de valores – não pode, por si mesma, destacar o grau de homogeneidade o heterogeneidade que existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis x, y e z: x: 70, 70, 70, 70, 70.
y: 68, 69, 70, 71, 72.
z: 5, 15, 50, 120, 160.
Suas médias aritméticas são 70, 70 e 70.
Entretanto, é fácil notar que o conjunto x é mais homogêneo que os conjuntos y e z, já que todos os valores são iguais à média.
O conjunto y, por sua vez, é mais homogêneo que o conjunto z, pois há menor diversificação entre cada um de seus valores e a média representativa.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer que o conjunto x apresenta dispersão ou variabilidade nula e que o conjunto y apresenta uma dispersão ou variabilidade menor que o conjunto z.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o
coeficiente de variação.
2.2.1 Amplitude Total
2.2.1.1 Dados não Agrupados
A amplitude total é a diferença entre o maior e o menor valor observado:
AT = x(máx) – x(mín)
Exemplo:
Para os valores: 40, 45, 48, 52, 54, 62 e 70
Temos: AT = 70 – 40 = 30
Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Relativamente aos três conjuntos de valores mencionados no início deste capítulo, temos: ATx = 70 – 70 = 0, (dispersão nula)
ATy = 72 – 68 = 4
ATz = 160 – 5 = 155
2.2.1.2 Dados Agrupados
- 79 -
* Sem intervalos de classe:
Neste caso, ainda temos: AT = x(máx) – x(mín)
Exemplo: Considerando a tabela abaixo:
	xi
	0
	1
	2
	3
	4
	fi
	2
	6
	12
	7
	3
Temos: AT = 4 – 0 = 4
* Com intervalos de classe:
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe: AT = L(máx) – l(mín)
Exemplo:
Considerando a distribuição abaixo:
TABELA 2.8
	
i
	ESTATURA S
(cm)
	
fi
	1
	150
	ι—
	154
	4
	2
	154
	ι—
	158
	9
	3
	158
	ι—
	162
	11
	4
	162
	ι—
	166
	8
	5
	166
	ι—
	170
	5
	6
	170
	ι—
	174
	3
	
	
	∑ = 40
Temos: AT = 174 -150 = 24
A amplitude total tem o inconvenientemente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude em um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade.
2.2.2 Variância e Desvio Padrão
Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos aoacaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas, índices de variabilidade bastante instáveis e, por isso mesmo, os mais geralmente empregados.
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios (lembremos que ∑ di = ∑ (xi - X) = 0). Assim, representando a variância por S2, temos:
S2 = ∑ (xi - X)2 ÷ ∑ fi
Ou, lembrando que ∑ fi = n ⟶ S2 = ∑ (xi - X)2 ÷ n
Nota:
- 80 -
· Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n – 1 em lugar de n.
Podemos, ainda, com o intuito de conservar a definição, calcular a variância usando o divisor de n e, em seguida, multiplicar o resultado por n ÷ (n – 1).
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância e representada por s: S = √s2
Assim: √(∑ (xi - X)2 ÷ n) (1)
Nota:
· Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista.
A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras.
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média aritmética (X) é um número fracionário, o que torna pouco prático o cálculo das quantidades (xi - X)2.
Podemos simplificar os cálculos fazendo uso da igualdade:
∑ (xi - X)2 = ∑ xi2 - (∑ xi)2 ÷ n
Assim, substituindo ∑ (xi - X)2 por seu equivalente em (1), obtemos:
s = √(∑ x 2 - (∑ x )2 ÷ n)i	i
que pode ser escrita do seguinte modo: s = √(∑ x 2 ÷ n - (∑ x ÷ n)2) (2)i	i
Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo os resultados do cálculo ser menos exatos do que quando a fórmula (2) é usada.
O desvio padrão goza de algumas propriedades, dentre as quais destacamos:
1) 	Somando-se (ou subtraindo-se) uma constante a (de) todos os valores de uma variável, o desvio padrão não se altera: yi = xi ± c ⟶ sy = sx
2) 	Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante: yi = xi x c ⟶ sy = c x sx
Essas propriedades nos permitem introduzir, no cálculo do desvio padrão, simplificações úteis, como veremos mais adiante.
Para o cálculo do desvio padrão, consideremos os seguintes casos:
2.2.2.1 Dados não Agrupados
Tomemos como exemplo, o conjunto de valores da variável x:
40, 45, 48, 52, 54, 62, 70
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma pra x1 e outra para x12. Assim:
- 81 -
TABELA 2.9
	xi
	x 2
1
	40
	1.600
	45
	2.025
	48
	2.304
	52
	2.704
	54
	2.916
	62
	3.844
	70
	4.900
	∑ = 371
	∑ = 20.293
Como n = 7, temos:
s = √(∑ x 2 ÷ n - (∑ x ÷ n)2) = √(20 ÷ 7 - (371÷ 7)2) = 9,486i	i
Resolva:
1) Complete o esquema para o cálculo do desvio padrão, dados os valores da variável:8, 10, 11, 15, 16, 18
Temos:
	
	xi
	x12
	
	8
	64
	
	....
	....
	
	....
	....
	
	....
	....
	
	....
	....
	n = ....
	∑ = ....
	∑ = ....
Logo: s = √(∑ x 2 ÷ n - (∑ x ÷ n)2) = √(.... ÷ .... - (.... ÷	)2) = 3,56i	i
2) 	Comprove a primeira propriedade do desvio padrão somando 5 a cada valor da variável do exercício anterior.
3) Comprove a segunda propriedade do desvio padrão multiplicando por 2 cada valor da variável do exercício 1.
2.2.2.2 Dados Agrupados
* Sem intervalo de classe
Como, neste caso, temos a presença de freqüências, devemos levá-las em consideração, resultando a fórmula:
s = √(∑ f x 2 ÷ n - (∑ f x ÷ n)2)i i	i i
Consideremos como exemplo, a distribuição da Tabela:
	xi
	0
	1	2
	3
	4
	fi
	2
	6	12
	7
	3
O modo mais prático de se obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para f x 2, lembrando que para obter f x 2 basta multiplicar cada fixi pelo seu respectivo xi. Assim:i i	i i
- 82 -
TABELA 2.10
	xi
	fi
	fi xi
	fi xi2
	0
	2
	0
	0
	1
	6
	6
	48
	2
	12
	24
	43
	3
	7
	21
	63
	4
	3
	12
	48
	
	∑ = 30
	∑ = 63
	∑ = 165
Logo: s = √(∑ f x 2 / n - (∑ f x / n)2) = √(165 / 30 - (63 / 30)2) = 1,044i i	i i
Resolva:
1) Complete o esquema para o cálculo do desvio padrão da distribuição:
	
	xi
	1
	2
	3	4
	5
	6
	
	fi
	2
	5
	8	6
	3
	1
	
Temos:
	
	
	
	
	
	
	xi
	fi
	fi xi
	fi xi2
	1
	2
	2
	2
	2
	....
	....
	....
	3
	....
	....
	....
	4
	....
	....
	....
	5
	....
	....
	....
	6
	....
	....
	....
	
	∑ = ....
	∑ = ....
	∑ = ....
Logo: s = √(∑ f x 2 / n - (∑ f x / n)2) = √(.... / .... - (.... /	)2) = 1,24i i	i i
* Com intervalo de classe:
Tomemos como exemplo a distribuição da Tabela 2.8.
Começamos por abrir as colunas para xi (ponto médio), para fixi e para f x 2. Assim:i i
TABELA 2.11
	i
	ESTATURAS
(cm)
	fi
	xi
	fixi
	fixi2
	1
	150 ι— 154
	4
	152
	608
	92.416
	2
	154 ι— 158
	9
	156
	1.404
	219.024
	3
	158 ι— 162
	11
	160
	1.760
	281.600
	4
	162 ι— 166
	8
	164
	1.312
	215.168
	5
	166 ι— 170
	5
	168
	840
	141.120
	6
	170 ι— 174
	3
	172
	516
	88.752
	
	
	∑ = 40
	
	∑ = 6.440
	∑ = 1.038.080
Logo: s = √(1.038.080 / 40 - (6.440 / 40)2) = √(31) = 5,567
2.2.2.3 Processo Breve
- 83 -
Baseados na mudança da variável x por outra y, tal que: yi = (xi – x0) / h,
E pelas mesmas razões expostas para o cálculo da média, podemos obter um processo breve de cálculo, com a aplicação da seguinte fórmula:
s = √(∑ f y 2 / n - (∑ f y / n)2)i i	i i
Assim, a distribuição da Tabela 2.8, temos, completando com as colunas para xi, yi, fixi e f y 2:i i
TABELA 2.12
	i
	ESTATURAS
(cm)
	fi
	xi
	yi
	fiyi
	fiyi2
	1
	150 ι— 154
	4
	152
	-2
	-8
	16
	2
	154 ι— 158
	9
	156
	-1
	-9
	9
	3
	158 ι— 162
	11
	160
	0
	0
	0
	4
	162 ι— 166
	8
	164
	1
	8
	8
	5
	166 ι— 170
	5
	168
	2
	10
	20
	6
	170 ι— 174
	3
	172
	3
	9
	27
	
	h = 40
	∑ = 40
	
	
	∑ = 10
	∑ = 80
Logo: s = h √(∑ f y 2 / n - (∑ f y / n)2) ⟶ s = 4 √(80/ 40 - (10/ 40)2) ≈ 5,57 cmi i	i i
Nota:
· Valem as mesmas observações que fizemos para a média aritmética.
Fases para o cálculo da média pelo processo breve:
1) Abrimos uma coluna para os valores xi (ponto médio).
2) Escolhemos um dos pontos médios (de preferência o de maior freqüência) para o valor de x0.
3) Abrimos uma coluna para os valores de y1 e escrevemos zero na linha correspondente a classe onde se encontra o valor de x0; a seqüência -1, -2, -3, ..., logo acima do zero, e a seqüência 1, 2, 3, ..., logo abaixo.
4) Abrimos uma coluna para os valores do produto fiyi, conservando os sinais + ou -, e, em seguida, somamos algebricamente esses produtos.
5) Abrimos uma coluna para os valores do produto fiyi , obtidos multiplicando cada fiyi pelo seu respectivo yi, e, em seguida, somamos esses produtos.
6) Aplicamos a fórmula.
2
Exercício resolvido:
1) Calcule o desvio padrão da distribuição, pelo processo breve.
xi fi
450 ι— 550 ι— 650 ι— 750 ι— 850 ι— 950 ι— 1.050 ι— 1.150
8
10
11
16
13
5
1
Temos:
- 84 -
	i
	xi
	fi
	yi
	fiyi
	fiyi2
	1
	500
	8
	-3
	-24
	72
	2
	600
	10
	-2
	-20
	40
	3
	700
	11
	-1
	-11 -55
	11
	4
	800
	16
	0
	0
	0
	5
	900
	13
	1
	13
	13
	6
	1.000
	5
	2
	10
	20
	7
	1.100
	1
	3
	3 26
	9
	
	h = 100
	∑ = 64
	
	∑ = -29
	∑ = 165
Como h = 100, vem: s = 100 √(165 / 64 - (-29 / 64)2) = R$ 154,00
Resolva:
1) Complete o esquema para o cálculopode ser classificada relativamente ao fator tempo em:
a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas;
b. periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas dos alunos;
c. 	ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
1.1.3.2 Crítica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta.
1.1.3.3 Apuração dos Dados
Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
1.1.3.4 Exposição ou Apresentação dos Dados
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas.
1.1.3.5 Análise dos resultados
Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fazes anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões.
1.1.4 A Estatística nas Empresas
- 6 -
No mundo atual, a empresa é uma das vigas-mestras da Economia dos povos.
A direção de uma empresa, de qualquer tipo, incluindo as estatais e governamentais, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e o uso da Estatística facilitarão seu tríplice trabalho de organizar, dirigir e controlar a empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazo.
A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas.
Tudo isso que se pensou, que se planejou, precisa ficar registrado, documentado para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do material e, ainda, para um controle eficiente do trabalho.
O esquema do planejamento é o plano, que pode ser resumido com o auxílio da Estatística, em tabelas e gráficos, que facilitarão a compreensão visual dos cálculos matemático-estatísticos que lhes deram origem.
O homem de hoje, em suas múltiplas atividades, lança mão de processos e técnicas estatísticos, e só estudando-os evitaremos o erro das generalizações apressadas a respeito de tabelas e gráficos apresentados em jornais, revistas e televisão, frequentemente cometido quando se conhece apenas “por cima” um pouco de Estatística.
1.1.5 Atividades Complementares
1. Complete: O método experimental é o mais usado por ciências como:
Química, da Física etc.
2. As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método?
Embora mais difícil e menos preciso, o método estatístico.
3. O que é Estatística?
A Estatística é uma parte da Matemática Aplicada que estuda métodos para a coleta, a organização, descrição, análise e interpretação de dados. Todo o seu estudo objetiva, entre outros, a tomada de decisões.
- 7 -
4. Cite as fases do método estatístico.
Coleta de Dados, Crítica dos Dados, Apuração dos Dados, Exposição ou Apresentação dos Dados e Análise dos resultados
5. Para você, o que é coletar dados?
A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos alunos de uma faculdade ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de exames, do censo demográfico etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas;
b. periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações periódicas dos alunos;
c. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
6. Para que serve a crítica dos dados?
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados.
A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta.
7. O que é apurar dados?
Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.
8. Como podem ser apresentados ou expostos os dados?
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas.
9. As conclusões, as inferências pertencem a que parte da Estatística?
Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões.
10. Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária.
Podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazo. Na seleção e organização da estratégia a ser adotada no empreendimento, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas.
1.2 População e Amostra
As pessoas de uma comunidade podem ser estudas sob diversos ângulos. Por exemplo, podem ser estudadas quanto ao sexo (masculino ou feminino), quanto à estatura (baixa, média ou alta), quanto à renda (pobres e ricas), etc.
Sexo, estatura e renda são variáveis, isto é, são propriedades as quais podemos associar conceitos ou números e assim expressar,do desvio padrão da distribuição, pelo processo breve:
CLASSE S
30 ι— 50 ι— 70 ι— 90 ι— 110 ι— 130
fi	2	8	12	10	5
Temos:
	i
	xi
	fi
	yi
	fiyi
	fiyi2
	1
	40
	2
	....
	....
	....
	2
	....
	....
	....
	....
	....
	3
	....
	....
	....
	....
	....
	4
	....
	....
	....
	....
	....
	5
	....
	....
	....
	....
	....
	
	h = ....
	∑ = ....
	
	∑ = ....
	∑ = ....
Logo: s = .... √(..... / .... - (.... /	)2) = 21,88
2.2.3 Coeficiente de Variação
O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressa em unidades diferentes.
Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV):
CV = s/X x 100
Para a distribuição da Tabela 2.11, onde X = 161 cm e s = 5,57 cm, temos: CV = 5,57 / 161 x 100 = 3,459
Daí: CV = 3,5%
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:
- 85 -
	
	X
	s
	ESTATURAS
	175 cm
	5,0 cm
	PESOS
	68 kg
	2 kg
Temos:
CVE = 5 / 175 x 100 = 2,85%
CVP = 2 / 68 x 100 = 2,94%
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas.
Nota:
· Se bem que, para qualificar a dispersão de uma distribuição, seja mais proveitoso o coeficiente de variação, não devemos deduzir daí que a variância e o desvio padrão careçam de utilidade. Pelo contrário, são medidas muito úteis no tratamento de assuntos relativos à inferência estatística, como já dissemos.
2.2.4 Atividades Complementares
1) Calcule a amplitude total dos conjuntos de dados:
a. 1, 3, 5, 9 8	b. 20, 14, 15, 19, 21, 22, 20 8
c. 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 9,2	d. 20, 14, 15, 19, 21, 22, 20 20
2) Calcule a amplitude total das distribuições:
a. 6
xi	2	3	4	5	6	7	8
fi	1	3	5	8	5	4	2
b. 0,7
CLASSE S
fi
1,5 ι— 1,6 ι— 1,7 ι— 1,8 ι— 1,9 ι— 2,0 ι— 2,1 ι— 2,2
4
8
12
15
12
8
4
3) Calcule os desvios padrões dos conjuntos de dados do exercício 1.
a. 2,96	b. 2,81	c. 3,016	d. 7,04
4) Calcule os desvios padrões das distribuições do exercício 2. a. 1,51	b. 0,159
5) Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente:
Nº DE CARAS	0	1	2	3	4	5
- 86 -
FREQÜÊNCIAS	1	14 34	29 16	3
Calcule o desvio padrão. 1,13
6) Calcule o desvio padrão da distribuição: 4,45
CLASSE S
fi
2 ι— 6 ι— 10 ι— 14 ι— 18 ι— 22
5
12
21
15
7
7) Calcule os desvios padrões das distribuições do exercício 8, capítulo 2.1.4.
a. 2,43	b. 8,8 cm	c. R$ 229,00	d. 9,93 kg
8) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, respectivamente, 18,3 e 1,47, calcule o coeficiente de variação. 8,03%
9) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? Estatística
10) Medidas as estaturas de 1.017 indivíduos, obtivemos X = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? estatura
11) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?
3,72% e 3,71%, respectivamente; o segundo grupo
12) 	Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 5,41
13) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a média da distribuição. 51,7
14) 	Obtenha o desvio padrão de cada um dos jogadores A e B, de basquete, em relação aos pontos por partida, conforme a tabela abaixo: Positivo
	A 26 32
	28 30 27
	31
	B 15 45
	19 42 31
	22
15) 	Considere as notas de três alunos em Matemática nos quatro bimestres de um mesmo ano. O professor de Matemática escolherá um deles para representar a turma numa competição de Matemática, o que tiver a melhor regularidade. Qual deles será escolhido? Positivo
1º Bim	2º Bim	3º Bim	4º Bim	Média
	Aluno A
	9,5
	8,5
	9,0
	9,5
	....
	Aluno B
	8,5
	10,0
	10,0
	8,0
	....
	Aluno C
	10,0
	7,5
	9,5
	9,5
	....
16) Considere as idades dos alunos de 3 grupos A, B e C:	Positivo
	Grupo A
Grupo
	15 anos
18 anos
16 anos
	15 anos
14 anos
15 anos
	15 anos
13 anos
13 anos
	15 anos
13 anos
16 anos
	15 anos
17 anos
15 anos
- 87 -
	B
Grupo C
	
	
	
	
	
Então:
a) obtenha a média de idade de cada grupo;
b) calcule a variância de cada grupo;
c) calcule o desvio padrão de cada grupo.
17) Numa competição de salto triplo, três atletas disputavam apenas uma vaga para uma olimpíada entre faculdades de uma cidade. Cada atleta fez 4 tentativas obtendo os seguintes resultados: Positivo
	Atleta I
	16,50 m
	15,81 m
	16,42 m
	16,12 m
	Atleta II
	13,90 m
	17,01 m
	16,82 m
	15,10 m
	Atleta III
	15,70 m
	16,02 m
	16,95 m
	17,00 m
a) Qual deles obteve melhor média?
b) Qual deles foi o mais regular nessas quatro tentativas?
18) Responda:	Positivo
a) Quando numa pesquisa o desvio padrão é zero?
b) Quando que uma distribuição é considerada homogênea?
19) A tabela a seguir mostra o número de acertos numa prova com 10 questões aplicadas numa turma com 50 alunos. Positivo
Nº da questão Quantidade de acertos
1	2	3
15 20 12
4	5	6	7	8	9	10
25 48 40 35 10
30
40
Obtenha:
a) a média de acertos por questão;
b) o desvio padrão dessa distribuição.
20) Em relação aos números 1, 4, 16 e 4, obtenha: Positivo
a) a média geométrica;
b) a média aritmética;
c) a média harmônica.
21) 	Numa escola é adotado o seguinte critério: a nota da primeira prova é multiplicada por 1, a nota da segunda prova é multiplicada por 2 e a nota da última prova é multiplicada por 3. Os resultados, após somados, são divididos por 6. Se a média obtida por esse critério for maior ou igual a 6,5, o aluno é dispensado das atividades de recuperação. Suponha que um aluno tenha tirado 6,3 na primeira prova e 4,5 na
- 88 -
segunda. Quanto precisará tirar na terceira para ser dispensado da recuperação?
Positivo
22) 	Para votar, cinco eleitores demoraram, respectivamente, 3 min 38 s, 3 min 18 s, 2 min 46 s, 2 min 57 s e 3 min 26 s. Qual foi a média do tempo de votação (em minutos e segundos) desses eleitores? Positivo
23) A distribuição dos salários de uma empresa é dada na seguinte tabela: Positivo
	Salário em
R$
	Número de funcionários
	500,00
	10
	1.000,00
	5
	1.500,00
	1
	2.000,00
	10
	5.000,00
	4
	10.500,00
	1
	
Total
	31
a) Qual é a média e a mediana dos salários dessa empresa?
b) 	Suponha que sejam contratados dois novos funcionários com salários de R$ 2.000,00 cada.
A variância da nova distribuição de salários ficará menor, igual ou maior que a anterior?
3. PROBABILIDADE - Introdução
Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão neste conteúdo se justifica pelo fato de a maioria dos fenômenos de que trata a Estatística ser de natureza aleatória ou probabilística. Consequentemente, o conhecimento dos aspectos fundamentais do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva ou Inferencial.
Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um ponto de apoio em nossos primeiros passos no caminho da Estatística Inferencial. Esses passos serão apresentados no capítulo seguinte, que trata da conceituação da variável aleatória e das duas principais distribuições de probabilidades de variáveis discretas e contínuas.
3.1 ExperimentoAleatório
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é provável que o meu time ganhe a partida de hoje” pode resultar:
a. que, apesar do favoritismo, ele perca;
b. que, como pensamos, ele ganhe;
c. que empate.
- 89 -
Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados
fenômenos aleatórios ou experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.
3.2 Espaço Amostral
A cada experimento, correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto universo, representado por S.
Os dois experimentos citados anteriormente têm os seguintes espaços amostrais:
· lançamento de uma moeda: S = {Ca, Co};
· lançamento de um dado: S = {1, 2, 3, 4, 5, 6}.
Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:
S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}.
Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral. Assim:
2 ∈ S ⟶ 2 é um ponto amostral de S.
3.3 Eventos
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório.
Assim, qualquer que seja E, se E ∈ S (E está contido em S), então E é um evento de S.
Se E = S, E é chamado evento certo.
Se E ∈ S e E é um conjunto unitário, E é chamado evento elementar. Se E = Ө, E é chamado evento impossível.
Exemplo:
No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
A = {2, 4, 6} ∈ S; logo, A é um evento de S.
B = {1, 2, 3, 4, 5, 6} ∈ S; logo, B é um evento certo de S (B = S).
C = {4} ∈ S; logo, C é um evento elementar de S;
D = Ө ∈ S; logo, D é um evento impossível de S.
Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser definidos pelas sentenças:
“Obter um número par na face superior.”
“Obter um número menor ou igual a seis na face superior.”
- 90 -
“Obter o número 4 na face superior.”
“Obter um número maior que 6 na face superior.”
3.4 Probabilidade
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.
Chamamos de probabilidade de um evento A (A ∈ S) o número real P(A), tal que:
P(A) = n(A) / n(S)
Onde:
n(A) é o número de elementos de A; n(S) é o número de elementos de S.
Exemplos:
a. Considerando o lançamento de uma moeda e o evento A “obter cara", temos: S = {Ca, Co} ⟶ n(S) = 2
A = {Ca} ⟶ n(A) = 1
Logo: P(A) = 1/2
O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos 50% de chance de que apareça cara na face superior.
b. Considerando o lançamento de um dado, vamos calcular:
· a probabilidade do evento A “obter um número par na face superior”. Temos:
S = {1, 2, 3, 4, 5, 6} ⟶ n(S) = 6
A = {2, 4, 6} ⟶ n(A) = 3 Logo: P(A) = 3/6 = 1/2
· a probabilidade do evento B “obter um número menor ou igual a 6 na face superior”. Temos:
S = {1, 2, 3, 4, 5, 6} ⟶ n(S) = 6
B = {1, 2, 3, 4, 5, 6} ⟶ n(B) = 6 Logo: P(B) = 6/6 = 1
· a probabilidade do evento C “obter um número um número 4 na face superior”. Temos:
S = {1, 2, 3, 4, 5, 6} ⟶ n(S) = 6 B = {4} ⟶ n(C) = 1
Logo: P(C) = 1/6
· a probabilidade do evento D “obter um número maior que 6 na face superior”. Temos:
S = {1, 2, 3, 4, 5, 6} ⟶ n(S) = 6
- 91 -
B = { } = Ө⟶ n(D) = 0 Logo: P(D) = 0/6 = 0
Pelos exemplos que acabamos de ver, podemos concluir que, sendo n(S) = n:
a. a probabilidade do evento certo é igual a 1: P(S) = 1
b. a probabilidade do evento impossível é igual a zero: P(Ө) = 0
c. 	a probabilidade de um evento E qualquer (E ∈ S) é um número real P(E), tal que: 0 ≤ P(E) ≤ 1
d. a probabilidade de um evento E qualquer E qualquer é, lembrando que n(E) = 1:
P(E) = 1/n
3.5 Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que não ocorra (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 ⟶ q = 1 - p
Assim, se a probabilidade de se realizar um evento é p = 1/5, a probabilidade de que ele não ocorra é: q = 1 – p ⟶ q = 1 – 1/5 = 4/5
Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p = 1/6. Logo, a probabilidade de não tirar o 4 no lançamento de um dado é: q = 1 – 1/6 = 5/6
3.6 Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não- realização de um dos eventos não afeta a probabilidade da realização do outro e vice- versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: p = p1 x p2
Exemplo:
Lançamos dois dados. A probabilidade de obtermos 1 no primeiro dado é: p1 = 1/6 A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no segundo é: p = 1/6 x 1/6 = 1/36
3.7 Eventos Mutuamente Exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.
- 92 -
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: p = p1 + p2
Exemplo:
Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é:
p = 1/6 + 1/6 = 2/6 = 1/3,
pois, como vimos, os dois eventos são mutuamente exclusivos.
3.8 Exercícios Resolvidos
1) Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas? p = 1/52
2) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? p = 4/52 = 1/13
3) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:
a. a probabilidade de essa peça ser defeituosa. p = 4/12 = 1/3
b. a probabilidade de essa peça não ser defeituosa. p = 1 - 1/3 = 2/3
4) 	No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. p = 4/36 = 1/9
5) 	De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?
p1 = 4/52 = 1/13	p2 = 1/52	p = p1 x p2 = 1/676
6) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde?
p1 = 3/9 = 1/3	p2 = 2/8 = 1/4	p3 = 4/9	p = p1 x p2 x p3 = 1/27
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual a probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus?
p1 = 1/52	p2 = 1/51	p = p1 x p2 = 1/2652
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52 cartas?
pr = 4/52 = 1/13	pd = 1/13	pv = 1/13	p = p1 + p2 + p3 = 3/13 ou p = 12/52 = 3/13
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta de um baralho de 52 cartas?Pc = 13/52 = 1/4	po = 13/52 = 1/4	p = pc+ po= ½
10) No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5? p = 1/6 + 1/6 = 1/3
- 93 -
11) São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de tirarmos uma dama e um rei, não necessariamente nessa ordem?
p1 = 4/52 x 4/52 = 1/169	p2 = 4/52 x 4/52 = 1/169	p = p1 + p2 = 2/169
12) Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.
n(10) = 3 ⟶ p10 = 3/36
n(11) = 2 ⟶ p11 = 2/36	p = p1 + p2 + p3 = 6/36 = 1/6 n(12) = 1 ⟶ p12 = 1/36
3.9 Atividades Complementares
1) Determine a probabilidade de cada evento:
a. um número par aparece no lançamento de um dado. 1/2
b. uma figura aparece ao se extrair uma carta de um baralho de 52 cartas. 3/13
c. uma carta de ouros aparece ao se extrair uma carta de um baralho de 52 cartas.
1/4
d. uma só coroa aparece no lançamento de três moedas. 3/8
2) Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. Determine a probabilidade de:
a. o número ser divisível por 5; 1/5
b. o número terminar em 3; 1/10
c. o número ser divisível por 6 ou por 8; 1/25
d. o número ser divisível por 4 e por 6. 2/25
3) Dois dados são lançados simultaneamente. Determine a probabilidade de:
a. a soma ser menor que 4; 1/12
b. a soma ser 9; 1/9
c. o primeiro resultado ser maior que o segundo; 5/12
d. a soma ser menor ou igual a 5. 5/18
4) Uma moeda é lançada duas vezes. Calcule a probabilidade de:
a. não ocorrer cara nenhuma vez; 1/4
b. obter-se cara na primeira ou na segunda jogada. 1/2
5) Um inteiro entre 3 e 11 será escolhido ao acaso.
a. qual a probabilidade de que este número seja ímpar? 3/7
- 94 -
b. qual a probabilidade de que este número seja ímpar e divisível por 3? 1/7
6) Uma carta é retirada ao acaso de um baralho de 52 cartas. Qual a probabilidade de que a carta retirada seja uma dama ou uma carta de copas? 4/13
7) No lançamento de dois dados, qual é a probabilidade de se obter um par de pontos iguais? 1/6
8) Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 2 peças, calcule:
a. a probabilidade de ambas serem defeituosas; 1/11
b. a probabilidade de ambas não serem defeituosas; 14/33
c. a probabilidade de ao menos uma ser defeituosa. 19/33
9) No lançamento de um dado, qual é a probabilidade de sair o número 6 ou um número ímpar? 2/3
10) 	Duas cartas são retiradas ao acaso de um baralho de 52 cartas. Calcule a probabilidade de se obterem:
a. dois valetes; 1/221
b. um valete e uma dama. 4/663
11) Um casal planeja ter três filhos. Determine a probabilidade de nascerem:
a. três homens; 1/8
b. dois homens e uma mulher. 3/8
12) Uma moeda é lançada três vezes. Calcule a probabilidade de obtermos:
a. três caras; 1/8
b. duas caras e uma coroa; 3/8
c. uma cara somente; 3/8
d. nenhuma cara; 1/8
e. pelo menos uma cara; 7/8
f. no máximo uma cara. 1/2
13) Um dado é lançado duas vezes. Calcule a probabilidade de:
a. sair um 6 no primeiro lançamento; 1/6
b. sair um 6 no segundo lançamento; 1/6
c. não sair 6 em nenhum lançamento; 25/36
d. sair um 6 pelo menos. 11/36
14) 	Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50, determine a probabilidade de, em uma extração ao acaso:
a. obtermos a bola de número 27; 1/50
b. obtermos uma bola de número par; 1/2
c. obtermos uma bola de número maior que 20; 3/5
- 95 -
d. obtermos uma bola de número menor ou igual a 20. 2/5
15) Uma loja dispõe de 12 geladeiras do mesmo tipo, das quais 4 apresentam defeitos.
a. Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? 1/3
b. Se um freguês vai compras 2 geladeiras, qual é a probabilidade de levar 2 defeituosas? 1/11
c. Se um freguês vai compras 2 geladeiras, qual é a probabilidade de levar pelo menos uma defeituosa? 19/33
16) Um par de dados é atirado. Encontre a probabilidade de que a soma seja 10 ou maior que 10 se:
a. um 5 aparece no primeiro dado; 1/18
b. um 5 aparece pelo menos em um dos dados. 1/12
17) 	Lança-se um par de dados. Aparecendo dois números diferentes, encontre a probabilidade de que:
a. a soma seja 6; 1/9
b. o 1 apareça; 5/18
c. a soma seja 4 ou menor que 4. 1/9
18) 	Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que:
a. ela não tenha defeitos graves; 7/8
b. ela não tenha defeitos; 5/8
c. ela seja boa ou tenha defeitos graves. 3/4
19) 	Considere o mesmo lote do problema anterior. Retiram-se 2 peças ao acaso. Calcule a probabilidade de que:
a. ambas sejam perfeitas; 3/8
b. pelo menos uma seja perfeita; 7/8
c. nenhuma tenha defeitos graves; 91/120
d. nenhuma seja perfeita. 1/8
- 96 -
3.10 Teorema de Bayes
Dar um palpite sobre que face da moeda vai cair para cima ou se vai chover amanhã sempre fez parte de nossas vidas. A origem da probabilidade matemática está ligada aos jogos de cartas e aos jogos de dados, no século 15, quando muitos matemáticos faziam cálculos sobre o número provável de vencedores e a quantidade a ser ganha nos jogos mais disputados. Uma das opções de cálculo mais usadas pelos estatísticos nas suas previsões hoje, porém, é a que foi desenvolvida no século 18 pelo reverendo inglês Thomas Bayes (1702-1761).
Filho e neto de clérigos, Bayes se formou em teologia e nunca exerceu oficialmente a carreira de matemático. Ele cuidava de uma igreja no interior da Inglaterra e havia publicado somente um artigo não assinado, mas era respeitado pela comunidade matemática em seu tempo. Assim, foi admitido na Royal Society de Londres, que congrega cientistas renomados do Reino Unido. Segundo os documentos da entidade, o reverendo possuía amplo conhecimento de geometria e dominava todas as áreas da matemática e filosofia da época.
A idéia de Bayes para o cálculo de probabilidades foi publicada postumamente pela Royal Society com o título "Ensaio Voltado para Solução de um Problema na Doutrina do Acaso" e é uma explicação de como ele abordava os problemas propostos pelos matemáticos anteriores a ele. O trabalho passou a ser conhecido como Teorema de Bayes, uma técnica de estatística e estimativa que virou uma lei fundamental da matemática.
Palpite calculado
Essencialmente o que a proposta do reverendo trazia de inovador era o caráter subjetivo na previsão de um evento, ou seja, a opinião do matemático que manipula os números entra de modo significativo nos cálculos. Essa opinião é baseada na quantidade de informação que se tem nas mãos sobre as condições de ocorrer tal evento. As informações vão definitivamente influenciar a previsão. Então, numa disputa de cara ou coroa, por exemplo, todo mundo concorda que a chance de alguém ganhar é de 50%. Mas se o trato for de jogar a moeda quatro vezes, o método bayesiano de fazer previsão vai se ajustando a cada jogada. Se der "cara" nas duas primeiras jogadas, as chances para as jogadas posteriores não serão mais meio-a-meio, segundo Bayes. Usando esse método na previsão das chances de um time A vencer um time B, deve-se levar em conta as informações que se tem sobre resultados anteriores a essa disputa, como quantas vezes A venceu B, e as experiências e opiniões de especialistas sobre esse jogo, o campeonato e os jogadores.
Usar o cálculo da probabilidade é justamente fazer palpites sobre determinados eventos, se vão ocorrer ou não. Ele é considerado ciência porque estuda com lógica e racionalidade as chances de um evento ocorrer.
Apesar de estar baseado rigidamente na lógica e na razão, o Teorema de Bayes passou por várias controvérsias à medida que os estudos sobre probabilidade e estatística evoluíam. Até hoje ele é criticado por incluir o caráter subjetivo - a opinião - no ajuste de
- 97 -
cálculos, e por isso ser "sem pé nem cabeça" do ponto de vista dos matemáticos conservadores e compromissados com a objetividade.
Na época em que viveu, certamenteo reverendo não tinha tanta necessidade de prever riscos e benefícios de alguma aplicação financeira ou se algum veículo de locomoção teria muita chance de quebrar ou não.
Hoje sua teoria pode ser aplicada a quase todas as áreas do conhecimento, nas pesquisas científicas ou no cotidiano das pessoas. Autoridades de saúde pública não podem deixar de usar os cálculos probabilísticos na previsão de alcance de uma epidemia. As economias mundiais não vivem mais sem a previsão de inflação, desemprego ou da alta ou baixa da cotação das moedas. Apesar de sempre terem sido criticados, Thomas Bayes e suas idéias continuam desafiando a intuição e o "achismo" nas nossas apostas e palpites diários.
Segundo o primeiro axioma do cálculo de probabilidades, valores probabilísticos de um evento A qualquer não podem ser menores que zero nem maiores que 1 e a probabilidade do evento certo é igual a 1. Em termos formais, temos: 0≤P(A)≤1. O valor zero é atribuído ao evento impossível e os valores intermediários, aos eventos possíveis ou incertos. A segunda lei diz que a probabilidade de qualquer evento ocorrer dentre um número n de eventos alternativos mutuamente exclusivos A e B é igual à soma das probabilidades dos eventos individuais. Formalmente: P(A ou B) = P(A) + P(B). A terceira lei fala que a probabilidade de dois eventos A e B ocorrerem é igual à multiplicação da probabilidade condicional P(A/B) – lê-se “probabilidade de A dado B” – pela probabilidade de B, o que pode ser formalizado de modo simplificado assim:
P(AeB)=P(A/B)×P(B). Pelo mesmo raciocínio, P(B eA) = P(B/A) × P(A).
Do terceiro axioma, assumindo-se por comutação que P(AeB)= P(BeA), deduz-se o teorema de Bayes que tem a seguinte formulação básica:
P(A/B) = P(B/A)/P(B) x P(A)
Nessa fórmula, a probabilidade do evento A ocorrer em vista do evento B (P(A/B)) é dada por três fatores: a verossimilhança de A (a probabilidade de B dado A); a probabilidade prévia de B; e a probabilidade prévia de A.
Tomemos o seguinte exemplo para nos ajudar a entender o uso do teorema de Bayes para o cálculo da probabilidade de um evento: um médico avalia duas ocorrências possíveis que podem estar se dando com um paciente que reclama de problemas respiratórios. Considerando-se, para simplificar o exemplo, que há apenas duas modalidades de problemas desse tipo, digamos bronquite e pneumonia, o raciocínio empregado para se avaliar essas ocorrências em termos bayesianos parte das probabilidades prévias desses eventos tal como dadas estatisticamente.
Assim, admitamos que a incidência de pneumonia (P(pn)) é muito mais rara que a de bronquite (P(br)), digamos 100 vezes menos freqüente, segundo os registros estatísticos. Em termos matemáticos, P(br) = 100/101 e P(pn) = 1/100.
Digamos, porém, que o paciente apresente um sintoma e1 que ocorra em 1 de cada 2 pacientes com pneumonia, mas apenas em 1 de cada 500 pacientes com bronquite. Assim, a verossimilhança de cada um dos eventos será P(e1/pn) = 1/2 e P(e1/br) = 1/500.
- 98 -
image5.png
image6.png
image7.png
image8.jpeg
image9.png
image10.png
image11.png
image12.png
image13.png
image14.png
image15.jpeg
image16.jpeg
image17.png
image18.png
image19.png
image20.png
image1.png
image2.png
image3.png
image4.jpegde certa maneira, informações sob a forma de medidas.
POPULAÇÃO (ou UNIVERSO) é qualquer conjunto de INFORMAÇÕES que tenham, entre si, uma CARACTERÍSTICA COMUM.
Voltemos às pessoas da citada comunidade. O conjunto de TODAS as estaturas constitui uma POPULAÇÃO DE ESTATURAS; o conjunto de TODOS os pesos constitui uma POPULAÇÃO DE PESOS; o conjunto de TODAS as cores de olhos constitui uma POPULAÇÃO DE CORES DE OLHOS.
- 8 -
Então, população não implica necessariamente GENTE e PESSOAS. O que importa é a VARIÁVEL estudada. Você pode ter uma POPULAÇÃO DE PESO DE RATOS ou COMPRIMENTOS DE MINHOCAS.
Se uma população for muito grande (por exemplo, o conjunto de todas as estaturas de uma comunidade), o pesquisador poderá ter um trabalho astronômico para estudá-la. E em alguns casos os resultados serão sempre falhos.
É só pensar no número de nascimentos e mortes diários, isto é, na ENTRADA e SAÍDA
de informações, para avaliar a dificuldade e a imprecisão do trabalho.
Nesses casos, o estatístico recorre a uma AMOSTRA, que, basicamente, constitui uma REDUÇÃO da população a DIMENSÕES MENORES, SEM PERDA DAS CARACTERÍSTICAS ESSENCIAIS.
Exemplo:
Imaginemos uma escola com 400 alunos (meninos, idades entre 6 e 16 anos).
Se quisermos fazer um estudo das estaturas (qual a estatura média?) podemos simplificar o trabalho colhendo uma amostra de, digamos, 40 alunos e estudar o COMPORTAMENTO DA VARIÁVEL ESTATURA APENAS nesses alunos.
A variável estudada poderia ser inteligência, número de filhos, número de cáries, notas em história ou renda familiar.
Uma amostra, para ser BOA, tem de ser REPRESENTATIVA, ou seja, deve conter EM PROPORÇÃO tudo o que a população possui QUALITATIVA E QUANTITATIVAMENTE. E tem de ser IMPARCIAL, isto é, todos os elementos da população devem ter IGUAL OPORTUNIDADE de fazer parte da amostra.
Logo, algum amigo poderá fazer parte da amostra, mas não todos.
Definições:
VARIÁVEIS (DADOS) são observações (tais como medidas, sexos, respostas de pesquisas) que tenham sido coletados.
ESTATÍSTICA é uma coleção de métodos para o planejamento de experimentos, obtenção de dados e, consequentemente organização, resumo, apresentação, análise, interpretação e elaboração de conclusões baseadas nos dados.
Uma POPULAÇÃO é a coleção completa de todos os elementos (escores, pessoas, medidas e outros) a serem estudados. A coleção é completa no sentido de que inclui todos os sujeitos a serem estudados.
Uma AMOSTRA é um subconjunto finito de uma população.
1.2.1 Atividades Complementares
1. 	Identifique (a) a amostra e (b) a população. Determine, também, se é provável também que a amostra seja representativa da população.
- 9 -
a. Um repórter da Veja se coloca em uma esquina e pergunta a 10 adultos se acham que o atual presidente está fazendo um bom trabalho.
Amostra: os 10 adultos selecionados; População: todos os adultos; não representativa
b. 	O Datafolha pesquisa 5000 famílias selecionadas aleatoriamente e verifica que entre as televisões em uso 19% estão ligadas no programa O Aprendiz (com base em dados da Folha de São Paulo).
c. 	Em uma pesquisa Gallup de 1059 adultos selecionados aleatoriamente, 30% responderam “sim” quando lhes foi perguntado “você tem uma arma em casa?”.
Amostra: os 1059 adultos selecionados; População: todos os adultos; representativa
d. Uma estudante de graduação da Universidade Federal do Pará realiza um projeto de pesquisa sobre como adultos brasileiros se comunicam. Ela começa com uma pesquisa pelo correio enviada a 500 adultos que conhece. Ela pede a eles que devolvam por correio a resposta a esta pergunta: “Você prefere usar o correio eletrônico ou o correio usual?” Ela recebe de volta 65 respostas, com 42 delas indicando preferência pelo correio usual.
2. Imagine que alguém resolveu fazer uma pesquisa sobre o esporte preferido da população brasileira. Para tanto, entrevistou 2000 pessoas. Esta amostra da população brasileira estaria sendo representativa se:
1. todas fossem do mesmo sexo?
2. todas fossem da mesma idade?
3. todas fossem da mesma cidade?
4. todas fossem da mesma classe social?
1.3 Variáveis (Dados) Quantitativas Contínuas e Discretas
A cada fenômeno corresponde um número de resultados possíveis.
Exemplo:
→ para o fenômeno “sexo” não dois os resultados possíveis: masculino e feminino;
→ para o fenômeno “número de filhos” há um número de resultados possíveis, expresso através dos números naturais: 0, 1, 2, 3, 4, ..., n;
→ para o fenômeno “estatura” temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo.
Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
Os exemplos acima nos dizem que as variáveis podem ser:
a. 	quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que
- 10 -
pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta.
b. qualitativa – quando seus valores são expressos por atributos: sexo (masculino – feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.;
Definimos os termos população e amostra. Os dois termos seguintes são usados para distinguir entre casos nos quais temos dados para uma população inteira, e casos nos quais temos dados apenas para uma amostra.
Definições:
Um PARÂMETRO é uma medida numérica que descreve alguma característica de uma
população.
Uma ESTATÍSTICA é uma medida numérica que descreve alguma característica de uma
amostra.
Exemplos:
→ Parâmetros: Quando Lula foi eleito presidente em 2006, ele recebeu 60,83% dos
95.838.220 votos no segundo turno. Se encararmos a coleção de todos esses votos como a população a ser considerada, então 60,83% é um parâmetro, não uma estatística.
→ Estatística: Com base em uma amostra de 877 executivos pesquisados, achou-se que 45% deles não contratariam alguém que cometesse um erro tipográfico em sua solicitação de emprego. Esse número de 45% é uma estatística porque se baseia em uma amostra, não da população inteira de todos os executivos.
Alguns conjuntos de dados consistem em números (tais como 66 um e 72 um), enquanto outros são não numéricos (tais como cor dos olhos: verde e marrom). Os termos dados quantitativos e dados qualitativos são em geral usados para distinguir entre esses dois tipos.
Definições:
Dados Quantitativos consistem em números que representam contagens ou medidas.
Dados Qualitativos (ou categóricos ou de atributos) podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica.
Exemplos:
→ Dados Quantitativos: Os pesos de modelos.
→ Dados Qualitativos: Os sexos (masculino/feminino) de atletas profissionais.
Quando trabalhamos com dados quantitativos, é importante usar as unidades de medida apropriadas, tais como dólares, horas, metros, e assim por diante. Devemos ter especial cuidado em observar referências como “todas as quantidades estão em milhares de dólares” ou “todos os tempos estão em centésimos de segundo” ou “as unidades são quilogramas”. Ignorar tais unidades de medida pode levar a conclusões muito erradas. A NASA perdeu seu Mars Climate Orbiter de $125 milhões de dólares quando ele bateu porque o programa de controle tinha dados de aceleração em unidades inglesas, que foram interpretadas incorretamente como unidades métricas.
- 11 -
Os dados quantitativos podem ainda ser descritos pela distinção entre os tipos
discretos e contínuos.
Definições:
Dados Discretos surgem quando o número de valores possíveis é ou um número finito ou uma quantidade “enumerável”. (Isto é, o número de valores possíveis é 0, ou 1, ou 2 e assim por diante.)
Dados (numéricos) Contínuos resultam de infinitos valores possíveis que correspondem a alguma escala contínua que cobre um intervalo de valores sem vazios, interrupções ou saltos.
Exemplos:→ Dados Discretos: Os números de ovos que as galinhas botam são dados discretos porque representam contagens.
→ Dados Contínuos: As quantidades de leite das vacas são dados contínuos porque são medidas que podem assumir qualquer valor em um intervalo contínuo. Durante um dado intervalo de tempo, uma vaca pode produzir uma quantidade de leite que pode ser qualquer valor entre 0 e 5 galões. Seria possível obter-se 2,34315 galões, porque a vaca não é restrita a quantidades discretas de 0, 1, 2, 3, 4 ou 5 galões.
De modo geral, as medições dão origem a variáveis contínuas e as contagens ou
enumerações, a variáveis discretas.
1.3.1 Atividades Complementares
1. Determine se o valor dado é uma estatística ou um parâmetro.
a. O Senado atual do Brasil compõe-se de 75 homens e 6 mulheres. Parâmetro
b. Uma amostra de estudantes é selecionada e a média do número de livros-texto comprados é 4,2.
c. Uma amostra de estudantes é selecionada e a média de tempo de espera na fila para comprar livros-texto é 0,65 h. Estatística
d. Em um estudo de todos os 2223 passageiros a bordo do Titanic, verificou-se que 706 sobreviveram quando ele afundou.
2. Determine se os valores dados são de um conjunto de dados discreto ou contínuo.
a. O salário de presidente de George Washington era de $25.000 por ano, e o valor atual do salário do presidente é de $400.000. Contínuo
b. Um estudante de estatística obtém dados amostrais e encontra que o peso médio dos carros na amostra é de 1200 Kg.
c. Em uma pesquisa com 1059 adultos, verificou-se que 39% deles tinham armas em suas casas (com base em uma pesquisa do Gallup). Discreto
- 12 -
d. Quando 19.218 máscaras de gás do exército americano foram testadas, verificou-se que 10.322 delas eram defeituosas (com base em dados da revista Times).
1.4 Variáveis Qualitativas Nominais e Ordinais
Outra maneira comum de classificar dados é usar quatro níveis de mensuração: nominal, ordinal, intervalar e razão.
Tudo parece indicar que uma das grandes preocupações do homem é – e sempre foi – a MEDIŲÃO: Medir terras, a quantidade de gado no pasto, a riqueza, porções de medicamentos etc.
A invenção dos números (isto é, de palavras capazes de expressar quantidades) permitiu que o homem deixasse de guardar informações num lugar físico, concreto (ex: pedrinhas e gravetos), para guardá-las num lugar psicológico: A MEMÓRIA.
Com a escrita, o homem supera esse problema. O ALGARISMO – representação gráfica do número possibilitou-lhe anotar as informações como garantia contra o esquecimento.
MEDIR uma magnitude (GRANDEZA) significa associar a essa magnitude um NÚMERO REAL.
Quando se mede uma grandeza, realizam-se em cadeia, as seguintes operações:
· Definição do que vai ser medido;
· Definição de um critério para a medição, isto é, de uma ESCALA;
· Leitura;
· Interpretação.
- 13 -
Embora número seja sempre número, as magnitudes diferem umas das outras quanto à classe a que pertencem: Estatura, peso, velocidade, inteligência, maturidade, temperatura, beleza etc.
O processo de mensuração depende do NÍVEL, isto é, da CLASSE a que pertence a magnitude (= GRANDEZA).
Cada nível supõe certas características associadas às grandezas nele contidas. Assim, há características de 1º Nível, 2º Nível, 3º Nível e 4º Nível. A complexidade e a informação aumentam com o Nível.
Níveis de Mensuração:
1º NÍVEL – O Nível Nominal de Mensuração é caracterizado por dados que consistem em nomes, rótulos ou categorias apenas. Os dados não podem ser ordenados (tal como do menor para o maior). É o nível de mensuração mais baixo, mais rudimentar possível. Sua escala de medida chama-se NOMINAL. A base, o fundamento para a atribuição dos números é de natureza QUALITATIVA, DISTINTIVA.
Exemplos:
→ Sim/não/indeciso: Respostas de pesquisa.
→ Cores: As cores de carros dirigidos por estudantes da faculdade (vermelho, preto, azul, branco, e assim por diante).
Numa sala há 8 alunos, 5 dos quais do sexo masculino. Convencionando que os homens serão designados por 1 e as mulheres, por 2, tudo o que se pode fazer é escrever.
o	u dizer:· Há 5 x 1 = 5 Homens
· Há 3 x 2 = 3 Mulheres
Maria	→ 2
Adriana → 2
Patrícia → 2
João	→ 1
Pedro → 1
Alberto → 1
Carlos → 1
Otávio → 1
Notar que não tem sentido matemático fazer a operação 3 x 2 = 6, pois 2 NÃO REPRESENTA uma QUANTIDADE, mas sim, uma CATEGORIA. Por essa razão, esse 2 poderia ser substituído pelo símbolo φ, daí resultando 3φ = 3 mulheres.
Como os dados nominais não têm ordenação ou significado numérico, eles não devem ser usados para cálculos. Algumas vezes, usam-se números associados às diferentes categorias (especialmente quando os dados são codificados para computador), mas esses números não têm qualquer significado computacional e qualquer média calculada com eles não tem qualquer significado.
Conclusão: No 1º Nível, os algarismos têm cara de números, mas não são números: São CATEGORIAS. Portanto, não são possíveis operações aritméticas com valores atribuídos às VARIÁVEIS. O 1º Nível presta-se a CODIFICAÇÕES e estas comportam, no máximo, CONTAGENS.
Outros exemplos:
→ Números de telefones: João → 3292-3541
→ Placas de automóveis: APA 4506 (carro da Adriana)
→ Camisas de jogadores: Pelé → 10
2º NÍVEL – Os dados estão no Nível Ordinal de Mensuração se podem ser arranjados em alguma ordem, mas diferenças entre os valores dos dados ou não podem ser determinadas ou não são significativas. Este nível já é um pouco mais elaborado que o
- 14 -
anterior e corresponde ao que popularmente se designa por ORDENAÇÃO; a escala de medida chama-se ORDINAL.
As grandezas de 2º nível podem ser avaliadas em termos de mais que ou menos que, embora a quantificação precisa seja impossível.
Exemplos:
→ Postos: Com base em vários critérios, uma revista classifica cidades de acordo com suas “condições de habitação”. Esses postos (primeiro, segundo, terceiro, e assim por diante) determinam uma ordenação. No entanto, as diferenças entre os postos não têm significado. Por exemplo, a diferença de “segundo menos primeiro” pode sugerir 2 - 1 = 1, mas essa diferença de 1 não tem significado porque não é uma quantidade que possa ser comparada a outras tais diferenças. A diferença entre a primeira e a segunda, cidades, não é a mesma que a diferença entre a segunda e a terceira cidades. Usando a classificação da revista a diferença entre Belo Horizonte e Ipatinga, não pode ser comparada quantitativamente com a diferença entre Belém e Marabá.
→ Notas em Cursos: Um professor de faculdade atribui notas A, B, C, D ou F. Essas notas podem ser arranjadas em ordem, mas não podemos determinar as diferenças entre elas. Por exemplo, sabemos que A é maior do que B (assim, há uma ordem), mas não podemos subtrair B de A (assim, a diferença não pode ser encontrada).
→ Notas em Cursos: resultantes de provas tradicionais – produzem mensurações de 2º nível. Assim, se João tirou 8 e Maria, 4, é mais possível concluir que João sabe mais que Maria, embora NÃO se possa concluir que João saiba o dobro do que ela sabe.
Dados ordinais fornecem informações sobre comparações relativas, mas não as magnitudes das diferenças. Usualmente, os dados ordinais não devem ser usados para cálculos, tais como uma média, mas essa orientação é, algumas vezes, violada (tal como quando usamos notas dadas por letras para calcular o conceito médio da turma).
3º NÍVEL – O Nível Intervalar de Mensuração é como o nível ordinal, com a propriedade adicional de que a diferença entre quaisquer dois valores de dados é significativa. No entanto, os dados nesse nível não têm um ponto inicial zero natural (quando o nada da quantidade está presente). É no 3º nível que surge, pela 1ª vez, uma escala de medida propriamente dita. É a escala INTERVALAR, caracterizada pela existência de:
· Uma unidade de medida (arbitrária, porém fixa);
· Um zero relativo, isto é, convencional.
Exemplos:
→ Anos: Os anos 1000, 2000, 1776 e 1492. (O tempo não começa no ano 0, de modo que o ano 0 é arbitrário e não um ponto inicial zero natural que represente“nenhum tempo”.)
→ As escalas termométricas. O zero é convencional em todas, bem como a distância entre dois traços contíguos – os chamados GRAUS.
Assim, se o corpo A está a 40ºC e outro, B, a 10ºC, não tem sentido dizer que A é “quatro vezes mais quente” que B só porque 40:10 = 4. Os valores são ordenados, e podemos determinar a sua diferença de 30ºC. No entanto, não há um ponto inicial natural. O valor de 0ºC pode parecer um ponto inicial, mas é arbitrário e não significa ausência total de calor. Como 0ºC não é um ponto inicial zero natural, é errado dizer que 50ºC é duas vezes mais quente do que 25ºC. Mas não há dúvida de que A é bem mais quente que B.
4º NÍVEL – O Nível de Mensuração de Razão é o nível intervalar com a propriedade adicional de que há também um ponto inicial zero natural (onde zero indica que nada da
- 15 -
quantidade está presente). Para valores nesse nível, diferenças e razões são, ambas, significativas. O 4º nível define a chamada escala de razão ou RACIONAL. Essa escala é muito parecida com a de 3º nível, exceto quanto à origem: o zero é absoluto, isto é, é zero mesmo.
Em função disso, todas as operações aritméticas passam a ter sentido e, portanto, NÃO HÁ CÁLCULO QUE NÃO POSSA SER FEITO.
Exemplos:
→ Pesos: Os pesos (em quilates) de diamantes de anéis (0 representa nenhum peso, e 4 quilates é duas vezes mais que 2 quilates).
→ Preços: Os preços de livros-texto (R$0,00 representa nenhum custo, e um livro de R$90,00 custa três vezes um livro de R$30,00).
Esse nível de mensuração é chamado nível de razão porque o ponto inicial zero torna as razões significativas. Entre os quatro níveis de mensuração, a maior dificuldade surge entre os níveis intervalar e de razão.
1.4.1 Atividades Complementares
1. Classifique as variáveis em qualitativas ou quantitativas (contínuas ou descontínuas):
a. Universo: alunos de uma faculdade.
Variável: cor dos cabelos - ... Qualitativa
b. Universo: casais residentes em uma cidade.
Variável: número de filhos - ... Quantitativa Discreta
c. Universo: as jogadas de um dado.
Variável: o ponto obtido em cada jogada - ... Quantitativa Discreta
d. Universo: peças produzidas por certa máquina.
Variável: número de peças produzidas por hora - ... Quantitativa Discreta
e. Universo: peças produzidas por certa máquina. Variável: diâmetro externo - ... Quantitativa Contínua
2. Quais das variáveis abaixo são discretas e quais são contínuas:
a. População: alunos de uma cidade. Variável: cor dos olhos.
b. População: estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante um ano. Quantitativa Contínua
c. População: Bolsa de Valores de São Paulo.
Variável: número de ações negociadas. Quantitativa Discreta
d. População: funcionários de uma empresa.
Variável: salários. Quantitativa Discreta
e. População: pregos produzidos por uma máquina.
Variável: comprimento. Quantitativa Contínua
f. População: casais residentes em uma cidade.
- 16 -
Variável: sexo dos filhos.
g. População: propriedades agrícolas do Brasil.
Variável: produção de algodão. Quantitativa Contínua
h. População: segmentos de reta.
Variável: comprimento. Quantitativa Contínua
i. População: bibliotecas da cidade de Ipatinga.
Variável: número de volumes. Quantitativa Discreta
j. População: aparelhos produzidos em uma linha de montagem.
Variável: número de defeitos por unidade. Quantitativa Discreta
k. População: indústrias de uma cidade. Variável: índice de liquidez. Quantitativa Contínua
3. Determine qual dos quatro níveis de mensuração (nominal, ordinal, intervalar, razão) é mais apropriado.
a. Altura das jogadoras de basquete da seleção brasileira. razão
b. 	Classificação de “encontro as cegas” como fantástico, bom, médio, fraco, inaceitável.
c. Classificação da revista Consumer Reports em “melhor comprar, recomendado, não recomendado”. ordinal
d. Números do seguro social.
e. O número de respostas “sim” recebidas quando se perguntou a 1250 motoristas se alguma vez tinham usado o telefone celular enquanto dirigiam. razão
f. Códigos postais (CEP).
4. Além do Básico
a. 	Interpretação do Aumento da Temperatura. Na tirinha do desenho “Born Loser” de Art Sansom, Brutus expressa satisfação com o aumento da temperatura de 1º para 2º. Quando perguntam a ele o que há de tão bom em relação a 2 º, ele responde “É duas vezes mais quente do que essa manhã”. Explique por que Brutus está errado mais uma vez.
Sem qualquer ponto inicial natural, as temperaturas estão no nível intervalar de mensuração; razões tais como “dobro” não tem significado.
b. Interpretação da Pesquisa Política. Um pesquisador entrevista 200 pessoas e lhes pergunta sobre o partido político de sua preferência. Ele codifica as respostas como 0 (para PT), 1 (para PSDB), 2 (para PMDB), 3 (para quaisquer outras respostas). Ele calcula, então, a média dos números e obtém 0,95. Como se pode interpretar esse valor?
c. Escala para Classificação de Comida. Um grupo de estudantes desenvolve uma escala de classificação da qualidade da comida da lanchonete, com 0 representando “neutra: nem boa nem ruim”. Dão-se números negativos para refeições ruins e números positivos para refeições boas, com o valor absoluto dos números correspondendo a seriedade da má ou boa qualidade. As três primeiras refeições tiveram classificações 2, 4 e -5. Qual é o nível de mensuração para tal classificação? Justifique sua escolha.
Ordinal ou intervalar são respostas razoáveis, mas ordinal faz mais sentido porque as diferenças entre valores não são, provavelmente, significativas. Por exemplo, a diferença entre uma comida classificada como 1 e uma comida classificada como 2 não é, provavelmente, a mesma entre uma comida classificada como 9 e uma comida classificada como 10.
- 17 -
1.5 Planejamento de Experimento e Amostragem
Devemos entender que o método usado para coletar dados é absoluta e criticamente importante, e devemos saber que a aleatoriedade é particularmente importante.
· Se os dados amostrais não forem coletados de maneira apropriada, eles podem ser de tal modo inúteis que nenhuma manipulação estatística poderá salva-los.
· A aleatoriedade comumente desempenha papel crucial na determinação de quais dados coletar.
Os métodos estatísticos são direcionados pelos dados. Normalmente, obtemos dados de duas fontes distintas: estudos observacionais e experimentos.
Definições:
Em um estudo observacional, observamos e medimos características específicas, mas não tentamos modificar os sujeitos objeto do estudo.
Em um experimento, aplicamos algum tratamento e passamos, então, a observar seu efeito sobre os sujeitos.
Exemplos:
→ Estudo Observacional: uma pesquisa do Gallup, por exemplo, simplesmente observa as pessoas (em geral, através de entrevistas) sem modificá-las de modo algum.
→ Experimento: o teste clínico da droga Liptor envolve o tratamento de algumas pessoas com a droga, de modo que as pessoas tratadas são modificadas.
Definições:
Em um estudo transversal, os dados são observados, medidos e coletados em um ponto no tempo.
- 18 -
Em um estudo retrospectivo (ou de controle de caso), os dados são coletados do passado, voltando-se no tempo (através de exames de registros, entrevistas e assim por diante).
Em um estudo prospectivo (ou longitudinal ou de coorte), os dados são coletados no futuro, de grupos (chamados coortes) que compartilham fatores comuns.
Essas três definições se aplicam aos estudos observacionais, mas agora mudamos nossa atenção para os experimentos. Os resultados de experimentos são algumas vezes destruídos por causa do confundimento.
Definição:
O confundimento ocorre em um experimento quando o pesquisador não está apto a distinguir entre os efeitos de diferentes fatores.
Tente planejar o experimento de modo que o confundimento não ocorra.
Por exemplo, suponha que um professor na faculdade experimente uma nova tática de freqüência (“sua média no curso cai um ponto para cada aula que você mata”), mas ocorre um inverno excepcionalmente ameno, sem chuvas ou temporais fortes queatrapalharam a freqüência no passado. Assim, se a freqüência melhorar, não poderemos determinar se essa demora se deveu à nova tática ou ao inverno ameno. Os efeitos da tática de freqüência e do tempo foram confundidos.
1.5.1 Controlando os Efeitos das Variáveis
Um dos elementos–chave no planejamento de um experimento é o controle dos efeitos das variáveis. Podemos obter tal controle usando dispositivos como experimentos cegos, blocos, planejamento experimental completamente aleatorizado ou um planejamento experimental rigorosamente controlado, descritos a seguir.
Experimento Cego - Em 1954, planejou-se um experimento maciço para testar a eficácia da vacina Salk na prevenção da pólio, que matava ou paralisava milhares de crianças. Naquele experimento, um grupo de tratamento recebeu a vacina Salk real, enquanto um segundo grupo recebeu um placebo que não continha qualquer droga. Nos experimentos que envolvem placebos, há sempre um efeito placebo, que ocorre quando um sujeito não tratado relata melhora nos sintomas. (A melhora relatada no grupo placebo pode ser real ou imaginada.) Esse efeito placebo pode ser minimizado ou contabilizado através do uso de um experimento cego, uma técnica em que o sujeito não sabe se está recebendo o tratamento ou o placebo. O experimento cego nos permite determinar se o efeito do tratamento é ou não significativamente diferente do efeito do placebo. O experimento da pólio foi do tipo duplo-cego, o que significa que a ocultação ocorreu em dois níveis (1) as crianças que recebiam a injeção não sabiam se estavam recebendo a vacina Salk ou um placebo, e (2) os médicos que davam as injeções e avaliavam os resultados também não sabiam.
Blocos – No planejamento de um experimento para testar a eficácia de um ou mais tratamentos, é importante colocar os sujeitos (em geral, chamados unidades experimentais) em grupos diferentes (ou blocos) de tal modo que os grupos sejam muito semelhantes. Um bloco é um grupo de sujeitos que são semelhantes nos modos que possam afetar o resultado do experimento.
Ao conduzir um experimento que testa um ou mais tratamentos diferente, forme blocos (ou grupos) de sujeitos com características similares.
Planejamento Experimental totalmente Aleatorizado – Na decisão de como associar os sujeitos aos diferentes blocos, você pode usar a seleção aleatória ou tentar controlar cuidadosamente a associação, de modo que os sujeitos dentro de cada bloco sejam semelhantes. Uma abordagem é usar um planejamento experimental completamente aleatorizado, onde os sujeitos são colocados nos blocos através de um processo de seleção aleatória. Um exemplo de um planejamento experimental
- 19 -
totalmente aleatorizado é a característica do experimento da pólio: as crianças foram destinadas ao grupo de tratamento ou ao grupo placebo através de uma seleção aleatória (equivalente à jogada de uma moeda).
Existe uma técnica especial – Amostragem – para recolher amostras, que garante, tanto quanto possível, o acaso na escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito escolhido, pois, como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população.
Planejamento Rigorosamente Controlado – Outra abordagem para atribuir sujeitos aos grupos é usar um planejamento rigorosamente planejado, no qual os sujeitos são escolhidos cuidadosamente de modo que em cada bloco sejam similares em relação ao que é importante ao experimento. Em um experimento que testa a eficácia de uma droga feita para baixar a pressão sanguínea, se o grupo do placebo inclui um homem de 30 anos, com excesso de peso, fumante e que consome sal e gordura em abundância, o grupo do tratamento deve incluir, também, uma pessoa com características semelhantes (o que, nesse caso, seria fácil de achar).
1.5.2 Replicação e Tamanho da Amostra
Além do controle dos efeitos das variáveis, outro elemento-chave do planejamento experimental é o tamanho das amostras. As amostras devem ser grandes o bastante para que o comportamento errático, que é característica de amostras muito pequenas, não disfarce os verdadeiros efeitos dos diferentes tratamentos. A repetição de um experimento é chamada replicação, e a replicação é usada efetivamente quando temos sujeitos suficientes para reconhecer diferenças a partir de tratamentos diferentes. (Em outro contexto, replicação se refere à repetição ou duplicação de um experimento de modo que os resultados possam ser confirmados ou verificados). Com replicação, tamanhos amostrais grandes aumentam a chance de reconhecimento dos efeitos de diferentes tratamentos. No entanto, uma amostra grande não é, necessariamente, uma boa amostra. Embora seja necessário ter uma amostra que seja suficientemente grande, é mais importante ter uma amostra na qual os dados tenham sido escolhidos de alguma maneira apropriada, tal como seleção aleatória (descrita mais adiante).
Use um tamanho de amostra grande o bastante para que possa ser vista a verdadeira natureza de quaisquer efeitos e obtenha a amostra usando um método apropriado, tal como um baseado em aleatoriedade.
No experimento planejado para testar a vacina Salk, 200.000 crianças receberam a verdadeira vacina e 200.000 outras crianças receberam um placebo. Como o experimento real usou tamanhos amostrais suficientemente grandes, a eficácia da vacina pôde ser comprovada. No entanto, embora os grupos de tratamento e de placebo fossem muito grandes, o experimento teria sido um fracasso se os sujeitos não tivessem sido destinados a cada grupo de um modo que tornasse ambos os grupos semelhantes no que era importante para o experimento.
1.5.3 Aleatorização e Outras Estratégias Amostrais
Na estatística, como na vida, um dos piores erros consiste em coletar dados de uma maneira não apropriada. Não podemos deixar de enfatizar esse ponto muito importante:
Se os dados amostrais não forem coletados de maneira adequada, eles podem ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los.
Vamos, agora, definir os métodos de amostragem mais comuns.
- 20 -
1.5.3.1 Amostragem Aleatória simples ou casual
Definições:
Em uma amostra aleatória, membros de uma população são selecionados de tal modo que cada membro individual tenha chance igual de ser selecionado.
Uma amostra aleatória simples (amostragem casual) de tamanho n é selecionada de tal modo que toda amostra possível de mesmo tamanho n tem a mesma chance de ser escolhida.
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.
Exemplo:
→ Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma faculdade:
a. 	Imagine uma sala de aula com 60 alunos arrumados em 6 filas de 10 alunos cada. Suponha que o professor selecione uma amostra de 10 alunos jogando um dado e selecionando a fila correspondente ao resultado da jogada. O resultado é uma amostra aleatória porque cada estudante individual tem a mesma chance (uma chance em seis) de ser escolhido. No entanto, a amostra não é uma amostra aleatória simples porque nem todas as amostras de tamanho 10 têm a mesma chance de serem escolhidas. Por exemplo, esse planejamento amostral, ao usar um dado para selecionar uma fileira, torna impossível selecionar 10 estudantes que estejam em filas diferentes (mas há uma chance em seis de selecionar os 10 estudantes da primeira fila).
b. 	Numeramos os alunos de 01 a 90. Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população.
Coma amostragem aleatória, esperamos que todos os componentes da população sejam (aproximadamente) proporcionalmente representados. Amostras aleatórias são selecionadas por vários métodos diferentes, incluindo o uso do computador para gerar números aleatórios. (Antes dos computadores, eram usadas tabelas de números aleatórios).
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma Tabela de Números Aleatórios (ANEXO I), construída de modo que os 10 algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas.
ANEXO I
TABELA DE NÚMEROS ALEATÓRIOS
5 7 7 2 0 0 3 9 8 4 8 4 4 1 7 9 6 7 7 1 4 0 2 1 1 3 9 7 5 6 4 9 8 6 5 4 0 8 9 3 2 9 6 8 7 4 5 4 8 3
2 8 8 0 5 3 5 1 5 9 0 9 9 3 9 8 8 7 5 8 7 0 2 7 7 1 7 7 1 7 0 6 3 2 0 2 7 8 6 2 1 6 7 4 2 9 6 5 1 7
9 2 5 9 1 8 5 2 8 7 3 0 4 8 8 6 9 7 4 8 3 5 2 5 1 8 8 8 7 4 0 3 6 2 9 8 3 8 5 8 6 5 8 6 4 2 4 1 0 3
9 0 3 8 1 2 9 1 7 4 3 0 1 9 7 5 8 9 0 7 5 0 6 4 1 5 5 9 7 1 8 8 1 3 7 4 9 5 3 0 5 2 7 8 3 0 1 1 7 5
8 0 9 1 1 6 9 4 6 7 5 8 6 0 8 2 0 6 6 6 9 0 4 7 5 6 1 8 4 6 4 5 1 1 1 2 3 5 3 2 4 5 5 0 4 1 1 3 4 3
2 2 0 1 7 0 3 1 3 2 9 6 9 1 9 2 7 5 4 0 1 6 5 4 2 9 7 2 7 4 9 9 0 0 9 5 9 7 6 1 0 0 9 8 2 4 3 0 0 7
5 6 2 4 1 0 0 4 3 0 2 0 4 6 2 9 9 0 5 3 5 3 1 1 0 5 8 4 4 1 2 1 6 4 7 9 1 9 7 6 2 9 5 1 6 2 6 0 6 6
7 9 4 4 9 2 6 2 0 2 9 6 8 6 6 4 3 0 0 0 9 4 5 6 6 9 3 0 2 0 5 9 8 7 8 7 3 5 4 4 2 2 5 0 9 7 7 8 1 9
5 3 9 9 6 6 4 5 0 8 8 9 7 8 5 0 7 7 5 3 3 7 2 5 7 7 4 1 2 7 6 2 3 8 0 2 2 3 5 7 6 2 0 1 4 1 6 0 3 5
- 21 -
1 8 9 2 8 7 3 5 8 8 5 5 0 5 2 1 3 6 5 1 3 9 2 8 5 0 1 4 6 6 8 5 7 9 3 0 1 9 7 9 7 2 6 6 6 4 3 1 4 5
5 3 0 8 5 8 9 6 6 3 0 5 6 1 2 5 7 0 2 2 5 0 4 1 2 8 9 6 6 2 6 6 4 3 6 3 0 6 6 3 0 1 3 2 7 9 8 5 2 2
0 3 5 8 8 0 2 9 2 8 7 6 8 9 5 1 1 8 2 4 8 8 8 9 4 6 4 7 4 8 5 9 1 9 2 9 8 7 0 3 1 0 3 3 9 9 6 7 1 2
2 7 0 7 8 1 8 8 6 5 6 9 4 9 9 8 0 0 2 8 0 4 7 0 5 1 3 0 0 1 4 7 1 8 9 7 3 3 2 1 8 5 8 2 4 5 4 3 2 4
0 5 2 1 0 8 5 9 0 1 0 6 2 2 2 4 9 8 9 1 8 1 1 7 5 5 4 4 6 6 1 6 0 7 7 3 0 7 6 6 1 0 1 2 3 1 7 8 5 8
4 0 3 6 1 3 2 7 8 4 3 0 8 2 3 3 3 6 3 9 6 9 4 2 0 5 5 8 6 4 6 1 1 2 3 3 8 9 2 7 8 9 5 2 6 6 7 1 9 3
5 4 6 0 2 5 2 8 8 5 8 8 2 0 0 0 1 0 5 9 6 1 0 5 3 6 6 1 3 3 7 2 0 1 0 1 1 9 0 1 6 1 1 0 5 1 2 0 9 1
7 1 5 1 6 3 4 0 7 6 5 1 1 1 7 3 7 3 5 2 3 7 3 1 6 0 4 5 8 8 9 2 7 3 4 3 7 1 2 8 0 4 9 8 0 9 0 2 4 8
6 1 0 2 0 1 8 1 7 3 9 2 6 0 6 6 7 3 5 8 5 3 3 4 4 2 6 8 2 6 3 8 3 4 0 3 2 7 4 4 8 6 0 4 4 6 6 5 9 3
8 2 5 5 9 3 1 3 4 6 3 0 9 5 2 6 5 5 0 6 9 6 1 7 6 5 9 1 7 2 3 9 7 9 9 6 1 2 4 9 5 2 8 0 6 3 2 6 9 9
8 9 9 8 5 4 1 4 2 1 7 4 1 3 5 7 6 8 1 9 8 6 2 8 6 0 8 9 4 7 3 3 1 5 2 6 2 8 7 7 4 5 3 8 4 8 0 8 0 8
0 0 9 9 8 4 8 4 1 4 6 7 9 5 1 3 7 7 5 8 9 0 1 4 5 0 7 9 4 2 7 3 6 3 3 1 0 6 6 0 4 3 4 0 1 2 5 5 0 4
6 2 4 1 5 0 7 8 2 0 4 8 0 5 8 8 4 3 5 2 9 8 0 3 1 9 9 3 9 2 0 3 0 4 9 7 2 5 8 4 9 5 9 5 0 3 6 3 3 1
9 4 2 7 9 0 6 9 2 4 6 8 0 9 9 2 1 1 8 6 0 7 6 3 8 3 1 9 3 2 9 9 5 1 1 5 5 5 7 1 0 9 2 7 0 2 6 7 0 0
4 4 8 9 2 9 2 8 8 4 3 6 2 8 2 5 1 5 8 2 8 7 7 4 1 8 9 7 2 5 7 6 1 0 6 3 2 6 7 6 0 2 2 6 7 4 5 3 2 8
9 7 3 0 7 6 9 5 3 3 2 1 1 0 5 4 2 6 9 5 6 6 6 5 5 2 0 4 9 9 3 6 5 8 4 8 0 3 0 8 9 3 6 3 5 8 1 7 9 6
3 9 1 6 5 8 0 4 4 4 8 0 1 5 5 9 5 9 8 3 9 0 9 5 5 4 6 6 8 1 8 4 3 9 6 0 8 5 3 8 8 8 6 6 3 3 3 5 6 9
6 0 7 8 1 1 0 3 2 6 6 7 5 0 3 4 0 9 6 1 3 1 3 0 2 0 7 6 9 3 6 6 3 0 8 3 5 1 0 9 3 3 8 3 6 4 7 6 0 5
0 3 1 9 2 3 4 7 6 2 8 9 5 7 7 7 9 1 3 3 8 8 4 7 6 0 5 9 3 7 5 4 3 9 4 8 7 7 6 7 4 9 8 5 3 8 4 3 9 1
4 1 2 8 5 2 6 7 5 6 2 5 3 9 5 9 9 6 6 5 5 1 3 6 9 0 3 2 2 2 3 9 3 3 0 5 2 2 9 9 0 3 3 9 9 7 9 6 9 9
7 7 5 4 9 8 5 0 3 9 2 5 3 7 4 2 5 2 9 7 1 0 0 3 5 6 0 4 9 2 8 1 6 6 8 6 7 0 0 1 4 8 8 9 5 5 8 2 1 0
2 8 6 3 4 1 6 1 9 1 6 4 2 4 8 3 8 1 3 7 3 4 4 8 8 3 2 7 9 6 3 8 7 1 6 9 7 3 0 6 7 7 5 0 2 5 6 4 4 0
7 4 2 4 4 8 8 5 4 0 1 2 3 3 5 9 6 7 5 0 1 4 9 8 1 4 2 6 4 2 7 9 7 9 1 3 5 2 8 9 6 9 7 8 8 0 4 4 7 1
0 0 2 4 0 3 3 7 9 6 4 6 6 8 7 5 0 5 3 2 4 2 1 6 6 3 3 3 2 8 9 7 2 6 3 6 4 7 2 7 7 3 6 5 3 8 3 4 4 6
0 5 4 1 4 7 6 9 6 9 4 5 3 6 1 6 7 1 1 8 9 5 5 1 9 7 2 2 0 4 1 3 2 3 9 6 5 8 6 0 0 3 6 9 4 8 7 9 8 3
6 2 6 9 8 4 9 7 9 7 4 7 2 3 6 6 5 1 5 6 1 3 0 8 6 9 1 1 5 2 7 5 5 9 2 6 8 6 8 1 8 0 4 3 0 0 9 8 9 2
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir da qual iremos considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice- versa), verticalmente (de cima para baixo ou vice-versa) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo.
Assim, para o nosso exemplo, considerando a 18ª linha, tomamos os números de dois algarismos (tantos algarismos quanto formam o maior número da população), obtendo:
61 02 01 81 73 92 60 66 73 58 53 34
Evidentemente, o número 92 será desprezado, pois não consta da população, como será abandonado um numeral que já tenha aparecido.
Temos, então:
61 02 01 81 73 60 66 58 53 34
Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma amostra das estaturas dos noventa alunos.
1.5.3.2 Amostragem Proporcional Estratificada
Muitas vezes a população se divide em subpopulações – estratos.
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Logo, temos:
Exemplo:
→ Supondo, no exemplo anterior (b), que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos:
b.1 
- 22 -
	SEXO
	POPULAÇÃO
	10%
	AMOSTR
A
	M F
	54
36
	10 x 54  100 = 5,4
10 x 36  100 = 3,6
	5
4
	Total
	90
	10 x 90  100 = 9,0
	9
b.2 	Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem a meninos e de 55 a 90, meninas. Tomamos na tabela de números aleatórios a primeira e a segunda colunas da esquerda, de cima pra baixo, obtemos os seguintes números:
57 28 92 90 80 22 56 79 53 18 03 27 05 40
Temos então:
28 22 53 18 03 → para os meninos;
57 90 80 56 → para as meninas.
Com a amostragem estratificada, subdividimos a população em pelo menos dois subgrupos (ou estratos) que compartilham as mesmas características (tais como sexo ou faixa etária) e em seguida, extraímos uma amostra de cada subgrupo (ou estrato).
1.5.3.3 Amostragem por Conglomerado
Na amostragem por conglomerado, primeiro dividimos a área da população em seções (ou conglomerados), depois selecionamos aleatoriamente alguns desses conglomerados e então escolhemos todos os membros desses conglomerados selecionados.
É fácil confundir a amostragem estratificada com amostragem por conglomerado, porque ambas envolvem a formação de subgrupos. Mas a amostragem por conglomerado usa todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos.
Exemplo:
→ Pesquisas Eleitorais – Selecionamos aleatoriamente 30 zonas eleitorais de um grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas zonas selecionadas. Isso é muito mais rápido e muito menos dispendioso do que selecionar uma pessoa de cada uma das muitas zonas da área populacional. Os resultados da amostragem estratificada ou por conglomerado podem ser ajustados ou ponderados para corrigir quaisquer representações desproporcionais de grupos.
1.5.3.4 Amostragem Sistemática
Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência.
Exemplos:
→ os prontuários médicosde um hospital;
→ os prédios de uma rua;
→ as linhas de produção.
Nesses casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população.
Exemplo:
- 23 -
→ Suponhamos uma rua contendo 900 prédios, dos quais desejamos obter uma amostra formada de cinqüenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 900  50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4º prédio, o 22º, o 40º etc., até voltarmos ao início da rua, pelo lado esquerdo.
1.5.4 Erros Amostrais
Não importa quão bem planejemos e executemos o processo de coleta da amostra, provavelmente sempre haverá algum erro nos resultados.
Exemplo:
→ Selecione aleatoriamente 1000 adultos, pergunte a eles se formaram no Ensino Médio e a porcentagem amostral de respostas “sim”. Se você selecionar aleatoriamente outra amostra de 1000 adultos, é provável que você obtenha uma porcentagem amostral diferente.
Definições:
Um erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado da população; tais erros resultam das flutuações amostrais devidas ao acaso.
Um erro não-amostral ocorre quando os dados amostrais são coletados, registrados ou analisados incorretamente (tal como a seleção de uma amostra tendenciosa, o uso de um instrumento de medida defeituoso, ou cópia incorreta dos dados).
Após ler toda esta seção, é fácil ficarmos espantados com a variedade de diferentes definições. Mas lembre-se desse ponto principal: o método usado para coletar os dados é absoluta e criticamente importante, e devemos saber que a aleatoriedade é particularmente importante. Se os dados amostrais não forem coletados de maneira apropriada, os dados podem se tornar tão inúteis que nenhuma manipulação estatística poderá salva-los.
- 24 -
1.5.5 Atividades Complementares
1. Resolva:
a. Pesquisa – peso dos colegas de sua classe (incluindo você). Amostra – correspondente a 30% da população.
Sugestão – faça uso da caderneta de seu professor e da Tabela dos Números Aleatórios (5ª e 6ª colunas, de baixo para cima).
b. Pesquisa – estatura dos alunos do curso de Sistemas de Informação. Amostra – 15% da população.
Sugestão – Use a Tabela dos Números Aleatórios (25ª linha, da esquerda para direita).
	SÉRIES
	POPULAÇÃO
	15%
	AMOSTRA
	A B
	
	
	
c. Em uma faculdade existem 250 alunos, sendo 35 no 1º período, 32 no 2º, 30 no 3º, 28 no 4º, 35 no 5º, 32 no 6º, 31 no 7º e 27 no 8º. Obtenha uma amostra de 40 alunos e preencha o quadro da página seguinte.
Como, neste caso, foi dado o número de elementos da amostra, devemos, então, calcular o número de elementos de cada estrato proporcionalmente ao número de elementos da amostra. Assim, para a 1ª série, temos:
250/35 = 40/x ⟶ x = 35 x 40  250 = 5,6 ⟶ x = 6 Logo:
	SÉRIE
	POPULAÇÃO
	CÁLCULO PROPORCIONAL
	AMOSTRA
	1ª
	35
	10 x 40  250 = 5,6
	6
	2ª
	....
	....
	....
	3ª
	....
	....
	....
	4ª
	28
	....
	....
	5ª
	....
	....
	6
	6ª
	....
	....
	....
	7ª
	....
	31 x 40  250 = ....
	....
	8ª
	....
	....
	....
	Total
	250
	-
	40
- 25 -
2. 	Uma faculdade abriga 124 alunos. Obtenha uma amostra representativa correspondendo a 15% da população.
Sugestão: use a 8ª, 9ª e 10ª colunas, a partir da 1ª linha, da Tabela de Números Aleatórios (de cima para baixo).
002 – 014 – 016 – 034 – 039 – 053 – 054 – 056 – 062 – 066 – 076 – 082 – 094 – 096 – 099 – 105 – 110 – 118 -
123
3. 	No curso de Sistemas de Informação há 80 alunos. Obtenha uma amostra de 12 alunos.
Sugestão: decida, juntamente com a classe e seu professor, o uso da Tabela de Números Aleatórios.
4. O diretor de uma faculdade, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra.
5. Uma cidade X apresenta o seguinte quadro relativo às suas faculdades:
	ESCOLA S
	Nº DE ESTUDADANTES
	
	MASCULINO
	FEMININO
	A
	80
	95
	B
	102
	120
	C
	110
	92
	D
	134
	228
	E
	150
	130
	F
	300
	290
	Total
	876
	955
Obtenha uma amostra proporcional estratificada de 12º estudantes.
6. 	Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3º estrato, determine o nº total de elementos da amostra. 30
7. Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada formada por 2.432 elementos.
Na ordenação geral, qual dos elementos abaixo seria escolhido para pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?
1.648º, 290º, 725º, 2.025º, 1.120º. 1.648º
8. Determine se a descrição dada corresponde a um estudo observacional ou a um
experimento.
a. Teste de Droga – Dá-se Lipitor a pacientes para se determinar se essa droga tem ou não o efeito de baixar os níveis altos de colesterol. Experimental
b. 	Tratamento da Sífilis – Muita controvérsia surgiu em relação a um estudo de pacientes com sífilis que não receberam um tratamento que poderia tê-los curado. A saúde deles foi acompanhada durante anos, após ter sido descoberto que tinham sífilis.
c. 	Fraude ao Consumidor – O Birô de pesos e medidas de Minas gerais seleciona aleatoriamente postos de gasolina e obtém 2 litros de gasolina de cada bomba. A quantidade bombeada é medida para verificar a exatidão. Estudo observacional
- 26 -
d. Braceletes Magnéticos – Os passageiros de navios de cruzeiro recebem braceletes magnéticos, que eles concordam em usar numa tentativa de eliminar ou diminuir o enjôo.
9. Identifique o tipo de estudo observacional (transversal, retrospectivo ou prospectivo).
a. Pesquisa Médica – Um pesquisador da Faculdade de Medicina da UFMG obtém dados sobre ferimentos na cabeça examinando os registros do hospital dos últimos 5 anos.
Restropectivo
b. 	Psicologia do Trauma – Um pesquisador do Hospital Mt Sinai planeja obter dados acompanhando (até o ano 2010) irmãos de vítimas fatais do ataque terrorista ao World Trade Center em 11 de setembro de 2001.
c. 	Estatística do Desemprego – O Ministério do Trabalho obtém dados atuais do desemprego pesquisando 50.000 pessoas este mês. Transversal
d. 	Ganhadores de Loteria – Um economista coleta dados entrevistando pessoas que ganharam na loteria entre os anos de 1995 e 2000.
10. Identifique qual destes tipos de amostragem é usado: aleatória, sistemática, de conveniência, estratificada ou por conglomerados.
a. Notícias na Televisão – Um repórter de noticiário da rede Globo analisa a reação a uma história impressionante entrevistando pessoas que passam em frente ao seu estúdio. De conveniência
b. Seleção de Júri – O comissário de jurados do Condado de Dutches obtém uma lista de 42.763 proprietários de carros e obtém um conjunto de jurados selecionando cada centésimo nome da lista.
c. Pesquisas Telefônicas – Em uma pesquisa do Gallup de 1059 adultos, os sujeitos da entrevista foram selecionados usando-se um computador para gerar aleatoriamente números de telefones, que eram então discados. Aleatória
d. 	Posse de Carro – Uma pesquisadora da General Motors dividiu todos os carros registrados em categorias de subcompacto, compacto, médio, intermediário e grande. Ele está pesquisando 200 proprietários de carro de cada categoria.
e. 	Bebida entre Estudantes – Motivado pelo fato de um estudanteter morrido por excesso de bebida, uma faculdade fez um estudo do hábito de bebida dos estudantes, selecionando aleatoriamente 10 classes diferentes e entrevistando todos os estudantes em cada uma dessas classes. De conglomerado
f. Marketing – Uma executiva de marketing da General Motors descobriu que o departamento de relações públicas da empresa tinha acabado de imprimir envelopes com os nomes e endereços de todos os proprietários de Corvete.
g. 	Ponto de Checagem de Sobriedade – O autor foi observador de um ponto de checagem de sobriedade da polícia, no qual cada quinto chofer era parado e entrevistado. (Ele testemunhou a prisão de um ex-aluno). Sistemática
h. Pesquisa de Boca de Urna – Uma rede de notícias está planejando uma pesquisa na qual 100 seções eleitorais serão selecionadas aleatoriamente e todos os eleitores serão entrevistados ao deixarem o local.
i. Educação e Salário – Um economista está estudando o efeito da educação sobre o salário e realiza uma pesquisa com 150 trabalhadores selecionados aleatoriamente de cada uma das seguintes categorias: menos do que Ensino Médio; Ensino Médio; mais do que Ensino Médio. Estratificada
- 27 -
j. Antropometria – Um estudante de estatística obtém dados sobre altura/peso entrevistando membros da família.
k. Pesquisa Médica – Um pesquisador da UFES examina todos os pacientes cardíacos de cada um dos 30 hospitais selecionados aleatoriamente. De conglomerado
l. Pesquisa da MTV – Um especialista em Marketing para a MTV está planejando uma pesquisa na qual 500 pessoas serão selecionadas aleatoriamente de cada faixa etária de 10-19, 20-29, e assim por diante.
11. Identifique as amostras aleatórias e as amostras aleatórias simples.
a. 	Amostragem de Comprimidos de Aspirina – Um farmacêutico mistura bem um recipiente com 1000 comprimidos de Bufferin e retira, então, 50 que devem ser testados para verificar o conteúdo exato de aspirina. Esse planejamento amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique. Sim, sim.
b. 	Amostragem de Estudantes – Uma sala de aula compõe-se de 30 alunos, sentados em 5 filas diferentes, com seis alunos em cada fila. O instrutor joga um dado e o resultado é usado para selecionar uma amostra dos estudantes em uma fila particular. Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique.
c. Amostra de Conveniência – Um repórter de notícias se coloca em uma esquina e obtém uma amostra de residentes da cidade selecionando cinco adultos que passam e perguntando sobre seus hábitos de fumo. Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique. Não, não.
d. Amostra Sistemática – Um engenheiro de controle da qualidade seleciona cada centésima fonte de computador que passa em uma esteira transportadora. Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique.
e. Amostra Estratificada – O shopping do Vale planeja realizar uma pesquisa de mercado com 100 homens e 100 mulheres em Ipatinga, a qual consiste em um número igual de homens e mulheres. Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique. Sim, não.
f. 	Amostra por Conglomerado – Um pesquisador de mercado seleciona aleatoriamente 10 quarteirões em Timóteo e pergunta então a todos os adultos residentes nos quarteirões selecionados se possuem ou não um aparelho DVD. Esse plano amostral resulta em uma amostra aleatória? Em uma amostra aleatória simples? Explique.
- 28 -
1.6 Tabelas de freqüência
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.
Definições:
Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de:
Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;
Coluna Indicadora – parte da tabela que especifica o conteúdo das linhas;
Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;
Casa ou Célula – espaço destinado a um só número;
Título – conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.
Há ainda a considerar elementos complementares da tabela, que são a fonte, as notas e as chamadas, colocadas, de preferência, no seu rodapé.
Exemplo:
PRODUÇÃO DE CAFÉ BRASIL – 2005-06
	
ANOS
	PRODUÇÃO (1.000 t)
	2005
	2 134
	2006
	2 594
FONTE: IBGE.
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar:
· um traço horizontal (−) quando o valor é zero, não só quanto à natureza das coisas, como quanto ao resultado do inquérito;
· três pontos (...) quando não temos os dados;
· um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
· zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são impressos em números decimais, precisamos acrescentar à parte decimal um número correspondente de zeros (0,0; 0,00; 0,000; ...).
- 29 -
1.6.1 Séries Estatísticas
Definição:
Série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.
Daí, podemos inferir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.
1.6.1.1 Séries Históricas, Cronológicas, Temporais ou Marchas
Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis.
Exemplos:
a. O Brasil fecha 2006 com a melhor safra de soja da sua história: 54,7 milhões de toneladas. Isso é 3% a mais que a safra de 2005. Estimando-se um faturamento de R$ 24 bilhões. O país é o segundo maior produtor mundial, atrás dos EUA.
Estados que lideram a produção no país: Mato Grosso, Paraná e Goiás. (Revista Isto é).
PRODUÇÄO MEDIA DE SOJA NO BRASIL 2005-06
	
ANOS
	PRODUÇÃO (1.000 t)
	2005
	51 138
	2006
	52 223
FONTE: IBGE.
b.
PREÇO DO ACÉM NO VAREJO SÃO PAULO – 1989-94
	
ANOS
	PREÇO MÉDIO (US$)
	1989
	2,24
	1990
	2,73
	1991
	2,12
	1992
	1,89
	1993
	2,04
	1994
	2,62
FONTE: APA.
1.6.1.2 Séries Geográficas, Espaciais, Territoriais ou de Localização
Descrevem os valores da variável, em determinado instante, discriminados segundo regiões.
DURAÇÃO MÉDIA DOS ESTUDOS SUP ERIORES 1994
	PAÍSES
	NÚMERO
DE ANOS
	Itália
	7,5
	Alemanha
	7,0
	França
	7,0
	Holanda
	5,9
	Inglaterra
	Menos de 4
FONTE: APA.
1.6.1.3 Séries Específicas ou Categóricas
- 30 -
Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias.
Exemplo:
a. A industria da soja gera cerca de 1,5 milhão de empregos diretos. Representa 20% do sistema agroindustrial. (Revista Isto é)
EXPORTAÇÃO	b.
BRASILEIRA 2005
	
PRODUTOS
	QUANTIDADE
(em bilhões de toneladas)
	Grãos
	20,5
	Farelo
	14,2
	Óleo
	2,4
FONTE: Companhia Nacional de Abastecimento (Conab).
REBANHOS BRASILEIROS 1992
	ESPÉCIES
	QUANTIDADE
(1.000 cabeças)
	Bovinos
	154.440,8
	Bubalinos
	1.423,3
	Eqüinos
	549,5
	Asininos
	47,1
	Muares
	208,5
	Suínos
	34.532,2
	Ovimos
	19.955,9
	Caprinos
	12.159,6
	Coelhos
	6,1
FONTE: IBGE.
1.6.2 Séries Conjugadas e Tabela de Dupla Entrada
Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries.
Conjugando duas séries

Mais conteúdos dessa disciplina