Triola - Introdução à estatística - Cap 01

•

UFES

Rainer Girelli

13/10/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Matemática Financeira

173.581 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Problema do Capitulo
Que podemos concluir desta pesquisa?
O programa de televisão A5C-Nightline realizou uma pesquisa em que solicitava a opinião dos espectadores sobre a
permanência, ou não, da sede das Nações Unidas nos EUA. Para responder, os espectadores deviam pagar 50 centavos
(americanos) para fazer uma chamada telefônica. Dos 180.000 que responderam, 67% disseram que a sede da ONU devia
sair dos EUA. Com base nesses resultados amostrais, que podemos concluir sol2re a opinião da população americana,
sobre a permanência ou não da sede da ONU nos EUA?
1-1 Aspectos Gerais
Começamos nosso estudo de estatística observando que a pala-
vra tem dois significados básicos. No primeiro sentido, o termo
é usado em relação a números específicos obtidos de dados, con-
forme ilustrado nos exemplos seguintes:
Em uma pesquisa, feita pela Bruskin-Goldring ResearCh
junto a 1.012 pessoas, a quem foi formulada pergunta sobre
como utilizar um bolo de frutas, 13% responderam que
deveria servir para calço de porta.
Entre as pessoas com quem se fez um teste sobre o uso de
drogas para admissão em novo emprego, 3,8% reagiram
positivamente [de. acordo com a American Management
Association (Associação Americana de Gerenciamento)].
O escore máximo de rebatidas de beisebol registrado até
agora é de 0,442, obtido por James O'Neil em 1887.
A segunda acepção se refere à estatística como método de análise.
O Estado da Estatística
A palavra estatística provém do latim status, que significa estada.
A primitiva utilização da estatística envolvia compilações de
dados e gráficos que descreviam vários aspectos de um estado
ou ¡país. Em 1662, John Graunt publicou informes estatísticos
sobre nascimentos e mortes. O trabalho de Graunt foi secundado
por estudos de mortalidade e taxas de morbidade, tamanho de
populações, rendas e taxas de desemprego. As famílias, os
governos e as empresas se apóiam largamente em dados
estatísticos. Assim é que as taxas de desemprego, de inflação, os
índices do consumidor, as taxas de natalidade e mortalidade são
calculadas cuidadosamente a intervalos regulares, e seus
resultados são utilizados por empresários para tomarem decisões
que afetam a futura contratação de empregados, níveis de
produção e expansão para novos mercados.
DEFINIÇÃO
A estatística é uma coleção de métodos para planejar ex-
perimentos, obter dados e organizá-los, resumi-los, analisá-
los, interpretá-los e deles extrair conclusões.
A estatística abrange muito mais do que o simples traçado de
gráficos e o cálculo de médias. Neste livro veremos como tirar
conclusões gerais e significativas que vão além dos dados origi-
nai§. Em estatística, utilizamos extensamente os termos popula-
ção e amostra. Esses termos, que passamos a definir, estão no
próprio cerne da estatística. •
DEFINIÇÕES
Uma população é uma coleção completa de todos os ele-
mentos (valores, pessoas, medidas etc.) a serem estudados.
Um censo é uma coleção de dados relativos a todos os ele-
mentos de uma população.
Uma amostra é uma subcoleção de elementos extraídos
de uma população.
Por exemplo, uma pesquisa Nielsen típica de televisão utiliza uma
amostra de 4000 lares e, com base nos resultados, formula con-
clusões acerca da população de todos os 97.855.392 lares nos
EUA.
Estreitamente relacionados com os conceitos de população e
amostra estão os conceitos de parâmetro e estatística. As defi-
nições seguintes são de fácil memorização.
DEFINIÇÕES
Um parâmetro é uma medida numérica que descreve uma
característica de uma população.
Uma estatística é uma medida numérica que descreve uma
característica de uma amostra.
Consideremos um exemplo. Em uma pesquisa, feita pela Bruslcin-
Goldring Research com 1015 pessoas escolhidas aleatoriamen-
te, 269 (ou 26,5%) possuíam computador. Como a cifra de 26,5%
se baseia em uma amostra, e não em toda a população, trata-se
de uma estatística (e não um parâmetro). Já se uma pesquisa fei-
ta entre os 50 governadores estaduais dos EUA mostra que 42
Introdução à Estatística 3
(ou 84%) possuem computador, a cifra de 84% é um parâmetro
porque se baseia em toda a população de governadores.
Um aspecto importante da estatística é sua aplicabilidade
óbvia a situações reais e relevantes; em todo este livro encontra-
remos ampla diversidade dessas aplicações.
1-2 A Natureza dos Dados
Alguns conjuntos de dados (como alturas) consistem em núme-
ros, enquanto outros são não-numéricos (como sexo). Aplicam-
se as expressões dados quantitativos e dados qualitativos para
distinguir esses dois tipos.
DEFINIÇÕES
Os dados quantitativos consistem em números que repre-
sentam contagens ou medidas.
Os dados qualitativos (ou dados categóricos, ou atribu-
tos) podem ser separados em diferentes categorias que se
distinguem por alguma característica não-numérica.
O Conjunto de Dados 4 do Apêndice B registra as quantida-
des de alcatrão em diferentes marcas de cigarros; esses valores
representam dados quantitativos, mas as diversas marcas cons-
tituem dados qualitativos.
Podemos ainda descrever os dados quantitativos distinguin-
do entre os tipos discreto e continuo.
DEFINIÇÕES
Os dados discretos resultam de um conjunto finito de
valores possíveis, ou de um conjunto enumerável desses
valores. (Ou seja, o número de valores possíveis é 0, ou 1,
ou 2 etc.)
Os dados contínuos (numéricos) resultam de um núme-
ro infinito de valores possíveis que podem ser associados
a pontos em uma escala contínua de tal maneira que não
haja lacunas ou interrupções.
Quando os dados representam contagens, são discretos; quan-
do representam mensurações, são contínuos. O número de ovos
que as galinhas põem constitui dados discretos, porque representa
uma contagem; já a quantidade de leite que as vacas produzem
constitui dados contínuos, porque representa mensurações que
podem tomar qualquer valor em um intervalo contínuo.
Outra maneira comum de classificar dados consiste em utilizar
quatro níveis de mensuração: nominal, ordinal, intervalar e razão.
DEFINIÇÃO
O nível nominal de mensuração é caracterizado por da-
dos que consistem apenas em nomes, rótulos ou categori-
as. Os dados não podem ser dispostos segundo um esque-
ma ordenado (como de baixo para cima).
Se associamos o termo nominal a "nome somente", o signifi-
cado é fácil de memorizar. Um exemplo de dado nominal é o
partido político a que cada senador dos EUA pertence.
I
EXEMPLO Seguem outros exemplos de dados amostrais ao
nível nominal de mensuração.
1. Respostas do tipo "sim", "não" ou "indeciso".
2. O sexo dos estudantes em uma turma de estatística.
Como as categorias carecem de qualquer significado ordinal
ou numérico, os dados precedentes não podem ser utilizados em
'cálculos. Assim é que não podemos tirar a "média" de 20 mu-
lheres e 15 homens. Cuidado: Por vezes atribuem-se números a
categorias (mormente quando os dados são computadorizados),
mas tais números não têm qualquer significado para efeito de
cálculo, e a média calculada com base neles em geral não tem
sentido. Poderíamos citar o fato de que a Gallup Organization
computou dados de uma pesquisa em que se atribui o "valor" O
aos democratas, 1 aos republicanos e 2 aos independentes. Mes-
mo estando diante de rótulos numéricos, os dados permanecem
no nível nominal e não podemos fazer cálculos com eles.
DEFINIÇÃO
O nível ordinal de mensuração envolve dados que po-
dem ser dispostos ern alguma ordem, mas as diferenças
entre os valores dos dados não podem ser determinadas,
ou não têm sentido.
EXEMPLO Dão-se a seguir exemplos de dados ao nível ordinal
de mensuração.
Um editor classifica alguns originais como "excelentes",
alguns como "bons" e alguns como "maus". (Não podemos
determinar uma diferença quantitativa entre "bom" e "mau".)
Um comitê de preparação olímpica classifica Gail em 3.°,
Diana em 7.° e Kim em 10.°. (Podemos determinar a dife-
rença entre os 3.° e 7.° lugares mas a diferença de 4 nãotem
qualquer significado.)
Esse nível ordinal dá informações sobre comparações relati-
vas, mas os graus de diferença não servem para cálculos. Os dados
em nível ordinal não devem, pois, ser utilizados em cálculos.
Censo do Ano 2000
O censo nacional (dos EUA) do ano 2000 será mais rápido,
menos dispendioso e mais preciso do que o censo de 1990. Ao
contrário do censo de 1990, o Censo de 2000 utilizará métodos
de amostragem para obter resultados mais precisos. Em 1990,
os agenciadores voltaram até seis vezes às 35 milhões de casas
que não remeteram os formulários preenchidos; mas, em 2000,
essas casas omissas serão submetidas a uma amostragem.
Espera-se que a amostragem produza resultados mais precisos
do que as tentativas de atingir cada casa individualmente. O
censo de 2000 custará cerca de $4 bilhões, o que significa $1
milhão menos do que o custo da repetição dos mesmos métodos
de 1990. O censo de 2000 será mais eficiente — embora o
censo de 1990 não tenha sido tão ineficiente como sugeriu o
colunista Dave Barry: "O Departamento do Censo expede 100
milhões de formulários, 87 milhões dos quais chegam a um
único destino em Albany."
4 ESTATÍSTICA
DEFINIÇÃO
O nível intervalar de mensuração é análogo ao nível
ordinal, com a propriedade adicional de que podemos de-
terminar diferenças significativas entre os dados. Todavia,
não existe um ponto de partida zero inerente, ou natural
(onde não haja qualquer quantidade presente).
As temperaturas de 98,2°F e 98,6°F são exemplos de dados nesse
nível intervalar de mensuração. Os valores se apresentam ordena-
dos, e podemos determinar diferenças entre eles (em geral chama-
das distância entre os dois valores). Todavia, não há ponto de par-
tida natural. O valor 0°F pode parecer um ponto de partida, mas
é inteiramente arbitrário, e não representa "ausência de calor". É
um erro dizermos que 50°F é duas vezes mais quente do que 25°F.
(Na escala Kelvin, as marcações de temperatura estão ao nível de
razão de mensuração; essa escala tem um zero absoluto.)
EXEMPLO Seguem exemplos de dados ao nível intervalar de
mensuração.
Os anos 1000,2000, 1776 e 1944. (O tempo não começou
no ano zero e, assim, O é arbitrário, e não um ponto de
partida zero natural.)
As temperaturas anuais médias (em graus Celsius) das
capitais dos 50 estados americanos.
Medida da Desobediência
Corno coletar dados sobre algo que não se apresente
mensurável, como o nível de desobediência do povo? O
psicólogo Stanley Milgram planejou o seguinte experimento: Um
pesquisador determinou que um voluntário acionasse um painel
de controle que dava choques elétricos crescentemente dolorosos
em uma terceira pessoa. Na realidade, não eram dados
choques e a terceira pessoa era um ator. O voluntário começou
com 15 volts e foi orientado a aumentar os choques de 15 em
15 volts. O nível de desobediência era o ponto em que a pessoa
se recusava a aumentar a voltagem. Surpreendentemente, dois
terços dos voluntários obedeceram às ordens mesmo que o ator
gritasse e simulasse um ataque cardíaco.
DEFINIÇÃO
O nível de razão de mensuração é o nível de intervalo
modificado de modo a incluir o ponto de partida zero ine-
rente (onde zero significa nenhuma quantidade presente).
Para valores nesse nível, tanto as diferenças como as ra-
zões têm significado.
EXEMPLO Dão-se a seguir exemplos de dados ao nível de ra-
zão de mensuração.
Pesos de artigos de material plástico descartados pelas re-
sidências (0 lb indica que nenhum plástico foi descartado,
e 10 lb representam duas vezes 5 lb).
Duração (em minutos) de filmes.
Distâncias (em milhas) percorridas por carros em um tes-
te de consumo de combustível.
Os valores de cada um desses conjuntos de dados podem ser
dispostos em ordem, suas diferenças podem ser calculadas, e
existe um ponto de partida zero inerente. Este nível é chamado o
nível de razão porque o ponto de partida torna as razões signi-
ficativas. Como um peso de 200 lb é duas vezes um peso de 100
lb, mas 50°F não é duas vezes mais quente do que 25°F, os pesos
estão ao nível de razão, enquanto as temperaturas Fahrenheit estão
em nível de intervalo. Para uma comparação e revisão concisas,
deve-se estudar a Tabela 1-1 para ver as diferenças entre os qua-
tro níveis de mensuração.
Ao aplicarmos a estatística a problemas reais, o nível de men-
suração dos dados é um fator importante para determinarmos o
processo a ser utilizado. Nossa compreensão dos quatro níveis
de mensuração deve ser complementado pelo bom senso — uma
ferramenta indispensável na estatística. Por exemplo, não tem
sentido calcularmos a média dos números de inscrição de segu-
rados no lNSS, porque esses números não medem nem contam
qualquer coisa; têm por função única e exclusiva identificar as
pessoas. Tais números são, na verdade, nomes diferentes para as
diversas pessoas e, como tais, não devem ser utilizados para cál-
culos. De modo geral, não devemos calcular médias de dados aos
níveis nominal ou ordinal de mensuração.
TABELA 1-1 Níveis de Mensuração de Dados
Nível

Sumário
Exemplo
Nominal
Ordinal
Categorias somente. Os dados
não podem ser dispostos em um
esquema ordenado.
As categorias são ordenadas, mas não
podemos estabelecer diferenças, ou
estas não têm sentido.
Carros de alunos:
10 Corvettes
20 Ferraris
40 Porsches
Carros de alunos:
10 compactos
20 médios
40 grandes
Categorias ou
nomes somente.
Está determinada
uma ordem:
"compacto", "médio",
"grande".
Intervalo Podemos determinar diferenças entre
valores, mas não há ponto de partida
inerente. As razões não têm sentido.
Razão
Como intervalo, mas com
um ponto de partida
inerente. As razões
têm sentido.
Temperaturas no campus:
45°F } 90°F não é duas vezes
80°F mais quente do que
90°F 45°F.
Pesos de jogadores de rugby em uma faculdade:
150 lb}
195 lb 300 lb é duas vezes 150 lb.
300 lb
Introdução à Estatística 5
1-2 Exercícios A: Habilidades e
Conceitos Básicos
Nos Exercícios 1-8, identifique cada número como discreto ou
contínuo.
Cada cigarro Carne! tem 16,13 mg de alcatrão.
O altímetro de um avião da American Airlines indica uma altitude
de 21.359 pés.
Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são
assinantes de um serviço de computador on-line.
O radar indica que Nolan Ryan rebateu a última bola a 82,3 mi/h.
De todos os escores SAT marcados no ano passado, 27 foram per-
feitos.
De 1000 consumidores pesquisados, 930 reconheceram a marca de
sopa Campbell,
O tempo total gasto anualmente por um motorista de táxi de Nova
York ao dar passagem a pedestres é de 2,367 segundos.
Ao completar um programa de treinamento, Shaquille O'Neal pe-
sava 12,44 lb menos do que no início do treinamento.
Nos Exercícios 9-18, determine o nível de mensuração mais
adequado (nominal, ordinal, intervalo, razão).
Classificação como superior, acima da média, médio, abaixo da
média ou pobre para encontros marcados com desconhecidos.
Conteúdo de nicotina (em miligramas) de cigarros Camel.
Números de inscrição do INSS.
Temperaturas (em graus Celsius) de uma amostra de contribuintes
irritados por estarem sendo fiscalizados.
Anos em que os democratas ganharam as eleições presidenciais.
Graus finais (A, B, C, D, F) de estudantes de estatística.
Códigos de endereçamento postal.
Rendas anuais de enfermeiras.
Carros classificados como subcompacto, compacto, intermediário
ou grande.
Cores de uma amostra de confeitos M&M.
1-2 Exercícios B: Acima do Básico
Presidentes americanos foram assassinados nos anos de 1865, 1881,
1901 e 1963. Qual é o nível de mensuração para esses anos? Ex-
plique sua resposta.
No quadrinho "Bom Loser" (Perdedor nato) por Art Sansom,
Brutus manifesta alegria por um aumento de temperatura de 1° para
2°. Ao lhe perguntarem a razão, respondeu: "Está agora duas ve-
zes mais quente que hoje de manhã." Por que Brutus errou mais
uma vez?
1-3 Usos e Abusos da Estatística
Usos da EstatísticaAs aplicações da estatística se desenvolveram de tal forma que,
hoje, praticamente todo campo de estudo se beneficia da utiliza-
ção de métodos estatísticos. Os fabricantes fornecem melhores
produtos a custos menores através de técnicas de controle de
qualidade. Controlam-se doenças com auxílio de análises que
antecipam epidemias. Espécies ameaçadas são protegidas por
regulamentos e leis que reagem a estimativas estatísticas de
modificação do tamanho das populações. Visando reduzir as ta-
xas de casos fatais, os legisladores têm melhor justificativa para
leis como as que regem a poluição atmosférica, inspeções de
automóveis, utilização do cinto de segurança e da bolsa de ar, e
dirigir em estado de embriaguez. Citamos apenas esses exem-
plos, porque uma compilação completa das aplicações da esta-
tística facilmente tomaria o resto deste livro.
Alguns estudantes escolhem um curso de estatística porque é
exigido, mas um número cada vez maior o faz voluntariamente,
porque reconhecem seu valor e aplicabilidade em qualquer campo
em que pretendam trabalhar. Como os empregadores gostam de
ver um curso de estatística no currículo de um candidato, o lei-
tor que tiver estudado estatística levará vantagem ao procurar um
emprego. Afora razões relacionadas com a obtenção de empre-
go e com a disciplina, o estudo da estatística pode tornar o leitor
mais crítico em sua análise de informações, e menos sujeito a
afirmações enganosas, como as que se acham comumente asso-
ciadas a pesquisas, gráficos e médias. Como membro educado e
responsável da sociedade, o leitor deve aguçar sua capacidade
de reconhecer dados estatísticos distorcidos e de interpretar in-
teligentemente dados que se apresentem sem distorção.
Os Motoristas Mais Idosos São Mais Seguros do
que os Mais Moços?
A American Association of Retired People — AARP (Associação
Americana de Aposentados) alega que os motoristas mais idosos
se envolvem em menor número de acidentes do que os mais
jovens. Nos últimos anos, os motoristas com 16-19 anos de
idade causaram cerca de 1,5 milhão de acidentes, em
comparação com apenas 540.000 causados por motoristas com
70 anos ou mais, de forma que a alegação da AARP parece
válida. Acontece, entretanto, que os motoristas mais idosos não
dirigem tanto quanto os mais jovens. Em lugar de considerar
apenas o número de acidentes, devemos examinar também as
taxas de acidentes. Eis as taxas de acidentes por 100 milhões de
milhas percorridas: 8,6 para os motoristas com idades de 16 a
19, 4,6 para os com idade de 75 a 79, 8,9 para os com idade
de 80 a 84 e 20,3 para os motoristas com 85 anos de idade ou
mais. Embora os motoristas mais jovens tenham de fato maior
número de acidentes, os mais velhos apresentam as mais altas
taxas de acidente.
Abusos da Estatística
Não é de hoje que ocorrem abusos com a estatística. Assim é que,
há cerca de um século, o estadista Benjamin Disraeli disse: "Há
três tipos de mentira: as mentiras, as mentiras sérias e a estatísti-
ca." Já se disse também que "os números não mentem; mas os
mentirosos forjam números" (Figures don't lie; liars figure) e
que "se torturarmos os dados por bastante tempo, eles acabarão
por admitir qualquer coisa". O historiador Andrew Lang disse
que algumas pessoas usam a estatística "como um bêbado utili-
za um poste de iluminação — para servir de apoio e não para
iluminar". Todas essas afirmações se referem aos abusos da es-
tatística, quando os dados são apresentados de forma enganosa.
Alguns dos que abusam da estatística o fazem simplesmente por
descuido ou ignorância; outros, porém, têm objetivos pessoais,
pretendendo suprimir dados desfavoráveis enquanto dão ênfase
aos dados que lhes são favoráveis. Passemos a alguns exemplos
das diversas maneiras como os dados podem ser distorcidos.
Pequenas Amostras No Capítulo 6 veremos que as pequenas amos-
tras não são necessariamente más; entretanto, os resultados ob-
tidos com pequenas amostras podem por vezes ser usados como
uma forma de "mentira" estatística. As preferências de apenas
6 ESTATÍSTICA
10 dentistas por determinado dentifrício não devem servir dê base
para uma afirmação generalizada como "A pasta dentifrícia XYZ
é recomendada por 7 em cada 10 dentistas." Mesmo que a amostra
seja grande, ela deve ser não-tendenciosa e representativa da
população de onde provém. Às vezes uma amostra pode parecer
realmente grande (como em uma pesquisa com "2000 adultos
americanos escolhidos aleatoriamente"); mas se se formulam
conclusões acerca de subgrupos, como republicanos católicos do
sexo masculino, tais conclusões podem estar baseadas em amos-
tras assaz pequenas.
Números Precisos Às vezes os próprios números podem ser enga-
nosos. Uma cifra, como um salário anual de $37.735,29, pode
parecer muito precisa, introduzindo alto grau de confiança em
sua exatidão. Já a cifra $37.700,00 não infunde o mesmo senso
de precisão. Entretanto,-uma estatística com muitas casas deci-
mais não é necessariamente precisa.
Estimativas por Suposição Outra fonte de engano estatístico envol-
ve estimativas que são, na verdade, suposições (ou, na lingua-
gem popular, "palpites"), podendo apresentar erros substanciais.
E preciso considerar a fonte da estimativa e a maneira como foi
estabelecida. Quando o Papa visitou Miami, as fontes oficiais
estimaram a multidão em 250.000 pessoas, mas, utilizando fo-
tos aéreas e grades, o Miami Herald chegou a uma cifra mais
precisa de apenas 150.000.
Porcentagens Distorcidas Por vezes utilizam-se porcentagens con-
fusas ou distorcidas. Em um anúncio de página inteira, a Conti-
nental Airlines anuncia melhores serviços. No tocante ao caso
de bagagem extraviada, o anúncio afirmava que "se trata de uma
área em que já melhoramos 100% nos últimos seis meses". Em
um editorial criticando essa estatística, o New York Times inter-
pretou corretamente a melhora de 100% como significando que
agora não se extravia mais qualquer bagagem — o que ainda não
foi conseguido pela Continental Airlines.
Cifras Parciais "Noventa por cento dos carros vendidos nos EUA
nos últimos 10 anos ainda estão rodando." Milhões de consumi-
dores ouviram esta mensagem e ficaram com a impressão de que
esses carros devem ter sido muito bem construídos para durarem
tanto. O que o fabricante não mencionou foi que 90% dos carros
por ele vendidos, o foram nos últimos três anos. A alegação,
embora tecnicamente correta, era enganosa, por não apresentar
os resultados completos.
Distorções Deliberadas No livro Tainted Truth, Cynthia Crossen cita
um exemplo da revista Corporate Travei que publicou dados
mostrando que, entre as companhias locadoras de carros, a Avis
foi a vencedora em uma pesquisa junto aos locatários. Quando a
Hertz solicitou informações detalhadas sobre a pesquisa, as res-
postas desapareceram e o coordenador da pesquisa se demitiu.
A Hertz processou a Avis (por falsa propaganda baseada na pes-
quisa) e a revista; chegou-se a um acordo.
Perguntas Tendenciosas As perguntas em uma pesquisa podem ser
formuladas de modo a "sugerirem" uma resposta. Um caso fa-
moso envoj.ve o candidato à presidência dos EUA, Ross Perot,
que formulou a seguinte pergunta em um questionário: "O pre-
sidente deve ter o poder de vetar decisões do Congresso?" No-
venta e sete por cento das respostas foram "sim". Entretanto, o
percentual de respostas "sim" caiu para 57% quando a pergunta
foi "O presidente deve ter, ou não, o poder de vetar decisões do
Congresso?" Às vezes as perguntas se apresentam involunta-
riamente tendenciosas em virtude de fatores como a ordem dos
itens a serem considerados. Por exemplo, uma pesquisa alemã
formulou estas duas perguntas:
O leitor diria que o tráfego contribui em maior ou menor
grau do que a indústria para a poluição atmosférica?
O leitor diria que a indústria contribui em maior ou menor
grau do que o tráfego para a poluição atmosférica?
Quando o tráfego foi mencionado em primeiro lugar, 45% acu-
saram o tráfegoe 32% acusaram a indústria; quando a indústria
foi citada em primeiro lugar, as porcentagens se modificaram
grandemente para 24% e 57%, respectivamente.
Pesquisa do Literary Digest
Na campanha presidencial de 1936, a revista Literary Digest fez
uma pesquisa e concluiu pela vitória de Alf Landon, mas Franklin
D. Roosevelt venceu por larga margem. Maurice Bryson observa:
"Foram enviados 10 milhões de cédulas — amostra a eleitores
em potencial, mas apenas 2,3 milhões foram devolvidos. Como
todos devem saber, tais amostras são quase sempre
tendenciosas." Bryson afirma também: "As respostas voluntárias
a questionários enviados pelo correio constituem talvez o método
mais comum de coleta de dados sobre ciências sociais
encontrado pelos estatísticos, e é também talvez o pior." (Ver
Bryson, "The Literary Digest Poli: Making of a Statistical Myth",
The American Statistician, Vol. 30, N.24.)
Gráficos Enganosos Muitos dispositivos visuais.— como gráficos
em barras e gráficos em setores — podem ser utilizados para
exagerar ou diminuir a verdadeira natureza de um conjunto de
dados. (Tais recursos serão discutidos no Capítulo 2.) Os dois
gráficos da Figura 1-1 representam os mesmos dados do Bureau
of Labor Statistics (Departamento de Estatística do Trabalho),
mas a parte (b) tem como objetivo exagerar a diferença entre os
ganhos dos homens e os das mulheres. Não partindo do zero no
eixo vertical, o gráfico (b) tende a produzir uma impressão sub-
jetiva errônea. A Figura 1-1 nos dá uma lição importante. Deve-
mos analisar as informações numéricas contidas em um gráfico,
não nos deixando enganar por sua forma geral.
Pictográficos Os desenhos de objetos, chamados pictográficos, tam-
bém podem levar-nos a erro. Os objetos comumente usados para
ilustrar dados incluem sacos de dinheiro, pilhas de moedas, tan-
$750
z
.ns
E • 500
"run
E
250 ks)
-c
O
(a) (b)
Fig. 1-1 Ganhos de profissionais de tempo integral.

$754

$750 --
c
700
650 -
c
600 -
" 550-
500
Homens
$520
I- -UNA
Mulheres Homens Mulheres
Introdução À Estatística 7
ques do exército (para despesas militares), vacas (para produção •
de laticínios), barris (para produção de petróleo) e casas (para
construção). Ao desenhar tais objetos, o artista pode criar impres-
sões falsas que distorcem as diferenças. Se duplicamos o lado
de um quadrado, a área não é apenas duplicada, e sim quadrupli-
cada; duplicando cada aresta de um cubo, seu volume não é ape-
nas duplicado, e sim multiplicado por oito. Se os impostos do-
bram a cada década, um desenhista pode representar os aumen-
tos de imposto por um saco de dinheiro para o primeiro ano e
um segundo saco duas vezes mais fundo, duas vezes mais alto e
duas vezes mais largo para o segundo ano. Ao invés de aparece-
rem duplicados, os impostos se apresentarão aumentados oito
vezes; o desenho distorce, assim, a realidade.
Pressão do Pesquisador Quando se formulam perguntas a indiví-
duos pesquisados, esses freqüentemente dão respostas favoráveis
à sua auto-imagem. Em uma pesquisa telefônica, 94% dos que
responderam disseram que lavam suas mãos após usar um ba-
nheiro, mas a observação em lugares tais como a Estação Penn,
em Nova York e Golden Gate Park em San Francisco mostra-
ram que o percentual efetivo é de apenas 68%.
Más Amostras Outra fonte de estatística enganosa são os métodos
inadequados de coleta de dados. É comum um pesquisador ana-
lisar dados e formular conclusões errôneas porque o método de
coleta de dados foi deficiente.
Um exemplo típico é a pesquisa "Nightline" em que 186.000
espectadores de televisão pagaram 50 centavos para discar um
número de telefone "900" dando sua opinião sobre se a sede das
Nações Unidas deve permanecer nos EUA. Os resultados mos-
traram que 67% dos que foram consultados eram favoráveis a
que a sede da ONU saísse dos EUA. No começo deste capítulo
perguntamos- o que se poderia concluir quanto à opinião geral da
população sobre a permanência da ONU nos EUA. Como os
. próprios espectadores é que decidiram se seriam incluídos na
pesquisa, temos um exemplo de pesquisa auto-selecionada, que
se define como segue.

DEFINIÇÃO
Uma pesquisa auto-selecionada é uma pesquisa em que
os próprios entrevistados decidem se serão incluídos.
Em tais pesquisas, o que freqüentemente ocorre é que participam
apenas aqueles que têm uma opinião firmada, resultando daí que
a amostra dos que respondem não é representativa da população
como um todo. Como 67% dos 186.000 pesquisados eram favo-
ráveis à mudança da sede da ONU dos EUA, nada podemos con-
cluir sobre a população em geral, dada a maneira como se ob- 7
teve a amostra. Na realidade, Ted Koppel reportou que uma pes-
quisa "científica" de 500 pessoas revelou que 72% delas deseja-
vam que a sede da ONU permanecesse nos EUA. Nessa pesqui-
sa de 500 pessoas, os que responderam foram selecionados ale-
atoriamente pelo pesquisador, de modo que o resultado tende
muito mais a refletir a verdadeira opinião da população em ge-
ral.
Uma pesquisa auto-selecionada é apenas uma das maneiras
como o método de coleta de dados pode ser seriamente prejudi- 8.
cado. Em vista de sua importância, dedicaremos a próxima se-
ção ao método de amostragem ou coleta de dados.

•
Qual a renda anual após o corte de 10%?
Com base na renda anual da parte a, determine a renda anual
após o aumento de 10%. O corte de 10% seguido do aumento
de 10% restituem à funcionária o salário original de $40.000?
A revista Glamour publicou o seguinte resultado de uma pesqui-
sa: "Setenta e nove por cento dos que responderam à nossa pes-
quisa de agosto afirmaram crer que os americanos se tornaram
demasiadamente propensos a apelar para a justiça em casos corri-
queiros." A questão foi publicada na revista e os leitores podiam
responder pelo correio, fax ou e-mail ( Tellus@Galamour . com).
Até que ponto é válido o resultado de 79%?
ADT Security Systems advertiu que "quando você sai de férias, os
ladrões começam a agir". O anúncio afirmava que "de acordo com
estatísticas do FBI, mais de 26% dos assaltos a residências ocor-
riam entre o Memorial Day [feriado que homenageia os soldados
mortos na guerra] e o Dia do Trabalho". Em que ponto essa afir-
mação é enganosa?
Em um estudo sobre crimes cometidos no campus de uma univer-
sidade por estudantes sob efeito do álcool ou dai drogas, foram
pesquisados 1.875 estudantes. Um artigo no USA Today notou:
"Oito por cento dos estudantes que respondem anonimamente afir-
mam ter cometido um crime no campus. E 62% desse grupo di-
zem ter agido sob a influência do álcool ou das drogas." Supondo
que o número de estudantes que responderam anonimamente seja
de 1.875, quantos efetivamente cometeram um crime no campus
sob a influência do álcool ou das drogas?
Um estudo realizado pelo Insurance Institute for Ilighway Safety
(Instituto de Segurança nas Rodovias) constatou que o Chevrolet
Corvette acusa o mais elevado índice de acidentes fatais — "5,2
Os exemplos precedentes constituem uma pequena amostra
das maneiras como a estatística pode ser utilizada de forma en-
ganosa. Livros inteiros têm sido dedicados a esse assunto, inclu-
sive o clássico How to Lie with Statistics, de Darrell Huff, The
Figure Finaglers, de Robert Reichard, e Tainted Truth, de
Cynthia Crossen. O entendimento de tais práticas será de grande
auxílio na avaliação dos dados estatísticos encontrados em situ-
ações cotidianas.
1-3 Exercícios A: Habilidades e
Conceitos Básicos
Uma pessoa foi encarregada de pesquisar o reconhecimento da
marca Nike, devendo contactar por telefone 1500 consumidores nos
EUA. Por que razão é incorreta a utilização de listas telefônicas
como população para fornecer a amostra?
Setenta e dois por cento dos americanos espremem o tubo de den-
tifrício a partir da parte superior. Essa observação, assim como
outras também não muito sérias, é apresentada em The First Really
Important Survey of American Habits (aprimeira pesquisa realmen-
te importante dos hábitos dos americanos). Esses resultados se
baseiam em 7000 respostas a 25.000 questionários enviados pelo
correio. Qual o lado errado dessa pesquisa?
Um relatório patrocinado pela Florida Citrus Commission concluiu
que os níveis de colesterol podem ser reduzidos mediante ingestão
de produtos cítricos. Por que razão a conclusão poderia ser suspeita?
Uma•funcionária tem um salário anual de $40.000, mas é informa-
da de que terá uma redução de 10% no pagamento em virtude do
declínio dos lucros da companhia. É informada também de que no
próximo ano terá um aumento de 10%. A situação não se afigura
tão má, porque a redução de 10% parece ser compensada pelo au-
mento de 10%.
$1864,8,
Milhões
$1483,3
Milhões
$983,5
Milhões
$643,3
Milhões
1 2 3

4
Ano
8 ESTATÍSTICA
mortes para cada 10..000". O carro com menor índice cle'kcidéiités
fatais foi o Volvo, com apenas 0,6 morte por 10.000. Significa isto
que o Corvette não é tão seguro quanto o Volvo?
O jornal Newport Chronicle afirma que as mães grávidas podem
aumentar suas chances de ter unr bebê sadio comendo lagostas. A
alegação se baseia em um estudo mostrando que as crianças nas-
cidas de mães que comem lagostas têm menos problemas de saú-
de do que as nascidas de mães que não comem lagostas. Qual é o
erro nesta alegação?
Uma pesquisa inclui o seguinte item: "Registre sua altura em po-
legadas." Com isso pretende-se obter e analisar as alturas dos que
respondem. Identifique os dois problemas neste item.
"De acordo com uma pesquisa de âmbito nacional feita por 250
agências de empregos, os sapatos gastos constituem o motivo mais
comum para que um homem que procura emprego não cause boa
impressão à primeira vista." Os jornais apresentavam essa alega-
ção com base em uma pesquisa encomendada pela Kiwi Brands,
produtores de graxa para sapatos. Faça um comentário sobre a ra-
zão por que os resultados de tal pesquisa podem ser questionados.
Em um suplemento de propaganda inserido no Time, os aumentos das
despesas com o combate à poluição foram ilustrados em um gráfico
como o que aparece a seguir. O que está errado com a figura? •
1-4 Planejamento de Experimentos
Os estudos que utilizam métodos estatísticos vão desde os que
são bem concebidos e executados, dando resultados confiáveis,
aos que são concebidos deficientemente e mal executados, levan-
do a conclusões enganosas e sem qualquer valor real. Eis alguns
pontos importantes para o planejamento de um estudo capaz de
produzir resultados válidos:
Identificar com precisão a questão a ser respondida e definir
com clareza a população de interesse.
Estabelecer um plano para coleta de dados. Esse plano deve
descrever detalhadamente a realização de um estudo obser-
vacional ou de um experimento (ambos definidos a seguir),
e deve ser elaborado cuidadosamente, de modo que os da-
dos coletados representem efetivamente a população em
questão.
Coletar os dados. Devemos ser extremamente cautelosos, para
minimizar os erros que podem resultar de uma coleta tenden-
ciosa de dados.
Analisar os dados e tirar conclusões. Identificar também pos-
síveis fontes de erros.
1-3 Exercícios E: Além do Básico
Um artigo no New York Times afirmou que a duiação média da vida
de 35 regentes de orquestra do sexo masculino era de 73,4 anos, em
contraste com a média de 69,5 anos para a população masculina em
geral. A vida mais longa foi atribuída a fatores como satisfação pes-
soal e motivação. Há uma falha fundamental na conclusão de que os
regentes de orquestra do sexo masculino vivem mais. Qual é?
Um pesquisador do Sloan-Kettering Cancer Research Center foi
criticado certa vez por adulterar dados. Entre seus dados estavam
cifras obtidas de seis grupos de ratos, com 20 ratos em cada gru-
po. Foram dados os seguintes valores como porcentagens de su-
cesso: 53%, 58%, 63%, 46%, 48%, 67%. O que está errado?
Procure identificar as quatro maiores falhas no seguinte. Um jor-
nal realizou uma pesquisa solicitando a resposta dos leitores a esta
pergunta: "Você apóia o desenvolvimento de armas atômicas que
poderiam matar milhões de pessoas inocentes?" Relata-se qué 20
leitores responderam, 87% com "não" e 13% com "sim".
Um editorial do New York Times criticou um anúncio que alegava
que determinado anti-séptico bucal "reduzia em mais de 300% as
placas nos dentes".
Removendo-se 100% de uma quantidade, quanto resta?
Que significa reduzir as placas em mais de 300%?
Os estudos que requerem métodos estatísticos decorrem tipi-
camente de duas fontes comuns: estudos observacionais e expe- •
rimentos.
DEFINIÇÕES
Em um estudo observacional, verificamos e medimos
características específicas, mas não tentamos manipular ou
modificar os elementos a serem estudados.
Em um experimento, aplicamos determinado tratamento
e passamos então a observar seus efeitos sobre os elemen-
tos a serem pesquisados.
Por exemplo, um estudo observacional pode envolver uma
pesquisa de cidadãos para determinar que porcentagem da po-
pulação é a favor do registro de armas de fogo. Um experimento
pode envolver o tratamento com um remédio ministrado a um
grupo de pacientes a fim de determinar sua eficiência na cura.
No caso da arma de fogo, coligimos dados sem modificar as
pessoas a serem pesquisadas; já o tratamento por um remédio
envolve a modificação das pessoas.
Os experimentos bem planejados costumam envolver um gru-
po a quem é dado um tratamento particular (chamado grupo de
tratamento) e um segundo grupo de controle ao qual não se ad-
ministra o tratamento. Por exemplo, o experimento sobre pólio
realizado em 1954 envolveu um grupo de tratamento de crian-
ças em quem foi injetada a vacina Salk, e um grupo de controle
de crianças que recebeu um remédio neutro (placebo). Em ex-
perimentos deste tipo, ocorre um efeito placebo quando um in-
divíduo não tratado acredita estar recebendo o tratamento e ale-
ga uma melhora nos sintomas. O efeito placebo pode ser contra-
balançado fazendo-se um experimento cego, uma técnica em que
o indivíduo não sabe se está recebendo o tratamento ou um pla-
cebo. O experimento sobre pólio foi do tipo duplo-cego, em que
as crianças que recebiam a injeção não sabiam se estavam rece-
bendo a vacina Salk ou um placebo, e os médicos que davam a
injeção e avaliavam os resultados também não sabiam.
Introdução à Estatística 9
As Pesquisas Políticas Crescem
Em "Consulting the Oracle", um artigo para o U.S. News and
World Report, o autor Stephen Budiansky escreve que o
Presidente Kennedy encomendou 16 pesquisas em seus três anos
de mandato, Nixon encomendou 233 pesquisas em seus seis
anos, e Clinton encomendou entre 100 e 150 pesquisas em seus
primeiros 2,5 anos. As 'Pesquisas de Clinton custaram entre
$30.000 e $45.000 coda uma, o que dá um custo de $30 por
pessoa. Budiansky relata que a pesquisa é complicada por
máquinas de resposta e por pessoas que se recusam a cooperar,
mas as boas pesquisas incluem tentativas repetidas para obter
respostas dos que não estão em casa ou se recusam a
responder. Não levar em conta os que não respondem pode
resultar em uma amostra que não represente adequadamente a
população.
Ao planejar um experimento para testar a eficiência de um ou
mais tratamentos, devemos ter o cuidado de atribuir as unidades
experimentais (ou indivíduos) aos diferentes grupos de tal modo
que esses grupos sejam bem semelhantes. (Tais grupos semelhan-
tes de unidades experimentais são chamados blocos.) Uma abor-
dagem eficiente consiste em utilizar um planejamento experimen-
tal completamente aleatorizado, que exige que as unidades ex-
perimentais sejam divididas em diferentes grupos mediante um
processo de seleção aleatória. Assim é que tal planejamento pode
envolver a atribuição aleatória de pessoas a um grupo tratado com
aspirina e a um grupo de controle que não é tratado. Outro pro-
cesso consiste em utilizar um planejamento controlado rigoro-
samente, com unidadesexperimentais' escolhidas cuidadosamen-
te, de modo que os diferentes grupos (ou blocos) sejam tão se-
melhantes quanto possível. Com um planejamento rigorosamente
controlado, podemos tentar formar grupos de tratamento e de
controle que incluam pessoas semelhantes em idade, peso, pres-
são sanguínea etc. É importante também considerar a replica ção,
que exige tamanhos de amostra suficientemente grandes que re-
duzam os efeitos da variação amostra! aleatória. O experimento
com a pólio foi um planejamento experimental completamente
aleatorizado, porque os indivíduos em ambos os grupos, de tra-
tamento e de controle, foram selecionados aleatoriamente. Incor-
porou a replicação incluindo números muito grandes (200.000)
de indivíduos em cada grupo.
Na realização de experimentos, os resultados por vezes são
comprometidos pelo confundimento.
DEFINIÇÃO
Ocorre o confundimento quando os efeitos de duas ou
mais variáveis não podem distinguir-se uns dos outros.
Por exemplo, se estamos realizando um experimento para testar
a eficiência de um novo retardante no incêndio em uma sarça, e
repentinamente começa a chover, ocorre o confundimento por-
que é impossível distinguir entre o efeito do retardante e o efeito
da chuva.
Um dos erros mais graves consiste em uma forma inadequa-
da de coleta de dados. Nunca é demais enfatizarmos este impor-
tante ponto:
Dados coletados de forma descuidada podem ser tão
inúteis que nenhum processamento estatístico
consegue salvá-los.
Notamos na Seção 1-3 que uma pesquisa auto-selecionada é uma
pesquisa em que as próprias pessoas decidem se vão responder
ou não. As pesquisas auto-selecionadas são muito comuns, mas
seus resultados em geral não têm utilidade para fazer inferências
válidas sobre toda uma população.
Passamos agora a definir e descrever os cinco métodos mais
comuns de amostragem.
DEFINIÇÃO
Em uma amostra aleatória, os elementos da população
são escolhidos de tal forma que cada um deles tenha igual
chance de figurar na amostra. (Escolhe-se uma amostra
aleatória simples de n elementos, de maneira que toda a
mostra de tamanho n possível tenha a mesma chance de
ser escolhida.)
As amostras aleatórias podem ser escolhidas por diversos mé-
todos, inclusive a utilização de tabelas de números aleatórios e
de computadores para gerar números aleatórios. Com a amos-
tragem aleatória, espera-se que todos os grupos da população
sejam representados na amostra de forma aproximadamente
proporcional. Uma amostragem descuidada pode facilmente
resultar em uma amostra tendenciosa, com características as-
saz diferentes das da população que a originou. Em contrapar-
tida, a amostragem aleatória é cuidadosamente planejada para
evitar qualquer tendenciosidade. Por exemplo, a utilização de
catálogos telefônicos elimina automaticamente todos aqueles
cujos telefones não figurem no catálogo, e a exclusão desse
segmento da população pode facilmente conduzir a resultados
falsos. Em Los Angeles, por exemplo, 42,5% dos números de
telefones não estão no catálogo (com base em dados da Survey
Sampling, Inc.). Os pesquisadores costumam contornar esse
problema utilizando computadores para gerar números de te-
lefone, de modo que todos os números sejam possíveis. Eles
devem também ter o cuidado de incluir os que inicialmente não
foram encontrados ou se recusaram a responder. A Companhia
de Pesquisas Harris constatou que a taxa de recusa para entre-
vistas telefônicas é em geral de 20%, no mínimo. O fato de
ignorarmos os que inicialmente se recusam a responder pode
concorrer para que nossa amostra seja tendenciosa.
DEFINIÇÃO
Com a amostragem estratificada, subdividimos a popu-
lação em, no mínimo, duas subpopulações (ou estratos) que
compartilham das mesmas características (como sexo) e,
em seguida, extraímos uma amostra de cada estrato.
Em uma pesquisa sobre a Emenda Constitucional da Igualda-
de de Direitos, poderíamos utilizar o sexo como base para a
criação de dois estratos. Após obter uma relação dos homens e
uma relação das mulheres, aplicamos um método conveniente
(como a amostragem aleatória) para escolher determinado nú-
mero de elementos de cada relação. Quando os diversos estra-
tos têm tamanhos amostrais que refletem a população global,
temos o que se chama amostragem proporcional. No caso de
alguns estratos não serem representados na proporção adequa-
DEFINIÇÃO
Na amostragem por conglomerados, começamos divi-
dindo a área da população em seções (ou conglomerados);
em seguida escolhemos algumas dessas seções e, finalmen-
te, tomamos todos os elementos das seções escolhidas.
10 ESTATÍSTICA
da, então os resultados poderão ser ajustados ou pondérados
convenientemente.
Para um tamanho fixo de amostra, se escolhemos aleatoria-
mente elementos de diferentes estratos, temos chance de obter
resultados mais consistentes (e menos variáveis) do que com a
simples escolha de uma ali-Risca aleatória de toda a população.
Por essa razão, costuma-se usar a amostragem estratificada para
reduzir a variação nos resultados.
DEFINIÇÃO
Na amostragem sistemática, escolhemos um ponto de
partida, e selecionamos cada k-ésim° elemento (como por
exemplo cada 50.° elemento) da população.
Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre
seus 107.000 empregados, poderia partir de uma relação com-
pleta dos mesmos e selecionar cada 100.0 empregado, obtendo
urna amostra de 1.070 elementos. Esse método é simples e utili-
zado com freqüência. .
Uma diferença importante entre a amostragem por conglomera-
dos e a amostragem estratificada é que a amostragem por con-
glomerados utiliza todos os elementos dos conglomerados sele-
cionados, enquanto a amostragem estratificada utiliza uma amos-
tra de membros de cada estrato. Pode-se encontrar um exemplo
de amostragem por conglomerado em uma pesquisa pré-eleitoral,
onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos
todos os elementos de cada uma das zonas escolhidas. Esse méto-
do é muito mais rápido e menos dispendioso do que a escolha de
um indivíduo de cada uma das inúmeras zonas da área popu-
lacional. Os resultados podem ser ajustados ou ponderados para
corrigir qualquer representação desproporcionada de grupos. A
amostragem por conglomerados é extensamente utilizada pelo
governo e por organizações particulares de pesquisa.
Meta-análise
O termo meta-análise se refere a uma técnica de estudo que,
essencialmente, combina os resultados de outros estudos. Tem a
vantagem de permitir que amostras menores separadas sejam
combinadas em uma única amostra grande, tornando mais
significativos os resultados globais. Tem também a vantagem de
utilizar um trabalho já feito. Por outro lado, tem a desvantagem
de ser apenas tão boa quanto o tenham sido os estudos básicos.
Se esses estudos apresentam falhas, pode ocorrer o fenômeno
"garbage in, garbage out" (N. do T.: "O que sai é tão bom
como o que entra.") A utilização da meta-análise é de uso
corrente em pesquisas médicas e psicológicas. Um exemplo:
"Reversal of Left Ventricular Hypertrophy in Essential
Hypertension: A Meta-analysis of Randomized Double-blind
Studies", por Schmieder, Marius e Klingbeil, Joumal of the
American Medical Association, Vol. 275, No.19.
DEFINIÇÃO
Na amostragem de conveniência, simplesmente utiliza-
mos resultados que já estão disponíveis.
Em alguns casos, os resultados da amostragem de conveniên-
cia podem ser assaz bons, mas em outros casos podem apresentar
séria tendenciosidade. Ao fazer uma pesquisa sobre pessoas ca-
nhotas, seria conveniente um estudante pesquisar seus próprios
colegas de classe, porque estão ao seu alcance imediato. Mesmo
que tal amostra não seja aleatória, os resultados devem ser bem
satisfatórios. Em contrapartida, poderia ser muito conveniente (e
talvez mesmo lucrativo) para a ABC News fazer uma pesquisa
pedindo aos espectadores que liguem para um número de telefone
"900" para registrar suas opiniões, mas essa pesquisa seriaauto-
selecionada e os resultados seriam provavelmente tendenciosos.
A Figura 1-2 ilustra os cinco métodos mais comuns de amos-
tragem que acabamos de descrever. Essas descrições pretendem
ser breves e gerais. O conhecimento aprofundado desses diver-
sos métodos, que permita sua utilização com proveito, exige um
estudo muito mais extenso, que ultrapassa o nível de um curso
introdutório. Para manter esta seção em perspectiva, notemos que
este texto fará referência freqüente a dados "selecionados alea-
toriamente", o que significa que os dados foram selecionados de
modo que todos os elementos da população têm a mesma chan-
ce de serem escolhidos. Conquanto não façamos referência fre-
qüente aos outros métodos de amostragem, devemos ter consci-
ência de que eles existem, e que o método de amostragem exige
planejamento e execução cuidadosos. Os métodos apresentados em
todo este texto dependem de amostras que tenham sido obtidas
cuidadosamente. Além disso, o tamanho da amostra deve sempre
ser suficientemente grande para os propósitos em vista. (Os pro-
blemas de tamanho da amostra são abordados mais adiante, espe-
cialmente no Capítulo 6.) Muitas pessoas acreditam que as gran-
des amostras são sempre boas, mas mesmo essas podem ser total-
mente desprovidas de valor, se os dados tiverem sido coletados de
maneira negligente. Finalmente, se estamos medindo uma carac-
terística (como altura) de um conjunto de indivíduos, podemos
obter resultados mais precisos se fizermos nós mesmos as medi-
das, em vez de pedirmos aos indivíduos que indiquem os valores.
Este último procedimento pode resultar em um número despro-
porcionado de resultados arredondados, assim como muitos resul-
tados que refletem valores desejados em lugar de valores efetivos.
Não importa quão bem planejemos e executemos o processo
de coleta de amostras, há sempre a possibilidade de um erro nos
resultados. Como exemplo, escolha aleatoriamente 1000 adul-
tos e pergunte a eles se têm o curso secundário completo, regis-
trando a porcentagem de respostas "sim". Escolhido um outro
grupo de 1000 indivíduos, é provável que se obtenha uma por-
centagem amostral diferente.
DEFINIÇÕES
Um erro amostral é a diferença entre um resultado amos-
tral e o verdadeiro resultado populacional; tais erros resul-
tam de flutuações amostrais aleatórias.
Ocorre um erro não-amostral quando os dados amostrais
são coletados, registrados ou analisados incorretamente.
Tais erros resultam de um erro que não seja uma simples
'Amostragem de Conveniência
Utilizar resultados de fácil acesso. ~WARM
I
Introdução à Estatística 11
Amostragem Aleatória
Cada elemento da população
tem a mesma chance de ser
escolhido. Em geral utilizam-se
computadores para gerar
números de telefone aleatórios.
Amostragem Estratificada
Classificar a pop. ulação em, ao
menos, dois estratos e extrair
uma amostra de cada um.
Is ,

Amostragem Sistemática
Escolher cada elemento de
ordem k.
Amostragem por Conglomerado
Dividir em seções a área populacional,
selecionar aleatoriamente algumas
dessas seções e tomar todos
os elementos das mesmas.
Fig. 1-2 Métodos comuns de amostragem.
flutuação amostral aleatória, como a escolha de uma amos-
tra não-aleatória e tendenciosa, a utilização de um instru-
mento de mensuração defeituoso, uma questão formulada
de modo tendencioso, um grande número de recusas de
resposta ou a cópia incorreta dos dados amostrais.
Se extrairmos uma amostra cuidadosamente, de forma que
ela represente realmente a população, podemos aplicar os mé-
todos descritos neste livro para analisar o erro amostra!, mas
devemos ter o máximo cuidado em minimizar os erros não-
amostrais.
Hawthorne e os Efeitos do Experimentador
O bem conhecido efeito placebo ocorre quando um indivíduo não
tratado acredita incorretamente que está recebendo um tratamento
real e reporta uma melhora dos sintomas. O efeito Hawthorne
ocorre quando indivíduos tratados respondem de maneira um tanto
diferente, simplesmente porque são partes de um experimento.
(Esse fenômeno foi chamado "efeito Hawthorne" porque foi
observado pela primeira vez em um estudo levado a efeito em
operários cia fábrica da Western Electric, em Hawthorne.) Ocorre
um efeito de experimentador (às vezes chamado efeito Rosenthall)
quando o pesquisador ou experimentador involuntariamente
influencia o indivíduo pesquisado, através de fatores como
expressão facial, tom de voz ou atitude.
12 ESTATÍSTICA
1-4 Exercícios A: Habilidades e
Conceitos Básicos
Nos Exercícios 1-4, determine se a descrição dada corresponde
a um estudo observacional ou a um experimento.
Mede-se o conteúdo de alcatrão, nicotina e monóxido de carbono
em diferentes marcas de cigarro (conforme Conjunto de Dados 4
no Apêndice B).
Pede-se a fumantes que reduzam à metade o número de cigarros
consumidos diariamente, para que se possam medir os efeitos so-
bre a freqüência de pulsação.
Em uma turma de educação física, estuda-se o efeito dos exercí-
cios físicos sobre a pressão sanguínea, determinando-se que meta-
de dos estudantes ande uma milha cada dia, enquanto a outra me-
tade corra uma milha diária.
Estuda-se a relação entre os pesos de ursos e seus comprimentos,
tomando-se as medidas em ursos anestesiados.
Nos Exercícios 5-16, identifique o tipo de amostragem utiliza-
do: aleatória, estratificada, sistemática, por conglomerado ou
de conveniência.
Quando escreveu Women and Love: A Cultural Revolution, a au-
tora Shere Hite baseou suas conclusões em 4.500 respostas a
100.000 questionários distribuídos a mulheres.
Um psicólogo da Universidade de Nova York faz uma pesquisa
sobre todos os estudantes de cada uma de 20 turmas selecionadas
aleatoriamente.
Um sociólogo na Universidade de Charleston seleciona 12 homens
e 12 mulheres de cada uma de quatro turmas de inglês.
A empresa Sony seleciona cada 200.0 CD de sua linha de produção
e faz um teste de qualidade rigoroso.
Um cabo eleitoral escreve o nome de cada senador dos EUA. em
cartões separados, mistura-os e extrai 10 nomes.
O gerente comercial da America Online testa uma nova estratégia
de vendas selecionando aleatoriamente 250 consumidores com
renda inferior a $50.000 e 250 consumidores com renda de ao
menos $50.000.
O programa Planned Parenthood (Planejamento Familiar) pesquisa
500 homens e 500 mulheres sobre seus pontos de vista sobre o uso
de anticoncepcionais.
Um pesquisador de mercado da American Airlines entrevista todos
os passageiros de cada um de 10 vôos selecionados aleatoriamente.
Um pesquisador médico da Universidade Johns Hopkins entrevis-
ta todos os portadores de leucemia em cada um de 20 hospitais
selecionados aleatoriamente.
Um repórter da revista Business Week entrevista todo 50.0 gerente
geral constante da relação das 1000 empresas com maior cotação
de suas ações.
Um repórter da revista Business Week obtém uma relação nume-
rada das 1000 empresas com maiores cotações de ações na bolsa,
utiliza um computador para gerar 20 números aleatórios e então
entrevista os gerentes gerais das empresas correspondentes aos
números extraídos.
Ao fazer uma pesquisa para um noticiário vespertino de Boston,
um repórter da NBC entrevista 15 pessoas que saem do auditório
da IRS.
1-4 Exercícios B: Além do Básico
Aberta e fechada são dois tipos de questões de uma pesquisa. Uma
questão aberta permite uma resposta livre, enquanto uma questão
fechada comporta apenas uma resposta fixa. Alguns exemplos
baseadoá em pesquisas Gallup.
Questão aberta: Na opinião do leitor, que se pode fazer para redu-
zir o crime?
Questão fechada: Qual das seguintes medidas más contribuiria para
a redução da criminalidade?
Contratar mais policiais.
Fazer com que os pais eduquem melhor os filhos.
Melhorar as condições sociais e econômicas nas favelas.
Ampliar os esforços para reabilitação nas cadeias.
Aplicar sentenças mais severas aos criminosos.
Reformar os tribunais.
1-5 Estatística com Calculadorase
Computadores
Um subproduto importante do programa espacial dos EUA é a
invenção do chip de microprocessador — uma invenção que teve
profunda influência na aplicação da estatística. A instalação de
chips de microprocessador em calculadoras e computadores eli-
minou a tremenda tarefa de cálculos monótonos, tornando o uso
da estatística mais acessível a muitas pessoas. Descreveremos
brevemente, nesta seção, o papel das calculadoras e dos compu-
tadores na estatística.
Calculadoras
Os estudantes de estatística cedo descobrem que uma calculado-
ra é um de seus melhores auxiliares. Além de ter as operações
básicas (+, —, x, ±, etc.), muitas calculadoras apresentam
hoje recursos estatísticos especiais, como média, desvio-padrão
e resultados de correlação/regressão. (Esses tópicos serão abor-
dados em capítulos posteriores.) Além de possibilitar o cálculo
de expressões complicadas e de certas operações estatísticas,
algumas calculadoras também permitem a introdução e armaze-
nagem de programas especiais a serem utilizados durante todo o
curso. A 11-83 da Texas Instruments é um excelente exemplo
de calculadora perfeitamente adaptável a um curso introdutório
de estatística. E programável, pode exibir gráficos e tem não
poucas funções estatísticas especiais incluídas.
Existe um disco separado com programas escritos para a TI-
82 e 11-83, e esses programas podem ser transferidos de um com-
putador para a calculadora. Alguns professores de estatística
exigem que todos os seus alunos utilizem uma calculadora TI-
83, outros exigem qualquer calculadora que processe estatística
bivariada e outros finalmente aceitam o uso de qualquer calcu-
ladora. Para o estudante que ainda não tem uma calculadora, re-
comenda-se uma que seja capaz de processar estatística de duas
variáveis. Qualquer que seja a calculadora escolhida, o manual
que a acompanha é um guia valioso. Em caso de dúvida, consul-
Quais são as vantagens e as desvantagens das questões aber-
tas?
Quais as vantagens e as desvantagens das questões fecha-
das?
Que tipo é mais fácil de analisar com processos estatísticos
formais? Por quê?
i 18. Descreva detalhadamente um método que poderia ser usado para
obter uma amostra aleatória simples das alturas de cinco alunos de .
sua turma de estatística.
Introdução à Estatística 13
te o manual e procure fazer os exemplos apresentados. Se ainda
assim tiver dificuldade, recorra ao seu professor.
Computadores
O computador desempenha hoje papel relevante em quase todos
os aspectos da análise estatística. A ampla diversidade de com-
putadores e pacotes de software possibilitou a utilização da es-
tatística por pessoas com diferentes tipos de formação matemá-
tica, mas também criou maior oportunidade de uso indevido da
estatística. É importante reconhecer que tanto os pacotes de soft-
ware como os computadores têm uma limitação muito séria: eles
seguem cegamente as instruções, ainda que inadequadas ou
mesmo absurdas. O computador não raciocina, e não pode for-
mular julgamentos. A compreensão dos princípios da estatística
é pré-requisito importante para a correta interpretação de resul-
tados obtidos por computador. Mesmo que o leitor não venha a
usar efetivamente os computadores neste curso, deve procurar
desenvolver habilidade em interpretar resultados de análise es-
tatística obtidos em um computador, como os que ocorrem em
todo este texto.
Faremos referência freqüentemente a dois pacotes em parti-
cular O STATDISK e Minitab. O STATDISK apresenta uma
vantagem importante: é um programa fácil de ser usado. O
Minitab já é um pacote estatístico de nível mais elevado, mas
também é de utilização relativamente fácil.
Com o STATDISK e o Minitab, os programas são escolhidos
de uma barra de ferramentas no topo da tela, como segue:
STATDISK: File Edit Analysis Data Help
Minitab:
File Edit Manip Calc Stat Graph Editor Window
Help
Utilizando STATDISK ou Minitab, podemos familiarizar-nos
melhor com a operação geral de um computador. Os exemplos
que seguem ilustram alguns aspectos básicos de STATDISK e
Minitab:
Para introduzir um novo conjunto de dados:
STATDISK: Selecionar Data da barra de ferramentas e es-
colher então a opção sampl e Editoi'.
Minitab: Selecionar File da barra principal e escolher
então a opção New Worksheet.
Para salvar e nomear um conjunto de dados:
STATDISK Selecionar File da barra principal e escolher
então a opção seve As.
Minitab: Selecionar File da barra principal e escolher
então a opção Seve Worksheet
As...
Para abrir um arquivo de dados previamente armazenado:
STATDISK: Selecionar File da barra principal e escolher
então a opção Open.
Minitab: Selecionar File da barra principal e escolher
então a opção Open Worksheet.
Para imprimir resultados:
STATDISK: Selecionar File da barra principal e escolher
a opção Print.
Minitab: Selecionar File da barra principal e escolher
a opção Print Window.
Para sair do programa:
STATDISK: Selecionar File da barra principal e escolher
então a opção Quit.
Minitab: Selecionar File da barra principal e escolher
então a opção Exit.
STATDISK e Minitab são ambos capazes de realizar quase to-
das as operações importantes abordadas neste livro.
Apresentamos apenas algumas características de STATDISK
e Minitab, mas a utilização desses programas é abordada com
maior detalhe em STATDISK Student Laboratory Manual and
Workbook (7.° edição) e em Minitab Student Laboratory Manu-
al and Workbook (7.a edição). As características e a apresenta-
ção de alguns resultados dados por esses programas são também
discutidos em todo este livro, sempre que adequado.
Alguns professores de estatística preferem outros pacotes
Como SPSS, SAS, BMDP, Execustat, Systat, Mystat ou
Statgraphics. Qualquer que seja o pacote escolhido, o estudante
sempre se beneficiará, melhorando seus conhecimentos em uma
área que se tornou tão importante.
Deixe o Computador Ligado
Algumas pessoas costumam desligar o computador logo após o
término de determinada tarefa, enquanto outras deixam-no
ligado até que não precisem mais utilizá-lo naquele dia. O
painel de circuitos e os chips do computador sofrem com esses
ciclos de liga/desliga. Mas o monitor pode se danificar quando
a mesma imagem é deixada na tela por períodos de tempo
muito longos. O tempo médio entre interrupções (MTBF = Mean
Time Between Failures) para o disco rígido já foi de 5000 horas,
mas hoje é de cerca de 30.000 horas. Considerando os efeitos
danosos dos ciclos on/off sobre o painel de circuitos e os chips
do computador, e o grande MTBF para discos rígidos, faz
sentido deixar o computador ligado até o fim do dia, desde que
a tela do monitor possa ser protegida utilizando-se um
programa para descansar a tela. Muitas pessoas utilizam essa
estratégia, que se originou em parte de uma análise estatística
de eventos passados.
1-5 Exercícios A: Habilidades e
Conceitos Básicos
Exercícios iniciais com calculadora: Nos Exercícios 1-8, as ex-
pressões apresentadas são análogas às que se encontram em
diferentes partes do livro. Utilize sua calculadora para obter os
valores indicados.
3 44

1 + 2,67 + 2,09 + 1,87 + 3,11

. '
5
2. \I(2 — 5)2 + (4 — 5)2 + (9 — 5)2
3 — 1
3 \13(101 ) — 152
6
00000001
00000002
00000003
00000004
00000005
00000006
00000007
00000008
00000009
00000010
00000011
00000012