Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
'- ' -~~~~~----~ "<~-~~~ ·-· RavyC\.V\e ~<:oWo...~ - fJ SrÉTUMA !EDBÇÃO MA IO F~ TRIOLA Tradução Alfredo Alves de Farias Professor Adjunto/ UFMG Revisão técnica Eliana Farias e Soares, Ph.D. Profes~ora Adj\mta I UFMG com a colabonlçâo de Vera Regina L. JF. Flores, M. Se. Professora Adjunta I UFMG 1: EDITORA -' \ lntrodu(ão à Estaitistica ; 1-1 Aspectos Gerais Define-se o termo estatisticajuntarnente com os termos população, amostra, parâmetro e estatística (segundo significado). 1-2 Natureza dos Dados Definem-se os dados quantitativos e os dados qualitativos juntamente com dados discretos e dados contínuos. Deünem-se também os quatro níveis de mensuração (nominal, ordinal, intervalar e razão). ' .. 1-3 Usos e Abusos da Estatística Apresentan1-se exemplos de utilização benéfica da estatística e, ao mesmo tempo, algumas formas e)ll que a estatística é usada para enganar. A utilização incorreta inclui pequenas amostras, números precisos, percentagens distorcidas, questões tendenciosas, gráficos enganosos e amostras mal extraídas. 1-4 Pla neja mento de Experimentos Descrevem-se estudos observacionais e experimentos, juntamente com uma boa metodologia estatística. Dá-se ênfase à importância de uma boa amostragem. Definem- se e descrevem-se diversos métodos de amostragem, inclusive amostragem aleatória, amostragem estratilicada, amostragem sistemática, amostragem por conglomerados e amostragem de conveniência. l -5 Estatística com Calculadoras e Computadores Discute-se a importância das calculadoras e dos computadores. A utilização das calculadoras é abordada em conjunto com pacotes STATDISK e Minitab. ......._ .... ~ ·- . j '"' ...... o:o.= ., - ~ Problema do Capítulo Que podemos concluir desta pesquisa? O programa de televisão ABC-Nightline reaiizou uma pesquisa em que solicitava a opinião dos espect adores sobre a permanência. ou não. da sede das Nações Unidas nos EUA. Para responder, os espectadores deviam pagar 50 centavos (americanos) para fazer uma chamada telefónica. Dos 186.000 que responderam, 67% disseram que a sede da ONU devia sair dos EUA. Com base nesses resultados amostrais, que podemos concluir sobre a opinião da população amer·icana, sobre a permanência ou não da sede da ONU nos EUA? 1-1 Aspectos Gerais Começamos nosso estudo Lle estalíslica observando que a pala- vra tem dois significado5 básicos. No primeiro sentido, o termo é usado em relação a números específicos obtidos de dados. con- forme ilustrado nos exemplos seguintes: .... Em uma pesquisa. feita pela Bruskin-Golclring Research junto a 1.0 I 2 pessoas, a quem foi formulada pergunta sobre como utilizar um bolo ele frutas. 13% responderam que deveria servir para calço de porta. Entre as pessoas com quem se fez um teste sobre o uso de drogas para admissão cm novo emprego. 3,8% reagiram positivamente [de acordo com a Amcrican Management Association (Associação Americana ele Gerenciamento)]. O escore máximo de rc:b•ltidas de beisebol registrado até agora é de 0,442, obtido por James O ' Neil em 1887. A segunda acepção se refere à estatística como método de análise. O Estado da Estatístico A palavra estatistica prav<i!rn do lolim srotus, que significa estado. A prirnilivo utilização da e\tatí.>ticc envolvia compilações de dadas e gráficos que descreviam vários aspectos de um estado ou pois. Em 1662, John Grount piJblicau informes estotísilcas sobre nascimentos e mortes. O trobalho de Grount foi secundada par estudos de mortal idade e taxm de morbidade, tamanho de populações, rendas e taxas de desemprega. As famílias, os governos e os empresas se apóiam largamente em dadas estolislicos. Assim é que os taxao de desemprega, de inAcção, os índices da consumidor, os taxas de natalidade e mortalidade são calculadas cuidadosamente o intervalos regulares, e seus resuliodas são utilizados por empresários poro tomarem decisões que afetom o futuro cantro toçãa de empregados, níveis de produção e expansão poro novos mercados. [g!JFINUÇii!.O A estatística é uma coleção Lle métodos para planejar ex- perimentos. obter dados e organ izá-los. re~umi-los, analisá- los, interpretá-los e deles extrair conclusões. A estatística abrange muito mais elo que o simples traçado de gráficos e o cálculo ele médias. Neste livro veremos como tirar conclusões gera is e significativas que vão além dos dados origi- nais. Em estatística, utilizamos extensamente os termos popula- ção e amostra. Esses termos. que passamos a definir. estão no próprio cerne da estatística. ii» !E IFIIN!a Ç @!E S Uma população é uma coleção completa de todos os ele- mentos (valores, pessoas. medidas etc.) a serem estudados. Um censo é uma coleção de dados relativos a todos os ele- mentos de 11ma população. Uma amostra é uma subcoleção de e lementos extraídos de uma população. Por exemplo, uma pesquisa Nielsen típica de televisão utiliza uma amostra ele 4000 lares e. com base n0s resultados, formula con- clusões acerca da população ele todos os 97.855.392 lares nos EUA . Estreitamente n.:lacionaclos com os conceitos Lle população e amostra estão os conceitos de parâmetro e estarí.l'lica. As defi- nições seguinte> são de fác il memorização. D~!FONB~õms Um parâmetro é uma medida numérica que descreve uma característica de uma população. Uma estatística é uma medida numé1ica que descreve uma característica de uma anwstra. Consideremos um exemP.lo. Em uma pesquisa, fei ta pela Bruskin- Goldring Research com' I O 15 pessoas escolhidas aleatoriamen- te, 269 (ou 26,5%) possuíam t:omputaclor. Como a cifra de 26,5% se baseia em uma amostra, e não em toda a população, trata-se de uma estaríslica (e não um parâmetro). Já se uma pesquisa fei - ta entre os 50 governadores estaduais dos EUA mostra que 42 (ou 84%) possuem computador, a c ifra de 84% é um parâmetro porque se baseia em toda a população de governadores. Um aspecto importante da estatística é sua aplicabilidade óbvia a situações reais e relevantes; em todo este livro encontra- remos ampla diversidade dessas aplicações. 1-2 A Natu i"eza dos Dados Alguns conjunlOs de dados (como alturas) consistem eiTUlúme- ros. enquanto outros ~ão não-numéricos (como sexo). Aplicam- se as expressões dados quantitativos e dados qualitativos para distingui r esses dois tipos. DIE!FINIÇÓ!ES Os dados quantitativos consistem em números que repre- sentam contagens ou medidas. Os dados qualitativos (ou dados categóricos, ou atribu- tos) podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica. O Conjunto de Dados 4 do Apêndice B registra as quantida- des de alcatrão em diferentes marcas de cigarros; esses valores representam dados quantitativos. mas as diversas marca~cons tituem dados qualitativos. Podemos ainda descrever os dados quantitativos distinguin- do entre os tipos discreto e contínuo. DIEIFINHÇÕIES Os dados discretos resultam de um conjunto finito de valores possíveis. ou de um conjunto enumerável desses valores. (Ou seja, o número de valores poss íveis é O. ou I. ou 2 etc.) Os dados contínuos (numéricos) resultam de um núme- ro infinito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal manei ra que não haja lacunas ou interrupções. Quando os dados represenram contagens. são discretos; quan- do representam mensurações. são CUIUÍilLIOS. O número ele ovos que as galinhas põem constitui dados discretos , porque representa uma contagem; já a quantidade de leite que as vacas produzem constitui dados contínuos, porque representa mensurações que podem tomar qualquer valor em um intervalo contínuo. Outra manei ra comum de classificar dados consiste em utilizar quatro níveis de mensuração: nominal, ordinal. intervalar e razão. DIEIFIINIIÇÃO O nível nominal de mensuração é caracteJizado por da- dos que consistem apenas em nomes, ró tulos ou categori- as. Os dados não podem ser dispostos segundo um esque- ma ordenado (como de baixo para cima). Introdução à Estatísticu _, Se associamos o termo nominal a "nome somente··. o signifi- cado é fácil de memorizar. Um exemplo ele dado nominal é o partido político a que cada senador dos EUA pertence. I EXEMPLO Seguem outros exemplos de dados amostrais <tO nível nominal de mensuração. I. Respostas do tipo "sim". "não'· ou "indeciso". 2. O sexo elo~ estudantes em uma turma ele estatística. Como as categorias carecem de qualquer significado ordinal ou numérico, os dados precedentes não podem ser utilizados em cálculos. Assim é que não podemos tirar a "média" de 20 mu- lheres e 15 homens. Cuidado: Por vezes atribuem-se números a categorias (mormente quando os dados são computadorizados). mas tais números não têm qualquer significado para efeito de cálculo, e a média calculada com base neles em geral não tem sentido. Poderíamos citar o faro de que a Gallup Organization computou dados ele uma pesquisa em que se atribui o "valor'' O aos democratas, I aos republicanos e 2 aos independentes. Mes- mo estando diante de rótu los numéricos. os dados permanecem no nível nominal e não podemos fazer cálculos com eles. !l)f.ti?HNOÇ.i.O O nível ordinal de mensuração envolve dados que po- - - dem ser dispostos e)n alguma ordem. mas as diferenças entre os valores dos dados não podem ser determinadas, ou não têm sentido. EXEMPLO Dão-se a seguir exemplos de dados ao nível ordinal de mensuração. 1. Um editor classifica alguns originais como "excelentes··. alguns como "bons" e alguns como "maus". (Não podemos detem1inar uma diferença quantitativa entre ·'bom" e "mau".) 2. Um comitê de preparação olímpica classifica Gai l em 3.0 , Diana em 7.0 e Kim em 10.". (Podemos determinar a dife- rença entre os 3.0 e 7.0 lugares mas a diferença de 4 não rem qualquer significado.) Esse nível ordi nal dá informações sobre comparações rei:Jti - vas, mas os graus de diferença não servem para cálculos. Os dados em nível ordinal não devem, pois. ser uti lizados em cálculos. Censo do Ano 2000 O censo nacional Idas EUA) do ano 2000 será mais rápido, menos dispendiosa e mais preciso da que a censo de 1990. Ao contrário do censo de 1990, o Censo de 2000 utilizará métodos de amostragem para obter resultados mais precisos. Em 1990, os agenciadores volta ram a té seis vezes às 35 milhões de casos que não remeteram os formulários preenchidos; mos, em 2000, essas cosas omissos serão submetidas a uma amostragem. Espera-se que a amostragem produza resultados mais precisos do que os' tentativas de atingir cada coso individualmente. O censo de 2000 custará cerco de $4 bilhões, o que significa $1 milhão menos do que o custo do repetição dos mesmos métodos de 1990. O censo de 2000 será mais eficiente- embora o censo de 1990 não tenha sido tã o ineficiente como sugeriu o colunista Dave Ba rry: "O Departamento do Censo expede 1 00 milhões de formulários, 87 milhões dos quais chegam a um único destino em Albony." L L ----·-·--- - 4 ESTAT[STICA DIEIFiN&ÇÃC O nível intervalar de mensuração é amílogo ao nível ordinal, com a propriedade adicional de que podemos de- terminar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural (onde 11ão haja qualquer quantidade presente). As temperaturas de 98,2"F e 98,6°F são exemplos de dados nesse nível intervalar de mensuração. Os valores se apresentam ordena- dos, e podemos determinar diferenças entre eles (em geral chama- das distância entre os dois valores). Todavia. não há ponto de par- tida natural. O valor O"F pode parecer um ponto de partida, mas é inteiramente arbitrário, e não representa "ausência de calor". É um erro dizermos que 50°F é duas vezes mais quente do que 25"F. (Na escala Kelvin, as marcações de temperatura estão ao nível de razão de mensuração; essa escala tem um zero absoluto.) EXEMPLO Seguem exemplos de dados ao nível intervalar de mensuração. 1. Os anos I 000, 2000, 1776 c 1944. (O tempo não começou no ano zero e, assim, O é arbitrário, e não um ponto de partida zero naturaL) 2. As temperaturas anuais médias (em graus Celsius) das capitais dos 50 estados americanos. ' Medida da Desobediência Como coletar dados sobre algo que não se apresente mensurável, como o nível de desobediência do povo? O psicólogo Stanley Milgrom p!anejou o seguinte experimento: Um pesquisador determinou q ue um voluntário acionasse um painel de controle que dava choques clétricos crescentemente dolorosos em uma terceira pes;oa. Na reolidade, não eram dados choques e a terceiro pessoa era um o lor. O voluntário começou com 15 volts e foi ori~ntado a c:umentor os choques de 15 em 15 volts. O nível de desobediência era o ponto em que a pessoa se recusava o aumentar tJ voltagem. Surpreendentemente , dois terços dos voluntários obedeceram às ordens mesmo que o olor gritasse e simulasse um tJtaque cardíaco. TABELA 1- ~ Níveis de Mensuração de Dados Nível Nominal Ordinal lntervaio Razão Sumário Categorias somente. Os dados não podem ser dispostos em um esquema ordenado. As categorias são ordenadas, mas não podemos estabelecer diferenças, ou e~tas não têm sentido. Podemos determinar diferenças entre valores, mas não há ponto de partida inerente. As razões não têm sentido. Como intervalo, mas com um ponto de partida inerente. As razões têm sentido. DIEIFDNBÇÃO O nível de razão de mensuração é o nível de intervalo modificado de modo a incluir o ponto de partida zero ine- rente (onde zero significa nenhuma quantidade presente). Para valores nesse nível, tanto as diferenças como as ra- zfles têm significado. EXEMPLO Dão-se a seguir exemplos de dados ao nível de ra- zão de mensuração. 1. Pesos de artigos de material plástico descartados pelas re- sidências (O Jb indica que nenhum plástico foi descartado, e 10 lb representam duas vezes 5 lb). 2. Duração (em minutos) de filmes. 3. Distâncias (em milhas) percorridas por carros em um tes- te de consumo de combustível. Os valores de cada um desses conjuntos de dados podem ser dispostos em ordem, suas diferenças podem ser calculadas, e existe um ponto de partida zero inerente. Este nível é chamado o nível de razão porque o ponto de partida toma as razões signi- ficativas. Como um peso de 200 lb é duas vezes um peso de 100 lb, mas 50°F não é duas vezes mais quente do que 25°F, os pesos estão ao nível de razão, enquanto as temperaturas Falu·enheit estão em nível de intervalo. Para uma comparação e revisão concisas, deve-se estudar a Tabela 1-1 para ver as diferenças entre os qua- tro níveis de mensuração. Ao aplicarmos a estatística a problemas reais, o nível de men- suração dos dados é um fator importante para determinarmos o processo a ser utilizado. Nossa compreensão dos quatro níveis de mensuração deve ser complementado pelo bom senso- uma ferramenta indispensável na estatística. Por exemplo, não tem sentido calcularmos a média dos números de inscrição de segu- rados no INSS, porque esses números não medem nem contam qualquer coisa; têm por função única e exclusiva identificar as pessoas. Tais números são, na verdade, nomes diferentes para as diversas pessoas e, como tais, não devem ser utilizados para cál- culos. De modo geral, não devemos calcular médias de dados aos níveis nominal ou ordinal de mensuração. Carros de aluno': I O Corvettes } 20 Ferraris 40 Porsches Carros de alunos: JO compactos} 20 médios 40 grandes Exemplo Categorias ou nomes somente. Está determinada uma ordem: "compacto", "médio", ugrande". Temperaturas no campas: 45°F } 90oF não é duas veze> 80°F mais quente do que 90°F 45°F. Pesos de jogadores de ragby em uma faculdade: 150 lb} 195 lb 300 1b é duas vezes 150 lb. 300 lb ... 1-2 Exercidos A: Habilidades e Conceitos Básicos Nos Exercícios 1-8, identifique cada número corno discreto ou contínuo. 1. Cada cigarro Carne! tem 16,13 mg de alcatrão. 2. O altímetro de um avião da American Airlines indica uma altitude de 21.359 pés. 3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes de um serviço de computador on-lille. 4. O radar indica que Nolan Ryan rebateu a última bola a 82,3 mi/h. 5. De todos os escores SAT marcados no ano passado, 27 foram per- feitos. 6. De 1000 consumidores pesquisados. 930 reconheceram a marca de sopa CampbelL 7. O tempo total gasto anualmente por um motorista de táxi de Nova York ao dar passagem a pedestres é de 2,367 segundos. 8. Ao completar um programa de treinamento, Shaquille O'Neal pe- sava 12,44 lb menos do que no início do treinamento. Nos Exercícios 9-18, determine o nível de mensuração mais adequado (nominal, ordinal, intervalo, razão). 9. Classiftcação como superior, acima da média, médio, abaixo da média ou pobre para encontros marcados com desconhecidos. 10. Conteúdo de nicotina (em miligramas) de cigarros Carne!. 11. Números de inscrição do INSS. 12. Temperaturas (em graus Celsius) de uma amostra de contribuintes irritados por estarem sendo fiscalizados. 13. Anos em que os democratas ganharam as eleições presidenciais. 14. Graus finais (A, B, C, D, F) de estudantes de estatística. 15. Códigos de endereçamento postal. 16. Rendas anuais de enfermeiras. 17. Carros classificados como subcompacto, compacto, intermediário ou grande. 18. Cores de uma amostra de confeitas M&M. 1-2 Exercícios B: Acima do B6Jsico 19. Presidentes americanos foram assassinados nos anos de 1865, 188 1, 1901 e 1963. Qual é o nível de mensuração para esses anos? Ex- plique sua resposta. 20. No quadrinho "Born Loser" (Perdedor nato) por Art Sansom, Brutus manifesta alegria por um aumento de temperatura de 1" para 2°. Ao lhe pergunrarem a razão, respondeu: "Está agora duas ve- zes mais quente que hoje de manhã." Por que Brutus errou mais uma vez? ] -3 Usos e Abusos da Esi'atistica Usos da Estatística As aplicações da estatística se desenvolveram de tal forma que, hoje, praticamente todo campo de estudo se beneficia da utiliza- ção de métodos estatísticos. Os fabricantes fornecem melhores produtos a custos menores através de técnicas de controle de qualidade. Controlam-se doenças com auxílio de análises que antecipam epidemias. Espécies ameaçadas são protegidas por regulamentos e leis que reagem a estimativas estatísticas de modificação do tamanho das populações. Visando reduzir as ta- xas de casos fatais, os legis ladores têm melhor justificativa para Introdução à Estatística 5 leis como as que regem a po luição atmosférica, inspeções de automóveis, utilização do cinto de segurança e da bolsa de ar, e dirigir em estado de embriaguez. Citamos apenas esses exem- plos, porque uma compilação completa das aplicações da esta- tística facilmente tomaria o resto deste livro. Alguns estudantes escolhem um curso de estatística porque é exigido, mas um número cada vez maior o faz voluntariamente, porque reconhecem seu valor e aplicabllidade em qualquer campo em que pretendam trabalhar. Como os empregadores gostam ele ver um curso de estatística no cunículo de um candidato, o lei- tor que ti ver estudado estatística levará vantagem ao procurar um emprego. Afora razões relacionadas com a obtenção de empre- go e com a disciplina, o estudo da estatística pode tornar o leitor mais crítico em sua análise de informações, e menos sujeito a afinnações enganosas, como as que se acham comumente asso- ciadas a pesquisas, gráficos e médias. Como membro educado e responsável da sociedade, o leitor deve aguçar sua capacidade de reconhecer dados estatísticos distorcidos e de interpretar in- teligentemente dados que se apresentem sem distorção. Os Moto ristas Mais Idosos São Mais Seguros do que os Mais Moços? A American Association of Retired People - AARP (Associação Ame ricano de Aposentados) a lega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. Nos últimos anos, os motoristas com 16-19 anos de idQ.de causàram cerca de 1 ,5 milhão de acidentes, em comparação com apenas 540.000 causados por motoristas com 70 anos ou mais, de formo que a alegação da MRP parece válida . Acontece, entretanto, que os motoristas mais idosos não dirigem tanto quonlo os mais jovens. Em lugar de considerar apenas o número de acidentes, devemos examinar também os taxas de acidentes. Eis as taxas de acidentes por 100 milhões de milhas percorridas: 8,6 paro os motoristas com idades de 16 a 19, 4,6 para os com idade de 7 5 a 79, 8, 9 poro os com idade de 80 a 84 e 20,3 paro os motoristas com 85 anos de idade ou mais. Embora os molorislas mais jovens lenham de falo maior número de ocidentes, os mais velhos apresentam as mais altas taxas de acidente. Abusos da Estatística Não é de hoje que ocorrem abusos com a estatística. Assim é que, há cerca de um século, o estadista Benjamin Disraeli disse: "Há três tipos de mentira: as mentiras, as mentiras sérias e a estatísti- ca." Já se disse também que ·'os números não mentem; mas os mentirosos forjrun números" (Figures don 't lie; liars figure) e que "se torturarmos os dados por bastante tempo, eles acabarão por admitir qualquer coisa". O historiador Andrew Lang disse que algumas pessoas usam a estatística "como um bêbado utili- za um poste de iluminação - pru·a servir de apoio e não para iluminar". Todas essas afirmações se referem aos abusos da es- tatística, quando os dados são apresentados de fom1a enganosa. Alguns dos que abusam da estatística o fazem simplesmente por descuido ou ignorância; outros, porém, têm objeti vos pessoais, · pretendend9 suprimir dados desfavoráveis enquanto dão ênfase aos dados que lhes são favoráveis . Passemos a alguns exemplos das diversas maneiras como os dados podem ser distorcidos. Pequenas Amostras No Capítulo 6 veremos que as pequenas amos- tras não são necessariamente más; entretanto, os resultados ob- tidos com pequenas amostras podem por vezes ser usados como um,a fórma de "mentira" estatística. As preferências de apenas ., ~··- ~·~ :l ·-~ '· 1 ,._ ;'-l · - • -- ~w . "' 6 ESTATiSTICA I O dentistas por detenninado dentifríc io não devem servir de base para uma afinnação generalizada como "A pasta dentifrícia XYZ é recomendada por 7 em cada I O dentistas." Mesmo que a amostra sej a grande, e la deve ser não-tendenciosa e representativa da população de onde provém. Às vezes uma amostra pode parecer realmente grande (como em uma pesquisa com "'2000 adultos americanos escolhidos aleatoriamente"). mas se se formu lam conclusões acerca de subgrupos. como republicanos católicos do sexo masculino, tais conclusões podem estar baseadas em amos- tras assaz pequenas. Números Precisos Às vezes os próprios números podem ser enga- nosos. Uma cifra. como um salário anual de $37.735,29. pode parecer muito precisa. introduzindo alto grau de contiança em sua exatidão. Já a cifra $37.700.00 não infunde o mesmo senso de precisão. Entretanto. uma estatística com muitas casas deci - mais não é necessariamente precisa. Estimativas por Suposição Outra fonte de engano estatístico envol- ve estimativas que são. na verdade. suposições (ou, na lingua- &em popular. "palpit<!s"), podendo apresentar erros substanciais. E preciso considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram a multidão em 250.000 pessoas, mas, utilizando fo- tos aéreas e grade5, o Miami Herald chegou a uma c ifra mais precisa de apenas 150.000. Porcentagens Distorcidas Por vezêl6 utilizam-se porcentagens con- fusas ou distorcidas. Em um anúncio de página inteira, a Conti- nental Airiines anuncia melhores serviços. No tocante ao caso de bagagem extraviada. o anúncio atinnava que ·'se trata de uma área em que já melhoramos 100% nos últimos seis meses". Em um editorial criticandu essa estatística, o New York Times inter- pretou corretamente a melhora de I 00% como signi ficando que agora não se extravia mais quaiquer bagagem- o que ainda não foi conseguido pela Continental Airlines. Cifras Parciais "Noventa por cento dos carros vendidos nos EUA nos últimos lO anos ainda estão rodando." Milhões de consumi- dores ouvi mm esta mensagem e ficaram com a impressão de que esses carros deitem ter sido muito bem construídos para durarem tanto. O que o fab1icantc não mencionou foi que 90% dos catTO~ por ele venJidos. c• fo ram nos últimos três anos. A a legação. cmbor;.~ tecnicamente correta, era enganosa. por não apresentar os resultados completos. Distorções Deliberadas No li vro Tointed Trwh. Cynthia Crossen c ita um exemplo da revista Corporate Travei que publicou dados mostrando que, entre as companhias locadoras de carros. a A vis foi a vencedora em uma pesquisa junto aos locatários. Quando a Hertz solicitou infonnações detalhadas sobre a pesquisa. as res- postas desapareceram e o coordenador da pesquisa se demitiu. A Hertz processou a Avis (por falsa propaganda baseada na pes- quisa) e a revista: chegou-se a um acordo. Perguntas Tendenciosos As pergunws em uma pesquisa podem ser formuladas de modo a "sugerirem' ' uma resposta. Um caso fa- moso envolve o candidato à presidência dos EUA. Ross Perot, que formulou a seguinte pergunta em um questionário : "O pre- sidente deve ter o poder de vetar decisões do Congresso?" No- venta e sete por cento das respostas foram "sim'' . Entretanto, o percentual de respostas "sim" caiu para 57% quando a pergunta fo i "O presidente deve ter. ou não . o poder de vetar decisões do Congresso')'' Às vezes as perguntas se apresenta m involunta- riamente tendenciosas em virtude de fatores como a ordem dos itens a serem considerados. Por exemplo. uma pesquisa alemã fo rmulou estas duas perguntas: O leitor diria que o tráfego contribui em ma ior ou menor grau do que a ind ústria para a poluiçflo atmosférica? O lei tor diria que a indústria contribu i em maior ou menor grau do que o tráfego para a poluição atmosférica~ Q uando o tráfego foi mencionado em primeiro lugar. 45% acu- saram o tráfego e 32% acusaram a indústria: q uando a indústria fo i citada em primeiro lugar, as porcentagens se modificaram grandeme nte para 24% e 57%. respectivamente. Pesquisa do Literary Digest N o componho presidencial de 1936, o revisto Literory Oigest fez uma pesquiso e concluiu pelo vitória de Ali London, mos Franklin D. Rooseveli venceu por largo morgem. Mourice Bryson observo: "Foram enviados 1 O milhões de cédulas- amostro o eleitores em potencial, mos apenas 2,3 milhões foram devolvidos. Como lodos devem saber, tpis amostras são ·quase sempre lendenciosos. " Bryson afirmo lombém: "As resposlos volunlários o questionários envtodos pelo correio consliluem talvez o método mais comum de colete de dados sobre ciências sociais encontrado pelos eslalísticos, e é lombém talvez o pior." (Ver Brysan, "The Literary Digesl Poli: Moking of o Stolisticol Myth", The American Stolistician. Vol. 30, N 2 4.J Gráficos Enganosos Muitos dispositivos visuais -como gráficos c m barras e gráficos em setores- podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto de dados. (Tais recursos serão discutidos no Capítulo 2.) Os dois gráficos da Figura 1-1 representam os mesmos dados do Bureau of Labor Statistics (Departamento de Estatística do Trabalho). mas a parte (b) tem como objetivo exagerar a diferença entre os ganhos dos homens e os das mulheres. Não partindo do zero no eixo vertical, o gráfico {b) tende a produzir uma impressão sub- jetiva errônea. A Figura 1-1 nos dá uma lição importante. Deve- mos analisar as informações numéricas contidas e m um gráfico, não nos deixando enganar por sua forma geral. Pictográficos Os desenhos de objetos, chamados pictográtiços. tam- bém podem levar-nos a erro. Os objetos comumente usados pam ilustrar dados incluem sacos de dinheiro, pilhas de moedas, tan- "$750 s:: -~ ] ~ <: .. 500 E ~ 250 " .<:: s:: $754 $520 ~ O ,...., r-· Homens Mulheres (a) () $750 ~ ii 700 E ~ 6E'JO s:: .. % 600 \1\ _g 550 $754 $520 s:: .. \é) 500 LL---~--L..::...C.-'i Homens Mulheres (b) fig. 1- 1 Ganhos de profissionais de lempo inlegrol. ques do-exército (para despesas militares), vacas (para produção de laticínios). barris (para produção de petróleo) e casas (para construção). Ao desenhar tais objetos, o artista pode cri ar impres- sões falsas que distorcem as diferenças. Se duplicamos o lado de um quadrado, a área não é apenas duplicada, e sim quadrupli- cada; duplicando cada aresta de um cubo. seu volume não é ape- nas duplicado, e sim multiplicado por oito. Se os impostos do- bram a cada década, um desenhista pode representar os aumen- tos de imposto por um saco de dinhe iro para o primeiro a no e um segundo saco duas vezes mais fundo, duas vezes mais alto e duas vezes mais largo para o segundo ano. Ao invés de aparece- rem duplicados. os impostos se apresentarão aumentados oito vezes: o desenho distorce , assim, a realidade . Pressão do Pesquisador Quando se formulam pe rgu ntas a indiví- duos pesquisados. esses freqüentemente dão respostas favoráveis à sua auto-imagem. Em uma pesq uisa telefônica . 94% dos que responderam d isseram que lavam suas mãos após usar um ba- nheiro, mas a observação em lugares tai s como a Estação Penn. e m Nova York e Golden Gate Park em San Francisco mostra- ram que o percentual efetivo é de apenas 68%. Más Amostras Outra fonte de estatística enganosa são os mé todos inadequados de coleta de dados. É comum um pesquisador ana- lisar dados e formular conclusões errôneas porq ue o método de cole ta de dados foi deficiente. Um exemplo típico é a pesquisa "Nightl ine" em que 186.000 espectadores de televisão pagaram 50 centavos para discar um nú mero de telefone "900" dando sua opinião so bre se a sede das Nações Unidas deve permanecer nos EUA. Os resultados mos- traram que 67% dos que foram consu ltados e ram favoráveis a que a sede da ONU snísse dos EUA. No começo deste capítulo perguntamos o que se poderia concluir quanto à opinião geral da popu lação sobre a permanênc ia da ONU nos EUA. Como os próprios espectadores é que decidiram se seriam incluídos na pesquisa. temos um exemplo de pesquisa auto-selecionada, que se define como segue. DIEU:~NBÇë.ll Urna pesquisa auto-selecionada é uma pesquisa em que os próprios entrevistados decidem se serão incluídos. Em tais pesquisas. o que freqüentemente ocorre é que participam apenas aque les que têm uma opinião firmada. resultando daí que a a mostra dos que respondem não é representati va da população como um todo. Como 67% dos 186.000 pesq ui sados eram favo- ráveis à mudança da sede da ONU dos EUA, nada podemos con- cluir sobre a populaçüo em geral, dada a maneira como se ob- teve a wnostra. Na realidade, Ted Ko ppel reportou que uma pes- quisa "científica" de 500 pessoas revelou que 72% del as deseja- vam que a sede da ONU permanecesse nos EUA. Nessa pesqui- sa de 500 pessoas, os que responderam foram selec ionados a le- atoriamente pelo pesquisador. de modo que o resu ltado tende muito mais a refleti r a verdadeira opinião da população e m ge- ral. Uma pesquisa auto-selec ionada é apenas uma das maneiras como o método de cole ta de dados pode ser seriamente prejudi- cado. Em vista de sua impm1ância, decticaremos a próx ima se- ção ao método de amostragem ou coleta ele dados. Introdução ii Estatísti.:~ 7 Os exemplos precedentes constituem uma pequena amostra das maneiras como a estatística pode ser utilizada de forma en - ganosa . Livros inte iros têm sido dedicados a esse assun to, inclu- sive o c láss ico How to Lie with Sratistics. de Darrell Huff. The Figure Finaglers. de Robert Reichard. e Tainted Truth. de Cynthia C rossen . O entendimento de tais práticas será de grande auxílio na avaliação dos dados estatísticos encontrados em si tu- ações cot idi a nas . l-3 Exerdotios A: Habilidades e Conceiil'os B~sicos I. Uma peswa foi encarregada ele pesquisar o reconhecimento da marca Nike. devendo contactar por telefone 1500 consumidores nos EUA. Por que razão é incorreta a utilização de listas telefôn icas como popu lação para fornecer a amostrary 2. Setenta e dois por cento dos americanos espremem o tu bo de den- tifrício a partir da pane superior. Essa observação. assim como out r&s também não muito sérias. é apresentada em The Firs/ Reallr lmporlanl Survey of American Habit.1· (a primeira pesquisa realmen- te importante dos hábitos dos americanos). Esses resultados se baseiam em 7000 respostas a 25.000 questionários e nviados pelo correio. Quat o lado errado dessa pesquisa '' 3. Um relatório patrocinado pela Florida Citrus Commission concluiu que os níveis de colesterol podem ser reduzidos mediante ingestão de produtos cítricos. Por que razão a conclusão poderia ser suspeita'' 4. Uma funcionária tem um salário anual de $40.000. mas é informa- da de que terá 'Uma redução de I 0% no pagamento e m virtude do declínio dos lucros da companhia. É informada também de que no próximo ano terá um aumento de I 0%. A situação não se afigura tão má. porque a redução de I 0% parece ser compensada pelo au- mento de 10%. a. Qual a renda anual após o corte de I 0%? b. Com base na renda anual da parte a. determ ine a renda anual apó~ o aumento de I 0%. O corte de I 0% seguido do aumento de I 0% rest ituem à funcionária o sa lário original de $40.000? S. A revista G/amour publicou o seguinte resu ltado de uma pesqui- sa: "Setenta e no ve por cento dos que responderam à nossa pes- quisa de agosto afirmaram crer que os americanos se tornaram demasiadamente propensos a apelar para ajustiça em casos coni- queiros ... A questão foi publicada nu revista e os leitores podiam responder pelo correio, fax ou e-mail (Tellus@Galamour. com) Ate! que ponto é válido o resultado de 79%'' 6. ADT Security Systems advertiu que "quando você sai de férias. os ladrões começam a agir". O anúncio atirmava que "de acordo com estatísticas do FBI, mais de 26% dos assaltos a residências ocor- riam entre o Memori al Day [feriado que homenageia os soldados mortos na guerra! e o Dia do Trabalho". Em que ponto essa afir- mação é enganosa? 7. Em um estudo sobre crimes cometidos no campus de uma univer- sidade por estudantes sob efeito do álcoo l ou das drogas, foram pesquisados 1.875 estudantes. Um artigo no USA Toda_v notou: "Oito por cento dos estudantes que respondem anonimamente afir- mam ter cometido um crime no campus. E 62% desse grupo di- zem ter'agido sob a influência do álcoo l ou das drogas." Supondo que o número de estudantes que responderam anonimamente seja de 1.875. quantos efetivamente cometeram um crime no campus sob a intluênc ia do álcool ou das drogas? 8. Um estudo realizado pelo lnsurance [nstitute for Highway Safety (Instituto de. Segurança nas Rodovias) constatou que o Chevrolel Corvette acusa o mais elevado índice de acidentes fatais- ··s.2 1 ._ l - '- ,_ 8 EsTATÍSTICA mortes para cada 10.000". O carro com menor índice de acidentes fatais foi o Volvo, com apenas 0,6 morte por !0.000. Significa isto que o Corvette não é tão seguro quanto o Volvo? 9. O jornal Newport Chronicle afirma que as mães grávidas podem aumentar suas chances de ter um bebê sadio comendo lagostas. A alegação se baseia em um estudo mostrando que as crianças nas- cidas de mães que comem lagostas têm menos problemas de saú- de do que as nascidas de mães que não comem lagostas. Qual é o erro nesta alegação? 10. Uma pesquisa inclui o seguinte item: "Registre sua alturu cm po· legadas." Com isso pretende-se obter e analisar as alturas dos que respondem. Identifique os dois problemas neste item. 11. "De acordo com uma pesquisa de âmbito nacional feita por 250 agências de empregos, os sapatos gastos constituem o motivo mais comum para que um homem que procura emprego não cause boa impressão à primeira vista." Os jornais apresentavam essa alega- ção com base em uma pesquisa encomendada pela Kiwi Brands, produtores de graxa para sapatos. Faça um comentário sobre ara- zão por que os resultados de tal pesquisa podem ser questionados. 12. Em um suplemento de propaganda inserido no Time, os aumentos das despesas com o combate à poluição foram ilustrados em um grático como o que aparece a seguir. O que está errado com a figura? .$643,3 Milhões 2 Ano 3 $1864,8 Milhões 4 1-3 Exercidos B: Além do Básôco 13. Um artigo no Nr:IV York Times afirmou que a duração média ela vida ue 35 regentes de orquestra do sexo masculino era de 73,4 anos, em cone a,. te com n média de 69,5 anoo pam a população masculina em gera!. A vida mais longa foi atribuída a fatores como satisfação pes- 'oal c moti,ação. Há uma falha fundamental na conclusão de que os regentes de orquestra do sexo masculino vivem mais. Qual é? 14. Um pesquisador do Sloan-Kettering Cancer Research Center foi criticado certa vez por adulterar dados. Entre seus dados estavam cifras obtidas de seis grupos de ratos, com 20 ratos cm cada gru- po. Foram dados os seguintes valores como porcentagens de su- cesso: 53%, 58%, 63%, 46%, 48%, 67%. O que está errado? lS. Procure identificar as quatro maiores falhas no seguinte. Um jor- nal real izou uma pesquisa solicitando a resposta dos le itores a esta pergunta: "Você apóia o desenvolvimento de armas atômicas que poderiam matar milhões de pessoas inocentes?" Relata-se que 20 leitores responderam, 87% com "não" e 13% com "sim". 16. Um editorial do New York Time s criticou um anúncio que alegava que determinado anti-séptico bucal "reduzia em mais de 300% as placas nos dentes". a. Removendo-se 100% de uma quantidade, quanto resta? b. Que significa reduzir as placas em mais de 300%? 1-4 Planejamento dle !Experimentos Os estudos que utilizam métodos estatísticos vão desde os que são bem concebidos e executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal executados, levan- do a conclusões enganosas e sem qualquer valor real. Eis alguns pontos importantes para o planejamento de um estudo capaz ele produzir resultados válidos: 1. Identificar com precisão a ques tão a ser respondida e definir com clareza a população de interesse. 2. Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a real ização de um estudo obser- vacional ou de um experimento (ambos definidos a seguir), e deve ser elaborado cuidadosamente, de modo que os da- elos coletados representem efetivamente a população em questão. 3_ Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resu ltar de uma cole ta tenden- ciosa de dados. 4. Analisar os dados e tirar conclusões. Identificar também pos- síveis fontes de erros. Os estudos que requerem métodos estatísticos decorrem tipi- camente de duas fontes comuns: estudos observacionais e expe- rimen tos. D1'5C:!INlU~Óllil$ Em um estudo observacional, verificamos e medimos caracteristicas especíticas, mas não tentamos manipular ou modificar os elementos a serem es tudados . Em um experimento. aplicamqs determinado tratamento e passamos então a observar seus efeitos sobre os elemen- tos a serem pesquisados. Por exemplo, um estudo observacional pode envolver uma pesquisa de cidadãos para determinar que porcentagem da po- pulação é a favor do registro de armas de fogo. Um experimento pode envolver o tratamento com um remédio ministrado a um grupo de pacientes a fim de determinar sua efic iência na cura. No caso da anna de fogo, coligimos dados sem modificar as pessoas a sere m pesquisadas; já o tratamento por um remédio envolve a modificação das pessoas. Os experimentos bem planejados costumam envolver um gru- po a quem é dado um tratamento particular (chamado gmpo de tratamento) e um segundo grupo de controle ao qual não se ad- ministra o tratamento. Por exemplo, o experimento sobre pólio realizado em 1954 envolveu um grupo de tratamento de crian- ças em quem foi injetada a vacina Salk, e um grupo de controle de crianças que recebeu um remédio neutro (placebo). Em ex- perimentos deste tipo, ocorre um efeito placebo quando um in- divíduo não tratado acredita estar recebendo o tratamento e ale- ga uma melhora nos sintomas. O efeito placebo pode ser contra- balançado fazendo-se um experimento cego, uma técnica em que o indivíduo não sabe se está recebendo o tratamento ou um pia- cebo. O experimento sobre pólio foi do tipo duplo-cego, em que as crianças que recebiam a injeção não sabiam se estavam rece- bendo a vacina Salk ou um placebo, e os médicos que davam a injeção e avaliavam os resultados também não sabiam. As Pesquisas Políticas Crescem Em "Consulting the Orocle", um artigo poro o U.S. News and Warld Repor/, o autor Stephen Budionsky escreve que o Presidente Kennedy encomendou 16 pesquisas em seus três anos de mandato, Nixon encomendou 233 pesquisas em seus seis anos, e Clinton encomendou entre 1 00 e 150 pesquisas em seus · primeiros 2,5 anos . As pesquisas de Clinton custaram entre $30.000 e $45.000 cada uma, o que dá um custo de $30 por pessoa. Budionsky relato que o pesquiso é complicado por máquinas de resposta e por pessoa s que se recusam o cooperar, mas as boas pesquisas incluem tentativas repetidas para obter respostas dos que não estão em cosa ou se recusam o responder. Não levar em conto os que não respondem pode resultar em uma amostro que não represente adequadamente a população. Ao planejar um experimento para testar a eficiência de um ou mais tratamentos, devemos ter o cuidado de atribuir as unidades experimentais (ou indivíduos) aos diferentes grupos de tal modo que esses grupos sejam bem semelhantes. (Tais grupos semelhan- tes de unidades experimentais são chamados blocos.) Uma abor- dagem eficiente consiste em uWizar umplanejamento experimen- tal completamente aleatorizado, que exige que as urudades ex- perimentais sejam divididas em diferentes grupos mediante um processo de seleção aleatória. Assim é que tal planejamento pode envolver a atribuição aleatória de pessoas a um grupo tratado com aspirina e a um grupo de controle que não é tratado. Outro pro- cesso consiste em utilizar um planejcunento controlado rigoro- samente, com unidades experimentais escolhidas cuidadosamen- te, de modo que os diferentes grupos (ou blocos) sejam tão se- melhantes quanto possível. Com um planejamento rigorosamente controlado, podemos tentar formar grupos de tratamento e de controle que incluam pessoas semelhantes em idade, peso, pres- são sanguínea etc. É importante também considerar a replicação, que exige tamanhos de amostra suficientemente grandes quere- duzam os efeitos da variação amostral aleatória. O experimento com a pólio foi um planejamento experimental completamente aleatorizado, porque os indivíduos em ambos os grupos, de tra- tamento e de controle, foram selecionados aleatoriamente. Incor- porou a replicação incluindo números muito grandes (200.000) de indivíduos em cada grupo. ' Na realização de experimentos, os resultados por vezes são comprometidos pelo confundimento. D!Ef~ND~.i@ Ocorre o confundimento quando os efeitos de duas ou mais variáveis não podem distinguir-se uns dos outros. Por exemplo, se estamos realizando um experimento para testar a eficiência de um novo retardante no incêndio em uma sarça, e repentinamente começa a chover, ocorre o confundimento por- que é impossível distinguir entre o efeito do retardante e o efeito da chuva. Um dos erros mais graves consiste em uma forma inadequa- da de cole ta de dados. Nunca é demais enfatizarmos este impor- tante ponto: Dados coletados de forma descuidada podem ser tão inúteis que nenhum processamento estatístico consegue salvá-los. Introdução à Eswtística 9 Notamos na Seção 1-3 que uma pesquisa auto-selecionada é uma pesquisa em que as próprias pessoas decidem se vão responder ou não. As pesquisas auto-selecionadas são muito comuns, mas seus resultados em geral não têm util idade para fazer inferências válidas sobre toda uma população. Passamos agora a definir e descrever os cinco métodos mais comuns de amostragem. !tll!Z!FBNDÇÃ@ Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada um deles tenha igual chcu1ce de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda a mostra de tamanho n possível tenha a mesma chance de ser escolhida.) As amostras aleatórias podem ser escolhidas por diversos mé- todos, inclusive a utilização de tabelas de números aleatórios e de computadores para gerar números· aleatórios. Com a amos- tragem aleatória, espera-se que todos os grupos da população sejam representados na amostra de forma aprox imadamente proporcional. Uma amostragem descuidada pode facilmente resultar em uma amostra tendenciosa, com características as- saz diferentes das da população que a originou. Em contrapar- ti da, a amostragem aleatória é cuidadosamente planejada para evitar qualquer tendenciosidade. Por exemplo, a utilização de catálogos telefônicos elimina automaticamente todos aqueles cujos telefones não ftgurem no catálogo, e a exclusão desse segmento da população pode faci lmente conduzir a resultados falsos. Em Los Angeles, por exemplo, 42,5% dos números de telefones não estão no catálogo (com base em dados da Survey Sampling, Inc.). Os pesquisadores costumam contomar esse problema utilizando computadores para gerar números de te- lefone, de modo que todos os números sejam possíveis. Eles devem também ter o cuidado de incluir os que inicialmente não foram encontrados ou se recusaram a responder. A Companhia de Pesquisas HmTis constatou que a taxa de recusa para entre- vistas telefônicas é em geral de 20%, no mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode concorrer para que nossa amostra seja tendenciosa. !!:lli'Ee::DINIB~ÃO Com a amostragem estratificada, subdividimos a popu- lação erri, no mínimo, duas subpopulações (ou estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada estrato. Em uma pesquisa sobre a Emenda Constitucional da Igualda- de de Direitos, poderíamos utilizar o sexo como base para a criação de dois estratos. Após obter uma relação dos homens e uma relação das mulheres, aplicamos um método conveniente (como a amostragem aleatória) para escolher deterrrúnado nú- mero de elementos de cada relação. Quando os diversos estra- tos têm tamanhqs amostrais que refletem a população global, temos o que se chama amostragem proporcional. No caso de algu~s estratos não serem representados na proporção adequa- ;. -..- ··-.-..._, ... ,.__ .............. ...,._....._, .• ~-,~~-·-"'-'- -- - •.:o...-, .:•-·- -·-·· -e-·-~-= --- ··---·---·~· - -- ----· - -~ -- - lO ESTATÍSTICA da. então os resultados poderão ser ajustados ou ponderados convenien temente. Para um tamanho fixo de amostra. se escolhemos aleatolia- mente elementos de diferentes estratos. temos chance de obter resultados mais consistentes (e menos valiá veis) do que com a simples escolha de uma amostra aleatória de toda a popu lação. Por essa razão; costuma--se usar a amostragem estratificada para reduzir a variação nos resultados. B)!tlf9N~~Â@ Na amostragem sistemática. escolhemos um ponto de partida. e selecionamos cada k·"•m•· elemento (como por exemplo cada 50."elemento) da população . Por exemplo, se a Motorola quisesse fazer uma pesquisa ;,obre seus I 07.000 empregados, poderia partir de uma relação com- pleta dos mesmos e selecionar cada I 00." empregado. obtendo uma amostra de 1.070 elementos. Esse método é simples e util i- zado com freq üência. DIEIFDINII~Ã@ Na amostragem por conglomerados. começamos divi- dindo a área da população em scções (ou conglomerados): em seguida escolhemos algumas dessas seções e. tina I men- te. tomamos rodos os elementos elas seções escolhidas. Uma diferença importante entre a amostragem por conglomera- dos e a amostragem estratificad ::t é que a amos tragem por con- glomerados uti liza todos os elementos dos conglomerados se le - cionados . enq uanto a amostragem estratificada utiliza uma li iiWS- cra de membros de cada estrato. Pode-se encontrar um exemplo de ammtragem por conglomerado em uma pesquisa pré-eleitoral. onde eswlhemos aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas. Esse méto- do~ muito mais rápido e menos dispendioso do que a escolha de um indivídu o de cada uma da<; inúmeras zonas da área popu- lacional. Os resultados podem "er ajustados ou ponderado> para ,·on i;,ir q11alquer representação desproporcionada de grupos. t\ aiJlostJ ..tgem por conglomer::tdos é extensamente utilizada pelo go\-cmo c por organ izações part iculares de pesqu isa. fMeta -análise I I! O lermo mela-análise se refere o uma lécnico de estudo que, essencialmente, combino os resultados de outros estudos. Tem o vantagem de permitir que omos!ros menores separados sejam comb•nodos em uma única a mostro grande, tornando mais ;ign ificotivas os resultadas globais. Tem também o _ vantagem de utilizar um trabalho já lei lo. Por outro lodo, tem o desvantagem de ser apenas tão boa quan lo o lenham sido os estudos básicos. :;e esses estudos apresenta m folhas, pode ocorrer o fenômeno "gorbage in, gorbage out" (N. do T.: "O que sai é Ião bom corno o que enlra. "l A utilização da meta-análise é de uso corrente em pesquisas médicas e psicológicas. Um exemplo: "Reverso! of left Ventricular Hypertrophy in Essential Hypertension: A Melo-onolysís of Rondomized Double-blínd Studies", por Schmieder, Martus e Klingbeil, )ournal of the American Medical Associalion, Vai. 275, No. l 9. ll:à!l:rFI!MIÇÃO Na amostragem de conveniência, simplesmente utiliza- mos resultados que já es tão disponíveis. Em alguns casos. os resultados da amostragem de conveniên- cia podem ser a~saz bons. mas em outros casos podem apresentar séria tendenciosid ade. Ao fazer uma pesquisa sobre pessoas ca- nhotas. seria conveniente um estudan te pesquisar 'eus próprios colegas de classe. porque estão ao seu alcance imediato. M.;smo que tal amostra não seja aleatória. os 1·esultac!os devem '~r bem satisfatórios. Em conu·apartida, puderia ser muito conveniente (e talvez mesmo lucrativo) para a ABC News fazer uma pesquisa pedindo aos espectadores que liguem para um nümero de telefone "900" para registrar suas opiniões. mas essa pesquis:1 seria auto- selecionada c os resultados seriam provavelmente tendenciosos . A Figura 1-2 ilu stra os cinco métodos mais comuns de amos- tragem que acabamos de desc rever. Essas descrições pretendem ser bre ves e gerais. O cun hecimenlu aprofundado desses diver- sos métodos. que permita su a utilização L<~lll pro veito. exige um estudo muito mais extenso. que ul.trapassa o nível de um curso introdutório. Para manter esta seção em perspectiva. notemos que este texto fará re ferê ncia freq üente a dados ·'selecionados alea- toriamente". n que significa que os dados foram selec ionados ele modo que todos os elementos da população têm a mesma chan- ce de serem escolh idos. Conquanto não façamos referênci a fre- qliente aos o utros métodos de amostragem, devemos ter consci- ência de que eles existem. e que o método de amostragem exige planejamento e execução cuidadosos. Os métodos apresentados em todo este texto dependem de amostras que tenham sido obtidas cu idadosamente. Além disso. o tamanho ela amostra deve sen1pre ser suficientemente grande para os propósitos em vista. (Os pro- blemas de tamanho da amostra são abordados mais adiante. espe- cialmente no Capítulo 6.) Muitas pessoas acreditam que as gran - des amosu·as são sempre boas. mas mesmo essas podem ser to tal- mente desprovida~ de valor. se os dados tiverem sido eoletaclos de maneira negligente. Finalmente. se es tamos medindo uma can lc- terística (como altura) de um conjunto de indivíduos. podemos obter resultados mais precisos se fizermos nós mesmos as medi- das , em vez de pedirmos aos indivíduos que indiquem os valores. Este último procedimento pode resultar em um número despro- porc ionado de resultados arredondados. assim como muitos resul - tados que retletem valores desejados cm lugar de valores e{PÚ\'Os. Não importa quão bem planejemos e execu temos o processo de coleta de amostra,, há sempre a possibilidade de um erro nos resu ltados. Como exemplo. escolhil aleatoriamente 1000 ad ul- tos e pergunte a eles se têm u curso secundürio completo. reg is- trando a porcen tagem de res pos tas "sim". Escolhido um ou tro grupo ele I 000 indivíduos, é provável que se obtenha uma por- centagem amostral diferente. D§fli!NII~ÕI'ES Um erro amostral é a diferença entre um resultado amos- tral e o verdadeiro resultado populacional; ta.is erros resul- tam ele flutuações amos trais aleatórias. Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados incorretamente . Tais erros resultam de um erro que não seja uma simples t tt ~ J / .. ~')} . . . . . · .!) t ~,®,~ ® t2ltQ ~ ',~ -·.-''' .' '' Introdução it EstGtísücu II Amostragem Aleat6ria Cada elemento da população tem a mesma chance de ser escolhido. Em geral utilizam-se computadores para gerar -números de telefone aleatórios. Amostragem Estratificada Classificar a população em, ao menos, dois estratos e extrair uma amostra de cada um. Amostragem Sistemática Escolher cada elemento de ordem k. Amostragem por Conglomerado Dividir em seções a área populacional, 6elecionar aleatoriamente algumas dessas seçõe6 e tomar todos os elementos das mesmas. Amostragem de Conveniência . Utilizar resultados de fácil acesso. ~ ~~ 4~li'~ · .. :~·;. ,......... . Fig. 1-2 Métodos comuns de amostragem. flutuação amostral aleatória, como a escolha de uma amos- tra não-aleatória e tendenciosa, a utilização de um instru- mento de mensuração defeituoso, uma questão formulada de modo tendencioso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais. Se extrairmos uma amostra cuidadosamente, de forma que ela represente realmente a população, podemos aplicar os mé- todos descritos neste livro para analisar o erro amostral, mas devemos ter o máximo cuidado em minimizar os erros não- amostrais. Hawthorne e os Efeitos do Experimentador O bem conhecido efeito placebo ocorre quando um indivíduo não trotado acredito incorretamente que está recebendo um tratamento real e reporto uma melhora dos sintomas. O efeito Hawthorne ocorre quando individuas tratadas respondem de maneiro um tanto diferente, simplesmente porque são partes de um experimento. [Esse fenãmeno foi chamada "efeito Hawthorne" porque foi observado pelo primeiro vez em um estudo levado o efeito em operários da fábrica da Western Electric, em Howthome.} Ocorre um efeito de experimentador {às vezes chamado efeito Rosentholl) quando o pesquisador ou experimentador involuntariamente inAuencio o indivíduo pesquisado, através de fatores como expressão facial, tom de voz ou atitude. .,_ 1 L \~ J 2 ESTATÍSTICA 1-4 exercidos A: Habilidades e Conceitos !Básicos Nos Exercícios 1-4, deten nine se a descrição dada corresponde a wn estudo observacional ou a um experimento. 1. Med~-se o conteúdo de alcatrão, nico~ina e monóxido de carbono em diferentes marcas de cigarro (conforme Conjunto de Dados 4 no Apêndice B). 2. Pede-se a fumantes que reduzam à metade o número de cigarros consumidos diariamente, para que se possam medir os efeitos so- bre a freqüência ele pu lsação. 3. Em uma turma de educação física, estuda-se o efeito dos exercí- cios ffsicos sobre a pressão sanguínea. detenninando-se que meta- de dos estudantes ande uma milha cada dia, enquanto a outra me- tade corra uma milha diária. 4. Estuda-se a relação entre os pesos de ursos e seus comprimentos, tomando-se as medidas em ursos anestesiados. Nos Exercícios 5-16, identifique o tipo de amostragem utiliza- do: aleatória, estratificada. sistemática, por conglomerado ou de conveniência. 5. Quando escreveu Women and Lave: A Cultural Revolurimz. a au- tora Shere Hitt: baseou suas conclusões em 4.500 respostas a !00.000 questionários distribuídos a mulheres. 6. Um psicólogo da Universidade de Nova York faz uma pesquisa sobre todos os estudantes de cada uma de 20 tunnas selecionadas aleatoriamente. 7. Um sociólogo na Universidade de Charleston seleciona 12 homens e 12 mull1eres de cada uma de quatro turmas de inglês. 8. A empresa Sony seleciona cada 200."CD de sua linha de produção e faz um teste de qualidade rigoroso. 9. Um cabo eleitoral escreve o nome de cada senador dos EUA. em cartões separados, mistura-os e extrai lO nomes. 10. O gerente comercial da America Online testa uma nova estratégia de vendas selecion:mdo aleatoriamente 250 consumidores com renda inferior a $50.000 e 250 consumidores com renda de ao menos $50.000. 11. O programa Planned Parenthood (Planejamento Familiar) pesquisa SOO homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. 12. Um pesquisador de mercado da American Airlines entrevista todos os passag<'iros de cacla um de lO vôos selecionados aleatoriamente. 13. Um ppsquis"dor médico da Universidade Johns Hopkins entrevis- ta todos os portadores de leuco::mia em cada um de 20 hospitais seleci•.ln:1dm dieatoriamente. 14. Um rcpórte•· da revista Bttsi11ess Week entrevista todo 50.0 gerente geral constante da relação das lOOO empresas com maior cotação de sua' ações. 15. Um repóner da revista Business Week obtém uma relação nume- rada das 1000 empresas com maiores cotações de ações na bolsa, utiliza um computador para gerar 20 números aleatórios e então entrevista o~ gerentes gerai> das empresas correspondentes aos números extraídos. 16. Ao fazer uma pesquisa para um noticiário vespertino de Boston, um repórter da NBC entrevista 15 pessoas que saem do auditório da IRS. 1-4 E;{erc:fldos B: Além do Básico 17. Aberta e fechada são dois tipos de questões de uma pesquisa. Uma questão aberta pennitc uma resposta livre, enquanto uma questão 18. fechada comporta apenas uma resposta fixa. Alguns exemplos baseados em pesquisas Gallup. Questão aberta: Na opinião do leitor, que se pode fazer para redu- zir o crime? Questão fechada: Qual das seguintes medidas mais contribuiria para a redução da criminal idade? Contratar mais policiais. Fazer com que os pais eduquem melhor os filhos. Melhorar as condições sociais e econômicas nas favelas . Ampliar os esforços para reabilitação nas cadeias. Aplicar sentenças mais severas aos criminosos . Reformar os tribunais. a. Quais são as vantagens e as desvantagens das questões aber- tas? b. Quais as vantagens e as desvantagens das questões fecha- das? c. Que tipo é mais fácil de analisar com processos estatísticos fonnais? Por quê? Descreva detalhadamente um método que poderia ser usado para ~1\ obter uma amostra aleatória s imples das alturas de cinco alunos de . ". · sua turma de estatística. s · 1 ~5 Esitatistica com Ca~culadoras e Computadores Um subproduto importante do programa espacial dos EU.(\ é a invenção do chip ele microprocessador- uma invenção que teve profunda influência na aplicação da estatística. A instalação de chips de microprocessador em c<~ leu I adoras e computadores eli- minou a tremenda tarefa de cálculos monótonos, tornando o uso da estatística mais acessível a muitas pessoas. Descreveremos brevemente, nesta seção, o papel das calcuJacloras e dos compu- tadores na estatística. Calculadoras Os estudantes de estatística cedo descobrem que uma calculado- ra é um de seus melhores auxiliares. Além de ter as operações básicas ( + , -, X, _,., o[ etc.), muitas calculadoras apresentam hoje recursos estatísticos especiais, como média, desvio-padrão c resultados de correlação/regressão. (Esses tópicos serão abor- dados em capítulos posteriores.) Além de possibilitar o cálculo de expressões complicadas e de certas operações estatísticas, algumas calculadoras também permitem a introdução e annaze- nagem ele programas especiais a serem utilizados durante todo o curso. A TI-83 da Texas Instruments é um excelente exemplo de calculadora perfeitamente adaptável a um curso introdutório ele estatística. E programável, pode exibir gráficos e tem não poucas funções eslatísticas especiais incluídas. Existe um disco separado com programas escritos para a TI- 82 e TI-83, e esses programas podem ser transferidos de um com- putador para a calculadora. Alguns professores de estatística exigem que todos os seus alunos utilizem uma calculadora TI- 83, outros exigem qualquer calculadora que processe estatística bivariada e outros fi nalmente aceitam o uso de qualquer calcu- ladora. Para o estudante que ainda não tem uma caJculaclora, re- comenda-se uma que seja capaz de processar estatística de duas variáveis. Qualquer que seja a calculadora escolhida, o mmlUal que a acompanha é um guia valioso. Em caso de dúvida, consul- te o manual e procure fazer os exemplos apresentados. Se ainda assim ti ver dificuldade, recorra ao seu professor. Computadores O computador desempenha hoje papel relevante em quase todos os aspectos da análise estatística. A ampla diversidade de com- putadores e pacotes de softwru-e possibi litou a utilização da es- tatística por pessoas com diferentes tipos de formação matemá- tica, mas também criou maior oportunidade de uso indevido da estatística. É importante reconhecer que tanto os pacotes de soft- wru-e como os computadores têm uma limitação muito séria: eles seguem cegamente as instruções, ainda que inadequadas ou mesmo absurdas. O computador não raciocina, e não pode for- mular julgamentos. A compreensão dos princípios da estatística é pré-requisito importante pru-a a correta interpretação de resul- tados obtidos por computador. Mesmo que o leitor não venha a usar efetivamente os computadores neste curso, deve procurar desenvolver habilidade em interpretar resultados de análise es- tatística obtidos em um computador, c-omo os que ocorrem em todo este texto. Fru-emos referência freqüe ntemente a dois pacotes em parti- cular: O STATDISK e M initab. O STATDISK apresenta uma vantagem importante: é um programa fácil de ser usado. O Minitab já é urn pacote estatístico de nível mais elevado, mas também é de utilização relativamente fácil. Com o STATDISK e o Minitab, os programas são escolhidos de uma barra de ferramentas no topo da tela, como segue: STATDISK: File Edit Analysis Data Help Minitab: File Edit Manip Ca le Stat Graph Editor Window Help Utilizando STATDISK ou Ivlinitab, podemos familiarizar-nos melhor com a operação geral de um computador. Os exemplos que seguem ilustram alguns aspectos básicos de STATDISK e Minitab: Para introduzir um novo conjunto de dados: ST A TDISK: Selecionar Da ta da bru-ra de ferramentas e es- colher então a opção Sample Editor . Minitab: Selecionar File da ban·a principal e escolher então a opção New Worksheet. Para salvar e nomear um conjunto de dados: STA TDISK Selecionar File da barra principal e escolher então a opção Save As . Minitab: Selecionru- File da barra principal e escolher então a opção Save Worksh eet As . .. Para abrir um arquivo de dados previamente armazenado: STATDISK: Sclecionar File da barra principal e escolher então a opção Open. Introdução à Estatísticu 13 Para imprimir resultados : STATDISK: Selecionar File da barra principal e escolher a opção Print. Minitab: Selecionru- File da barra principal e escolher a opçã? Print 11/indow . Para sair do programa: STATDISK: . Selecionar File da barra principal e escolher então a opção Quit . Minitab: Selecionar File da barra principal e escolher então a opção Exit. STATDISK e Minitab são ambos capazes de realizar quase to- das as operações importantes abordadas neste livro . Apresentamos apenas algumas cru-acterísticas de STATDfSK e Minitab, mas a utilização desses programas é abordada com maior detalhe em STATDISK Student Laboratory Manual and Workbook (7." edição) e em Minitab Student Laborat01y Manu- al and Workbooic (7. "edição). As características e a apresenta- ção ele alguns resu ltados dados por esses programas são também discutidos em todo este livro, sempre que adequado. Alguns professores de estatística preferem outros pacotes como SPSS, S AS, BMDP, Execustat, Systat, Mystat ou Statgraphics. Qualquer que seja o pacote escolhido, o estudante sempre se beneftciará, melhorando seus conhecimentos em uma área que se tornou tão importante. Deixe o Computador Ligado Algumas pessoas costumam desligar o computador logo após o término de determinado tarefo, enquan to outros deixom·no ligado até que não precisem mais utilizá~o naquele dia. O painel de circuitos e os chips do computador sofrem com esses ciclos de ligo/desligo. Mos o monitor pode se danificar quando a mesma imagem é deixado no tela por períodos de tempo muito longos. O tempo médio entre interrupções (MTBF = Meon Time Between Failures) paro o disco rígido já foi de 5000 horas, mos hoje é de cerca de 30.000 horas . Considerando os efeitos danosos dos ciclos on/off sobre o painel de circuitos e os chips do computa dor, e o grande MTBF poro discos rigidos, foz sentido deixar o computador ligado até o fim do dia, desde que o tela do monitor posso ser protegido utilizando-se um programo para descansar a tela. Muitas pessoas uti li zam essa estra tég ia, que se originou em parte de uma análise estatística de eventos passados. 1-5 !Exercidos A: !HlabiHdades e Conceitos IB>ósi«:os Exercícios iniciais com calculadora: Nos Exercícios 1-8, as ex- pressões apresentadas são análogas às que se encontram em diferentes partes do livro. Utilize sua calculadora para obter os valores indicados. 1. 3,44 + 2,67 + 2,09 + 1,87 + 3,11 5 2. ~(2- 5)2 + (4- 5)2 + (9- 5)1 3 - 1 I Minitab: Selecionar File da barra principal e escolher 3. /3(101) - 15 2 então a opç_ão Open Worksheet . "V >'- 't .. L I ~ ~ tDlfi 14 E STATÍSTICA 4 . (12 - 8,5) 1 + .:...(2_2_-_25-"",3-'):....2 8,5 25,3 " 1,96 2 • 0,25 - · 0.03 2 6. 102,7 - 100,0 14,2 ,f50 15 1 7. 9 !61 (SugesLão: 6 !=6x5 x4x3x 2xl) S. 8(56,80) - ( 14,60) (26) J8(32,9632)- (14,60)' Ji;(L04)- (26 )2 1-5 Exercícios B: Além do Básko 9. Carregar STATDISK ou Minitab e abr ir o arq uivo do con- junto de dados indicado a seguir. Esses dados já estão ar- mazenados. Escreva os três primeiws valo res relac ionados . STATDISK: BLUE . soo (pesos de balas M &M azuis) Minitab: ALFI\LFA. HTVJ (safras de alfafa de di versas variedades em diferen tes p lantações) 110. Carregar STATDISKou Minitab e salvar as seguintes quanti- dades de alcatrão (em miligramas por cigarro) para 15 cigar- ros diferentes. Salve os dados com o nome de arquivo CIGTAR. 16 16 9 8 16 13 15 9 2 15 15 9 14 6 18 Abra o arq ui vo de dados para verificar que foram realmente salvos e obtenha uma apresentação impressa dos mesmos. Vocabulário estatística população censo amostra parâmetro estatística dados quantitativos d.tdo' qualitativos dadus discretos dados contínuos nível nominal de mensuraç~o nível ordinal de mensuração mvel intervalar de mensuraçuo nível de razão ele mensuração pesquisa auto-selecionada estudo observacional experimento confund imento amostra aleatória amostra aleatória simples amostragem estratificada mHostragc:-n sistcrnál i~a amostragem por conglomerados amostragem de coll\·cniência cn·o amostra l erro não-amostral Revisão fniciamus este capítulo com um;rdescrição geral da natureza da esta tís- tica e abordamos di ferentes aspt;ctos da natureza elos dados . Ilustramos com exemplos usos e abusos da estatística. Discutimos o planejamento de experimentos enfatizando a im[Jortiincia dos métodos de boa amos- tragem. Encerramos o capítu lo Cl•ill uma rápida discussão do papel das calculadoras e dos computadorc.<. Ao completar o estudo deste capítu- lo, o estudante deve ser capaz de: Disti nguir entre uma população e uma amostr a Distinguir entre um parâmetro e uma estatís tica [cientificar o nível de mcnsuraç5o (nominal, ordinal, intervalar, razão) de um conjunto de dados ~ ..... ~ .... ""~:--.~~~.,~··~~~. Reconhecer a importância dos métodos de boa amostragem. be m como a séria deficiência dos métodos viciados de amostragem Reconhecer que as pesquisas auto-selecionadas não podem servi r de base para fom1ar conclusões vá lidas sobre uma população Ex ercícios de Revisão 1. O Laboratório de Teste de Produtos para o Consumidor seleciona uma dúzia de pilhas (i nd icadas como de 9 vo lts) de cada um elos fab ricantes, e testa a capacidade efeti v a de cada uma. a. Os valores obtidos são d iscretos ou contínuos? b. Iden tifique o nível de mensuração (nominal. ord inal, interva lar. razão) para as vo ltagens. c. Que tipo de amostragem (aleatória, estrati licada, sistemática, por conglomerado, de conveniência) está sendo utilizado? d. Trata-se de um esntdo observacional ou de um expe rimento? e. Q ual é o efeito relevante da utilização, pelo consumidor, de pilhas rotuladas como de 9 volts, quando, na realidade, seu ní- vel de voltagem é mu ito d iferen te? 2. Os pesquisadores do Laboratório de Teste de Produtos para o Con - sumidor testam amos tras de protetores eletrõn icos contra variações de corrente para determinar os níveis de vo ltagem que podem da- nificar os computadores. Para cada um dos casos seguintes. deter- mine qual dos quatro níve is de mensuração (nominal, ordinal, interva lar, razão) é apropriado. a. Os níveis ele vo ltagem que causam dano. b. Postos (primeiro, segundo, terceiro etc.) por ordem de qualida- de pa ra uma amostra ele protetor~s. c. Relacionar os protetores como "recomendado. aceit{lvei, não- .aceitável". d. As temperaturas das sa las em que os protetorcs são testados . e. Os países em que os protctores foram fabricados. 3. A revista Business Week faz uma pesquisa, enviando pelo correio um questionário a 5000 pessoas que investem em títulos. Com base nos resultados, os edito res das revista concluem que~ maioria dos investidores nos EUA estão pessimistas quanto à economia. Qual o erro desta conclusão? 4. Identifique cada cifra como discreta o u contínua. a. A Nielsen Media Research Organization (Organização de Pes- quisas Nie lsen) pesquisou 2027 adulto> que assistem ao pro- grama Mo11day Nigltt Footb"llna ABC. b. O Professor Fisher regis trou os tempos gastos por estudan tes de estatística para completarem um exame fina l. c o prime iro resultado foi 87,25 minutos. c. Kathy Patcl pesou seu livro ele e~tatística e obteve o valor ele 1,87 lb. 5. fdentifiquc o tipo de amostragem (aieatória, estratificada, si> temá- tica, por conglomerado, de conwniênua) utilizada cm ctda u:n do~ casos ~egul ntes: a. Obtém-se uma amostra ele um produto extraindo-se cada 100." unidade da linha de mon tagem. b. Geram-se números aleatórios em um computador para selecio- nar números de série de ca•Tos a 'erem escolh idos para uma amostra de teste. c. Um fornecedor ele peças para automóvel obtém uma amostra de todos os itens de cada um de 12 fornecedores selecionados aleatoriamente. d . Um fabricante de automóveis faz um estudo de mercado compre- endendo testes de direção feitos por uma mnostra de I O homens e 1 O mulheres em cada uma de quatro diferentes faixas etárias. e. Um fabricante de au tomóvei> faz um estudo de mercado en tre- vistando clientes em potencia l que so li c itam tes te de di reção a um revendedor local. 6. Agenciadores do censo constataram que ao pe rgun ta r a idade das pessoas encontram mais pessoas com 50 anos elo que com 49 ou 5 l. Pode explicar por que isso ocotTe? 7. O leitor. pretende fazer uma pesquisa em seu campus. Onde está 0 etTO ao selecionar cada 50.0 estudante que sai da la nchone te? ... 8. O Southport Chronicle reportou que uma corrida preliminar foi assistida por 8725 pessoas. Comente. · Exercícios Cumulativo s de Revisão Os exercícios cumulativos de revisão deste livro destinam-se a incor- porar algum material de capítulos anteriores, uma caracrerísrica que será implementada IZOS capitulas seguintes. Os exercícios desta seção utilizam conceitos aprendidos antes do esllldo deste livro. 1. A pergunta seguinte, feita em uma pesquisa, teve repercussão quan- do as respostas sugeriram que cerca de 22% dos americanos acha- vam que o holocausto pode não ter existido. "Acha possível ou impossível que a exterminação de j udeus pelos nazistas nunca tenha existido?" Uma pesquisa subseqüente revelou que os que responderam pro- vavelmente se sentiram confusos pela dupla negativa da frase. Eis uma formulação adequada em uma pesquisa Roper subseqüente: "Acha possível que a exter minação de judeus p d os nazistas j amais ocorreu, ou está certo de que realmente aconlcccu?" Esta segunda versão parece substancialmente menos confusa? Pode formular a questão de modo que ela se apresente ainda mais clara do que nas duas versões? Introdução à Estatísti<:<t 15 2. Observe a figura a seguir. É semelhante a uma a que Edwin Tufte, autor de The Visual Display of Quantitatíve Data, se refere quan- do observa: "Este pode muito bem ser o pior gráfico jamais dado à imprensa". Observe que o gráfico relac iona "quase por acaso, ape- nas cinco conjuntos de dados (pois a d ivisão demro de cada ano soma 100 por cento)". Examine primeiro o gráfico e identifique a informação que ele procura transmitir. faça então um novo gráti- co retratando a mesma situação. Projeto paro Computador g Recorra ao Conjunto de Dados 2 no Apêndice B e considere as I 06 tem- peraturas (em graus Fahrenheit) encontradas na última coluna (Dia 2, 12 horas). Os pesquisadores da Universidade de Maryland coletaram dados sobre a temperatura do corpo humano e constataram que a média não era de 98,6°F, valor que quase todos nós supomos ser a média cor- reta. Utilizando o STATDISK ou o Minitab, introduza as 106 tempera- turas e as salve sob o nome BODYTEHP. O objetivo deste projeto de computador é introduzi r os dados e armazená- los em um disquete de computador. Isso permitirá termos os dados disponíveis para us5-Ios no Capítulo 2, contribuindo tam- bém para aumentar sua capacidade de introduzir e. armazenar dados em um computador- uma técnica criticamente importante nos dias atuais. ESTRUTUR.A ETARIA DA MATP..ÍCULA EM FACULDADES "' ~ " '~ ~ " "" "5 ~ ~ ~ "' ~ " " ~ .e 72.0 1972 1973 1974 1975 1976 - ,. ~L ~. ,j :,---- ------ ... ~- --- ·- -- - ~l"~;:~.-~.--:.~·~..;~,-::-~1--:--:r:t.·!O:·:'!x.-.: ... • ,.:-"'"'"=::---:~"":".~ ~ 16 EsTATiSTICA Dados Mal Representados Obtenha um exemplo de um jornal ou uma revista em que os dados tenham sido apresentados de maneira enganosa. Iden-- tifique a fonte (incluindo data de publicação) de onde o exem- 1. Atividade extraclasse: Divida em grupos de cinco eco- lete 50 valores utilizando amostragem aleatória, confor- me descrita na Seção 1-4. Repita então a coleta de 50 valores para cada um dos outros quatro métodos de amos- tragem: estrati ficada, sistemática, por conglomerados e de conveniência. Em cada caso, calcule a "média". (A média é definida no Capítulo 2 e se obtém somando-se todos os valores e dividindo-se o total pelo número ele valores.) Descreva inicialmente, com detalhe, o proces- so utilizado para cada método de amostragem; relacione então os valores e compare as cinco médias. Os diferen- tes métodos parecem dar os mesmos resultados? Os da- dos devem ser extraídos de uma população como idades dos livros em uma biblioteca, ou idades dos carros no es- tacionamento da faculdade. pio foi tirado. Explique como a apresentação é enganosa e sugira uma forma· mais honesta de apresentar os dados. 2. Atividades na classe: Divida em grupos de três ou quatro e utilize os dados a seguir para construir um gráfico que exa- gere os aumentos nos pontos altos da Média Industrial Dow Jones. Construa ourro gráfico que minimize a impOttância desses aumentos, e finalmente construa um terceiro gráfico que represente os dados sem qualquer tendenciosidade. Década 1950 1960 1970 ] 980 Dow Alto 683 995 1.052 2.796 3. Atividades na classe: Divida em grupos de três ou quatro. Suponha que deve fazer uma pesquisa junto a estudantes de tempo integral ele sua faculdade. Planejc e descreva de- talhadamente um processo para obter uma amostra alea- tória de 100 estudantes. ent is ta Paul Mones Paul Manes é advogado, autor e consultor. Escreveu When o Child Kills: Abused Children Who Kil/ Their Porenls. Escreveu também Stolking Justice, o verdadeira história de um detetive que utilizou pela primeira vez impressões digitais DNA para apanhar um assassino contumaz. Foi entrevistado em muitos programas importantes nos EUA, na Europa e na Austrália, inclusive "60 Minutos", "20/20" e "Larry King live". Seus comentários apareceram em jornais e revistas como o New Yark Times e Time; foi correspondente legal poro "NBC News". Treina médicos, advogados e oficiais de justiça, e testemunho perante comissões legislativos. O senhor utiliza a estatística em seu trabalho como advogado? Utilizo extensamente a estatístico em meu trabalho. Com o dactiloscopia DNA, por exemplo, consideramos vários fatores e determinamos a probabilidade de obter uma seqüência específico de genótipos nas mesmas pessoas. Costumá•tomos atentar poro três /oci (posições que os genes ocupam nos cromossomas); em seguido possamos paro cinco, mos agora estamos em sete. Estudamos uma amostra de referência e uma amostro de comparação para ver a freqüêncio com que determinado seqüêncio ocorre. Se o seqüêncio de um suspeito coincide em sete loci, existe uma boa chance de o suspeito ser culpado; em seguido dete rminamos o freqüêncio daquela ;eqüêncio no população. Em Stolking Justice, os chances eram de 1 em 750.000.000 de outro pessoa ter o mesmo perfil DNA do acusado no coso. Aplicamos o teste de hipóteses e determinamos o nível de significância poro o perfil DNA específico. O DNA é também muito importante em investigações de paternidade e casas de estupro. Com os testes convencionais de sangue-enzima, poderíamos chegar a cerca de 10% do população. Isso significa que há uma chance em 1 O de o culpado nõo ser o acusado. Com o doctiloscopia DNA, temos uma chance em 300.000.000, e entramos a ssim no domínio do inevitabilidade estatístico. O processo é usado nõo somente poro condenar pessoas, mas também paro excluir suspeitos. Há um caso famoso no Carolina da Norte, em que duas testemunhos oculares testificaram que o acusado era um estuprodor. Ele Ficou preso 11 anos, mas foi liberado quando o DNA mostrou que ele nõo era o culpado. Nesse caso, o estatístico e o DNA se revelaram muito mais precisos do que as identificações por testemunhos oculares. Tenho utilizado a esta tística em casos de homicídio, de abusos de crianças, de mulheres espan.:odas e de paternidade. Nos casos de paternidade hoje, os resultados da DNA são tão precisas que todo o sistema de julgamento está sendo abreviado. Os condenados simplesmente não vão a julgamento quando os resultados da DNA são bastante claros. Uma dúvida razoável se transforma em nenhuma dúvida. A grande pergunta é: "A estatístico é tõo poderoso a ponto de tirar do júri suo responsabilidade de tomar decisões?" Há exceções, mas, no maioria dos casos, a presença de uma Forte evidência estatístico é um instrumento e ficiente poro o tomada de decisões. Como advogado que faz extenso uso da estatística, o senhor acha que todos os advogados deveriam conhecer os princípios da estatística? Eles necessitam de muito mais. Se queremos dominar efetivamente nosso evidência, devemos ter algum Fundamento estatístico.
Compartilhar