Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 INTRODUÇÃO À ESTATÍSTICA - Aspectos gerais A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair informações. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da organização e descrição dos dados, desconhecendo que o aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente. Ela abrange muito mais do que o simples traçado de gráficos e o cálculo das médias. Em estatística, utilizamos extensamente os termos população e amostra. Esses termos, que passamos a definir, estão no próprio cerne da estatística. Uma população é uma coleção completa de todos os elementos (valores, pessoas, medidas, etc.) a serem estudados. Um censo é uma coleção de dados relativos a todos os elementos de uma população. Uma amostra é uma subcoleção de elementos extraídos de uma população. Estreitamente relacionados com os conceitos de população e amostra estão os conceitos de parâmetro e estatística. Um parâmetro é uma medida numérica que descreve uma característica de uma população. Uma estatística é uma medida numérica que descreve uma característica de uma amostra. Exemplo Em uma pesquisa com 1015 pessoas escolhidas aleatoriamente, 269 (ou 26,5%) possuíam computador. Como a cifra de 26,5% se baseia em uma amostra, e não em toda a população, trata-se de uma estatística (e não um parâmetro). Já se uma pesquisa feita entre os 27 governadores do Brasil mostra que 20 (ou 74%) possuem computador, a cifra 74% é um parâmetro porque se baseia em toda a população de governadores. 2 - A natureza dos dados Alguns conjuntos de dados (como alturas) consistem em números, enquanto outros são não-numéricos (como sexo, cor dos olhos). Aplicam-se as expressões dados qualitativos e dados quantitativos para distinguir esses dois tipos. Os dados qualitativos (ou dados categóricos, ou atributos) podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica. Os dados quantitativos consistem em números que representam contagens ou medidas. Eles se subdividem em 2 tipos: discretos e contínuos. Os dados discretos resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores. (Ou seja, o número de valores possíveis é 0, ou 1, ou 2, etc). Os dados contínuos (numéricos) resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas ou interrupções. Quando os dados representam contagens, são discretos; quando representam mensurações, são contínuos. - Usos e abusos da estatística Usos da estatística Hoje praticamente todo campo se beneficia da utilização de métodos estatísticos. Vamos ver alguns exemplos: o Técnicas de controle de qualidade de um produto; o Controle de doenças; o Espécies ameaçadas são protegidas; o Redução de taxas fatais. Abusos da estatística Algumas vezes os dados são apresentados de forma enganosa. Isso constitui um abuso da estatística. Alguns dos que abusam da estatística o fazem por descuido ou ignorância; outros, porém, têm objetivos pessoais. Passemos a alguns exemplos das diversas maneiras como os dados podem ser distorcidos. o Pequenas amostras: As pequenas amostras não são necessariamente más; entretanto, os resultados obtidos com pequenas amostras podem por vezes ser usados como uma forma de “mentira” estatística. As preferências de 10 dentistas por determinado dentifrício não devem servir de base para uma afirmação generalizada como “A pasta detifrícia X é recomendada por 7 a cada 10 dentistas”. Mesmo que a amostra seja grande ela não deve ser tendenciosa. Não adianta se uma amostra for 3 grande mas se forem feitas conclusões acerca de sub-grupos desta amostra. o Números precisos: Às vezes, os próprios números podem ser enganosos. Uma cifra $37.735,29 pode parecer muito precisa enquanto que a cifra $37.700,00 não infunde o mesmo senso de precisão. No entanto, uma estatística com muitas casas decimais não é necessariamente precisa. o Estimativas por suposição: Estimativas por suposição podem apresentar erros substanciais. É preciso considerar a fonte da estimativa e a maneira como foi estabelecida. Quando o Papa visitou Miami, as fontes oficiais estimaram uma multidão de 250.000 pessoas, mas utilizando fotos aéreas e grades chegou- se a uma cifra mais precisa de 150.000 pessoas. o Porcentagens distorcidas: Por vezes utilizam-se porcentagens confusas ou distorcidas. Num anúncio de página inteira, a Continental Airlines anuncia que no caso de bagagens extraviadas se trata de uma área em que já melhoraram 100% nos últimos 6 meses. Em uma crítica a esta estatística, o New York Times interpretou corretamente uma melhora de 100% significando que não se extravia mais qualquer bagagem, o que não é verdade. o Cifras parciais: “Noventa por cento dos carros vendidos nos EUA nos últimos 10 anos ainda estão rodando.” Milhões de consumidores ficaram com a impressão de que os carros devem ter sido muito bem construídos para durarem tanto. O que o fabricante não mencionou é que 90% dos carros por ele vendidos, o foram nos últimos 3 anos. o Perguntas tendenciosas: As perguntas em uma pesquisa podem ser formuladas de modo a “sugerirem” uma resposta. Um exemplo famoso envolve o candidato à presidência dos EUA que formulou a seguinte pergunta em um questionário: “O presidente deve ter o poder de vetar as decisões do Congresso?” Noventa e sete por cento das respostas foram “sim”. Entretanto, esse percentual caiu para 57% quando a pergunta foi “ O presidente deve ter, ou não, o poder de vetar as decisões do Congresso?” Às vezes, até mesmo a ordem dos itens a serem considerados pode influenciar na resposta. o Gráficos enganosos: Muitos dispositivos visuais podem ser utilizados para exagerar ou diminuir a verdadeira natureza de um conjunto de dados. 4 0 100 200 300 400 500 600 700 800 Homens Mulheres G an ho s em an al m ed ia no e m dó la re s o Pictográficos: Os desenhos de objetos, chamados pictográficos, também podem levar a erros. Ao desenhar objetos para ilustrar dados o artista pode criar falsas impressões. Por exemplo, se duplicarmos o lado de um quadrado, a área desse quadrado não é apenas duplicada e, sim quadruplicada. o Pressão do pesquisador: Quando se formulam perguntas a indivíduos pesquisados, esses freqüentemente dão respostas favoráveis à sua auto-imagem. o Más amostras: Uma fonte de estatística enganosa são os métodos inadequados de coleta de dados. Um exemplo é uma pesquisa auto-selecionada. Esta constitui de uma pesquisa em que os próprios entrevistados serão incluídos. - Planejamento de experimentos Os estudos que utilizam métodos estatísticos vão desde os que são bem concebidos e executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal executados, levando a conclusões enganosas e sem qualquer valor real. Eis alguns pontos importantes para o planejamento de um estudo capaz de produzir resultados válidos: 1. Identificar com precisão a questão a ser respondida e definir com clareza a população de interesse. 2. Estabelecer um plano para coleta de dados. Esse plano devedescrever detalhadamente a realização de um estudo observacional ou de um experimento (ambos definidos a seguir), e deve ser elaborado cuidadosamente, de modo que os dados coletados representem efetivamente a população em questão. 3. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resultar de uma coleta tendenciosa de dados. 4. Analisar os dados e tirar conclusões. Identificar também possíveis fontes de erros. 500 550 600 650 700 750 800 Homens Mulheres G an ho s em an al m ed ia no e m d ól ar es 5 Obs.: Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases correspondentes à estatística descritiva, fazemos uma análise dos resultados obtidos, através dos métodos da Estatística indutiva ou inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. Os estudos que requerem métodos estatísticos decorrem tipicamente de duas fontes comuns: estudos observacionais e experimentos. Em um estudo observacional, verificamos e medimos características específicas, mas não tentamos manipular ou modificar os elementos a serem estudados. Em um experimento, aplicamos determinado tratamento e passamos então a observar seus efeitos sobre os elementos a serem pesquisados. Passamos agora a definir os cinco métodos mais comuns de amostragem. Amostragem aleatória Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda amostra de tamanho n possível tenha a mesma chance de ser escolhida. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola: a) numeramos os alunos de 01 a 90. b) Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população. Amostragem estratificada Com a amostragem estratificada, subdividimos a população em, no mínimo, duas subpopulações (ou estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada estrato. Exemplo: Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada. 6 São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: Sexo População 10% Amostra M 54 5,4 5 F 36 3,6 4 total 90 9,0 9 A próxima fase consiste em selecionar, quer seja por sorteio, quer seja pelo uso de uma tabela de números aleatórios ou outro método qualquer, os 5 meninos e as 4 meninas para comporem a amostra. Amostragem sistemática Na amostragem sistemática, escolhemos um ponto de partida, e selecionamos cada k-ésimo elemento (como por exemplo cada 50º elemento) da população. Exemplo: Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra formada de cinqüenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 50 900 =18, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4º prédio, o 22º, o 40º etc., até voltarmos ao início da rua, pelo lado esquerdo. Amostragem por conglomerados Na amostragem por conglomerados, começamos dividindo a área da população em seções (ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das seções escolhidas. Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Exemplo: Numa pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais, pesquisamos todos os elementos de cada uma das zonas escolhidas. 7 Amostragem de conveniência Na amostragem por conveniência, simplesmente utilizamos resultados que já estão disponíveis. Obs.: Em alguns casos, os resultados da amostragem de conveniência podem até ser bons, mas em outros casos podem apresentar séria tendenciosidade. Exemplo: Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente um estudante pesquisar seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que tal amostra não seja aleatória, os resultados devem ser bem satisfatórios. Não importa quão bem planejemos e executemos o processo de coleta de amostras, há sempre a possibilidade de um erro nos resultados. Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não-aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, uma questão formulada de modo tendencioso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais.
Compartilhar