Baixe o app para aproveitar ainda mais
Prévia do material em texto
Núcleo de Educação a Distância – NEAD/AEDB Av. Cel. Prof. Antonio Esteves, nº 01 Campo de Aviação – Resende, RJ CEP: 27.523-000 Tel.: (24) 3383 -9020 http://www.ead.aedb.br/ead/ Núcleo de Educação a Distância – NEAD/AEDB 2 Prezado(a) Aluno(a), Seja bem-vindo a Disciplina online Bioestatística. Meu nome é Nilo Sampaio e acompanharei você como Professor Tutor durante este ano letivo. Em Bioestatística objetivamos apresentar os conhecimentos devidamente fundamentados quanto a metodologia necessária para que o Aluno saiba aplicá-los nos casos concretos do seu dia a dia. Buscamos, simultaneamente, oferecer um treinamento prático, por meio de exemplos, simulado e uma série de exercícios. O conteúdo da disciplina foi estruturado em vários módulos, os quais se encontram no link "conteúdo da disciplina". Clique nesse link para conhecer os diferentes módulos e iniciar seus estudos. Não se esqueça de acessar o calendário da disciplina (link calendário de atividades da disciplina) para acompanhar nossas atividades programadas (trabalhos, provas etc.). Finalmente, sempre que você tiver qualquer dúvida pode entrar em contato comigo via e-mail, fórum ou chats disponibilizados nesta plataforma de EaD. Abraço, Nilo Sampaio Professor Tutor. Núcleo de Educação a Distância – NEAD/AEDB 3 Conteúdo Programático 1. População e Amostragem 1.1 População e amostra 1.2 Técnicas de amostragem 1.3 Estatísticas e parâmetro Núcleo de Educação a Distância – NEAD/AEDB 4 1. - POPULAÇÃO E AMOSTRAGEM Dados corretamente coletados fornecem conhecimentos que não seriam obtidos por simples especulação. Mas nem sempre é possível levantar todos os dados. Um exemplo disso são as prévias eleitorais, que fornecem as estimativas da porcentagem de votos em cada candidato. As prévias são feitas regularmente e publicadas. Mas quem são as pessoas que os institutos de pesquisa devem entrevistar? Se estiverem pensando em eleições presidenciais, a ideia seria entrevistar todos os portadores de título de eleitor do Brasil. Mas como as prévias eleitorais são feitas com frequência, não é possível entrevistar todos os eleitores (incluindo eu e você) a cada 10 dias, por exemplo, para conhecer as intenções de voto de todos nós. Então as prévias eleitorais são feitas com pequeno número de eleitores: de 1.500 a 3.000. É o que chamamos de amostra. http://www.citisystems.com.br/wp-content/uploads/2012/12/amostra-estatistica- controle-populacao.png Núcleo de Educação a Distância – NEAD/AEDB 5 1. - POPULAÇÃO E AMOSTRAGEM 1.1 - População e Amostra O que é população? População ou universo é o conjunto de unidades sobre o qual desejamos obter informação. O que é amostra? Amostra é todo subconjunto de unidades retiradas de uma população para obter a informação desejada. Os estatísticos usam o termo população para descrever um grande conjunto de unidades que têm algo em comum. Por exemplo: pacientes, animais, radiografias ou prontuários. A distinção entre os dados realmente coletados (amostra) e a vasta quantidade de dados que poderiam ser observados (população) é a chave para o bom entendimento da Estatística. O uso de amostras permite obter respostas razoáveis, com margem de erro conhecida. O levantamento de dados de toda a população chama-se censo. A Fundação Instituto Brasileiro de Geografia e Estatística (IBGE) faz o Censo Demográfico do Brasil a cada 10 anos. Por que usamos amostras? 1. Custo e demora dos censos; Exemplo: Seria demorado e custoso examinar o peso de todos os recém-nascidos do Brasil em determinado ano. 2. Populações muito grandes; Exemplo: População de peixes do mar é finita, mas muito grande que pode ser considerada infinita para qualquer finalidade prática. 3. Impossibilidade física de examinar toda a população; Exemplo: É impossível estudar toda a população quando o estudo destrói as unidades como uma empresa que fabrica fósforos e deseja testar a qualidade do produto não pode testar todos. 4. Comprovado valor científico das informações coletadas por meio de amostras; Exemplo: O estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda a população. Núcleo de Educação a Distância – NEAD/AEDB 6 Como obtemos amostras? Antes de obter uma amostra, é preciso definir os critérios que serão usados para selecionar unidades que comporão essa amostra. De acordo com a técnica usada, tem-se um tipo de amostra: Amostra aleatória, casual ou probabilística; Amostra sem probabilística; Amostra não probabilística ou de conveniência. Atividades Propostas Para complementar este conteúdo segue uma lista de exercícios: Exercício 2 - População e Amostragem Volte para seu curso e participe do Fórum “Boas Vindas” e “População e Amostragem” no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações Núcleo de Educação a Distância – NEAD/AEDB 7 1. - POPULAÇÃO E AMOSTRAGEM Amostra aleatória, casual ou probabilística A amostra aleatória ou probabilística é constituída por n unidades retiradas ao acaso da população. Isto é, a amostra aleatória é obtida por sorteio. Logo, toda unidades da população tem probabilidade conhecida de pertencer à amostra. Para obter uma amostra aleatória, é preciso que a população seja conhecida e cada unidade esteja identificada por nome ou por número. Os elementos que constituirão a amostra são escolhidos por sorteio. Tanto o sorteio por computador como bolas em uma caixa atendem as regras do procedimento aleatório. Uma amostra aleatória pode ser simples ou estratificada. A amostra aleatória simples é obtida por sorteio de uma população constituída por unidades homogêneas para a variável que você quer estudar. Exemplo: Imagine que você quer obter uma amostra de 2% dos 500 funcionários de um instituto de pesquisas para entrevistá-los sobre a qualidade dos equipamentos dos laboratórios. Qual seria o procedimento para obter uma amostra aleatória simples? Solução: Para obter a amostra desejada você precisa sortear 10 funcionários. Você pode fazer isso da maneira mais antiga e conhecida começando por escrever o nome de todos os pacientes em pedaços de papel. Em seguida, coloque todos os pedaços de papel em uma urna, misture bem e retire um nome. Repita o procedimento até ter os nomes dos 10 funcionários que comporão sua amostra. Neste caso, é importante o sorteio ser sem reposição, ou seja, após a retirada de um nome, o papel não deve ser recolocado na urna. Assim, não haverá chances de um mesmo funcionário ser sorteada mais de uma vez. A amostra aleatória estratificada é usada quando população é constituída por unidades heterogêneas para a variável que se quer estudar. Nesse caso, as unidades da população devem ser identificadas; depois, as unidades similares devem ser reunidas em subgrupos chamados estratos. O sorteio é feito dentro de cada estrato. Exemplo: Imagine que você quer obter uma amostra de 2% dos 500 funcionários de um instituto de pesquisas para entrevistá-los sobre a qualidade dos equipamentos dos laboratórios. Você suspeita que mulheressejam mais exigentes do que homens. Aproximadamente metade dos funcionários é do sexo masculino. Você quer obter dados dos dois sexos. Qual seria o procedimento? Núcleo de Educação a Distância – NEAD/AEDB 8 Solução: Comece separando homens de mulheres. Você tem, então, dois estratos, um de homens, outro de mulheres. Depois você obtém uma amostra aleatória de casa sexo (ou cada estrato) e reúne os dados dos dois estratos numa só amostra aleatória estratificada. Amostra semi-probabilística A amostra semi-probabilística é constituída por n unidades retiradas da população por procedimento parcialmente aleatório. A amostra semi- probabilística pode ser: sistemática, por conglomerados ou por quotas. A amostra semi-probabilística sistemática é constituída por n unidades retiradas da população segundo um sistema preestabelecido. Por exemplo, se você quiser uma amostra constituída por 1/8 da população, você sorteia um número que caia entre 1 e 8. Se for sorteado o número 3, por exemplo, a terceira unidade (número 3) será selecionada para a amostra. A partir daí, tome, sistematicamente, a terceira unidade de cada oito, em sequência. No caso do exemplo, a primeira unidade é 3. Seguem, de oito em oito, as unidades de números: 11, 19, 27, etc. Exemplo: Imagine que você quer obter uma amostra de 2% dos 500 funcionários de um instituto de pesquisas para entrevistá-los sobre a qualidade dos equipamentos dos laboratórios. Qual seria o procedimento para obter uma amostra semi-probabilística sistemática? Solução: Você precisa sortear 10 funcionários. Para obter a amostra, você pode dividir 500 por 10, e obter 50. Sorteie então um número entre 1 e 50, inclusive. Se sair o número 27, por exemplo, esse será o número do primeiro funcionário que será incluído na amostra. Depois, a partir do 27, conte 50 e chame esse funcionário. Proceda dessa forma até obter a amostra de 10 funcionários. A amostra semi-probabilística por conglomerados é constituída por n unidades tomadas de alguns conglomerados. O conglomerado é um conjunto de unidades que estão agrupadas, qualquer que seja a razão. Um asilo é um conglomerado de idosos, uma universidade é um conglomerado de jovens estudantes, um serviço militar é um conglomerado de adultos saudáveis. Como exemplo, imagine que um dentista quer levantar dados sobre a necessidade de aparelho ortodôntico em crianças de 12 anos. Ele pode sortear três escolas de primeiro grau (conglomerados) e examinar todas as crianças com 12 anos dessas escolas. Exemplo: Um professor de educação física quer estudar o efeito da terapia de reposição hormonal (uso de hormônios por mulheres depois da menopausa) sobre o desempenho nos exercícios. Como obteria uma amostra semi-probabilística por conglomerados? Núcleo de Educação a Distância – NEAD/AEDB 9 Solução: O professor de Educação física pode sortear duas academias de ginástica da cidade e avaliar o desempenho das mulheres que frequentam a academia e já tiveram a menopausa (tanto as que fazem como as que não fazem uso da terapia de reposição hormonal) para posterior comparação. A amostra semi-probabilística por quotas. É constituída por n unidades retiradas da população segundo quotas estabelecidas de acordo com a distribuição desses elementos na população. A ideia de quota é semelhante à de estrato, com uma diferença: você seleciona a amostra por julgamento e depois confirma as características das unidades amostradas. A amostragem por quotas não é aleatória. A vantagem é ser relativamente barata e por isso é muito usada em levantamentos de opinião e pesquisas de mercado. Exemplo: Considere uma pesquisa sobre a preferência de modelo de carro. Como se faz uma amostra semi-probabilística por quotas? Solução: Você possivelmente irá entrevistar homens e mulheres com mais de 18 anos que vivem em uma metrópole, na proporção apresentada pelo censo demográfico em termos de sexo, idade e renda. Você então sai às ruas para trabalhar com a incumbência de entrevistar determinada quota de pessoas, com determinadas características. Por exemplo, você pode ser incumbido de entrevistar 30 homens com “mais de 50 anos que recebam mais de seis e menos de 10 salários mínimos”. Então você deverá julgar, pela aparência da pessoa, se ela se enquadra nas características descritas – homem de mais de 50 anos que ganha entre seis e 10 salários mínimos. Se achar que viu a pessoa certa, deve fazer uma abordagem e depois confirmar as características com perguntas. O número de pessoas em determinada quota depende do número delas na população. Amostra não probabilística ou de conveniência A amostra não probabilística ou de conveniência é constituída por n unidades reunidas em uma amostra simplesmente porque o pesquisador tem fácil acesso a essas unidades. Assim, o professor que toma s alunos de sua classe como amostra de toda a escola está usando uma amostra de conveniência. Exemplo: Imagine que um nutricionista quer entrevistar 50 mães de crianças com idades de 3 e 4 anos para conhecer os hábitos alimentares dessas crianças. Como obteria essa amostra? Solução: Se o nutricionista trabalha em uma escola, para obter a amostra de 50 mães de crianças de 3 e 4 anos, provavelmente procurará as mães de crianças matriculadas na escola em que trabalha. Núcleo de Educação a Distância – NEAD/AEDB 10 1.2 - Avaliação das técnicas de amostragem As amostras aleatórias exigem que o pesquisador tenha a listagem com todas as unidades da população, porque é dessa listagem que serão sorteadas as unidades que comporão a amostra. Essa exigência inviabiliza a tomada de amostras aleatórias em grande parte dos casos. Por exemplo, não é possível obter uma amostra aleatória de resendenses simplesmente porque não temos uma lista com o nome de todos os resendenses. A amostra semi-probabilística sistemática não exige que a população seja conhecida, mas é preciso que esteja organizada em filas, em arquivos, ou mesmo em ruas, como os domicílios de uma cidade. Por exemplo, para tomar uma amostra dos domicílios de uma cidade, parte-se de um ponto sorteado e toma-se, de tantos em tantos, um domicílio para a amostra. A amostra semi-probabilística por conglomerados exige livre acesso aos conglomerados, o que nem sempre se consegue. Um médico pode sortear cinco hospitais da cidade de São Paulo para entrevistar pacientes internados por problemas cardíacos, mas dificilmente conseguirá permissão da diretoria de todos esses cinco hospitais para fazer sua pesquisa. A amostra semi-probabilística por quotas exige algum conhecimento da população, mas as unidades não precisam estar numeradas ou identificadas. Se você quiser uma amostra de homens e de mulheres empregados de uma grande empresa, basta saber, por exemplo, a proporção de homens e mulheres na empresa, e amostrar na mesma proporção. As amostras probabilísticas são preferíveis do ponto de vista do estatístico, mas, na prática, elas nem sempre são possíveis. Na área de saúde, o pesquisador trabalha, necessariamente, com unidades às quais tem acesso: ratos de um laboratório, universitários, pacientes em tratamento no ambulatório, crianças matriculadas em escolas. As amostras de conveniência não invalidam a pesquisa, mas precisam ser muito bem descritas porque representam apenas a população de indivíduos semelhantes àqueles incluídos na amostra. Atividades Propostas Volte para seu curso e participe do Fórum “Boas Vindas” e “População e Amostragem” no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações: Núcleo de Educação a Distância – NEAD/AEDB 11 1. - POPULAÇÃO E AMOSTRAGEM 1.3 - Estatística e parâmetro Nós já sabemosa diferença entre amostra e população. Agora, precisamos distinguir os valores obtidos da amostra e os valores obtidos da população. A estatística resume uma característica da amostra; o parâmetro resume uma característica da população. Quando ouvimos no noticiário que, de acordo, com a pesquisa de determinado instituto, 44% dos brasileiros aprovam determinada atitude do governo, você foi apresentado a uma estatística. Essa estatística resume o que as pessoas que compuseram a amostra (provavelmente 1.500 a 2.000) pensam da atitude em questão. É um indicador ou uma estimativa do parâmetro correspondente – a porcentagem da população brasileira que aprovou a atitude. Mas não existe garantia de que as estatísticas (estimativas obtidas com base nos dados da amostra) tenham valor igual, ou mesmo próximo do parâmetro (valor verdadeiro na população). No entanto, isto ocorrerá na maioria das vezes – desde que a amostra tenha sido obtida de acordo com a técnica correta e tenha sido bem dimensionada (o tamanho seja adequado). Com quantas unidades se compõe uma amostra? Do ponto de vista do estatístico, as amostras devem ser grandes para dar maior confiança às conclusões obtidas. Para entender as razões desse ponto de vista, imagine que em uma cidade existem dois hospitais. Em um deles nascem, em média, 120 bebês por dia e, no outro, nascem 12. A razão meninos para meninas é, em média, 50% nos dois hospitais. Em uma ocasião nasceu, em um dos hospitais, duas vezes mais meninos do que meninas. Em qual dos hospitais é mais provável que isso tenha ocorrido? Para o estatístico, a resposta é óbvia: é mais provável que o fato tenha ocorrido no hospital em que nasce menor número de crianças. A probabilidade de uma estimativa desviar-se muito do parâmetro (do valor verdadeiro) é maior quando a amostra é pequena. A “qualidade” de uma estimativa depende, em muito, do número de unidades que compõe a amostra (tamanho da amostra). No entanto, desde que a população seja muito maior do que a amostra, a “qualidade” da estatística não depende do tamanho da população. De qualquer modo, as amostras não devem ser muito pequenas, porque o resultado do trabalho seria de pouca utilidade. Como se determina o tamanho da amostra? Na prática, o tamanho da amostra é determinado mais por considerações reais ou imaginárias a respeito do custo de cada unidade amostrada do que por técnicas estatísticas. Se seu orçamento for curto, não tente enquadrar nela uma pesquisa ambiciosa. Mas o pesquisador precisa sempre levar em conta o que é usual na área. Então você deve seguir um conselho para determinar o tamanho da amostra: veja o que se Núcleo de Educação a Distância – NEAD/AEDB 12 faz na sua área, consultando a literatura, mas verifique também o que seu orçamento e tempo permitem fazer. De qualquer forma, o tamanho da amostra pode ser determinado por critério estatístico. As fórmulas de cálculo são bem conhecidas. Mas a aplicação dessas fórmulas não será objetivo da nossa disciplina no momento. A questão da representatividade A amostra só traz informações sobre a população da qual foi retirada. Não tem sentido, por exemplo, estudar os hábitos de higiene de índios bolivianos e considerar que as informações “servem” para descrever os hábitos de higiene de moradores da periferia da cidade de São Paulo. Ainda, a amostra deve ter o tamanho usual da área em que a pesquisa se enquadra. Amostras demasiado pequenas não dão informação útil. Desconfie também, de amostras muito grandes. Será que o pesquisador observou cada unidade amostrada com o devido cuidado? As amostras podem ser representativas ou não representativas. E não se pode julgar a qualidade da amostra pelos resultados obtidos. Se você jogar uma moeda 10 vezes, podem ocorrer 10 caras. Provável? Não. Possível? Sim. Conclusões e decisões tomadas com base em amostras só tem sentido na medida em que as amostras representam a população. Para bem interpretar os dados e tirar conclusões adequadas, não basta olhar os números: é preciso entender como a amostra foi tomada e se não incidiram, no processo de amostragem, alguns fatores que poderiam trazer tendência aos dados. Como você sabe se uma amostra é tendenciosa? Não há fórmulas de matemática ou estatística para dizer se a amostra é tendenciosa ou representativa da população. Você terá de ter bom senso e conhecimento na área. São, portanto, necessários, muitos cuidados, porque os erros de amostragem podem ser sérios. Tendência é a diferença entre a estimativa que se obteve na amostra e o parâmetro que se quer estimar. Atividades Propostas Volte para seu curso e participe do Fórum “Boas Vindas” e “População e Amostragem” no Bloco Fóruns de Discussões – Lembro-lhe que sua participação significativa vale ponto. Anotações:
Compartilhar