Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE DO VALE DO RIO DOS SINOS – UNISINOS ESCOLA DE SAÚDE ATIVIDADE ACADÊMICA ESTATÍSTICA APLICADA À SAÚDE (Conteúdo programático e exercícios) Professora: Simone Soares Echeveste secheveste@unisinos.br Professora: Claudia Angelita Fagundes Raupp rauppcaf@unisinos.br Professor: Ricardo Ferreira Vitelli vitelli@unisinos.br 2016 mailto:secheveste@unisinos.br mailto:rauppcaf@unisinos.br mailto:vitelli@unisinos.br SUMÁRIO 1 ESTATÍSTICA ............................................................................................................................................. 4 1.1 INTRODUÇÃO ......................................................................................................................................... 4 1.2 CONCEITOS BÁSICOS DE ESTATÍSTICA .......................................................................................... 5 1.3 DIVISÕES DA ESTATÍSTICA ................................................................................................................. 7 1.4 POPULAÇÃO E AMOSTRA ................................................................................................................... 7 1.5 CLASSIFICAÇÃO DE VARIÁVEIS ......................................................................................................... 8 EXERCÍCIOS DO CAPÍTULO 1 ................................................................................................................. 11 2 ESTATÍSTICA DESCRITIVA ................................................................................................................... 14 2.1 APRESENTAÇÃO DE DADOS EM TABELAS .................................................................................... 14 2.2 APRESENTAÇÃO DOS DADOS EM QUADROS............................................................................... 15 2.3 APRESENTAÇÃO DOS DADOS EM GRÁFICOS .............................................................................. 15 2.3.1 Gráficos de colunas ......................................................................................................................... 16 2.3.2 Gráficos de barras ............................................................................................................................ 18 2.3.3 Gráficos de linhas ............................................................................................................................ 18 2.3.3 Gráficos de setores .......................................................................................................................... 19 2.4 MEDIDAS ESTATÍSTICAS ................................................................................................................... 21 2.4.1 Medidas de Tendência Central: ..................................................................................................... 21 2.4.1.1 Média Aritmética .............................................................................................................................. 22 2.4.1.2 Mediana (Md) ................................................................................................................................... 24 2.4.1.3 Moda (Mo) ........................................................................................................................................ 25 2.4.2 Medidas de Variabilidade: ............................................................................................................... 26 2.4.2.1 Variância .......................................................................................................................................... 27 2.4.2.2 Desvio-padrão ................................................................................................................................. 27 2.4.2.3 Coeficiente de Variação (CV) ......................................................................................................... 29 EXERCÍCIOS DO CAPÍTULO 2 ................................................................................................................. 31 3 PROBABILIDADE .................................................................................................................................... 42 3.1 CONCEITOS BÁSICOS DE PROBABILIDADE ................................................................................. 43 3.2 PROPRIEDADES DA PROBABILIDADE ........................................................................................... 46 3.3 PROBABILIDADE CONDICIONAL ..................................................................................................... 48 EXERCÍCIOS DO CAPÍTULO 3 ................................................................................................................. 49 4 NOÇÕES DE AMOSTRAGEM ................................................................................................................ 51 4.1 AMOSTRAGEM PROBABILÍSTICA ..................................................................................................... 51 4.1.1 Amostra Aleatória Simples ............................................................................................................. 51 4.1.2 Amostra Aleatória Sistemática....................................................................................................... 52 4.1.3 Amostra Aleatória Estratificada ..................................................................................................... 52 4.1.4 Amostra Aleatória por Conglomerados ........................................................................................ 52 4.2 AMOSTRAGEM NÃO PROBABILÍSTICA ............................................................................................ 53 4.2.1 Amostra por Conveniência ou Acidental ..................................................................................... 53 4.2.2 Amostra por cotas ............................................................................................................................ 53 4.2.3 Amostra de Voluntários................................................................................................................... 53 5 ESTIMAÇÃO ............................................................................................................................................. 55 5.1 ESTIMAÇÃO POR INTERVALO OU INTERVALO DE CONFIANÇA ............................................... 55 5.1.1 Intervalo de confiança para uma proporção populacional ....................................................... 56 5.1.2 Intervalo de confiança para uma média populacional ............................................................... 63 EXERCÍCIOS DO CAPÍTULO 5 ................................................................................................................. 65 6 TESTES DE HIPÓTESES ........................................................................................................................ 70 6.1 COMPONENTES DE UM TESTE DE HIPÓTESES ........................................................................... 70 6.1.1 Hipóteses de Pesquisa .................................................................................................................... 70 6.1.2 Estatística do Teste .......................................................................................................................... 71 6.1.3 Região Crítica .................................................................................................................................... 71 6.1.4 Regra de Decisão ............................................................................................................................. 71 6.1.5 CONCLUSÃO EXPERIMENTAL ...................................................................................................... 72 6.2 TESTE DE HIPÓTESES PARAUMA MÉDIA (TESTE T – STUDENT) ............................................ 73 Regra de decisão ....................................................................................................................................... 73 6.3 TESTE DE HIPÓTESES PARA COMPARAÇÃO ENTRE DUAS MÉDIAS (T-STUDENT PARA DUAS AMOSTRAS) ..................................................................................................................................... 75 6.4 TESTE QUI-QUADRADO ..................................................................................................................... 79 EXERCÍCIOS DO CAPÍTULO 6 ................................................................................................................. 83 7 ANÁLISE DE CORRELAÇÃO ................................................................................................................ 91 7.1 TIPOS DE CORRELAÇÃO ................................................................................................................... 92 7.2 COEFICIENTE DE CORRELAÇÃO DE PEARSON (r) ...................................................................... 93 EXERCÍCIOS DO CAPÍTULO 7 ................................................................................................................. 96 8 ANÁLISE DE REGRESSÃO ................................................................................................................. 100 EXERCÍCIOS DO CAPÍTULO 8 ............................................................................................................... 102 GABARITO DOS EXERCÍCIOS ............................................................................................................... 103 4 1 ESTATÍSTICA A palavra estatística surge da expressão em Latim statisticum collegium palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra adquiriu um significado de coleta e classificação de dados, no início do século XIX. Uma das definições apresentadas elaborada por Rao é: A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existente na resposta para um determinado problema; a tomada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econômicos, para o aumento da qualidade e produtividade, na otimização em análise de decisões, em questões judiciais, previsões e em muitas outras áreas. (RAO, 1999) 1.1 INTRODUÇÃO Existe um consenso por parte dos estudiosos de várias áreas que há uma grande demanda na sociedade atual por um cidadão que compreenda estatística, que seja capaz de consumir e pensar criticamente sobre as informações diárias que recebe, exercendo boas decisões baseadas nestas informações. Há uma concordância geral na concepção de que o estudo de estatística merece um extenso estudo devido à relevância para a sociedade contemporânea de atividades de coletar, representar e processar dados, este fato pode ser considerado como uma consequência do crescimento do uso de métodos estatísticos na realização de predições. A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância. Diariamente somos “soterrados” por informações estatísticas: são estatísticas da saúde, estatísticas da segurança, estatísticas da educação, etc, não há como qualquer cidadão fugir de tanta informação. A quantidade enorme de dados é o que caracteriza o mundo atual, cada vez mais necessitamos de informações, saber como obtê-las e como entendê-las 5 é fundamental para qualquer indivíduo, pois este deve ser capaz de fazer uma análise crítica dos dados possibilitando uma tomada de decisões mais consciente. O papel da estatística na ciência, de acordo com Silvia Shimakura, pode ser descrito considerando os seguintes tópicos: a) Na ciência, são realizados estudos experimentais ou observacionais, levando à coleção de dados numéricos. b) O propósito da investigação é responder uma questão científica. c) O padrão de variação nos dados faz com que a resposta não seja óbvia. d) Em geral, a disciplina de estatística refere-se a métodos para coleta e descrição dos dados, e então a verificação da força da evidência nos dados pró ou contra as ideias científicas. A presença de uma variação não previsível nos dados faz disso uma tarefa pouco trivial. 1.2 CONCEITOS BÁSICOS DE ESTATÍSTICA Sempre que falamos em Estatística estamos inseridos no contexto de uma pesquisa. As pesquisas podem ser classificadas em duas grandes abordagens conforme demonstra a figura 1. Figura 1 – Comparativo entre as pesquisas qualitativas e quantitativas Fonte: Os autores QUALITATIVA X QUANTITATIVA Objetivo: Alcançar uma compreensão do contexto do problema, das razões e motivações subjacentes Estrutura: Pequenas amostras Não estruturada Análise de Conteúdo Resultados: Desenvolve uma compreensão inicial do problema (não conclusiva) Objetivo: Procurar quantificar os dados e generalizar os resultados obtidos com uma amostra para a população-alvo Estrutura: Grandes amostras Estruturada (questionário) Análise Estatística Resultados: Recomenda um curso final de ação (conclusiva) PESQUISA QUALITATIVA PESQUISA QUANTITATIVA X 6 Uma pesquisa é composta, de modo geral, por quatro etapas distintas. Destas etapas nas três últimas (planejamento, execução e comunicação dos resultados) a estatística surge como uma importante ferramenta de suporte para o pesquisador. Figura 2 – Etapas da pesquisa quantitativa Fonte: Os autores Na etapa de planejamento da pesquisa, a estatística tem importante participação na determinação do tamanho da amostra a ser estudada, na escolha do procedimento/processo de amostragem que deve ser utilizado para a coleta de dados, bem como na elaboração do instrumento de coleta e no estabelecimento do tipo de variáveis a serem pesquisadas. No momento da execução da pesquisa, a estatística é imprescindível, pois fornece as ferramentas necessárias para a análise dos dados e para a obtenção de conclusões sobre o objeto de estudo. Na comunicação dos resultados, a estatística auxilia a construção de tabelas e gráficos facilitando a apresentação dos principais resultados obtidos. Todas estas etapas são importantes de serem realizadas e fazem parte da elaboração de uma pesquisa científica que procure ser a mais fidedigna possível. O conhecimento destas etapas também é importante para o julgamento da adequação de pesquisas realizadas por terceiros, ou seja, quando nos é apresentado oralmente ou através de artigos resultados de uma pesquisa precisamos ter um conhecimento mínimo do processo científico para que sejamos capazes de criticar e entender os resultados obtidos. PESQUISA QUANTITATIVA Reconhecimento e formulação do problema de pesquisa Planejamento da pesquisa (amostra, variáveis, questionários,...) Execução da pesquisa (campo) Comunicação dos resultados E S T A T ÍS T IC A 7 1.3 DIVISÕES DA ESTATÍSTICA A Estatística pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contemplando ferramentas de organização de dados e síntese de informação. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros populacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra.A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade. 1.4 POPULAÇÃO E AMOSTRA Uma população é constituída por um conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretendem estudar. Uma amostra é um subconjunto da população usado para obter informações acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população. Na figura 3 temos as duas possibilidades de coleta de dados. De forma censitária, coletando e analisando todos os elementos de uma população, ou de modo amostral, retirando uma amostra da população. Figura 3 – Possibilidades de coleta de dados de modo censitário ou amostral Fonte: Clip arts 8 É importante destacar que o procedimento de levantamento de dados acontece a partir da definição da população a ser pesquisada, de onde se extrai uma amostra representativa, executam-se cálculos para obter as estatísticas de interesse. Depois se projeta esses resultados para a população, que se caracteriza por um processo de inferência estatística. A figura 4 ilustra esses procedimentos. Figura 4 – Representação das etapas do procedimento estatístico Fonte: Internet imagens 1.5 CLASSIFICAÇÃO DE VARIÁVEIS Uma variável é uma característica de uma população que difere de um indivíduo para outro e do qual temos interesse em estudar. Cada unidade (membro) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadas observações. Essas variáveis podem ser originadas das perguntas efetuadas em um processo de pesquisa de dados que utilize um instrumento de coleta (por exemplo, um questionário). As variáveis podem ser classificadas em: Variáveis Quantitativas: São as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. 9 Variáveis Quantitativas discretas: Características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido se forem oriundas de uma contagem. Exemplos: número de filhos, número de bactérias por litro de leite, números de erros de ortografia, etc. Variáveis Quantitativas contínuas: Características mensuráveis que assumem valores em uma escala para as quais valores podem ser fracionais, são oriundas de uma medição. Exemplos: peso, altura, pressão atmosférica, etc. Variáveis Qualitativas (ou categóricas): São as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. Variáveis Qualitativas nominais: Não existe ordenação dentre as categorias. Exemplos: sexo, estado civil, nacionalidade, etc. Variáveis Qualitativas ordinais: Existe uma ordenação entre as categorias. Exemplos: escolaridade (1º, 2º, 3º graus), grau de importância (nenhuma, pouca, razoável, muito), etc. Exemplo: Considere a situação de pesquisa a seguir e identifique: a população, a amostra, as variáveis pesquisadas e suas classificações. Uma pesquisa foi realizada com filhos de pais separados em grandes escolas da região metropolitana de Porto Alegre. Foram selecionados para fazer parte da pesquisa 400 alunos, todos filhos de pais separados, e algumas questões foram observadas como desempenho escolar (notas nas disciplinas), ocorrência de repetência escolar e grau de satisfação com o relacionamento com seus pais (muito satisfeito, satisfeito, etc.) 10 População: Filhos de pais separados, estudantes de grandes escolas, na região metropolitana de Porto Alegre. Amostra: 400 alunos. Variáveis pesquisadas/tipos de variáveis: Desempenho escolar – Quantitativa contínua Ocorrência de repetência escolar – Qualitativa Nominal Satisfação com o relacionamento – Qualitativa Ordinal 11 EXERCÍCIOS DO CAPÍTULO 1 Para as questões de 1 a 6 classifique as seguintes variáveis em: Quantitativas (Discretas ou Contínuas) ou Qualitativas (Nominais ou Ordinais). 1. A cor da pele de pessoas (ex.: branca, negra, amarela). Variável do tipo ______________________ e _______________________ 2. O número de consultas médicas feitas por ano por um associado de certo plano de saúde. Variável do tipo ______________________ e _______________________ 3. O teor de gordura, medido em gramas por 24 horas, nas fezes de crianças de 1 a 3 anos de idade. Variável do tipo ______________________ e _______________________ 4. O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga tipo A, Droga tipo B e placebo. Variável do tipo ______________________ e _______________________ 5. A pressão intraocular, medida em mmHg, em pessoas. Variável do tipo ______________________ e _______________________ 6. O número de filhos das pacientes participantes de certo estudo. Variável do tipo ______________________ e _______________________ PARA OS CASOS A SEGUIR DEFINA A POPULAÇÃO E A AMOSTRA DO ESTUDO 7. Viagra para os diabéticos (Revista Isto é nº 1535 de 03/03/1999) A famosa pílula azul pode também ser eficaz para diabéticos que têm a função erétil comprometida. Estudos preliminares haviam descartado a eficiência do Viagra nesses casos. Mas uma pesquisa realizada com 268 homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56% dos pacientes que tomaram Viagra tiveram melhora contra 10% dos que ingeriram placebo (pílula inócua). Mas em hipótese nenhuma se recomenda o uso do medicamento sem orientação médica. 8. Sexo feliz (Revista Isto é no 1537 de 17/03/1999) Ter relações sexuais três vezes por semana rejuvenesce. Um estudo do Hospital Real de Edimburgo (Reino Unido), feito com 3,5 mil europeus e americanos, revelou que a qualidade e a frequência das relações sexuais influem diretamente na aparência física. Todos os selecionados para a pesquisa afirmavam sentirem-se mais jovens do que 12 realmente eram. E essas pessoas faziam sexo pelo menos três vezes por semana. "Durante o ato sexual o organismo produz substâncias químicas como a endorfina que causam sensação de bem-estar e melhoram a condição do corpo e da mente", explica o neuropsicólogo David Weeks, coordenador do estudo. 9. Alerta da pele (Revista Isto é no 1537 de 17/03/1999) Quem já teve câncer de pele deve redobrar os cuidados para não ser vítima de um outro tipo de tumor. Um estudo publicado no Jornal da Associação Médica Americana revelou que aqueles que tiveram câncer dermatológico pesquisados a partir de 250 pacientes revelou que estão 25% a 30% mais propensos a desenvolver um outro câncer até 12 anos depois de se terem curado. Acredita-se que o tumor de pele aumente a suscetibilidade geral do organismo a novos episódios da doença. 10. Gene da gordura (Revista Isto é no 1537 de 17/03/1999) Cientistas americanos anunciaram na semana passada ter descoberto em ratos o primeiro gene que suprime a obesidade e regula a queima de calorias. Essa pode ser a chave para o desenvolvimento de uma droga para manter as pessoas em forma. Na verdade, esse é o sexto gene relacionado com a obesidade, mas, de acordo com os pesquisadores, é o primeiro que age no metabolismo e consegue gastar energia. Eles submeteram dois grupos de 5 ratos a testes com alimentos gordurosos. Aqueles com uma mutação nesse gene não ganharam peso enquanto que os normais engordaram. 11. Colesterol na medida (Revista Isto é no 1536 de 10/3/1999) Níveis muito baixos de colesterol podem ser prejudiciais, afirma um estudo divulgado na semana passada, no congresso da American Heart Association. A pesquisa comparou cidadãosamericanos acima de 50 anos que foram vítimas de derrame e os que não foram vítimas de derrame. O estudo foi desenvolvido com 714 vítimas de derrame e 3.743 pessoas saudáveis. Quem tinha colesterol acima de 280 estava duas vezes mais suscetível a sofrer derrame isquêmico (bloqueio de vaso sanguíneo). Aqueles com colesterol abaixo de 180 estavam duas vezes mais propensos a ter derrame hemorrágico. Explica-se: o colesterol ajuda na estrutura das veias e evita que elas se rompam. O ideal é mantê-lo no nível médio (200), como recomendam os órgãos de saúde. 12. Efeito protetor da vacina BCG em crianças (Boletim OPAS 1986) Para avaliar o efeito protetor da vacina BCG em crianças com menos de 15 anos de idade, na cidade de Buenos Aires (Argentina), estudaram-se as crianças que receberam algum tratamento antituberculose durante o ano de 1981, tanto internados em hospitais ou tratados na forma ambulatorial. Para cada uma destas crianças, encontrou-se outra criança de mesma idade, sexo, condição socioeconômica e que tinha tido alguma doença aguda, diferente da tuberculose, no mesmo período e que havia sido tratada no mesmo estabelecimento. Em ambos os grupos, considerou-se como vacinados os que tinham a cicatriz correspondente à vacina BCG em uma ou ambas as regiões deltoidianas. Foram pesquisadas 100 crianças em cada uma das duas condições. 13 13. Torcida bastante eficaz (Revista Isto é nº 1581 de 19/01/2000) O sabor de vitória tem um efeito químico muito mais benéfico para a alma do que se acreditava. A conclusão é de uma equipe de pesquisadores americanos. Eles mediram o nível de testosterona (hormônio masculino) em torcedores de futebol e basquete e constataram um aumento de 20% do hormônio quando seus times vencem (quando os times perdem há uma queda de 20%). Como o hormônio regula o humor, a sensação de bem-estar e o interesse sexual, uma dose extra de testosterona vai bem. 14. Animais contra alergia (Revista Isto é nº 1569 de 27/10/1999) Brincar na fazenda, onde vivem animais como vacas, galinhas e outros bichos, diminui as chances de a criança desenvolver alergias. A constatação é de pesquisadores austríacos, que estudaram 2.283 crianças que vivem nesses locais. Aquelas que tinham contato com animais eram três vezes menos sensíveis a problemas alérgicos e respiratórios, como a asma, do que as que vivem na zona urbana. A hipótese é a de que o contato precoce com os animais aumente a tolerância das células de defesa do organismo a bactérias e ácaros. 14 2 ESTATÍSTICA DESCRITIVA Tabelas de frequência, quadros e gráficos estatísticos são encontrados em jornais informativos, relatórios técnicos, monografias, dissertações, teses e revistas científicas. Nessa etapa apresentamos as normas e os cuidados na elaboração de tabelas, quadros e gráficos estatísticos. 2.1 APRESENTAÇÃO DE DADOS EM TABELAS As tabelas de frequência simples apresentam de forma concisa o número de ocorrências (absoluta e relativa) dos valores de uma variável. A tabela de frequências é uma forma de representação da frequência de cada valor distinto da variável. As tabelas de frequência ou distribuições de frequências resumem a informação contida na amostra, ordenando os seus valores e agrupando-os em classes de valores repetidos ou de valores distribuídos por intervalos. A tabela 1 é apresentada conforme as normas técnicas de apresentação tabular para publicações. A recomendação em trabalhos científicos é de que o total seja a primeira linha dos dados, contudo é muito frequente aparecer no final assim, na maior parte das tabelas encontradas essa recomendação não é seguida. Tabela 1 – Distribuição da amostra por classe social Classe social Frequência absoluta Frequência relativa Total A 50 10 100 20 B 10 20 C 12 24 D E 13 05 26 10 Fonte: Pesquisa de orçamentos familiares Fonte dos dados Título da tabela Identificação da Variável Categorias da variável Não existem linhas 15 2.2 APRESENTAÇÃO DOS DADOS EM QUADROS Os quadros são outra forma de apresentação de dados coletados, principalmente de natureza qualitativa. Podem também ser apresentados como uma forma resumida de apresentar os principais achados de uma coleta de dados. O quadro 1 é apresentado conforme as normas técnicas de apresentação de quadros para publicações. A diferença principal entre um quadro é uma tabela é que o quadro deve ter as linhas laterais Quadro 1 - Diferenças entre os perfis das escolas pesquisadas ESC OL A A ESC OL A B ESC OL A C Tem menos alunos matriculados no turno noturno Melhor média de desempenho em ciências humanas no ENEM 2010 Melhor média de desempenho em cinco das seis médias das avaliações Maior proporção de professores concursados Melhor desempenho da redação no ENEM 2010 Escola com menos tempo de Ensino Médio Atende somente o ensino médio Menor taxa de participação dos alunos no ENEM 2010 Menor média em todas as seis avaliações Menor quantidade de funcionários e maior relação funcionário/alunos Fonte: Escolas Estaduais de São Leopoldo 2.3 APRESENTAÇÃO DOS DADOS EM GRÁFICOS A utilização de gráficos como forma de apresentação de dados pode ser justificada através de um ditado popular de que uma imagem vale mais que 1000 palavras. Técnicas gráficas são geralmente utilizadas, em vez de tabelas, para descrever um conjunto de dados através de um "desenho". Um gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. (CRESPO, 1996) A representação gráfica deve ser utilizada levando-se em conta algumas qualidades essenciais básicas para a construção destes: 16 a) Simplicidade: as informações contidas em um gráfico devem ser diretas e detalhes secundários devem ser omitidos; Ás vezes na construção de um gráfico o ideal é a forma mais simples e direta de apresentação. b) Clareza: as informações devem ser claras possibilitando uma interpretação correta sem dúvidas sobre os resultados. c) Veracidade: o gráfico deve expressar a verdade sobre os dados estudados. De acordo com Levin (1987), enquanto que algumas pessoas parecem "desligar-se" ao serem expostas a informações estatísticas em forma de tabelas, elas podem prestar bastante atenção às mesmas informações apresentadas em forma gráfica. Este fato justifica a grande utilização por parte dos pesquisadores e da mídia escrita e impressa dos gráficos em substituição das tabelas. 2.3.1 Gráficos de colunas A utilização de gráficos em colunas serve para representarmos dados que poderiam ser apresentados em tabelas, contudo, a representação gráfica tende a acentuar e facilitar a observação dos interessados no resultado da pesquisa. Na forma visual é mais rápido destacarmos alguns tipos de diferenças existentes na segmentação utilizada no gráfico. O gráfico de colunas é um dos gráficos mais utilizados para representar um conjunto de dados, sendo a representação de uma série de dados através de retângulos dispostos verticalmente. As alturas destes retângulos são proporcionais às suas respectivas frequências. Este gráfico pode ser utilizado para representar qualquer tipo de variável em qualquer nível de mensuração por este fato é um recurso extremamente utilizado em pesquisas. No exemplo do gráfico 1 (tempo médio de escolaridade) a variável é caracterizada como sendo quantitativa contínua. Vale observar que anos de escolaridade se caracteriza por ser uma variável discreta, porém, a média dos anos, se caracteriza por ser contínua. 17 Gráfico 1 – Tempo de escolaridade média em anos, por região, por estado civil, em 2010 Fonte: Pesquisa Nacional por Amostra de Domicílios (PNAD-2010) Outro exemplo de aplicação,utilizando uma variável qualitativa nominal, representado pelo gráfico 2. Cabe destacar que, quando a variável é nominal é recomendável apresentar as colunas em forma crescente ou decrescente de valores. Como a variável é nominal isso é possível, no caso de ser ordinal não podemos alterar a ordem disposta nas categorias de resposta. Gráfico 2 – Cinco Jornais com maior tiragem no Brasil, no ano de 2015 Fonte: Associação Nacional de Jornais 4,3 2,5 3,5 4,5 2,4 4,4 1,8 2,8 2 2 3 5 0 1 2 3 4 5 6 Região 1 Região 2 Região 3 Região 4 Casados Solteiros Viúvos 220971 183404 175441 149241 144191 0 50000 100000 150000 200000 250000 Super Notícia (MG) O Globo (RJ) Folha de SP (SP) Estado de SP (SP) Zero Hora (RS) 18 2.3.2 Gráficos de barras O gráfico de barras é uma representação de uma série de dados por meio de retângulos dispostos horizontalmente. Os comprimentos destes retângulos são proporcionais às suas respectivas frequências. Este gráfico é semelhante ao gráfico de colunas, contudo, a posição da escala e da frequência é trocada, ou seja, na linha horizontal temos a frequência de casos observados e na linha vertical temos a variável de estudo. O gráfico 3 ilustra essa situação. A opção pelo gráfico de barras, em substituição ao gráfico de colunas acontece quando o texto da variável qualitativa, que representa a categoria de resposta, é muito longo. Gráfico 3 – Esporte preferido pelos entrevistados Fonte: Pesquisa com estudantes de uma escola estadual 2.3.3 Gráficos de linhas Esse tipo de gráfico utiliza-se de uma linha para representar uma série estatística. Seu principal objetivo é evidenciar a tendência ou a forma como o fenômeno está crescendo ou decrescendo através de um período de tempo. Seu traçado deve ser realizado considerando o eixo "x" (horizontal) a escala de tempo e o eixo "y" (vertical) frequência observada dos valores. É importante destacar que esse tipo de gráfico somente deve ser utilizado no caso de variáveis quantitativas contínuas, uma vez que a linha pressupõe a existência de valores intermediários. 3% 5% 7% 15% 27% 43% 0% 10% 20% 30% 40% 50% Ciclismo Basquete Tênis Vôlei Natação Futebol 19 Gráfico 4 – Evolução no número de pacientes em TARV1, no Brasil, no período de 1999 a 2012 Fonte: MS/SVS/Departamento de DST, Aids e Hepatites Virais/Casos registrados no Siscel e no Siclom até 31/12/2012 2.3.3 Gráficos de setores O gráfico de setores, também conhecido como: gráfico de pizza, torta, queijo ou bolacha é um dos mais simples recursos gráficos, sua construção é baseada no fato de que o círculo possui 360º, sendo que este círculo é dividido em fatias de acordo com o percentual em cada categoria. É um gráfico útil para representar variáveis nominais ou apresentadas em categorias de respostas. Não é recomendável utilizar esse tipo de gráfico quando existem muitas categorias de respostas, ou, quando a pergunta possibilita mais de uma alternativa de resposta. Pois esse tipo de gráfico é constituído a partir da ideia de que a soma das respostas totalize 100%. Exemplo representado no gráfico 5. 1 Pacientes em terapia antirretroviral. 86078 93414 113191 125175 139868 156670 164547 174270 180640 192535 231146 257037 284390 313175 50000 100000 150000 200000 250000 300000 350000 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 20 Gráfico 5 – Distribuição percentual de casos de AIDS, por região de residência, no Brasil, de 1980 a 20132 Fonte: MS/SVS/Departamento de DST, Aids e Hepatites Virais. Exemplo: A pesquisa “Panorama Nacional, a Execução das Medidas Socioeducativas de Internação” foi realizada pelo Departamento de Monitoramento e Fiscalização do Sistema Carcerário (DMF) e pelo Departamento de Pesquisas Judiciárias (DPJ). O levantamento foi realizado por uma equipe multidisciplinar que visitou, de julho de 2010 a outubro de 2011, os 320 estabelecimentos de internação existentes no Brasil, para analisar as condições de internação de 17.502 adolescentes que cumprem medidas socioeducativas de restrição de liberdade. Durante estas visitas, a equipe entrevistou 1.898 adolescentes internos. Um dos resultados observados foi o percentual destes jovens que utilizam drogas (gráfico a seguir). 2 Casos notificados no Sinan e Siscel/Siclom até 30/06/2013 e no SIM de 2000 até 2012. 5,10% 13,90% 20,00% 55,20% 5,80% Norte Nordeste Sul Sudeste Centro-oeste 21 Analisando esta notícia responda: a) A variável apresentada no gráfico: Percentual de jovens em cumprimento de medidas socioeducativas usuários de drogas. b) No Brasil, o percentual de jovens deste grupo que usam drogas: 74,8%. c) O tipo de gráfico apresentado: Gráfico de colunas. d) A região do Brasil com menor percentual de jovens desse grupo: Região Norte. e) A região do país onde houve o menor percentual de respostas: Região Centro- oeste. 2.4 MEDIDAS ESTATÍSTICAS A análise descritiva dos dados tem por objetivo a descrição dos resultados de uma pesquisa através de tabelas, gráficos e cálculos de algumas medidas estatísticas. 2.4.1 Medidas de Tendência Central: São indicadores que permitem que se tenha uma primeira ideia, um resumo, de como se distribuem os dados de um experimento. Também são designadas como medidas de posição. Estas medidas são consideradas formas úteis de descrever um grupo como um todo encontrando um único número que 22 represente todo o conjunto de dados. As medidas de tendência central são: média, mediana e moda. 2.4.1.1 Média Aritmética A média aritmética, que se representa por �̅� na amostra e por na população é uma medida de localização do centro da amostra, e obtém-se a partir da soma de um conjunto de valores, dividida pelo número de valores considerados. É importante destacar que essa medida somente pode ser obtida para variáveis quantitativas. A seguir são apresentadas as médias para o caso populacional e amostral. População Amostra N x N i i x 1 n x X n i i 1 Onde: x = somatório da variável “x” n = o número de elementos pesquisados, ou seja, o tamanho da amostra N = o número de elementos da população, ou seja, o tamanho da população �̅� = média amostral 𝜇𝑥 = média populacional Exemplo: Os dados a seguir representam os tempos (em anos) de relacionamento de 8 clientes de uma agência bancária. Nesse exemplo os dados são disponibilizados em rol (arrolados individualmente). 16 15 17 18 18 17 17 16 Amostra: 8 clientes Variável: Tempo de relacionamento 23 Média: anos n x x 7,16 8 134 8 1617171818171516 Em outras situações os dados aparecem em distribuição de frequência por ponto. Considere a seguinte tabela de frequência: Tabela 2 - Número de casos registrados de H1N1 em um período de 30 dias Nº de casos H1N1 Nº de dias % 0 12 40,0 1 8 26,7 2 7 23,3 3 3 10,0 Total 30 100,0 Fonte: Secretaria de Saúde de Porto Alegre Quando os dados estão dispostos na forma de uma tabela de frequências, precisamos considerar o número de vezes que cada valor se repetiu, ou seja, a sua frequência. Neste caso, devemos multiplicar os diferentes valores “x” pelas respectivas frequências “f”. A fórmula utilizada é: �̅� = ∑ 𝑥 . 𝑓 𝑛 Onde: x = variável f = frequência de cada valor da variável n = tamanho da amostra (𝑛 = ∑ 𝑓) No exemplo agora apresentado, teríamos o seguinte número médio de casos registrados de H1N1 por dia: �̅� = ∑ 𝑥 . 𝑓 𝑛 = (0 × 12) + (1 × 8) + (2 × 7) + (3 × 3) 30 = 0 + 8 + 14 + 9 30 = 1,03 𝑐𝑎𝑠𝑜𝑠 24Interpretação: Em média, são registrados 1,03 casos de H1N1 por dia. 2.4.1.2 Mediana (Md) Ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide o conjunto de dados ao meio, isto é, metade dos elementos da amostra é menor ou igual à mediana e a outra metade é maior ou igual à mediana. Para que essa medida seja obtida é necessário que a variável seja quantitativa ou qualitativa ordinal, em alguns casos. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento central. Se n é par, a mediana é a média dos dois elementos centrais. Exemplo 1: Quando o tamanho da amostra (n) for ímpar Considere a quantidade de sódio (mg) em 9 marcas distintas de 1 litro de leite integral: 90 92 95 90 95 94 90 90 91 1º Passo: Ordenar os dados em ordem crescente (ou decrescente) 90 90 90 90 91 92 94 95 95 2º Passo: Encontrar a posição da mediana Como n = 9 (ímpar), o valor central está na posição: 2 1n Posição da Mediana = 2 19 2 1n 5ª posição 3º Passo: Localizar a mediana 90 90 90 90 91 92 94 95 95 Mediana Md = 91 mg 25 Interpretação: Metade das marcas de 1 litro de leite integral possuem menos que 91 mg de sódio e metade mais que 91 mg de sódio. Exemplo 2: Quando o tamanho da amostra (n) for par Considere a quantidade de sódio (mg) em 10 marcas distintas de 1 litro de leite integral: 90 92 95 90 95 94 90 90 91 93 1º Passo: Ordenar os dados em ordem crescente 90 90 90 90 91 92 93 94 95 95 2º Passo: Encontrar a posição da mediana Como n=10 é par, o valor central está na posição 2 n Posição da Mediana = 2 10 2 n 5ª posição 3º Passo: Localizar a mediana: como n é par devemos localizar os dois valores centrais, ou seja, a 5ª e a 6ª posição: 90 90 90 90 91 92 93 94 95 95 mg 2 9291 Md 5,91 2.4.1.3 Moda (Mo) A moda é o valor que ocorre com maior frequência em um conjunto de dados, ou seja, o valor mais comum. Para a obtenção dessa medida não existe nenhum tipo de exigência com relação a variável, tanto pode ser quantitativa como qualitativa. Exemplo: Considere as notas finais em Matemática de 10 alunos: 26 8 7 6 8 7 2 5 7 7 7 Mo = 7 pontos Interpretação: A nota em matemática que ocorreu com maior frequência foi de 7 pontos. OBSERVAÇÃO Algumas situações podem ocorrer em relação à moda: a) Um conjunto de dados pode não possuir moda, ou seja, nenhum valor se repete ou todos se repetem na mesma quantidade. Ex.: 7 8 5 4 b) Dois valores podem se repetir empatados com as maiores frequências, neste caso dizemos que a distribuição é Bimodal. Podem também existir várias modas, nesse caso a distribuição é Multimodal. Ex.: 7 7 6 8 8 5 2.4.2 Medidas de Variabilidade: São medidas da variação de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem identificar até que ponto os resultados se concentram, ou não, ao redor da tendência central de um conjunto de observações. Também são designadas como medidas de dispersão. A média é extremamente útil como uma medida que objetiva representar ou resumir um conjunto de dados, mas também é imprescindível ao pesquisador ter conhecimento da variação que ocorre em torno desta média. Para isso o cálculo das medidas de variabilidade contribui para uma melhor interpretação do comportamento de uma variável quantitativa (sua média e sua variação). 27 2.4.2.1 Variância A variância é representada na população pelo símbolo 2 e na amostra pelo símbolo 2s . Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. A variância de uma amostra é a média dos quadrados dos desvios dos valores em relação à média. População Amostra N x N i i 1 2 2 1 1 2 2 n Xx s n i i No cálculo da variância pode-se observar que a unidade da variável estudada é levada ao quadrado, dificultando assim, a interpretação de seu resultado final. A solução para este problema é extrair a raiz quadrada da variância, permitindo assim que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio-padrão. 2.4.2.2 Desvio-padrão O desvio-padrão é a raiz quadrada da variância. Esta medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos, pode ser calculado considerando as seguintes etapas: 1ª) Calcular a média 2ª) Subtrair a média de cada valor do conjunto (desvio) 3ª) Elevar ao quadrado cada desvio 4ª) Somar os quadrados dos desvios 5ª) Dividir esta soma por (n-1) 6ª) Extrair a raiz quadrada Desse processo resulta a fórmula a seguir: 𝑠𝑥 = √ 1 1 2 n Xx n i i 28 Existe também outra maneira de chegarmos até o valor do desvio-padrão utilizando uma fórmula alternativa que é: 𝑠𝑥 = √ ∑ 𝑥2 − 𝑛. (∑ 𝑥)2 𝑛 − 1 Um conjunto de dados pode ser avaliado, em termos de variabilidade, a partir do diagrama de dispersão dos dados. Diagrama de dispersão dos pontos de um conjunto de dados (mais heterogêneo) Fonte: Dados fictícios Diagrama de dispersão dos pontos de um conjunto de dados (mais homogêneo) Fonte: Dados fictícios 0 0,5 1 1,5 2 2,5 3 3,5 0 0,5 1 1,5 2 2,5 3 3,5 0 0,5 1 1,5 2 2,5 3 3,5 0 0,5 1 1,5 2 2,5 3 29 Exemplo: Os dados a seguir se referem à quantidade de erros de ortografia de 5 redações 8 10 5 8 8 Amostra: 5 vestibulandos Variável: quantidade de erros de ortografia Média: ortografia de erros 7,8 5 39 5 885108 n x x Interpretação: Em média os vestibulandos cometeram 7,8 erros de ortografia em suas redações. Desvio-padrão: 1 1 2 n Xx s n i i 15 )8,78()8,78()8,75()8,710()8,78( 22222 s ortografia de erros 8,12,3 4 8,12 4 04,004,084,784,404,0 4 )2,0()2,0()8,2()2,2()2,0( 22222 s s Interpretação: Existe uma variação em torno da média de 1,8 erros de ortografia. 2.4.2.3 Coeficiente de Variação (CV) O Coeficiente de Variação é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa a variação relativa (%) presente no conjunto de dados em relação à média. População Amostra %100 CV Quanto maior o Coeficiente de Variação, mais heterogêneos serão os dados. %100 X s CV 30 EXEMPLO A obesidade, já encarada em todo o mundo como epidemia, é gerada pela interação entre fatores genéticos, culturais e Psicológicos. De acordo com alguns autores da psicologia, mecanismos psíquicos de fixação oral, regressão oral e supervalorização dos alimentos são de grande impacto na forma como as pessoas desenvolvem hábitos alimentares. É comum, por exemplo, que uma história passada de depreciação da imagem corporal e insuficiente condicionamento primitivo do controle do apetite leve aos transtornos alimentares, tais como a bulimia, a anorexia e também a obesidade. Os dados fazem parte de uma pesquisa da Organização da Cooperação e do Desenvolvimento Econômico, e mostram o percentual de obesos em alguns países: Considerando os dados acima apresentados, identifique: a) Variável de estudo: Percentual de obesos b) Classificação desta variável: Quantitativa contínua c) Amostra de estudo: 8 Países Calcule e interprete para estes dados: d) Mediana = 13,5% 50% dos países pesquisados têm menos de 13,5% de obesos. e) Moda= 13% O percentual de obesos mais frequente, entre os países pesquisados, é de 13%. f) Média = 136/8 = 17% Em média, o percentual de obesos nos países pesquisados é de 17% g) Desvio-padrão = 7,19% Existe uma variação em torno da média de 7,19% de obesos. Portugal Estados Unidos 31% Canadá 14% Portugal 13% Espanha 13% Brasil 20% Itália 9% Alemanha 13% Inglaterra 23% 31 EXERCÍCIOS DO CAPÍTULO 2 15. Um posto de saúde SUS de uma região realizou uma pesquisa no período de 7 dias com o objetivo e investigar o número de crianças com problemas respiratórios graves encaminhadas a hospitais: 5 3 2 3 2 3 4 Identifique: a) População: b) Amostra: c) Variável: Calcule e interprete: d) Moda: e) Mediana: f) Média: 16. Os dados a seguir se referem ao número de consultas pré-natal realizadas por um grupo de 30 adolescentes gestantes residentes em áreas de vulnerabilidade social: 6 5 3 3 7 6 0 0 5 6 7 0 0 3 3 5 7 6 5 3 0 3 5 3 3 5 3 7 7 5 Identifique: a) População: b) Amostra: c) Variável: d) Construa uma tabela de frequência para representar estes dados. e) A partir da tabela construída calcule e interprete a média para estes dados. 17. A balada segura é uma operação de fiscalização e educativa, baseada em lei estadual, que acontece de forma continuada, nas noites e madrugadas de quarta a domingo. Tem como objetivo informar, mobilizar, engajar, prevenir, educar e fiscalizar a combinação mortal de álcool e direção. Uma equipe de pesquisadores participou em uma destas operações para verificar o perfil dos motoristas que foram autuados por embriagues. Neste dia houve 5 autuações e uma das variáveis investigadas foi o resultado obtido no teste do bafômetro (em mg de álcool por litro de ar soprado). 32 0,5 mg/l 0,2 mg/l 0,2 mg/l 0,3 mg/l 0,2 mg/l Identifique: a) Amostra b) Variável c) Obtenha e interprete a Mediana para estes dados d) Obtenha e interprete a Média e o Desvio-padrão para estes dados 18. Um estudo realizado com 30 pacientes portadores do Mal de Parkinson, cuja característica consiste na perda de movimentos voluntários e rigidez geral, procurou verificar o tempo necessário de tratamento, em semanas com um fisioterapeuta a fim de recuperar algumas funções de movimento básicas para que este viva no seu ambiente familiar sem assistência de terceiros, ou ainda, com o mínimo de assistência. Os resultados obtidos estão relacionados a seguir: 4 6 2 3 8 9 10 3 5 6 7 4 4 3 8 9 10 9 8 6 5 4 3 8 9 7 6 3 2 7 a) Quem é a variável de estudo? Classifique-a. Quem é a população desta pesquisa? Quem foi a amostra estudada? b) Construa uma tabela para estes dados considerando 4 classes (faixas de valores). c) Quantos pacientes levaram no mínimo 4 semanas para se recuperarem? d) Qual a porcentagem de pacientes que levaram 6 semanas ou mais para se recuperarem? 19. A tabela a seguir representa os casos registrados de intoxicação humana, segundo a causa determinante: Tabela 1 - Causas de intoxicação humana Causas Frequência % Acidente 29.601 Abuso 2.604 Suicídio 7.965 Profissional 3.735 Outras 1.959 Ignorada 1.103 Fonte: MS/FIOCRUZ a) Quem é a variável de estudo? Classifique-a. 33 b) Qual o percentual de casos que apresentaram intoxicação devido a causas profissionais? c) Qual o percentual de casos que não foram devidos ao suicídio? d) Qual o percentual de casos que foram devido a outras causas ou causas ignoradas? 20. Ao estudar 15 crianças de 5 a 7 anos em relação à quantidade de horas que estas gastam assistindo TV por dia, observaram-se os seguintes resultados: 4 6 4 2 3 4 5 6 2 4 6 3 4 3 4 a) Quem é a variável de estudo? Classifique-a. Quem foi a amostra pesquisada? b) Construa uma tabela para estes dados. c) Quantas crianças gastam 5 ou mais horas diárias assistindo TV? d) Qual o percentual de crianças que assistem menos de 4 horas diárias de TV? 21. Um novo tratamento vem sendo testado por um grupo de psicólogos visando a amenização dos efeitos da depressão pós-parto. Para isso, selecionou-se uma amostra de 30 mães que apresentaram depressão pós-parto e através de seções de terapia, observou-se o tempo que cada uma levou (semanas) para apresentar melhoras no seu nível de depressão: 10 8 8 4 6 8 6 5 5 4 10 6 6 7 8 6 4 4 4 5 5 6 6 4 5 6 10 8 8 7 a) Quem é a variável de estudo? Classifique-a. b) Quem foi a amostra pesquisada? c) Construa uma tabela para estes dados. d) Qual a percentagem de mães que levaram menos de 6 semanas para apresentar melhoras? Para as questões a seguir, interprete corretamente a tabela 2 e marque a alternativa correta para cada uma das seguintes perguntas: Tabela 2 - Idade (meses) que a criança falou a primeira palavra Idade (meses) Nº crianças % 10 a 15 30 60,0 Mais de 15 a 20 15 30,0 Mais de 20 a 25 5 10,0 Total 50 100,0 Fonte: Clínica de fonoaudiologia 22. Percentual de crianças que falaram sua primeira palavra com mais de 15 meses: 34 a ( ) 60% b ( ) 40% c ( ) 30% d ( ) 15 crianças e ( ) 90% 23. Assinale a alternativa correta entre as afirmações a seguir: a) ( ) A variável de estudo é a Idade (meses) que a criança falou a primeira palavra, ela é qualitativa. b) ( ) A variável de estudo é 50 crianças, ela é quantitativa. c) ( ) A variável de estudo é a Idade (meses) que a criança falou a primeira palavra, ela é quantitativa. d) ( ) A amostra de estudo é a idade das crianças. e) ( ) A amostra de estudo são crianças que falam. 24. Uma amostra de 6 crianças vítimas de abuso sexual foi estudada, observando a idade em que estas crianças sofreram o abuso: Maria Cristina Daiane Carla Patrícia Tatiana 12 anos 12 anos 16 anos 11 anos 15 anos 9 anos Identifique: a) População: b) Amostra: c) Variável: Calcule e interprete: d) Média e) Mediana f) Desvio-padrão 25. “O termo esquizofrenia (esquizo = cisão, frenia = mente) foi introduzido em 1911 pelo psiquiatra suíço Eugen Bleuler para definir uma doença psíquica caracterizada, basicamente, pela "cisão do pensamento, do afeto, da vontade e do sentimento subjetivo da personalidade". Os sintomas da esquizofrenia são classificados como produtivos e negativos. Os sintomas produtivos mais característicos são o delírio e as alucinações. Na esquizofrenia, as alucinações auditivas são as mais frequentes: o paciente escuta vozes de pessoas ausentes, que comentam sobre seu comportamento ou lhe dão ordens imperativas, às quais ele não consegue resistir. O paciente passa a sentir-se influenciado por outros, perde o controle de sua própria vontade, sente-se controlado por telepatia, por hipnose, "como um robô". Pode também interpretar delirantemente estímulos reais, como por exemplo, achar que uma determinada notícia na televisão ou no rádio refere-se à sua pessoa. Os sintomas negativos caracterizam-se, principalmente, por uma diminuição da afetividade e por um empobrecimento do 35 conteúdo do pensamento Na população geral, o risco de um indivíduo adoecer de uma esquizofrenia durante a vida é de 1%. A prevalência da doença (frequência em determinado ponto no tempo) é de 0,5%, e a incidência é de 30 novos adoecimentos em cada 100.000 habitantes por ano”. Um pesquisador interessado em estudar o perfil de pacientes esquizofrênicos observou em um grupo de 250 pacientes a Idade em que estes apresentaram os primeiros sintomas da esquizofrenia. Os resultados são apresentados na tabela 1. Tabela 1 - Idade do Início dos Sintomas Idade (anos) Nº casos % 19 a menos de 20 10 20 a menos de 22 42 22 a menos de 25 90 25 a menos de 27 80 27 a menos de 30 18 30 anos ou mais 10 Total 250 Fonte: Hospital Maria Imaculada Identifique: a) População de estudo: b) Amostra estudada: c) Variável de pesquisa: Responda: d)Qual o percentual de pacientes que apresentaram sintomas com menos de 25 anos? e) Qual o percentual de pacientes que apresentaram sintomas com no mínimo 27 anos? 26. Segundo alguns estudos realizados, crianças com problemas perceptivos aumentam seus rendimentos com treinamento adequado. Com o objetivo de verificar se isto realmente ocorre, um investigador selecionou uma amostra de 8 crianças com problemas perceptivos e aplicou o teste de Raven para medir a percepção. Depois submeteu as mesmas crianças a 2 meses de treinamento e aplicou novamente o teste para obter novos escores. Os resultados obtidos foram: Criança João Maria Carlos Márcia Pedro Paulo Bruno Ana Antes do Treinamento: 70 72 80 75 77 80 74 81 Após o Treinamento: 74 73 84 75 84 95 88 86 a) Quem é a variável de estudo? 36 b) Quem é a amostra estudada? c) Calcule e interprete a média, mediana e o desvio-padrão para cada um dos grupos estudados. d) Qual grupo apresentou resultados mais homogêneos? Justifique sua resposta. e) Sabendo que quanto maior for o escore, maior é a capacidade de percepção da criança, conclua descritivamente sobre os resultados obtidos através das médias calculadas. 27. Um órgão de saúde realizou uma pesquisa para verificar a tendência à hipocondria de pacientes de uma determinada clínica. Para isso, 35 pacientes foram entrevistados e questionados sobre a quantidade de medicamentos diferentes que adquiriram sem receita médica em farmácias no último semestre, obtendo-se os seguintes resultados: 0 6 5 0 5 2 5 2 0 1 5 2 3 1 6 3 1 5 3 2 0 2 4 2 3 4 0 5 3 0 4 3 0 2 2 a) Quem é a variável de estudo? b) Quem é a amostra estudada? c) Construa uma tabela para estes dados. d) Calcule e interprete a média e o desvio-padrão para estes dados. e) Quantas pessoas consomem no mínimo 2 medicamentos sem receita? f) Qual a porcentagem de pessoas que não adquirem medicamentos sem receita? 28. A tabela 1 representa a Idade (anos) do início do tabagismo (ato de fumar) de uma amostra de 337 homens. Tabela 1 – Início do tabagismo Idade Nº de Homens % 12 a menos de13 23 13 a menos de14 42 14 a menos de15 54 15 a menos de18 123 18 a menos de20 45 20 anos ou mais 50 Total 337 Fonte: Instituto de Pesquisas do Câncer a) Complete a coluna do percentual da tabela. d) Qual o percentual de homens que começaram a fumar com no mínimo 18 anos? 37 29. Com o objetivo de comparar as idades em que crianças iniciam caminhar (em anos) entre aquelas que frequentam ou não escolinhas, um pesquisador realizou um estudo. Selecionou duas amostras de crianças: uma em escolinhas e outra nas residências destas crianças. Os dados coletados foram: Grupo 1: Crianças que frequentam escolinha 1,2 1,0 1,0 0,9 1,0 Grupo 2: Crianças que não frequentam escolinha 1,6 1,4 1,2 1,5 1,3 Considerando os dados acima apresentados, complete a seguinte tabela e realize um breve comentário descritivo sobre os resultados observados. Tabela 1 – Comparação descritiva da Idade média que iniciou a caminhar entre os grupos Grupo Idade Média Idade Modal Idade Mediana Desvio- padrão Crianças que frequentam escolinha Crianças que não frequentam escolinha 30. A esperança de vida ao nascer, no Brasil, vem experimentando, ao longo dos anos, incrementos paulatinos. Observou-se que os diferenciais entre os sexos também experimentaram aumentos ao longo dos 21 anos de estudo. Em 1980, enquanto as mulheres possuíam uma esperança de vida ao nascer de 66,0 anos, os homens detinham uma esperança de vida de 60 anos, representando uma diferença de 6,0 anos. Vinte e um anos mais tarde, as mulheres, no Brasil, já estariam vivendo 8 anos a mais que os homens (73 anos, para o sexo feminino e 65 anos, para o sexo masculino). No contexto mundial, o Brasil ocupa, segundo a Organização das Nações Unidas, através de sua Divisão de População, a 108a posição no ranking dos 187 países para os quais foram estimadas as esperanças de vida ao nascer, para o período 2000-2005. Apesar dos ganhos recentes, ainda há uma longa trajetória para o Brasil alcançar patamares como o da França (79,0 anos) e o do Japão (81,5 anos). 38 Fonte: IBGE - 2001 Considerando o gráfico apresentado marque V para verdadeiro e F para falso nas seguintes afirmativas: ( ) A variável apresentada neste gráfico é Esperanças de vida ao Nascer por sexo no Brasil – 1980 a 2001, ela é uma variável quantitativa. ( ) A esperança de vida média, neste período, para os homens é de 63,7 anos. ( ) A variável apresentada neste gráfico é o sexo, ela é uma variável qualitativa. ( ) Em relação à 1980, houve um acréscimo em 2001 na esperança de vida dos homens superior ao crescimento na esperança de vida das mulheres. ( ) Poderia ter utilizado um gráfico de linhas para representar estas dados. ( ) A moda para a esperança de vida dos homens é de 64,5 anos ( ) A mediana para a esperança de vida das mulheres é de 72 anos 31. Preocupada com a questão da gravidez na adolescência, uma pesquisadora realizou uma pesquisa com 12 adolescentes grávidas e, dentre as questões de estudo foi perguntada a idade destas meninas. Os resultados foram: 15 16 14 18 17 15 13 16 19 17 16 17 Identifique: a) Variável: b) Amostra: c) Construa uma tabela para estes dados. Esperanças de Vida ao Nascer (anos) por Sexo Brasil - 1980-2001 65656564 63 60 73737272 70 66 20 30 40 50 60 70 80 90 100 1980 1991 1998 1999 2000 2001 Ano Id a d e ( a n o s ) Homens Mulheres 39 32. A tabela 1 representa o número irmãos relatados por 153 crianças de uma escola: Tabela 1 – Número de irmãos Nº irmãos Nº crianças % 0 85 55,5 1 20 13,1 2 40 26,1 3 8 5,3 Total 153 100 Fonte: Famílias pesquisadas em uma escola Calcule e interprete: a) Média b) Desvio-padrão c) Coeficiente de Variação d) Assinale a alternativa correta nas afirmações abaixo: ( ) 31,4% das crianças têm pelo menos 2 irmãos ( ) 31,4% das crianças têm no máximo 2 irmãos ( ) 68,6% das crianças têm no mínimo 1 irmão ( ) 105 crianças têm menos que 1 irmãos 33. Considere o gráfico 1 para responder as seguintes questões: a) Qual é a variável deste estudo? Classifique-a b) Qual foi a amostra estudada? c) Quantas cidades possuem a taxa de mortalidade infantil acima de 20% d) Qual o percentual de cidades com a taxa de mortalidade infantil de no máximo 15% e) Qual é a taxa de mortalidade infantil média, mediana e modal destas cidades? f) Qual é o desvio-padrão desta taxa de mortalidade infantil? 40 Gráfico 1- Taxa de mortalidade infantil, por cidade, no RS, em 2002 Fonte: IBGE 34. À medida que a infecção pelo HIV dissemina-se pelo mundo, percebe-se que a epidemia não segue a mesma trajetória nas populações, apresentando-se de maneira distinta em cada área geográfica e afetando diferenciados segmentos populacionais em momentos diversos. No Brasil, a epidemia reflete a grandeza e a diversidade sociogeográfica do País e sua marcante heterogeneidade regional, que faz da epidemia brasileira uma soma de micro epidemias regionais. Essas características e o dinamismo deste processo, além de dificultarem as atividades de acompanhamento do curso da epidemia, de prevenção da disseminação do HIV e do planejamento para reduzir o seu impacto, torna indispensável ter um conhecimento mais profundo e preciso sobre a natureza da epidemia pelo HIV em cada região, unidade da federação e município. O gráfico 1 relata a incidência de casos onde o contágio realizou-se por causa da transfusão de sangue no período de 1995 a 2002. 13 14 14 14 15 15 16 16 17 18 19 20 21 22 24 33 0 5 10 15 20 25 30 35 Novo Hamburgo Sapucaia do Sul São Leopoldo Santa Cruz do Sul Santa Maria CanoasPorto Alegre Cachoeirinha Passo Fundo Viamão Gravataí Caxias do Sul Pelotas Rio Grande Bagé Uruguaiana 41 Gráfico 1 – Incidência de casos de AIDS por causa do contágio por transfusão de sangue de 1195 até 2002 Fonte: Secretaria Estadual de Saúde Considerando o gráfico apresentado marque V para verdadeiro e F para falso nas seguintes afirmativas: ( ) Em 62,5% dos anos o número de casos registrados foi inferior a 50 casos. ( ) A variável apresentada neste gráfico é incidência de casos de AIDS onde o contágio realizou-se através da transfusão de sangue no período de 1995 a 2002. Ela é uma variável quantitativa. ( ) A amostra desta pesquisa são os 8 anos selecionados (1995 a 2002). ( ) A mediana para estes dados é de 21 casos. ( ) A variável apresentada neste gráfico é o tempo de estudo que foi de 1995 a 2002 ( ) Poderia ter utilizado um gráfico de colunas para representar estes dados. ( ) A moda para estes dados é de 21 casos. 330 307 185 21 14 23 11 1 0 50 100 150 200 250 300 350 1995 1996 1997 1998 1999 2000 2001 2002 42 3 PROBABILIDADE A teoria das probabilidades, no fundo, não é mais do que o bom senso traduzido em cálculo; permite calcular com exatidão aquilo que as pessoas sentem por uma espécie de instinto... É notável que tal ciência, que começou nos estudos sobre jogos de azar, tenha alcançado os mais altos níveis do conhecimento humano. (LAPLACE) As Probabilidades existem há muito tempo, desde 1500-1400 A.C, os Jogos de Azar tornaram-se populares na época dos gregos e romanos, pela mão do Imperador Cláudio, que até em viagem jogava dados. Há quem acredite que o cálculo das probabilidades nasceu com os italianos Paccioli, Cardano, Tartaglia e Galileu. Todos estes matemáticos baseavam o seu estudo na observação de fenômenos aleatórios sobre os quais inferiam baseados no senso comum, o que consideravam como curiosidades matemáticas. Tal como qualquer ramo da ciência o estudo das probabilidades começou com o quotidiano, ou seja, com a observação de fenômenos diários e como explicação para muitas situações que ocorriam aleatoriamente. Com o passar do tempo a probabilidade começou a ser tratada como uma questão matemática, e assim foi evoluindo até ao que estudamos hoje em dia. Em resumo, a Teoria das Probabilidades se apresenta como um estudo teórico de fenômenos envolvendo a incerteza utilizando ferramentas básicas do Cálculo Matemático. Esses fenômenos, conhecidos como aleatórios, estocásticos ou não determinísticos, são aqueles que a sua repetição, em condições idênticas, produzem resultados diferenciados, isto é, não é possível determinar, com exatidão, qual o seu resultado. Esses fenômenos, na verdade, são predominantes em todas as áreas do conhecimento. Nos dias atuais, no entanto, não é mais possível pensar em estatística sem pensar em probabilidade. A probabilidade constitui a base da estatística indutiva, permite tomar decisões e qualificar o erro cometido ao tomar decisões. Ela subsidia o estudo dos fenômenos aleatórios. Essa interdependência, porém, só vem a acontecer no início do século passado através da necessidade de generalização de um estudo sobre cruzamento de várias espécies de plantas feito pelo botânico Fisher. Nessa época surge o que hoje chamamos Inferência Estatística (inferir, como conceito estatístico, significa generalizar). 43 3.1 CONCEITOS BÁSICOS DE PROBABILIDADE O termo probabilidade se refere ao estudo da aleatoriedade e da incerteza. O que vem a ser um experimento aleatório? De acordo com Morgado et al. (1997), um experimento aleatório é aquele que, se repetido sobre as mesmas condições, não produz necessariamente o mesmo resultado, ou seja, é qualquer ação ou processo cujo resultado está sujeito à incerteza. Este conceito pode ser interpretado da seguinte forma: mesmo que se conheçam todas as variáveis envolvidas em um experimento e se tenha controle sobre elas, o resultado final poderá não ser o mesmo, ainda que o experimento seja repetido sob condições idênticas. Assim sendo temos fenômenos determinísticos e aleatórios. Os determinísticos são aqueles em que os resultados são sempre os mesmos, qualquer que seja o número de ocorrências verificadas. Os aleatórios os resultados não são previsíveis, mesmo que haja um número grande de repetições do mesmo fenômeno. Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A observação de um fenômeno aleatório por parte do homem é chamada de experimento aleatório. Características de um experimento aleatório: 1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém podemos descrever todos os possíveis resultados - as possibilidades; 2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma forma aparentemente acidental. Mas quando o número de repetições aumenta, uma regularidade aparecerá. E esta regularidade que torna possível construir um modelo matemático preciso para analisar o experimento. Espaço Amostral de um experimento (S): Para cada experimento o conjunto de todos os resultados possíveis é chamado de Espaço Amostral denotado pela letra S. 44 Exemplo 1: Considere o experimento: Lançamento de 1 dado S: {1,2,3,4,5,6} Exemplo 2: Considere o experimento: Lançamento de 1 moeda S: {cara, coroa} Exemplo 3: Considere o experimento: Observar o Fator Rh de um casal S: {(H+ M+);(H+ M-);(H- M+);(H- M-)} EXEMPLOS: Determine o Espaço Amostral dos seguintes experimentos: a) Lançamento de duas moedas simultaneamente b) Lançamento de uma moeda duas vezes c) Observar o tipo sanguíneo de um indivíduo d) Retirar uma carta do baralho e observar apenas o naipe e) Lançamento de dois dados simultaneamente f) Lançamento de 1 dado e 1 moeda g) Lançamento de 1 moeda três vezes h) Observar o sexo dos filhos de um casal com três filhos i) Observar o número de pacientes bipolares em uma clínica com 10 pacientes internados. Definição de Probabilidade: Na definição clássica de probabilidade, considerando que todos os resultados possíveis são equiprováveis (tenham a mesma probabilidade de ocorrência), podemos definir probabilidade como sendo: Considere A o evento de interesse: nº de casos favoráveis ao evento A P(A) = nº possíveis de casos Notação para Probabilidade 45 P – representa a probabilidade A, B ,C – representam eventos específicos P(A) - representa a probabilidade de o evento A ocorrer A probabilidade de um evento A deve ser um número maior ou igual a 0 e menor ou igual a 1: 0 P(A) 1 ou ainda, em termos percentuais, 0% P(A) 100% Exemplo: Considere uma caixa contendo 10 brindes: 4 livros, 2 celulares, 1 rádio e 3 perfumes. Você tem direito a um destes brindes que serão sorteados. Qual a probabilidade de você: a) Ganhar um livro b) Ganhar um celular c) Ganhar um rádio ou um celular d) Não ganhar perfume Na definição frequentista de probabilidade, um experimento é realizado (repetido) um grande número de vezes, onde é observado o número de vezes (frequência) em que ocorre um determinado evento A de interesse. 𝑃(𝐴) = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑧𝑒𝑠 𝑞𝑢𝑒 𝑜 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 𝑜𝑐𝑜𝑟𝑟𝑒𝑢 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑧𝑒𝑠 𝑒𝑚 𝑞𝑢𝑒 𝑜 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑓𝑜𝑖 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜 Exemplo: Adultos são aleatoriamente selecionados para uma pesquisa do IBOPE, e pergunta-se a eles se são a favor da pena de morte para uma pessoa acusada de assassinato. Os resultados da pesquisa realizada com 519 pessoas concluem que 338 destas são a favor da pena de morte. Com base nestes resultados, estime a probabilidade de uma pessoa, escolhida aleatoriamente ser: a) a favor da pena de morte para uma pessoa acusada de assassinato b) contra a pena de morte para uma pessoa acusada de assassinato46 3.2 PROPRIEDADES DA PROBABILIDADE PROPRIEDADE 1: PROBABILIDADE COMPLEMENTAR O evento complementar de A é o evento formado por todos os resultados do espaço amostral que não pertencem à A. A probabilidade de não ocorrência de A é descrita como )(AP e é expressa da forma: )(1)( APAP PROPRIEDADE 2: REGRA DA ADIÇÃO Se A e B são dois eventos que não podem ocorrer ao mesmo tempo então: A B P(A ou B) = P(A) + P(B) Exemplo: Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás e R – retirar um Rei. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou um Rei? P(A ou R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 0,1538 Se A e B são dois eventos que podem ocorrer ao mesmo tempo então: P(A ou B) = P(A) + P(B) – P(A e B) A B 47 Exemplo 1: Ao retirar uma carta do baralho considere os eventos: A retirar um Ás e E retirar uma carta no naipe de Espadas. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou uma carta do naipe de espadas? P(A ou E) = P(A) + P(E) – P(A e E) = 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 Exemplo 2: A probabilidade de um estudante obter conceito A em uma disciplina é 40%, conceito B 20%, conceito C 30% e conceito D 10%. Qual a probabilidade deste estudante ter: a) conceito A ou B 60% 100 * 0,60 0,20 0,40 P(B) P(A) B) ouP(A b) conceito C ou D 40% 100 * 0,40 0,10 0,30 P(D) P(C) D) ou P(C c) conceito B ou C 50% 100 * 0,50 0,30 0,20 P(C) P(B) C) ou P(B PROPRIEDADE 3: REGRA DA MULTIPLICAÇÃO Se A e B são dois eventos independentes então: P(A e B) = P(A) x P(B) Exemplo: Em um departamento de orientação profissional observou-se que a probabilidade de um estudante apresentar alto escore de inteligência é 20%, apresentar elevado escore em adaptação social (QI Emocional) é 30% e apresentar tendências neuróticas é 5%. Considerando estes valores, qual a probabilidade de um estudante: a) apresentar alto escore de inteligência e elevado escore de adaptação social 6% 100 * 0,06 0,30 0,20 P(AS) P(EI) AS)e P(EI 48 b) apresentar alto escore de inteligência e tendências neuróticas 1% 100 * 0,01 0,05 0,20 P(TN) P(EI) TN) e P(EI Dois eventos são independentes quando a ocorrência ou não de um evento não tem efeito algum na probabilidade de ocorrência do outro evento. Dois eventos são dependentes quando a ocorrência ou não ocorrência de um evento afeta a probabilidade de ocorrência do outro. 3.3 PROBABILIDADE CONDICIONAL Vamos considerar o seguinte exemplo para ilustrar a ideia de probabilidade condicional: Tabela 1 – Tipo de câncer por sexo do paciente Tipo Sexo Total Masculino Feminino Câncer no Pulmão 240 135 375 Câncer de Pele 80 114 194 Leucemia 20 51 71 Total 340 300 640 Fonte: Pesquisa com pacientes com câncer Qual é a probabilidade de: a) Um paciente apresentar câncer no pulmão = 375/640 = 0,5859 = 58,59% b) Um paciente apresentar Leucemia c) Um paciente ser do sexo Feminino d) Um paciente ser do sexo Masculino e) Um paciente apresentar câncer no pulmão dado que é do sexo Masculino Masculino = 340 Câncer no pulmão = 240/340 = 0,7059 = 70,59% f) Um paciente apresentar câncer no pulmão dado que é do sexo Feminino g) Um paciente ser do sexo feminino dado que ele tem câncer de pele h) Um paciente apresentar câncer de pele dado que é do sexo Masculino 49 EXERCÍCIOS DO CAPÍTULO 3 35. Em uma maternidade em um determinado mês, foram registrados 205 recém- nascidos dos quais 35 apresentaram baixo peso ao nascer. Um bebê é escolhido aleatoriamente neste grupo, qual é a probabilidade dele apresentar: a) Baixo peso b) Peso normal 36. Dos 1200 acidentes de trânsito registrados em uma BR verificou-se que 780 foram provocados por motoristas de 18 a 25 anos, 240 por motoristas de 26 a 35 anos e 180 por aqueles com mais de 35 anos. Qual a probabilidade de ocorrer um acidente neste BR e ele ser provocado por um motorista com idade: a) de 18 a 25 anos b) de 26 a 35 anos c) Mais de 35 aos d) 35 anos ou menos 37. Considere a tabela 1 para resolver esse problema. Tabela 1 – Resultados de um teste que detecta o uso de maconha pela análise do sangue Resultado do Teste O sujeito usou maconha Total Sim Não Positivo (presença de maconha) 119 24 143 Negativo (ausência de maconha) 3 154 157 Total 122 178 300 Fonte: Pesquisa de dependência química Um indivíduo realiza este teste, qual é a probabilidade de ocorrer um resultado: a) Falso positivo b) Falso negativo c) Positivo verdadeiro d) Negativo verdadeiro 38. A probabilidade de um homem estar vivo daqui a 30 anos é de 40% e de sua mulher é de 65%. Qual a probabilidade de que daqui a 30 anos: a) ambos estejam vivos b) somente a mulher esteja viva c) ambos estejam mortos d) somente a mulher esteja morta e) um deles esteja vivo 50 39. Um terço dos eleitores de certa comunidade é constituído por homens e 10% dos eleitores votaram em branco na última eleição. Supondo que estes eventos sejam independentes, determine a probabilidade de escolher aleatoriamente um homem e este ter votado em branco na última eleição. 40. Em 25% das vezes João chega em casa tarde para jantar. Por outro lado, o jantar atrasa 10% das vezes. Se não há qualquer relacionamento entre os atrasos de João e os atrasos para jantar, qual é a probabilidade de ocorrerem ambos os atrasos? 41. Marcelo tem dois velhos automóveis. Nas manhãs frias, há 20% de probabilidade de um deles não pegar e 30% do outro não pegar. Em uma manhã fria qual a probabilidade de: a) nenhum pegar b) apenas 1 pegar 51 4 NOÇÕES DE AMOSTRAGEM Frederick Mosteller, estatístico e professor em Harvard disse, certa vez, que é possível mentir usando estatísticas, mas que se mente mais, e melhor, sem estatísticas. É preciso entender que as amostras podem levar a conclusões erradas. Contudo, as opiniões pessoais, sem base em dados, levam, em geral, a conclusões muito mais erradas. Frequentemente precisamos obter conclusões para um conjunto de elementos (população) observando apenas uma parcela deste conjunto (amostra). Este processo é chamado de INFERÊNCIA ESTATÍSTICA. É importante termos a consciência de que a possibilidade de erro é inerente ao processo de inferência. A preocupação fundamental para minimizar o risco de errar ao tomar uma decisão é com a forma de seleção da amostra. O critério a ser utilizado na seleção dos elementos deve ser muito cuidadoso, para que possamos tomar as nossas decisões com níveis de segurança aceitáveis. A seguir, algumas das principais técnicas de amostragem. 4.1 AMOSTRAGEM PROBABILÍSTICA É a designação dada a todos os métodos de amostragem que envolvem seleção aleatória dos elementos, atribuindo a cada elemento da população uma probabilidade de pertencer à amostra. Podemos destacar as seguintes técnicas de amostragem probabilística. 4.1.1 Amostra Aleatória Simples Equivale a um sorteio lotérico, em que todos os elementos da população têm iguais probabilidades de pertencer à amostra e todas as possíveis amostras têm iguais probabilidades de ocorrer. 52 4.1.2 Amostra Aleatória Sistemática Consiste numa variação da amostra aleatória simples, que tem por objetivo facilitar a obtenção da amostra. Ela é feita, selecionando-se elementos em intervalos regulares (a cada dez ou vinte, por exemplo), partindo de um cadastro previamente organizado de acordo com um critério que não tenha relação com a variável de interesse. 4.1.3 Amostra Aleatória Estratificada É indicada nos casos em que a população é muito heterogênea,
Compartilhar