Baixe o app para aproveitar ainda mais
Prévia do material em texto
Revisão técnica: Rute Henrique da Silva Ferreira Licenciada em Matemática Mestre em Educação Matemática Doutora em Sensoriamento Remoto Catalogação na publicação: Karin Lorien Menoncin CRB-10/2147 P228b Parenti, Tatiane. Bioestatística / Tatiane Parenti, Juliane Silveira Freire da Silva, Jamur Silveira; [revisão técnica : Rute Henrique da Silva Ferreira ]. – Porto Alegre: SAGAH, 2018. 207 p. il. ; 22,5 cm ISBN 978-85-9502-362-8 1. Bioestatística. I. Silva, Juliane Silveira Freire da. II. Silveira, Jamur. III.Título. CDU 311 Bioestatistica_LIVRO.indb 2 13/03/2018 09:16:30 WYQÁXMS Ytmjeji 7 Iwzezíwzmge i hmsiwzezíwzmge: je vsvyreçãs à eqswzxe ....................79 Zezmete Qexuyiw je Wmrbe Vexitzm Erkyqew jilmtmçõiw mqvsxzetziw ..................................................................................................... 79 Jmlixitgmetjs gstgimzsw ........................................................................................................................ 70 I te vxázmge, gsqs lmge? .......................................................................................................................... 73 Bexmábimw uyermzezmbew i bexmábimw uyetzmzezmbew ...............................69 Zezmete Qexuyiw je Wmrbe Vexitzm Bexmábimw te hmsiwzezíwzmge ......................................................................................................................69 Idvrsxetjs ew bexmábimw...........................................................................................................................63 I te vxázmge? ...................................................................................................................................................62 Sxketmfeçãs jsw jejsw uyetzmzezmbsw ...............................................99 Zezmete Qexuyiw je Wmrbe Vexitzm Sxketmfetjs sw jejsw ............................................................................................................................ 99 Xivxiwitzetjs sw jejsw .......................................................................................................................93 Jejsw i gstpytzs ji jejsw ...................................................................95 Zezmete Qexuyiw je Wmrbe Vexitzm S uyi wãs jejsw iwzezíwzmgsw?.............................................................................................................95 Gsqs xigstnigix yq gstpytzs ji jejsw ................................................................................. 87 Gstwzxymtjs yq gstpytzs ji jejsw .............................................................................................88 Xefãs i vxsvsxçãs .................................................................................... 85 Zezmete Qexuyiw je Wmrbe Vexitzm S uyi wixme e “xefãs”? ...............................................................................................................................85 S uyi é “vxsvsxçãs”? ...............................................................................................................................14 Beqsw à vxázmge! .......................................................................................................................................... 17 Estatística e bioestatística: da população à amostra Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir estatística, bioestatística, população e amostra. � Diferenciar os conceitos de estatística, bioestatística, população e amostra. � Relacionar esses conceitos com as suas aplicações na rotina diária do profissional da saúde. Introdução Neste texto, você vai estudar os conceitos de estatística, bioestatística, população e amostra, bem como as suas características e sua utilização em bioestatística. Algumas definições importantes A estatística é usada como fonte de dados há muitos séculos, “é a ciência que tem por objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados”. Apesar de estarmos habituados à análise de infor- mações populacionais (especialmente nos censos demográficos), ela também pode ser usada como fonte em outras ciências e, no nosso caso, especialmente nas ciências ligadas à vida e aos seres vivos. Mais do que dados, a estatística nos oferece a oportunidade de olhar para as informações fornecidas, de maneira crítica, e analisá-las a partir disto. Ela é aplicada à area da saúde em diversos contextos, desde diagnósticos com base no levantamento de ocorrências, até a comprovação da eficácia Bioestatistica_LIVRO.indb 13 13/03/2018 09:16:31 de medicamentos e outros dados importantes. Nas ciências biológicas e na medicina veterinária não é diferente. Ao pesquisador, cabe a interpretação e a análise das conclusões, possibilitando readequação de tratamentos, opções por medicamentos mais eficientes ou interferência nas atividades desenvolvidas em determinado ambiente, por exemplo. Oferece ainda a possibilidade de análise e interpretação de informações sobre medicamentos, equipamentos, avaliação de protocolos e artigos científicos. Dizemos, então, que a estatística é auxiliar da pesquisa científica e que deve estar aliada ao conhecimento e ao estudo do objeto em si, seja ele uma determinada enfermidade, a ação de um medicamento, a intervenção em uma unidade de preservação ambiental ou outras. Nestes casos, referimo-nos à bioestatística, segmento aplicado às ciências relacionadas à vida, à saúde, como medicina, enfermagem, fisioterapia, veterinária, biologia, ecologia, agronomia, engenharia ambiental e tantas outras especialidades. Dois conceitos são primordiais ao entendimento da análise estatística de dados: população e amostra. A população se refere ao grupo mais amplo de análise, como, por exemplo, todos os homens entre 50 e 60 anos com diabetes do tipo 2. Porém, sabemos que fazer uma pesquisa com uma população tão ampla se torna inviável. Então, cria-se um “subgrupo”, que chamamos de amostra (Figura 1). Esta opção permite que se faça a mesma análise em um grupo menor, desde que estabelecidos parâmetros de seleção. Figura 1. Ilustração de pesquisa por meio de amostra. Fonte: ANÁLISE... (2015). População Amostra Estatística e bioestatística: da população à amostra 14 Bioestatistica_LIVRO.indb 14 13/03/2018 09:16:31 No mesmo exemplo, tomaríamos um grupo composto por homens, pacientes de diabetes do tipo 2, com idades entre 50 e 60 anos e que estivessem em tratamento na unidade básica de saúde de um determinado bairro da cidade de Porto Alegre. Poderiam ser estabelecidos parâmetros ainda mais específicos, diminuindo o tamanho da amostra até atingirmos a necessidade da pesquisa, mas de maneira que não interferisse na qualidade dos dados. Por exemplo, no grupo, selecionaríamos apenas os que fazem uso de insulina, ou os que não fazem, e poderíamos usar como parâmetro o gênero, separando assim homens e mulheres que tenham a mesma idade e a mesma condição de saúde. Devemos considerar ainda as variáveis que podem interferir nos resultados da pesquisa. No caso do exemplo, considerar se os pacientes realizam atividades físicas ou não, se fazem controle da alimentação, se possuem neuropatias, se utilizam medicamentos para cardiopatias e também outros aspectos que possam inteferir nos resultados. Há várias possibilidades de uso estatístico, como, por exemplo, os dados obtidos no site da Sociedade Brasileira de Endocrinologia e Metabologia, pois, segundo estes, a diabetes atinge mais homens do que mulheres (Figura 2). Em uma projeção, é possível perceber a tendência a aumentar o número de pacientes nas próximas décadas. Figura 2. Gráfico de acometidos pela diabetes. Fonte: Sociedade Brasileira de Endocrinologia e Metabologia (2015). Diabetes por gênero Número de homens com diabetes 2015 215.1 milhões 2040 328.4 milhões 2015 199.5 milhões 2040 313.3 milhões Número de mulherescom diabetes 15 Estatística e bioestatística: da população à amostra Bioestatistica_LIVRO.indb 15 13/03/2018 09:16:32 Você sabia que os parâmetros podem alterar os resultados da pesquisa? No caso dos pacientes com diabetes, por exemplo, o uso de insulina pode ser uma parâmetro, pois deverá interferir nos resultados se o objetivo for a aplicação de algum medicamento novo. Gênero, idade, uso de medicamentos e doenças crônicas são parâmetros que devem ter sua relevância considerada nas análises. Diferenciando conceitos Vamos analisar um exemplo para diferenciar na prática os termos estudados. Uma médica pediatra quer fazer uma análise estatística do uso de me- dicamentos homeopáticos por pacientes de 1 a 3 anos de idade. Ela deseja comparar os efeitos do uso destes medicamentos com os alopáticos. Seu objetivo é investigar se os homeopáticos oferecem vantagem em relação aos medicamentos alopáticos. Para isto, inicia definindo a população: todos os seus pacientes nesta faixa etária. Após essa primeira etapa, seleciona duas amostras que considerará como parâmetro para o tipo de medicação oferecida aos pacientes: � Amostra 1 – aqueles cujos pais optam por medicamentos homeopáticos sistematicamente, que são seus pacientes desde o nascimento e que não apresentam doenças crônicas. Sua análise terá como indicadores o número de vezes que as crianças apresentaram alguma alteração na saúde no período de um ano, bem como o tipo de doença que apresen- taram. Serão consideradas variáveis importantes a evolução do peso e o desenvolvimento físico das crianças. � Amostra 2 – composta por pacientes cujos pais não utilizam medica- mentos homeopáticos nos tratamentos, que são seus pacientes desde o nascimento e que não apresentam doenças crônicas. Para obter resultados mais confiáveis, os parâmetros e as variáveis serão os mesmos. Supondo que a médica realize os registros e as verificações necessárias ao longo de 1 ano, conforme a proposta da pesquisa, ao final deste prazo ela poderá, por intermédio dos dados obtidos, verificar se a sua hipótese inicial foi comprovada ou não. Se os dados das variáveis e os parâmetros forem Estatística e bioestatística: da população à amostra 16 Bioestatistica_LIVRO.indb 16 13/03/2018 09:16:32 registrados, estes podem oferecer pistas das razões pelas quais a hipótese se comprova ou não. Assim, os dados podem ser utilizados em desdobramentos da mesma pesquisa ou provocar a necessidade de uma nova coleta de dados A vantagem desse tipo de análise é que ele oportuniza ao profissional uma maior segurança na tomada de decisões, além de melhores e mais confiáveis argumentos aos pacientes e aos clientes e maior sucesso nas abordagens escolhidas. As variáveis podem interferir nos resultados da pesquisa e não é sempre que elas podem ser previstas pelo pesquisador. São variáveis, por exemplo, a idade e o peso dos indivíduos ou o tempo de exposição a determinado parâmetro. Supondo que fosse realizada uma pesquisa acerca da relação do hábito de fumar com a incidência de tumores nos pulmões, uma variável óbvia e previsível seria o tempo de exposição ao fumo, enquanto uma variável imprevisível seria a intercorrência de outras doenças ao longo da análise. E na prática, como fica? O maior ganho da aplicabilidade da estatística no trabalho do profissional da saúde é poder conhecer seus pacientes e seus clientes de uma maneira mais objetiva e obter dados concretos que podem interferir na qualidade do seu trabalho. Por exemplo: uma dentista que atende em dois consultórios localizados em regiões bem distantes de uma mesma cidade. Em um deles, ela atende pacientes de baixa renda, que consultam ocasionalmente e, em geral, com diagnósticos de tratamento de canal e outros; no outro consultório, atende pacientes de classe média alta, acostumados a realizar consultas periódicas e que, na maioria das vezes, buscam por tratamentos estéticos e ortodônticos. A profissional deseja organizar seu material de trabalho, otimizando investimentos e reduzindo custos e desperdícios de materiais. Neste caso, a população se refere aos seus pacientes nos dois consultórios. Ela estabelece como amostra os pacientes que procuraram seus serviços nos últimos seis meses e cria uma tabela para cada consultório, em que os dados que lhe servirão de parâmetros (Figura 3). 17 Estatística e bioestatística: da população à amostra Bioestatistica_LIVRO.indb 17 13/03/2018 09:16:32 Figura 3. Exemplo de tabela utilizada pela dentista para controle do material necessário. Após verificar os dados, a profissional poderá analisar em qual consultório ela tem maior necessidade de estoque e de que tipo de material e também com que outros profissionais ela deve estabelecer parcerias (na produção de implantes, próteses e aparelhos). Outro exemplo: um médico ginecologista pretende analisar os efeitos de um novo medicamento que interfere na produção hormonal pós-menopausa. Como tem muitas pacientes nesta condição, organizou uma planilha e solicitou que algumas das suas clientes respondessem e lhe enviassem seus pareceres após o uso do medicamento. Determinou como população suas pacientes em pós-menopausa e as dividiu por faixa etária em duas amostras: a amostra 1, constituída por pacientes com idades entre 50 e 60 anos, e a amostra 2, composta por pacientes com idades entre 60 e 70 anos. Na planilha, solicita às pacientes que informem sobre os sintomas que o medicamento se propõe a combater e como se sentem após o uso deste durante um período de três meses. Finalizado este período, ao receber o retorno das pacientes, o médico poderá analisar se houve diminuição/melhora dos sintomas, em qual faixa etária o medicamento traz melhores efeitos, se o uso contínuo produz o efeito esperado e outras dúvidas que ele possa ter a esse respeito. A estatística também está presente em artigos e estudos a respeito de do- enças e de tratamentos na área médica. Ler e interpretar os dados, as tabelas e os gráficos proporciona maior segurança e entendimento dos resultados Estatística e bioestatística: da população à amostra 18 Bioestatistica_LIVRO.indb 18 13/03/2018 09:16:32 informados. Assim como, ao escrever artigos e dados médicos, é de suma importância que se utilize dados estatísticos que sustentem as afirmações que se faça sobre determinado estudo, seja ele na medicina, na biomedicina, na biologia ou em outras áreas às quais se dediquem as análises. O link a seguir contém um exemplo de pesquisa que utiliza dados estatísticos na área da ginecologia. https://goo.gl/eJp58z 1. Qual o único estudo que envolve a pesquisa em toda a população brasileira? a) Pesquisa eleitoral brasileira. b) Pesquisa da opinião dos moradores de um bairro sobre o saneamento básico. c) Levantamento de informações sobre os usuários de um serviço de telefonia. d) Censo brasileiro proposto pelo IBGE. e) Pesquisa sobre a qualidade do atendimento de uma empresa em uma cidade. 2. O conceito de bioestatística difere do conceito de estatística em um ponto principal. Assinale a alternativa correta. a) A estatística analisa dados das ciências biológicas e da saúde. b) A bioestatística é um ramo do conhecimento que consta de processos que têm por objeto a observação, a classificação e a análise de fenômenos coletivos com a finalidade de obter inferências indutivas a partir dos dados de equipamentos e produtos. c) A estatística analisa todas as informações referentes à área da saúde. d) Bioestatística é a aplicação da 19 Estatística e bioestatística: da população à amostra Bioestatistica_LIVRO.indb 19 13/03/2018 09:16:32 estatística nas ciências biológicas e da saúde. Ela é essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa. e) Estatística é a aplicação da bioestatística nas ciências da saúde. 3. Marque a alternativa incorreta: a) amostra é um subconjunto com menor número de elementos(parte), ou seja, toda fração (independente do tamanho) obtida de uma população. b) a amostra é qualquer fração de uma população. Como sua finalidade é representar a população, deseja-se que a amostra escolhida apresente as mesmas características da população de origem, isto é, que seja uma amostra “representativa” ou “não tendenciosa”. c) bioestatística é a aplicação da estatística nas ciências biológicas e da saúde. Ela é essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa. d) estatística é ramo do conhecimento que consta de processos que têm por objeto a observação, a classificação e a análise de fenômenos coletivos com a finalidade de obter inferências indutivas a partir dos dados. e) o conceito de população em bioestatística refere-se especificamente a um grupo de pessoas residentes em um local geográfico delimitado. 4. Identifique qual das opções abaixo expressam dados para análise bioestatística: a) dados de uma indústria automobilística. b) dados de uma empresa que produz parafusos. c) dados de uma auditoria contábil. d) dados referentes à produção de um grupo de operários. e) dados dos pacientes de uma clínica de vacinas. 5. Complete a frase com as palavras adequadas e marque a alternativa correta: _________________________ são informações que resumem uma população, são difíceis de serem obtidas, pois implicam o estudo de toda a população. E _____________________ são usados(as) para realizar inferências sobre o parâmetro, são valores calculados em amostras representativas da população-alvo. a) Estimativas, parâmetros. b) Parâmetros, estimativas. c) Estatísticas, bioestatísticas. d) Populações, amostras. e) Estimativa, amostras. Estatística e bioestatística: da população à amostra 20 Bioestatistica_LIVRO.indb 20 13/03/2018 09:16:32 ANÁLISE estatística: como definir a dimensão da amostra. [2015]. Disponível em: <http:// analise-estatistica.pt/2015/03/como-definir-a-dimensao-da-amostra.html>. Acesso em: 22 ago. 2017. SOCIEDADE BRASILEIRA DE ENDOCRINOLOGIA E METABOLOGIA. Atlas mundial de diabetes 2015. 2015. Disponível em: <https://www.endocrino.org.br/atlas-2015-dis- ponivel/>. Acesso em: 24 jul. 2017. Leitura recomendada CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Art- med, 2003. 21 Estatística e bioestatística: da população à amostra Bioestatistica_LIVRO.indb 21 13/03/2018 09:16:32 Variáveis qualitativas e variáveis quantitativas Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Identificar os tipos de variáveis utilizadas em bioestatística. � Diferenciar a variável qualitativa da quantitativa. � Especificar os tipos de variáveis que o profissional da saúde obtém em sua prática diária. Introdução Neste texto, você vai estudar os diferentes tipos de variáveis qualitativas e quantitativas, suas características e suas aplicações em bioestatística. Variáveis na bioestatística O conceito de variáveis se refere às características individuais daquele que está servindo como unidade ou objeto de estudo, como o gênero, o peso e a altura de uma pessoa dentro de um universo. Assim, as variáveis representam quaisquer características que possam modificar o resultado da pesquisa. Em Bioestatística, assim como em Estatística, sabemos que as variáveis, em geral, enquadram-se em uma classificação entre quantitativas e qualitativas. Como os termos indicam, as quantitativas se referem a atributos mensuráveis e as qualitativas àqueles que não tem correspondência numérica. Retomando estes conceitos, dizemos que: Bioestatistica_LIVRO.indb 23 13/03/2018 09:16:32 Variáveis quantitativas se referem àquelas expressas em valores numéri- cos, como altura e peso dos sujeitos analisados, como o número de indivíduos de uma espécie de animal ou de planta presente na área estudada em uma pesquisa sobre determinado ecossistema e como o número de nascidos vivos em uma maternidade específica, enfim, as variáveis quantitativas se adequam às necessidades da pesquisa e representam valores referentes ao universo pesquisado. As variáveis quantitativas podem ser classificadas como discretas ou contínuas, sendo que as discretas devem ser medidas, em geral, por números inteiros. É o caso de dados como óbitos e nascimentos, por exemplo. Já as variáveis contínuas permitem resultados com valores numéricos não inteiros, como quantidades de determinada substância ou valores próximos. Vejamos na Tabela 1 um exemplo de tabela gerada a partir de dados quan- titativos em pesquisa realizada com estudantes da Universidade Federal de Alfenas, em Minas Gerais (UNIFAL). Dizemos que as variáveis apresentadas são quantitativas discretas, pois se referem ao número de estudantes que afirma ter se automedicado e quais as substâncias utilizadas. Variáveis qualitativas e variáveis quantitativas24 Bioestatistica_LIVRO.indb 24 13/03/2018 09:16:32 Fonte: Silva et al. (2011). Medicamentos Cursos Medicina Farmácia Odontologia Enfermagem n1 % n2 % n3 % n4 % Analgésicos Antitérmicos 307 93,03 153 94,44 102 82,92 28 90,32 Anti-inflamatórios 242 73,33 123 75,92 98 79,67 28 90,32 Xaropes para tosse 193 58,48 128 79,01 88 71,54 20 64,51 Antiasmáticos 20 6,06 8 4,93 5 4,06 3 9,67 Antibióticos 172 51,12 93 57,40 77 62,6 24 77,41 Antidepressivos 23 6,96 9 5,55 7 5,69 3 9,67 Corticoides sistêmicos 16 4,84 29 17,9 5 4,06 5 16,12 Corticoides nasais 52 15,75 33 20,37 19 15,44 11 35,48 Descongestionantes nasais 188 56,96 100 61,72 78 63,41 21 67,74 Antialérgicos/ anti-histamínicos 124 37,57 47 29,01 48 39,02 12 38,7 Fármacos para resfriados, gripes 270 81,81 149 91,97 109 88,61 29 93,54 Fármacos para permanecer acordado 90 27,27 23 14,19 29 23,57 7 22,58 Fármacos para dormir 75 22,72 17 10,49 21 17,07 7 22,58 NOTA: houve mais de uma resposta por acadêmico. n1 = 330; n2 = 162; n3 = 123; n4 = 31 Tabela 1. Exemplo de apresentação de dados quantitativos com variáveis discretas. Variáveis qualitativas se referem a valores não numéricos e não mensurá- veis, como gênero, etnia e outros dados relevantes, mas sem correspondência ou valor numérico. São chamadas de qualitativas nominais as que se referem a atributos como gênero e etnia e de qualitativas ordinais as que se referem a atributos que não podem ser medidos, mas que seguem uma escala de classi- ficação, como do “melhor” ao “pior”, por exemplo. 25Variáveis qualitativas e variáveis quantitativas Bioestatistica_LIVRO.indb 25 13/03/2018 09:16:32 Devemos destacar que uma variável numérica não é necessariamente quantitativa, se por exemplo, na planilha de pesquisa o gênero do pesquisado for registrado por números (1 = masculino; 2 = feminino; 3 = transgênero, etc.), ainda assim esta continua sendo uma variável qualitativa, pois se refere a informação não mensurável. A Tabela 2 mostra a relação de dados qualitativos gerada a partir da “Análise da contribuição do Programa Bolsa Família para o enfrentamento da pobreza e a autonomia dos sujeitos beneficiários”, realizada em 2013. Neste caso, a variável segue uma escala que vai do “Melhorou muito” até o “Piorou muito”, sendo identificada como Ordinal. Fonte: Testa et al. (2013). Média Melhorou muito Melhorou Não melhorou ou piorou Piorou Piorou muito Situação geral da família 1,81 30,1% (31) 60,2% (62) 8,7% (9) 1,0% (1) 0,0% (0) Alimentação 1,95 16,5% (17) 71,8% (74) 11,7% (12) 0,0% (0) 0,0% (0) Educação 2,13 9,7% (10) 67,0% (69) 22,3% (23) 0,0% (0) 0,0% (0) Saúde 2,24 8,7% (9) 58,3% (60) 33,0% (34) 0,0% (0) 0,0% (0) Relações familiares 2,36 9,7% (10) 50,5% (52) 34,0% (35) 5,8% (6) 0,0% (0) Risco 2,38 10,7% (11) 43,7% (45) 42,7% (44) 2,9% (3) 0,0% (0) Convívio social 2,42 6,8% (7) 42,7% (44) 47,6% (49) 0,0% (0) 0,0% (0) Moradia 2,50 7,8% (8) 40,8% (42) 43,7 (45) 6,8% (7) 0,0% (0) Lazer 2,59 5,8% (6) 32,0% (33) 58,3% (60) 2,9% (3) 0,0% (0) Trabalho2,74 2,9% (3) 29,1% (30) 59,2% (61) 6,8% (7) 1,0% (1) Conjunto 10,9% (112) 49,6% (511) 36,1% (372) 2,6% (27) 0,1% (1) Tabela 2. Percepção de melhoria quanto às situações de vida. Variáveis qualitativas e variáveis quantitativas26 Bioestatistica_LIVRO.indb 26 13/03/2018 09:16:32 Explorando as variáveis As variáveis quantitativas e qualitativas são muito utilizadas em todos os tipos de pesquisas que usam dados estatísticos. Vejamos alguns exemplos que podem auxiliar no entendimento da finalidade e do conceito de cada uma, assim como as diferenças entre elas. Supondo que temos uma proposta de pesquisa em que se pretende investigar a relação entre o hábito de fumar cigarros e o desenvolvimento de doenças pulmonares, poderíamos utilizar variáveis diferentes, conforme o objetivo proposto. � Variáveis quantitativas discretas: relacionar o número de cigarros consumidos por dia por cada um dos pacientes com a idade de início do consumo de cigarros e a idade atual. � Variáveis quantitativas contínuas: relacionar o peso dos pacientes ao estado de saúde. � Variáveis qualitativas nominais: relacionar o gênero dos investigados ao hábito de fumar. � Variáveis qualitativas ordinais: registrar o estágio da doença em que os pacientes se encontram (inicial, intermediário e terminal) e relacionar o hábito de fumar ao nível de instrução: fundamental, médio, superior e pós-graduação. É importante destacar que a escolha das variáveis não deve ser aleatória e que a interpretação posterior dos dados obtidos precisa considerar a rele- vância e o número de ocorrências. Essa escolha tem relação direta com o tipo de pesquisa que está sendo proposta. Assim, a pesquisa experimental identifica as relações entre duas variáveis. No método experimental, deve-se provocar variações na ocorrência de uma variável e verificar se ela é a causa de algum efeito em outra. Exemplo: utilizar diferentes medicamentos para uma determinada doença e observar os seus resultados. Na pesquisa correlacional, não há como provocar mudanças nas variáveis, então o pesquisador observa as alterações e seus efeitos, elencando as variáveis que serão observadas. Um exemplo seria analisar os efeitos das alterações naturais de temperatura em um determinado ambiente e nos seres que vivem ali. A pesquisa de levantamento tem variáveis não interferentes, como, por exemplo, uma pesquisa eleitoral, que vai ter como universo a população da cidade, do estado ou do país. A amostra deve ser composta por números 27Variáveis qualitativas e variáveis quantitativas Bioestatistica_LIVRO.indb 27 13/03/2018 09:16:32 representativos de cada segmento da sociedade (gênero, idade, classe social podem ser alguns destes segmentos) e estas variáveis não se alteram. Existem ainda outros tipos de pesquisa, que atendem às necessidades específicas de cada objeto de estudo e que terão suas características próprias, como os estudos de caso e as observações. Entidades ligadas à pesquisa e à ciência no Brasil: � A Sociedade Brasileira para o Progresso da Ciência (SBPC) é uma entidade civil, sem fins lucrativos ou posição político-partidária, voltada para a defesa do avanço científico e tecnológico e do desenvolvimento educacional e cultural do Brasil. Desde a sua fundação, em 1948, a SBPC exerce um papel importante na expansão e no aperfeiçoamento do sistema nacional de ciência e tecnologia, bem como na difusão e na popularização da ciência no país. Sediada em São Paulo, a SBPC está presente nos demais estados brasileiros por meio de Secretarias Regionais. Repre- senta mais de 100 sociedades científicas associadas e mais de 6 mil sócios ativos, entre pesquisadores, docentes, estudantes e cidadãos brasileiros interessados em ciência e tecnologia. � A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), fundação do Ministério da Educação (MEC), desempenha papel fundamental na expansão e consolidação da pós-graduação stricto sensu (mestrado e doutorado) em todos os estados da Federação. Em 2007, passou também a atuar na formação de professores da educação básica, ampliando o alcance de suas ações na formação de pessoal qualificado no Brasil e no exterior. E na prática? Ao decidir por realizar uma pesquisa na área da saúde, é imprescindível que o pesquisador conheça as normas estabelecidas pelo Conselho Nacional da Saúde por intermédio da Resolução Nº 01/88, de 13 de junho de 1988. Essas normas referem-se a questões éticas que envolvem pesquisas com seres hu- manos (BRASIL, 1988), em relação à dignidade, à adequação aos princípios éticos e científicos, à privacidade do indivíduo e aos possíveis riscos que o estudo possa acarretar. Variáveis qualitativas e variáveis quantitativas28 Bioestatistica_LIVRO.indb 28 13/03/2018 09:16:32 De acordo com a Resolução Nº 01/88, de 13 de junho de 1988, as pesquisas podem ser classificadas de acordo com a probabilidade de risco que oferecem: Art. 7º - Considera-se como risco da pesquisa a probabilidade de que o indivíduo sofra algum dano como conseqüência imediata ou tardia do estudo. Para efeito deste regulamento, as pesquisas se classificam nas seguintes categorias: I – Pesquisa sem risco: são estudos que empregam técnicas e métodos retrospectivos de pesquisa e aqueles em que não se realiza nenhuma intervenção ou modificação intencional nas variáveis fisiológicas, psicológicas e sociais dos indivíduos que par- ticipam no estudo, entre os quais se consideram; questionários, entrevistas, revisão de prontuários clínicos e outros, nos quais não se identifiquem nem seja invasivo à intimidade do indivíduo; II – Pesquisa com risco mínimo: estudos prospectivos que empreguem o registro de dados através de procedimentos comuns em exames físicos ou psicológicos de diagnóstico ou tratamento rotineiros, entre os quais se consideram: pesar o indiví- duo, Audiometria, eletrocardiograma, tomografia, coleção de excretas e secreções externas, obtenção de placenta durante o parto, coleção de líquido amniótico ao romper-se a membrana da bolsa amniótica, obtenção de saliva, dentes deciduais e dentes permanentes extraídos por indicação terapêutica, placa bacteriana dental e cálculos removidos por procedimentos profiláticos não invasivos, corte de cabelos e unhas sem causar desfiguramento, extração de sangue, com freqüência máxima de duas vezes por semana e volume máximo 450ml em dois meses, exceto durante a gravidez, exercício moderado em voluntários sãos, provas psicológicas em indivíduos ou grupos nos quais não se manipulará a conduta do indivíduo, pesquisa com me- dicamentos de uso comum, com ampla margem terapêutica e autorizados para sua venda, empregando-se as indicações, doses e vias de administração estabelecidas e que não sejam os medicamentos de pesquisa que se definem no Artigo 50 deste regulamento entre outros; e III – Pesquisa com risco maior que o mínimo: são aquelas em que as probabilidades de afetar o indivíduo são significativas, entre as quais se consideram: estudos radiológicos e com micro-ondas, pesquisas com medicamentos e modalidades que se definem no Artigo 50 do regulamento, pesquisa com novos dispositivos, estudos que incluem procedimentos cirúrgicos, extração de sangue maior que 2% do volume circulante em recém-nascido, punção liquórica, amniocentese e outras técnicas ou procedimentos invasivos e o uso de placebo entre outros. 29Variáveis qualitativas e variáveis quantitativas Bioestatistica_LIVRO.indb 29 13/03/2018 09:16:32 Leia na íntegra a Resolução do Conselho Nacional da Saúde: https://goo.gl/ujwoLj Neste sentido, é relevante que se tenha em mente: qual é o meu objeto de pesquisa? Qual é meu público-alvo? Quais hipóteses desejo comprovar com a minha pesquisa? Que tipo de pesquisa se adequa melhor ao meu objeto de estudo? Respondidas estas questões, o pesquisador pode pensar em quais meto- dologias poderá usar para sua investigação. Com a escolha da metodologia, virão as decisões sobre como trataros dados estatísticos levantados, que tipos de questões deverão ser feitas, se os dados serão quantitativos ou qualitativos e assim, sucessivamente. É possível encontrar na Internet softwares diversos, inclusive gratuitos, e artigos com dicas que auxiliam tanto na análise quanto na interpretação de dados estatísticos: https://goo.gl/jq3x4u https://goo.gl/2fb9z4 Variáveis qualitativas e variáveis quantitativas30 Bioestatistica_LIVRO.indb 30 13/03/2018 09:16:33 BRASIL. Conselho Nacional da Saúde. Resolução n° 01/88, 13 de junho de 1988. Brasília, DF, 1988. Disponível em: <https://www.ufrgs.br/bioetica/r01-88.htm>. Acesso em: 25 jul. 2017. SILVA, L. S. F. et al. Automedicação em acadêmicos de cursos de graduação da área da saúde de uma universidade privada do Sul do estado de Minas Gerais. Odontologia Clínica-Científica, Recife, v. 10, n. 1, p. 57-63, jan./mar. 2011. 1. Identifique a alternativa em que a variável seja classificada como “qualitativa nominal dicotômica”. a) Autopercepção de saúde: excelente, muito boa, boa e regular. b) Inatividade: sim/não. c) Número de hospitalizações no último ano. d) Motivo da última consulta: prevenção, acompanhamento, tratamento. e) Local da última consulta: hospital, consultório, clínica. 2. As variáveis cujas repostas são dadas por números inteiros que mesmo hipoteticamente não poderiam receber vírgula são chamadas de: a) qualitativa nominal dicotômica. b) qualitativa nominal politômica. c) qualitativa ordinal. d) quantitativa discreta. e) quantitativa contínua. 3. As variáveis cujas repostas são dadas por números com vírgulas são classificadas como: a) qualitativa nominal dicotômica. b) qualitativa nominal politômica. c) qualitativa ordinal. d) quantitativa discreta. e) quantitativa contínua. 4. Identifique a variável classificada como “qualitativa ordinal politômica”. a) Altura: 1,68 m. b) Peso: 56,500 kg. c) Idade: 18 anos. d) Filhos: 3. e) Estado geral de saúde: péssimo, ruim, regular, bom excelente. 5. Para que tipo de variável não se pode calcular média? a) Numérica contínua, expressa com duas casas decimais. b) Categórica nominal. c) Numérica contínua, expressa sem nenhuma casa decimal (somente números inteiros). d) Numérica contínua, expressa com 10 casas decimais. e) Numérica contínua, expressa com uma casa decimal. 31Variáveis qualitativas e variáveis quantitativas Bioestatistica_LIVRO.indb 31 13/03/2018 09:16:33 TESTA, M. G. et al. Análise da contribuição do Programa Bolsa Família para o enfrenta- mento da pobreza e a autonomia dos sujeitos beneficiários. Revista de Administração Pública, Rio de Janeiro, v. 47, n. 6, p. 1519-1541, nov./dez. 2013. Disponível em: <http:// www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-76122013000600009>. Acesso em: 22 ago. 2017. Leituras recomendadas BANDEIRA, M. Tipos de pesquisa. [199-?]. Disponível em: <http://www.ufsj.edu.br/ portal-repositorio/File/lapsam/texto%201b%20-%20TIPOS%20DE%20PESQUISA. pdf>. Acesso em: 25 jul. 2017. BRASIL. Fundação CAPES. 2017. Disponível em: <http://www.capes.gov.br/>. Acesso em: 25 jul. 2017. SOCIEDADE BRASILEIRA PARA O PROGRESSO DA CIÊNCIA. 2017. Disponível em: <http:// portal.sbpcnet.org.br/>. Acesso em: 25 jul. 2017. Variáveis qualitativas e variáveis quantitativas32 Bioestatistica_LIVRO.indb 32 13/03/2018 09:16:33 Dados e conjunto de dados Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir o conceito de dados. � Reconhecer um conjunto de dados. � Construir um conjunto de dados. Introdução Neste texto, você vai estudar o conceito e o conjunto de dados, sua obtenção, suas características e sua utilização em bioestatística. O que são dados estatísticos? Os dados são obtidos a partir de levantamentos, como questionários e en- trevistas, que geram dados e servirão para posterior análise e interpretação. Todos os dados gerados e analisados por meio de diferentes instrumentos são chamados de conjunto de dados. Assim, a coleta dos dados é a fase inicial, em que se acumulam documentos e informações referentes ao assunto. Estes documentos e estas informações devem ser agrupados e organizados de forma que facilitem o acesso e a análise. A coleta de dados pode ser realizada de diversas maneiras e a opção deve ser feita a partir do tipo de pesquisa a realizar e dos objetivos que se quer atingir. Por exemplo, em uma pesquisa bibliográfica, buscam-se as informações em fontes como documentos, livros, filmes, documentários, jornais, revistas e outras fontes que forneçam informações confiáveis. Neste caso, deve-se ter o máximo cuidado com consultas em materiais disponíveis na Internet, buscando sempre verificar a confiabilidade do site ou da sua autoria. Bioestatistica_LIVRO.indb 39 13/03/2018 09:16:34 A forma mais comum de coleta de dados é o questionário. Seu sucesso talvez se deva à sua versatilidade. Os questionários são usados para pesquisas eleitorais, de mercado e muitas outras. Em geral, torna-se mais barato e se gasta menos tempo se comparado às entrevistas, além de permitirem o anonimato das pessoas que responderão às questões. Porém, a ausência do entrevistador limita as respostas a pessoas alfabetizadas e impede que estas tirem dúvidas acerca de questões. Essas limitações podem interferir nos resultados. Uma forma usual de coleta de dados é a entrevista. Esta técnica permite uma interação entre o entrevistado e o entrevistador, o que pode ser muito interessante para atender aos objetivos de pesquisas que se dediquem a assuntos que perpassem a vida pessoal, ou os detalhes que podem passar despercebidos em questionários, devido a respostas mais objetivas. Por isto, as entrevistas são muito utilizadas nas áreas sociais, humanas e biomédicas. Permitem, por meio de metodologias específicas, que seus dados sejam quantificados para posterior análise das informações obtidas. Além disto, se o próprio pesquisador ou alguém no seu lugar fizer as entrevistas, haverá maior garantia de devo- lução do material, isto porque, com questionários, é comum que se envie um número e se receba outro, muitas vezes bem inferior. As desvantagens deste tipo de coleta são subjetivas, pois passam pela dificuldade no entendimento de questões, pelo fornecimento de informações falsas, pela intimidação do entrevistado e outras. Os formulários também podem ser aplicados e representam uma combi- nação entre questionários e entrevistas. A sua vantagem é que as perguntas são feitas por um entrevistador (que lê e assinala as respostas), eliminando as desvantagens do questionário. A observação se adéqua a todas as ciências. Podem ser organizadas de maneira que o observador realize seu trabalho a partir de um evento cotidiano ou provocado. Em qualquer caso, o observador não deve interferir na situação observada, pois poderia alterar os resultados. As ciências biomédicas, quími- cas, físicas e outras costumam utilizar intensamente essa prática de coleta de dados, dependendo dos objetivos a que a pesquisa se propõe. Dados e conjunto de dados40 Bioestatistica_LIVRO.indb 40 13/03/2018 09:16:34 Existem outros métodos e técnicas de coletas de dados que podem ser mais aplicados aos levantamentos quantitativos ou qualitativos. O importante é que o pesquisador defina sua coleta a partir dos objetivos propostos para a pesquisa. O artigo “Tipos de dados e formas de apresentação na pesquisa clínico-epidemiológica” traz comentários e su- gestões sobre como facilitar a compreensão e familiarizar o leitor com os tipos de dados epidemiológicos. Confira o artigo no link ou código a seguir. https://goo.gl/ji6iZ9 Como reconhecer um conjunto de dados Os conjuntos de dados representam os levantamentos realizados para deter- minada pesquisa. Cada conjunto de dados resulta da metodologia escolhida para o levantamento. Assim, um conjunto de dados quantitativos pode ser classificado em “discretos” ou “contínuos”. Confiraexemplos a seguir. 41Dados e conjunto de dados Bioestatistica_LIVRO.indb 41 13/03/2018 09:16:34 Dados quantitativos discretos Os dados quantitativos discretos estão exemplificados na Tabela 1. Fonte: Secretaria Municipal de Saúde de XXX. Pessoas com diabetes Apuração dos grupos Nº de grupos 7 / 1 8 / / 2 9 / / / / / 5 10 / / / / / / / / 8 11 / / / 3 12 / 1 Foi contabilizado o número de pessoas com diabetes em 20 grupos de 1000 pessoas cada. Tabela 1. Levantamento dos pacientes com diabetes em um hospital municipal da cidade XXX - 2017. Dados e conjunto de dados42 Bioestatistica_LIVRO.indb 42 13/03/2018 09:16:34 Dados quantitativos contínuos Em uma fábrica de motores elétricos para uso em consultórios dentários, identificou-se o problema de ruído excessivo do motor. Possivelmente, a causa está nas variações no diâmetro do eixo. Foram medidos os diâmetros do eixo de 200 motores. Podemos fazer a apuração, considerando intervalos de medidas, como apresentado na Tabela 2. Fonte: Portal Action ([200-?]). 4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,5 4,9 4,5 4,9 5,1 4,8 4,9 4,8 5 5,3 4,9 5,5 5,2 5,1 4,6 4,9 4,8 5,1 4,6 4,3 4,9 4,7 5,2 4,8 4,4 5,6 5 5 5 4,8 5,2 4,5 5,1 5,1 4,9 4,8 4,8 5 4,8 5,1 5,4 4,2 5,1 4,9 4,6 5,4 4,9 4,3 4,6 4,7 4,7 5,3 4,4 4,7 4,8 5,2 4,5 5,1 4,6 5,8 4,9 5,2 4,8 4,9 4,9 4,4 4,7 4,8 5,1 5,4 5 4,4 5,1 4,9 4,9 5,1 5,2 4,7 4,8 4,6 5,2 5,5 5,2 4,2 4,9 4,9 4,8 4,2 5,2 4,7 4,8 4,6 5,2 Obs.: Os valores estão em milésimos de milímetros. Tabela 2. Diâmetro do eixo de 100 motores. 43Dados e conjunto de dados Bioestatistica_LIVRO.indb 43 13/03/2018 09:16:34 Um possível resumo dos dados está contido na Tabela 3. Fonte: Portal Action ([200-?]). Diâmetro Apuração Nº de motores apurados [4,2;4,4) / / / / / / 6 [4,4;4,6) / / / / / / / / 8 [4,6;4,8) /////////////// 15 [4,8;5,0) //////////...////////// 33 [5,0;5,2) ////////////////// 18 [5,2;5,4) ///////////// 13 [5,4;5,6) / / / / / 5 [5,6;5,8) / / 2 Tabela 3. Diâmetro do eixo de 100 motores (com apuração). Ao estabelecermos intervalos de classes, estamos admitindo que o eixo pode assumir qualquer valor entre o limite inferior (inclusive) e o limite superior (exclusive). Construindo um conjunto de dados A partir das discussões que tivemos até aqui, é possível construir um con- junto de dados sobre dúvidas e reflexões acerca do trabalho desenvolvido em qualquer área da ciência. Vamos propor aqui a construção de um conjunto fictício, demonstrando os passos a seguir: Dados e conjunto de dados44 Bioestatistica_LIVRO.indb 44 13/03/2018 09:16:34 1. Definição do tipo de pesquisa e escolha da metodologia de busca de dados. Pesquisa bibliográfica sobre o desenvolvimento de terapias para o tratamento de determinada doença. A busca de dados se dará por meio de bibliografia especializada e de questionário que será aplicado a pacientes de um determinado hospital universitário. 2. Construção do questionário, entrevista ou outro instrumento escolhido. Instrumento: questionário com questões abertas. a) Gênero. b) Idade. c) Tem doenças autoimunes? Quais? d) Já teve episódios de sangramentos espontâneos, manchas vermelhas, hematomas sem explicação? Se sim, com que frequência? e) Tem diagnóstico de púrpura? Se sim, gostaria de participar de uma pesquisa acerca de uma nova terapia para o tratamento desta doença? Se sim, deixe registrado seu nome completo e seu contato. 3. Tabulação dos dados obtidos a partir do instrumento. Construção de tabela com as informações que poderão ser usadas mais tarde na cons- tituição do grupo. Gênero Idade Doenças prévias Sintomas Púrpura Participar 4. Representação dos dados por meio de gráficos. Pode ser construído um gráfico para cada variável, disponibilizando as informações conforme as diferentes necessidades. 45Dados e conjunto de dados Bioestatistica_LIVRO.indb 45 13/03/2018 09:16:34 Razão e proporção Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir razão. � Explicar o que é proporção. � Resolver problemas envolvendo raciocínio proporcional. Introdução Neste capítulo, você vai estudar a razão e a proporção por meio de definição, de exemplos e de aplicações. O que seria a “razão”? A palavra “estatística” vem do latim “statisticum collegium”, que significa “conselho de estado”. Em 1749, a apalavra statistik, em alemão, passou a ser utilizada se referindo ao estudo e à análise de dados provenientes de levanta- mentos realizados por órgãos públicos. Hoje, qualquer dado, levantamento, compilação ou análise podem ser estudados pela estatística. A estatística pode ser dividida em descritiva (usada como método de re- colhimento e de análise e como representação e cálculo de dados em geral) e em inferência estatística (que permite a criação de modelos para a resolu- ção de problemas percebidos a partir dos dados estudados). Outro ramo da estatística está diretamente relacionado à matemática e seus métodos foram criados juntamente com a teoria das probabilidades, que calcula a frequência de ocorrência de determinado fenômeno. Os cálculos das frequências necessitam de duas grandezas: a razão e a proporção. Definir razão pode se tornar uma tarefa inglória se formos atrás de todos os significados possíveis para este termo. Aqui, tratamos do significado de razão na parte da matemática, que estuda a estatística. Para entendermos o conceito de razão, vamos analisar alguns exemplos: Identificação interna do documento K1LUG4S7FA-CAXFMZ1 1. Considerando um corpo com 6 m de comprimento e outro com 3 m. Ao dividir o comprimento de um pelo outro, temos: 6 3 = 2 Podemos dizer, então, que o corpo maior é duas vezes o tamanho do menor. Ou ainda, que o menor tem a metade do comprimento do maior. A esta divisão damos o nome de razão. A razão 12 pode ser representada como 1:2, o que significa que cada metro do corpo menor corresponde a 2 m do maior. 2. Dos 1.200 pacientes que procuraram a emergência hospitalar na última semana, 240 eram idosos. A razão de idosos que procuraram a emergência esta semana: 240 : 1.200 = 240 (:240) 1.200 (:240)= 1 5 Isto é, a cada cinco pacientes, um era idoso. 3. Em um levantamento em determinado hospital, foi descoberto que a cada 100 pacientes que desenvolvem câncer de intestino, 75 são mulheres. Razão entre o número de mulheres e o número de pacientes: 75 : 100 = 75 (:25)100 (:25) = 3 4 Isto é, a cada quatro pacientes, três são mulheres. O que é “proporção”? Os conceitos de razão e proporção estão relacionados entre si. Assim, a razão é o quociente (divisão) entre dois números e a proporção é a igualdade entre duas razões. As proporções são aplicadas em situações em que as informações devem ser comparadas e são calculadas pelo uso de “regras de três simples”. Razão e proporção50 Identificação interna do documento K1LUG4S7FA-CAXFMZ1 Vejamos um exemplo: Para produzir 600 pães no refeitório do hospital, são utilizados 100 kg de farinha. Dito isto, quantos pães podem ser feitos com 25 kg de farinha? Então vejamos: 600 x 100 25= 100 ∙ x = 600 ∙ 25 100x = 1.500 x = 1.500/100 x = 150 Podemos dizer que é possível produzir 150 pães com 25 kg de farinha. Você pode saber um pouco mais sobre razão e proporção assistindo aos seguintes vídeos: https://goo.gl/foSOOC https://goo.gl/qQEDYw https://goo.gl/6UNvyv Vamos à prática! Vejamos alguns problemas envolvendo razão e proporção e suas soluções: 1. Em um aviário havia 520 galinhas. 60 não foram vacinadas. 92 galinhas vacinadas morreram. Das galinhas vacinadas, qual é a razão entre mortas e vivas? 520 – 60 = 460 galinhas vacinadas 51Razão e proporção Identificação interna do documento K1LUG4S7FA-CAXFMZ1 Das 460 vacinadas, 92 morreram. Então, a razão entre mortas (92) e vivas (460 – 92 = 368) é: 92 : 368 = 92 (:92) / 368 (:92) = 1/4 Considerando as galinhas vacinadas, para cada galinha que morreu, 4 permaneceram vivas. 2. Para cada kit farmacêutico que vende,Francisco recebe R$ 200,00 de comissão. Quanto ele recebeu de comissão no mês que vendeu 15 kits? 2 200 15 x= 2x = 3.000 x = 3.000/2 x = 1.500 No mês que vendeu 15 kits, Francisco recebeu R$ 1.500,00. Como percebemos, os cálculos que envolvem razão e proporção são rela- tivamente simples, mas muito importantes para a posterior interpretação de dados estatísticos. Os links a seguir oferecem opções de problemas envolvendo diferentes conhecimentos matemáticos e estatísticos: https://goo.gl/kQXAzn https://goo.gl/nNsGx8 WALLE, J. A. V. de. Matemática no ensino fundamental: formação de professores e aplicação em sala de aula. Porto Alegre: Artmed, 2009. Referência Razão e proporção52 Identificação interna do documento K1LUG4S7FA-CAXFMZ1 Organização de dados: tabelas e gráficos Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Reconhecer por que os dados devem ser organizados em estatística. � Identificar os principais tipos de tabelas e gráficos. � Selecionar o tipo de gráfico mais adequado para cada tipo de situação. Introdução Neste capítulo, vamos calcular e aplicar métodos estatísticos à análise de dados. A partir daí, construir e analisar tabelas e gráficos utilizando as normas científicas. Por que organizamos os dados em estatística? Quando estamos coletando os dados, essa coleta ocorre de forma aleatória e, durante esse processo, não temos a capacidade de organizá-los e também não temos condições de tomar alguma decisão com base na coleta, sem o tratamento desses dados. Por esse motivo, precisamos começar a analisar os dados coletados e, de alguma forma, resumi-los para podermos visualizar os resultados de forma organizada, iniciando, assim, a análise descritiva dos dados. Primeiramente, resumimos em tabelas de distribuição de frequências e depois podemos fazer gráficos, o que visualmente é melhor para representar os dados (Figura 1). A análise descritiva dos dados ainda dispõe de outras técnicas além dessas, mas, neste capítulo, atentaremos para a análise de tabelas e gráficos. Bioestatistica_LIVRO.indb 99 13/03/2018 09:16:40 Figura 1. Exemplo de diferentes tipos de gráficos. Fonte: Araujo (2011). Título do grá�co Título do grá�co Título do grá�co Título do grá�co Série 1 (linha esquerda) Série 1 Série 2 Série 3 18 16 14 12 10 45 10,00 9,00 8,00 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 40 35 30 25 20 15 10 5 7 6 5 4 3 2 1 0 8 6 4 2 Série 4 Série 1 Série 2 Série 3 Série 4 Série 2 (linha direita) Categoria E, 1 Categoria A, 5 Categoria D, 2 Categoria C, 3 Categoria B, 4 Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov DezJan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Sobre a coleta de dados, é importante estarmos sempre atentos à forma como coleta- mos os dados. Precisamos, antes de qualquer coleta, estabelecer a metodologia para a escolha das unidades amostrais. Muitas vezes, quando coletamos dados, estamos interessados em poder fazer inferência para o restante da população (extrapolar para toda a população). Somente quando temos uma amostra probabilística – ou seja, os elementos da população são escolhidos por sorteio aleatório – que poderemos realizar inferências. Caso a amostra não seja probabilística, poderemos apenas fazer uma análise descritiva dos dados e o resultado dessa análise dirá respeito somente à amostra pesquisada. Organização de dados: tabelas e gráficos100 Bioestatistica_LIVRO.indb 100 13/03/2018 09:16:40 Tipos de tabelas e gráficos Existem tabelas que são para dados qualitativos, que também chamamos de tabelas para dados categóricos (Tabela 1). São tabelas simples em que se anota a frequência que cada uma das opções de resposta aparece na amostra. Sexo F Fr Masculino 63 52,5 Feminino 57 47,5 Total 120 100,0 Tabela 1. Exemplo de tabela com dados qualitativos. Conforme verificado na Tabela 1, a coluna f (frequência simples absoluta) é resultado da contagem da frequência que cada uma das palavras apareceu na amostra. Ou seja, havia 63 pessoas do sexo masculino e 57 do sexo feminino na amostra. Para calcularmos a coluna fr, precisamos ver quanto cada uma das fre- quências tem de proporção no total da amostra. Podemos resolver isso por regra de três. 120 63 100% x 120 ∙ x = 63 ∙ 100 x = 63∙100 120 = 52,5% Podemos representar essa tabela com um gráfico de setores, também conhecido como gráfico de pizza, conforme a Figura 2. 101Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 101 13/03/2018 09:16:40 Figura 2. Gráfico de setores (pizza). 47,5 52,5 Masculino Feminino Observe que em tabelas para dados de uma variável qualitativa nominal, devemos ordenar do mais frequente para o menos frequente. Já quando temos uma variável qualitativa ordinal, precisamos respeitar a ordem em que a variável é apresentada (Tabela 2). Satisfação F fr Muito satisfeito 12 13,3 Satisfeito 14 15,6 Indiferente 21 23,3 Insatisfeito 19 21,1 Muito insatisfeito 24 26,7 Total 90 100 Tabela 2. Exemplo de tabela com dados qualitativos ordinais sobre a satisfação com o atendimento recebido em uma Unidade de Pronto Atendimento (UPA) de Porto Alegre, RS. Para representarmos essa tabela, podemos fazer um gráfico de colunas, conforme a Figura 3. Organização de dados: tabelas e gráficos102 Bioestatistica_LIVRO.indb 102 13/03/2018 09:16:40 Figura 3. Exemplo de gráfico de colunas. 30,0 25,0 20,0 15,0 13,3 Muito satisfeito Muito insatisfeito Satisfeito InsatisfeitoIndiferente 15,6 23,3 26,7 21,1 10,0 5,0 0,0 Podemos também utilizar as tabelas para representar dados quantitativos. Nesse caso, podemos ter tabelas por ponto e tabelas por intervalos (também chamadas de tabelas por classes). Variáveis quantitativas discretas costumam gerar tabelas de distribuição de frequência por ponto (Tabela 3). Número de filhos F fr 0 12 15,0 1 11 13,8 2 23 28,8 3 19 23,8 4 9 11,3 5 6 7,5 Total 80 100 Tabela 3. Exemplo de tabela quantitativa sobre o número de filhos por família. 103Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 103 13/03/2018 09:16:40 Também podemos representar esses dados com um gráfico de colunas, conforme a Figura 4. Figura 4. Gráfico de colunas sobre o número de filhos por família. 30,0 35,0 25,0 20,0 15,0 15,0 13,8 28,8 23,8 11,3 7,5 543210 10,0 5,0 0,0 Já as variáveis quantitativas geram tabelas de distribuição de frequências por intervalos (Tabela 4). Faixa F Fr 15|---25 9 14,5 25|---35 12 19,4 35|---45 22 35,5 45|---55 11 17,7 55|---65 8 12,9 Total 62 100,0 Tabela 4. Exemplo de tabela com variáveis quantitativas sobre a faixa etária. Organização de dados: tabelas e gráficos104 Bioestatistica_LIVRO.indb 104 13/03/2018 09:16:40 Para representarmos essa tabela, precisamos nos dar conta de um fato: entre as faixas, não existe um intervalo numérico, pois chegamos ao limite de um número e na faixa seguinte já iniciamos com ele. Assim, não podemos representar nenhum espaço no eixo do gráfico quando temos um gráfico de colunas. Nesse caso, as colunas estão grudadas umas às outras, e chamamos esse gráfico de histograma (Figura 5). Figura 5. Exemplo de gráfico histograma. 30,0 35,0 25,0 20,0 15,0 14,5 15| ---25 25| ---35 35| ---45 45| ---55 55| ---65 19,4 35,5 17,7 12,9 10,0 5,0 0,0 Quando temos uma variável quantitativa discreta, pode ser que também precisemos fazer intervalos para melhor representar os dados. Caso existam mais de 10 opções de resposta, já podemos montar os intervalos para poder representar melhor esses dados. 105Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 105 13/03/2018 09:16:40 Podemos ainda acrescentar mais colunas a essas tabelas que representam dados quantitativos para utilizarmos para fins de análise(Tabela 5). As co- lunas que necessariamente precisam aparecer em uma tabela de distribuição de frequências, além da primeira coluna que representa as opções de resposta dos dados coletados, são: � f → frequência simples absoluta (resulta da contagem na amostra). � fr → frequência simples relativa (resulta da regra de três vista ante- riormente no capítulo). � F → frequência acumulada absoluta (resulta somando a coluna f). � Fr → frequência acumulada relativa (resulta somando a coluna fr). � x’ → ponto médio do intervalo, no caso da tabela de intervalos. Faixa f fr F Fr 15|---25 9 14,5 9 14,5 (15+25)/2=20 25|---35 12 19,4 9+12=21 33,9 (25+35)/2=30 35|---45 22 35,5 21+22=43 69,4 (35+45)/2=40 45|---55 11 17,7 43+11=54 87,1 (45+55)/2=50 55|---65 8 12,9 54+8=62 100,0 (55+65)/2=60 Total 62 100,0 - - - Tabela 5. Exemplo de tabela de faixa etária com demais colunas. Sobre a nomenclatura para a tabela de distribuição de frequências por intervalos, a barra na vertical (|) indica que o número ao seu lado está contido no intervalo. Quando temos o traço na horizontal, chegamos muito próximo ao número que está ao seu lado, mas não chegamos até ele. Por exemplo: 15|---25 → o número 15 está contido nesse intervalo, mas o número 25 não. 15---|25 → o número 15 não está contido nesse intervalo e o número 25 sim. 15---25 → o número 15 não está contido nesse intervalo e o número 25 também não. 15|---|25 → o número 15 está contido nesse intervalo e o número 25 também. Organização de dados: tabelas e gráficos106 Bioestatistica_LIVRO.indb 106 13/03/2018 09:16:41 Agora, qual gráfico escolher? Além dos gráficos apresentados aqui, temos uma grande quantidade de gráficos. Os mais básicos para a análise descritiva de dados são os de setores e os de barras ou colunas, mas não são somente esses que podemos utilizar. Quando tivermos uma variável qualitativa, tanto nominal quanto ordinal, podemos representar esses dados com um gráfico de setores, de colunas ou barras (Figura 6). Figura 6. Exemplo de dados representados em um gráfico de setores. Dois Irmãos 7% Campo Bom 10% São Leopoldo 15% Porto Alegre 32% Canoas 20% Novo Hamburgo 16% Para os mesmos dados, poderíamos representar em um gráfico de colunas e de barras (Figuras 7 e 8). 107Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 107 13/03/2018 09:16:41 Figura 7. Exemplo de gráfico de colunas utilizando os dados da Figura 6. 30,0 35,0 32,2 20,0 15,6 15,6 10,0 6,7 25,0 20,0 15,0 10,0 5,0 0,0 Dois Irmãos Campo Bom São Leopoldo Porto Alegre Canoas Novo Hamburgo Figura 8. Exemplo de gráfico de barras utilizando os dados da Figura 6. Porto Alegre Canoas Novo Hamburgo São Leopoldo Campo Bom Dois Irmãos 32,2 20,0 15,6 15,6 10,0 6,7 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 Agora, para as variáveis quantitativas para tabelas de distribuição de fre- quências simples ou por intervalos, podemos ter gráficos de colunas para representar as variáveis quantitativas discretas, conforme mostra a Figura 9. Organização de dados: tabelas e gráficos108 Bioestatistica_LIVRO.indb 108 13/03/2018 09:16:41 Para os dados de variáveis quantitativas representadas em tabelas de distri- buição de frequências por intervalos, representamos graficamente com um histograma, conforme mostra a Figura 10. Figura 9. Exemplo de gráfico de colunas com variáveis quantitativas discretas. 35,0 30,0 25,0 20,0 15,0 10,0 5,0 0,0 0 1 2 3 4 15,0 13,8 28,8 23,8 11,3 Figura 10. Exemplo de histograma. 30,0 25,0 20,0 15,0 10,0 5,0 0,0 0|---10 10|---20 20|---30 30|---40 40|---50 25,6 24,4 17,4 22,1 10,5 109Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 109 13/03/2018 09:16:41 Além desses gráficos, podemos citar ainda o gráfico de dispersão, que é utilizado em análise de correlação e regressão, quando temos duas variáveis e verificamos a relação entre elas. Imaginemos duas variáveis, peso e altura. Podemos, com o gráfico de dispersão (Figura 11), verificar a relação entre elas. Cada um dos pontos representa um par de valores (peso no eixo y e altura no eixo x). Figura 11. Exemplo de diagrama de dispersão. Pe so Altura 110 100 90 80 70 60 50 40 150 160 170 180 190 200 O gráfico de linhas é utilizado quando desejamos representar uma variável quantitativa ao longo do tempo (Figura 12). O eixo x sempre será o tempo. Imaginemos acompanhar a evolução do número de nascidos vivos em uma pequena maternidade ao longo dos anos. Organização de dados: tabelas e gráficos110 Bioestatistica_LIVRO.indb 110 13/03/2018 09:16:41 Figura 12. Exemplo de gráfico de linhas. 1260 1250 1240 1230 1220 1210 1200 1190 1180 1170 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Nestes endereços eletrônicos, você pode aprender a fazer gráficos utilizando o Excel: https://goo.gl/4mQZ0m https://goo.gl/Ek3Ydy 111Organização de dados: tabelas e gráficos Bioestatistica_LIVRO.indb 111 13/03/2018 09:16:41 Considere os dados referentes a uma pesquisa com 20 famílias de um bairro pequeno, onde foi perguntado quantas vezes o chefe da família procurou o médico no ano anterior. As respostas da coleta são as seguintes: 1 4 2 0 2 2 2 3 0 4 5 0 1 1 3 3 1 4 2 5 Para representarmos esses dados, o primeiro passo é a montagem da tabela de distribuição de frequências. Precisamos contar quantas vezes cada um dos números apareceu e então fazer os seus percentuais. nº de visitas f fr 0 3 15 1 4 20 2 5 25 3 3 15 4 3 15 5 2 10 total 20 100 A segunda maneira de representarmos esses dados seria por meio de um gráfico. 30,0 25,0 25,0 20,0 20,0 15,0 15,0 15,015,0 10,0 10,0 5,0 0,0 0 1 2 3 4 5 Concluímos então que o número mais frequente de visitas é igual a 2, representando 25%. Ou seja, mais da metade dos chefes de família foi, no máximo, até duas vezes a uma consulta com um médico no último ano. Organização de dados: tabelas e gráficos112 Bioestatistica_LIVRO.indb 112 13/03/2018 09:16:41 Medidas de dispersão e variabilidade Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Definir as medidas de dispersão e variabilidade. � Diferenciar as medidas de amplitude de variação, variância, desvio padrão, coeficiente de variação e amplitude entre quartis. � Analisar as medidas de dispersão e variabilidade. Introdução Neste capítulo, você vai estudar as medidas de dispersão e variabilidade de um conjunto de dados, as quais acompanham as medidas de tendência central, representando e descrevendo o conjunto de dados. Com as me- didas de dispersão e variabilidade, é possível entender a homogeneidade ou a heterogeneidade dos dados. O que são medidas de variabilidade? As medidas de variabilidade são analisadas em conjunto com as medidas de tendência central. Com as medidas de variabilidade, podemos verificar como os dados estão se comportando em torno da média, da moda e da mediana. Mesmo que dois conjuntos de dados tenham a mesma média, eles podem não ter o mesmo comportamento e a mesma variabilidade (Figura 1). Bioestatistica_LIVRO.indb 125 13/03/2018 09:16:44 Figura 1. Exemplo de diferentes distribuições, sendo 3 com médias iguais e variabilidades diferentes. Fonte: Professor Guru (2017). 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 μ = 0. σ2 = 0,2 μ = 0. σ2 = 1,0 μ = 0. σ2 = 5,0 μ = 0. σ2 = 0,5 Não podemos interpretar as medidas de tendência central isoladamente. Para verificar se as medidas de variabilidade representam bem os dados, precisamoscalcular e analisar as medidas de variabilidade. Diferenciação das medidas Amplitude A amplitude necessita do valor máximo e do valor mínimo do conjunto de dados, medindo, assim, a distância entre o maior e o menor valor. A amplitude só leva em consideração os extremos, não chega a comparar os valores da distribuição com a média desses dados. Medidas de dispersão e variabilidade126 Bioestatistica_LIVRO.indb 126 13/03/2018 09:16:44 a = valor máximo – valor mínimo = xmax – xmin Variância Diferente da amplitude, a variância leva em consideração todos os valores da distribuição e compara cada um deles com a média. A variância mede a distância de cada um dos valores em relação à média. Por uma questão matemática, precisamos elevar ao quadrado cada uma dessas distâncias para podermos eliminar o sinal. Depois disso, fazemos a média dos quadrados dessas diferenças. A fórmula para calcularmos a variância de uma amostra com dados em rol é a seguinte: x = ∑ x n Sendo: s2 = variância amostral xi = cada um dos i elementos da amostra x = média da amostra n = número de elementos da amostra Caso a variância esteja sendo calculada para os dados de uma população, representaremos esse valor pela letra grega sigma ao quadrado σ2. Em vez de dividirmos por n-1, dividimos o somatório por N, sendo que n é o número de elementos da amostra e N é o número de elementos da população. Supondo que há 4 notas de avaliações realizadas no semestre (7; 8; 6; 9). Nessa situação, a variância é dada por: Primeiramente, precisamos calcular a média: x = ∑ xi n = = 7 + 8 + 6 + 9 4 30 4 7,5 Então, o cálculo da variância para esses dados fica: S2 = ∑ (xi-x) 2 n-1 = (7 - 7,5)2 + (8-7,5)2 + (6 - 7,5)2 + (9 - 7,5)2 4 - 1 = 5 4 = 1,25 127Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 127 13/03/2018 09:16:44 Podemos também calcular a variância quando temos uma tabela de dis- tribuição de frequências. Nesse caso, precisamos multiplicar cada uma das distâncias pelo número de vezes que se repete. Com base na Tabela 1, em que temos as notas de 30 alunos do curso de Bioestatística. Qual seria a variância para esses dados? Primeiramente, calculamos a média: x = ∑ ƒ· x ∑ ƒ = 246 30 = 8,2 Nota F Fr f.x 7 8 26,7 (7-8,2)2 . 8 = 11,52 8 12 40 (8-8,2)2 . 12 = 0,48 9 6 20 (9-8,2)2 . 6 = 3,84 10 4 13,3 (10-8,2)2 . 4 = 12,96 30 100 28,8 Tabela 1. Notas de 30 alunos do curso de Bioestatística. s2 = ∑ (xi-x) 2 n-1 = 28,8 29 = 0,9931 Desvio padrão Como você pode observar, a variância calcula a soma dos quadrados das distâncias em relação à média. Como elevamos todos os termos ao quadrado, a nossa unidade de medida também fica alterada. Se estivermos calculando a variância da altura de atletas do vôlei, por exemplo, a unidade de medida está em cm e, como o cálculo da variância de todos os elementos está elevada ao quadrado, então a unidade de medida passa a estar em cm2. Não podemos comparar a variância diretamente com a média ou com outras medidas, pois precisamos tirar a raiz da variância, e isso chamamos desvio padrão. Medidas de dispersão e variabilidade128 Bioestatistica_LIVRO.indb 128 13/03/2018 09:16:44 Sendo assim, o desvio padrão é a raiz quadrada da variância. A fórmula para calcularmos o desvio padrão de uma amostra com dados em rol é a seguinte: s =√∑ (xi - x)2n - 1 Onde: s = desvio padrão amostral xi = cada um dos i elementos da amostra x = média da amostra n = número de elementos da amostra Levando em consideração as 4 notas de avaliações realizadas no semestre (7,0; 8,0; 6,0; 9,0), o desvio padrão é dado por: A média para esses dados é igual a x = 7,5. Então, o cálculo do desvio padrão para esses dados fica: s = √ √√∑ (xi-x)2n -1 = (70 - 7,5)2 + (8,0 - 7,5)2 + (6,0 - 7,5)2 + (9,0 - 7,5)24 -1 = 54 = √1,25 = 1,12 A variabilidade da nota dos alunos em torno da média é de 1,12. Assim como a variância, podemos também calcular o desvio padrão quando temos uma tabela de distribuição de frequências. Continuamos a fazer o somatório das distâncias quadradas de acordo com a frequência de cada um dos resultados da variável. Com base nos dados da Tabela 1, em que constam as notas de 30 alunos do curso de Bioestatística. Qual seria o desvio padrão para esses dados? Sabemos que a média previamente calculada é igual a x = 8,2. s =√ √∑ (xi - x)2n-1 = 28,829 = √0,9931 = 0,9965 129Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 129 13/03/2018 09:16:45 No link ou código a seguir, você terá acesso a um vídeo que lhe ensinará a fazer os cálculos das medidas de tendência central e as medidas de variabilidade. https://goo.gl/TR3JcK Coeficiente de variação Quando quisermos comparar a variabilidade de duas ou mais amostras ou po- pulações, podemos fazer essa comparação apenas com o uso do desvio padrão, caso as diferentes amostras sejam da mesma variável e tenham médias iguais. Se estivermos comparando variáveis diferentes de um mesmo indivíduo, como, por exemplo, peso e altura de gestantes em uma amostra de 30 pessoas, e quisermos verificar se a menor variabilidade é para o peso ou para a altura, não podemos considerar apenas o desvio padrão, pois ele seguirá a escala de medida e a grandeza de cada uma das variáveis estudadas. Para essa verifi- cação, precisamos fazer uso do coeficiente de variação, que divide o desvio padrão pela média e multiplica por 100 para transformarmos em percentual. Além de utilizarmos o coeficiente de variação quando temos variáveis com unidade de medidas diferentes, também faremos uso dessa medida de variabilidade quando tivermos médias diferentes, mesmo que sendo a mesma variável, como verificar o aumento de peso de crianças em dois estados di- ferentes, cujas médias provavelmente não serão iguais. Então, para verificar a variabilidade dessas duas realidades, precisamos calcular o coeficiente de variação. CV = sx ∙ 100 Onde: CV = coeficiente de variação s = desvio padrão amostral x = média amostral Medidas de dispersão e variabilidade130 Bioestatistica_LIVRO.indb 130 13/03/2018 09:16:45 De acordo com as 4 notas das avaliações realizadas no semestre (7; 8; 6; 9), já calculamos a média x = 7,5 e s = 1,12. O cálculo do coeficiente de variação seria: CV = sx · 100 = 1,12 7,5 · 100 = 14,93% Também podemos calcular o coeficiente de variação para os dados da tabela 1, que já calculamos previamente a média x = 8,2 e s = 0,9965. CV = sx · 100 = 0,9965 8,2 · 100 = 12,15% Utilizando o coeficiente de variação, sempre que quisermos descobrir qual grupo de dados é mais homogêneo, ou seja, o que possui a menor variabilidade em torno da média, devemos optar pelo grupo de dados que tiver o menor percentual do coeficiente de variação. Caso o coeficiente de variação seja muito elevado, a média não será a melhor medida para representarmos os dados devido à alta variabilidade em torno dela. Amplitude interquartílica Essa medida é útil quando temos uma distribuição assimétrica. Os quartis são valores que dividem uma amostra de dados ordenados em quatro partes. As quatro partes são iguais a 25%. No primeiro quartil, denominado de Q1, temos 25% dos valores menores ou iguais a ele. No segundo quartil, deno- minado mediana, temos 50% dos valores menores ou iguais a ele. No terceiro quartil, denominado de Q3, temos 75% dos valores menores ou iguais a ele. A amplitude ou desvio interquartílico é dada pela diferença entre o primeiro e o terceiro quartil (Q1 – Q3). 131Medidas de dispersão e variabilidade Bioestatistica_LIVRO.indb 131 13/03/2018 09:16:45 Um pesquisador está interessado em descobrir as diferenças de comportamento quanto ao peso de bebês recém-nascidos nos dois extremos do país. Ele decide então coletar uma amostra do peso de 6 crianças de uma maternidade no interior da Bahia e outra amostra de 6 crianças nascidas em uma maternidade em Blumenau/SC. Os dados são os seguintes: Maternidade Bahia 2,5 2,4 2,6 2,8 2,6 2,4 Maternidade Santa Catarina 3,53,6 3,8 3,3 3,5 3,6 Primeiramente, calculamos a média para os dois conjuntos de dados. Maternidade Bahia: x = ∑ x n = 2,5 + 2,4 + 2,6 + 2,8 + 2,6 + 2,4 7 = 2,55 Maternidade Santa Catarina: x = ∑ x n = 3,5 + 3,6 + 3,8 + 3,3 + 3,5 + 3,6 7 = 3,55 Precisamos também calcular o desvio padrão. Maternidade Bahia: s = √ ∑(xi - x )2n -1 √= (2,5 - 2,55)2 + (2,4 - 2,55)2 + (2,6 - 2,55)2 + (2,8 - 2,55)2 + (2,6 - 2,55)2 + (2,4 - 2,55)25 √= 0,1155 = 0,15 Maternidade Santa Catarina: s = √ ∑(xi - x)2n -1 √= (3,5 - 3,55)2 + (3,6 - 3,55)2 + (3,8 - 3,55)2 + (3,3 - 3,55)2 + (3,5 - 3,55)2 + (3,6 - 3,55)25 √= 0,1355 = 0,16 Por fim, calculamos o coeficiente de variação, uma vez que as médias de peso das duas maternidades são diferentes. Medidas de dispersão e variabilidade132 Bioestatistica_LIVRO.indb 132 13/03/2018 09:16:46 Cálculo de probabilidade Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: � Diferenciar eventos mutuamente excludentes de eventos comple- mentares. � Distinguir eventos independentes de eventos dependentes. � Realizar cálculos simples de probabilidade. Introdução Neste texto, você vai estudar um dos conceitos mais importantes da estatística: a probabilidade. A partir dele, você terá informações adicionais da situação que está analisando e, com isso, mais êxito na tomada de decisões. Probabilidade A teoria das probabilidades é um ramo da matemática que cria, elabora e pesquisa modelos para estudar experimentos ou fenômenos aleatórios. Há certos fenômenos (ou experimentos) que, embora sejam repetidos muitas vezes e sob condições idênticas, não apresentam os mesmos resultados. Por exemplo, no lançamento de uma moeda perfeita, o resultado é imprevisível, não se pode determiná-lo antes de ser realizado e não podemos prever, mas podemos saber quais são os possíveis resultados. Aos fenômenos (ou expe- rimentos) desse tipo damos o nome de fenômenos aleatórios (ou casuais). Pelo fato de não sabermos o resultado exato de um fenômeno aleatório é que buscamos os resultados prováveis, as chances e as probabilidades de um determinado resultado ocorrer. Identificação interna do documento PYDB0XJZAK-D1SFU31 Segundo Mann, a probabilidade corresponde à medida numérica da possibilidade de que um determinado evento venha a ocorrer. Espaço amostral Em um experimento (ou fenômeno) aleatório, o conjunto formado por todos os resultados possíveis é chamado espaço amostral, que vamos indicar por U ou Ω. Veja os seguintes exemplos. � Lançar uma moeda e observar a face voltada para cima: U = {cara, coroa}. � Lançar um dado e observar a face voltada para cima: U = {1, 2, 3, 4, 5, 6}. Evento Chama-se evento todo subconjunto de um espaço amostral, ou seja, os resul- tados que poderão ocorrer em um determinado fenômeno. Resultados esses que queremos que aconteçam ou não. No lançamento de um dado, por exemplo, em relação à face voltada para cima, podemos ter os seguintes eventos. � O número é par: {2, 4, 6}. � O número é menor que 5: U = {1, 2, 3, 4}. � O número é 8: {}. Cálculo de probabilidade136 Identificação interna do documento PYDB0XJZAK-D1SFU31 Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso e se observa o número indicado. Descrever de forma explícita os seguintes conjuntos e dar o número de elementos de cada um: a) o espaço amostral U. b) o evento A: o número da bola é ímpar. c) o evento B: o número da bola é múltiplo de 3. Solução: a) O conjunto de todos os resultados possíveis é representado pelo seguinte espaço amostral: U = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. O número de elementos desse conjunto é n(U) = 10. b) Se o número da bola é ímpar, temos o evento: A = {1, 3, 5, 7, 9}. O número de elementos desse conjunto é n(A) = 5. Se o número da bola é múltiplo de 3, temos o evento: B = {3, 6, 9}. O número de elementos desse conjunto é n(B) = 3. Eventos mutuamente excludentes e eventos complementares Eventos que não podem ocorrer conjuntamente são conhecidos com eventos mutuamente excludentes (também chamados de eventos mutuamente exclu- sivos). Caso dois ou mais eventos sejam mutuamente excludentes, no máximo um deles irá ocorrer a cada vez que repetirmos o experimento. Por conseguinte, a ocorrência de um evento exclui a ocorrência do outro, ou de outros eventos. Considerando, por exemplo, dois lançamentos de uma moeda, esse expe- rimento tem quatro resultados possíveis: cara/cara, cara/coroa, coroa/cara, coroa/coroa. Esses resultados são mutuamente excludentes, uma vez que um, e somente um, deles irá ocorrer ao lançarmos a moeda duas vezes. Chama-se evento complementar de um evento A e é representado por Ā o conjunto formado por todos os elementos do espaço amostral U que não pertencem ao evento A. No lançamento de um dado, temos o seu espaço amostral: U = {1, 2, 3, 4, 5, 6}. Considere os eventos a seguir. � O evento A: o número obtido é menor que 3. � O evento Ā: o número obtido é maior ou igual a 3. 137Cálculo de probabilidade Identificação interna do documento PYDB0XJZAK-D1SFU31 Observe que os eventos A = {1, 2} e Ā = {3, 4, 5, 6}. Estes são complemen- tares, pois, A ∩ Ā = { } e A Ā = U, a interseção (o que há de comum entre os conjuntos) entre os dois conjuntos resulta em um resultado vazio, visto que os dois conjuntos não possuem resultados em comum, e a união (unir todos os elementos dos conjuntos envolvidos) entre os dois conjuntos resulta no conjunto espaço amostral U. Eventos independentes e eventos dependentes Dois eventos são independentes quando a ocorrência ou a não ocorrência de um evento não tem efeito algum na probabilidade de ocorrência do outro evento. Dois eventos são dependentes quando a ocorrência ou a não ocorrência de um evento afeta a probabilidade de ocorrência do outro evento. Os eventos independentes e dependentes são chamados de com e sem reposição, respectivamente. Com reposição significa o retorno do evento sorteado ao seu conjunto de origem. É isso que mantém a probabilidade de sorteio constante, portanto, não se altera a probabilidade de sorteio do evento seguinte. Sem reposição significa o não retorno do evento sorteado ou do seu con- junto de origem, alterando a probabilidade de sorteio do evento seguinte. Exemplo de evento independente: Dois lançamentos sucessivos de uma moeda não viciada são considerados como eventos independentes, uma vez que o resultado do primeiro lançamento não tem efeito algum nas probabilidades de ocorrer uma cara ou uma coroa no segundo lançamento. Exemplo de evento dependente: A retirada de duas bolas, sem reposição, de uma urna contendo 20 bolas numeradas de 1 a 20 são dependentes, pois as probabilidades do resultado da retirada da segunda bola estão diretamente ligadas a retirada da primeira bola. Especificamente, se na primeira bola retirada saiu a de número 10, e se não houver reposição, com certeza não existirá a probabilidade de que, na segunda retirada, a bola 10 apareça, pois esta não se encontra mais na urna, ou seja, a primeira retirada afetou completamente as probabilidades de retirada da segunda bola. Cálculo de probabilidade138 Identificação interna do documento PYDB0XJZAK-D1SFU31 Todo experimento que tiver dois ou mais eventos e aparecer no enunciado as palavras com reposição ou sem reposição, automaticamente já saberemos se são indepen- dentes (com reposição) ou dependentes (sem reposição). Cálculo de probabilidade Como se calcular questões e/ou experimentos de probabilidade? Considere uma área muito visitada no Museu de Animais. Em um recipiente, existem 12 aranhas, das quais 8 são fêmeas. A probabilidade de se retirar uma aranha macho para um experimento é de? No lançamento de um dado perfeito, qual é a probabilidade de sair um número maior do que 4? Em uma urna existem 20 bolas numeradas de 1 a 20. Sorteando-se uma bola, ao acaso, qual é a probabilidade, em porcentagem, de que o número da bola sorteada seja divisível por 3? Considere
Compartilhar