Baixe o app para aproveitar ainda mais
Prévia do material em texto
Biologia Bioestatística Lilian Giotto Zaros Henrique Rocha de Medeiros Bioestatística Natal – RN, 2011 Biologia Bioestatística Lilian Giotto Zaros Henrique Rocha de Medeiros 2ª Edição COORDENAÇÃO DE PRODUÇÃO DE MATERIAIS DIDÁTICOS Marcos Aurélio Felipe GESTÃO DE PRODUÇÃO DE MATERIAIS Luciana Melo de Lacerda Rosilene Alves de Paiva PROJETO GRÁFICO Ivana Lima REVISÃO DE MATERIAIS Revisão de Estrutura e Linguagem Eugenio Tavares Borges Janio Gustavo Barbosa Jeremias Alves de Araújo José Correia Torres Neto Kaline Sampaio de Araújo Luciane Almeida Mascarenhas de Andrade Thalyta Mabel Nobre Barbosa Revisão de Língua Portuguesa Camila Maria Gomes Cristinara Ferreira dos Santos Emanuelle Pereira de Lima Diniz Janaina Tomaz Capistrano Priscila Xavier de Macedo Rhena Raize Peixoto de Lima Revisão das Normas da ABNT Verônica Pinheiro da Silva EDITORAÇÃO DE MATERIAIS Criação e edição de imagens Adauto Harley Anderson Gomes do Nascimento Carolina Costa de Oliveira Dickson de Oliveira Tavares Leonardo dos Santos Feitoza Roberto Luiz Batista de Lima Rommel Figueiredo Diagramação Ana Paula Resende Carolina Aires Mayer Davi Jose di Giacomo Koshiyama Elizabeth da Silva Ferreira Ivana Lima José Antonio Bezerra Junior Rafael Marques Garcia Módulo matemático Joacy Guilherme de A. F. Filho IMAGENS UTILIZADAS Acervo da UFRN www.depositphotos.com www.morguefi le.com www.sxc.hu Encyclopædia Britannica, Inc. FICHA TÉCNICA Catalogação da publicação na fonte. Bibliotecária Verônica Pinheiro da Silva. Governo Federal Presidenta da República Dilma Vana Rousseff Vice-Presidente da República Michel Miguel Elias Temer Lulia Ministro da Educação Fernando Haddad Universidade Federal do Rio Grande do Norte – UFRN Reitora Ângela Maria Paiva Cruz Vice-Reitora Maria de Fátima Freire Melo Ximenes Secretaria de Educação a Distância (SEDIS) Secretária de Educação a Distância Maria Carmem Freire Diógenes Rêgo Secretária Adjunta de Educação a Distância Eugênia Maria Dantas © Copyright 2005. Todos os direitos reservados a Editora da Universidade Federal do Rio Grande do Norte – EDUFRN. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa do Ministério da Educacão – MEC Zaros, Lilian Giotto. Bioestatística / Lilian Giotto Zaros e Henrique Rocha de Medeiros. – Natal: EDUFRN, 2011. 214 p.: il. ISBN 978-85-7273-833-0 Conteúdo: Aula 1 – O que é bioestatística. Aula 2 – Como transformar dados em informações. Aula 3 - Descrevendo Sistemas. Aula 4 – Elaborando hipóteses. Aula 5 – Testando hipóteses. Aula 6 – Análise de variância. Aula 7 – Correlacionando informações. Aula 8 – Análise de regressão. Aula 9 – Entendendo os números índices e suas aplicações. Aula 10 – Probabilidade: conceitos e aplicações. Disciplina ofertada ao curso de Biologia a distância da UFRN. 1. Bioestatística. 2. Hipóteses. 3. Probabilidade. I. Medeiros, Henrique Rocha de. II. Título. CDU 311 Z38b Sumário Apresentação Institucional 5 Aula 1 O que é Bioestatística 7 Aula 2 Como transformar dados em informações 25 Aula 3 Descrevendo Sistemas 43 Aula 4 Elaborando hipóteses 65 Aula 5 Testando hipóteses 83 Aula 6 Análise de variância 101 Aula 7 Correlacionando informações 129 Aula 8 Análise de regressão 147 Aula 9 Entendendo os números índices e suas aplicações 173 Aula 10 Probabilidade:conceitos e aplicações 193 5 Apresentação Institucional A Secretaria de Educação a Distância – SEDIS da Universidade Federal do Rio Grande do Norte – UFRN, desde 2005, vem atuando como fomentadora, no âmbito local, das Políticas Nacionais de Educação a Distância em parceira com a Secretaria de Educação a Distância – SEED, o Ministério da Educação – MEC e a Universidade Aberta do Brasil – UAB/CAPES. Duas linhas de atuação têm caracterizado o esforço em EaD desta instituição: a primeira está voltada para a Formação Continuada de Professores do Ensino Básico, sendo implementados cursos de licenciatura e pós-graduação lato e stricto sensu; a segunda volta-se para a Formação de Gestores Públicos, através da oferta de bacharelados e especializações em Administração Pública e Administração Pública Municipal. Para dar suporte à oferta dos cursos de EaD, a Sedis tem disponibilizado um conjunto de meios didáticos e pedagógicos, dentre os quais se destacam os materiais impressos que são elaborados por disciplinas, utilizando linguagem e projeto gráfi co para atender às necessidades de um aluno que aprende a distância. O conteúdo é elaborado por profi ssionais qualifi cados e que têm experiência relevante na área, com o apoio de uma equipe multidisciplinar. O material impresso é a referência primária para o aluno, sendo indicadas outras mídias, como videoaulas, livros, textos, fi lmes, videoconferências, materiais digitais e interativos e webconferências, que possibilitam ampliar os conteúdos e a interação entre os sujeitos do processo de aprendizagem. Assim, a UFRN através da SEDIS se integra o grupo de instituições que assumiram o desafi o de contribuir com a formação desse “capital” humano e incorporou a EaD como moda- lidade capaz de superar as barreiras espaciais e políticas que tornaram cada vez mais seleto o acesso à graduação e à pós-graduação no Brasil. No Rio Grande do Norte, a UFRN está presente em polos presenciais de apoio localizados nas mais diferentes regiões, ofertando cursos de graduação, aperfeiçoamento, especialização e mestrado, interiorizando e tornando o Ensino Superior uma realidade que contribui para diminuir as diferenças regionais e o conhecimento uma possibilidade concreta para o desenvolvimento local. Nesse sentido, este material que você recebe é resultado de um investimento intelectual e econômico assumido por diversas instituições que se comprometeram com a Educação e com a reversão da seletividade do espaço quanto ao acesso e ao consumo do saber E REFLE- TE O COMPROMISSO DA SEDIS/UFRN COM A EDUCAÇÃO A DISTÂNCIA como modalidade estratégica para a melhoria dos indicadores educacionais no RN e no Brasil. SECRETARIA DE EDUCAÇÃO A DISTÂNCIA SEDIS/UFRN O que é Bioestatística 1 Aula Aula 1 Bioestatística 9 Apresentação Nesta primeira aula, apresentaremos um breve histórico da Estatística, suas subdivisões e como podemos utilizá-la no ramo das Ciências Biológicas. Num segundo momento, abordaremos o conceito de Bioestatística e suas aplicações, partindo para a retomada de alguns conceitos vistos na disciplina de Matemática e Realidade. Essa retomada é essencial não somente para a compreensão das aulas seguintes, mas também da disciplina como um todo. Para compreender os assuntos que serão abordados nesta aula, é necessário que você leia atentamente os conceitos, que sempre serão acompanhados de exemplos aplicados às Ciências Biológicas. Ao fi nal de cada tópico principal haverá uma série de exercícios propostos para você resolver, além de exercícios já resolvidos. No fi nal da aula, haverá uma autoavaliação para que você avalie a sua aprendizagem. Tenha sempre seu caderno em mãos para que você anote suas dúvidas e as encaminhe para nós o mais rápido possível. Objetivos Conhecer a história da Estatística e identifi car as situações onde ela pode ser aplicada. Conhecer e distinguir as diversas fases do método estatístico. Defi nir o que é Bioestatística. Compreender os conceitos fundamentais para o entendimento e aplicação da Bioestatística. Distinguir as técnicas de amostragem para a escolha de elementos que irão compor uma amostra. 1 2 3 4 5 Aula 1 Bioestatística 10 O que é Estatística? Para alguns, responder a essa pergunta é muito fácil, mas para outros, que nunca ouviram falar em estatística, pode parecer algo impossível de entendimento. Mas, mesmo sem saber, você já deve ter utilizado a estatística no seu cotidiano. Vamos conferir? Com a chegada da Copa do Mundo de 2010, muitas lojas irão fazer promoções de televisores. Você, consumidor, quer comprar uma TV e para saber qual delas tem o melhor preço,inicia sua pesquisa de loja em loja, anotando os valores. Depois, em casa, compara os preços, seleciona aquele mais em conta e se dirige até a loja para efetuar a sua compra. Nessa situação, a estatística esteve presente quando você coletou os dados, extraiu as informações a partir da sua pesquisa e tomou as decisões baseadas na sua coleta de dados. Mas, além do cotidiano, a Estatística pode estar presente em qualquer disciplina de qualquer curso, inclusive do curso de Ciências Biológicas. Mas você deve estar se perguntando: “Em quais disciplinas e como?” Bem, se o professor da disciplina de Biodiversidade pedir para que você faça um levantamento de quais as espécies animais habitantes da caatinga estão ameaçadas de extinção, você estará utilizando um dos princípios da Estatística, ou melhor, do método estatístico (que veremos a seguir), que é o da coleta de dados. Mas se ele for mais além, e pedir para que você ordene quais os animais mais ameaçados de extinção, aí você terá que fazer um levantamento mais aprofundado, checar outras fontes, organizar e interpretar os dados e apresentar os resultados ao professor. Nesse momento você ainda estará utilizando a estatística. Percebeu como a Estatística toma parte do nosso cotidiano e das disciplinas do Curso de Ciências Biológicas, por exemplo? A Estatística tem se mostrado um instrumento extremamente útil na organização e interpretação dos dados, auxiliando na tomada de decisões, além de proporcionar uma avaliação adequada de uma determinada situação, seja ela de origem biológica ou não. Aula 1 Bioestatística 11 O papel da Estatística quando estabelecida como ciência Pois bem, inicialmente a Estatística se preocupava em enumerar coisas e pessoas para a avaliação das riquezas e cadastramento das propriedades de uma determinada cidade. Isso aconteceu há milhares de anos atrás e atualmente acontece no Brasil a cada 10 anos. Você já deve ter recebido em sua casa um funcionário do Instituto Brasileiro de Geografi a e Estatística (IBGE), munido de um questionário para avaliar sua condição de vida. Pois é esse questionário, chamado de CENSO, que nos permite adquirir informações sobre cada família brasileira, e já era realizado em civilizações muito antigas como a do Império Romano, da China e do antigo Egito em 1000 a.C. Hoje, com o passar dos anos, podemos constatar que o papel da Estatística vai além de organizar e descrever fatos e/ou gerar informações analisando um conjunto de dados coletados, mas também auxiliar no: 1) Planejamento, auxiliando na escolha das situações experimentais e na determinação da quantidade de indivíduos a serem examinados. 2) Na análise dos dados, indicando técnicas para resumir e apresentar as informações, bem como para comparar as situações experimentais ou não. 3) Na elaboração das conclusões, utilizando os vários métodos estatísticos que permitem generalizar a partir dos resultados obtidos. Fonte: <http://matematiques.sites.uol.com.br/pereirafreitas/1.1.2metodoestati stico.htm>. Acesso em: 25 fev. 2010. Estatística é a ciência que tem como objetivo orientar a coleta, o resumo, a apresentação, a análise e a interpretação dos dados coletados. E para isso, ela se apóia na utilização do método estatístico. O método estatístico é um processo para se obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza. Aula 1 Bioestatística 12 O método estatístico apresenta as seguintes fases: Defi nição do problema: Podemos ilustrar essa primeira fase do método estatístico com a pergunta: O que pesquisar? Nessa etapa você deve conhecer o problema a ser pesquisado, fazer as perguntas às quais quer que sejam respondidas com a sua pesquisa. Por exemplo: A altura média dos alunos de cada semestre do Curso de Ciências Biológicas. Planejamento da pesquisa: Essa segunda etapa pode ser traduzida com a pergunta: Como pesquisar? Assim, é essencial que você tenha clareza de como a pesquisa será feita. Deve-se também defi nir se você utilizará a população ou apenas uma amostra dessa população, que estudaremos logo a seguir. Utilizando o nosso exemplo acima, devemos planejar se vamos estudar a altura de todos os alunos do Curso de Ciências Biológicas ou somente dos alunos do primeiro semestre, ou somente a altura dos homens. Coleta dos dados: Podemos perguntar: O que coletar? Nessa etapa você deve obter as informações de acordo com o que foi planejado na etapa anterior. Se o objetivo é saber a altura dos alunos de cada semestre do Curso de Ciências Biológicas, você deve iniciar as medições de cada um dos alunos, anotando os valores obtidos, como exemplifi cados na tabela 1. Tabela 1 – Altura, em metros, dos alunos do 1º, 2º e 3º semestres do Curso de Ciências Biológicas Altura dos alunos do semestre 1 (m) Altura dos alunos do semestre 2 (m) Altura dos alunos do semestre 3 (m) 1,54 1,67 1,65 1,74 1,87 1,54 1,82 1,88 1,64 1,9 1,89 1,56 1,54 1,78 1,75 3,543,54 1,89 1,56 1,75 1,9 1,6 1,87 1,76 1,64 1,96 1,94 1,65 1,72 1,95 1,6 Alunos do semestre 1 2 1,9 1,8 1,7 1,6 1,5 1,4 Al tu ra m éd ia (m ) Alunos do semestre 2 Alunos do semestre 3 Aula 1 Bioestatística 13 Crítica dos dados: Essa fase é essencial para saber como anda a sua pesquisa. Pode-se lançar a seguinte pergunta: Os dados estão coerentes? Você deve observar criticamente os dados coletados, para que, se detectado algum erro, este não seja repetido nas coletas futuras. Se você está medindo as alturas dos alunos de cada semestre do Curso de Ciências Biológicas e encontra uma medida de 3,54m, conforme apresentado em destaque na Tabela 1, pode ter certeza que nessa hora, você cometeu algum erro. Apresentação: Nessa etapa você deverá apresentar os dados coletados após eles serem organizados. Uma vez os dados coletados, eles devem ser apresentados, seja através de tabelas ou gráfi cos, conforme apresentado no Gráfi co 1, ou por meio de um texto escrito. Gráfi co 1 – Altura média (m) dos alunos do primeiro, segundo e terceiro semestre do Curso de Ciências Biológicas Análise e interpretação dos dados: Essa é a etapa fi nal do método estatístico, mas nem por isso, a menos importante. Nessa fase você deve descrever e analisar os dados pesquisados, e chegar a uma conclusão, ou seja, responder a sua pergunta inicial. No caso do nosso exemplo, constatar qual a altura média dos alunos de cada semestre do Curso de Ciências Biológicas. As fases do método estatístico, que incluem desde a defi nição do problema até a apresentação dos dados, denominam-se Estatística Descritiva, e a análise e interpretação dos dados constitui a Estatística Inferencial, que ajuda a concluir sobre um conjunto maior de dados (populações) quando apenas parte desse conjunto (as amostras) foi estudada. Atividade 1 Aula 1 Bioestatística 14 Com base no que você viu até agora sobre o método estatístico, faça uma pesquisa na sua casa ou comunidade sobre algo que você gostaria de saber (número de pessoas da comunidade, número de pessoas com olhos claros, tipo de árvore da sua região, dentre outros) e, à medida que você for organizando sua pesquisa, explicite quais as fases do método estatístico que você utilizou. 1 2 Atividade 2 Aula 1 Bioestatística 15 Mas você deve estar se perguntando: “E a Bioestatística?” Agora que você já sabe o que é Estatística, você se arriscaria a elaborar uma defi nição para Bioestatística? É simples! Considera-se Bioestatística a aplicação dos métodos estatísticos para solucionar problemas biológicos. Pode parecer difícil para um aluno que não tem gosto pela Matemática aprender Bioestatística. Mas ele deve adquirir algum conhecimento sobre essa disciplina, pois só assim poderá ter um ponto de vista objetivo sobre as técnicas do método científi co empregado nas suas pesquisas e saberá avaliar o grau de importância da informação fornecida por essas técnicas. Aprender Bioestatística também pode proporcionar quevocê se familiarize com alguns conceitos mais utilizados na área. Alguns termos do vocabulário comum têm signifi cado técnico e específi co quando usados em Bioestatística. E é importante conhecê-los. Enfi m, sem despender muito tempo com cálculos e demonstrações, pretendemos que você adquira os conhecimentos sufi cientes para tornar-se um usuário competente das técnicas estatísticas mais comuns que podem ser aplicadas nas Ciências Biológicas. Com base no que foi apresentado até aqui, escreva o que você entendeu sobre o que é Bioestatística e qual a sua importância. Procure, no seu cotidiano, duas utilizações da Estatística. Aula 1 Bioestatística 16 Retomando alguns conceitos fundamentais Alguns conceitos fundamentais para o entendimento e aplicação da Bioestatística você já viu na disciplina de Matemática e Realidade (Aula 2 – A Estatística: do senso comum ao conhecimento científi co. Vamos retomá-los? Unidade experimental ou Unidade de observação É a menor unidade a fornecer uma informação. Podem ser pessoas, animais, plantas, objetos. São aqueles indivíduos submetidos a uma situação de experimento controlado, como por exemplo, ratos de laboratório colocados em um labirinto para estudar o comportamento antes e após a administração de uma droga. População É o conjunto de “todos” os elementos (pessoas, animais, plantas, objetos) que apresentam, pelo menos, uma característica comum e que pode ser observada, como por exemplo, a população de árvores de mandacaru do sertão do Rio Grande do Norte. Amostra É qualquer parte retirada de uma população estatística, ou seja, é qualquer subconjunto de uma população. Árvores de mandacaru do município de Currais Novos (RN). Dados São as informações numéricas ou não obtidas de uma unidade experimental ou de observação. Quando se afi rma que as árvores de mandacaru têm 21 espinhos, os dados são “21 espinhos”. Variável É alguma característica que pode ser observada (contada ou medida) em uma população ou em uma amostra. O número de espinhos do mandacaru, a idade de uma pessoa e seus 1 Atividade 3 Aula 1 Bioestatística 17 hábitos quanto ao fumo, a estatura de um jogador de basquete, a cor da pelagem dos animais, o tipo de folha de uma planta constituem exemplos de variáveis. Entretanto, as variáveis podem ser classifi cadas em quantitativas e qualitativas: 1) Variáveis quantitativas: são aquelas cujos dados são valores numéricos, como por exemplo, a estatura das pessoas, o número de sementes de uma vagem, o nível de colesterol no sangue, o número de espinhos do mandacaru. As variáveis quantitativas podem ainda ser: a) Variáveis quantitativas discretas: são aquelas em que os dados podem apresentar somente determinados valores, no geral, números inteiros, como por exemplo, o número de fi lhos de um casal, o número de patas de um cavalo e o número de pétalas das fl ores. É impossível dizer que um casal tem 2,3 fi lhos. b) Variáveis quantitativas contínuas: são aquelas em que os dados podem apresentar qualquer valor dentro de um intervalo de variação possível, como por exemplo, o peso de uma pessoa (56,3 kg) e a altura de uma árvore (1,5 m). 2) Variáveis qualitativas: são aquelas que fornecem dados de natureza não numérica, ou seja, fornecem qualidade à variável, como por exemplo, a cor da semente das ervilhas, a raça ou o sexo do animal. As variáveis qualitativas podem ser: a) Variáveis qualitativas nominais: os níveis de respostas não admitem nenhuma ordem, diferenciando uma categoria da outra, apenas pelo nome, por exemplo, o sexo dos animais, ou é fêmea ou macho. b) Variáveis qualitativas ordinais: os níveis de respostas admitem ordem. Não é só possível identifi car diferentes categorias, mas também reconhecer graus de intensidade entre elas, possibilitando a sua ordenação. A cor da fl or do mandacaru, que pode ser de branca à vermelha; o nível de intensidade de dor, que pode ser fraca, média, forte e muito forte. Explique com suas palavras o que você entendeu por: a) População: 2 Aula 1 Bioestatística 18 b) Amostra: c) Variável: Classifi que as variáveis abaixo: a) Cor do cabelo: b) Número de patas de um coelho: c) Número de células brancas no sangue: d) Tipo sanguíneo A, B, AB e O: e) Tipo de folha de uma árvore: f) Número de colônias de E. coli existente na água mineral: Aula 1 Bioestatística 19 Utilizando as amostras de uma população Os experimentos são realizados com amostras de uma população e não com toda a população e podemos apresentar duas razões para isso: A primeira, porque as populações fi nitas só podem ser estudadas através de amostras, como por exemplo, um conjunto de alunos de uma escola em determinando ano, e a segunda, porque essas populações são muito grandes. Imagine sabermos o tipo sanguíneo mais frequente dos brasileiros? Levaríamos muito tempo e teríamos muito trabalho para realizarmos esses testes. Fonte: <martabolshaw.blogspot.com/2008_03_01_archive.html>. Acesso em: 25 fev. 2010. E se pegássemos apenas uma amostra dessa população? O estudo cuidadoso de uma amostra tem mais valor científi co do que o estudo de toda a população. Por exemplo, para estudar o efeito do fl úor sobre a prevenção da cárie em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que examinar rapidamente todas as crianças antes e determinado tempo após o uso do fl úor. Dessa maneira não seria mais fácil, e ao mesmo tempo constituiria de uma metodologia correta? Aula 1 Bioestatística 20 Como fazer para escolher a amostra correta? Quando trabalhamos com uma amostra da população, utilizamos as técnicas de amostragem, isto é, escolhemos o procedimento que vamos adotar para escolher os elementos que irão compor a amostra. Amostra casual simples É composta por elementos retirados ao acaso da população. Todo elemento da população tem igual probabilidade de ser escolhido para compor a amostra. Vamos ver como? Vamos supor que você esteja no laboratório de biologia vegetal e quer realizar um experimento para avaliar os efeitos de diferentes quantidades de cálcio (1mg, 3mg e 5mg) no crescimento da planta. Para a realização desse experimento temos 15 vasos de plantas, nas mesmas condições de umidade, luz, temperatura, altura da planta e estado nutricional. A pergunta é: Quais vasos escolher para receber 1mg, 3mg e 5mg de cálcio? Nesse caso, fazemos um sorteio dos vasos, para que todos tenham a mesma chance de serem escolhidos para receber diferentes quantidades de cálcio. Atividade 4 1 2 Aula 1 Bioestatística 21 Amostra sistemática Os elementos são escolhidos por um sistema. Se no exemplo acima, você escolhesse somente os vasos listrados de preto, estaria organizando uma amostragem sistemática. Amostra estratifi cada É composta por todos os elementos originados de todos os estratos da população. Por exemplo: A população de Natal (RN) é composta por crianças, jovens, adultos e idosos. Uma amostra estratifi cada tem que ter uma representação na mesma proporção das quatro categorias acima citadas, ou seja, 10 crianças, 10 jovens, 10 adultos e 10 idosos. Amostra de conveniência É formada por elementos que o pesquisador reuniu somente porque dispunha deles. Se você utilizar todos os vasos de plantas citados no primeiro exemplo, independente de um critério, esta amostra constituirá numa amostra de conveniência. Entretanto, você deve ter muito cuidado ao utilizar esse tipo de amostra, pois os dados podem ser tendenciosos, não revelando a realidade da situação. Responda às questões abaixo de acordo com o que você entendeu sobre amostras e seus tipos. Um pesquisador tem dez gaiolas. Cada uma delas contém seis ratos. Como esse pesquisador pode selecionar dez ratos para compor sua amostra? Dada uma população de quarenta cajueiros, descreva uma forma de obter uma amostra casual simples composta por seis cajueiros. 3 Aula 1 Bioestatística 22 Organize uma lista com dez nomes de pessoas em ordem alfabética. Depoisdescreva uma forma de obter uma amostra sistemática de cinco nomes. Resumo Nesta primeira aula, você viu um breve histórico da Estatística e como podemos aplicá-la nas Ciências Biológicas. Estudou que, com o passar dos anos, o papel da Estatística se modifi cou, indo além de organizar e descrever fatos e/ou gerar informações. Você pode perceber que ela vem auxiliando na escolha das situações experimentais, na determinação da quantidade de indivíduos a serem examinados, na análise dos dados, indicando técnicas para resumir e apresentar as informações e na elaboração das conclusões. Você aprendeu a defi nição de método estatístico e todas as suas fases, desde a defi nição do problema, passando pelo planejamento, coleta e crítica dos dados, até a apresentação, análise e interpretação dos dados. Estudou também a Bioestatística, ou seja, a aplicação da Estatística nas Ciências Biológicas, e retomou alguns conceitos essenciais para o seu entendimento e aplicação, como a defi nição de população, amostra e variável. Por fi m, viu que as técnicas de amostragem constituem um conjunto de procedimentos que vamos adotar para escolher os elementos que irão compor a amostra que queremos analisar. Autoavaliação Nesta aula, você deve ter percebido a importância da Estatística e da aplicação dos métodos estatísticos para solucionar problemas biológicos. Feito isto, verifi que se você consegue responder, de maneira resumida, às seguintes perguntas: 1 2 Aula 1 Bioestatística 23 Qual a fi nalidade e as fases do método estatístico? Conceitue população e amostra, exemplifi cando. Se você conseguiu respondê-las, suas respostas certamente contêm os elementos básicos que você deverá ter apreendido deste conteúdo. Caso contrário, retome os textos e resolva as questões até que tais conceitos se estabeleçam para você como um conhecimento bem estruturado. Referências CALLEGARI-JACQUES, Sídia M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003. INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA – IBGE. Disponível em: <www.ibge. gov.br>. Acesso em: 25 fev. 2010. LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso Editores, 1999. SAMPAIO, Ivan Barbosa Machado. Estatística aplicada à experimentação animal. Belo Horizonte: Ed. Fundação de Ensino e Pesquisa em Medicina Veterinária e Zootecnia, 1998. VIEIRA, Sonia. Introdução à bioestatística. Rio de Janeiro: Campus, 1980. Aula 1 Bioestatística 24 Anotações Como transformar dados em informações 2 Aula 1 2 3 4 Aula 2 Bioestatística 27 Apresentação Nesta aula, estudaremos o conceito de dados e banco de dados. Veremos como criar um banco de dados e, posteriormente, a transformar os dados em informações. Inicialmente faremos uma retomada dos principais conceitos vistos na Aula 1 – O que é Bioestatística – para depois iniciarmos a apresentação dos novos conceitos sobre os dados. Conceituado dados e banco de dados, estudaremos as diferenças entre dados e informações e aprenderemos a planejar uma coleta de dados. Por fi m, analisaremos os dados coletados para que eles sejam apresentados em forma de tabelas, fi guras ou gráfi cos, de acordo com o objetivo da pesquisa. Tenha em mãos o seu material da Disciplina de Matemática e Realidade, pois faremos a revisão utilizando as Aulas 3 (A natureza dos dados estatísticos e sua organização) e 4 (Gráfi cos estatísticos: uma síntese dos dados). Bom estudo! Objetivos Conceituar dados e banco de dados. Distinguir a diferença entre dados e informações. Estabelecer critérios para fazer uma coleta de dados. Analisar os dados coletados. Aula 2 Bioestatística28 Retomando alguns conceitos da Aula 1 Antes de iniciarmos a nossa aula, é conveniente você relembrar o que é uma unidade experimental, uma variável e como esta pode ser classifi cada (Aula 1– O que é Bioestatística). Vamos defi nir o que são os dados? Dados são defi nidos como informações numéricas (contínuas ou discretas) ou qualitativas, obtidas de uma unidade experimental ou de observação. No exemplo da Aula 1, quando se afi rma que as árvores de mandacaru têm 21 espinhos, os dados são “21 espinhos”. Podemos também citar o exemplo do consumidor que vai a várias lojas para fazer uma pesquisa de preço dos televisores. Nesse caso, os dados são os preços das TVs que ele pesquisou. Se compararmos os exemplos acima, podemos verifi car que os dados podem ainda ser classifi cados em: Dados isolados, como é o caso dos 21 espinhos de mandacaru, obtidos somente de uma planta. Conjunto de dados, como é o caso dos diversos valores pesquisados pelo consumidor antes de comprar a televisão. Nesse caso, para que esses dados transmitam alguma informação, eles devem ser organizados. Como organizar os dados? Organizar o dado “21 espinhos de mandacaru” é relativamente fácil, sendo possível até anotar em um papel e guardar. Pronto, simples assim; desde que eu só queira estudar uma planta. Mas, qual a relevância deste dado (21 espinhos), se o objetivo do meu trabalho é determinar o número médio de espinhos nos mandacarus em um jardim que tem 20 plantas? Observe que, nesse caso, teremos que traçar uma estratégia de planejamento e organização de trabalho, de modo que se possa ao fi nal: 1) Ter contado ou estimado o número médio de espinhos de todas as plantas. Unidade Experimetal É a menor unidade a fornecer uma informação. Podem ser pessoas, animais, plantas, objetos. Variável É alguma característica que pode ser observada (contada ou medida) em uma população ou em uma amostra. Classifi cação das variáveis Quantitativa (discreta ou contínua) e qualitativa (nominal ou ordinal). Atividade 1 1 2 Aula 2 Bioestatística 29 2) Conseguir lembrar ou guardar esses números, a fi m de que, se outro indivíduo precisar recomeçar ou continuar o trabalho, possa repetir o mesmo e chegar a resultados semelhantes. Nesse momento, quando nos deparamos com uma quantidade maior de dados a serem coletados para posterior análise, precisamos organizá-los em um banco de dados. Diferencie dados e banco de dados. Cite alguns exemplos de dados quantitativos e qualitativos que fazem parte do seu cotidiano. Aula 2 Bioestatística30 Banco de dados Um banco de dados é um conjunto de registros (de números ou variáveis qualitativas) com uma estrutura regular que permite a reorganização e inserção desses registros de forma sistemática, com a fi nalidade de se gerar informações. Pode ser a agenda do seu telefone celular, a lista telefônica, o seu caderno de anotações e até um conjunto de dados organizados em uma planilha de Excel. Sim, isso mesmo! Mas desde que esses dados sejam organizados de forma sistemática. Veja o exemplo a seguir: Situação problema 1: Como posso fazer a identifi cação das principais espécies vegetais de uma área de caatinga na reserva fl orestal do meu município? Para resolver esse problema, devemos primeiro deixar bem claro: 1) Qual o objetivo da pesquisa? Identifi car as principais espécies vegetais numa determinada área de reserva fl orestal do município onde moro. 2) O que fazer para alcançar esse objetivo? Identifi car e contar o número de individuos presentes em cada uma das áreas de caatinga do município. Note que no objetivo estão “espécies vegetais”, isto inclui árvores, arbustos, cactáceas, gramíneas e leguminosas, independente de seu tamanho. Feito isso, você pode partir para o próximo passo: 3) Identifi car e classifi car as variáveis a serem estudadas: As variáveis são as espécies vegetais. Neste exemplo, trata-se de uma variável numérica e discreta, pois serão dados de contagem (Caso haja dúvidas, volte para a Aula 1 – O que é Bioestatística – e leia a defi nição de variáveis e seus tipos). Agora, como posso defi nir o método de amostragem já que é impossível contar todas as espécies vegetais da área? Para isso devemos fazer a seguinte pergunta: 4) Quantas amostras eu vou precisar colher, parafazer essa determinação? Existem vários métodos para fazer essa determinação, neste caso o mais recomendado é fazer uma revisão de literatura e procurar identifi car o método mais adequado. Para este caso específi co do exemplo, podemos defi nir que Forma sistemática Forma organizada de dispor os dados, seguindo algum critério. Por exemplo: ao arrumar suas camisetas no armário você as ordena pela cor. Parcela de 4m 2 contendo todas as plantas a serem contadas L 1 L 2 L 3 L 4 L 5 L 6 L 7 L 8 L 9 L 10 L 11 L 12 Aula 2 Bioestatística 31 Figura 1 – Área experimental e respectiva parcela de 4m2 Na Figura 1, em cada subunidade será reservada uma parcela com 4m 2 de área para identifi cação e contagem do número de plantas de caatinga. Depois de coletados os dados, veja, na tabela a seguir, como fi cou a sua organização. Tabela 1 – Levantamento fi tossociológico de uma área de caatinga Ordem Nome Popular Espécie Número de indivíduos 1 Angico Piptadenia macrocarpa 4 2 Bambural Hyptis suaveolans (L.) Poit 1375 3 Carrapicho Agulha Bidens sp 37 4 Catingueira Caesalpinia pyramidalis Tul 2 5 Jitirana Merremia aegyptia L. 4 6 Malva Sida cordifolia L. 135 7 Manda Pulão Croton sp. 249 8 Marmeleiro Croton hemiargyreus 8 9 Mata Pasto Senna obtusifolia 13 10 Melosa Ruellia asperula 54 11 Milhã Brachiaria plantaginea 90 12 Mofumbo Combretum leprosum Mart. 13 13 Mororó Bauhinia cheilantha 2 14 Pau Branco Auxemma oncocalyx 4 15 Sabiá Mimosa caesalpiniifolia 1 16 Tiririca Cyperus sp 3 17 Urtiga Fleurya aestuans L. 11 Viu como é fácil? Agora, que tal extrair uma informação desse conjunto de dados? Identifi que a espécie vegetal que apresenta o maior número de indivíduos (plantas) na área amostrada. serão avaliados 12 locais diferentes (L1, L2, L3, L4, L5, ... ,L12) e em cada um destes locais serão coletadas amostras de parcelas de 4m 2 (Figura 1). Em cada parcela, todas as plantas encontradas serão identifi cadas pelo nome comum e o científi co e contadas. Atividade 2 Aula 2 Bioestatística32 Vamos tomar algumas medidas de biometria com seus conhecidos? Selecione um grupo de 25 indivíduos (podem ser pessoas da sua família, amigos, alunos, colegas de trabalho, da igreja e/ou de prática de esportes) e organize uma tabela com os seguintes dados: primeiro nome, idade, sexo, altura e peso de cada um deles, utilizando a tabela a seguir. Primeiro nome Idade Sexo Altura Peso 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Biometria Estudo das características biológicas quantitativas de uma população. Aula 2 Bioestatística 33 Diferenciando os conceitos: dados x informações Para discutir o conceito de informações, vamos partir da seguinte situação: Uma lista telefônica (seja de celular ou papel) é um conjunto de dados, organizados em função de alguma variável como, por exemplo, o nome e/ou endereço. Quando você precisa ligar para uma pessoa, cujo telefone não se lembra, o que você faz? Certamente, uma pesquisa/ análise no conjunto de dados da lista a fi m de obter a informação desejada: o telefone da pessoa. Analisando essa situação, podemos defi nir informação como: o conhecimento obtido através da interpretação do signifi cado dos dados (HOUAISS; VILLAR; FRANCO, 2001). Aliás, um dicionário da língua portuguesa nada mais é que um conjunto de dados, organizados de forma sistemática (normalmente em ordem alfabética), no qual podemos obter informações sobre a ortografi a correta, signifi cados, sinônimos e antônimos de palavras. Uma curiosidade... Se, na minha lista telefônica, eu não encontrar o número de telefone da pessoa que procuro ou se ele não for o correto, ainda assim isso é uma informação? Sim, só que nesse caso o seu banco de dados (agenda do telefone) não serviu para responder o seu questionamento. Por esse motivo, a informação obtida foi: ‘você não tem o número do telefone da pessoa’. Neste caso, se realmente desejar falar com ela, você vai precisar conseguir a informação correta em outra fonte de dados, que pode ser a lista telefônica, um colega, etc. Nessa situação é importante para lembrar que nem sempre o nosso conjunto de dados vai permitir obter a informação necessária e/ou correta. São vários os fatores que podem resultar nesse problema, dentre eles podemos citar problemas na amostragem (número insufi ciente e/ou amostras tendenciosas que conduzem a conclusões inverídicas) e erros na coleta e/ou no processamento dos dados. Atividade 3 Aula 2 Bioestatística34 Na tabela construída na Atividade 2, conte o número de pessoas do sexo masculino e do feminino que tem mais de 1,55m de altura e pesa mais que 68kg. Planejando a coleta de dados Lembra que agora a pouco vimos que há vários fatores que podem resultar no fato de um dado não fornecer nenhuma informação ou fornecer informações erradas? Esse fato foi exemplifi cado pelo caso de não acharmos o telefone procurado ou acharmos o telefone e este estar errado. Para que isso não ocorra, é importante planejar e traçar uma estratégia para realizar a coleta de dados. Essa estratégia de planejamento da Coleta de Dados é composta por: Observação dos ítens do método estatístico (mencionada na Aula 1): Nessa primeira fase você deve seguir as etapas do método estatístico, que são: (1) Identifi cação do problema e (2) Formulação de hipóteses. Conhecendo esses dois ítens, entre outras coisas, é possível: Identifi car e classifi car as variáveis adequadas e necessárias para a pesquisa. Isso é importante para que você possa organizar as tabelas em função do tipo de resposta esperada (ex.: sim ou não; presente ou ausente; espaço para número ou texto) para cada variável estudada. Traçar uma estratégia de ação que permita coletar, organizar e processar os dados de forma precisa e correta. Assim, pode-se evitar desperdício de tempo anotanto informações que não serão úteis e adequando as condições para coletar os dados e a necessidade do trabalho. Desse modo, pode-se evitar erros na anotação ou processamento dos dados. Um exemplo disso pôde ser observado na realização do censo agropecuário 2006, no qual os entrevistadores utilizaram “palmtops” para coletar os dados. Assim, diminui a chance de ocorrer erros durante o processamento dos questionários, por erros de leitura. Entretanto, os erros de coleta de dados podem acontecer na hora da anotação dos questionários por resposta imprecisa do entrevistado. PLANEJAMENTO DA COLETA DE DADOS Observação das fases do método estatístico ETAPA OPERACIONAL • Determinar o número de pessoas da equipe • Realizar treinamento para a coleta dos dados • Providenciar material necessário • Organizar o trabaho no local da coleta • Verificar o modo de armazenamento e transporte do material coletado Identificação do problema Formulação de hipóteses Aula 2 Bioestatística 35 Além disto, é importante antes de sair para coletar os dados, verifi car: Quantas pessoas serão necessárias para realizar o trabalho. Se existe material de coleta disponível (por exemplo: lápis e papel, frascos para armazenar amostras etc.) para todo o trabalho. Se é necessário realizar treinamento antes de iniciar o trabalho. Como as amostras coletadas podem ser armazenadas e transportadas. Se a amostra utilizada é representativa da população. Como será realizado o trabalho de coleta. Tendo como exemplo a Tabela 1, para fazer a coleta de dados de quais as espécies vegetais e o número de plantas em cada parcela, precisamos de: fi ta métrica para demarcar o perímetro da área amostral; lápis e papel para fazer anotar o nome comum (popular), o científi co e a quantidade de indivíduos de cada espécie. Além disso, para esse trabalho específi co é importante levar na equipe uma pessoa que conheça a fl ora regional e saiba identidicar as plantas. Em caso de dúvidas, é interessante também ter recipientes adequados para coletar amostras e levar para o biotério, a fi m de fazer identificação correta da espécie. A Figura 2 reúne as principais etapas do planejamento da coleta de dados. Figura 2 – Principais etapas do planejamento da coleta de dados Fonte: Henrique Rocha de Medeiros Atividade 4 Aula 2 Bioestatística36 Elabore um plano para a coleta de dados idade, peso e altura de todas as pessoas da cidade onde você mora. Aula 2 Bioestatística 37 A opção de organizar os dados em linhas ou colunas vai depender da preferência defi nida antes de iniciar o trabalho de coleta. Todavia, esta deve sempre possibilitar a soma ou contagem de dados correspondentes à mesma variável seguindo uma única sequência de linhas ou colunas. Além disso, a sistematização das informações em planilhas facilita ainda a elaboração de tabelas (ver Tabela 1 – Levantamento fi tossociológico de uma área de caatinga) e gráfi cos para análise dos dados. Há vários tipos de gráfi cos, e a escolha de qual utilizar vai depender do tipo de dados existentes, da necessidade e familiaridade com as informações. Utilizando os dados do nosso exemplo, escolhemos apresentá-los em forma de gráfi co de barras, mais adequado para o tipo de dados que temos (Figura 4). Análise gráfi ca de conjunto de dados Como dito anteriormente, um conjunto de dados só poderá ser transformado em informação se, com ele, for possível realizar alguma análise e interpretação dos seus resultados. Assim, podemos estabelecer alguns mecanismos de classifi cação para o conjunto de dados. Uma das ferramentas que possibilitam essa organização sistematizada são as planilhas (Figura 3), isto é, um conjunto de dados organizados em linhas e colunas, que podem ser preenchidas manualmente ou em computadores (planilhas eletrônicas). Figura 3 – Exemplo da planilha com linhas e colunas feita em computador. Os dados apresentados são referentes ao exemplo utilizado na aula Fonte: Henrique Rocha de Medeiros Espécies encontradas N úm er o de in di víd uo s de c ad a es pé ci e Angico Bambural Carrapicho Agulha Catingueira Jitirana Malva Manda Pulão Marmeleiro Mata Pasto Melosa Milhã Mofumbo Mororó Pau Branco Sabiá Tiririca Urtiga0 200 400 600 800 1000 1200 1400 1600 Número de indivíduos Levantamento fitossociológico de espécies encontradas numa área de Caatinga Aula 2 Bioestatística38 Não existe um tipo mais correto de gráfi co, todavia é importante que eles permitam a interpretação rápida e o entendimento dos resultados e, além disso, que respeitem as normas para a elaboração de gráfi cos e tabelas, como visto nas Aulas 3 e 4 da disciplina Matemática e Realidade. Exercício resolvido 1 Utilizando as informações da Tabela 1 (Levantamento fi tossociológico de uma área de caatinga), indique quantas espécies foram identifi cadas e qual o total de plantas contadas. Resolução Nessa tabela, os dados referentes a cada espécie (observe que os nomes científi cos não se repetem) estão organizados em linhas. Assim, observando-se a tabela pode-se aferir que foram identifi cadas 17 espécies. O número total de plantas contadas pode ser obtido somando-se o número de indivíduos de cada espécie (4 + 1375+ 37+...+1+3+11 = 2005). Figura 4 – Identifi cação e quantifi cação das espécies vegetais encontradas numa área de caatinga na Região Nordeste do Brasil Fonte: Henrique Rocha de Medeiros Aula 2 Bioestatística 39 Resolução Observando-se os resultados da tabela pode-se identifi car que o bamburral, o manda pulão e a malva, com respectivamente 1.375, 249 e 135 indivíduos cada, são as espécies vegetais que têm o maior número de plantas na área estudada. Essa mesma resposta pode ser obtida, analisando-se a Figura 4: Identifi cação e quantifi cação das espécies vegetais encontradas numa área de caatinda na Região Nordeste do Brasil. Resumo Você estudou o conceito de dados e banco de dados e aprendeu como criar um banco de dados para, posteriormente, transformá-lo em informações. Você retomou os principais conceitos vistos na Aula 1 – O que é Bioestatística – tais como, unidade experimental, variável e classifi cação de variáveis. Você estudou as diferenças entre dados e informações e aprendeu que, para que dados sejam transformados em informações, precisa planejar sua coleta de forma a evitar erros. Para isso, utilizou-se as duas primeiras etapas do método estatístico: (1) Identifi cação do problema e (2) Formulação de hipóteses. Você estudou também algumas ações que fazem parte do planejamento da coleta de dados, como conhecer o local da coleta, formar uma equipe de coleta, levar material necessário, dentre outros. Aprendeu que os dados coletados podem ser organizados em planilhas eletrônicas feitas em computador, o que facilita posterior análise e interpretação. Por fi m, relembrou as formas de apresentação dos dados, como por exemplo, em tabelas e gráfi cos. Nesse caso, a opção pela tabela ou pelo gráfi co se dará em função da necessidade de informação. Se o objetivo for apenas identifi car as espécies com maior número de indivíduos, possivelmente o gráfi co será a melhor alternativa. Entretanto, se a quantifi cação é necessária, a organização da tabela em função do número de indivíduos poderá facilitar o trabalho. Exercício resolvido 2 Ainda utilizando as informações da Tabela 1, identifi que as três espécies que tem mais indivíduos na amostra estudada. Nesse caso, a mesma resposta pode ser obtida analisando a tabela ou construindo gráfi cos como pôde ser observado. 1 Aula 2 Bioestatística40 Autoavaliação A dengue é uma doença grave, que está disseminada em todo o território nacional. Então, que tal por em prática os conceitos da aula de hoje, transformando os dados sobre essa epidemia em informação? Para isto analise os dados que foram retirados de um texto extraído da página da Secretaria de Saúde Pública (SESAP/RN) na internet. <http://www.rn.gov.br/contentproducao/aplicacao/govrn/imprensa/enviados/noticia_detalhe. asp?nImprensa=0&nCodigoNoticia=17319>: A Secretaria Estadual de Saúde Pública, por meio do Programa de Controle da Dengue, divulgou nesta segunda-feira (14/12/2009) o boletim de acompanhamento epidemiológico da dengue. Desde janeiro deste ano foram notifi cados 3.577 casos da doença no Rio Grande do Norte. Destes, 17 foram de Febre Hemorrágica de Dengue (FHD), além de três óbitos ocorridos. Em relação ao mesmo período do ano anterior (2008) quando foram notifi cados 43.552, houve uma redução nos casos. Na região metropolitana da Capital (que inclui os municípios de Natal, Macaíba, São Gonçalo e Extremoz) foram notifi cados 1.724 casos de dengue. Em Natal, foram notifi cados 1.235 casos de dengue, dos quais 13 de FHD. Já em Mossoró, 370 pessoas foram acometidas por esta enfermidade (dengue) e 07 apresentaram FHD. Agora, utilizando os dados acima e: Construa uma tabela com o número de casos notifi cados da doença no ano de 2009 em todo o estado do Rio Grande do Norte, na Região Metropolitana da capital, em Natal e em Mossoró. 2 3 Aula 2 Bioestatística 41 Calcule a porcentagem de casos ocorridos no município de Natal em relação ao restante do estado, analisando os dados da tabela elaborada na questão 1. Analise os dados e calcule a redução do número de casos notifi cados de dengue em 2009 em relação ao ano anterior (2008), quando foram notifi cados 43.552 casos dessa enfermidade. Se você conseguiu resolver o exercício acima, parabéns! Caso contrário, entre em contato com o seu professor, retorne ao texto da aula, reveja os principais conceitos, volte à atividade de autoavaliação e tente quantas vezes forem necessárias. Referências HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso Editores, 1999. OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing Company, 1990. SAMPAIO, Ivan BarbosaMachado. Estatística aplicada à experimentação animal. Belo Horizonte: FEP MVZ Editora, 1997. Aula 2 Bioestatística42 Anotações Descrevendo Sistemas 3 Aula 1 2 3 Aula 3 Bioestatística 45 Apresentação Nesta aula, estudaremos as aplicações da estatística descritiva nas Ciências Biológicas. Para isto, utilizaremos dados de sistemas biológicos para calcular a média, variância, desvio padrão, moda e mediana e veremos como obter informações com este tipo de análise estatística. Desse modo, será importante que você tenha uma boa compreensão dos conceitos vistos na Aula 1 – O que é Bioestatística – e Aula 2 – Como transformar dados em informações. As análises que aqui serão realizadas terão como base os conceitos apreendidos nessas aulas. Objetivos Distinguir os conceitos de estatística descritiva e suas aplicações em Ciências Biológicas. Aplicar a estatística descritiva para realizar análises de conjuntos de dados. Avaliar os resultados da análise dos dados, de modo a poder caracterizar corretamente a amostra e poder fazer inferências sobre a população. Aula 3 Bioestatística46 Medidas de tendência central As medidas de tendência central indicam um ponto, em torno do qual, se distribuem ou concentram os números do conjunto de dados. Este tende a estar localizado no centro da distribuição dos dados. As principais medidas de tendência central são a média, a moda e a mediana, que estudaremos a seguir. Média A média de um conjunto de números pode ser defi nida como um valor que representa o total desse conjunto, sem alterar as suas características. Esta medida (média) é um valor de “equilíbrio” do conjunto de dados. Se o conjunto de dados é obtido de uma população, utiliza-se a letra grega “µ” (pronuncia-se mi) para representar a média. Quando o conjunto de dados é obtido de uma amostra da população, utiliza-se o símbolo “x _ ” (pronuncia-se x barra). Calculando médias e suas aplicações A média aritmética (x _ ) de um conjunto de dados é calculada pela soma de todos os dados dividida pelo número deles. A representação matemática do cálculo da média é a seguinte: x = ∑ x n onde: ∑x = somatório de todos os valores de x n = a quantidade de valores Exercício resolvido 1 Um aluno tirou as notas: 0, 2, 4, 6 e 10, em cinco provas. Calcule a média das notas desse aluno. Aula 3 Bioestatística 47 Resolução 1) Primeiro devemos somar (∑x) todos os valores da cada prova: 0 + 2 + 4 + 6 + 10. O resultado é 22. 2) Depois identifi camos o n, ou seja, como são 5 notas, temos n = 5. 3) Por fi m, divide-se a soma 22 por 5 (22/5) e obtém-se a média 4,4. 4) Conclui-se que o aluno teve média 4,4. Exercício resolvido 2 Calcule a média geral das notas da turma de 25 alunos, de acordo com os dados apresentados na Tabela 1. Tabela 1 – Resultado da avaliação (nota) de uma turma com 25 alunos Número de alunos Nota 5 5 8 7 9 8 3 10 Resolução Neste caso, você pode resolver a questão (e encontrar a média geral da turma) de duas maneiras: 1) Somando todas as notas (∑x) obtidas pelos alunos (5 + 5 + 5 + 5 + 5 + 7 + 7 + 7 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 10 + 10 + 10) que dá ∑x = 183 e dividir o valor encontrado pelo número (n) de alunos que é n = 25. Assim, o cálculo da média da turma é obtido pela divisão 183/25, cujo resultado é 7,32. 2) O mesmo resultado de média (7,32) pode ser obtido se você multiplicar a nota pelo número de alunos que tiraram a respectiva nota e fi zer o somatório de todos os resultados, da seguinte maneira: (5*5) + (8*7) + (9*8) + (3*10)(3*10) = 183. Assim, se dividirmos 183 por 25 obteremos o mesmo resultado para o cálculo da média geral da turma, ou seja, 7,32. (5*5) + (8*7) + (9*8) + (3*13*10) 5*5 = 5+5+5+5+5; 8*7 = 7+7+7+7+7+7+7+7; 9*8 = 8+8+8+8+8+8+8+8+8 e 3*10 =10+10+10 Atividade 1 Aula 3 Bioestatística48 Calcule a média para os seguintes conjuntos de dados: a) A altura (em cm) de plantas submetidas a tratamento com hormônio de crescimento: 12,5cm; 12,6cm; 12,9cm; 13,5cm; 13,7cm; 12,7cm; 13,6cm. b) Número de movimentos respiratórios por minuto (mpm) de cobaias de laboratório após a administração de um anestésico intravenoso: 12 mpm; 14 mpm; 13 mpm; 14 mpm; 15 mpm; 16 mpm; 16 mpm; 15 mpm; 13 mpm. c) Número de salários mínimos recebidos pelos trabalhadores de um laboratório de análises clínicas: 5 salários míninos; 4 salários míninos; 4,5 salários míninos; 6 salários míninos; 5,5 salários míninos; 8 salários míninos; 6 salários míninos; 6,5 salários míninos. Aula 3 Bioestatística 49 Mediana e moda A análise da média deve refl etir o conjunto de dados. Todavia, este cálculo pode ser afetado por medidas muito discrepantes (muito altas ou muito baixas em relação ao valor médio). Quando isto acontece, a média calculada não representa adequadamente o que acontece no conjunto de dados. Para estas situações o cálculo da mediana e/ou da moda pode ser uma alternativa adequada para descrever o conjunto de dados. A mediana (cujo símbolo é md) é o valor que ocupa a posição central; esta medida divide o conjunto de dados em duas metades iguais. Para calcular a mediana, organize o seu conjunto de dados em ordem crescente e encontre o valor que está no centro da série. Quando o número de dados for ímpar a mediana será o valor que está no centro da série. Quando o número de dados for par, a mediana será a média dos valores que estão no centro da série. Exercício resolvido 3 Vamos descobrir a mediana do conjunto de dados utilizado para o cálculo das médias do Exercício resolvido 2? Para isso devemos: 1) Organizar o conjunto de dados em ordem crescente. Assim procedendo, obtemos: Valor 5 5 5 5 5 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 10 10 10 Posição 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 2) Note que temos 25 números. Esse valor é ímpar, e desse modo, a mediana será o valor que divide esse conjunto. Neste caso, a mediana corresponderá ao número que está na posição 13 (número 7), pois este dividirá o conjunto de dados em duas metades iguais, com 12 dados (números) cada um, como se pode observar abaixo: Conjunto 1 com os 12 primeiros valores (anteriores a mediana) Valor 5 5 5 5 5 7 7 7 7 7 7 7 Posição 1 2 3 4 5 6 7 8 9 10 11 12 Mediana Valor 7 Posição 13 Conjunto 2 com os 12 últimos valores (posteriores a mediana) Valor 8 8 8 8 8 8 8 8 8 10 10 10 Posição 14 15 16 17 18 19 20 21 22 23 24 25 1 2 Atividade 2 Aula 3 Bioestatística50 É interessante utilizar essa medida quando se estuda um grande conjunto de dados, onde existe muita discrepância entre eles. Neste caso, a mediana pode ser uma medida mais representativa que a média. Já a moda (cujo símbolo é mo) representa o valor que ocorre com maior frequência no conjunto de dados. Analisando-se o conjunto de dados do Exercício resolvido 2, observa-se que a nota que mais aparece é 8. Neste caso, a moda ou o valor modal é 8. Neste exercício, a média, a mediana e a moda apresentam valores bem próximos entre si. E, dependendo do conjunto de dados estas três medidas podem até ter o mesmo valor. Entretanto, dependendo da variação existente no conjunto de dados, você deverá escolher qual dessas medidas de tendência central (média, mediana ou moda) é a mais representativa e adequada para ser utilizada. Calcule a média, a moda e a mediana para o conjunto de dados de uma classe com seis alunos, cujas notas foram: Aluno A B C D E F Nota 2,0 5,0 8,0 5,0 7,5 3,5 Analisando o conjunto de dados abaixo, responda: Aluno A B C D E F G H Nota 2,0 5,0 7,0 10,0 5,0 6,0 3,0 8,0 a) Quantos alunos têm nota superior à média geral da turma? Aula 3 Bioestatística 51 Medidas de dispersão As medidas de dispersão indicam ou permitem ter noção do quanto estão distantes os dados entre si. Ou seja, como eles variam em relação à média. Neste sentido, a descrição de um conjunto de dados sempre se faz com uma medida de tendência central (geralmente a média) e uma de dispersão associadas. Mas,como medir esta variação em relação à média? Para isto, devemos analisar a amplitude e os desvios em relação à média. Amplitude A amplitude corresponde à diferença entre o maior e o menor valor no conjunto de dados. Esta medida nos fornece uma noção da dispersão dos dados. Para explicar este conceito, vamos utilizar dois conjuntos de dados A e B, que representam a nota obtida pelos alunos de uma determinada disciplina: Conjunto de dados A: 4; 6; 4; 6; 5; 5 Conjunto de dados B: 9; 1; 5; 5; 1; 9 b) Calcule a média, a moda e a mediana desta turma. c) Qual destas três medidas de tendência central, você acha mais adequada para descrever o conjunto de dados? Justifi que a sua resposta. Aula 3 Bioestatística52 Para calcular a amplitude destes dois conjuntos de dados, identifi que, respectivamente, o maior e o menor valor em cada um deles. No conjunto A o maior valor encontrado é 6 e o menor 4. Assim, a amplitude é 6 – 4 = 2. Para o conjunto de dados B o maior e o menor valor, são respectivamente 9 e 1, portanto a amplitude é 9 – 1 = 8. Observe que esta medida permite inferir que a variabilidade do conjunto de dados B é maior que o do A. Quando se trabalha com algumas variáveis de grande instabilidade como, por exemplo, contagem de ovos por grama de fezes (OPG) utilizado para diagnóstico de verminose, onde se podem determinar valores de amplitude superior a 10000 OPG, esta medida é bastante interessante para demonstrar a variabilidade e a dispersão existente. Estas características podem ser comprovadas nos dados da tabela a seguir (Tabela 2), onde temos zero como o menor valor de OPG e 5100 como o maior valor. Tabela 2 – Contagem de OPG (ovos/g) de um rebanho de ovinos mestiços (½ sangue Somalis × ½ sem raça defi nida) mantidos em pastagem nativa naturalmente contaminada por larvas de nematódeos gastrintestinais Animal Contagem de OPG 1 100 2 0 3 200 4 300 5 0 6 100 7 400 8 100 9 1100 10 1400 11 5100 12 400 13 700 14 300 15 500 16 0 17 700 18 1300 19 200 20 800 21 300 22 2300 Fonte: Zaros et al (2009). Aula 3 Bioestatística 53 Desvio em relação à media O desvio em relação à média permite estimar o quanto um determinado valor se afasta da média do conjunto. O cálculo do desvio em relação à média é dado pela diferença entre o valor medido (observado) e a média do conjunto de dados (calculado previamente). Este é representado matematicamente pela fórmula: Desvio em relação a média = x – x _ . Onde: x = valor medido x _ = valor da média calculada Para determinar os desvios, precisamos inicialmente calcular as médias de cada conjunto de dados. Ainda utilizando os conjuntos A (4; 6; 4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9), vemos que a média para ambos é 5. Assim, os desvios em relação à média do conjunto de dados A são: Valor medido (x) Média (x _ ) x – x _ 4 5 –1 6 5 1 4 5 –1 6 5 1 5 5 0 5 5 0 Total = 0 Os desvios em relação à média para o conjunto B são: Valor medido (x) Média (x _ ) x – x _ 9 5 4 1 5 – 4 5 5 0 5 5 0 1 5 – 4 9 5 4 Total = 0 Observe que, apesar dos conjuntos de dados A e B possuírem as mesmas médias, eles apresentam desvios bem diferentes. No conjunto A, os desvios vão de – 1 a +1 e no B, de – 4 a +4. Você notou que, apesar dos valores diferentes, a soma dos desvios é zero nos dois conjuntos? Vamos ver o porquê? Você pode está se perguntando: Se a soma dos desvios em relação à média é sempre zero para qualquer conjunto de dados, como poderei utilizar esta medida? Aula 3 Bioestatística54 Neste caso, podemos utilizar um artifício matemático que é elevar o valor de (x – x _ ) ao quadrado, transformando-o em (x – x _ )2, e assim ter sempre um valor positivo para esta operação. Assim, sempre que você calcular a soma dos desvios elevada a potência 2, obterá um valor positivo e diferente de zero. Vamos conferir? Exercício resolvido 4 Calcule a soma dos desvios elevada à potência 2 para os conjuntos de dados A (4; 6; 4; 6; 5; 5) e B (9; 1; 5; 5; 1; 9). Resolução 1) Para o conjunto de dados A: Valor medido (x) Média (x _ ) x – x _ (x – x _ )2 4 5 –1 1 6 5 1 1 4 5 –1 1 6 5 1 1 5 5 0 0 5 5 0 0 Total = 0 Total = 4 2) Para o conjunto de dados B: Valor medido (x) Média (x _ ) x – x _ (x – x _ ) 2 9 5 4 16 1 5 –4 16 5 5 0 0 5 5 0 0 1 5 –4 16 9 5 4 16 Total = 0 Total = 64 3) Calculados os desvios e elevando-os à potência de 2, eles só terão valor zero, se todos os valores x – x _ do conjunto forem iguais a 0. Neste caso, não existe dispersão e/ou diferença em relação a média. Atividade 3 Aula 3 Bioestatística 55 Retome os principais conceitos vistos nesta aula e defi na: a) Média: b) Mediana: c) Moda: d) Amplitude: e) Desvio em relação à média: Aula 3 Bioestatística56 Variância de uma amostra Depois de calcular os desvios em relação à média, agora, você já pode calcular a variância (s2) de uma amostra. Esta medida de dispersão permite ter noção de quanto variam os dados em relação a média e principalmente calcular o desvio padrão de uma média. A variância de uma amostra é estimada pela fórmula: S2 = ∑ (x− x)2 n− 1 Onde: x = valor medido ou observado na amostra x _ = Média calculada para amostra n = número de dados da amostra Vamos fazer uma aplicação da variância utilizando os dados do exercício resolvido 4? Neste caso, para os dois conjuntos de dados, A e B, foram utilizados 6 valores, então o valor de n é igual a 6 e, consequentemente, n – 1 = 5. Utilizando estes conceitos, a variância para o conjunto A é calculada dividindo-se o valor de (x – x _ )2, que é igual a 4, por n – 1, que é igual a 5. Assim, a variância de A é 4/5 ou 0,8. Da mesma forma, a variância de B é calculada por 64, resultado de (x – x _ )2, dividido por 5, resultado de n – 1. Ou seja, 64/5 que resulta em 12,8. Observe que a variância é uma medida adimensional. Agora, conhecendo a variância de um conjunto de dados, eu posso estimar o seu desvio padrão. Desvio padrão Como a variância é uma medida que estima os quadrados dos desvios em relação a média, esta tem pouca aplicação prática. Visto que as unidades de medida dos dados utilizados no cáculo da variância também são elevadas ao quadrado, o que difi culta a interpretação das respostas. Tome-se por exemplo uma medida calculada em: kg ou cm ou m2. Neste caso, a variância será expressa em respectivamente: kg 2 ou cm2 ou m4; difi cultando a interpretação dos resultados. Aula 3 Bioestatística 57 Uma forma de resolver este problema é extrair a raiz quadrada da variância, obtendo assim o desvio padrão (s). O desvio padrão (s) de um conjunto de dados é obtido calculando-se a raiz quadrada da variância, utilizando a fórmula: s = ( 2 √ S2) Onde: S 2 = variância da amostra Utilizando este conceito nos mesmos conjuntos de dados A e B, obtemos os seguintes valores: Para o conjunto A: S 2 = 0,8 então, s = 2 √ 0, 8 s = 0,894 Para o conjunto B: S 2 = 12,8 então, s = 2 √ 12, 8 s = 3,577 Agora, já que conhecemos a média e o desvio padrão do conjunto de dados e a amplitude, podemos utilizar estas informações para descrever os dados analisados neste exemplo. 1) Conjunto A = 5 ± 0,894; menor valor 4; maior valor 6; n = 5. 2) Conjunto B = 5 ± 3,577; menor valor 1; maior valor 9; n = 5. Você pode, utilizando essas informações, escolher o conjunto de dados A, se preferir o que tiver menor desvio em relação à média ou o conjunto de dados B se a opção for pela maior amplitude. Coefi ciente de variação Agora, o que representa o desvio em relação à média? O desvio em relação à média permite avaliar a instabilidade do conjunto de dados. Esta medida de dispersão é chamada de coefi ciente de variação (CV). O CV é calculado dividindo-se o desvio padrão pela média do conjunto de dados. CV = s/x _ Onde: s = Desvio Padrão x _ = Média aritimética calculada para o conjunto de dados. Atividade 4 Aula 3 Bioestatística58 Utilizando os dados do Exercício resolvido 4, teremos os seguintes coefi cientesde variação. 1) Conjunto de dados A: 0,894/5 = 0,1788 ou 17,88% 2) Conjunto de dados B : 3,577/5 = 0,7154 ou 71,54% Este resultado indica que o conjunto de dados A é mais homogêneo e menos instável que o B. Atenção Não estamos afi rmando que “A” é melhor do que “B” ou vice-versa, mas sim, homogêneo. Isto é importante, para se avaliar a representatividade da média em relação ao conjunto de dados. Lembra quando falamos da média de dados de contagem de OPG e que nestes casos, se pode ter amplitude superior a 10000? Este é um caso de variável muito instável, onde a média não tem muita representatividade. Nestas situações, trabalhar com a moda ou a mediana é mais interessante que com a média. A noção de instabilidade de uma variável e a escolha entre utilizar a média, a moda ou a mediana para descrever o conjunto de dados, é uma opção individual do pesquisador. Para isto, recomenda-se o bom senso e observar/ler como se publicam estas informações nos meios científi cos, jornais e revistas. Os dados a seguir fornecem a concentração de um determinado poluente (ppm) em 8 pontos de um afl uente medidos uma hora antes e uma hora depois de um acidente ambiental: Tabela 3 – Concentração (em ppm) de um determinado poluente nas águas de um rio antes e depois de um acidente ambiental Concentração antes Concentração depois 4,67 5,44 4,97 6,11 5,11 6,49 5,17 6,61 5,33 6,67 6.22 6,67 6,50 6,78 7,0 7,89 Fonte: <http://leg.ufpr.br/~paulojus/CE003/ce003/node2.html>. Acesso em: 12 abr. 2010. Aula 3 Bioestatística 59 Utilizando o conjunto de dados da Tabela 3, calcule a média, a mediana, a moda, o desvio padrão e o coefi ciente de variação da concentração de poluentes antes e depois do acidente ambiental. Leitura complementar PROJETO de ensino. Aprendendo a fazer estatística. Disponível em: <http://www.des.uem. br/projetos/Estatistica_Descritiva.pdf>. Acesso em: 12 abr. 2010. Este texto refere-se aos principais conceitos da Estatística Descritiva vistos na aula de hoje. Além disto, sua leitura possibilitará conhecer outros exemplos de aplicações da Estatística Descritiva, principalmente para você utilizar em situações de sala de aula tendo como exemplo as situações do cotidiano. Resumo Aula 3 Bioestatística60 Nesta aula, você estudou as aplicações da estatística descritiva nas Ciências Biológicas. Para isto, você teve como exemplo dados de sistemas biológicos para calcular a média, variância, desvio padrão, moda e mediana. Você compreendeu como obter informações com este tipo de análise estatística e aprendeu a realizar uma análise de um conjunto de dados utilizando a estatística descritiva. Por fi m, você pôde interpretar os resultados da análise dos dados, de modo a poder caracterizar corretamente a amostra e poder fazer inferências sobre a população. Autoavaliação Um fazendeiro foi avaliar a produção de leite dos seus animais. Ele anotou os dados na tabela a seguir (Tabela 4). Entretanto, fi cou sem saber analisar, fazer uma estatística descritiva dos resultados. Tabela 4 – Produção de leite (Kg/animal/dia) Produção de leite (kg/animal/dia) Identifi cação do animal Dia 1 Dia 2 Dia 3 Dia 4 A296 7,4 4 7,2 6,6 A369 6 5,4 8 4,8 A001 8 2,8 3,4 9,4 L061 7,4 9,8 11,2 7 L212 4,6 9 10,2 4 L344 2,8 5 6,2 4 Analise os dados da Tabela 4 e calcule a média, o desvio padrão, a moda, a mediana e o coefi ciente de variação da produção de leite do rebanho. Aula 3 Bioestatística 61 Se você conseguiu resolver o exercício acima, parabéns. Caso contrário, entre em contato com o seu professor. Retome o texto da aula, reveja os principais conceitos, volte à atividade de Autoavaliação e tente quantas vezes forem necessárias. Referências HOUAISS, Antonio; VILLAR, Mauro de Sales; FRANCO, Francisco Manoel de Mello. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Editora Objetiva, 2001. LOPES, Paulo Afonso. Probabilidades e estatística. Rio de Janeiro: Ed. Reichman e Affonso Editores, 1999. MAGALHÃES, M. N.; LIMA, A. C. P. de. Noções de probabilidade e estatística. São Paulo: IME-USP, 2000. OTT, Lyman; MENDEENHALL, William. Understanding statistics. Boston: PWS-KENT Publishing Company, 1990. PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de bioestatística. 2. ed. São Paulo: Pioneira Thomson Learning, 2004. SAMPAIO, Ivan Barbosa Machado. Estatística aplicada à experimentação animal. Belo Horizonte: FEP MVZ Editora, 1997. ZAROS, L. G. et al. Desempenho de ovinos Somalis resistentes e susceptíveis a nematódeos gastrintestinais. In: ZOOTEC, 2009, Águas de Lindóia. Anais... Águas de Lindóia, 2009. Anotações Aula 3 Bioestatística62 Anotações Aula 3 Bioestatística 63 Anotações Aula 3 Bioestatística64 Elaborando hipóteses 4 Aula 1 2 3 Aula 4 Bioestatística 67 Apresentação Nesta aula, apresentaremos o conceito de hipótese, exemplifi cando com situações que fazem parte do seu cotidiano. Num segundo momento, veremos quais os tipos de hipótese e como utilizá-los. Entenderemos o conceito de população amostral e referência, os quais serão parte essencial na construção da hipótese. Estudaremos quais os tipos de erros existentes ao se aceitar ou rejeitar uma hipótese verdadeira. Nesta aula, temos exercícios resolvidos que servirão de guia para que você faça as atividades propostas após cada assunto abordado. Lembre-se: para que você compreenda os conceitos desta aula, é necessário que você leia atentamente o texto, fazendo sempre anotações sobre suas dúvidas e questionamentos. Objetivos Defi nir hipótese. Diferenciar os tipos de hipóteses. Defi nir erro tipo I e tipo II. Aula 4 Bioestatística68 Fo nt e: < ht tp :// no tic ia sr o. na fo to .n et /im ag es /p ho to 20 08 10 04 01 48 24 .jp g> . Ac es so e m : 2 5 m ar . 2 01 0. Segundo o Dicionário On Line de Português, a palavra hipótese refere-se a uma suposição que se faz acerca de uma coisa possível ou não, a qual se tira uma consequência; teoria provável, admissível, embora ainda não demonstrada. Na ilustração anterior, nossa hipótese é que vai chover. Chegamos a essa afi rmação, constatando o céu cinzento e carregado de nuvens. Mas, será que podemos comprovar essa hipótese? Será que essa hipótese pode ser rejeitada? Que elementos temos para aceitar ou rejeitar essa hipótese? Essas e outras questões serão respondidas no decorrer desta aula. Se voltarmos um pouco no tempo e relembrarmos algumas disciplinas que você já estudou, como Biodiversidade, podemos destacar teorias que foram formuladas a partir de uma, duas ou mais hipóteses. Um exemplo foi a teoria da evolução dos seres vivos. Essa teoria teve várias hipóteses, dentre elas a sustentada pelo cientista francês Jean-Baptiste Lamarck, que afi rmava que os seres vivos tinham de se transformar para melhor se adaptarem ao ambiente, ou seja, as girafas teriam adquirido o pescoço longo ao se esforçarem para ter acesso à comida. Essa hipótese não foi aceita pela ciência e foi substituída pelas hipóteses de Darwim, que originaram a Teoria da Seleção Natural. Uma provável teoria... Observe a fi gura abaixo e responda a seguinte pergunta: Será que vai chover? Figura 1 – Céu nublado Atividade 1 Aula 4 Bioestatística 69 Baseado nos conhecimentos que você adquiriu durante o curso de Ciências Biológicas, pesquise e descreva outras hipóteses que foram confi rmadas ou rejeitadas na história da Biologia. Figura 2 – Girafas que teriam adquirido pescoço longo ao se esforçarem para ter acesso à comida - Hipótese de Lamarck Esse é apenas um exemplo de hipóteses que, quando aceitas, tornaram-se fatos, teorias. Aula 4 Bioestatística70 Um exemplo nos dias de hoje Nas Ciências Biológicas, os trabalhos científi cos são realizados com objetivos bem estabelecidos, expressos por meio de afi rmações – as hipóteses – que os pesquisadores desejam verifi car. Veja esta situação: suponha que o pesquisador queira verifi car se o medicamento X, utilizado no tratamento do câncer depele apresenta, como efeito colateral, um aumento na pressão sanguínea. Nesse caso, o pesquisador elabora duas afi rmações, ou seja, duas hipóteses que devem ter sentido contrário uma da outra (igualdade x diferença). Assim, obrigatoriamente, ao aceitar uma hipótese, a outra deve ser rejeitada. Isso pode ser visto no exemplo a seguir. Hipótese 1 (H1): o medicamento X, utilizado no tratamento do câncer de pele, não apresenta efeito colateral. Hipótese 2 (H2): o medicamento X, utilizado no tratamento do câncer de pele, apresenta pelo menos um efeito colateral. Entretanto, para saber quais das hipóteses são verdadeiras, o pesquisador deverá testá-las, ou seja, inicia-se uma pesquisa para responder às suas perguntas. No caso do exemplo acima, ele deve selecionar indivíduos, utilizar a medicação X e avaliar se ocorre algum efeito colateral nos pacientes. Dependendo dos resultados obtidos, o pesquisador aceita ou não a sua hipótese: se ele verifi car que os indivíduos apresentaram algum efeito colateral, como, por exemplo, alteração na pressão arterial após a administração do medicamento, ele aceitará a hipótese 2; caso contrário, deverá aceitar a hipótese 1. Fonte: <http://frasesilustradas.fi les.wordpress.com/2009/04/hipotese.jpg>. Acesso em: 25 mar. 2010. Atividade 2 Aula 4 Bioestatística 71 Com base no que você leu até aqui, defi na hipótese e construa duas hipóteses sobre como será a disciplina de Bioestatística. Hipóteses e seus tipos Até o momento, vimos o conceito de hipótese. Agora, vamos conhecer seus tipos? Há dois tipos principais de hipóteses. Uma que chamamos de Hipótese Científi ca e a outra que denominamos de Hipótese Estatística. A hipótese científi ca é aquela que não menciona o valor do parâmetro. É o caso da nossa situação acima, em que as hipóteses formuladas não exprimem valor, ou seja, não se referem à média da pressão sanguínea dos indivíduos analisados. Já a hipótese estatística menciona o valor do parâmetro. Seria o caso se, no exemplo acima, o pesquisador apresentasse o valor médio da pressão sanguínea dos indivíduos analisados, como, por exemplo, 128mmHg (milímetros de mercúrio). O esquema a seguir resume os dois principais tipos de hipóteses com seus respectivos exemplos e nos apresenta outros dois subtipos da hipótese estatística, a Hipótese Nula ou de Nulidade (H 0 ) e a Hipótese Alternativa (Ha). Valor do parâmetro Valor do parâmetro: é um número, um valor que quantifi ca a variável. HIPÓTESE Hipótese Científica O medicamento apresenta efeito colateral Parâmetro com valor Hipótese Nula Ho A média da pressão sanguínea é igual para os indivíduos que receberam o medicamento e para os que não receberam A média da pressão sanguínea é diferente para os indivíduos que receberam o medicamento e para os que não receberam Hipótese Alternativa Ha O medicamento apresenta efeito colateral sobre a média de pressão sanguínea Hipótese Estatística Parâmetro sem valor Aula 4 Bioestatística72 Figura 3 – Tipos e subtipos de hipóteses e seus respectivos exemplos Fonte: Lilian Giotto Zaros. Vamos nos aprofundar nas hipóteses estatísticas? As hipóteses estatísticas sempre comparam dois ou mais parâmetros, afi rmando que são iguais ou não, como você pôde ver no esquema acima. Essas hipóteses ainda podem ser: Hipótese Nula ou de Nulidade (H 0 ), que estabelece a ausência de diferenças entre os parâmetros. É sempre a primeira a ser formulada. Ainda utilizando o exemplo anterior, a hipótese de nulidade pode ser: H 0 , a média da pressão sanguínea da população amostrada (μ 1 ), de indivíduos tratados com o medicamento X, não difere da média da população tomada como referência (μ 2 ), ou abreviadamente: H 0 : μ 1 = μ 2 Se essa hipótese for aceita, a conclusão é de que o medicamento não altera a pressão sanguínea. População amostrada (μ 1 ) é a amostra que constitui o seu estudo. No caso do nosso exemplo, os 60 indivíduos que tomaram o medicamento constituem a população amostral ou, simplesmente, a amostra. População tomada como referência (μ 2 ) é aquele que serve como base ou referência para o estudo. No caso do exemplo, é a população de pessoas que não receberam o medicamento. O pesquisador não precisa, necessariamente, medir a pressão de todas as pessoas. Ele simplesmente pode ter como base estudos já realizados que constataram que a média da pressão arterial é de 128mmHg. Aula 4 Bioestatística 73 Hipótese alternativa Hipótese Alternativa (Ha ou H1): é a hipótese contrária à hipótese nula. Estabelece a presença de diferenças entre os parâmetros. Geralmente, é a que o pesquisador quer ver confi rmada. A hipótese alternativa do exemplo acima é: Ha, a média da pressão sanguínea da população amostrada (μ1), de indivíduos tratados com o medicamento X, difere média da população tomada como referência (μ 2 ), ou abreviadamente: Ha : μ1 ≠ μ2 Se essa hipótese for aceita, a conclusão é de que o medicamento altera a pressão sanguínea. Exercício resolvido Formule as hipóteses de nulidade e alternativa para a situação descrita a seguir. Um pesquisador da Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) tem se dedicado aos estudos de caprinos, tentando identifi car alguns genes que sejam relacionados à resistência à verminose. Num dado momento da sua pesquisa, ele notou que vários genes aparecem em diferentes proporções nos animais mais resistentes do que nos animais mais susceptíveis e outros genes aparecem nas mesmas proporções em ambos os animais. Diante dessa observação, o pesquisador precisa formular suas hipóteses para posteriormente testá-las. Descreva quais as hipóteses esse pesquisador deve testar. Resolução Em primeiro lugar, você deve identifi car qual a população a ser testada. No exemplo acima, queremos comparar se os animais resistentes apresentam os mesmos genes que os animais susceptíveis. Nesse caso, como iremos testar os dois grupos de animais, podemos denominar os animais resistentes de população 1 (μ 1 ) e os animais susceptíveis de população 2 (μ 2 ), já que ambos serão testados. Uma vez defi nida a população a ser testada, você pode elaborar as hipóteses. Hipótese de nulidade (H 0 ): a média de expressão gênica dos animais resistentes não difere da dos animais susceptíveis. H 0 : μ 1 = μ 2 Hipótese alternativa (Ha): a média de expressão gênica dos animais resistentes difere da dos animais susceptíveis. Ha : μ1 ≠ μ2 Entendido? Agora faça o mesmo nas situações abaixo. Atividade 3 1 2 Aula 4 Bioestatística74 Um pesquisador da Fundação Oswaldo Cruz, no Rio de Janeiro, recebeu uma demanda do Governo Federal para testar um novo inseticida contra o mosquito Aedes aegipty, transmissor da dengue e da febre amarela urbana. Alguns estudos preliminares foram realizados e comprovaram que o inseticida tem efeito na diminuição da população desse inseto. Entretanto, o que o governo ainda não sabe é se ele atua inibindo a eclosão dos ovos, inibindo o desenvolvimento da larva em adulto, ou tornando os adultos estéreis. Com base nessas informações, escolha uma das três alternativas para o mecanismo de ação do inseticida e elabore as hipóteses (H 0 e Ha) que devem ser testadas para responder ao questionamento do Governo Federal. Antigamente, se pensava que o câncer de mama era uma doença rara em mulheres abaixo dos 35 anos. Pesquisas recentes têm mostrado que essa incidência não é um evento tão raro como se pensava anteriormente. Desse modo, pesquisadores de institutos de saúde vêm se questionando se as causas desse tipo de câncer são as mesmas em mulheres abaixo de 35 anos, quando comparadas àquelas de 45 anos ou mais. Suponha que você é um desses pesquisadores que irá realizar a pesquisa e elabore as hipóteses (H 0 e Ha) a serem testadas. ERRO Tipo I - erro α Rejeita H0 quando ela é verdadeira Aceita H0 quando ela é falsa Afirma-se uma diferença quando ela efetivamente não existe Afirma-se
Compartilhar