Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Cursos: Educação Física, Fisioterapia e Nutrição Professora Mercedes 2 REVISÃO - MATEMÁTICA 1 - Somatório Para indicarmos a soma dos x i valores da variável x, isto é x 1 +x 2 +x 3 +...+x n usamos o símbolo (sigma), denominado em matemática, somatório. Assim, a soma x 1 +x 2 +x 3 +...+x n pode ser representada por: x i Exemplo: dados x 1 =2, x 2 =7, x 3 =9 e x 4 =6, temos: x i = 2+7+9+6 = 24 2 - Arredondamento Muitas vezes é necessário ou conveniente suprimir unidades inferiores às de determinada ordem. Esta técnica é denominada de arredondamento de dados. Em nosso curso, adotaremos o seguinte critério para arredondamento de dados: i) Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a permanecer. Exemplo: 53,24 para a 53,2. ii) Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer. Exemplos: 42,87 passa a 42,9; 25,05 passa a 25,1. OBS.: 1) Arredondar não significa, necessariamente, deixar o número sem as casas decimais. Arredonda-se com o número de casas decimais que for necessário. 2) Não devemos fazer arredondamentos sucessivos. Exercícios 1) Sendo: x: 2, 3, 7, 8 e 0, determine: a) xi 2 b) (xi) 2 2) Dado: x 1 3 2 y 0 9 1 3 calcule: a) xy b) y/x c) (x - y) 2 d) 3x e) xy f) ( )2 2 x y g) y(x-1) h) yx 2 i) 5 3) Arredondar os números abaixo na 3ª casa decimal: a) 0,0042 b) 0,222222 c) 0,0067 d) 0,66666 e) 2,709861 f) 0,333333 g) 732,131313 h) 0,00087 4) Arredondar na 2ª casa decimal: a) 0,88888 b) 12,035 c) 6,054 d) 13,194 e) 10,4031 f) 0,005 g) 13,14159 h) 2,718 4 1 - BIOESTATÍSTICA A Estatística, ou métodos estatísticos, como é denominada algumas vezes, desempenha papel crescente e importante em quase todas as fases da pesquisa humana. Lidando anteriormente apenas com negócios de Estado, donde o seu nome, a influência da Estatística estendeu-se à Agricultura, Biologia, Comércio, Química, Comunicações, Economia, Educação, Eletrônica, Medicina, Física, Ciências Políticas, Psicologia, Sociologia e outros numerosos campos da ciência e da Engenharia. Ela está interessada nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. Definição Existem várias definições para Estatística. Apresentaremos aqui uma delas, encontrada na bibliografia anexa. "Estatística é um conjunto de métodos e processos quantitativos que serve para estudar e medir fenômenos coletivos". A Estatística aplicada às ciências biomédicas recebeu o nome de BIOESTATÍSTICA. Para alguns autores, Bioestatística é a Estatística aplicada às ciências da vida. O objetivo geral da Estatística, como um campo de investigação, é o desenvolvimento de procedimentos que permitam analisar e interpretar um fenômeno observado, de modo a avaliar objetivamente a situação em observação. Conceitos Usados Em Estatística População e Amostra Ao coletar os dados sobre características de um grupo de objetos ou indivíduos, tais como estaturas e pesos dos estudantes de uma universidade ou sobre a integridade de lotes de vacinas distribuídas no país, é muitas vezes impossível ou impraticável observar todo o grupo, especialmente se for muito grande, ou se a observação implica na destruição do objeto em questão. Em vez de examinar todo o grupo, denominado população ou universo, examina-se uma pequena parte chamada amostra. 5 População: é qualquer conjunto de informações que tenham, entre si, uma característica comum. Em Estatística, população não significa, necessariamente "pessoas". Amostra: é um subconjunto da população, de dimensões menores que ela, sem perda das características essenciais. Estatística Indutiva E Estatística Descritiva Se uma amostra é representativa de uma população, conclusões importantes podem ser inferidas de sua análise. A parte da Estatística que trata das condições sob as quais essas inferências são válidas chama-se Estatística Indutiva ou Inferência Estatística. Como essa inferência não pode ser absolutamente certa, a linguagem da probabilidade é muitas vezes usada no estabelecimento de conclusões. Fig.1 - Coleta de amostra. A parte da Estatística que procura somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior, é chamada Descritiva ou Dedutiva. Variáveis Chamamos de variável ao conjunto de resultados possíveis de um fenômeno aleatório. As variáveis podem ser qualitativas, quando representam um conjunto de categorias ou modalidades, ou quantitativas, quando representam um conjunto de números. 6 As variáveis ainda podem ser: i) Contínuas: são aquelas que, teoricamente, podem assumir qualquer valor em um intervalo. Em geral, as medições dão origem a dados contínuos. Exemplo: a altura H de indivíduos que pode ser 1,65m, 1,662m ou 1,6772, conforme a precisão da medida, é uma variável contínua. ii) Discretas: são aquelas que, de um valor para outro, não existe continuidade. Geralmente originam-se de contagens. Exemplo: o número N de crianças, em uma família, que pode assumir qualquer um dos valores 0, 1, 2, 3, ... mas não pode ser 2,5 ou 3,842, é uma variável discreta. Mensuração Desde os tempos remotos, o homem tem a preocupação de medir coisas. Em nossa vida diária, freqüentemente estamos medindo algo: o tempo gasto em uma tarefa, a distância a ser percorrida em um compromisso, o número de convidados para uma festa, outros. Mensurar significa associar a alguma coisa um número. As coisas que medimos diferem entre si quanto a classe a que pertencem. Exemplo: estatura, velocidade, inteligência, beleza. A forma de mensuração depende da classe ou nível que ela pertence, pois cada nível possui características próprias, de acordo com a sua complexidade. Níveis de Mensuração i) 1º nível - Nominal: é o mais baixo nível da escala de medidas. É usado para classificar um objeto, pessoa ou característica. Nele vale apenas a relação de igualdade (=). Exemplo: sexo, masculino e feminino; podemos atribuir valores a esta variável: masculino = 0 e feminino = 1. No entanto não é possível realizar operações aritméticas com estes números. ii) 2º nível - Ordinal: é usado para atribuir ordem. Aqui, além da relação de igualdade (=), valem as relações "maior que/menor que" (< , >). Exemplo: a classificação sócio-econômica no Brasil é feita através das letras A, B, C, D e E, sendo que na classe A estão as pessoas com maior poder aquisitivo e na classe E as de menor poder aquisitivo. Daí podemos representar: A > B > C, ou D = D. Este nível também não permite operações aritméticas. iii) 3º nível - Intervalar: aqui aparece pela primeira vez uma escala verdadeiramente quantitativa. Caracteriza-se pela existência de uma unidade de medida arbitrária, porém fixa, e de um zero convencionado. Exemplo: nas escalas usuais de temperatura o zero é convencionado e a distância entre graus de uma mesma escala também. Neste nível as únicas operações aritméticas são a adição e a subtração, multiplicação e divisão não são permitidas. Justificativa: se um líquido P está a 30oC e o líquido Q a 10oC, não podemos dizer que a temperatura de P é três vezes maior que Q, pois na escala Fahrenheit teríamos o corpo P a 86oF e Q a 50oF (na escala Fahrenheit a água vira gelo a 32ºF e vapor a 212ºF). 7 iv) 4º nível - Racional: é semelhante ao nível intervalar, com a diferença de existir umzero verdadeiro, ou seja, o zero representa a ausência da variável. Neste nível todas as operações aritméticas são possíveis. Exemplo: distância (km); volume (m3), outros. As mensurações em nível ordinal e nominal são as mais comuns nas ciências do comportamento. Contagem: das contagens originam números inteiros, portanto, todas operações aritméticas são possíveis. Para que usamos a Bioestatística? A Bioestatística serve para: 1) Resumir e Organizar Informações: freqüentemente quando coletamos dados de uma população, obtemos uma gama muito grande de informações que precisam ser organizadas e resumidas. Neste resumo são colocados resultados que caracterizam uma população em relação a certa variável. 2) Representar Dados: após apuração e resumo, as informações devem ser transmitidas de modo simples e claro. Uma forma de representar os dados são os gráficos. 3) Conhecer como determinada variável apresenta-se distribuída na população: muitas vezes o pesquisador precisa saber se a população tem determinada característica, como por exemplo, a distribuição dos índices de desnutrição. 4) Testar Hipóteses: quando uma hipótese é levantada, ela precisa de comprovação, o que pode ser conseguido usando um recurso estatístico chamado "Teste de Hipótese". Por exemplo, pode-se querer saber se a dieta A é melhor que a dieta B na redução do colesterol. Ou se a dieta de carboidratos é melhor do que a de proteínas. 5) Fazer Inferências: ao estudar uma população, em geral não se consegue dados dela toda, seja devido ao custo elevado, ao tempo despendido ou o tamanho da mesma. Assim a Estatística fornece meios para que, estudando apenas uma parte, se possa tirar conclusões do todo. 6) Tomar Decisão: muitas vezes para se tomar decisão sobre um determinado assunto, é necessário saber como tem sido o seu comportamento, como tem evoluído. Aí é onde entra a Estatística fornecendo subsídios para a tomada de decisão. Por exemplo: os governantes podem tomar a decisão aumentar os investimentos em saúde, com base em informações sobre mortalidade infantil. 7) Correlacionar variáveis. Usado para verificar o grau de associação entre variáveis e para fazer previsões baseadas em amostras (Regressão). Por exemplo: a ocorrência de osteoporose em mulheres após a menopausa tem correlação com o consumo de café. Outro exemplo: o consumo de álcool tem associação com o fumo. 8 Fases Do Trabalho Estatístico: O trabalho estatístico consiste de 6 etapas: 1. Definição 2. Planejamento 3. Coleta de dados 4. Elaboração 5. Análise e interpretação dos dados 6. Relatório 1) Definição: i) Definir os objetivos: toda pesquisa deve ter um objetivo determinado para saber o que se vai procurar e o que se pretende alcançar. Deve partir de um objetivo limitado e claramente definido. A não definição de objetivos é como se construir um edifício sem a fundação. É comum a alguns estudantes, após um exaustivo e dispendioso trabalho de coleta de informações fazer uma pergunta típica: "o que eu faço com isto?" Isto é decorrente da falta de objetivo. ii) Formular hipóteses: hipótese é uma proposição que se faz na tentativa de verificar a validade de resposta existente para um problema. É uma suposição que antecede a constatação dos fatos e tem como característica uma formulação provisória; deve ser testada para determinar sua validade. A clareza da definição dos termos da hipótese é condição de importância fundamental para o desenvolvimento da pesquisa. iii) Definir a população: a pesquisa em foco deve ser delimitada, ainda que este limite seja extenso. Isto é feito em função de se saber para qual população os resultados serão válidos. 2) Planejamento Formular um plano para coleta de dados: o próximo passo é fazer um planejamento de como os dados serão colhidos. É uma das fases mais importantes, pois se os dados coletados não forem confiáveis ou representativos, o pesquisador não ficará sabendo e o resultado será prejudicado. O resultado final da pesquisa depende muito do planejamento no sentido de que vários cuidados devem ser tomados. Por exemplo: uma pesquisa que envolve conhecimento de particularidades das pessoas deve ser bem cuidadosa, pois os pesquisados poderão esconder ou mascarar tais dados. Conforme mencionado anteriormente, nem sempre é possível coletar dados de toda população, assim a opção é se trabalhar com amostras. Para que o resultado da pesquisa seja válido para toda população é necessário que a amostra tomada seja representativa. Por exemplo: na impossibilidade de consultar todos os habitantes de um município sobre a atuação do prefeito, um pesquisador resolve, por conveniência, obter opiniões em apenas um bairro; pode acontecer que o bairro escolhido acabou de receber melhorias; daí o resultado da pesquisa não será representativo. 9 Fig.2 - Erro amostral. Para que estas situações não ocorram, é necessário que se use uma técnica de amostragem. Existem várias técnicas, sendo que as mais comuns são: i) Amostragem Aleatória Simples (AAS) Nesta técnica, todos elementos da população têm igual probabilidade de serem selecionados para constituir a amostra. Por exemplo: para formarmos uma amostra de funcionários de uma empresa, pegamos uma listagem com o nome de todos, numeramos e em seguida sorteamos alguns usando papéis dobrados ou uma "tabela de números aleatórios". ii) Amostragem Sistemática (AS) Aqui os elementos da amostra são selecionados por um sistema preestabelecido. Por exemplo: uma clínica deseja saber o perfil de seus pacientes; possui um arquivo com 1400 prontuários numerados de 1 a 1400; decide-se por tomar uma amostra de 10 pacientes; daí divide-se 1400 por 10 encontrando-se 140; em seguida sorteia-se o primeiro prontuário. Se o sorteado for o número 15, a amostra será composta pelos prontuários 15, 15+140=155, 155+140=295 e assim por diante até completar os 10. Outro exemplo: selecionar um funcionário que entra no restaurante da empresa, contar outros 10 e selecionar o 11º. iii) Amostragem Estratificada (AE) É usada quando a população apresenta-se dividida em estratos, ou seja, grupos com características distintas dentro do tema a ser estudado. Por exemplo: ao pesquisarmos sobre os hábitos alimentares dos freqüentadores de uma academia, podemos ter como estratos as faixas etárias ou o gênero (masculino ou feminino). Neste caso tomamos uma AAS de cada um dos estratos citados. O tamanho da amostra a ser tomada é assunto que será visto mais adiante. Planejamento de Experimentos Dependendo do tipo ou objetivo da pesquisa, será necessário, ao invés de colher amostras, fazer experiências. Neste caso será necessário fazer um planejamento de 10 experimento. Devido sua complexidade, o pesquisador precisará de um conhecimento bem amplo de Estatística. 3) Coleta de Dados Etapa da pesquisa em que se inicia a aplicação dos instrumentos elaborados e das técnicas selecionadas, a fim de se efetuar a coleta dos dados previstos. É uma tarefa cansativa que toma muito tempo e exige do pesquisador paciência, perseverança e esforço pessoal, além do cuidadoso registro dos dados e de um bom preparo anterior. O rigoroso controle na aplicação dos instrumentos de pesquisa é fator fundamental para evitar erros e defeitos resultantes de entrevistadores inexperientes ou de informantes tendenciosos. A seguir são citadas algumas técnicas e instrumentos de pesquisa. Coleta Documental: a fonte de coleta é restrita a documentos (livros, revistas, jornais, etc.). Observação: é uma técnica de coleta de dados onde são utilizados os sentidos para captar determinados aspectos da realidade. Não consiste apenas em ver e ouvir, mas também em examinar fatos ou fenômenos que se desejam estudar. Entrevista: é um encontro de duas pessoas, a fim de que uma delas obtenha informações arespeito de determinado assunto. Questionário: é um instrumento constituído por uma série ordenada de perguntas, que devem ser preenchidas sem a presença do entrevistador. Formulário: é o instrumento utilizado na entrevista. Testes: são instrumentos utilizados com a finalidade de obter dados que permitam medir o rendimento, a competência, a capacidade ou a conduta dos indivíduos, em forma quantitativa. Inquérito por telefone: contato verbal entre o entrevistador e o entrevistado através do telefone. Pesquisa através da Internet: os internautas são convidados a acessar determinada página para responder à pesquisa. Pode ainda ser feita através de e-mail ou salas de bate-papo. Sociometria: é uma técnica quantitativa que procura explicar as relações pessoais entre indivíduos de um grupo. Cuida da mensuração da maneira como as pessoas vivem, sua cultura, opiniões e atitudes. 11 Existem outras técnicas e instrumentos para coleta de dados, sendo que para aplicação de qualquer que seja, é necessário conhecê-los bem. Vale lembrar a necessidade de um pré-teste, antes da coleta definitiva dos dados. 4) Elaboração dos Dados Após a coleta, os dados são elaborados e classificados de forma sistemática, conforme a seguir: i) Seleção: é o exame minucioso dos dados para verificar possíveis falhas e erros. ii) Codificação: é uma técnica operacional utilizada para categorizar os dados que se relacionam. Mediante a codificação, os dados são transformados em símbolos, podendo ser tabelados e contados. iii) Tabulação: é a disposição dos dados em tabelas, possibilitando maior facilidade na verificação das inter-relações entre eles. Permite a sintetização dos dados, de modo que estes sejam mais bem compreendidos e interpretados rapidamente. 5) Análise e Interpretação dos Dados Uma vez organizados os dados e obtidos os resultados, o passo seguinte é a análise e a interpretação dos mesmos, constituindo-se ambos no núcleo central da pesquisa. Nesta fase serão obtidas medidas como média, mediana, moda, proporções, percentís, desvio padrão, etc. Ao final apresenta-se a conclusão que a análise e interpretação levaram. 6) Relatório Exposição geral da pesquisa, desde o planejamento até as conclusões, incluindo os processos metodológicos empregados. Deve ser expresso em linguagem simples, clara, objetiva, concisa e coerente. Tem a finalidade de dar informações sobre os resultados da pesquisa, se possível, com detalhes, para que eles possam alcançar a sua relevância. São importantes a objetividade e o estilo, mantendo-se a expressão impessoal e evitando-se frases qualificativas ou valorativas, pois a informação deve apenas descrever e explicar. 12 O relatório deve abranger os seguintes aspectos: i) Apresentação do problema ao qual se destina o estudo; ii) Processos de pesquisa; iii) Os resultados; iv) Conseqüências deduzidas dos resultados. O Estado de São Paulo 05/02/95 13 Exercícios 1 - Quais são as fases do trabalho estatístico? Descreva de forma sucinta cada uma delas. 2 - Comente sobre a elaboração de questionários. 3 - Quais os tipos de perguntas que devem ser evitadas nos questionários? 4 - Cite vantagens e desvantagens das perguntas abertas e fechadas. 5 - O que é e para que serve uma pesquisa piloto? 6 - Quais são os requisitos de um bom questionário? 7 - Quais as características que devem apresentar o relatório final de pesquisa? 8 - Qual a diferença entre população e amostra? 9 - Qual a diferença entre amostra e amostragem? 10 - Para que serve a Estatística? 11 - Quais as técnicas de amostragem que você conhece? Explique como funciona uma delas. 12 - Cite 3 técnicas ou instrumentos de pesquisa. 13 - Classifique as variáveis abaixo quanto ao nível de mensuração. a) peso (kg) b) estatura (cm) c) sexo d) profissão e) dia da semana f) idade g) tipo sangüíneo h) resultado de um concurso de beleza feminina i) religião j) área (m2) l) renda familiar ($) m) classe social n) altitude o) estado civil p) nº camisa jogador q) nº do CPF r) nº placa automóvel s) pressão arterial 14 2 - TABULAÇÃO DOS DADOS É o arranjo tabular dos dados. Conceitos Dados Brutos: após a coleta, temos dados ainda não organizados que chamamos dados brutos. Rol: é um arranjo de dados numéricos em ordem crescente ou decrescente de grandeza. Amplitude Total: é a diferença entre o maior e o menor número do rol. Distribuição de Freqüência: é o arranjo tabular dos dados por classes, juntamente com as freqüências correspondentes; também denominado dados agrupados. Embora o processo de agrupamento geralmente inutilize muitos detalhes originais dos dados, consegue-se vantagem importante que consiste no aspecto global obtido, que se torna mais claro evidenciando as relações essenciais. Intervalo de Classe: é a diferença entre o maior e o menor número da classe. Limites de Classe: o menor e o maior número da classe chamam-se limite inferior e superior respectivamente. Freqüência Acumulada (Fac): é a soma de freqüências de determinada classe com as anteriores. Freqüência Relativa (FR): é o quociente entre a freqüência absoluta da classe e o total. Exemplo: estatura de estudantes (cm) 158 154 153 160 157 171 170 166 165 169 155 161 162 164 163 Estatura (cm) Nº alunos (fi) Fac FR % 150 | 155 2 2 0,13 13 155 | 160 3 5 0,20 20 160 | 165 5 10 0,33 33 165 | 170 3 13 0,20 20 170 | 175 2 15 0,13 13 15 Exercícios 1 - Tabular os dados abaixo e calcular as freqüências acumuladas e relativas: a) Estatura (cm) de indivíduos adultos (iniciar em 150 e usar intervalo de classe igual a 5 cm). 182 154 163 151 180 171 189 176 159 151 160 170 161 153 171 160 158 169 157 173 153 174 170 165 174 167 164 156 162 157 166 173 159 157 158 173 167 168 168 169 b) Tempo de amamentação, em meses (iniciar em zero e suar intervalo de classe igual a 4). 12 15 4 8 9 6 7 5 11 13 10 9 17 12 7 8 6 10 8 16 3 14 9 13 18 4 2 18 12 5 11 6 11 9 10 7 14 13 15 10 16 7 5 8 13 c) Idade de mulheres na época em que ocorreu a menopausa (iniciar em 30 e usar intervalo de classe igual a 5). 32 35 44 38 39 46 47 35 41 43 40 39 47 52 37 48 36 50 48 46 53 44 49 43 48 34 52 38 42 45 51 46 41 39 40 37 44 43 35 40 46 37 45 38 43 37 41 46 44 49 50 39 46 47 d) Colesterol total (em mg/dl) (iniciar em 140 e usar intervalo de classe igual a 40). 230 168 300 265 159 274 198 217 310 155 264 277 225 255 288 301 215 206 240 350 220 337 186 171 308 140 189 243 144 193 219 154 379 249 251 217 231 278 346 231 292 208 280 324 304 270 166 176 e) Peso (kg) de estudantes do colégio ACD (iniciar em 45 e usar intervalo de classe igual a 6). 69 57 72 54 83 68 72 58 64 62 65 76 60 49 74 59 66 83 70 45 60 81 71 67 63 64 53 73 81 50 67 68 53 75 65 58 80 60 63 53 f) Glicose apurada em exame de sangue (em mg/dl) (iniciar em 50 e usar intervalo de classe igual a 20). 55 123 100 62 101 135 78 95 87 118 91 84 98 125 80 95 82 99 111 103 120 115 77 96 90 114 52 148 57 88 106 104 87 116 82 112 93 130 149 113 56 61 144 96 139 114 91 118 70 87 106 87 16 3 - MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central são usadas para indicar um valor que tende a representar melhor um conjunto de dados. Geralmente localizam-se em torno do meio ou centro de uma distribuição, onde maior parte dos dados tende a se concentrar. 1 - Média Aritmética É dada por: onde x i são os dados apurados e n a quantidade destes dados. 2 - Mediana Colocados os valores em ordem crescente, mediana é o elemento que ocupa a posição central. Neste grupo, o terceiro indivíduo tem estatura mediana. A medianaé encontrada da seguinte forma: a) Número ímpar de dados: Se n for ímpar, a mediana será o elemento central, de ordem 0,5(n+1). Exemplo: 27, 37, 31, 43, 42 Primeiramente colocamos em ordem: 27 31 37 42 43. A seguir verificamos qual elemento ocupa a posição central, ou fazemos 0,5(n+1) = 0,5(5+1) = 3. Portanto o 3º elemento. Daí Md = 37 b) Número par de dados: Caso n seja par, a mediana será a média entre os elementos centrais, de ordem 0,5n e 0,5n+1. Exemplo: 134, 120, 136, 133, 123, 127 n x x i 17 Colocamos em ordem: 120 123 127 133 134 136 e fazemos 0,5n = 0,5.6 = 3 e 0,5n+1 = 3+1 = 4, logo a mediana está entre o 3º e 4º elemento, ou seja: Md 127 133 2 = 130 3 - Moda É o valor que ocorre com maior freqüência num conjunto. Exemplo: notas de Matemática: 2, 8, 6, 5, 4, 6, 1, 0, 6, 7, 9, 3 Mo = 6 Proporção As medidas vistas anteriormente aplicam-se principalmente a dados quantitativos, com exceção da moda, que também é útil para dados nominais. Outra medida usada para dados nominais é a proporção, que é a fração ou porcentagem de itens de determinado grupo ou classe. É calculada por: p n N onde n é o número de itens que apresentam determinada característica e N o número total de observações. Por exemplo: se num grupo de 40 crianças, 10 são obesas, dizemos que a proporção das obesas é de: p n N 10 40 Para que a caracterização dos dados seja mais adequada, podemos usar o seguinte critério: média: quando os valores forem razoavelmente homogêneos; mediana: quando os valores forem heterogêneos; moda: quando ocorrem muitas repetições. Exercícios 1) O número de pacientes atendidos num serviço médico por dia, em um período de 10 dias foi: 14, 21, 9, 11, 8, 19, 25, 22, 21 e 15. Determine a média, mediana e moda. 2) Tomar uma amostra aleatória simples de n = 5 (5 pessoas) da sala de aula. Verificar a idade dos alunos da amostra. A seguir, determine: a) a idade média dos alunos; b) a idade mediana; c) idade que ocorre com maior freqüência. 18 3) Colher uma amostra de 6 alunos da turma, deixando que cada um se manifeste (voluntário), com o objetivo de pesquisar sobre o peso. A seguir calcule o peso médio o mediano e o modal. 4) A amostra do exercício 3 pode ser considerada representativa? Comente. 5) Numa amostra de 8 alunos da turma, 3 usam óculos. Calcule a proporção das pessoas que não usam óculos. 6) Uma empresa, possuindo apenas 5 funcionários, paga os seguintes salários: $50,00; $27,00; $26,00; $25,00 e $24,00. Qual das medidas de tendência central caracteriza melhor os salários desta empresa? (dica: calcule as 3) 7) Presença de ferro (Fe) no sangue (em mg): 11,08 5,29 6,55 6,56 10,44 7,71 7,48. Calcule a média, mediana e a moda. 8) Registrou-se as seguintes temperaturas (oC) em uma câmara fria em certo período: 2, 0, 3, 4, 3, 5 e 1. Quais as temperaturas média, mediana e modal? 9) Uma amostra aleatória de 56 alunos do Grupo Escolar Santa Lúcia revelou que 32 são meninos e 24 meninas. Calcule a proporção de meninos e meninas. 10) Na pesquisa anterior, constatou-se que os alunos estão distribuídos da seguinte forma, em relação a classe social: Classe nº alunos A 4 B 15 C 23 D 14 a) Calcule as proporções de cada classe. b) Qual é a classe modal? 11) Determine a moda e as proporções: Tipo de Sangue freqüência O 417 A 292 B 94 AB 17 12) Calcule média, mediana e moda para as notas obtidas pelos alunos abaixo e responda qual das três medidas caracteriza melhor as notas 10 2 3 3 3 13) Determine a moda para as idades de mulheres na época em que ocorreu a menopausa (capítulo 2 exercício “c”). 14) A tabela abaixo mostra o consumo diário (em g) de proteína e lipídeos numa amostra de adolescentes: Proteína (g) 37,39 65,42 75,89 65,47 55,75 59,94 Lipídeos (g) 39,15 55,69 115,4 85,02 42,13 65,92 Determine a média e a mediana. 19 4 - MEDIDAS DE POSIÇÃO - SEPARATRIZES Se um conjunto de dados é organizado em ordem crescente de grandeza, o valor que divide o conjunto em duas partes iguais é a mediana. Por extensão desse conceito, pode-se pensar nos valores que dividem o conjunto em quatro partes iguais. Estes valores são denominados quartis. Semelhantemente, os valores que dividem os dados em dez e cem partes iguais são denominados decís e percentís respectivamente. i) Quartil 25% 25% 25% 25% Q 1 Q 2 Q 3 ii) Decil 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % D1 D2 D3 D4 D5 D6 D7 D8 D9 iii) Percentil 1% 1% 1% 1% P1 P2 P3 P99 Os percentís são encontrados da seguinte forma: a) Número ímpar de dados: Se n for ímpar, o percentil procurado será o de ordem (n+1)p, onde n é o tamanho da amostra e p a porcentagem representada pela separatriz. b) Número par de dados: Se n for par, o percentil procurado será a média entre os elementos de ordem np e np + 1. Exemplo: Em um teste você obteve o resultado 236. Além de você, onze pessoas fizeram o teste e obtiveram 210, 245, 220, 225, 233, 216, 252, 228, 215, 230 e 241. a) Qual o percentil do seu resultado entre os 12? Primeiramente ordenamos: 210, 215, 216, 220, 225, 228, 230, 233, 236, 241, 245, 252. O resultado 236 ocupa a 9ª posição, num total de 12 posições; assim: 9 12=0,75 = 75%; ou seja 75% dos resultados são menores ou iguais ao seu. b) Qual é o 25º percentil? n = 12, logo n é par; assim: np = 12.0,25 = 3 3º elemento e np + 1 = 3 + 1 = 4 4º elemento Daí o 25º percentil será a média entre o 3º e o 4º elemento, ou seja, a média entre 216 e 220 que é o 218. 20 O gráfico abaixo, conhecido como gráfico de Marcondes, mostra os percentís das variáveis altura e peso, relativas às idades de crianças. Ele serve para acompanhar o desenvolvimento. Exercícios 1) Tomar uma AAS de 11 alunos e apurar a estatura dos mesmos: a) Quem tem estatura _______m ocupa qual percentil? b) Determine o 75º percentil. 2) Pesquisa realizada junto a 14 famílias da favela da Carrocinha, constatou os seguintes números de pessoas por domicílio: 2 5 8 7 6 4 3 5 5 1 9 4 10 e 11. a) Nesta amostra, a família que tem 6 pessoas ocupa qual percentil? b) Encontrar P70e P50. . 21 3) Considere os salários abaixo: 70 82 87 72 107 119 79 102 94 125 96 115 78 84 98 72 87 80 94. a) Abaixo de que salário se situam os 30% com menor remuneração? b) Acima de que salário ficam os 30% com maior remuneração? 4) O médico informou que seu peso está no percentil 85. O que isto significa? 5) Utilizando os dados dos exercícios a, b, c e e, do capítulo 2 calcule respectivamente: a) o percentil 90; b) o P75; c) o 25º percentil; d) o nonagésimo quinto percentil. 6) O que significa a frase a seguir: “somente os gerentes e executivos recebem salários acima do 3º quartil”1. 7) Dobra cutânea triciptal: 7,5 12,9 10,6 7,6 13,9 11,1 13,3 15,1 26,2 11,0 11,5 6,5 8,4 15,7 9,9 12,8 11,3 11,3 Calcule o 9º decil. 8) Dobra cutânea subescapular: 8,4 9,9 9,2 6,2 8,5 10,0 7,6 14,3 20,2 7,3 8,0 7,3 8,8 11,4 8,7 8,1 8,7 14,6 8,2 7,3 13,2 9,4 12,2 Calcule o 1º quartil. 1 Revista Exame: As melhores empresas para você trabalhar. Editora Abril, edição 669. 22 5 - MEDIDAS DE DISPERSÃO OU VARIABILIDADE Como vimos anteriormente, um conjunto de dados pode ser sintetizado através de valores representativos como a média, mediana e a moda. No entanto, estas medidas não têm a capacidade de caracterizar completamente um conjunto de dados. Por exemplo: se a média final de dois alunos A e B é 6, não podemos concluir que o aproveitamento dos mesmos foi homogêneo. O aluno A pode ter obtido notas 6, 5 e 7 e o aluno B 10, 8 e 0 (zero). Portanto, para qualificaros valores de uma certa variável, ressaltando a homogeneidade ou heterogeneidade de sua distribuição, recorremos às medidas de dispersão. 1) Variância: por definição é: 1.1 - Populacional S X X N 2 2 1.2 - Amostral s x x n 2 2 1 2) Desvio Padrão: é a raiz quadrada positiva da variância, ou seja: S X X N 2 e s x x n 1 2 Para população e amostra respectivamente 3) Coeficiente De Variação: é uma medida de dispersão relativa que estabelece uma relação entre desvio padrão e média. Através dele, podemos ter uma idéia se o valor do desvio padrão é alto ou não. É dado por: CV s x 100 23 Exemplo: tempo gasto (em minutos) para realização de certa tarefa, observado em uma amostra de 5 funcionários: 2 5 4 3 6 Como se trata de uma mostra, usamos a fórmula correspondente. Assim: x x x 2 2 (2 - 4)2 = 4 5 (5 - 4)2 = 1 4 (4 - 4)2 = 0 3 (3 - 4)2 = 1 6 (6 - 4)2 = 4 20 x x 2 = 10 2 2 2 min5,2 4 10 1 n xx s Como min 2 não tem sentido prático, calculamos o desvio padrão. min58,15,2 1 2 n xx s E para conhecermos a variação, em percentual, calculamos o CV: %5,39 4 10058,1100 x s CV Portanto, os tempos variaram em 39,5%. Exercícios 1) Usando os dados da amostra colhida, referente a idade dos alunos da turma, calcular a variância, desvio padrão e o coeficiente de variação. Comente o resultado encontrado. 2) Dados os conjuntos numéricos: A = {5, 5, 5, 5, 5} e B = {8, 7, 2, 10, 1}; Sem calcular, responda qual dos dois conjuntos apresenta maior variabilidade; ainda sem calcular, qual a variabilidade do conjunto A. Justifique o resultado. 3) Calcule o coeficiente de variação do conjunto B. 24 4) Calcule o coeficiente de variação para as idades das pessoas dos grupos A e B. Comente os resultados encontrados. A = {1, 3, 5} e B = {53, 55, 57} 5) Calcular a variância, desvio padrão e coeficiente de variação para o consumo (em kWh) de energia elétrica de uma residência: Mês abril maio junho julho agosto setembro outubro kWh 278 283 296 233 334 313 251 6) Calcule a variabilidade dos IMC (índice de massa corporal) abaixo: IMC: 18,0 22,1 18,9 16,0 20,1 18,1 21,1 23,1 7) Calcule o coeficiente de variação das temperaturas da câmara fria citada no capítulo 3, exercício 8. 8) Calcule o coeficiente de variação para as quantidades (em mg) de fósforo (P): 721 762 452 619 980 846 9) Calcule o coeficiente de variação para a pressão sangüínea sistólica (em mmHg) de um grupo de pacientes. 115 120 135 110 100 125 120 90 120 10) Calcule variabilidade para as quantidades (em mg) de cálcio (Ca): 589 1023 495 559 353 Calcule a variabilidade e analise se a distribuição é homogênea. 11) Batimentos cardíacos (por minuto) em um grupo de pacientes 5 dias após cirurgia no coração: Paciente A B C D D E BPM 85 75 87 89 86 94 Determine a variabilidade. 25 6 - REPRESENTAÇÃO GRÁFICA Os dados estatísticos podem ser representados através de elementos geométricos, chamados gráficos. Os gráficos têm o objetivo de dar uma visão rápida e global do fenômeno em estudo. No entanto apresentam algumas limitações: não são precisos na medida em que omitem detalhes; podem ser distorcidos de acordo com interesses particulares; não permitem a representação de um grande número de dados. Os gráficos devem ser elaborados de forma simples e clara, retratar a realidade e respeitar sua escala. Uma preocupação com os gráficos é referente a estética. Um gráfico com um eixo horizontal ou vertical muito grande fica ruim do ponto de vista estético. Assim, os eixos devem ter o mesmo comprimento, ou então o eixo vertical ter, no mínimo, 75% do comprimento do eixo horizontal. Construção De Gráficos Os gráficos devem ser construídos com base no sistema de eixos cartesianos, ou seja, dois eixos perpendiculares entre si, sendo que a origem (zero) é na intersecção dos mesmos. No eixo das abscissas (horizontal), os valores crescem da esquerda para a direita. Neste eixo, geralmente representamos cronologia (tempo), região geográfica (estado, município, outros) ou categorias. No eixo das ordenadas (vertical), os valores crescem de baixo para cima. Nele representamos as quantidades (valores, %). Os gráficos devem ter título e nas extremidades dos eixos devem ser indicadas as variáveis que estão sendo representadas, com as respectivas unidades. Quando um eixo tem seus valores iniciais muito altos, deve haver uma interrupção, com a indicação da posição do zero. Todo gráfico deve indicar, no seu rodapé, a fonte, ou seja, a instituição ou pesquisador(es) que levantaram os dados. 26 I - Gráfico De Colunas É usado para representar séries cronológicas, geográficas e categóricas. São retângulos com larguras de mesma medida e alturas proporcionais às quantidades representadas. É construído da seguinte forma: 1 - traçar um sistema de eixos cartesianos; 2 - marcar os valores ou categorias das variáveis nos eixos, evitando o uso de números "quebrados"; escrever o nome das variáveis; 3 - construir retângulos representativos das variáveis, mantendo entre um e outro distâncias iguais; 4 - colocar o título e a fonte. Obs.: as distâncias entre colunas devem ter medida inferior à largura das mesmas. Exemplo de gráfico de colunas O gráfico do exemplo mostra os principais fatores desencadeantes da violência sofrida pelas mulheres. Podemos destacar que os principais fatores estão ligados ao álcool e ao ciúme. II - Gráfico De Linhas Usado apenas para séries cronológicas, onde podemos perceber a evolução do fenômeno no decorrer do tempo. 27 Para sua construção: 1 e 2 - estes passos são idênticos ao gráfico de colunas; 3 - marcar os pontos correspondentes aos pares de valores das duas variáveis; 4 - unir os pontos marcados por segmentos de reta; 5 - colocar título e fonte. Exemplo: evolução da expectativa de vida no Brasil Ano Expectativa de vida (anos) 1940 44 1950 46 1960 52 1970 53 1980 61 1990 66 2000 69 Fonte: IBGE Evolução da Expectativa de Vida no Brasil 0 10 20 30 40 50 60 70 1940 1950 1960 1970 1980 1990 2000 Fonte: IBGE O gráfico nos mostra a evolução da expectativa de vida dos brasileiros ao longo das últimas décadas. Pode-se observar um aumento considerável do tempo de vida. Você conseguiria listar alguns fatores que têm contribuído para este aumento? 28 III - Gráficos Comparativos Como o próprio nome diz, servem para comparar dois ou mais fenômenos. No entanto, se muitos fenômenos forem representados num mesmo gráfico, este perde sua clareza e simplicidade. Cada fenômeno deverá ter uma cor ou motivo de modo que possam ser diferenciados uns dos outros. Estes gráficos necessitam legenda. Exemplo de gráfico de linhas comparativas. IV - Gráfico De Setores É usado quando queremos comparar os valores de uma categoria com o total de todas categorias. Seu aspecto é de um círculo onde estão traçados alguns raios, por isso é conhecido como gráfico de pizza ou torta. Antes de iniciar sua construção precisamos converter os valores encontrados em graus. Esta conversão é feita através de regra de três simples. Construção: 1 - usando um compasso ou gabarito, traçar uma circunferência com raio qualquer (não muito pequeno) e marcar o seu centro; 2 - traçar um raio qualquer; 3 - usando um transferidor, marcar os ângulos correspondentes aos valores da tabela, começando pelo primeiro raio traçado; 4 - pintar ou diferenciar com motivos cada categoria representada; 5 - colocar legenda, título e fonte. 29 Exemplo: classificação socioeconômica da população brasileiraem 1997. Classe % A 10 B 23 C 40 D 25 E 2 Fonte: IBOPE Classificação socioeconômica da população brasileira em 1997 % 10% 23% 40% 25% 2% A B C D E Fonte: IBOPE V - Representação Gráfica De Distribuições De Freqüência Podemos representar os dados agrupados de duas maneiras: histograma e polígono de freqüência. a) Histogramas: são parecidos com os gráficos de colunas, porém sem os espaços entre elas. São construídos da seguinte forma: 1 - traçar o sistema de eixos cartesianos; 2 - marcar no eixo horizontal apenas os limites de classe; 3 - marcar as freqüências no eixo vertical; 4 - traçar um retângulo para cada classe, com largura igual ao intervalo de classe e altura igual a respectiva freqüência; 5 - colocar título e fonte. Obs.: as linhas que dividem as colunas são dispensáveis. 30 Exemplo: peso de recém-nascidos no mês de novembro na Maternidade Mãe Santa. Peso (g) f 2000 | 2500 2 2500 | 3000 5 3000 | 3500 12 3500 | 4000 8 4000 | 4500 3 Fonte: Secretaria (fictícia) Peso de recém-nascidos no mês de novembro na maternidade Mãe Santa. Fonte: Secretaria b) Polígonos de freqüência: são semelhantes aos gráficos de linha. São construídos da seguinte forma: 1, 2 e 3 - igual ao histograma; 4 - marcar os pontos médios das classes; 5 - marcar os pontos correspondentes aos pares de valores "ponto médio da classe" e "freqüência da classe"; 6 - marcar um ponto onde seria o ponto médio da classe anterior à primeira e outro onde seria o ponto médio da classe seguinte à última; 7 - unir os pontos por segmentos de reta; 8 - colocar título e fonte. Exemplo: Peso de uma amostra de Adolescentes da Região XYZ Peso (kg) Freq. 50 | 55 2 55 | 60 5 60 | 65 6 65 | 70 9 70 | 75 4 Fonte: Instituto RTS 31 Peso de uma Amostra de Adolescentes da Região XYZ Fonte: Instituto RTS Para finalizar este capítulo, ressaltamos a importância do papel milimetrado na construção de gráficos, pois estes facilitam muito. Mais modernamente podemos contar com os gráficos feitos por computador, que são bastante precisos e têm uma apresentação muito boa. O recurso mais comum atualmente é o Microsoft Excel. 32 Exercícios 1) Usando uma conta de luz, construir um gráfico do consumo de energia elétrica. 2) Represente graficamente os dados abaixo. Entre colchetes está indicado o tipo de gráfico. a) Taxa de mortalidade infantil* neonatal e pós-natal na Região Metropolitana de Belo Horizonte - MG. [linhas] Ano Neonatal Pós-neonatal 1992 24 15 1993 22 16 1994 21 14 1995 23 12 1996 22 9 1997 23 6 1998 19 7 Fonte: Rev. Saúde Pública v.9 n. 1 São Paulo fev. 2005 * Número de óbitos de crianças em cada mil nascidos vivos. b) Taxa de mortalidade infantil e principais grupos de causas na Região Metropolitana de Belo Horizonte - MG. [linhas] Ano Afecções perinatais Diaréia – pneumonia - desnutrição 1992 16 9 1993 16 10 1994 20 9 1995 22 7 1996 16 6 1997 14 4 1998 13 4 Fonte: Rev. Saúde Pública v.9 n. 1 São Paulo fev. 2005 c) Domicílios ligados à rede geral de abastecimento de água em 1999 – em %. [colunas] Região Área urbana Área rural Norte 71,5 ND Nordeste 88,6 25,3 Sudeste 96,1 25,9 Sul 95,0 24,1 Centro-oeste 86,2 18,5 Fonte: IBGE/Simonsen Associados 33 d) Nível de escolaridade das puérperas da cor branca no município do Rio de Janeiro entre 1999 e 2001. [setores] Instrução materna % < 4º série fundamental 5,8 4º série fundamental 22,9 8º série fundamental 20,6 Ensino médio 37,4 Nível superior 13,1 Fonte: Rev. Saúde Pública v.9 n. 1 São Paulo fev. 2005 e) Paridade das puérperas da cor negra no município do Rio de Janeiro entre 1999 e 2001. [setores] Paridade % Nenhum filho anterior 33,6 1 a 2 filhos anteriores 44,1 3 e mais filhos anteriores 22,3 Fonte: Rev. Saúde Pública v.9 n. 1 São Paulo fev. 2005 f) Distribuição de casos de doença exantemática, segundo o município de residência.. [coluna] Município Nº Casos Nova Aliança 44 Nova Granada 5 Votuporanga 48 Magda 13 São José do Rio Preto 96 Fonte: Boletim Epidemiológico Paulista dez. 2004 g) Número de leitos hospitalares em estabelecimentos credenciados em 1999 – por 1000 habitantes. [colunas] Região Nº Norte 2,01 Nordeste 2,80 Sudeste 3,13 Sul 3,15 Centro-oeste 3,54 Brasil 2,99 Fonte: Ministério da Saúde 34 h) Distribuição de casos de doença exantemática, segundo faixa etária (setembro a dezembro de 2004). Faixa etária Nº casos 0 | 1 4 1 | 4 48 4 | 10 98 10 | 15 20 15 | 20 8 20 | 30 11 30 | 40 10 Fonte: Boletim Epidemiológico Paulista dez. 2004 i) Número de alcoólatras crônicos segundo a idade que iniciaram o hábito de ingerir bebidas alcoólicas. idade (anos) freqüência 10 | 15 8 15 | 20 41 20 | 25 30 25 | 30 14 30 | 35 7 35 | 40 2 Fonte: Secretaria Saúde j) Q.I. de uma amostra de alunos do Colégio Clara de Assis. QI freqüência 70 | 80 7 80 | 90 11 90 | 100 42 100 | 110 27 110 | 120 20 120 | 130 3 Fonte: Clínica Psicológica 3) Represente graficamente as freqüências acumuladas das tabelas de “h” a “j”. Estes gráficos de são chamados de OGIVA. 35 4) Interprete criticamente os gráficos abaixo: a) b) 36 BIBLIOGRAFIA BERQUÓ, E.S., SOUZA, J.M.P. & GOTLIEB, S.L.D. Bioestatística. São Paulo: EPU, 1981. COSTA, Sérgio Francisco. Introdução ilustrada à estatística. São Paulo: Harper & Row, 1988. LEVIN, Jack. Estatística aplicada a ciências humanas. São Paulo: Harper & Row, 1987. MARCONI, Marina A. e LAKATOS, Eva M. Técnicas de pesquisa. São Paulo: Atlas, 1990. MARTINS, Gilberto A. & DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990 PEATMAN, John G. Introduction to applied statistics. New York: Harper & Row, 1963. VIEIRA, Sônia. Introdução à Bioestatística. Rio de Janeiro: Campus, 1989. VIEIRA, Sônia & HOFFMANN, Rodolfo. Elementos de estatística. São Paulo: Atlas, 1986. WITT, Aracy. Metodologia de pesquisa; questionário e formulário. São Paulo: Resenha Tributária, 1973.
Compartilhar