Baixe o app para aproveitar ainda mais
Prévia do material em texto
Conceitos Básicos Aula 01 – Bioestatística Professor: Éwerton Veríssimo Estatística - Conceito • “Estatística é a ciência que fornece os princípios e os métodos para coleta, organização, resumo, análise e interpretação de dados.” (VIEIRA, 2008, p.3) • A Bioestatística é o ramo da estatística responsável pelas pesquisas com cunho biológico. Estatística - Motivação • Utilização de procedimentos para a organização e resumo de grandes quantidades de dados. • Pode ser utilizada dentro da pesquisa científica, tomada de decisão e na estruturação de projetos. Estatística – Fases do trabalho estatístico Estatística – Fases do trabalho estatístico Determinar o que se pretende pesquisar. Como acontecerá o levantamento dos dados? Quais os dados deverão ser levantados? Determinar um cronograma para execução das atividades Quais os custos para execução da pesquisa? Estatística – Fases do trabalho estatístico Fase em que será realizado o registro sistemático dos dados Os dados coletados serão condensados e tabulados. Além disso, nesta fase será determinada a maneira pela qual os dados serão apresentados. Fase em que será realizado o cáldulo de medidas e coeficientes. Tipos de Pesquisa • Unidade experimental: – experimento condicionado. – Interferência do pesquisador no processo. • Exemplo: verificar a melhoria do desempenho de um atleta diante da utilização de uma substância proibida. • Unidade de observação: – O pesquisador apenas registra os dados que são gerados. – Não há interferência do pesquisador no processo. • Exemplo: verificar o comportamento de pessoas ao experimentar um novo produto. Variável e Dados • Variável: Característica que, observada em uma unidade experimental, pode variar de um indivíduo para o outro. (CALLEGARI JACQUES, 2003, p.15) • Variáveis são características que são medidas, controladas ou manipuladas em uma pesquisa. • “Dados são os valores da variável em estudo[...]”(VIEIRA, 2003, p. 23) Variável e Dados • Extraindo variáveis a partir das imagens Classificação das Variáveis Quantitativas ou Numéricas Qualitativas ou Categorizadas NOMINAL ORDINAL Ex: cor dos olhos Ex: classe social, grau de instrução CONTÍNUA DISCRETA Ex: peso, altura, salário Ex: número de filhos, número de itens defeituosos. Classificação das Variáveis Exemplo Exemplo Exercícios 1. Classifique as variáveis listadas abaixo: a) Número de bebês nascidos por dia em uma maternidade. b) Quantidade anual de chuva na cidade de Campina Grande. c) Quantidade de calorias consumida por dia. d) Valor de uma compra efetuada. e) Grau de escolaridade f) Cor da pele (branca, preta, amarela, parda) g) Número de cadeiras em um teatro. h) Modelo de celular. Exercícios 2. Classifique as variáveis listadas: a. Marca de antitérmico preferida; b. Grau de satisfação com um produto alimentício(péssimo, ruim, bom, ótimo, excelente); c. Peso de grãos exportados; d. Renda familiar; e. Número de computadores em um laboratório de informática f. Esporte praticado(vôlei, futebol, tênis, futsal) g. Quantidade de apartamentos em um edifício h. Patente militar(soldado, cabo, sargento, subtenente, aspirante, primeiro-tenente,etc.) População • População: conjunto de unidades que apresentam uma característica em comum. – Exemplos: • Pacientes portadores de câncer de mama. • Árvores da floresta amazônica. • Radiografias do hospital de Trauma. • Medicamentos referentes ao lote 53/1998 População - Exercícios 1. Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 100 metros obstáculos, registrou-se o tempo gasto por 16 desses atletas e obtiveram-se os seguintes resultados. Indique: A população de estudo. A variável estatística do estudo e classifique-a. Quatro valores que a variável estatística assume. a. b. c. Amostra e Censo • “Amostra é um subconjunto retirado da população com o objetivo de representá-la.” (PIANA; MACHADO; SELAU, 2009, p.120). • “Conclusões e decisões tomadas com base em amostras só tem sentido na medida em que as amostras representam a população.” (VIEIRA, 2003, p.13) • Um levantamento efetuado sobre toda uma população é denominado de levantamento censitá- rio ou Censo Amostras – Por que se usam? • Custo e demora dos censos. • Populações podem ser infinitas • Impossibilidade física de examinar toda a população. • Uma amostra pode ser mais atualizada que um censo. • A precisão pode sofrer no caso de um censo de uma grande população. Amostras • Representatividade: conter em proporção tudo o que a população possui qualitativa e quantitativa. • Imparcial: todos os elementos da população tem igual oportunidade de fazer parte da amostra. OBS: “Não há fórmulas de matemática ou estatística para dizer se a amostra é tendenciosa ou representativa da população. Você terá de ter bom senso [...].” (VIEIRA, 2003, p. 13) Representatividade de uma Amostra • Exemplo 1: Suponha que estivéssemos interessados em conhecer o grau de instrução dos habitantes do Estado de São Paulo. – População: habitantes do estado de São Paulo – Amostra: 400 moradores de regiões com difícil acesso a uma escola ou universidade. Esta amostra é representativa da população pesquisada? Representatividade de uma Amostra • Exemplo 2: Deseja-se avaliar o estado nutricional de crianças de 5 a 10 anos de idade na cidade de Porto Alegre. – População: crianças com a faixa etária de 5 a 10 anos de idade da cidade de Porto Alegre. – Amostra: 300 crianças de regiões onde a renda média mensal das famílias é de 1 salário mínimo foram escolhidas. Esta amostra é representativa da população pesquisada? Amostragem • “Não é necessário tomar um vinho inteiro para ver se é bom.” • Não é preciso assistir uma reportagem inteira para saber se vale a pena assisti-la até o fim. • Para analisar a qualidade de atendimento de um determinado hospital não é preciso consultar todas as pessoas que já foram atendidas no hospital. Amostragem • Consiste no processo de colher amostras de uma população. • Estabelece uma relação entre a população e amostra. Tipos de Amostragem • Probabilística: – Cada elemento da população tem probabilidade conhecida e diferente de zero de pertencer a amostra. – A realização desse tipo de amostragem somente é possível se a população for finita e totalmente acessível. – Os principais métodos de amostragem são: aleatória (casual) simples, sistemática, estratificada e conglomerado. Tipos de Amostragem • Não Probabilística: – Elementos são incluídos na amostra sem probabilidades previamente especificadas ou conhecidas de serem selecionados. – Tem a vantagem de permitir que a escolha de amostras e a coleta de dados sejam relativamente fáceis de acordo com o que for mais conveniente para quem está realizando a pesquisa Tipos de Amostragem • Para cada tipo de amostragem existem técnicas de seleção da amostra. Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Sistemática Amostragem Proporcional Estratificada Amostragem por Conglomerado Amostragem por Quotas Amostragem porConveniência Amostragem a Esmo Amostragem Probabilística • Amostragem Aleatória Simples – equivalente a um sorteio lotérico (todos os elementos devem ter a mesma chance de serem sorteados). – Os elementos são retirados ao acaso da população. – Os elementos da população não se encontram ordenados. Amostragem Probabilística • Amostragem Aleatória Simples – Exemplo: Imagine que 500 clientes estão cadastrados em sua empresa e você precisa obter uma amostra aleatória de 2% dos cadastros para analisar a satisfação deles com relação aos serviços prestados. Como proceder para selecionar esta amostra? a. Numeramos os cadastros de 001 a 500. b. Escrever os números de 001 a 500 em pedaços de papel e colocá-los em uma caixa, retirando um a um. Amostragem Probabilística • Amostragem Sistemática – A seleção dos elementos que constituirão a amostra pode ser feito por um sistema imposto pelo pesquisador. – Os elementos da população encontram-se ordenados. Exemplo: prontuários médicos de um hospital; os prédios de uma rua; as linhas de produção, etc. Amostragem Probabilística • Amostragem Sistemática – Exemplo: Numa gerência, produz-se em média 500 bobinas de aço por dia. Chega-se a conclusão de que é necessário avaliar no controle de qualidade 20 dessas bobinas. Determine quais bobinas poderiam compor a amostra de modo que esta seja representativa da produção diária. Amostragem Probabilística • Amostragem Sistemática Amostragem Probabilística • Amostragem Proporcional Estratificada – Muitas vezes a população se divide em subpopulações, denominadas de Estratos. – É provável que cada estrato possua comportamento heterogêneo com relação a variável em estudo. – A definição dos estratos pode ser de acordo com sexo, idade, renda, grau de instrução, etc.; – Dentro de cada um dos estratos, você pode fazer amostragem usando AAS devido aos estratos serem homogêneos individualmente, considerando a variável de interesse. Amostragem Probabilística • Amostragem Proporcional Estratificada – Dentro de cada um dos estratos, você pode fazer amostragem usando AAS devido aos estratos serem homogêneos individualmente, considerando a variável de interesse. Amostragem Probabilística • Amostragem Proporcional Estratificada – Exemplo: Numa localidade com 150 000 habitantes, 45 000 têm menos de 20 anos de idade, 75 000 têm idades entre 30 e 50 anos e 30000 têm mais de 50 anos de idade. Extrair uma amostra de 30 habitantes desta população. N = 150 000, N1 = 45 000, N2 = 75 000, N3 = 30 000 e n = 30 150000 000 45 301 n 91 n ; 150000 000 75 302 n 151 n ; 150000 000 30 303 n 61 n Amostragem Probabilística • Amostragem por Conglomerado – A população é dividida em subgrupos denominados de conglomerados. – Geralmente, podemos definir os conglomerados por fatores geográficos, como bairros e quarteirões. – Selecionam-se amostras aleatórias simples dos grupos (conglomerados), e todos os itens dentro dos grupos selecionados farão parte da amostra. Amostragem Probabilística • Amostragem por Conglomerado Amostragem Não Probabilística • Amostragem Intencional – A amostra é colhida na parte da população que o pesquisador julga ser mais representativa. Exemplo: Pesquisa: desejamos saber a aceitação de uma nova marca de whisky a ser inserida no mercado de uma cidade Amostra: selecionar pessoas que façam uso da bebida e que tenham condições financeiras de comprar essa nova marca. Amostragem Não Probabilística • Amostragem a Esmo – É o caso em que o pesquisador procura ser aleatório, sem, no entanto, utilizar um sorteio aleatório. Exemplo: Pesquisa: verificar a qualidade de parafusos fabricados. Amostra: selecionar 100 parafusos de uma caixa que contém 10.000 parafusos do mesmo modelo e tamanho, de certo não faríamos uma amostragem aleatória simples, pois seria extremamente trabalhosa. Amostragem Não Probabilística • Amostragem por Cotas – É a amostragem por estratificação, porém não existem sorteios. – Para cada grupo é determinada uma cota proporcional ao seu tamanho. – Método usualmente trabalhado em prévias eleitorais. Exercícios 1. Numa população que apresenta grande variação, em relação a certa característica em estudo, qual a técnica de amostragem adequada? 2. Identifique o tipo de amostragem utilizado. a) Ao escalar um júri um tribunal de justiça decidiu selecionar aleatoriamente 4 pessoas brancas, 3 morenas, e 4 negras. b) Um cabo eleitoral escreve o nome de cada senador do Brasil, em cartões separados, mistura e extraí 10 nomes. c) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a cada 10 pessoas da fila. Exercícios 3. Considere a seguinte relação de clientes de uma determinada loja. Deseja-se realizar um sorteio que deverá premiar cinco clientes. Que tipo de amostragem deverá ser utilizada para se obter os premiados? QUADRO 2 – POPULAÇÃO DE CLIENTES 01 Leonardo 09 Fabiano 17 Eric 25 Kátia 02 Renne 10 Shirlei 18 Paulo 26 Danielle 03 Mariana 11 Valeria 19 Renato 27 Andréa 04 Leandro 12 Neila 20 Antonio 28 Claudia 05 Jurandir 13 Jose Pires 21 Maria Tereza 29 Maristela 06 Fernando 14 Diego 22 Aparecida 30 Flavia 07 Luis Carlos 15 Emanuel 23 Alessandra 31 Renata 08 Fabio 16 Marcelo 24 Juliana 32 Sandra Referências • CRESPO, Antônio Arnot. Estatística Fácil. 19ª ed. São Paulo: Saraiva, 2009. • VIEIRA, Sonia. Introdução à bioestatística. 4ª ed. Rio de Janeiro: Elsevier, 2008. • CALLEGARI-JACQUES, Sidia M. Bioestatística Princípios e Aplicações. Porto Alegre: Artmed, 2003. Distribuição de Frequência Aula 02 – Bioestatística Professor: Éwerton Veríssimo Elementos de Distribuição de Frequência 45 Bioestatística - Módulo 1 • As distribuições de frequência são usadas principalmente para a apresentação de uma grande quantidade de dados. • Dados Brutos: conjunto de dados não ordenados. 168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166 169 180 175 164 181 179 172 169 174 171 178 166 183 159 168 176 188 165 172 170 166 189 172 185 168 163 188 195 182 176 174 182 Altura (em centímetros) dos atletas de um clube Elementos de Distribuição de Frequência • Rol: conjunto de dados ordenados. Exemplo: Teores de ácido palmítico (%) observados em 120 amostras de óleos vegetais, utilizadas em um estudo para comparar as características de óleos obtidos a partir de diferentes fontes. 46 Bioestatística - Módulo 1 Elementos de Distribuição de Frequência • Amplitude Total(R): é a diferença entre o valor máximo e o valor mínimo observados no conjunto de dados. – Exemplo- Para o conjunto de dados do exemplo anterior a amplitude total é: 9,3 3,8– 13,1 R 47 Bioestatística - Módulo 1 Elementos de Distribuição de Frequência • Número de Classes(k): Pode ser determinado de acordo com a expressão a seguir, denominada fórmula de Sturges, onde n é o número de observações, ou tamanho da amostra. )log(3,31 nk Elementos de Distribuição de Frequência – Exemplo de Número de Classes: uma distribuição de freqüências para os dados referentes ao teor de ácido palmítico , de acordo com a fórmula de Sturges, terá: 49 Bioestatística - Módulo 1 87,86 log(120) 3,3 1 k Elementos de Distribuição de Frequência • Amplitude de Classe (h): representa o tamanho das classes ou intervalos. Pode ser calculada por: – Exemplo: – Para os dados dos exemplos anteriores, a amplitude de classe é: k R h Amplitude Total Número de Classes 2,1 8 3,9 h Elementos de Distribuição de Frequência • Intervalos de Classe: os limites de cada classe podem ser definidos de quatro modos distintos. • 0 —10: compreende todos os valores entre 0 e 10, exceto os extremos. • 0 |— 10: compreende todos os valores entre 0 e 10, exceto o 10. • 0 |—| 10: compreende todos os valores entre 0 e 10, inclusive o 0 e o 10. • 0 —|10: compreende todos os valores entre 0 e 10, exceto o 0. 51 Bioestatística - Módulo 1 Elementos de Distribuição de Frequência • Para os dados utilizados como exemplo, as classes e intervalos são: Tabela: distribuição de frequência para os teores de ácido palmítico observados em amostras de óleos vegetais 52 Bioestatística - Módulo 1 Elementos de Distribuição de Frequência – Freqüência absoluta(fi): é o número de vezes que uma determinada característica ou valor numérico é observada. – Freqüência relativa(fr): Corresponde ao quociente entre a freqüência absoluta da classe e o total de elementos. 53 Bioestatística - Módulo 1 Elementos de Distribuição de Frequência – Frequência acumulada(fac): Corresponde à soma das freqüências de determinada classe com as anteriores. – Exemplo: A freqüência acumulada crescente da quarta classe, na distribuição mostrada na Tabela da amostras dos olhos vegetais é: 54 Bioestatística - Módulo 1 62 8 21 24 94 fac Elementos de Distribuição de Frequência • Ponto Médio de Classe(Xi): É a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 0|—10, teremos: 5 2 100 Ponto médio da classe Tipos de Distribuições de Frequências • Tipo A: Usada para variáveis qualitativas ou quantitativas discretas com poucos valores diferentes. As observações são representadas em uma tabela de freqüências, não agrupadas em classes. • Tipo B: Usada para variáveis quantitativas contínuas ou discretas com muitos valores diferentes, sendo as variáveis observadas representadas sob a forma de intervalos. Bioestatística - Módulo 1 56 Exercícios 1. Um professor anotou as notas de Matemática de uma classe de 30 alunos, obtendo os seguintes dados brutos (ainda não organizados): Agrupe os dados utilizando distribuição de frequência 57 Bioestatística - Módulo 1 Exercícios 2. Os valores abaixo relacionados em rol (estão organizados), representam as alturas dos 40 alunos de uma turma, em cm. Organizar uma distribuição de freqüências utilizando classes. 58 Bioestatística - Módulo 1 Agrupe os dados utilizando distribuição de frequência Exercícios 3. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na linha de produção e anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados: Bioestatística - Módulo 1 59 Agrupe os dados utilizando distribuição de frequência Referências • CRESPO, Antônio Arnot. Estatística Fácil. 19ª ed. São Paulo: Saraiva, 2009. • VIEIRA, Sonia. Introdução à bioestatística. 4ª ed. Rio de Janeiro: Elsevier, 2008. • CALLEGARI-JACQUES, Sidia M. Bioestatística Princípios e Aplicações. Porto Alegre: Artmed, 2003. Séries Estatísticas Aula 03 – Bioestatística Professor: Éwerton Veríssimo Séries Estatísticas - Introdução • Os dados coletados, na maioria das vezes, são extensos e desorganizados. Nesse sentido, faz-se necessário reunir os dados em tabelas, facilitando sua compreensão. • Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, local e espécie. Séries Estatísticas – Elementos de uma Tabela • Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo; • Cabeçalho: parte superior da tabela que especifica o conteúdo das colunas; • Coluna indicadora: parte da tabela que especifica o conteúdo das linhas; • Título: conjunto de informações que concede respostas às perguntas: O quê? ,Quando? ,Onde?; • Rodapé: situa-se na parte inferior da tabela e serve para indicar a fonte dos dados, as notas e as chamadas; Séries Estatísticas – Elementos de uma Tabela Séries Estatísticas - Classificação • Conforme varie um dos elementos da série(tempo, espaço ou espécie), podemos classificá-la em: – Histórica – Geográfica – Específica ou Categórica Séries Estatísticas - Classificação • Séries Históricas, Cronológicas, Temporais ou Marchas – Os valores da variável de estudo são referentes há um determinado local e distribuídos em intervalos de tempo variáveis. Séries Estatísticas - Classificação • Séries Geográficas, Espaciais, Territoriais ou de Localização – Os valores da variável de estudo são referentes há um determinado instante e distribuídos segundo os locais. Séries Estatísticas - Classificação • Séries Específicas ou Categóricas – Os valores da variável de estudo são referentes há um determinado instante e local e distribuídos segundo as especificações ou categorias. Séries Estatísticas - Classificação • Séries Conjugadas – Às vezes é necessário representar em uma única tabela a variação dos valores de mais de uma variável, ou seja, fazer uma conjugação de duas ou mais séries. Séries Estatísticas – Distribuição de Frequência • A distribuição de frequência é composta pelo agrupamento de dados em classes formadas pela repetição das freqüências. Diárias ($) Número de apartamentos 150 |--- 180 3 180 |--- 210 8 210 |--- 240 10 240 |--- 270 13 270 |--- 300 33 300 |--- 330 40 330 |--- 360 35 360 |--- 390 30 390 |--- 420 16 420 |--- 450 12 Total 200 Séries Estatísticas: Dados Absolutos e Relativos • Dados Absolutos: coletados direto da fonte, sem outra manipulação senão a contagem ou medida. • Dados Relativos: obtido por meio de comparações por quociente que se estabelecem entre dados absolutos. Os dados relativos são expressos, em geral, por meio de percentagens, índices , coeficientes e taxas. Dados Relativos - Percentagens • Os dados relativos são especificados segundo uma razão relativa ao total. • Exemplo: Ceará: Dados Relativos - Índices Dados Relativos - Coeficientes Dados Relativos - Coeficientes Exercícios • Classifique as Séries Estatísticas Exercícios • Classifique as Séries Estatísticas Exercícios • Classifique as Séries Estatísticas Referências • CRESPO, Antônio Arnot. Estatística Fácil. 19ª ed. São Paulo: Saraiva, 2009. • VIEIRA, Sonia. Introdução à bioestatística. 4ª ed. Rio de Janeiro: Elsevier, 2008. Gráficos Estatísticos Aula 04 – Bioestatística Professor: Éwerton Veríssimo Gráficos Estatísticos • Forma de apresentar dados estatísticos que promove uma compreensão mais rápida do fenômeno em estudo comparado a interpretação de séries. • A representação gráfica de um fenômeno deve obedecer certos requisitos: – Simplicidade – Clareza – Veracidade Gráficos Estatísticos • Gráfico em colunas ou em barras – Usado para representar geralmente variáveis qualitativas, sejam elas nominais ou ordinais. GráficosEstatísticos • Gráficos em colunas Gráficos Estatísticos • Gráfico em Barras Gráficos Estatísticos • Gráfico em colunas ou em barras múltiplas – Usado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Gráficos Estatísticos • Gráfico em Setores – Empregado quando desejamos comparar cada valor da série com o total. Gráficos Estatísticos • Gráfico em Setores – Cada setor é determinado por meio de uma regra de três simples e direta, lembrando o total da série corresponde a 360° Gráficos Estatísticos • Gráfico em Linha ou em Curva – Adequado para acompanhar a evolução temporal da variável, enfatizando sua tendência. Gráficos Estatísticos • Gráfico de Pontos – As variáveis quantitativas contínuas apresentam valores na maioria das vezes diferentes. – Os dados contínuos podem ser representados por meio de um gráfico de pontos. Gráficos Estatísticos • Gráfico Polar – Ideal para representar séries temporais cíclicas, como por exemplo: • Temperatura ao longo de um dia • Arrecadação da zona azul ao longo do dia • Consumo de energia elétrica durante um ano. • Número de passageiros de um linha de ônibus ao longo da semana. Gráficos Estatísticos • Gráfico Polar Gráficos Estatísticos • Histograma – Formado por um conjunto de retângulos justapostos. – Serve para representar a frequência de ocorrências de uma série expressa em números absolutos ou em porcentagens. – Na linha horizontal colocamos os valores da variável em estudo e na linha vertical, as frequências. Gráficos Estatísticos • Histograma Gráficos Estatísticos • Polígono de Frequência – O polígono de freqüências resulta da união dos pontos centrais no topo de cada barra do histograma. Desafio
Compartilhar