Baixe o app para aproveitar ainda mais
Prévia do material em texto
CURSO DE FARMÁCIA ITES INSTITUTO TAUBATÉ DE ENSINO SUPERIOR AULA 1 CONCEITOS FUNDAMENTAIS Profa Msc Simone Carolina S. Petri e Silva BIOESTATÍSTICA INTRODUÇÃO À ESTATÍSTICA PARTE A CLASSIFICAÇÃO • A estatística pode ser classificada em: - Descritiva: é a parte que se ocupa da organização, sumarização e apresentação dos gráficos. - Indutiva: é a parte que se ocupa dos métodos utilizados para a obtenção de conclusões sobre uma população, segundo informações oriundas de uma amostra da população. •A Estatística Descritiva visa organizar, resumir e apresentar dados, utilizando recursos como tabelas e gráficos. •Além disso, fornece valores de parâmetros como médias, medianas, desvios padrões e outros, calculados a partir dos dados. ESTATÍSTICA DESCRITIVA •População – é o conjunto completo de todos os elementos que constituem o sistema em estudo. •Ou seja, o conceito de população inclui a totalidade de medições, resultados, observações ou outros itens considerados em determinadas análise estatística. ESTATÍSTICA DESCRITIVA •Amostra – é um subconjunto de uma população. “A Estatística Descritiva estabelece relações matemáticas que permitem descrever o conjunto de dados representados pela amostra.” ESTATÍSTICA DESCRITIVA 1. Deseja-se determinar a altura média dos 60 alunos que formam uma turma do 2º ano de Engenharia de uma universidade. •Nesse caso, podem ser medidas as alturas de todos os 60 alunos da turma e a altura média calculada, proveniente dos dados de toda população estudada, corresponde a um “valor verdadeiro”. EXEMPLOS 2. Deseja-se determinar a altura média de todos os alunos que cursam Engenharia na referida universidade. •Nesse caso, a população será composta pelos alunos de todas as turmas de Engenharia (do 1º ao 5º ano) e a turma do 2º ano de Engenharia constitui uma amostra da população. EXEMPLOS DADOS OU VARIÁVEIS São informações obtidas a partir de medições de grandezas, resultados de pesquisas, respostas a questionários ou contagens em geral. DADOS OU VARIÁVEIS •CLASSIFICAÇÃO •Quantitativos - compostos de informações são numéricas, classificadas em categorias. Exemplos: - Cor dos olhos (azuis, verdes, castanhos, etc.); - Sexo (feminino ou masculino); - Tipo sanguímeo (A, B, AB ou O); - Religião praticada; - Etc. DADOS OU VARIÁVEIS •CLASSIFICAÇÃO •Quantitativos Ordinais – compostos de informações ordenadas em escalas do tipo 1, 2, 3,... Ou A, B, C,.... Exemplos: - Avaliação de uma prova com conceitos (A, B, C, D ou E); - Classificação dos pilotos em uma competição automobilística de acordo com a ordem de chegada; - Etc. DADOS OU VARIÁVEIS •CLASSIFICAÇÃO •Qualitativos Métricos – compostos de informações obtidas por medições de grandezas. Exemplos: •Estatura •Peso •Volume •Área •Comprimento •Etc. DADOS OU VARIÁVEIS •CLASSIFICAÇÃO • Dados de frequência – compostos de informações a respeito do número de elementos pertencentes a uma dada categoria. Exemplos: - Número de habitantes por região do país; - Número de usuários de internet por faixa etária; - Número de eleitores do sexo feminino e do sexo masculino; - Etc. RESOLUÇÃO DE LISTA DE EXERCÍCIOS 1 PARTE A: Introdução à Estatística NATUREZA DOS DADOS PARTE B NATUREZA DOS DADOS 1. Variáveis e Dados •Variável é a característica de interesse medida em cada elemento da amostra ou da população. Variáveis podem ter valores numéricos ou não numéricos (por exemplo, idade, sexo, tipo sanguíneo). NATUREZA DOS DADOS 1. Variáveis e Dados •Dados são informações obtidas quando se mede uma variável. Por exemplo, na tabela abaixo, 32 anos é um dado para a variável idade e feminino é um dado para a variável sexo. NATUREZA DOS DADOS 1. Variáveis e Dados Paciente Idade Sexo Grupo Sanguíneo Paciente 1 45 M A Paciente 2 32 M O Paciente 3 18 F B NATUREZA DOS DADOS 2. Tipos de Variáveis Variáveis Qualitativas/ Categóricas Variáveis Quantitativas/ Numéricas Nominal Valores em categorias arbitrárias (sem unidade) Ordinal Valores em categorias ordenadas (sem unidade) NATUREZA DOS DADOS 2.A. Tipos de Variáveis – Variáveis Nominais •É aquela cujos dados se enquadram em categorias que não podem ser colocadas em ordem numérica. Exemplo: tipo sanguíneo. NATUREZA DOS DADOS 2.A. Tipos de Variáveis – Variáveis Nominais • Essa configuração de tabela é chamada de tabela de frequência. Mostra o número ou a frequência dos tipos de sangue é distribuído em 4 categorias. •Os dados não têm quaisquer unidades de medida. NATUREZA DOS DADOS 2.A. Tipos de Variáveis – Variáveis Nominais •A ordenação das categorias é completamente arbitrária. Pertencer a uma categoria não significa ter maior importância do que à outra. •Quando uma variável nominal têm 2 possibilidades, ela é dita dicotômica ou binária – muito utilizadas na Epidemiologia. NATUREZA DOS DADOS Tipo sanguíneo de 100 pacientes (dados hipotéticos) Grupo Sanguíneo Número de Pacientes O 65 A 15 B 12 AO 8 Total 100 NATUREZA DOS DADOS 2.B. Tipos de Variáveis – Variáveis Ordinais •É dita ordinal quando há uma ordem inerente ou uma hierarquia entre as categorias. Exemplo: Escala de Coma de Glasgow (ECG) – uma variável categórica ordinal. Essa escala mede o grau de comprometimento cerebral. NATUREZA DOS DADOS 2.B. Tipos de Variáveis – Variáveis Ordinais •As variáveis ordinais tem duas características importantes. - A- Os dados não têm quaisquer unidades de medida (do mesmo modo que as variáveis nominais); - B- A ordenação das categorias não é arbitrária, como nas variáveis nominais. Assim, é possível ordenar as categorias de uma forma lógica, com sentido. Distribuição dos escores da Escala de Coma de Glasgow em 90 pacientes com traumatismo craniano Escala de Coma de Glasgow Número de Pacientes 3 8 4 1 5 6 6 5 7 5 8 7 9 6 10 8 11 8 12 10 13 12 14 9 15 5 Total 90 NATUREZA DOS DADOS 2. Tipos de Variáveis Variáveis Qualitativas/ Categóricas Variáveis Quantitativas/ Numéricas Discreta Valores inteiros em ordem numérica (unidade de contagem) Contínua Valores contínuos em ordem numérica ou escala (unidade de medida) NATUREZA DOS DADOS 2.C. Tipos de Variáveis – Variáveis Numéricas Contínuas •São aquelas que podem assumir qualquer valor dentro de um intervalo de números reais, dependendo da precisão do instrumento de medição. NATUREZA DOS DADOS 2.C. Tipos de Variáveis – Variáveis Numéricas Contínuas •Podem ser de 2 tipos: intervalar ou de razão. A diferença entre elas está na presença do zero absoluto que existe na variável de razão – entretanto, o tratamento estatístico é o mesmo. NATUREZA DOS DADOS 2.C. Tipos de Variáveis – Variáveis Numéricas Contínuas a)As variáveis numéricas contínuas podem ser adequadamente mensuradas e têm unidades de medida. b)Elas produzem dados que são números reais (podem ser escritos em uma sequência numérica) NATUREZA DOS DADOS 2.C. Tipos de Variáveis – Variáveis Numéricas Contínuas Peso de seis pacientes (dados hipotéticos) Paciente Sexo Peso (Kg) 1 F 68,25 2 M 80,63 3 F 75,00 4 F 71,21 5 F 73,44 6 F 76,98 NATUREZA DOS DADOS 2.D. Tipos de Variáveis – Variáveis Numéricas Discretas •É dita como discreta quando apenas se pode quantificar os resultados possíveis por meio do processo de contagem. •Dados numéricos discretos provêm geralmente de contagem. Os dados obtidos são números reais e são invariavelmente números inteiros. NATUREZA DOS DADOS 2. Tipos de Variáveis – Variáveis Numéricas Discretas •Podem ser colocados em sequência numéricae têm as mesmas propriedades e de razão dos dados numéricos contínuos. NATUREZA DOS DADOS 2. Tipos de Variáveis – Variáveis Numéricas Discretas a) Podem ser contadas e têm unidades de medidas – “número de elementos” b) Produzem dados que são números reais que podem ser colocados em sequência numérica. NATUREZA DOS DADOS 3. Como identificar o tipo de variável? •Para identificar se os dados são numéricos é verificar se eles têm unidades ligadas a eles: mm, g, m3, número de mortes, etc. •Se não, podem ser ordinais ou nominais. A variável apresenta unidades (incluir “número de coisas”) Não Sim Os dados podem ser colocados em ordem? Os dados foram obtidos por medição ou contagem? Ordinal Sim Não Nominal Contínua Discreta Contagem Medição RESOLUÇÃO DE LISTA DE EXERCÍCIOS 1 PARTE B: Natureza dos Dados DESCREVENDO OS DADOS: TABELAS PARTE C TABELAS •Tabelas de frequência para variáveis nominais - É a tabela mais utilizada para descrever os dados. - A ordenação das categorias nominais é arbitrária TABELAS •Tabelas de frequência para variáveis nominais Distribuição da frequência em puérperas do Hospital Geral de Caxias do Sul (RS), em 2008 Tipo Frequência Não drogaditas 904 Medicamentos 23 Álcool 17 Crack 2 Cocaína 1 Total 947 TABELAS •Tabelas de frequência para variáveis nominais – frequência relativa Distribuição da frequência de drogadição em puérperas di Hospital Geral de Caxias do Sul (RS), em 2008 TIPO FREQUÊNCIA FREQUÊNCIA RELATIVA Não drogaditas 904 95,5 Medicamentos 23 2,4 Álcool 17 1,8 Crack 2 0,2 Cocaína 1 0,1 Total 947 100 TABELAS •Tabelas de frequência para variáveis ordinais •Quando a variável não é ordinal, podemos alocar os dados em categorias ordenadas. TABELAS •Tabelas de frequência para variáveis ordinais Distribuição da frequência do Escore de Apgar no 5º minuto, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008 ESCORE FREQUÊNCIA FREQUÊNCIA RELATIVA <5 2 0,2 5 a 7 31 3,2 >7 940 96,6 Total 973 100 TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas •A abordagem mais útil com dados numéricos contínuos é agrupá-los em primeiro lugar e após construir uma distribuição de frequência dos dados agrupados. TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas •Procura-se agrupar os dados, se possível, grupos de igual amplitude. Assim é possível produzir uma distribuição de frrequências dos dados agrupados. • Isso só é interessante se houver quantidade suficiente de dados (>30). TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas Distribuição dos valores do VEF1 de 42 escolares asmáticos no início do tratamento, no Ambulatório de Doenças Respiratórias Pediátricas (Adrep), Caxias do Sul (RS), em 1998 VEF1 (L) f fr(%) Fr(%) 0,61 – 0,80 6 14,3 14,3 0,81 – 1,00 15 35,7 50,0 1,01 – 1,20 9 21,4 71,4 1,21 – 1,40 10 23,8 95,2 1,41 – 1,60 1 2,4 97,6 1,61 – 1,80 1 2,4 100,0 Total 42 100 TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas (Grupos Abertos) •Um problema surge quando um ou dois valores estão muito distantes da massa geral dos dados, seja muito menor ou muito maior. TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas (Grupos Abertos) •Esses valores são chamados de atípicos ou outliers. Sua presença pode significar ter uma grande quantidade de linhas vazias ou quase vazias em uma ou ambas as extremidades da tabela de frequência. TABELAS •Tabelas de frequência para variáveis numéricas – variáveis contínuas (Grupos Abertos) Distribuição dos valores do VEF1 de 42 escolares asmáticos no início do tratamento, no Ambulatório de Doenças Respiratórias Pediátricas (Adrep), Caxias do Sul (RS), em 1998 VEF1 (L) f fr(%) Fr(%) 0,61 – 0,80 6 14,3 14,3 0,81 – 1,00 15 35,7 50,0 1,01 – 1,20 9 21,4 71,4 1,21 – 1,40 10 23,8 95,2 1,41 – 1,60 1 2,4 97,6 >1,61 1 2,4 100,0 Total 42 100 TABELAS •Tabelas de frequência para variáveis numéricas – variáveis discretas •O número de possíveis valores que a variável pode assumir é, muitas vezes, limitado. •No entanto, se necessário, os dados podem ser agrupados exatamente da mesma maneira que para os dados contínuos. TABELAS •Tabelas de frequência para variáveis numéricas – variáveis discretas Distribuição das consultas de gestantes durante o pré-natal, no Hospital Geral de Caxias do Sul (RS), em 2008. Número de Consultas f fr(%) Fr(%) 0 a 5 214 24,3 24,3 6 a 10 543 61,6 85,9 >10 125 14,1 100 Total 882 100 TABELAS •Tabelas Cruzadas •Em uma tabela cruzada, pode-se apresentar o percentual de três maneiras: 1. Por linha 2. Por coluna 3. Por total TABELAS •Tabelas Cruzadas Associação entre baixo peso ao nascer e tabagismo materno em gestações a termo, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008. Tabagismo Peso de nascimento Total <2.500g ≥2.500g Sim 15 (7,9%) 175 (93,1%) 190 (100%) Não 23 (2,4%) 651 (96,6%) 674 (100%) Total 38 (4,4%) 826 (95,6%) 864 (100%) RESOLUÇÃO DE LISTA DE EXERCÍCIOS 1 PARTE C: Descrevendo os Dados - Tabelas DESCREVENDO OS DADOS: GRÁFICOS PARTE D INTRODUÇÃO A escolha adequada do tipo de gráfico ajuda a descrever os dados e visualizar as informações de maneira clara. O que é adequado depende, principalmente, do tipo de dados, bem como as características particulares do que se quer explorar. DESCREVENDO OS DADOS: GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS PARTE D.1 GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de setores ou pizza GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de setores ou pizza Cada segmento (fatia) do gráfico deve ser proporcional à frequência da categoria representada. A desvantagem desse gráfico é que ele só pode representar uma variável. GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de setores ou pizza O gráfico de pizza pode perder clareza se for usado para representar mais do que 4 ou 5 categorias. Não é utilizado em artigos científicos ou relatórios – como regra, não se deve utilizar gráfico de pizza. GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de setores ou pizza GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras É um gráfico que costuma apresentar a frequência no eixo vertical e a categoria no eixo horizontal. O gráfico simples é apropriado para apenas 1 variável. GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras GRÁFICOS PARA DADOS ORDINAIS E NOMINAIS •Gráfico de barras DESCREVENDO OS DADOS: GRÁFICOS PARA DADOS NUMÉRICOS E DISCRETOS PARTE D.2 GRÁFICOS PARA DADOS NUMÉRICOS DISCRETOS •Histograma Parecido com o gráfico de barras, não possui qualquer espaço entre as barras adjacentes. Enfatiza natureza contínua da variável. GRÁFICOS PARA DADOS NUMÉRICOS DISCRETOS •Histograma Uma limitação é que ele pode representar apenas uma variável de cada vez e isso torna difícil a comparação entre dois histogramas – um irá sobrepor o outro. GRÁFICOS PARA DADOS NUMÉRICOS DISCRETOS DESCREVENDO OS DADOS: DADOS CUMULATIVOS PARTE D.3 DADOS CUMULATIVOS É possível representar graficamente dados ordinais cumulativos ou dados numéricos discretos cumulativos por meio de um gráfico por etapas. A altura total de cada etapa acima do eixo horizontal representa a frequência cumulativa até a categoria. A altura decada etapa individual é a frequência da categoria. DADOS CUMULATIVOS DADOS CUMULATIVOS RESOLUÇÃO DE LISTA DE EXERCÍCIOS 1 PARTE D: Descrevendo os Dados - Gráficos TÉCNICAS DE AMOSTRAGEM PARTE E INTRODUÇÃO É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. As técnicas de amostragem, tal como o planejamento amostral, são amplamente utilizados nas pesquisas científicas e de opinião para se conhecer alguma característica da população. INTRODUÇÃO • Nos planejamentos amostrais, a coleta dos dados deve ser realizada observando-se uma metodologia adequada para que os resultados possam ser extrapolados para a população como um todo. • Esse processo de extensão dos resultados para a população é o que, na estatística, chamamos de INFERÊNCIA. •Parâmetro: é uma característica fixa e desconhecida da população a qual se tem interesse em estudar. •Os parâmetros representam quantidades numéricas que podem ser interpretadas pelo pesquisador, como por exemplo: média; proporção; variação; taxa de crescimento; etc... •Estimativa: valor calculado a partir dos dados obtidos pela amostra para se estimar o valor desconhecido do parâmetro. •Unidade amostral: é o indivíduo (ou elemento) da população amostral sobre o qual a medida de interesse será observada. •As unidades amostrais podem ser os próprios elementos da população amostral ou podem ser formadas por grupos de elementos, compondo o que será chamado de conglomerado. •Conglomerados podem ser formados por: - quarteirões; - ruas (face dos quarteirões); - departamentos; - prateleiras; - caixas; - lotes de produtos; - etc... •Sistema de referência: é uma listagem completa de todos os unidades da população amostral (aptas a serem selecionadas na amostra); •Amostragem probabilística: é a pesquisa por amostragem realizada segundo critérios bem definidos da teoria estatística das probabilidades. •Na amostragem probabilística todas as unidades da população amostral devem ter a mesma probabilidade de serem selecionadas. •Por que fazer amostragem ao invés de um censo? - Vantagens da pesquisa por amostragem em relação ao censo: a) é mais barata; b) é mais rápida; c) é mais fácil de ser controlada por envolver operações menores. - Desvantagens da pesquisa por amostragem em relação ao censo: a) o censo pode ser mais vantajoso quando a população é pequena e/ou as informações são de fácil obtenção. b) os resultados da pesquisa por amostragem carregam erro; c) se a população for muito heterogênea o erro pode ser muito grande (e a precisão muita baixa). •Neste caso pode ser necessária uma amostra muito grande; PLANOS PARA AMOSTRAGEM •Unidade amostral: indivíduos ou grupos de indivíduos (conglomerados); •Sistema de referência: lista completa das unidades amostrais. •N = tamanho da população, é definido pelo número de indivíduos da população amostral; •n = tamanho da amostra, definido pelo número de indivíduos selecionados na amostra. PLANOS PARA AMOSTRAGEM •Fatores que interferem na escolha do Plano Amostral: - Tamanho da população N; - Custo; - Heterogeneidade da população; •Os elementos da amostra devem ser selecionados da população amostral segundo alguma forma de sorteio. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: A) Amostragem Aleatória Simples (A.A.S.) •Na A.A.S., a amostra de tamanho n é selecionada ao acaso dentre os N elementos da população amostral. •Procedimento de sorteio: - Um indivíduo é selecionado ao acaso dentre os N possíveis; - O segundo indivíduo é selecionado ao acaso dentre os (N – 1) restantes... - . . . e assim por diante, até que todos os n indivíduos sejam sorteados. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: A) Amostragem Aleatória Simples (A.A.S.) - Esse procedimento tem a característica de ser “sem reposição”, o que significa que: cada indivíduo aparece uma única vez na amostra. - Procedimentos “com reposição”, quando o indivíduo pode aparecer mais de uma vez na amostra, não serão abordados por serem poucos comuns na prática. •Obs: Quando o tamanho da população for muito grande, os dois procedimentos de sorteio (sem e com reposição) são equivalentes. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: B) Amostragem Aleatória Estratificada (A.A.E.) •Quando a população é muito heterogênea, ou seja, quando as características observadas variam muito de um indivíduo para outro, é aconselhável subdividir a população em estratos homogêneos. •A população é dividida em k estratos sendo que, uma A.A.S. é aplicada em cada um dos deles. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: B) Amostragem Aleatória Estratificada (A.A.E.) •Obs: A A.A.E. produz resultados mais precisos do que a A.A.S. com o mesmo tamanho de amostra. •É mais cara, por segmentar a população. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: •C) Amostragem Aleatória por Conglomerados (A.A.C.) - Na amostragem por conglomerados os elementos da população são agrupados em conglomerados ou clusters (grupos), que serão as unidades amostrais a serem selecionadas. - A divisão deve ser feita de forma que os conglomerados tenham as mesmas características da população. PLANOS PARA AMOSTRAGEM •Os Planos de Amostragem mais comuns são: •D) Amostragem Sistemática - É aplicada de forma sistemática, tendo em mão um sistema de referência de fácil acesso. - Na amostragem sistemática além da facilidade de acesso ao sistema de referência, a informação a ser coletada também é de fácil acesso. - Fichas de cadastro de assinantes (revistas, provedores de acesso à internet, serviço telefônico, etc...); cadastro de funcionários; peças numa linha de produção; mudas num canteiro; etc... RESOLUÇÃO DE LISTA DE EXERCÍCIOS 1 PARTE E: Técnicas de Amostragem
Compartilhar