Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Bioestatística Eduardo Fernandes Santana Estatística no Dia a Dia 01 Cálculos de possibilidade de vitórias de um time num jogo de futebol. Estatística no Dia a Dia 01 Relação candidato-vaga de um vestibular ou concurso público. Estatística no Dia a Dia 01 Eleições. Estatística no Dia a Dia 01 Teste de DNA relativo à paternidade de uma criança tem estatisticamente 99% de probabilidade de confirmar quem é o verdadeiro pai. Estatística no Dia a Dia 01 Na Faculdade, nos cálculos de médias do semestre, ou ainda na média para prova final.. Estatística no Dia a Dia 01 Aceitação de um novo produto de mercado, através de pesquisas prévias. Estatística no Dia a Dia 01 Problemas de visão nos homens! Estatística no Dia a Dia 01 Estatística no Dia a Dia Problemas de visão nos homens! 100% dos homens não enxergam o gorila ao lado!!!! 01 Aplicações da Estatística ÁREA SOCIAL: Pesquisa de Opinião. ÁREA DE SAÚDE: Medicamentos Genéricos e Epidemias de doenças infecto contagiosas como a meningite. ÁREA INDUSTRIAL: Controle de Qualidade. ÁREA FINANCEIRA: Investimento no mercado financeiro. Conceito de Estatística Conceito de Estatística A palavra Estatística tem origem do latim, status (estado) - informações referentes ao Estado. Ferramenta ou método que ajuda na interpretação e análise de grandes conjuntos de números. Conjunto de instrumentos que podem ser utilizados para recolher, classificar, apresentar e interpretar conjunto de dados numéricos. Ciência que se preocupa com a Coleta, Organização, Descrição, Análise e Interpretação de Dados Experimentais.. A palavra Estatística tem origem do latim, status (estado) - informações referentes ao Estado. Ferramenta ou método que ajuda na interpretação e análise de grandes conjuntos de números. Conjunto de instrumentos que podem ser utilizados para recolher, classificar, apresentar e interpretar conjunto de dados numéricos. Ciência que se preocupa com a Coleta, Organização, Descrição, Análise e Interpretação de Dados Experimentais.. Conceito de Estatística Pesquisa Estatística Consiste em um trabalho de identificação, reunião, tratamento, análise e apresentação de informações (dados) para satisfazer certas necessidades. Pesquisas estatísticas são realizadas com os mais diversos objetivos, em áreas tão diversas quanto ciências médicas e biológicas, engenharias, ciências sociais e econômicas, turismo, esporte, ... Bioestatística Ciência que se preocupa com a organização, descrição, análise e interpretação de dados experimentais. Aplicação dos números para ilustrar a história natural de uma população. Ciência que trata com planos e métodos de coletas, tabulação e análise de fatos numéricos nas ciências da vida. conceitos Definição A bioestatística é a aplicação de estatística ao campo biológico e médico. Ela é essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa na área biológica e médica. É fundamental à epidemiologia, à ecologia, à psicologia social e à medicina baseada em evidência. A Bioestatística tem o objetivo de determinar se um fato na natureza ocorre por um fator determinado ou pelo mero acaso. Torna a suspeita de que evento clínico esta ligado a uma determinada patologia em evidência científica. Definição Bioestatística Conceitos Iniciais: População - Qualquer conjunto de informações que tenham entre si uma característica comum que delimite quais elementos pertencem a ela. Ex: população das pessoas com baixa estatura da cidade de Salvador. O tamanho de uma população habitualmente é representado pela letra N. Amostra - Subconjuntos representativos de uma população. É representado pela letra n. A amostra deve ser parecida com a população extraída , devendo obedecer aos seguintes princípios básicos: deve ser suficientemente grande; seus integrantes devem ter sido selecionados ao acaso. Seleção ao Acaso (random): Cada um dos componentes da população estudada tem a mesma chance de ser incluído na amostra; A inclusão de um membro não altera a chance de inclusão dos demais. Caso isso não ocorra, diz-se que a amostra é não randomizada ou viciada - biased. Bioestatística Bioestatística Tipos: Estatística Descritiva - Utilizada simplesmente para descrever dados, mostrando seus subtipos, sua distribuição, frequência.... Estatística Analítica ou Indutiva - Permite ao investigador ir além da descrição dos dados. Utilizada para comparar grupos e fazer generalizações a partir de resultados obtidos, fazendo inferências sobre a população com base nas amostras. Tipos de Dados A estatística engloba os métodos de coleta, resumo, análise e tirada de conclusões a partir dos dados. Variável/dados pertencerão a um de dois tipos: categóricos ou numéricos. Estatística Descritiva VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua ----------------------------------------- São representados por porcentagem -------------------------------------------------- São representados por média±desvio Padrão ou mediana (intervalo entre Quartis), etc Estatística Descritiva Dados Categóricos (Qualitativos) Dados Nominais - são dados que se definem exclusivamente por nomes (não são mensurados), sem qualquer ordem. Ex: grupo sanguineo (A, AB, B e O), estado civil (casado/viúvo/solteiro,etc), raça, sexo, cor dos olhos, via de parto... Podem ser codificados através de números: 1 = masculino 2 = feminino Os dados não são mensurados, simplesmente são contados! Descritos em termos de porcentagens e proporções e apresentados na forma de diagrama de barras, "pizzas". Estatística Descritiva Gráficos Dados Categóricos (Qualitativos) Dados Ordinais - são aqueles que se distribuem por categorias que tem uma ordem. Nesse tipo de dados não há valores intermediários entre as categorias e uma mesma diferença numérica não tem sempre o mesmo significado. Ex: Grau de dor (nenhuma, branda, leve, moderada, intensa), Escala de Apgar, de Glasgow, grau de Retinopatia... Podem ser descritas também por proporção e porcentagem! Estatística Descritiva Existe ainda uma classificação de dados categóricos conhecido como Variável Dicotômica ou Binária, quando possuem apenas duas variáveis ou duas possibilidades de resposta: sim ou não, por exemplo. Estatística Descritiva Nome - Fulano de Tal Sexo - Masculino Idade – 50 anos Etnia – caucasiano Tipo Sanguíneo – A Peso – 60 kg Creatinina - 0.8mg/Dl QUAIS SÃO DADOS CATEGÓRICOS? Estatística Descritiva Nome - Fulano de Tal Sexo - Masculino Idade – 50 anos Etnia – caucasiano Tipo Sanguíneo – A Peso – 60 kg Creatinina - 0.8mg/Dl QUAIS SÃO DADOS CATEGÓRICOS? Estatística Descritiva Nome - Fulano de Tal Sexo - Masculino Idade – 50 anos Etnia – caucasiano Tipo Sanguíneo – A Peso – 60 kg Creatinina - 0.8mg/Dl QUAIS SÃO DADOS NUMÉRICOS? Estatística Descritiva Nome - Fulano de Tal Sexo - Masculino Idade – 50 anos Etnia – caucasiano Tipo Sanguíneo – A Peso – 60 kg Creatinina - 0.8mg/Dl QUAIS SÃO DADOS NUMÉRICOS? Exemplo 1 - Uma indústria de calculadoras eletrônicas, preocupada com vários defeitos que um de seus produtos vem apresentando, fez um levantamento e constatou os seguintes problemas: A: Defeito na cobertura plástica; B: Defeito no teclado; C: Defeito na fonte de energia; D: Soldas soltas; E: Defeito na placa da unidade de processamento; F: Defeito no visor; G: Outros. Este é um típico exemplo de dados qualitativos nominais. Nesta situação, para cada item inspecionado, existe uma variável T que representa o tipo de defeito encontrado. Exemplo Tipo de Problemas (T) Frequência A 10 B 20 C 55 D 80 E 25 F 3 G 7 Exemplo Exemplo 2: Em um concurso público foram contabilizados os números de pessoas inscritas segundo os níveis de escolaridade: fundamental completo, médio completo, superior completo e pós-graduação completa. Segue abaixo a Tabela com os valores observados. Exemplo Nível de escolaridade Inscritos Fundamental completo 451 Médio completo 627 Superior completo 292 Pós-graduação completa 95 Exemplo Nível de escolaridade Inscritos Fundamental completo 451 Médio completo 627 Superior completo 292 Pós-graduação completa 95 Neste exemplo, temos um ordem natural entre os atributos (nível de escolaridade) e consequentemente, temos um exemplo de dados qualitativos ordinais. Apenas para relembrar... Temos... Estatística Descritiva Esses tipos de dados são fácies de serem descritos. Geralmente basta apresentar o seu número (valores absolutos) e distribuição (porcentagem por categoria). Podem ser representados através de diagramas de barras verticais (colunas) ou os chamados setoriais ("pizzas"). Descrevendo Dados Nominais e Ordinais Diagramas de barras verticais (colunas). Setoriais ("pizzas"). Distribuição da Turma por Grupo Sanguíneo e Fator rh Fator rh rh+ rh- Totais Grupo A B AB O Totais Descrevendo Dados Contínuos Esse tipo de dado pode ser trabalhado para gerar informações que expressem a tendência central e a dispersão. Descrevendo Dados Contínuos Medida de Tendência Central. Dá uma idéia de onde se localiza o centro, ou seja, o ponto médio de um determinado conjunto de dados. Dispersão. O modo como os dados se posicionam ao redor do ponto central de um determinado conjunto de dados. Descrevendo Dados Contínuos Dispersão Tendência Central Medidas de Tendência Central A Medida de Tendência Central dá uma ideia de onde se localiza o ponto médio (centro) de determinado conjunto de dados. Média; Mediana; Moda. Descrevendo Dados Contínuos Tendência Central Dada uma lista de números, uma média é um valor que pode substituir todos os elementos dessa lista sem alterar determinada característica da mesma. Tal característica deverá ser determinada através do enunciado ou do contexto do problema que desejamos resolver. De longe, a média aritmética é a mais conhecida e a mais utilizada, mas ela não é a única existente. A Média Aritmética é definida como a soma dos valores observados, dividida pelo número de observações. Descrevendo Dados Contínuos Medidas de Tendência Central Média Aritmética Descrevendo Dados Contínuos Medidas de Tendência Central Média Aritmética Habitualmente representada por X quando se trata de amostra e por µ quando se trata de populações. Valor que, uma vez ordenado todos os resultados, deixa igual número de resultados de cada lado. Descrevendo Dados Contínuos Medidas de Tendência Central Mediana (Md) Moda (Mo) A moda (Mo) é o valor que mais se repete, ou seja, o valor mais provável a ser escolhido. É a única medida de tendência central que pode ter mais de um valor, podendo ser o conjunto amodal, monomodal, bimodal... Considere os seguintes resultados brutos obtidos, componentes de uma determinada amostra: Descrevendo Dados Contínuos Medidas de Tendência Central 56 63 64 65 66 66 69 71 57 64 64 65 66 66 68 72 *Utilizou-se a média aritmética dos dois valores centrais, devido ao n ser um número par. n = 16 Σx = 1.042 X = 1.042/16 = 65,1 Md = 66 + 65/2 = 65,5* Mo = 66 Medidas de Dispersão ou Variabilidade As Medidas de Dispersão ou Variabilidade dão uma ideia de como os dados se posicionam ao redor do ponto central. É possível afirmar que, quanto menor a dispersão, os dados são mais homogêneos. As Medidas de Dispersão mais utilizadas são: Amplitude Total (range); Variância. Desvio Padrão; Descrevendo Dados Contínuos Dispersão Diferença entre o mais alto e o mais baixo valor observado na amostra/população estudada. Descrevendo Dados Contínuos Medidas de Dispersão Amplitude Total (Range) Variância e Desvio Padrão Em um conjunto de dados (com a média já calculada) observa-se que eles se distribuem ao redor desta média para mais e para menos. Quanto mais próximo da média estiverem, mais homogênio será o conjunto. Supondo que alguém queira avaliar a estatura dos alunos do curso de Fisioterapia desta IES, de um determinado semestre, que no momento da pesquisa seja composta de 11 alunos Descrevendo Dados Contínuos Medidas de Dispersão ESTATURA DOS ALUNOS 135 136 138 141 143 152 152 152 157 163 170 Média = 149 Mediana = 152 Valor Máximo = 170 Valor Mínimo = 135 Amplitude Total = 170 – 135 = 35 É necessário saber inicialmente quanto cada resultado se afasta da média. Como esses resultados se afastam para mais e para menos, são obtidos resultados positivos e negativos. Descrevendo Dados Contínuos Cálculo da Variância ESTATURA DOS ALUNOS 135 – 149 14 136 – 149 13 138 – 149 11 141 – 149 8 143 – 149 6 152 – 149 3 152 – 149 3 152 – 149 3 157 – 149 8 163 – 149 14 170 - 149 21 Observação Importante: É preciso elevar cada diferença ao quadrado; Esse artifício é utilizado na matemática pois caso fossem simplesmente somados os valores (positivos e negativos) eles se anulariam; E, se ainda fossem considerados apenas valores absolutos, o fato de um valor se situar para um lado ou para outro da média não teria a mínima importância. A Variância é calculada dividindo a soma dos quadrados obtida pelo seu tamanho. Descrevendo Dados Contínuos Cálculo da Variância (ESTATURA – MÉDIA)2 (-14)2 196 (-13)2 169 (-11)2 121 (-8)2 64 (-6)2 36 (3)2 9 (3)2 9 (3)2 9 (8)2 64 (14)2 192 (21)2 441 SOMA 1.314 VARIÂNCIA δ2 = 1.314/11 = 119,45 A Variância é calculada dividindo a soma dos quadrados obtida pelo seu tamanho. Descrevendo Dados Contínuos Cálculo da Variância (ESTATURA – MÉDIA)2 (-14)2 196 (-13)2 169 (-11)2 121 (-8)2 64 (-6)2 36 (3)2 9 (3)2 9 (3)2 9 (8)2 64 (14)2 192 (21)2 441 SOMA 1.314 VARIÂNCIA δ2 = 1.341/11 = 119,45 DESVIO PADRÃO O DP é a raiz quadrada da Variância. DP = = 10,92 119,45 Descrevendo Dados Contínuos Cálculo da Variância VARIÂNCIA DA AMOSTRA δ2 = 1.341/11-1 = 131,40 DESVIO PADRÃO DA AMOSTRA O DP é a raiz quadrada da Variância. DP = = 11,43 131,40 Observação Importante: Caso esses alunos fossem uma amostra de uma certa população, seria necessário um ajuste matemático, pois os valores das amostras estão mais próximas das médias das amostras do que realmente ocorre na população, onde valores extremos são mais fácies de ocorrer; Condicionou-se, através de cálculos matemáticos, que deve-se subtrair “1” do denominador (amostra) para melhor estimar o DP de uma população. Supondo que os dados avaliados fossem amostra de uma população de alunos desta IES, os cálculos ficariam da seguinte forma: Coeficiente de Variação A magnitude do Desvio Padrão depende da unidade de medida de uma variável particular e, assim, um Desvio Padrão medido em dias será numericamente muito maior do que o mesmo desvio medido em meses. O Coeficiente de Variação expressa o Desvio Padrão com porcentagem do valor da média. O Coeficiente de Variação independe da unidade de medida usada! Permite comparar dispersões de dados entre estudos onde foram usadas unidades de medidas diferente: polegadas e centímetros, por exemplo Coeficiente de Variação Coeficiente de Variação igual a 100% indica que o DP é igual a média; quanto menor ele for, mas homogênea será a amostra. Menor ou igual a 15% - Baixa dispersão – homogênea, estável. Entre 15% e 30% - Média dispersão. Maior que 30% - Alta dispersão, heterogênea. Coeficiente de Variação Exemplo: Considere as notas da primeira Verificação de Aprendizagem duas turmas de Bioestatística do Curso de Fisioterapia (6AM e 6ÄN): TURMA NÚMERODE ALUNOS NOTA MÉDIA DESVIO PADRÃO COEFICIENTEDE VARIAÇÃO PSICOLOGIA[M] n 5 4 80% PISCICOLOGIA[N] n 40 4 10% Ao se interpretar esses valores, pode-se afirmar quê: Na primeira distribuição, em média, os desvios relativamente à média atingem 80% do valor desta. Na segunda distribuição, porém, a distribuição dos desvios relativamente à média atingem em média 10%. As percentagens mostram os pesos dos DP sobre a distribuição. Distribuição de Frequências EX: Rendimento dos alunos de bioestatística (NASSAU) – primeira avaliação. Organização dos dados brutos de forma tabular; Utilizar intervalos e frequências de forma a condensar os dados de forma a tornar a análise mais fácil. Distribuição de Frequências NOTA NÚMERO DE ALUNOS 0 5 1 1 2 2 3 4 5 3 6 3 7 4 8 2 9 1 10 1 CATEGORIA FREQUÊNCIA 0 –3 12 4 – 6 7 7– 10 8 CATEGORIA FREQUÊNCIA % 0 –3 12 44,5 4 – 6 7 25,9 7– 10 8 29.6%
Compartilhar