Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Logarítimo natural (nipeniano) Relembrando a ordem : (2+2) x 4 – 3 (1+1)² x 2 – 3 / 3 4 x 4 – 3 2 x 2 – 3 / 3 16 – 3 = 13 4 x 2 – 3 / 3 8 – 1 = 7 Ordem de ações dentro de uma equação Parenteses > potência / raiz > divisão / multiplicação > soma / subtração O produto ou divisão de 2 numeros negativos dará positivo (- / +) = - | (-/-) = + | (- /-/- ) = - | (+ /+) = - Processo de pesquisa Importância da pesquisa Coleta de dados Análise para ser feita a conclusão Como responder uma pergunta interessante ? Iniciar com uma observação que você quer entender. Essa observação pode ser trivial ou pode ser baseada em alguns dados A partir da observação inicial você gera explicações ou teorias Para essas explicações você gera hipóteses Para testar suas hipóteses você precisa de dados DADOS ------------------- OBSERVAÇÃO INICIAL GERAÇÃO DE UMA TEORIA IDENTIFICAR VARIÁVEIS --------------- GERAÇÃO DE UMA HIPÓTESE MENSURAR VARIÁVEIS --------------- COLETAR DADOS PARA TESTAR A HIPÓTESE GRÁFICOS MODELOS ------------ ANALISAR OS DADOS Vários objetos científicos começam pela observação do mundo real e o questionamento de por que aquilo ocorre . Feita uma observação para avaliar se aquela teoria é verdadeira ou não , é preciso coletar dados. E para tal são necessários algumas variáveis que haja interesse em medir Gerando uma teoria e testando – as Teoria : explicação para os dados observados Hipóteses : uma predição a partir de uma teoria 1) Por que existem tantos participantes com personalidades desagradáveis no BBB ? A razão do numero de pessoas narcisistas selecionadas para o programa será maior do que a razão do numero de narcisistas inscritos. A razão do numero de pessoas narcisistas que se candidata ao programa é maior que o numero de narcisistas na população geral (1%) Não narcisistas Narcisistas Total Selecionados 3 9 12 Rejeitados 6805 845 7650 Total 6808 854 7662 Narcisistas = 854 / 7662 = 0,11 % > 1% Narcisistas = 9/12 = ¾ = 0,75% >>> 1% 2) Os Beatles são a banda mais influente da história / Os Beatles são a banda que mais vendeu discos na história A maioria das hipóteses pode ser expressa em termos de duas variáveis Variável : algo que pode mudar entre as pessoas ,locais ou tempo Variáveis categóricas > nominal : espécie e sexo ; Ordinal : 1º ,2º , 3º Variáveis numéricas : continuas e discretas Variável causa e Variável consequência / Variavel dependente e Variável independente Os Beatles : variável independente ( razão) Os discos : variável causa (consequência) Existe efeito de quantidade de horas dormidas no desempenho acadêmico ? Quantidade de horas dormidas (variável numérica continua e independente) Quantidade acadêmica (variável dependente e numérica continua) Conceito de erro :Em medição ,erro é a variação obtida em relação ao resultado real Conceito de validade : O instrumento mede o que ele realmente diz que mede Confiabilidade : O instrumento pode gerar resultados consistentes em diferentes situações Análise : representação gráfica ,forma de apresentar e resumir os dados coletados Distribuição de frequência : quantas vezes um valor ocorre ? - Frequência absoluta : 1,67 M = 5 (apareceu 5x no gráfico) - Frequência relativa ao total 1,67 M = Nº de vezes 1,67 apareceu = 5 / total de observação 24 – 5/24 = 0,2083 MEDIDAS CENTRAIS DE DISTRIBUIÇÃO Moda : o valor mais frequente no conjunto de dados Mediana : valor central de um conjunto de dados em ordem crescente ou decrescente. Fica entre o numéro que ocupa a 12ª posição e a 13ª 1,54 ; 1,55 ; 1,57 – 1,57 – 1,57 ; 1,58 ; 1,60 ; 1,63 ; 1,65 – 1,65 ; 1,66 ; 1,67 – 1,67 – 1,67 – 1,67 – 1,67 ; 1,68 ; 1,69 – 1,69 – 1,69 ; 1,70 ; 1,80 ; 1,85 Para um conjunto de nº par : N=24 = 12ª posição 2 2 12ª esquerda –direita + 12ª direita – esquerda / 2 1,66 + 1,67 /2 = 1,665 1,67 N+1 = 24+1 = 25 = 12,5 2 2 2 Para um conjunto de nº ímpar N+1 = 23+1 = 24 = 12² 2 2 2 Média : somar todos os valores e dividir pelo total de observações M (1,54 + 1,55 + ...1,85) / 24 39,59 / 24 = 1,6495 1,65 A média sofre influencia de valores extremos ,tanto muito altos quanto muito baixos.MÉDIA 20+20+24+25+28+29+30+32+35 /9 = 27 25 , 20 ,30 , 28 , 32 ,24 , 35 , 29 , 30 – MODA É O 30 , é quem aparece mais vezes MEDIANA 20 ,20 ,24 ,25 , 28 ,29 ,30 ,32 ,25 N+1 /2 9+1 /2 = 5º posição Medidas de variação – dispersão Amplitude : maior valor – menor valor 35 – 20 = 15 anos (tem sempre que ter a unidade) Amplitude interqualitica - quartil são valores que dividem os dados em 4 partes iguais - IQR = 3º quartil – 1º quartil - Q3 – Q1 = 31-22 = 9 Calculo de amplitude interqualitica 1 – ignorar a mediana em ambas as metades IQR = 9 2 – considerar a mediana em ambas as metades N=5 5+1 /2 = 3 24 é a mediana da primeira metade / 30 é a mediana da segunda metade 24-30 = 6 IQR =6 3- a amplitude interqualitica será uma média das estratégias 1 e 2 IQR 9+6 /2 = 7,5 Desvio padrão VALOR OBSERVADO MÉDIA – na média subtrai o valor observado – o valor da média ERRO ERRO² SQE = SOMA DO QUADRADO DOS ERROS 20 27 -7 49 20 -7 49 24 -3 9 25 -2 4 28 1 1 29 2 4 30 3 9 32 5 25 35 8 64 TOTAL : 214 Variância – grau de liberdade SQE /GL 214 / N-1 214 / 8 Variância 26,75 anos ² Ѵ 26,74 = 5,17 anos . Caracteristicas dos dados Medida estatística Quando usar Centrais Média Ausência de outliers Centrais Mediana Possiveis outliers Variabilidade DP Amostra grande - ausencia de outliers Variabilidade IQR Possiveis outliers Variabilidade Amplitude Usar com atenção Testes de hipótese Objetivo : fornecer ferramentas que nos permitam validar ou refutar uma hipótese especifica (Ho) ,tendo como base as informações de uma determinada amostra Ho = hipotese nua - sinal de igualdade Ha = hipótese alternativa - sinal de diferença Clareza no objetivo da pesquisa Formulação das hipóteses nula e alternativa Calculo da medida de afastamento de hipotese nula Clareza no objetivo da pesquisa Formulação da hipóteses nula e alternativa Calculo da medida de afastamento da hipótese nula Nível de significância Chance de erro Significância = 0,005 5% P= chance de erro Trabalhando com variáveis categóricas Graúda x não graúda ; PT x psdb x pmbd ; benigno x maligno O que interessa é a frequência Com variáveis categóricas não podemos usar a média , porque a média de uma variável categórica não possui sentido : os valores são arbitrários e dependerão de quantos membros uma categoria possui . Portanto , o interesse é analisar a frequência do acontecimento ou não acontecimento de um dado evento Situação mais simples Quantificar a relação entre 2 variaveis categóricas . Ex: um treinador de cães resolveu avaliar se existia relação / associação entre o tipo de treinamento utilizado e se os cães aprenderam ou não um comportamento especifico . Avalie 2 que conclusão é possível chegar . Considera = 0,005 TREINAMENTO UTILIZADO DANÇAR COMIDA AFETO TOTAL Sim 28 48 28+48 = 76 Não 10 114 10 +114= 124 O somatório de linhas e colunas deve ser igual , então : 28 + 48 = 76 10 +114 = 124 76+124 = 200 28+ 10 = 38 114+ 48 = 162 38 + 162 = 200 Frequencia Esperada Comida Afeto Sim 76 x 38 / 200 76 x 162 /200 Não 124 x 38 /200 124 x 162 /200 76 x 38 / 200 = 14, 44 76 x 162 / 200 = 61,56 124 x 38 / 200 = 23,56 124 x 162 / 200 = 100,44 Teste do chi quadrado ( x²) X² = £ (frequência observada – frequência esperada / frequência esperada)X² = £ (28 – 14, 44² / 14,44 ) + (48- 61,56² / 61,56) + (10 – 23,56 ² / 23,56) + (114 – 100,44² / 100,44) A² = ( 13,56²/ 14,44) + (13,56²/ 61,56) + (13,56² / 23,56) + (13,56²/ 100,44) X² = 183,87 / 14,44 + 183 ,87 /61,56 + 183, 87 / 23,56 + 183,87 /100,44 R = 12 , 73 + 2,99 + 7,80 + 1,83 = 23,35
Compartilhar