Baixe o app para aproveitar ainda mais
Prévia do material em texto
Testes de Hipóteses Genéticas Alan Silva Doutorando PPG-GEN alanbio@gmail.com AU05 Resumo Determinação da herança de características a partir da formulação e testes com hipóteses em Genética; Tipos de hipótese e comparações entre padrões de herança utilizando o Teste de Qui- quadrado. Hipótese • Formulação provisória a ser demonstrada ou verificada, sendo uma suposição admissível; • Instrumento de pesquisa que medeia a teoria e a metodologia, formulada a partir de uma ambiência teórica e diante de um problema científico a ser resolvido; • Teste de uma hipótese: passo a passo seguido para se verificar uma inferência; Teste de Hipóteses Hipótese Nula (H0): • Base dos testes • Afirma que não há relação entre os fenômenos medidos, não há variação. Ex.: “o tratamento médico não tem efeito”, “o aumento de 5% no preço não afetou as vendas”. • Conclusões: rejeitar hipótese nula ou não rejeitar hipótese nula (≠ provar sua veracidade) Teste de Hipóteses Exemplo: Julgamento • H0: o réu é inocente • Provas tentam rejeitar H0. • Conclusões: Rejeitou H0: réu não é inocente Não Rejeitou H0: não há provas suficientes para rejeitar H0 (≠ réu ser realmente inocente) Teste de Hipóteses Hipótese Alternativa (H1): • Alternativa à H0; • Dependente do contexto do problema; • Direciona a interpretação dos resultados e conclusões • Ciência que utiliza a probabilidade para explicar a frequência de ocorrência de eventos; • Utilizada como ferramenta de análise de dados; • Por si só não gera conclusões; Estatística TESTE DE CONCORDÂNCIA • As proporções esperadas são calculadas com base em alguma teoria; TESTE DE CONTINGÊNCIA • Não há uma teoria que informe a respeito da probabilidade de ocorrência de cada classe; • Ex: verificar se uma característica se distribui igualmente entre sexos, grupos etários ou raciais; Testes de Hipóteses • Muito utilizada em estatística inferencial; • Avaliar a relação entre o resultado de um experimento e a distribuição esperada – Teste de Aderência; • Utilizada para comparar proporções, levando em conta tamanho da amostra e desvios; • Verificar se os desvios observados são ao acaso ou significativos; Teste de Qui-Quadrado (2) • Risco de rejeitar uma hipótese e ela ser verdadeira; • 5% de significância: satisfatório • Fischer: devemos acreditar que o resultado é verdadeiro quando tivermos 95% de confiança nele, ou 5% de chance que os resultados ocorreram ao acaso • Deve considerar o número de classes independentes avaliadas, em forma de graus de liberdade: GL = n° de classes - 1 Nível de Significância Se fossem feitas infinitas tentativas para um teste, a distribuição se aproximaria do seguinte gráfico: • Valores de 2 menores que 3,841 têm 95% de chance de ocorrência. • Valores de 2 menores que 6,635 têm 99% de chance de ocorrência. Nível de Significância ESP. 500 500 CARA COROA OBS. 475 525 DESVIO -25 +25 1000 lançamentos No exemplo da moeda: • Distribuição observada: 475:525 • Tamanho da amostra: 1000 • Distribuição esperada: 500:500 • Desvios: -25 e +25 • Falta alguma coisa? Teste de Concordância GL Nível de significância () 0,99 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001 1 ,0002 0,004 0,016 0,064 0,148 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10,827 2 0,020 0,103 0,211 0,446 0,713 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13,815 3 0,115 0,352 0,584 1,005 1,424 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16,266 4 0,297 0,711 1,064 1,649 2,195 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18,467 5 0,554 1,145 1,610 2,343 3,000 4,351 6,064 7,289 9,236 11,070 13,388 15,080 20,515 6 0,872 1,635 2,204 3,070 3,828 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22,457 7 1,239 2,167 2,833 3,822 4,671 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24,322 8 1,646 2,733 3,490 4,594 5,527 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26,125 9 2,088 3,325 4,168 5,380 6,393 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27,877 10 2,558 3,940 4,865 6,179 7,267 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29,588 11 3,053 4,575 5,578 6,989 8,148 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31,264 12 3,571 5,226 6,304 7,807 9,034 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32,909 13 4,107 5,892 7,042 8,634 9,926 12,340 15,119 16,985 19,812 22,362 25,472 27,688 34,528 14 4,660 6,571 7,790 9,467 10,821 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36,123 15 5,229 7,261 8,547 10,307 11,721 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37,697 16 5,812 7,692 9,312 11,152 12,624 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39,252 17 6,408 8,672 10,085 12,002 13,531 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40,790 18 7,015 9,390 10,865 12,857 14,440 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42,312 19 7,633 10,117 11,651 13,716 15,532 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43,820 20 8,260 10,851 12,443 14,572 16,266 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45,315 • H0: não há diferença entre as proporções, as variações devem-se ao acaso. • H1: há diferença entre as proporções, as variações são significativas • Distribuição observada: 475:525 • Tamanho da amostra: 1000 • Distribuição esperada: 500:500 • Nível de significância: 5% • Graus de liberdade: 1 (cara e coroa = 2 -1 = 1) Teste de Concordância Teste de Concordância 2 calculado para 1 GL= 2,50 2 esperado para 1 GL e 5% de significância = 3,841 2 calculado < 2 tabelado; Conclusão: A proporção 475:525 é considerada 1:1 Eventos CARA COROA TOTAL OBS. (O) 475 525 1000 ESP. (E) 500 500 1000 (O – E) -25 +25 0 (O – E)2 625 625 1250 (O – E)2/E (625)2/500 = 1,25 (625)2/500 = 1,25 2,50 logo, ACEITA-SE H0 Verificar se uma determinada vacina causa efeito semelhante em 2 grupos de indivíduos, descritos abaixo: Teste de Contingência Reação Grupo Positiva Negativa A 25 45 B 15 25 H0: Não há diferença no efeito da vacina entre os grupos H1: O efeito da vacina varia entre os grupos GL = (linhas – 1) x (colunas – 1) = (2 – 1) x (2 – 1) = 1 2calculado (0,0342) < 2 tabelado (3,841) Aceita-se H0 Teste de Contingência Reação TOTAL Grupo Positiva Negativa A 25 45 B 15 25 TOTAL O O 40 70 110 70 40 E 25,45 d 14,55 40 -0,45 +0,45 0 d2/E 0,0079 0,0139 0,0218 E d d2/E 44,55 25,45 70 +0,45 -0,45 0,0045 0,0079 0 0,0124 Deve ser utilizado quando: • A amostra é pequena (N < 40) • O valor de 2calculado > 2 crítico (rejeitaria H0) • Há pelo menos uma classe com n° esperado < 5 • 2 = [|O – E| – 0,5]2 / E Correção de Yates Exemplo: Em uma cidade X tentou-se associar o sexo dos indivíduos com a alergia ao pólen. H0: Não há associação entre a alergia e o sexo H1: Há associação entre a alergia e o sexo Correção de Yates Sexo / Alergia Sim Não Total Mulheres 10 9 19 Homens 13 2 15 Total 23 11 34 2 = (-2,85)2/12,85 + (2,85)2/10,15 + (2,85)2/6,15 + (-2,85)2/4,85 2calculado = 4,4277; 2crítico = 3,841; Correção de Yates Sexo / Alergia Sim Não Total O O Mulheres 10 9 19 Homens 13 2 15 Total 23 11 34 E 12,85 10,15 23 d -2,85 +2,85 0 E 6,15 4,85 11 d +2,85 -2,85 0 GL = (2-1) x (2-1) = 1 Rejeita-se H0 2 = (|-2,85| – 0,5)2/12,85 + (|2,85| – 0,5)2/10,15 + (|2,85| – 0,5)2/6,15 + (|-2,85| – 0,5)2/4,85 2calculado = 3,0105, GL = (2-1) x (2-1) = 12crítico = 3,841, ou seja, Aceita-se H0 Correção de Yates Sexo / Alergia Sim Não Total O E d O E d Mulheres 10 12,85 -2,85 9 6,15 +2,85 19 Homens 13 10,15 +2,85 2 4,85 -2,85 15 Total 23 23 0 11 11 0 34 Após a redescoberta dos trabalhos de Mendel: • Estudos focados no mecanismo de herança em diversos organismos; • Resultados semelhantes aos obtidos por Mendel para as ervilhas de jardim; • HIPÓTESE GENÉTICA: estudo de características herdadas de acordo com os Princípios de Mendel e suas extensões; Hipóteses Genéticas Experimento de Mendel Experimento de Mendel Amarela Verde Lisa Rugosa Púrpura Branca Axial Terminal Verde Amarela Lisa Ondulada Alto Baixo 6022 : 2001 5474 : 1850 882 : 299 428 : 152 705 : 224 651 : 207 787 : 277 3,01 : 1 2,96 : 1 3,15 : 1 3,14 : 1 2,82 : 1 2,95 : 1 2,84 : 1 Mendel cruzou ervilhas e obteve os seguintes resultados: Teste cada resultado estatisticamente. Exercício 1 CRUZAMENTOS RESULTADOS HIPÓTESES a) Semente lisa x semente rugosa (F2) 5474:1850 3:1 b) Flor violeta x Flor branca (F2) 705:224 3:1 c) Lisa amarela (F1) x Rugosa verde 31:26:27:26 1:1:1:1 a) Semente lisa x semente rugosa (F2) Exercício 1 AA aa P Aa F1 F2 AA Aa aA aa a) Semente lisa x semente rugosa (F2) 2calculado (0,2628) < 2 tabelado (3,841), GL = 1 Aceita-se H0 Exercício 1 O Semente lisa 5474 Semente rugosa 1850 Total 7324 H 3 1 4 E 5493 1831 7324 d - 19 + 19 0 d2/E 0,0657 0,1971 0,2628 b) Flor violeta x Flor branca (F2) 2calculado (0,3906) < 2 tabelado (3,841), GL = 1 Aceita-se H0 Exercício 1 O Flor violeta 705 Flor branca 224 Total 929 H 3 1 4 E 696,75 232,25 7324 d 8,25 - 8,25 0 d2/E 0,0976 0,2930 0,3906 c) Amarela Lisa (F1) x Rugosa Verde Exercício 1 AABB aabb A_bb aaB_A_B_ aabb RC F b) Amarela Lisa (F1) x Rugosa Verde 2calculado (0,6180) < 2 tabelado (7,815), GL = 3 Aceita-se H0 O 31 26 27 26 Total 110 H 1 1 1 1 4 E 27,5 27,5 27,5 27,5 110 d 3,5 - 1,5 - 0,5 - 1,5 0 d2/E 0,4454 0,0818 0,0090 0,0818 0,6180 Um pesquisador tentou verificar se a herança do tamanho das orelhas de camundongos se assemelhava à herança observada por Mendel nas ervilhas, e para isso cruzou camundongos de orelhas grandes (PP) com camundongos de orelhas pequenas (pp) e observou na geração F2 o aparecimento de 155 camundongos de orelhas grandes e 45 com orelhas curtas. Teste estatisticamente esta hipótese. Exercício 2 2calculado (0,6667) < 2 tabelado (3,841), GL = 1 Aceita-se H0 Conclusão: Trata-se de uma herança mendeliana, monogênica, com dominância do alelo P sobre p. Exercício 2 O Orelhas grandes 155 Orelhas curtas 45 Total 200 H 3 1 4 E 150 50 200 d 5 - 5 0 d2/E 0,1667 0,5 0,6667 Em um trabalho realizado para estudar a herança da época de florescimento em pepino, foram obtidos os seguintes resultados: Forneça interpretações genéticas e estatísticas para os resultados observados. Exercício 3 POPULAÇÕES PRECOCE TARDIO P1 50 P2 50 F1 50 RC1 (F1 + P1) 195 RC2 (F1 + P2) 101 91 F2 281 80 2calculado (1,5521) < 2 tabelado (3,841), GL = 1 Aceita-se H0 Conclusão: Trata-se de uma herança mendeliana, monogênica, com dominância do alelo “precoce”. Exercício 3 O Floresc. precoce 281 Floresc. tardio 80 Total 361 H 3 1 4 E 270,75 90,25 361 d 10,25 - 10,25 0 d2/E 0,3880 1,1641 1,5521 Duas moscas de frutas (Drosophila) com asas curvadas (curly) são cruzadas. A F1 consiste de 341 recurvadas e 162 normais. Proponha uma hipótese genética para explicar esses resultados. Teste estatisticamente e caso sua hipótese seja rejeitada proponha uma nova hipótese e teste estatisticamente. Exercício 4 H0: trata-se de herança monogênica, autossômica, com dominância do alelo “curly”. 2calculado (13,933) > 2 tabelado (3,841), GL = 1 Rejeita-se H0 Conclusão: As proporções verificadas não seguem a proporção 3:1. Exercício 4 O Curly 341 Normal 162 Total 503 H 3 1 4 E 377,25 125,75 503 d - 36,25 36,25 0 d2/E 3,4832 10,4498 13,933 H0: trata-se de herança monogênica, autossômica, com dominância do alelo “curly” e sua letalidade em homozigose. 2calculado (0,2875) < 2 tabelado (3,841), GL = 1 Aceita-se H0 Conclusão: As proporções verificadas obedecem à proporção 2:1. Exercício 4 O Curly 341 Normal 162 Total 503 H 2 1 3 E 335,33 167,67 503 d 5,67 - 5,67 0 d2/E 0,0958 0,1917 0,2875 Foi avaliada a população de uma determinada espécie, e para 289 indivíduos observou-se a variabilidade do gene Hb, cujos alelos Hba e Hbs podem ser identificados através de eletroforese em gel de poliacrilamida. Observando o gel abaixo desta população, explique se a população está em equilíbrio de Hardy-Weinberg. Exercício 5 No de indivíduos 189 9 89 Hba Hbs HbaHba = 189 HbaHbs = 89 HbsHbs = 9 Total = 287 Exercício 5 Frequência populacional p = Hba = (189 + ½ x 89) / 287 = 0,81 q = Hbs = (9 + ½ x 89) / 287 = 0,19 Frequência Gênica esperada HbaHba = p2 x 287 = (0,81)2 x 287 = 188,30 HbaHbs = 2pq x 287 = (2 x 0,81 x 0,18) x 287 = 88,34 HbsHbs = q2 = (0,19)2 x 287 = 10,36 H0: As frequências observadas e esperadas para cada fenótipo não diferem. GL = (n° classe - n° alelos) = 3 – 2 = 1 2calculado (0,1860) < 2 tabelado (3,841). Aceita-se H0 Conclusão: As proporções observadas e esperadas não diferem. A população está em equilíbrio. Exercício 5 O HbaHba 189 HbaHbs 89 HbsHbs 9 Total 287 E 188,3 88,34 10,36 287 d 0,7 0,66 - 1,36 0 d2/E 0,0026 0,0049 0,1785 0,1860 Referências ALLE, L. F. Teste de Hipóteses em Genética. UFPR, PPG-Gen, Curitiba, 2014. Apresentação pessoal. BARROS, José D'Assunção As Hipóteses nas Ciências Humanas. Revista Sisifo, vol.7, set/dez 2008 Lisboa: Universidade de Lisboa, 2008. BEIGUELMAN, B. Curso Prático de Bioestatística. FUNPEC, Ribeirão Preto, 5ª edição, 2002. GRIFFITHS, A.J.F. et al.Introdução à Genética. Ed. Guanabara-Koogan, Rio de Janeiro, 2002. RAMALHO, M. A. P. et al. Genética na Agropecuária. 3. ed. São Paulo: Ed. Globo, 1995. SNUSTAD, D.P.; SIMMONS, M.J. Fundamentos de Genética. Ed. Guanabara-Koogan, Rio de Janeiro, 3ª Ed., 2004. Significância Estatística Erro tipo I: aceita uma hipótese falsa e a pesquisa encerra erroneamente (mais grave). Erro tipo II: rejeita uma hipótese verdadeira, mas a pesquisa continua em busca de uma hipótese verdadeira (menos grave). Significância do teste: 5% (chance de rejeitar Hipótese verdadeira. Poder do teste: 80% (poder de rejeitar H0 quando ela deve mesmo ser rejeitada). Anexo H0 correta H0 falsa H0 rejeitada Erro tipo I correto H0 não rejeitada correto Erro tipo II
Compartilhar