Baixe o app para aproveitar ainda mais
Prévia do material em texto
72 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Unidade II 5 INDO ALÉM DOS DADOS 5.1 Distribuição amostral e o teorema central do limite Para entender uma distribuição amostral, vamos usar exemplo uma população bem pequena. Durante a Primeira Guerra Mundial, os alemães ocuparam a floresta Białowieža, na Polônia, um dos últimos locais onde o bisão europeu ainda podia ser visto na natureza. Como consequência do cerco e para a manutenção do exército, os soldados alemães caçaram esses espécimes. Ao final da guerra, durante a retirada, eles atiraram em mais espécimes (simplesmente porque podiam). Como resultado, apenas nove animais sobreviveram. A população de uma espécie estava reduzida a nove indivíduos. Os sobreviventes foram abrigados em zoológicos e um programa de reprodução em cativeiro foi iniciado, com a tentativa de reintroduzir a espécie na natureza. Conforme dados de 2017 (MILLER, 2017), a floresta Białowieža abriga, atualmente, 600 espécimes em vida livre (cerca de 10% da população atualmente existente na Europa). Sabendo que a massa corporal de um bisão adulto pode variar entre 300 e 920 kg, suponhamos que a massa dessa população de nove indivíduos seguisse o perfil observado na figura seguinte. 0 300 350 400 450 500 550 600 650 700 750 800 850 900 950 Fr eq uê nc ia Massa (kg) 1 2 Figura 19 – Histograma da distribuição da massa corporal de bisões europeus. A distribuição de escores nessa população é achatada (dados hipotéticos) Esses nove indivíduos correspondiam a toda a população de bisões europeus. Assumindo que os valores de suas massas corporais fossem conforme apresentado, poderíamos obter a média populacional (µ): X N ∑ µ = 73 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Sendo: µ = a média populacional ΣX = o somatório dos valores da variável X N = o número de observações da população ( )350 430 480 540 560 680 760 810 880 9 + + + + + + + + µ = 5490 610 kg 9 µ = = Para realizar uma distribuição amostral para a média dessa população, em primeiro lugar se retira, aleatoriamente, amostras a partir da população; para cada amostra, calcula‑se sua média; e, em seguida, verifica‑se a distribuição de frequências das médias amostrais. Dois aspectos importantes precisam ser destacados: I – A amostragem ocorre com reposição: isso significa que, após a seleção de um indivíduo e registro do seu valor de massa (kg), ele será devolvido para a população, dando‑lhe a chance de ser selecionado novamente; de tal forma, todos os indivíduos apresentam sempre a mesma chance de serem aleatoriamente selecionados (no caso, 1/9 = 0,1111 = 11,11%). II – A ordem em que os casos forem selecionados não importa: se o indivíduo A for selecionado primeiro e, em seguida, o indivíduo B, isso levaria ao mesmo resultado caso o indivíduo B fosse selecionado primeiro e, em seguida, o indivíduo A. Assumindo que nossas amostras obtidas a partir da população possuam tamanho igual a dois indivíduos, quantas possibilidades únicas seriam possíveis, extraindo‑se dois indivíduos de uma população com total de nove? Observação O número de combinações com repetição a partir N elementos tomados n a n é ( ) ( )N n 1,n 1 N n 1 ! C n! N 1 !+ − − + − = − possíveis amostras de n elementos, que podem ser extraídas a partir da população. No caso, N = 9 e n = 2, logo: ( ) ( ) ( ) 9 2 1 !N n 1! 10! 10.9.8! 10.9 90 45 n! N 1 ! 2! 9 1 ! 2!8! 2!8! 2 2 + −+ − = = = = = = − − 74 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Observe a tabela seguinte e as 45 combinações únicas. Sua segunda seção traz os pares de valores de massa para cada amostra, enquanto a terceira apresenta os valores de média para essas amostras. Observe que os valores das médias amostrais diferem entre si, estando algumas mais próximas da média populacional e outras mais distantes. Como existe variabilidade entre as médias, é possível calcular uma medida de dispersão para a distribuição amostral. Essa medida é conhecida como erro padrão da média (σM) e indica quanta variabilidade há, em média, entre uma média amostral e outra. Diferentemente do desvio padrão, que mede a variabilidade dentro de uma única amostra, o erro padrão da média estima a variabilidade entre elas. Tabela 20 – Amostras (n = 2) a partir de uma população contendo nove indivíduos Todas as amostras possíveis com combinação única A, A A, B A, C A, D A, E A, F A, G A, H A, I B, B B, C B, D B, E B, F B, G B, H B, I C, C C, D C, E C, F C, G C, H C, I D, D D, E D, F D, G D, H D, I E, E E, F E, G E, H E, I F, F F, G F, H F, I G, G G, H G, I H, H H, I I, I Valores de massa (kg) para todas as amostras possíveis 350, 350 350, 430 350, 480 350, 540 350, 560 350, 680 350, 760 350, 810 350, 880 430, 430 430, 480 430, 540 430, 560 430, 680 430, 760 430, 810 430, 880 480, 480 480, 540 480, 560 480, 680 480, 760 480, 810 480, 880 540, 540 540, 560 540, 680 540, 760 540, 810 540, 880 560, 560 560, 680 560, 760 560, 810 560, 880 680, 680 680, 760 680, 810 680, 880 760, 760 760, 810 760, 880 810, 810 810, 880 880, 880 Médias dos valores de massa (kg) para as amostras 350 390 415 445 455 515 555 580 615 430 455 485 495 555 595 620 655 480 510 520 580 620 645 680 540 550 610 650 675 710 560 620 660 685 720 680 720 745 780 760 785 820 810 845 880 75 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Observação As letras empregadas na primeira seção representam todas as possibilidades de combinações para uma amostragem com reposição e n = 2. Na segunda parte, são apresentados os valores de massa (kg) dos indivíduos em cada amostra. Na terceira, são reportados os valores de média para cada amostra. A figura a seguir apresenta o histograma para as 45 médias obtidas na terceira parte da tabela anterior. Observe o formato da distribuição: a população apresentava, na figura anterior, distribuição achatada, mas a distribuição amostral aparenta assumir o formato de uma distribuição normal (compare com a curva normal, em vermelho, sobreposta ao histograma). 0 300 350 400 450 500 550 600 650 700 750 800 850 900 950 Fr eq uê nc ia Média da massa (kg) 8 7 6 5 4 3 2 1 Figura 20 – Distribuição amostral das médias para amostragem com reposição e n = 2, a partir dos valores da massa corporal de bisões europeus (N = 9). O teorema central do limite estabelece que uma distribuição amostral da média tenderá à distribuição normal, independentemente do formato da distribuição da população, desde que o tamanho amostral seja grande (n ≥ 30). Nesse exemplo, ainda que n amostral seja pequeno (n = 2), a distribuição amostral já aparenta assumir o formato de uma distribuição normal, como é possível evidenciar pela comparação com a curva sobreposta A média dessa distribuição amostral (µM) leva a uma observação interessante: ela é igual à média da população. Observe que, se tirarmos a média dos 45 valores da terceira seção da tabela anterior, temos: M 27450 610 kg 45 µ = = Uma vez observadas as diferentes médias amostrais, a partir da massa (kg) de uma pequena população de bisões europeus, imagine, agora, que uma amostra de 100 brasileiros foi selecionada ao acaso e a média de sua massa corporal (kg) foi obtida. Como seria o formato da distribuição amostral 76 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II para a média se muitas amostras aleatórias contendo 100 indivíduos fossem coletadas? Com mais de 200 milhões de habitantes no Brasil, seria impossível obter cada amostra com n = 100 indivíduos. É nessa hora que entra em cena o teorema central do limite, fornecendo uma descrição matemática do que a distribuição amostral se pareceria, caso um pesquisador obtivesse todas as amostras possíveiscom tamanho n a partir da população. Tenha em mente que, para que o teorema central do limite se aplique, o tamanho da amostra precisa ser grande. Quão grande? Com n = 2, tal como vimos no exemplo anterior, certamente estamos bem distante da concepção do termo. Em geral, assume‑se que um n = 30 já pode assim ser considerado. De tal forma, o teorema central do limite se aplica quando o tamanho das amostras utilizadas para avaliar uma distribuição amostral seja n ≥ 30. O teorema central do limite é importante, pois três constatações podem ser observadas: I – Se o n amostral for grande, então a distribuição amostral da média tenderá à distribuição normal, independentemente do formato da distribuição de frequências da população. II – Se o n amostral for grande, então a média das médias que compõem a distribuição amostral será igual à média da população, a partir da qual as amostras foram obtidas. III – Se o n amostral for grande, será possível estimar o erro padrão da média, uma medida que indicará quanta variabilidade haverá, em média, entre uma média amostral e outra. O erro padrão pode ser calculado conforme a seguinte equação: M n σ σ = Sendo: σM = o erro padrão da média σ = o desvio padrão populacional n = o número de observações da amostra Com base no exemplo dos bisões, sendo o desvio padrão populacional 128,60 kg, tem‑se: M n σ σ = M 128,60 128,60 90,94 kg 1,41422 σ = = ≅ 77 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA O acesso a toda uma população raramente ocorre e, portanto, dificilmente se tem acesso ao desvio padrão populacional. Então, como será possível calcular o erro padrão para a média sem o desvio padrão populacional? Nessas situações, emprega‑se o desvio padrão amostral, uma estimativa do desvio padrão populacional, para calcular uma estimativa do erro padrão da média (sM). Observe a equação: M s s n = Sendo: sM = uma estimativa do erro padrão da média s = o desvio padrão amostral n = o número de observações da amostra Comparemos duas amostras extraídas da tabela anterior: A1 = {540, 680} e A2 = {560, 760}; cujas médias são, respectivamente, 610 e 660 kg. Os desvios padrões amostrais obtidos serão de 99,00 e 141,42 kg, respectivamente. Substituindo‑se, na equação: M s s n = M1 99 99 s 70,00 kg 1,41422 = = = M1 141,42 141,42 s 100,00 kg 1,41422 = = = Quanto menor for a medida do erro padrão da média, mais as médias em uma distribuição amostral se aproximam. Por consequência, isso nos diz que há menos erro amostral. Assumindo que a amostra tenha um n grande, logo, a média dessa amostra tenderá a estar mais próxima da média populacional. Em outras palavras, se o erro padrão da média for pequeno, então a média de uma amostra provavelmente refletirá com maior precisão a média populacional. Note, no exemplo anterior, que as médias que compõem a primeira amostra se distanciam em 140 unidades (680 – 540 = 140), já as médias que compõem a segunda amostra se distanciam em 200 unidades (760 – 560 = 200). A estimativa do erro padrão foi menor na primeira amostra (sM1 = 70,00 kg) do que na segunda (sM2 = 100,00 kg), indicando que há menos erro amostral na primeira, ou seja, seus valores se aproximam mais entre si. 78 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Graças ao teorema central do limite, um pesquisador não precisa se preocupar com o formato da distribuição de frequências da população a partir da qual uma amostra é retirada. Desde que o tamanho amostral seja grande o suficiente, a distribuição amostral da média tenderá à normalidade, ainda que a população não o seja. Esta noção é útil, pois a curva normal possui propriedades matemáticas conhecidas, em relação à porcentagem de casos que estão sob diferentes porções da curva. No próximo capítulo serão introduzidos os testes de hipóteses, e este conceito permitirá estimar com que frequência um dado valor pode ocorrer. 5.2 Calculando intervalos de confiança Em geral, utilizamos informações obtidas a partir de uma amostra para estimar parâmetros de uma população. Vimos que a estimativa de um parâmetro (como a média populacional) variará entre diferentes amostras obtidas a partir dessa população. É possível utilizar o erro padrão para ter ideia do quanto essas estimativas se diferem entre si. Também é possível utilizar essa informação para calcular limites dentro dos quais se acredita que o parâmetro populacional cairá. Tais limites são chamados intervalos de confiança. Domjan, Blesbois e Williams (1998) estudaram a quantidade de sêmen e espermatozoides liberados por codornas quando estimuladas para cópula. Basicamente, as aves foram colocadas em uma câmara experimental na presença de fêmeas, em que associaram elementos do ambiente com o ato de copular. Uma vez condicionadas, as aves foram colocadas na câmara experimental, só que, dessa vez, em vez de uma fêmea, uma boneca de feltro com cabeça embalsamada de codorna foi colocada para estimular os machos, e o volume do ejaculado foi coletado para análise. Animais que haviam sido condicionados e haviam associado o ambiente com o ato da cópula liberaram volumes maiores de sêmen, contendo mais espermatozoides do que os animais que não haviam sido condicionados à câmara experimental. Figura 21 – Boneca de codorna utilizada pelos pesquisadores para estimular as aves no dia da coleta do ejaculado 79 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Um dos grupos condicionados (n = 7) obteve uma média, de espermatozoides liberados, de 17 milhões. Essa é a média amostral. E quanto seria a média populacional? Não temos acesso a essa informação. Como não sabemos a média populacional, não podemos inferir que 17 milhões seja um bom ou mau estimador desse valor. Portanto, em vez de fixar apenas um único valor da amostra, é possível estimar um intervalo, usando a média amostral como ponto médio e estabelecendo um limite superior e inferior para esse intervalo. Assumindo que o valor da média populacional fosse de 15 milhões de espermatozoides (hipoteticamente), observe a figura seguinte e considere que 50 experimentos independentes foram realizados, gerando 50 amostras diferentes (com n = 7 cada). Note que as médias amostrais (pontos) variam entre si e diferem da média populacional (linha pontilhada). Embora a maioria dos intervalos contenha o valor real da média populacional (eles cruzam a linha pontilhada, indicando que o valor de 15 milhões de espermatozoides está contido entre o limite superior e inferior do intervalo de confiança), alguns não a possuem (pontos vermelhos, em destaque). 0 6 8 10 12 14 16 18 20 22 24 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Es pe rm at oz ói de s ( m ilh õe s) Amostra Figura 22 – Intervalos de confiança da contagem de espermatozoides de codornas em 50 amostras diferentes. Assumindo, hipoteticamente, que a média populacional seja de 15 milhões de espermatozoides (linha pontilhada), a média de cada uma das 50 amostras diferentes (com n = 7) – pontos em preto – é apresentada com seus respectivos intervalos de confiança (barras acima e abaixo da média). Das 50 amostras, três (destaque) não contemplam a média populacional em seus intervalos De certa forma, os intervalos de confiança informam a chance que esses valores possuem em conter o parâmetro que se procura estimar (nesse caso, a média). Em geral, procuramos por intervalos de confiança de 95% (e, algumas vezes, intervalos de confiança de 99%): eles são limites calculados de tal forma que certa porcentagem de amostras contenha o valor real do parâmetro dentro da amplitude do intervalo. Assim, quando vir um intervalo de confiança de 95% para a média, pense da seguinte forma: se coletássemos100 amostras independentes, calculássemos a média e, então, obtivéssemos os intervalos de confiança para a média, em 95 das 100 amostras, os intervalos de confiança conteriam o valor da média populacional. Para calcular um intervalo de confiança de 95%, é preciso conhecer os limites dentro dos quais 95% das médias cairão. Sabemos que, se o n amostral for grande, a distribuição amostral das médias será normal. Para facilitar a explicação, vamos assumir uma distribuição normal com centro (média) igual a 0 e desvio padrão igual a 1. A vantagem disso é que podemos utilizar valores tabelados. O intervalo compreendido entre ‑1 e +1 unidades de desvio padrão seleciona aproximadamente 68,27% da área 80 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II total sob a curva; já o intervalo compreendido entre ‑2 e +2 unidades de desvio padrão corresponde a 95,45% da área sob a curva; enquanto o intervalo compreendido entre ‑3 e +3 unidades de desvio padrão, a aproximadamente 99,73% da área sob a curva. Essas são propriedades matemáticas da distribuição normal. –3 –2 –1 0 z 1 2 3 68,27% 95,45% 99,73% Figura 23 – A curva normal padrão e suas porcentagens de área sob a curva. Assumindo‑se média = 0 e desvio padrão = 1, nota‑se que o intervalo compreendido entre ‑1 e +1 seleciona aproximadamente 68,27% da área total sob a curva; já o intervalo compreendido entre ‑2 e +2 corresponde a 95,45%; enquanto o intervalo compreendido entre ‑3 e +3, a aproximadamente 99,73% Qual seria o valor exato de desvios padrões acima e abaixo da média que criariam um intervalo compreendendo os 95% centrais da área sob a curva? Para responder a essa pergunta, devemos recorrer a uma tabela de z escores – que corresponde à transformação de qualquer valor de um conjunto de dados em unidades de uma curva normal padrão. X M z s − = Sendo: z = o escore padrão X = um valor da amostra M = a média amostra s = o desvio padrão amostral Uma tabela completa de z escores pode ser encontrada no Apêndice A deste livro‑texto. A seguir, observe um recorte da tabela z escores para encontrarmos a informação desejada. Procuramos pela informação correspondente ao valor de z escore necessário para termos preenchidos os 95% centrais da área sob a curva normal. Conforme esquematiza a figura a seguir, devemos buscar essa informação na coluna D da tabela mencionada. 81 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA média–z z D Figura 24 – Esquematização de área central sob a curva normal. Os valores de z escores necessários para que se obtenha determinada área (representada pela coluna D na tabela 21 – excertos do Apêndice A) podem ser consultados em uma tabela de z escores Tabela 21 – Área sob a curva normal (excerto do Apêndice A) Área sob a curva normal z escore A Abaixo de +z acima de ‑z B Da média a +z ou a ‑z C Acima de +z abaixo de ‑z D Entre ‑z e +z 1,90 97,13% 47,13% 2,87% 94,26% 1,91 97,19% 47,19% 2,81% 94,39% 1,92 97,26% 47,26% 2,74% 94,51% 1,93 97,32% 47,32% 2,68% 94,64% 1,94 97,38% 47,38% 2,62% 94,76% 1,95 97,44% 47,44% 2,56% 94,88% 1,96 97,50% 47,50% 2,50% 95,00% 1,97 97,56% 47,56% 2,44% 95,12% 1,98 97,61% 47,61% 2,39% 95,23% 1,99 97,67% 47,67% 2,33% 95,34% 2,00 97,72% 47,72% 2,28% 95,45% Nota: o intervalo necessário para que 95% da área central sob a curva normal seja assinalado está compreendido entre ‑1,96 e +1,96 desvios padrões a partir da média (destaque). O intervalo de confiança de 95% para a média pode ser facilmente calculado uma vez que o desvio padrão amostral e a média amostral sejam conhecidos. Entretanto, para o cálculo se utiliza o erro padrão, porque estamos interessados na variabilidade de uma distribuição amostral de médias e não na variabilidade das observações dentro de uma amostra. Assim: s limite inferior doI C95% M 1,96 n = − × 82 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II s limite superior doI C95% M 1,96 n = + × Sendo: IC95% = o intervalo de confiança de 95% para a média M = a média amostra s = o desvio padrão amostral n = o número de observações da amostra Lembrete Lembre que o desvio padrão amostral (s) dividido pela raiz quadrada de n é igual ao erro padrão (sM): M s s n = Exemplo de aplicação Exemplo 18 Assuma que a variável pressão diastólica tenha uma distribuição normal com média populacional (µ) desconhecida. Em uma amostra de 83 indivíduos, a média amostral foi de 81 mmHg e o erro padrão foi de 1,21 mmHg. Qual seria o intervalo de confiança de 95% para a média? Resolução Temos: Mlimite inferior do IC95% M 1,96 s= − × limite inferior do IC95% 81 1,96 1,21= − × limite inferior doI C95% 81 2,3716= − limite inferior doI C95% 78,63= Mlimite superior do IC95% M 1,96 s= + × 83 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA limite superior do IC95% 81 1,96 1,21= + × limite superior doI C95% 81 2,3716= + limite superior doI C95% 83,37= O intervalo de confiança de 95% para a média varia de 78,63 a 83,37 mmHg. Note que a subtração foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para o limite superior. Logo, o intervalo [78,63; 83,37] contém o valor médio da população com 95% de confiança. De forma abreviada, poderíamos reportar estes valores como M = 81,00, IC95% [78,63; 83,37]. O procedimento anterior é válido desde que as amostras sejam grandes, uma vez que o teorema central do limite nos diz que a distribuição amostral das médias será normal. Entretanto, para amostras pequenas, a distribuição amostral não será necessariamente normal. Nesses casos, emprega‑se a distribuição t – uma família de distribuições de probabilidade cujos formatos variam à medida que o tamanho amostral aumenta (quando a amostra for muito grande, tenderá à distribuição normal – veja na figura a seguir). Para construir um intervalo de confiança para a média em uma amostra pequena, utiliza‑se o mesmo princípio apresentado anteriormente, mas, em vez de um valor de z, utiliza‑se um valor de t. Assim, quais seriam os valores de t que limitariam os 95% centrais da área sob a curva t? Para responder a essa pergunta, devemos recorrer a uma tabela de valores críticos de t. Uma tabela t pode ser encontrada no Apêndice B deste livro‑texto. A seguir, observe um recorte dessa tabela para encontrarmos a informação desejada. Procuramos pela informação correspondente ao valor de t necessário para termos preenchidos os 95% centrais da área sob a curva t. Conforme esquematiza a figura 26, devemos buscar essa informação na coluna B. 0–1–2–3 1 2 3 GL = +∞ GL = 1 GL = 2 GL = 5 Figura 25 – Distribuição t. À medida que o n amostral aumenta – observado pelo aumento dos graus de liberdade (GL) – a distribuição t se assemelha à distribuição normal 84 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II 0–t t B Figura 26 – Valores críticos da distribuição t. Para uma distribuição t com n – 1 graus de liberdade (GL), os valores críticos de t no eixo x, que correspondam aos limites inferior e superior de 95% da área sob a curva, podem ser encontrados na coluna B da tabela seguinte. Se a área assinalada em cinza corresponder a 95% da curva, tem‑se 2,5% à esquerda e 2,5% à direita nas áreas em branco Tabela 22 – Valores críticos de t (excerto do Apêndice B) GL A α = 0,05 unicaudal ou α = 0,10 bicaudal B α = 0,025 unicaudal ou α = 0,05 bicaudal C α = 0,01 unicaudal ou α = 0,02 bicaudal D α = 0,005 unicaudal ou α = 0,01 bicaudal 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,499 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250 10 1,812 2,228 2,7643,169 Nota: a distribuição t varia conforme o grau de liberdade (GL). Para se obter os 95% c entrais da área sob a curva, deve‑se olhar na coluna B (destaque) e cruzar com a informação do grau de liberdade desejado, pois a soma das áreas das caudas à esquerda e à direita corresponderão a 5% da área sob a curva (α = 0,05 ou 5%). Assim: n 1 s limite inferior doI C95% M t n −= − × n 1 s limite superior doI C95% M t n −= + × 85 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Sendo: IC95% = o intervalo de confiança de 95% para a média M = a média amostra tn – 1 = valor crítico de t com n – 1 graus de liberdade s = o desvio padrão amostral n = o número de observações da amostra Exemplo de aplicação Exemplo 19 Assumindo que uma amostra de sete codornas condicionadas obteve, em média, 17 milhões de espermatozoides em seu ejaculado, com desvio padrão de 8,8 milhões de espermatozoides, calcule o intervalo de confiança de 95% para a média. Resolução Temos que, conforme a tabela anterior, para n – 1 graus de liberdade (n = 7, portanto GL = 6), o valor crítico de t na coluna B seria t = 2,447. Assim: s limite inferior doI C95% M 2,447 n = − × 8,8 limite inferior doI C95% 1 7,0 2,447 7 = − × 8,8 limite inferior doI C95% 1 7,0 2,447 2,6458 = − × limite inferior doI C95% 1 7,0 8,14 8,86= − = s limite superior doI C95% M 2,447 n = + × 8,8 limite superior doI C95% 1 7,0 2,447 7 = + × 8,8 limite superior doI C95% 1 7,0 2,447 2,6458 = + × 86 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II limite superior doI C95% 1 7,0 8,14 25,14= + = O intervalo de confiança de 95% para a média varia de 8,86 a 25,14 milhões de espermatozoides. Note que a subtração foi feita primeiro, pois o intervalo de confiança é reportado do limite inferior para o limite superior. De forma abreviada, poderíamos reportar a média e o intervalo de confiança como M = 17,00, IC95% [8,86; 25,14]. Lembrete O que o intervalo de confiança nos diz? Oficialmente, um intervalo de confiança de 95% apenas revela que, se repetíssemos o processo de coleta de dados e de obtenção de novas amostras e calculássemos o intervalo de confiança para cada amostra, em 95 de 100 repetições, os intervalos de confiança calculados conteriam o valor da média populacional. Diante de um intervalo de confiança calculado, não se sabe, contudo, se estamos diante de uma dessas 95 situações. No dia a dia, as pessoas tendem a interpretar o intervalo de confiança como um limite dentro do qual o parâmetro populacional pode estar. Também há uma chance de o parâmetro populacional não cair dentro de um intervalo de confiança calculado (reveja as amostras destacadas em vermelho na figura 21 e observe a figura seguinte). 0 µ –2 2–1–3 31 B A Figura 27 – Distribuição amostral de médias com destaque para dois intervalos de confiança de 95%. Conforme o teorema central do limite, uma distribuição amostral de médias tenderá à distribuição normal, sendo o ponto médio da distribuição – a média das médias de todas as amostras que compõem essa distribuição – igual à média populacional (µ). Duas médias aleatórias – pontos A e B – são destacadas com seus respectivos intervalos de confiança de 95% demarcados. Note que a média populacional (centro da distribuição) está compreendida dentro dos limites do intervalo de confiança da média destacada pelo ponto A, mas não está compreendida dentro dos limites do intervalo de confiança da média destacada pelo ponto B 87 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA 5.3 Probabilidade As conclusões estatísticas envolvem noções de probabilidade, tal como os meteorologistas indicam que há chance de chover ao longo da semana. As condições podem ser adequadas para a previsão de que choverá, no entanto, a chuva não é garantida. A probabilidade pode ser explicada em função do número de eventos específicos para um dado resultado em função do total de eventos possíveis. ( ) número de vezes que um evento A pode ocorrerp A número total de eventos possíveis = Sendo: p = probabilidade A = um evento específico Moedas geralmente são usadas como exemplos simples para ensinar noções de probabilidade. Uma moeda possui duas faces – cara e coroa –, que são mutuamente exclusivas, ao jogar uma moeda não é possível obter cara e coroa simultaneamente. Assim, qual seria a chance de obter cara ao jogar uma moeda? Tendo em vista apenas dois resultados possíveis, observa‑se que: ( ) 1p cara ou 0,50 ou 50% 2 = A probabilidade pode ser reportada como uma fração; nesse caso, há uma chance em duas de uma moeda dar cara. É possível, ainda, reportar na forma decimal, afirmando que a probabilidade de uma moeda dar cara é 0,50. Multiplicando‑se o decimal por 100, a probabilidade pode ser expressa em porcentagem, e alguém poderia afirmar que, ao jogar uma moeda, há uma chance de 50% de obter cara. Se lançássemos um dado, qual seria a chance de obtermos um número quatro na face voltada para cima? Assumindo que um dado possui seis faces, e todas têm a mesma chance de serem obtidas em um lançamento, para obter o número quatro (evento específico), devemos dividir o número de vezes que esse resultado pode ocorrer pelo total de eventos possíveis (seis faces): ( ) 1p quatro ou 0,1667 ou1 6,67% 6 = E se resolvêssemos tirar aleatoriamente uma carta em um baralho, qual seria a chance de ser um ás de copas? Existe apenas um evento possível em um total de 52 possibilidades, logo: ( ) 1p ás de copas ou 0,0192 ou1 ,92% 52 = 88 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II E qual seria a chance de tirarmos um ás qualquer? Como existem quatro ases em 52 cartas: ( ) 4p ás ou 0,0769 ou 7,69% 52 = Vejamos agora como se comportam eventos independentes. Ao jogar duas moedas, simultaneamente, qual a chance de obter duas caras? Ao assumir que os eventos são independentes, entende‑se que o resultado de uma moeda não impacta no resultado da outra moeda, ou seja, obter cara ou coroa na primeira moeda não exercerá efeito sobre o resultado da segunda moeda. Existem quatro cenários possíveis para o lançamento de duas moedas: • cara na primeira e cara na segunda; • cara na primeira e coroa na segunda; • coroa na primeira e cara na segunda; • coroa na primeira e coroa na segunda. Logo: ( ) 1p cara, cara ou 0,25 ou 25,00% 4 = É possível obter o mesmo resultado multiplicando a probabilidade de um evento específico acontecer pela probabilidade do outro evento específico também ocorrer: a chance de obter cara em uma moeda é de 1 2 , e a chance de obter cara na outra moeda também é de 1 2 . Assim: ( ) 1 1 1p cara, cara ou 0,25 ou 25,00% 2 2 4 = × = Se lançássemos dois dados, qual seria a chance de obtermos uma soma igual a sete nas faces voltadas para cima? Para que seja obtida uma soma igual a sete, vejamos os cenários possíveis no lançamento de dois dados: • um no primeiro e seis no segundo; • dois no primeiro e cinco no segundo; • três no primeiro e quatro no segundo; 89 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA • quatro no primeiro e três no segundo; • cinco no primeiro e dois no segundo; • seis no primeiro e um no segundo. Havendo seis possibilidades de resultados no primeiro dado e outras seis possibilidades no segundo dado, temos um total de 36 resultados possíveis, logo: ( ) 6 1p soma sete ou 0,1667 ou1 6,67% 36 6 = = Vejamos agora como se comportam eventos relacionados. Uma urna contém três bolas brancas e três bolas pretas. Suponha que sejam sorteadas duas bolas ao acaso, sem reposição. Isso significa que, ao extrairmos a primeira bola, observamos sua cor e não a devolvemos à urna. O total de bolas disponíveis na urna reduziuem uma unidade após a extração da primeira, e isso terá impacto sobre o número de eventos possíveis. Nesse exemplo, qual seria a chance de obter duas bolas pretas? Existem três bolas pretas em um total de seis bolas na urna, logo, a chance de a primeira bola sorteada ser preta é de 3 1 6 2 = ; para que a segunda bola também seja preta, devemos atentar que restaram apenas duas bolas pretas em um total de cinco, ou seja, resultando em uma chance de 2 5 . Assim: ( ) 1 2 2 1p preta, preta ou 0,20 ou 20,00% 2 5 10 5 = × = = Se a probabilidade de um evento for igual a 1,00 – ou expressa em porcentagem (100%) –, isso significa que determinado resultado é uma certeza. Nenhum evento possível pode possuir uma probabilidade maior que 1,00; e a soma das probabilidades de todos os eventos possíveis será sempre igual a 1,00. De forma inversa, é possível concluir que a probabilidade de um evento ocorrer nunca poderá ser menor que zero (0%) – uma probabilidade zero indica que um resultado não pode ocorrer. Assim, verifica‑se que: ( )0,00 p A 1,00≤ ≤ Noções de probabilidade são muito importantes quando trabalhamos com a curva normal. Por exemplo, se uma variável apresentar perfil de distribuição normal e um caso for selecionado aleatoriamente a partir da população, qual a chance desse caso cair dentro de um determinado intervalo da curva (por exemplo, entre ‑1 e +1 desvios padrões a partir da média populacional)? Como vimos na figura 23, a área sob uma curva normal compreendida entre ‑1 e +1 desvios padrões a partir da média corresponde a aproximadamente 68,27% do total da curva. Os estatísticos usam probabilidade para avaliar se um determinado resultado ou evento será comum ou raro. Por comum, deduz‑se que certo resultado ocorra frequentemente, ou seja, ocorrerá em alguma 90 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II região próxima ao centro de uma distribuição normal. Tipicamente, algo que tenha 95% de chance de ocorrer é considerado comum. Um resultado raro, por outro lado, é aquele que tem uma chance pequena de ocorrer, ou seja, estará mais distante do centro da distribuição, em alguma de suas caudas (à esquerda ou à direita). Usualmente, os estatísticos consideram um evento raro aquele que tenha menos de 5% de chance de ocorrer. Escrito em termos de probabilidade, se p < 0,05, em geral, esse evento é considerado raro. Considerando que uma variável numérica qualquer assuma um perfil de distribuição normal na população, qual a probabilidade de um evento aleatório cair acima de dois desvios padrões da média? média z C Figura 28 – Esquematização de área sob a curva normal à direita de um z escore. Os valores de área sob a curva à direita de um z escore (representada pela coluna C na tabela 21) podem ser consultados numa tabela de z escores Ao consultarmos uma tabela de z escores (Apêndice A), veremos que, para um z escore igual a 2,00, a área à direita da curva (coluna C) corresponde a 2,28% do total da curva. Logo, a chance de um evento aleatório cair acima de dois desvios padrões da média é considerada rara, com p = 0,0228. 6 TESTES DE HIPÓTESES PARA UMA E DUAS AMOSTRAS 6.1 Introdução aos testes de hipóteses Na definição de inferência estatística, vimos que as informações obtidas em uma amostra podem ser utilizadas para obter uma conclusão geral acerca da população. A transição entre a estatística descritiva e a estatística inferencial começa com a lógica que os estatísticos utilizam para tomada de decisão, um processo chamado testes de hipóteses. As etapas de um teste de hipóteses se assemelham ao preparo de um bolo. Antes de colocar a massa para assar, você precisa obter os ingredientes, misturá‑los na ordem adequada, pré‑aquecer o forno etc. Da mesma forma, existe uma ordem nas etapas para a condução de um teste de hipóteses. Uma hipótese é uma predição a partir de uma teoria, ou seja, uma explicação proposta para os fatos observados. Por exemplo, um dia, a observação de que pessoas que fumavam desenvolviam câncer de 91 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA pulmão com frequência mais elevada do que não fumantes levou à hipótese de que fumar causaria câncer de pulmão (hoje essa hipótese é considerada fato). Vejamos dez conceitos importantes acerca de testes de hipóteses: I – Uma hipótese é uma predição a partir da população, não da amostra. Isso porque um pesquisador deseja estender sua conclusão para o todo e não apenas para a amostra específica à qual tem acesso. II – Trabalha‑se com o modelo de duas hipóteses – uma hipótese nula, H0, e outra, chamada hipótese alternativa, Ha. III – As duas hipóteses precisam contemplar, juntas, todos os resultados possíveis – se alguém formulasse duas hipóteses dizendo que (1) “todas as flores do mundo são vermelhas” e (2) “todas as flores do mundo são brancas”, essas duas hipóteses não contemplariam todos os resultados possíveis, pois também existem flores de outras cores. Contudo, se alguém dissesse que (1) “todas as flores são brancas” e (2) “nem todas as flores são brancas”, então as duas hipóteses cobririam todos os eventos possíveis. IV – As duas hipóteses precisam ser mutuamente exclusivas, o que significa que apenas uma hipótese pode ser correta em um dado momento. V – A hipótese nula sempre deverá afirmar que a variável independente não exerce efeito sobre a variável dependente. Por exemplo, se um pesquisador está avaliando o efeito de um dado tratamento para curar uma doença, a hipótese nula deverá afirmar que aquele tratamento não exerce efeito de cura. Em outras palavras, esse tratamento teria impacto zero (nulo) sobre a cura. VI – A hipótese alternativa é aquela que os pesquisadores acreditam estar certa, pois ela afirma que a variável independente exerce certo efeito sobre a variável dependente. Para o exemplo do parágrafo anterior, seria dito que o tratamento exerce algum efeito de cura. Note que a hipótese alternativa não estabelece como será esse efeito, mas seguramente será diferente de zero. VII – Uma hipótese nula, por ser uma hipótese negativa, não pode ser provada. Suponha que um adulto deseje provar para uma criança que não existem monstros embaixo da cama. Não importa quantas evidências ele ofereça, a criança sempre contra‑argumentará dizendo que o adulto não olhou direito ou que os monstros ouviram seus passos e se esconderam. Uma negação não pode ser provada. VIII – Entretanto, uma negação pode ser refutada/rejeitada – basta apenas um exemplo. Se uma criança conseguir capturar um monstro embaixo da cama, um adulto não poderá mais afirmar que não existem monstros embaixo da cama. Se um experimento não se der conforme postula a hipótese nula, um pesquisador a rejeitará e, então, poderá aceitar a hipótese alternativa. IX – Por serem mutuamente exclusivas, caso a hipótese nula seja rejeitada, o pesquisador aceitará a hipótese alternativa. Como um pesquisador geralmente acredita que a hipótese alternativa seja verdadeira, o objetivo de um estudo quase sempre é rejeitar a hipótese nula. 92 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II X – Entretanto, se um pesquisador falhar em refutar a hipótese nula, não se pode afirmar que a hipótese nula seja verdadeira. Lembre‑se de que uma negação não pode ser provada. O melhor que o pesquisador poderá afirmar é que ele não obteve evidências suficientes para rejeitar a hipótese nula. Em analogia a um veredito jurídico, dizer que não há evidências que permitam refutar a hipótese nula seria como declarar que o réu não é culpado; não ser culpado não quer dizer que o réu seja inocente, apenas não houve evidências suficientes para que o juiz ou júri o considerasse culpado. O aprendizado para completar um teste de hipóteses é semelhante ao processo de aprender a cozinhar – o melhor a fazer é seguir uma receita. Vejamos umareceita de seis passos para condução de um teste de hipóteses: I – Escolher o teste estatístico adequado. II – Verificar os pressupostos (ou pré‑requisitos) do teste estatístico escolhido. III – Listar as hipóteses nula e alternativa. IV – Encontrar o valor crítico da estatística que determine quando rejeitar a hipótese nula. V – Calcular o valor do teste estatístico. VI – Interpretar os resultados e reportar, por extenso, o que eles indicam. A primeira etapa consiste na escolha do teste estatístico adequado, pois existem centenas de testes disponíveis. A escolha correta dependerá de alguns fatores, tais como a pergunta de pesquisa, o tipo de estudo a ser realizado, a escala de medição dos dados, a quantidade e o tipo de variáveis envolvidas na pergunta. Todos os testes estatísticos possuem pressupostos, condições que precisam ser atendidas antes que o teste seja efetuado. Se os pressupostos não forem atendidos, os pesquisadores não poderão ter certeza se os resultados do teste realmente são válidos. Existem dois tipos de pressupostos: robustos e não robustos. Um pressuposto não robusto precisa ser atendido para dar prosseguimento ao teste; a violação de um pré‑requisito não robusto indica que o pesquisador deverá parar e reavaliar a escolha do teste em questão. Um pressuposto robusto poderá ser violado até certo grau, de forma que o teste poderá ser concluído e interpretado. Imagine um indivíduo cujo sistema imune esteja abalado (não robusto), tal como um indivíduo em tratamento quimioterápico ou à base de medicamentos imunossupressores, para que não haja rejeição de um órgão transplantado. Podemos imaginar que o funcionamento adequado do sistema imune é um pressuposto do nosso estado de saúde. Esse indivíduo, cuja imunidade está violada, estará mais propenso a contrair uma infecção, como gripe, caso esteja em um ambiente com certa aglomeração de pessoas e alguém contaminado espirre no ambiente. Agora, uma pessoa que esteja com seu sistema imune funcional (robusto) será capaz de lidar com esse agente infeccioso e, de tal forma, permanecerá saudável. Entretanto, ainda assim, essa pessoa 93 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA poderá contrair a doença caso a exposição ao patógeno se dê em grande quantidade ou por uma via mais direta – digamos que, em vez de estar em um ambiente em que alguém simplesmente espirrou, o aerossol formado pelas gotículas de saliva atingiram em cheio o rosto dessa pessoa ou ela compartilhou sua escova de dentes com alguém gripado. Mesmo que um pressuposto seja robusto, ele poderá ser violado a depender das condições. As hipóteses podem ser listadas para testes bicaudais (bilaterais ou não direcionais) ou unicaudais (unilaterais ou direcionais). Um teste de hipóteses bicaudal não indica se a variável independente exerce um efeito positivo ou negativo sobre a variável dependente, apenas indica que há algum impacto. Em geral, testes bilaterais são muito mais empregados do que testes unilaterais. Quando um pesquisador estabelece, a priori, uma direção para o impacto da variável independente sobre a variável dependente (se levará a um resultado maior que ou menor que), emprega‑se um teste de hipóteses unicaudal. A vantagem deste sobre o outro é que a rejeição da hipótese nula se torna mais fácil, facilitando o aceite da hipótese alternativa. Para a tomada de decisão, é importante estabelecer um valor crítico – que deve ser alcançado ou excedido para que se possa rejeitar a hipótese nula – da estatística adotada. Qual será esse valor crítico dependerá de uma série de fatores, tais como quão disposto o pesquisador está em assumir uma conclusão errada (em termos probabilísticos) e quantos casos existem em sua amostra. O cálculo da medida de afastamento da hipótese nula, ou estatística do teste, é a etapa mais direta das seis apresentadas: basta adicionar os valores certos a uma equação e apertar os botões corretos da calculadora na ordem certa. A interpretação dos resultados é a razão pela qual os testes estatísticos são realizados. Na última etapa, reportam‑se os achados de forma direta. Alguns aspectos devem constar na descrição dos resultados, tais como: • uma recapitulação das causas pelas quais o estudo foi realizado; • a apresentação de medidas‑resumo importantes, como média e desvio padrão; • uma explicação do que esses resultados significam; e • possíveis sugestões para pesquisas futuras. 6.2 Teste z para uma amostra Agora que a lógica geral por trás de um teste de hipóteses foi apresentada, vejamos as etapas específicas para a condução de um teste z para uma amostra. O teste z para uma amostra é utilizado para avaliar se a média de uma amostra (M) difere da média populacional (µ) quando o desvio padrão populacional (σ) for conhecido. 94 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Suponhamos uma máquina automática de encher pacotes de café os enche segundo uma distribuição normal, com média ajustável e variância igual 400 g2 (desvio padrão populacional = 400 = 20 g). O valor da média ajustável pode ser fixado em um mostrador, porém a sua localização está em uma posição pouco acessível. A máquina foi regulada para uma média = 500 g (média populacional). Desejamos, de meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se a média realmente é igual a 500 g ou não. Caso a média amostral em uma dessas coletas seja igual a 492 g, seria necessário parar a produção para verificar o mostrador? Os pressupostos do teste z para uma amostra são os seguintes: • Amostras aleatórias: a amostra deve ser obtida aleatoriamente a partir da população. Este pré‑requisito é robusto, logo, mesmo que a coleta de dados não se dê de forma randômica, ainda poderemos prosseguir com o teste. Deve‑se, contudo, permanecer atento à conclusão do teste, pois, ao estender os resultados obtidos na amostra para a população, deve‑se lembrar das características do processo de amostragem. • Independência de observações: o segundo pressuposto nos diz que os casos registrados em uma amostra são independentes, ou seja, não são influenciados por outros casos na mesma amostra. Este pré‑requisito não é robusto, logo sua violação implica cuidado, pois não devemos prosseguir com o teste escolhido. • Normalidade: o terceiro pressuposto indica que a variável dependente deverá apresentar distribuição normal na população. Este pré‑requisito também é robusto, logo, sua violação não implica necessariamente na anulação do teste, desde que o desvio à normalidade não seja tão grande. Em nosso exemplo, observamos que amostras de 16 pacotes são coletadas aleatoriamente da linha de produção, a cada meia hora. Os eventos são independentes, pois o conteúdo de café em um pacote não influencia no resultado do outro pacote. Conforme o enunciado, sabemos que a máquina automática preenche os pacotes segundo uma distribuição normal. Logo, todos os pressupostos foram atendidos e podemos prosseguir para a próxima etapa. O próximo passo consiste em listar as hipóteses nula e alternativa. Devemos iniciar pela determinação da hipótese nula, que deve ser sempre uma hipótese negativa. Em seguida, podemos estabelecer a hipótese alternativa, mutuamente exclusiva à hipótese nula, dizendo seu contrário. Como o objetivo do experimento proposto é determinar se a média amostral em uma das coletas pode ser considerada diferente da média populacional (500 g, informação que vai estampada no rótulo das embalagens) e a hipótese nula deve ser sempre uma hipótese negativa, assumiremos que a média da amostra não será diferente da média populacional ou, em outras palavras, que essas médias são iguais: H 0: média amostral (M) = média populacional (µ) Já a hipótese alternativa deverá ser mutuamente exclusiva à hipótese nula. No caso, assumindo um teste bicaudal (pois não nosimporta se a média da amostra será maior ou menor que a média populacional, mas sim se será diferente): 95 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Ha: média amostral (M) ≠ média populacional (µ) A quarta etapa consiste em encontrar o valor crítico da estatística, que determina quando rejeitar a hipótese nula. Em qualquer teste de hipóteses, até que se prove o contrário, devemos sempre assumir que a hipótese nula seja verdadeira. Graças ao teorema central do limite, sabemos que a distribuição amostral das médias terá como centro a média populacional e essa distribuição será normal. Sabemos que a distribuição normal possui características importantes, especialmente quanto à área sob a curva em função de quantos desvios padrões nos deslocamos à esquerda ou à direita do centro (veja a figura no Apêndice A). Logo, podemos dividir essa área sob a curva em duas partes: uma região em que os eventos são frequentes e outra em que são raros. Vimos que, quanto mais próximo do centro, maior a frequência de observações, logo mais comuns serão os eventos. Quanto mais nos distanciamos do centro, mais os eventos passam a ser raros. Assim, duas constatações podem ser feitas: • Se a média de uma amostra cair dentro da área em que os eventos são frequentes, não haverá razão para rejeitarmos a hipótese nula. A média da amostra será um valor considerado comum, o que seria esperado se a hipótese nula fosse verdadeira. • Se a média de uma amostra cair dentro da área em que os eventos são raros (região crítica ou área de rejeição), então estamos diante da ocorrência de um evento não frequente, incomum. Nessa situação, conforme a lógica dos testes de hipóteses, a hipótese nula deverá ser rejeitada e será aceita a hipótese alternativa. A divisória entre a área em que os eventos são frequentes e aquela em que são raros é conhecida como valor crítico do teste. O valor crítico de z (zcrit) dependerá de quão pequena o pesquisador considerar a área de rejeição. Por convenção, assume‑se que um evento comum é aquele que ocorre 95% das vezes, logo, se algo ocorre apenas 5% das vezes ou menos, será considerado raro. Esses valores são arbitrários e deverão ser estabelecidos pelo pesquisador, a priori. Sendo os 95% da área mais próxima ao centro considerados a região em que os eventos são frequentes, teremos uma área de rejeição de 5%, que corresponderá a 2,5% da área dispostos na cauda à esquerda e a 2,5% dispostos na cauda à direita. Por essa razão, um teste é considerado bicaudal – a área crítica se localiza em ambas as laterais (caudas) da distribuição de frequências. Um teste unicaudal assumirá uma área crítica em apenas uma das laterais da distribuição. Lembrete Vimos que os valores de z escores de ±1,96 limitam os 95% centrais de uma distribuição normal padrão. Agora, eles serão usados como valores críticos para o teste z para uma amostra. Outros valores críticos de z podem ser obtidos conforme necessário no Apêndice A. 96 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Se um valor de z escore calculado (na próxima etapa) for menor ou igual ao valor de ‑zcrit ou maior ou igual ao valor de +zcrit, então a hipótese nula de um teste bicaudal deverá ser rejeitada. Escrito de forma matemática, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e aceita‑se Ha. Já se for maior que o valor de ‑zcrit e menor que o valor de +zcrit, então não haverá evidências para rejeitar a hipótese nula. Escrito de forma matemática, se ‑zcrit < zcalc < +zcrit, aceita‑se H0. O tamanho da região crítica, expresso em termos de probabilidade, é conhecido como nível de significância (α) e consiste na probabilidade de um resultado cair na região crítica e a hipótese nula ser rejeitada, mesmo quando a hipótese nula for verdadeira. Os valores críticos que dividem a área em que os eventos são mais frequentes da área em que são mais raros dependem se o pesquisador realizará um teste unicaudal ou bicaudal e qual será o nível de significância (α) adotado. Para o nosso exemplo, assumindo um teste de hipóteses bicaudal e um nível de significância (α) = 0,05 ou 5%, quais seriam os valores críticos de z? Conforme mencionado anteriormente, os valores de zcrit seriam iguais a ±1,96 e podem ser consultados no Apêndice A deste livro‑texto. Devemos agora prosseguir com o cálculo da estatística do teste. A estatística z pode ser calculada conforme a seguinte equação: M M z −µ = σ Sendo: z = um valor de z escore M = a média amostral µ = a média populacional σM = o erro padrão da média Para o nosso exemplo, temos que: M = 492 g µ = 500 g σM = 20 20 4N 16 σ = = = 5 g 97 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Aplicando‑os na equação: M M z −µ = σ 492 500 8 z 1,6 5 5 − − = = = − Para interpretar os resultados, vejamos se a hipótese nula foi rejeitada. Conforme destacado anteriormente, se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, rejeita‑se H0 e se aceita Ha, caso seja empregado um teste bicaudal. Para o nosso exemplo, temos que zcalc = ‑1,6. Para um α = 0,05 em um teste z bicaudal, zcrit = ±1,96. Assim: ‑zcrit < zcalc < +zcrit ‑1,96 < ‑1,6 < +1,96 Portanto, aceita‑se H0 como verdadeira, pois os dados não forneceram evidências suficientes para rejeitá‑la. Conclui‑se que a média amostral de 492 g de café não pôde ser considerada significativamente diferente da média populacional de 500 g. Estabelecida a conclusão, além da interpretação, convém reportar algumas informações adicionais, como o valor do teste estatístico utilizado, o valor do nível de significância (α) adotado e se a hipótese nula foi ou não rejeitada, indicando‑se a chance de erro (p ou p‑valor) obtida. Quando se realiza um teste de hipóteses, o p‑valor pode ser utilizado para determinar a significância dos seus achados. A chance de erro é a probabilidade de obter o valor observado (estatística do teste, no caso, zcal). É importante ter a noção de que, quanto menor o p‑valor (p ≤ α), maior será a evidência contra a hipótese nula, portanto, seria mais prudente rejeitá‑la (se p = 0,01 e α = 0,05, a probabilidade de a hipótese nula ser verdadeira será de 1%, menos do que o nível de significância adotado). Um valor alto da chance de erro (p > α) indica uma fraca evidência contra a hipótese nula, assim, seria mais prudente aceitá‑la como verdadeira (se p = 0,10 e α = 0,05, a probabilidade de a hipótese nula ser verdadeira será de 10%, mais do que o nível de significância adotado). Observação Se p > α, os dados não fornecem evidências para rejeitar H0, logo aceitamos H0 como verdadeira; se p ≤ α, os dados fornecem evidências para rejeitar H0, logo, aceitamos Ha. 98 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Associando o valor da estatística do teste (zcal, no caso) à chance de erro (p), nota‑se uma relação importante em um teste bicaudal: • se ‑zcrit < zcalc < +zcrit, ou, dito em termos mais diretos, |zcalc| < |zcrit|, p > α, logo, não existem evidências para rejeitar H0, devendo aceitá‑la como verdadeira; • se zcalc ≤ ‑zcrit ou se zcalc ≥ +zcrit, ou melhor, se |zcalc| ≥ |zcrit|, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira. Nessa avaliação, uma amostra de 16 pacotes de café foi aleatoriamente selecionada a partir da linha de produção e suas massas foram avaliadas, a fim de verificar se a regulagem da empacotadora estava em acordo com as especificações preestabelecidas. Sendo a média populacional µ = 500 g e o desvio padrão populacional σ = 20 g, um teste z para uma amostra bilateral foi empregado, visando avaliar se a diferença entre a média amostral e a média populacional seria considerada significativamente distinta a um nível de significância α = 0,05. A média amostral obtidaM = 492 g não pôde ser considerada diferente da média populacional (z(n = 16) = – 1,6, p = 0,1096). Conclui‑se que não é necessário interromper a produção, visto que o equipamento não gerou uma amostra com média diferente das especificações. Note que o valor da chance de erro (p), em testes bicaudais, corresponde à soma da área sob a curva normal à esquerda e à direita do módulo do valor de zcalc (coluna C do Apêndice A – para z = 1,6, valor da coluna C = 5,48%; dobrando‑se esse valor, obtemos p = 0,1096). Veja que: |zcalc| < |zcrit|, logo p > α |‑1,6| < |1,96|, logo p > 0,05 Se p > α (p = 0,1096), aceita‑se H0 como verdadeira. Exemplo de aplicação Exemplo 20 O departamento de saúde de uma cidade deseja determinar se a média de coliformes fecais por unidade de volume de água em uma lagoa está dentro dos níveis considerados saudáveis (µ = 200 unidades formadoras de colônia/unidade de volume, σ = 20 unidades formadoras de colônia/unidade de volume). Considere que foram coletadas, aleatoriamente, 10 amostras de água da lagoa, e se obteve os seguintes valores de unidades formadoras de colônia (UFC): 175 190 215 198 184 207 210 193 196 180 99 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Com base nesses dados, considerando α = 0,01 e assumindo que a distribuição respeita a normalidade, compare a média amostral com a média populacional. Resolução Desse modo, sendo o desvio padrão populacional conhecido, podemos empregar o teste z para uma amostra. Em relação aos pressupostos do teste, observamos que 10 amostras de água foram coletadas aleatoriamente a partir de uma lagoa, com cada coleta independente da outra, e o enunciado indica que a distribuição respeita a normalidade. Sem haver violação dos pressupostos, podemos proceder com o teste. Quanto às hipóteses, observe que o desejo é avaliar se a média de coliformes fecais por unidade de volume de água está dentro dos níveis considerados saudáveis (µ = 200 unidades formadoras de colônia/unidade de volume). Se a média for menor ou igual a 200 unidades formadoras de colônia/unidade de volume, estamos dentro dos níveis considerados saudáveis; porém, se esse valor estiver acima de 200, os níveis serão considerados impróprios para o consumo humano. Assim, o delineamento do objetivo sugere um teste de hipóteses unicaudal com as seguintes hipóteses: H0: média amostral (M) ≤ média populacional (µ) Ha: média amostral (M) > média populacional (µ) Segundo o enunciado, o nível de significância adotado é α = 0,01. Sendo o teste unilateral à direita, deseja‑se saber o valor crítico de z que corresponda a uma área crítica de 1% à direita. Conforme o Apêndice A, em sua coluna C, observamos que para uma área de 1% à direita, zcrit = 2,33. Podemos, enfim, prosseguir com a estatística do teste. Com base nos valores apresentados, temos que: M = 194,8 unidades formadoras de colônia/unidade de volume µ = 200 unidades formadoras de colônia/unidade de volume σM = 20 20 3,1623N 10 σ = = = 6,3245 unidades formadoras de colônia/unidade de volume Aplicando‑os na equação: M M z −µ = σ 194,8 200 5,2 z 0,8222 0,82 6,3245 6,3245 − − = = = − ≅− 100 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Temos que zcalc = ‑0,82. Para um α = 0,01 em um teste z unicaudal, zcrit = 2,33. Assim: zcalc < zcrit ‑0,82 < 2,33 Se zcalc < zcrit, logo p > α; assim, os dados não fornecem evidências para rejeitar H0. Para estimar o valor de p, podemos recorrer ao Apêndice A e procurar pela área à direita de ‑0,82 (no caso, coluna A – veja figura no Apêndice). Nota‑se que a área à direita de z = ‑0,82 corresponde a 79,39% do total da curva, portanto, p‑valor = 0,7939. O que esse valor nos indica? Que a média amostral de 194,8 unidades formadoras de colônia/unidade de volume tem 79,39% de chance de ser menor ou igual à média populacional de 200 unidades formadoras de colônia/unidade de volume. Como p > α, aceita‑se H0. Resta‑nos, agora, reportar a conclusão final por extenso: Nessa avaliação, uma amostra com 10 coletas de água foi realizada a partir de uma lagoa, e seus valores de unidades formadoras de colônia/unidade de volume foram determinados para verificar se os níveis de coliformes fecais estavam dentro dos limites considerados saudáveis. Sendo a média populacional µ = 200 unidades formadoras de colônia/unidade de volume e o desvio padrão populacional σ = 20 unidades formadoras de colônia/unidade de volume, um teste z para uma amostra unilateral foi empregado, visando avaliar se a média amostral seria significativamente maior que a média populacional, a um nível de significância α = 0,01. A média amostral obtida M = 194,8 unidades formadoras de colônia/unidade de volume não pôde ser considerada maior que a média populacional (z(n = 10) = ‑0,82, p = 0,7939). Conclui‑se que o nível de coliformes fecais por unidade de volume de água na lagoa está dentro dos níveis considerados saudáveis. Todo teste de hipóteses tem sua conclusão sujeita a erro. O erro em afirmar que existe uma diferença quando ela efetivamente não existe – ou seja, rejeitar H0 quando se deveria aceitá‑la – é chamado de erro do tipo I e tem uma probabilidade de ocorrer igual ao α adotado. No entanto, também é possível cometer o erro de aceitar H0 quando não se deveria, isto é, afirmar uma igualdade quando o correto seria afirmar uma diferença. Chamamos esse erro de erro do tipo II ou β, cuja probabilidade, em geral, é difícil de estimar, pois é necessário conhecer o valor do parâmetro na população amostrada. Como a probabilidade complementar desse erro (1 – β) representa a probabilidade em afirmar corretamente que existe uma diferença quando ela realmente existe, diz‑se que 1 – β é o poder do teste estatístico em detectar uma diferença real. Não serão abordados cálculos de β e poder do teste, mas esses conceitos podem ser utilizados para estimar o tamanho amostral necessário para atingir determinado objetivo ou para determinar, após a realização de uma pesquisa, que poder a amostra estudada tem em detectar uma diferença estipulada pelo pesquisador. 101 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Saiba mais Para mais informações sobre erros do tipo I e do tipo II, consulte: HOEL, P. G. Introduction to Mathematical Statistics. 3 ed. New York: John Wiley & Sons Inc, 1966. 6.3 Teste t para uma amostra O teste t para uma amostra é utilizado para comparar a média de uma amostra a um valor específico, como a média populacional. Em suma, é equivalente ao teste z para uma amostra, entretanto, é mais utilizado, pois não demanda o conhecimento do desvio padrão populacional (σ). Em vez disso, o teste t para uma amostra emprega o desvio padrão amostral (s). Suponhamos que, durante uma semana, 13 bebês nasceram em determinada maternidade. Parte do procedimento padrão consiste em medir o comprimento dos recém‑nascidos. Com base nos dados a seguir, dispostos em cm, a um nível de significância de 5%, os dados fornecem evidências para afirmar que o comprimento médio dessa amostra é diferente de 50 cm? 49 50 45 51 47 49 48 54 53 55 45 50 48 A primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar uma média amostral a certo valor (como a média populacional), devemos considerar o teste z para uma amostra ou o teste t para uma amostra. Entretanto, por não dispormos do desvio padrão populacional, nesse caso, devemos escolher o teste t para uma amostra. Os pressupostos do teste t para uma amostra são os mesmos do teste z para uma amostra: amostras devem ser aleatórias, deve haver independência de observações e os dados devem apresentar distribuição normal. Assim, os 13 bebês da suposição anterior, que compõem a amostra, representam uma amostra aleatória entre os nascimentosregistrados na maternidade. Há independência entre as observações, pois não há informações que indiquem que os casos exerçam influência uns sobre os outros. A variável dependente (comprimento) apresenta perfil de distribuição normal na população, portanto, assumiremos que os dados seguem esse perfil. Observação Existem testes de hipóteses chamados testes de normalidade, que visam avaliar se os valores contidos em determinada amostra apresentam perfil semelhante à curva normal. Alguns exemplos são os testes de Shapiro‑Wilk, 102 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II d’Agostino‑Pearson, Anderson‑Darling e Kolgomorov‑Smirnov. Nesses testes, temos H0: distribuição dos dados = distribuição normal; Ha: distribuição dos dados ≠ distribuição normal. Para esse conjunto de dados, o teste de normalidade de Shapiro‑Wilk teve chance de erro p = 0,6842. Para um nível de significância α = 0,05, podemos concluir que p > α, portanto, se aceita H0 – os dados apresentam distribuição normal. Saiba mais Para mais informações sobre os testes de normalidade, leia: FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados. Rio de Janeiro: Elsevier, 2017. FIELD, A. Discovering statistics using IBM SPSS statistics. 4. ed. Thousand Oaks: Sage, 2013. Na figura a seguir, a inspeção visual do box‑plot indica se tratar de um conjunto de dados relativamente simétrico, sem outliers. Ao lado, vemos um gráfico quantil‑quantil (Q‑Q plot), muito útil para ter uma ideia do perfil de distribuição de um conjunto de dados numéricos. Quanto mais os pontos se aproximarem da linha de tendência central, mais tenderão à normalidade. Note que nenhuma observação (cada ponto no Q‑Q plot) ultrapassou o limite de ±2,0 desvios padrões (eixo vertical) em função da média. 40 40 45 50 55 60 –2.0 –1.5 –1.0 –0.5 0.0 0.5 1.0 1.5 2.0 45 50 55 60 Co m pr im en to (c m ) Recém‑nascidosA) B) Valores observados N or m al e sp er ad a Figura 29 – Box‑plot e Q‑Q plot da variável comprimento (cm) de uma amostra de recém‑nascidos (n = 13). O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot indica que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam da linha de tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0 desvio padrão em função da média (B) 103 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA A próxima etapa consiste na descrição das hipóteses nula e alternativa. Antes de defini‑las, deve‑se estipular se estamos diante de um teste unicaudal ou bicaudal. Testes bicaudais são comumente empregados e são mais conservadores, no sentido de que tornam mais difícil a rejeição de H0. De tal forma, um teste bicaudal é a escolha padrão, em geral – devendo ser empregado quando um pesquisador deseja avaliar se existe alguma diferença entre a média amostral e o valor a ser comparado, para qualquer uma das direções. Um teste unicaudal é utilizado quando um pesquisador já possui uma dada predição a partir da direção dos resultados antes da coleta de dados. Em outras palavras, deseja avaliar se a média amostral é maior que ou menor que determinado valor a ser comparado, ou seja, objetiva‑se apenas uma das laterais da distribuição. Dada a hipótese anterior, uma vez que se deseja avaliar se o comprimento médio dessa amostra é diferente de 50 cm, pressupõe‑se o uso de um teste bicaudal. Assim, temos: H0: média amostral = 50 cm Ha: média amostral ≠ 50 cm Em seguida, devemos estimar o valor crítico do teste. Lembre‑se que, ao utilizar um teste t, utilizaremos uma distribuição t. A interpretação do valor crítico é a mesma que vimos para o teste z para uma amostra, entretanto, para obter esse valor na tabela de valores críticos de t, devemos levar em conta as seguintes observações: • O teste é unicaudal ou bicaudal? • Qual é o nível de significância (α) adotado? • Qual é o tamanho da amostra (n)? Para os dados do nosso exemplo, temos que o teste em questão é bicaudal; segundo o enunciado, o nível de significância adotado é α = 0,05 ou 5% e; o tamanho da amostra é de 13 bebês. Com base nesses valores, é possível recorrer a uma tabela t (Apêndice B) e cruzar os graus de liberdade (n – 1) com o nível de significância adotado. Sendo GL = n – 1 = 12 e α bicaudal = 0,05, observamos que o valor crítico de t para essa estatística será igual a 2,179. tcrit = 2,179 104 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Tabela 23 – Valores críticos de t (excerto do Apêndice B) GL A α = 0,05 unicaudal ou α = 0,10 bicaudal B α = 0,025 unicaudal ou α = 0,05 bicaudal C α = 0,01 unicaudal ou α = 0,02 bicaudal D α = 0,005 unicaudal ou α = 0,01 bicaudal 1 6,314 12,706 31,821 63,657 2 2,920 4,303 6,965 9,925 3 2,353 3,182 4,541 5,841 4 2,132 2,776 3,747 4,604 5 2,015 2,571 3,365 4,032 6 1,943 2,447 3,143 3,707 7 1,895 2,365 2,998 3,499 8 1,860 2,306 2,896 3,355 9 1,833 2,262 2,821 3,250 10 1,812 2,228 2,764 3,169 11 1,796 2,201 2,718 3,106 12 1,782 2,179 2,681 3,055 Nota: a distribuição t varia conforme o grau de liberdade (GL). Como o nível de significância adotado no nosso exemplo é α = 0,05 bicaudal e o conjunto apresenta 12 graus de liberdade, temos que o valor crítico de t para este cálculo será de 2,179 (conforme destaque) Para um teste bicaudal, a tomada de decisão se dará: • se ‑tcrit < tcalc < +tcrit, não há evidências para rejeitar H0, devendo aceitá‑la como verdadeira; • se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira. Calcula‑se o valor da estatística t, conforme a equação a seguir: M M t s −µ = Sendo: t = o valor da estatística t M = a média amostral µ = a média populacional (ou valor de referência) sM = a estimativa do erro padrão da média 105 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Com base nos 13 valores descritos no início de nossa suposição, podemos calcular a média e o desvio padrão amostrais: Média M = 49,54 cm e desvio padrão s = 3,13 cm. Em seguida, substituindo‑se, na equação do teste t para uma amostra, temos: M = 49,54 cm µ = 50 cm sM = s 3,13 3,13 3,6056n 13 = = = 0,8681 cm M M t s −µ = 49,54 50 0,46 t 0,530 0,8681 0,8681 − − = = ≅ − Vamos agora à interpretação do resultado do teste. Em primeiro lugar, a hipótese nula foi rejeitada? Temos que tcalc = ‑0,530 e tcrit = 2,179. Como o teste é bicaudal, devemos observar que, se ‑tcrit < tcalc < +tcrit, não há evidências para rejeitar H0, devendo‑se aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira. Nesse caso, estamos diante da primeira situação, pois: ‑tcrit < tcalc < +tcrit –2,179 < –0,530 < 2,179 Portanto, não há evidências para rejeitar H0 e devemos aceitá‑la como verdadeira. Assim, quanto será a chance de erro (p)? Ela é maior ou menor que o nível de significância (α) adotado? A interpretação segue o mesmo raciocínio apresentado para o teste z para uma amostra. Como: |tcalc| < |tcrit|, logo p > α |‑0,530| < |2,179|, logo p > 0,05 Se p > 0,05, aceita‑se H0 como verdadeira. Mas qual será o valor exato da chance de erro (p)? Para obter o valor exato, teríamos duas abordagens: calcular a integral da área sob a curva além 106 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II do valor de tcalc (ambas as caudas) ou utilizar um software de análise (para o exemplo em questão, via software, p = 0,6042). Ambas as opções demandam conhecimentos específicos que não serão abordados. Note que, independentemente de estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão nãose altera: p > 0,05. Compare os Apêndices A e B e note como a nossa tabela t é reduzida se comparada à tabela z. Isso se deve ao fato de, nessa tabela t, apresentarmos apenas alguns valores de probabilidade (α – no topo das colunas), que, em geral, são necessários para obtenção dos valores críticos. Observação Para um teste t bicaudal, temos que, se ‑tcrit < tcalc < +tcrit, ou, dito em termos mais diretos, |tcalc| < |tcrit|, p > α, logo, não existem evidências para rejeitar H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit ou se tcalc ≥ +tcrit, ou melhor, |tcalc| ≥ |tcrit|, p ≤ α, logo, os dados fornecem evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira. Uma vez interpretado o resultado, podemos prosseguir para sua descrição por extenso. Devemos destacar alguns elementos importantes na resposta, tais como: I – o teste utilizado; II – o número de elementos da amostra; III – o valor calculado do teste estatístico acompanhado dos graus de liberdade; IV – o nível de significância (α) adotado; V – se H0 foi rejeitada ou não. Assim, vejamos como concluiríamos nosso caso: uma amostra contendo 13 recém‑nascidos foi avaliada em uma maternidade, e um teste t para uma amostra bilateral foi empregado, visando avaliar se o comprimento médio amostral seria diferente de 50 cm, a um nível de significância de 5%. A média obtida M = 49,54 cm, com desvio padrão s = 3,13 cm, não pôde ser considerada diferente de 50 cm (t(12) = ‑0,530, p > 0,05). Conclui‑se que o comprimento médio desses bebês não foi diferente do valor esperado. Exemplo de aplicação Exemplo 21 Uma empresa diz que o volume médio de suas garrafas de refrigerante é de 1500 mL (1,5 L). Para que ela não corra o risco de sofrer punições do órgão fiscalizador, seu departamento de controle de 107 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA qualidade realiza testes frequentes com amostras retiradas da linha de produção. Sabendo‑se que a empresa só seria autuada caso as garrafas apresentassem volume inferior a 1500 mL, determine se a empresa corre esse risco por não cumprir a informação divulgada nas embalagens de seus produtos. Para seus cálculos, observe a amostra a seguir e adote um nível de significância α = 0,025. Volumes medidos (mL) 1508 1518 1492 1505 1515 1498 1496 1505 1510 1507 Resolução Assumindo que a distribuição amostral seja normal, a primeira etapa de um teste de hipóteses é a seleção do teste adequado. Como o objetivo é comparar uma média amostral a certo valor (como a média populacional), devemos considerar o teste z para uma amostra ou o teste t para uma amostra. Entretanto, por não dispormos do desvio padrão populacional, neste caso, devemos escolher o teste t para uma amostra. As dez garrafas que compõem a amostra representam uma amostra aleatória retirada da linha de produção. Há independência entre as observações, pois não há informações que indiquem que os casos da amostra exerçam influência uns sobre os outros. A variável dependente (volume em mL) apresenta perfil de distribuição normal na população, conforme relatado no enunciado, portanto, assumiremos que os dados seguem esse perfil. Podemos inspecionar o box‑plot e o Q‑Q plot dos dados. 1485 1490 1495 1500 1505 1510 1515 1520 1485 1495 1505 1515 1525 –2.0 –1.5 –1.0 –0.5 0.0 0.5 1.0 1.5 2.0 Vo lu m e (m l) Refrigerante A) B) Valores observados N or m al e sp er ad a Figura 30 – Box‑plot e Q‑Q plot da variável volume (mL) de uma amostra de refrigerantes (n = 10). O box‑plot indica se tratar de conjunto de dados relativamente simétrico, sem outliers (A). O Q‑Q plot indica que os dados do conjunto apresentam distribuição que tende à normalidade (pontos se aproximam da linha de tendência central), sendo que nenhuma observação ultrapassou o limite de ±2,0 desvios padrões em função da média (B) 108 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 Unidade II Quanto às hipóteses, observe que o desejo é avaliar se a média do volume amostral condiz com a informação do rótulo da embalagem (1500 mL). Sabendo que a empresa só seria autuada caso as garrafas apresentassem volume inferior a 1500 mL, o delineamento do objetivo sugere um teste de hipóteses unicaudal com as hipóteses de H0: média amostral ≥ valor de referência (1500 mL); Ha: média amostral < valor de referência (1500 mL). Segundo o enunciado, o nível de significância adotado é α = 0,025. Sendo o teste unilateral à esquerda, deseja‑se saber um valor crítico de t que corresponda a uma área crítica de 2,5% à esquerda. Conforme a tabela anterior, em sua coluna B, observamos que, para uma área de 2,5% à esquerda, com 9 graus de liberdade (n – 1 = 10 – 1 = 9), tcrit = ‑2,262 (negativo, pois está à esquerda). Para um teste unilateral à esquerda, a tomada de decisão se dará de modo que, se tcalc > ‑tcrit, não há evidências para rejeitar H0, devendo aceitá‑la como verdadeira; já se tcalc ≤ ‑tcrit, há evidências para rejeitar H0, devendo‑se aceitar Ha como verdadeira. Para calcular o valor da estatística t a partir do conjunto de dados, podemos determinar a média amostral M = 1505,4 mL e o desvio padrão amostral s = 8,20 mL. Substituindo‑se, na equação: M = 1505,4 mL µ = 1500 mL sM = s 8,20 8,20 3,1623n 10 = = = 2,593 mL M M t s −µ = 1505,4 1500 5,4 t 2,083 2,593 2,593 − = = ≅ Vamos agora à interpretação do resultado do teste t para uma amostra. Em primeiro lugar, a hipótese nula foi rejeitada? Note que a média amostral foi maior que a média populacional, que nos dá um indício importante (pois a empresa só seria autuada se o volume médio dos refrigerantes estivesse abaixo da informação da embalagem). Temos que tcalc = 2,083 e tcrit = ‑2,262. Como o teste é unicaudal à esquerda, observamos que: tcalc > ‑tcrit 2,083 > ‑2,262 Portanto, não há evidências para rejeitar H0, e devemos aceitá‑la como verdadeira. Assim, quanto será a chance de erro (p)? Ela é maior ou menor que nível de significância (α) adotado? 109 Re vi sã o: B ru no - D ia gr am aç ão : M ár ci o - 10 /0 6/ 20 19 BIOESTATÍSTICA APLICADA À BIOMEDICINA Para um teste t unilateral à esquerda, temos que, se tcalc > ‑tcrit, p > α; já se tcalc ≤ ‑tcrit, p ≤ α. Como: tcalc > ‑tcrit, logo p > α 2,083 > ‑2,262, logo p > 0,025 Se p > 0,025, aceita‑se H0 como verdadeira. Como o teste em questão é unilateral à esquerda, para obter o valor exato da chance de erro (p), teríamos duas abordagens: calcular a integral da área sob a curva à esquerda do valor de tcalc ou utilizar um software de análise (para o exemplo em questão, via software, p = 0,9665). Note que, independentemente de estar em posse do valor exato da chance de erro (p) ou não, nossa conclusão não se altera: p > 0,025. Resta‑nos, agora, reportar a conclusão final por extenso: Uma amostra contendo 10 garrafas de refrigerante foi avaliada em uma fábrica, e um teste t para uma amostra unilateral foi empregado, visando avaliar se o volume médio amostral seria menor que 1500 mL a um nível de significância de 2,5%. Visto que a empresa só seria autuada caso as garrafas apresentassem volume inferior à informação presente no rótulo, a média amostral obtida M = 1505, 4 mL, com desvio padrão s = 8,20 mL, não pôde ser considerada menor que 1500 mL (t(9) = 2,083, p > 0,025). Conclui‑se que o volume médio das garrafas presentes na amostra não foi menor do que o valor esperado, portanto, a empresa não corre riscos. 6.4 Teste t para duas amostras independentes Nos dois últimos tópicos, vimos o teste z e o teste t, ambos para uma amostra. Eles foram os primeiros testes apresentados porque são bons para introduzir a lógica dos testes de hipóteses. Contudo, raramente os pesquisadores se perguntam se a média de uma amostra difere da média populacional. Agora, veremos um teste utilizado para comparar duas amostras. Essa estratégia é bastante
Compartilhar