A maior rede de estudos do Brasil

Grátis
224 pág.
Estatistica usado o R

Pré-visualização | Página 46 de 50

a distribuição não segue mais uma 12 , mas sim
18
uma r−1  c−1 2 . Isso acontece, como você já deve ter adivinhado porque numa tabela desse tipo,
fixadas as margens, podemos alterar até (r-1) x (c-1) caselas da tabela à vontade, antes das outras
não poderem mais ser alteradas, ou seja, esses são os seus graus de liberdade. Aliás isso já
aconteceu no caso da 2 x k , não é mesmo? Faça a conta.
Para exemplificar, vamos usar os dados referentes ao grau da resposta ao tratamento para
Gonorréia com 3 diferentes esquemas terapêuticos. Este é um exercício do livro “Fundamentals of
Biostatistics”, de Bernard Rosner, 5ª edição, tabela 10.25 na página 415. Essa teremos que digitar
também:
gono.trat<-matrix(c(40,10,15,30,20,40,130,70,45), nr=3, dimnames =
list("Tratamento" = c("Penicilina", "Spectinomicina (baixa)", "Spectinomicina
(alta)"), "Resposta" = c("Esfregaço +", "Esfregaço +, Cultura +", "Ambos -")))
gono.trat
Para fazer o teste:
> chisq.test(gono.trat)
 Pearson's Chi-squared test
data: gono.trat 
X-squared = 29.1401, df = 4, p-value = 7.322e-06
Não há muito a se comentar sobre essa saída. Poderíamos conferir os cálculos, como antes:
> esperado<-chisq.test(gono.trat)$expected
> sum(((gono.trat-esperado)^2)/esperado)
[1] 29.14007
Confira o p-valor. Conferem os graus de liberdade? Muito bem. Aqui também não temos a
nossa correção de continuidade, pelos mesmos motivos já mencionados. Experimente fazer um teste
exato também.
Bem, agora eu aposto que alguns de vocês gostariam de saber como identificar qual desses
valores é de fato diferente dos demais, não é mesmo? Ainda que fosse para uma tabela 2 x k, como
é que podemos satisfatoriamente saber qual grupo difere de qual? Bem, infelizmente esse não é um
problema trivial, e modelos muito mais avançados dos que estamos lidando aqui devem ser usados.
Vocês serão apresentados a esses modelos no próximo curso de estatística.
Uma advertência que deve ser feita é que não é correto, ao contrário do que muitos acham,
testar um dos grupos contra a soma dos demais, repetindo esse procedimento para todos os grupos.
Existem aí vários problemas entre comparações múltiplas e dependência entre os grupos.
Poder para proporções
O R também possui uma função para calcular poder, tamanho de amostra, etc para
proporções, no mesmo estilo da que nós vimos para o teste t. A implementação, porém é só para
duas amostras. O nome da função também é bastante parecido, power.prop.test() e os seus
argumentos são bastante parecidos também, exceto pela ausência do desvio-padrão, já que no caso
de proporções, ele depende dos valores de p. Por exemplo, para saber o poder de um teste para a
diferença de uma proporção p1 de 0.15 e p2 de 0.30, com um alfa de 0.05 e 140 indivíduos em cada
grupo, basta fazer:
> power.prop.test(p1=0.15, p2=0.30, n=140)
 Two-sample comparison of proportions power calculation 
19
 n = 140
 p1 = 0.15
 p2 = 0.3
 sig.level = 0.05
 power = 0.8560383
 alternative = two.sided
 NOTE: n is number in *each* group 
Claro que este procedimento também serve para calcular tamanhos de amostra para poderes
pré-estabelecidos.
20
Exercícios
1. Faça todos os passos do teste para diferenças de duas proporções independentes, de modo
a obter o p-valor para a aproximação Normal e Qui-quadrada. Faça (a) sem a correção de
continuidade e (b) com a correção de continuidade. (c) O que está estranho na saída
mostrada na aula? Use o mesmo exemplo da aula. Mostre o código do software que você
usou, ou os cálculos feitos à mão. Dica: para a correção de continuidade nesse caso, some,
ao módulo da diferença das proporções a quantia 1/2n11/2n2
2. Por que o teste do Qui-quadrado para as k proporções não é recomendado para o nosso
exemplo da aula. Faça um teste que contorne esse problema.
3. Explique o código usado para o cálculo do IC da OR pelo método de Woolf
4. Volte ao exemplo do teste de Fisher. Calcule agora a OR e os ICs pelos métodos de Woolf
e Miettinen. Todos os resultados são coerentes uns com os outros? Discuta esses
resultados.
5. Usando a função power.prop.test() faça uma curva de poder para um experimento que
testa duas proporções quaisquer. Estabeleça o problema, o teste de hipóteses e discuta
diferentes tamanhos de amostra para o seu problema. Que sugestão você teria para
construir essa curva para um experimento que usasse apenas uma amostra?
Do livro:
6. (7.2.) Em 747 casos de febre das Montanhas Rochosas, foram registrados 210 óbitos em
uma determinada região dos EUA. Em outra região, de 661 casos, 122 faleceram. A
diferença de letalidade da doença entre essas regiões é estatisticamente significante?
7. (7.3 ) Duas drogas foram testadas para úlcera péptica e comparadas quanto à sua
efetividade. Os resultados foram:
Curou Não curou Total
Pirenzepina 23 7 30
Tritiozina 18 13 31
Total 41 20 61
Estabeleça o teste de hipóteses para este experimento e faça um teste Qui-quadrado e
também o teste exato de Fisher sobre esses dados e discuta as diferenças entre eles. Baseie-se tanto
no p-valor quanto no IC 95%.
Do Rosner:
8. A tabela abaixo apresenta o resultado de um estudo feito no Líbano para aferir o efeito da
viuvez na mortalidade. Para isso, Viúvos e viúvas foram pareados com pessoas casadas na
mesma época, com idade semelhante (mais ou menos 2 anos) e mesmo sexo. Na tabela, o
21
número de pares onde pelo menos uma das pessoas faleceu até um certo período de
seguimento:
O total de pares no estudo foi de 151 viúvos e 544 viúvas, sempre na proporção de 1:1.
Considerando que todos os pares foram considerados para a análise, formula o teste de hipóteses,
aplique o teste adequado, e comente o resultado.
Obs.: Como está meio apagado: n1 são os pares onde o viúvo ou viúva faleceu e o casado
está vivo e o n2, o contrário.
22
Exercícios - Respostas
Aula 6 - Proporções
Livro: páginas 129 a 138
1. Faça todos os passos do teste para diferenças de duas proporções independentes, de modo a
obter o p-valor para a aproximação Normal e Qui-quadrada. Faça (a) sem a correção de
continuidade e (b) com a correção de continuidade. (c) O que está estranho na saída
mostrada na aula? Use o mesmo exemplo da aula. Mostre o código do software que você
usou, ou os cálculos feitos à mão. Dica: para a correção de continuidade nesse caso, some,
ao módulo da diferença das proporções a quantia 1/2n11/2n2
(a) Primeiro vamos ver a saída sem correção, para conferir depois:
> prop.test(c(9,4),c(12,13), correct=F)
 2-sample test for equality of proportions without continuity
correction
data: c(9, 4) out of c(12, 13) 
X-squared = 4.8909, df = 1, p-value = 0.027
alternative hypothesis: two.sided 
95 percent confidence interval:
 0.09163853 0.79297686 
sample estimates:
 prop 1 prop 2 
0.7500000 0.3076923 
Agora basta seguir as equações apresentadas na aula mesmo. Precisamos calcular o p
comum, a diferença e a variância:
prop<-13/25
dif<-(9/12)-(4/13)
varian<-((1/12)+(1/13))*prop*(1-prop)
Tranqüilo? Só segui as instruções. Agora podemos calcular o nosso z:
z<-dif/sqrt(varian)
E então calcular um p-valor:
> 2*pnorm(z, lower.tail=F)
[1] 0.02699857
Claro que isso seria o mesmo que fazer z ao quadrado e calcular o p-valor pela Qui-
quadrada, certo?
> pchisq(z^2, df=1, lower.tail=F)
[1] 0.02699857
Aliás, podemos também conferir o valor dessa estatística com a saída acima:
> z^2
[1] 4.890902
(b) Novamente a saída para conferir:
1
> prop.test(c(9,4),c(12,13))
 2-sample test for equality of proportions with continuity
correction
data: c(9, 4) out of c(12, 13) 
X-squared = 3.2793, df = 1, p-value = 0.07016
alternative hypothesis: two.sided 
95 percent confidence interval:
 0.01151032 0.87310506 
sample estimates:
 prop 1 prop 2 
0.7500000 0.3076923
É pena que haja um erro no enunciado e na verdade nós temos que diminuir a quantidade do
módulo da diferença e não somar. Bem, faz parte... Vamos calcular a correção:
corr<-(1/24)+(1/26)
E agora vamos