Buscar

Aplicações qui-quadrado LD

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

SBSSSS:
jj|§§3ill
Capítulo 11
I
@
I; *
i •
de qui-quadrado
'
objetivos;
11.1 Estatística
qui-quadrado
11.1 Estatística
qui-quadrado
11.2 Inferências
referentes a
experimentos
multinomiais
HÁ VÁRIOS PROBLEMAS PARA OS QUAIS OS
DADOS ENUMERATIVOS SÃO CATEGORIZADOS E OS
RESULTADOS, MOSTRADOS POR MEIO DE CONTAGENS.
11.3 Inferências
sobre tabelas de
contingência
Para ilustrar esse fato, pense em comida apimentada. Se você gos¬
ta de comida apimentada, provavelmente, tem um jeito preferido de
“refrescar” sua boca depois de comer seu prato apimentado favorito.
Alguns dos métodos mais utilizados são: beber água, leite, refrigeran¬
te ou cerveja, ou ainda comer pão ou outro alimento. Há ainda algu¬
mas pessoas que preferem não refrescar a boca em tais ocasiões, logo,
nada fazem. A seção snapshot do USA Today “Putting Out the Fire”
(Apagando o fogo), mostrada a seguir, apresenta os seis métodos
mais utilizados por adultos, após comerem alimentos apimentados.
Recentemente, foi solicitado a 200 adultos, que afirmavam amar
comida apimentada, que dissessem qual era sua maneira favorita de
refrescar a boca, após comer alimentos com pimenta. É apresentado,
a seguir, um resumo da amostra.
Método Água Leite Refrigerante Cerveja
Número 73 35 20
Dados de contagem como esses
são, frequentemente, chamados dados
enumerativos.
De forma semelhante, um conjun- §
to de notas de uma prova final pode f -ÿ —-ser exibido como uma distribuição de ?
frequência. Esses números de frequên¬
cia são contagens, o número de dados
que ficam em cada célula. Foi realiza-|
da uma pesquisa na qual foi solicitado
;
'%
I
°r,
$Ví
r
Pão Outros Nada
19 29 11 13
1 Um1
E
I lll&si
-mm i
ZL .
236 P„r,e 4: Mais estatística i n ferenci a I
nniynw -i
sail .Vfr-: ,
1a eleitores que informassem se eram registrados como republicanos, democratas ou outro partido
e se apoiavam ou não determinado candidato. Normalmente, os resultados são apresentados em
forma de gráfico, que mostra o número de eleitores de cada possível categoria. Inúmeros exemplos
dessa forma de apresentação de dados foram fornecidos ao longo dos dez capítulos anteriores.
fí\ LI
;
!Montagem de dados
Suponha que temos um determinado número de células nas quais n observações foram organiza¬
das. (O termo célula é sinónimo de classe. Os termos classe e frequência foram definidos e utiliza¬
dos nos capítulos anteriores. Antes de continuar, uma breve revisão dos Objetivos 2.1,.2.2 e 2.3
pode ser útil). As frequências observadas em cada célula são denotadas por Oj, 02, O,, . . . , Ok
(veja a Tabela 11.1 na próxima página). Perceba que a soma de todas as frequências observadas é
Ol+02 + ...+ Ok = n
em que né o tamanho da amostra.
S
Ifc
:m i
1
c.
•Vr pi *r. ãk» ’ . --I; U' .‘V%# rmr* , Á
. JSiil .èLJ&
1I ; f Kl» » * r-rJ
i
.'7 ' %
Pi - : ! 11
f:
1* /:jH-.' iJf Im
WÍ - _
P ‘‘
SÉiSr*•- •- JÀr % .51 mm.
ééSI Wm sV li1
Sis
;ill
discordância. Portanto, é usual que esses testes sejam
unicaudais, com a região crítica localizada à direita.
Em amostragens repetidas, o valor calculado de
na fórmula (11.1) terá uma distribuição amostrai que
pode ser aproximada pela distribuição de probabilidade
qui-quadrado quando n é alto. Essa aproximação é, geral¬
mente,considerada adequada quando todas as frequências
esperadas são iguais ou maiores que 5.Lembre-se de que as
distribuições qui-quadrado, assim como as distribuições-í
de Student, formam uma família de distribuições de pro¬
babilidade, cada uma sendo identificada pelo número do
parâmetro de graus de liberdade. O valor apropriado dos
graus de liberdade será descrito em cada teste específico.
A fim de usar a distribuição qui-quadrado, devemos estar
cientes de suas propriedades, que foram listadas no Obje¬
tivo 9.3, na página 198. (Veja também a Figura 9.7). Os
valores críticos para qui-quadrado são obtidos por meio
da Tabela 8 do Apêndice B. (Instruções específicas foram
fornecidas no Objetivo 9.3, na página 199).
O que gostaríamos de fazer é comparar as frequências
observadas a algumas frequências esperadas ou teó¬
ricas denotadas por Ev Ev Ev ... ,Ek (veja a Tabe¬
la 11.1), para cada uma dessas células. Novamente, a
soma dessas frequências esperadas deve ser exatamente
igual a n\
E, + E2 +...+ Ek = n
!!
Tabela 11.1 Frequências observadas
Categorias Ar
1a 2a 3a ... /r-ésima
Frequências 0, . 02 03 ... 0k
observadas
Frequências f, f2 £3 ...
esperadas
ITotal
n
n
......
Hipótese da utilização de qui-quadrado
para a realização de inferências
baseadas em dados enumerados:
A informação amostrai é obtida usando-se a amostra
aleatória retirada da população na qual cada indivíduo
é classificado de acordo com a(s) variável(eis)
categórica(s) envolvida(s) no teste.
Uma variável categórica é aquela que classifica ou
categoriza cada indivíduo dentro de uma célula ou classe
específica, em meio às demais. Essas células ou classes
são inclusivas e mutuamente exclusivas. A face voltada
para cima de um dado lançado é uma variável categóri¬
ca: a lista de resultados {1, 2,3,4, 5, 6} é um conjunto de
categorias inclusivas e mutuamente exclusivas.
Neste capítulo, permitimos certa “liberalização” com
respeito a hipóteses nulas e seus testes. Nos capítulos an¬
teriores, a hipótese nula foi sempre uma declaração sobre
um parâmetro populacional (|x, a ou p). No entanto, há
outros tipos de hipóteses que podem ser testadas, assim
Decidiremos, então, se as frequências observadas pare¬
cem concordar ou discordar das frequências esperadas.
Faremos isso por meio do teste de hipótese com qui-
-quadrado, x2-
í
i
:
Resumo do procedimento
do teste
Para a realização de um teste de hipótese com qui-qua¬
drado, precisamos começar pela compreensão do se¬
guinte teste estatístico:
Teste estatístico para qui-quadrado
X2* = S —wtodas as células t
(O-E)2 (11.1)
Este valor calculado para qui-quadrado é a soma de vários
números não negativos, um de cada célula (ou catego¬
ria). O numerador de cada termo da fórmula para x2ÿ- é
o quadrado da diferença entre os valores das frequências
observadas e esperadas. Quanto mais próximos estive¬
rem esses valores, menor será o valor de (O-E)2; quan¬
to mais separados estiverem, maior será o valor de (O-
E)z. O denominador para cada célula coloca o tamanho
do numerador em perspectiva, ou seja, uma diferença (O
-E) de 10 resultante das frequências de 110 (O) e 100
(E) é muito diferente de uma diferença de 10 resultante
de 15 (O) e 5 (E).
Essas ideias sugerem que valores pequenos de qui-
-quadrado indicam concordância entre os dois conjun¬
tos de frequências, enquanto valores maiores indicam
Karl Pearson
e o qui-quadrado
Conhecido como um dos pais da estatística moderna, I
238 Parte 4: Mais estatística inferencial
=
<;como “este é um dado imparcial- possui seis lados com
um número diferente em cada, sem repetições” ou “a
altura e peso dos indivíduos são independentes”. Note
que, essas hipóteses não são afirmações sobre um parâ¬
metro, apesar de, às vezes, elas serem mencionadas com
valores de parâmetros específicos.
Considere a afirmação “este é um dado imparcial”,
p = P(outro número qualquer) =|e você quer testá-la. O
que você faria? Sua resposta foi algo como: Lançar este
dado várias vezes e registrar os resultados? Súponha que
você decidiu lançar o dado 60 vezes. Se este dado é im¬
parcial, o que você espera que ocorra? Que cada número
(1, 2,...,6) deva aparecer, aproximadamente g das vezes
(ou seja, dez vezes). Se cada número aparecer, aproxima¬
damente, dez vezes, você certamente aceitará a afirmação
de imparcialidade [p = \ para cada valor). Se, por acaso,
o dado favorecer alguns determinados números, você re¬
jeitará a afirmação. (O teste estatístico calculado
terá um valor alto neste caso, como veremos em breve).
trerejeitar ou não a afirmação “este é urr/dado impar¬
cial”. (A probabilidade pára cada númeroé|).0,dádo é ,
lançado de um copo pára uma superfície plana e lisÿ 60 , f
vezes, com as seguintes frequências observadas:
Número
Frequência observada
A hipótese nula de que o dado é imparcial é considera¬
da como sendo verdadeira. Isso nos permite calcular as
frequências esperadas. Se o dado é imparcial, esperamos
dez ocorrências de cada número.
Agora, vamos calcular um valor observado de x2-
Esses cálculos são mostrados na Tabela 11.2. O valor
calculado é x2"fc = 2,2.
Agora,vamos usar nossoconhecido teste de hipóteses
em cinco passos.
i
i, í
1234 .56;
7 12 10 12 8 11
a. Parâmetro de interesse:
A probabilidade na qual cada lado fica voltado
para cima: P(l), P(2), P(3), P(4), P(5), P(6).
b. Afirmação das hipóteses:
Wo: o dado é imparcial |cadap =
Hjo dado não é imparcial
(ao menos um p é diferente dos demais).
61.2' Inferências
referentes
a experimentos
multinomiais
\
a- Verifique as premissas:
O dado foi coletado de maneira aleatória e cada re¬
sultado é um dos seis números.
b. Teste estatístico:
Em um experimento multinomial, o grau de liberda¬
de é = k-1, em que kéo número de células.PROBLEMA ANTERIOR SOBRE O DADO É
UM BOM EXEMPLO DE UM EXPERIMENTO
MULTINOMIAL.
h% Vamos retomar esse problema. Suponha que vocêqueira testar esse dado (em a = 0,05) e decidir en- ..,.•11/ y.Tabela 11.2 Cálculos para obtenção de x2
(0-E)2 I ©•••W n deve ser «9ÿ avOÿE==n-
Tabela V»-2'
Número Observadas (0) Esperadas (£) 0 — E (0 — E)2 E
1 7 10 -3 9 0,9
ft
2 12 2 0,410 4
3 10 10 0 0 0,0Ii 0,4 §124 10 2 4 VocêP0!
t
umaV
dona
5 8 10 -2 4 0,4 com°
rnostra 16 11 10 1 0,11 &r P2'2 ITotal 60 60 0/
*
2394 Capítulo I I : Aplicações de qui-quadrado
'T
Utilizando a fórmula (11.1), temos
X2*= V
A distribuição qui-quadrado e a fórmula (11.1),com
grau de liberdade = k- l = 6- í = 5.
c. Determine o nível de significância, OL.
a = 0,05
{Q-E)\
E 'todas as células
X2ÿ = 2,2
(os cálculos são mostrados na Tabela 11.2).
a. Informação amostrai: veja a Tabela 11.2.
b. Teste estatístico calculado: .|g||f Distribuição de probabilidade:Como sempre, podemos usar tanto o valor-p quanto
o procedimento clássico:
I
\Usando o procedimento clássico:
a. A região crítica é a cauda localizada à direita,
pois os valores maiores de qui-quadrado discor¬
dam da hipótese nula O valor crítico é obtido
da Tabela 8, na interseção da linha do grau de
liberdade = 5 e a coluna a = 0,05:
X2(5, 0,05) = 11,1
Usando o procedimento do valor-p:
a. Utilize a cauda localizada à direita, pois os valores
maiores de qui-quadrado discordam da hipótese
nula:
P = P(X2*>2,2|gl = 5)
conforme é mostrado na figura a seguir.
valor-pL £\l a = 0,05 V:0 2,2 5 I
Para determinar o valor-p, você tem duas opções:
1. Use a Tabela 8 do Apêndice B para atribuir limi¬
tes ao valor-p: 0,75 < P < 0,90.
2. Use um computador ou uma calculadora para
determinar o valor-p: P = 0,821.
Para instruções específicas, veja a página 201.
O valor-p não é menor que o nível de significância, a.
0 2,2 5 TC11,1
Para instruções específicas, veja a página 199.
b. ’x2~k não está na região crítica, como é mostra¬
do em vermelho na figura anterior.
s
«
1Vb-
3. A probabilidade associada a cada célula foi de|,
constante em todos os testes. (Seis valores de|so¬
mados a 1,0.)
4. Quando o experimento chegou ao fim, havia uma
lista de seis frequências (7, 12, 10, 12, 8 e 11) que,
somadas, totalizam 60, o que indica que cada resul¬
tado foi levado em conta.
[jOsIsIglI] a. A decisão é: não rejeitar Ho.
b. Conclusão:
No nível 0,05 de significância, as frequências
observadas não são significativamente diferentes
daquelas de um dado imparcial.
Antes de olharmos os outros exemplos, devemos de¬
finir o termo experimento multinomial e estabelecer as
diretrizes de como completar o teste qui-quadrado.
O exemplo do dado vai ao encontro da definição de
um experimento multinomial, pois ele possui as quatro
características descritas na definição.
O procedimento de teste para experimentos multi-
nomiais é muito parecido com o descrito nos capítulos
anteriores. A grande mudança reside na declaração da
hipótese nula. Ela pode ser uma declaração verbal, assim
como no exemplo do dado: “Este é um dado imparcial”.
Geralmente, a alternativa da hipótese nula não é decla¬
rada. No entanto, neste livro, a hipótese alternativa será
mostrada, desde que auxilie na organização e na compre¬
ensão do problema. Contudo, ela não será usada para
determinar a localização da região crítica, assim como
no caso dos capítulos anteriores. Para experimentos
1, O dado foi lançado n (60) vezes de forma idêntica
e os testes são independentes com relação uns aos
outros. (O resultado de cada teste não foi afetado
pelos resultados de outros testes).
2. A cada vez que o dado foi lançado, um dos seis núme¬
ros apareceu ecada número foi associado a uma célula.
j
í
240 Parte 4: Ma is estatística i n fe r e n c i a I
I
4
7
Cada frequência esperada, £., será determinada multipji-
cando-se o número total de testes n pela probabilidade
correspondente (p.) para cada célula, Ouseja,
'iI;
V tv
e?
%Valor esperado para
experimentos multinomiais
E, = n -P,
Uma diretriz deve ser cumprida para assegurar uma
boa aproximação da distribuição qui-quadrado: cada
frequência esperada deve seg pelo menos, igual a 5 (ou
seja, cada E. > 5). Algumas vezes, é possível combinar
células “menores” para cumprir essa diretriz. Se essa di¬
retriz não pode ser cumprida, então, medidas corretivas
devem ser tomadas para garantir uma boa aproximação.
Essas medidas corretivas não são abordadas neste livro,
no entanto, são discutidas em diversas outras fontes.
-1
(11.3)If K- - ; te:£.1 I:
Experimento multinomial
Um experimento multinomial possui as seguintes
características:
TESTE DE HIPóTESE MULTINOMIAL COM FREQUêNCIAS
IGUALMENTE ESPERADAS
Situações multinomiais ocorrem regularmente na vida
cotidiana. Considere o exemplo de matrículas para cur¬
sos universitários. Estudantes universitários têm insisti¬
do na liberdade de escolha quando se matriculam em
determinado curso. Neste semestre, há sete turmas para
um determinado curso de matemática. As turmas estão
previstas para reunirem-se em diversos horários com
uma variedade de professores. A Tabela 11.3 mostra o
número de estudantes que escolheram cada uma das sete
turmas. Os dados indicam que os estudantes tiveram
preferência por certas turmas, ou que cada turma tinha
a mesma probabilidade de ser escolhida?
1. Consiste em n testes independentes idênticos.
2. O resultado de cada teste encaixa-se perfeita-
mente em uma das possíveis células k.
3. Há uma probabilidade associada a cada célula
em particular. Além disso, essas probabilidades
individuais permanecem constantes durante o
experimento. (Este deve ser o caso de p, + p2 +
•••+ Pk— T.)
4. O experimento resultará em um conjunto de
frequências observadas k, 0]f 02, ...,Ok, no qual g;
I cada O.é o número de vezes que um resultado *
! do teste cai em uma determinada célula. (Este
deve sér o caso de 02 4 p2 -f ...+ Ok = n.)
:
í
|
I
|
l
Tabela 11.3 Dados de matrículas para as turmas t
íTurma
1 2 3 4 5 (j 7 Tptal
Números de alunos 18 12 25 23 8 19 14 119
;
multinomiais, sempre utilizaremos uma região crítica
umcauual, e esta será a cauda localizada à direita da
distribuição "X2, pois desvios maiores (positivos ou ne¬
gativos) dos valores esperados levam a um aumento no
valor x2ÿ calculado.
O valor crítico será determinado pelo nível de signi-
ficância atribuído (a) e pelo número de graus de liberda¬
de. O número de graus de liberdade (gl) será 1 a menos
que o número de células (k), valor pelo qual os dados
serão divididos:
Se nenhuma preferênciafoi mostrada na seleção de
turmas, então, podemos esperar que os 119 alunos se¬
jam igualmente distribuídos entre as sete turmas, ou seja,
esperamos que 17 alunos se matriculem em cada turma.
Utilizando o processo de cinco passos, vamos completar
o teste de hipótese no nível de significância de 5% e ve¬
rificar se os estudantes foram igualmente distribuídos.
a. Parâmetro de interesse:
Preferência por cada turma ou a probabilidade de
que uma determinada turma seja escolhida no ato
da matrícula.
PASSO 1Graus de liberdade para experimentos
multinomiais
gl = k-1 (11.2)
241Capítulo 11: Aplicações de qui-quadrado
(n
T
b. Teste estatístico calculado:
Utilizando a fórmula (11.1), temos
b. Afirmação das hipóteses:
Ho: não houve demonstração de
preferência (igualmente distribuídos).
Hg: houve demonstração de preferência
(não igualmente distribuídos).
I
(O-E)2,X2* = Xtodas as células E
7(18- 17)2 , (12 — 17)2 , (25 — 17)2 í; I17 17 17
a. Premissa:
Os 119 estudantes representam uma amostra alea¬
tória da população de todos os alunos que se matri¬
cularam para este curso em particular. Uma vez que
nenhuma nova regra tenha sido introduzida na sele¬
ção de cursos e que as matrículas pareçam proceder
em seu padrão usual, não há razão para acreditar
que esta não seja uma amostra aleatória.
b. Teste estatístico a ser usado:
I
2
(23 — 17)2 , (8 — 17)2 , (19-17)2 , (14-17)2] 17 17 17 17
(1)2 , (~5)2 , (8)2 (6)2 (—9)2 (2)2 (—3)2_
17 + 17 + 17 + 17" + 17 + — +17 171 +25 + 64 + 36 + 81 + 4 + 9 _ 220 — f 2 941117 17
= 12,94
Novamente, podemos usar tanto o valor-p quanto o
procedimento clássico:
Á distribuição qui-quadrado e a fórmula (11.1),comí
gl = 6.
c. Nível de significância: a = 0,05.:
a. Informação amostrai: veja a Tabela 11.3.
* Usando o procedimento do valor-p: Usando o procedimento clássico:
a. A região crítica é a cauda localizada à direi¬
ta, pois os valores maiores de qui-quadrado
discordam da hipótese nula. O valor crítico
é obtido da Tabela 8, na interseção da linha
do gl = 6 e a coluna a = 0,05:
X2(6,0,05) = 12,6
a. Utilize a cauda localizada à direita, pois os valores
maiores de qui-quadrado discordam da hipótese nula:
P = P(X2T*>12,94|gl = 6)
conforme é mostrado na figura a seguir.
7
7
7
i|valor-p * a = 0,05 í.
X26 12,940 x20 6 12,6
12,94
Para determinar o valor-p, você tem duas opções:
1. Use a Tabela 8 do Apêndice B para atribuir limi¬
tes ao valor-p: 0,025 < P < 0,05.
2. Use um computador ou uma calculadora para
determinar o valor-p: P = 0,044.
I Para instruções específicas, veja a página 201.
\ b. O valor-p é menor que o nível de significância,a.
Para instruções específicas, veja a página
199.
b. está na região crítica, como é mostrado
em vermelho na figura anterior. I
,s*\ ———j. v ......
informações fornecidas. Pode ser preferência por
professor, horário ou conflito de agenda.
Conclusões devem ser tiradas com cuidado, a fim de
evitar a sugestão de conclusões que os dados não pos- ;|
sam sustentar.
SítSSi a. A decisão é: rejeitar Hq.
b. Conclusão:
No nível de significância 0,05, parece haver uma
demonstração de preferência. Contudo, não se pode
determinar que preferência seja essa com base nas
7
:!
7242 Parte 4: Mais estatística inferencial
•A
I •I .?ÿ
w \
a. Informação amostrai: / , ,
As frequências observadas são: 3*15, 101, ÍÒS t $i.
b. Teste estatístico calculado: li
’ IA razão 9:3:3:1 indica probabilidades de \
T6’T6’T6el6- Í
Portanto, as frequências esperadas são
n = EO,= 315 + 101 + 108 + 32 = 556
Os cálculos para a obtenção de x2* são mostrados na
Tabela 11.4.
TESTE DE HIPóTESE MULTINOMIAL COM
FREQUÊNCIAS IGUALMENTE ESPERADAS
Nem todos os experimentos multinomiais re- fcjj
* sultam em frequências igualmente esperadas. 1|
Por exemplo, a teoria mendeliana da herança afirma f|
que as frequências de ervilhas redondas e amarelas,
£ rugosas e amarelas, redondas e verdes e rugosas e ver- 1
|des ocorrerão na razão 9:3:3:1 quando duas varieda- *
des específicas de ervilhas são cruzadas.Para testar essa
teoria,Mendel obteve frequências de 315,101,108 e 32,
respectivamente. Ao completar nosso teste de hipótese de
cinco passos no nível 0,05 de significância, vamos
descobrir se os dados amostrais fornecem evidên¬
cias suficientes para rejeitar a teoria de Mendel.
I
*I
Tabela 11.4 Dados necessários para calcularx2ÿ
(0-f)20 E 0—Ea- Parâmetro de interesse:
As proporções: P(redonda e amarela),
P(rugosa e amarela), P(redonda e verde),
P(rugosa e verde).
b. Afirmação das hipóteses:
Ho: 9:3:3:1 é a razão de herança.
Hg: 9:3:3:1 não é a razão de herança.
IE
i.315 312,75 2,25 0,0162
101 104,25 -3,25 0,1013
108 104,25 3,75 0,1349
32 34,75 -2,75 0,2176
v
<0-£Px!*=S556 556,00 0/ 0,4700 r~=W7 Itodas as células
.
a- Premissas:
Suponhamos que os resultados de Mendel formem
uma amostra aleatória.
b. Teste estatístico a ser usado:
A distribuição qui-quadrado e a fórmula (11.1),
com grau de liberdade = 3.
c. Nível de significância: a = 0,05.
A distribuição de probabilidade:
•#í Novamente, podemos usar tanto o valor-p quanto o
procedimento clássico:
Usando o procedimento do valor-p:
j a. Utilize a cauda localizada à direita, pois os valores
j maiores de qui-quadrado discordam da hipótese nula:
i P = P(x2*->0,47|gl = 3)
conforme é mostrado na figura a seguir.
\Usando o procedimento clássico:
a. A região crítica é a cauda localizada à direi¬
ta, pois os valores maiores de qui-quadrado
discordam da hipótese nula. O valor crítico é
obtido da Tabela 8, na interseção da linha do
gl = 3 e a coluna a = 0,05:
X2(3,0,05) = 7,81 :í--ivalor-p
A , — f0 0,47 3 a = 0,05
Para determinar o valor-p, você tem duas opções:
1. Use a Tabela 8 do Apêndice B para atribuir limites
ao valor-p: 0,90 < P < 0,95.
j 2. Use um computador ou uma calculadora para
determinar o valor-p: P = 0,925.
Para instruções específicas, veja a página 201.
b. O valor-p não é menor que o nível de significância, a.
0 0,47 3 7,81
Para instruções específicas, veja a página 199. j§
b. não está na região crítica, como é mos¬
trado em vermelho na figura anterior.
243Capítulo 11: Aplicações de qui-quadrado
3J
T
Teste de independência
Para ilustrar um teste de independência,, consideremos
uma amostra aleatória que apresente os sexos de estudan¬
tes universitários de artes liberais e suas áreas acadêmicas
favoritas. Cada pessoa em um grupo de 300 estudantes
foi identificada como do sexo masculino ou feminino e
questionada sobre a preferência acadêmica: artes liberais
na área de exatas, ciências sociais ou humanas. A Tabela
11.5 é uma tabela de contingência que mostra as frequên¬
cias encontradas para essas categorias. Essa amostra apre¬
senta evidências suficientes para rejeitar a hipótese nula
“a preferência por exatas, ciências sociais ou humanas é
independente do sexo de um estudante universitário”?
Para descobriÿ vamos completar o teste de hipótese utili¬
zando o nível de significância 0,05.
: a. A decisão é: não rejeitar Hq.
b. Conclusão:
No nível de significância 0,05, não há evidências su¬
ficientes para rejeitar a teoria de Mendel.
:
i
2 * % % - % -m t *?* I
-n.3
5
Inferências
sobre a. Parâmetro de interesse:
A determinação da independência das variáveis “sexo”
e “área acadêmica favorita” requer que discutamos a
probabilidade dos vários casos e o efeito que respostas
a respeito de uma variável têm sobre a probabilidade
de respostas com relação à outra variável. Indepen¬
dência, conforme a definição do Capítulo 4, requer
P(E|M) = P(E|F) = P(E); ou seja, o sexo não exerce
influência sobre a probabilidade de escolha de uma
área acadêmica por determinada pessoa.
b. Afirmação das hipóteses:
H:a preferência por exatas, ciências sociais ou
humanas é independente do sexo de um estudante
universitário.H:a preferência pela área acadêmica não é
independente do sexo do estudante.
tabelas de
contingência
UMA TABELA DE CONTINGÊNCIA É
UMA DISPOSIÇÃO DE DADOS EM UMA
CLASSIFICAÇÃO FEITA DE DUAS MANEIRAS.
Os dados são organizados em células e o número de da¬
dos em cada célula é informado. A tabela de contingên¬
cia envolve dois fatores (ou variáveis). Além disso, uma
questão comum a respeito dessas tabelas é se os dados
indicam que as duas variáveis são dependentes ou inde¬
pendentes (veja as páginas 90 a 93).
Dois diferentes testes utilizam o formato da tabela
de contingência. O primeiro a ser abordado é o teste de
independência.
1!
I .5 1
MLik
mTabela 11.5 Resultados amostrais para sexo e
preferência de área acadêmica
zfi *1 'TI
Área acadêmica preferida
Exatas Ciências Humanas
(E) sociais (CS) (H)
m
! ívTotalSexo y '
.
t-Estudantes dosexo 37
masculino (M)
Estudantes do 35
sexo feminino (F)
12241 44 *71 17872 ~r: —Total 115 30072 113 V- . " y
rC mm < !í ;244 Parte 4: Mais estatística inferencial
i__; ii
'
E- Cy.%
DE QUE DOIS EVENTOS
“°
primeiras células da primeira linha, os outros quatro
valores de células são fixados:
A o
m?mm a. Premissas:
A informação amostrai é obtida usando-se uma amostra
aleatória retirada de uma população e, em seguida,
cada indivíduo é classificado de acordo com o sexo e
área acadêmica preferida.
b. Teste estatístico a ser usado:
No caso das tabelas contingenciais, o número de
graus de liberdade é exatamente o mesmo que o nú¬
mero de células na tabela, que podem ser preenchi¬
das livrementé quando se tem os totais marginais.
Os totais para nossos estudantes universitários são
exibidos na tabela a seguir:
50 60 C 122
D E F 178
72 113 115 300
Os valores têm de ser C = 12, D = 22, E = 53 e F-
103. Caso contrário, os totais não estariam corretos.
Portanto, há duas opções para este problema. Cada
opção corresponde a 1 grau de liberdade. Logo, o
número de graus de liberdade para o nosso exemplo
é igual a 2 (gl = 2).
A distribuição qui-quadrado será usada juntamente
com a fórmula (11.1), com grau de liberdade = 2.
Nível de significância:a = 0,05.
122
178
72 113 115 300 c.
BBEEBB a- Informação amostrai: veja a Tabela 11.5.
b. Teste estatístico calculado:
Antes de podermos calcular o valor de qui-quadrado,
precisamos determinar os valores esperados, E, para
cada célula. Para fazê-lo, precisamos relembrar as
Dados esses totais, podem-se preencher apenas duas
células antes de todas as demais serem determina¬
das. (Os totais devem, obviamente, permanecer os
mesmos.) Por exemplo, uma vez que escolhemos dois
valores arbitrários (digamos, 50 e 60) para as duas
V ir*
:
'
msm : - :SlijgfsS
fn——r • .-•••1 i
HPíIÍPÍÍPH
ate que haja ev.dèncias para rejeitá-lã
" suposição em nosso exemplo, estamo
. dizendo que o evento de um estu’
a&H|méntejerdosexomasct __
íhálllS§lisulteafór
verdade, multiplicando-se a probabilidade (ou proporção) M-.....—LL*áilino esexMW&- m\- u, isperace estúdantèsÿdo'sexo, 1|
, ciências exatas " nf|n' -
tern
i ISenderitesÿitéri
Wm
jpárãS;
WÊÊÊ
mo
rJr 1PZ6dem 't. 1 ’ilida. 3m ser deterimÊSmm '.'Mir de ÊÈÊÊÊ
HI I t... asmM - Ilgi
1
Normalmente, a tabela de contingência é escrita de :i
forma que contenha todas essas informações (veja a Ta- '
bela 11.7). T
Tabeía 11.7 Tabela contingencial com os resultados
amostrais e valores esperados
hipóteses nulas, que afirmam que esses fatores são
independentes. Portanto, esperamos que os valores
sejam distribuídos na proporção dos totais margi¬
nais. Há 122 pessoas do sexo masculino e espera¬
mos que sejam distribuídas entre E, CS e H pro¬
porcionalmente aos totais 72, 113 e 115. Assim, as
contagens esperadas da célula para pessoas do sexo
masculino são Área acadêmica preferida
Exatas Ciências sociais Humanas
Estudantes 37(29,28) 41(45,95) 44(46,77)
do sexo
masculino
Estudantes 35(42,72) 72(67,05) 71 (68,23)
dosexo
feminino
TotalSexoM:-U2 4ÍI-122 4ÿ-122 122300 300300
Do mesmo modo, esperamos para pessoas do sexo
feminino
178
4ÍI-178300300
Desta maneira, os valores esperados ficam conforme
mostrado na Tabela 11.6. Sempre verifique os totais
marginais para os valores esperados em comparação
aos totais marginais para os valores observados.
Total 72 113 115 300
O qui-quadrado calculado é
(O-fl2.x2ÿ = StodasascélulasTabela 11.6 Valores esperados
E CS
Estudantes 29,28 45,95 46,77
do sexo
masculino
Estudantes do 42,72 67,05 68,23
sexo feminino
E '
!,rTotal (37 — 29,28)2 , (41 — 45,95)2 , (44-46,77)2H X2ÿ — 29,28 45,95 46,77122,00|
(35 — 42,72)2 , (72 — 67,05)2 , (71 -68,23)2
42,72 67,05 68,23
= 2,035 + 0,533 + 0,164 + 1,395 + 0,365 + 0,112178,00
7 = 4,604
IUI300,00|Total 72,00 113,00 115,00
Novamente, podemos usar tanto o valor-p quanto o
procedimento clássico:
.
/Usando o procedimento clássico:
a. A região crítica é a cauda localizada à direi¬
ta, pois os valores maiores de qui-quadrado
discordam da hipótese nula. O valor crítico
é obtido a partir da Tabela 8, na interseção 1
da linha do gl = 5 e a coluna a = 0,05:
X2(2,0,05) = 5,99
Usando o procedimento do valor-p:
a. Utilize a cauda localizada à direita, pois os valores
maiores de qui-quadrado discordam da hipótese
nula:
P = P(X2-Ar>4,604|gl = 2)
conforme é mostrado na figura a seguir.
:
.
I* valor-p
a=0,05 I
4,604 X20 2
X20 2 5,99
4,604Para determinar o valor-p, você tem duas opções:
1. Use a Tabela 8 do Apêndice B para atribuir limi¬
tes ao valor-p: 0,10 < P < 0,25.
2. Use um computador ou uma calculadora para
determinar o valor-p: P = 0,1001.
, Para instruções específicas, veja a página 201.
\ b. O valor-p não é menor que a.
|
Para instruções específicas, veja a página
199.
b. x2ÿ não está na região crítica, como é mos¬
trado em vermelho na figura anterior. ;
-246 Parte 4: Mais esta tística inferencial
:
? IT \
Í
Deve-se, novamente, observar' a diretri? mencionada }
previamente: Cada E. . deve sér, pelo menos; igual a 5. %
le a.A decisão é: não rejeitar Ho.
b. Conclusão:
No nível de significância 0,05, as evidências não nos
permitem rejeitar a independência existente entre o
sexo de um estudante e sua preferência por determi¬
nada área acadêmica.
i-
$
;sTeste de homogeneidade
O segundo tipo de problema de tabela contingencial é
chamado teste de homogeneidade. Esse teste é utilizado
quando uma das duas variáveis é controlada pelo expe¬
rimentador, de forma que os totais da linha ou coluna
sejam predeterminados.
Por exemplo, suponha que queiramos fazer uma pes¬
quisa com eleitores registrados a respeito de uma lei pro¬
posta pelo governador. Na pesquisa, 200 moradores da
área central da cidade, 200 do subúrbio e 100 da zona
rural foram selecionados aleatoriamente e questionados
se eram a favor ou contra a proposta do governador. Ou
seja, é extraída uma amostra aleatória simples de cada
um desses três grupos. Um total de 500 eleitores participa
da pesquisa. Porém, repare que a quantidade de eleitores
que ficará em cada categoria de linha foi predeterminada
(antes de a amostra ser extraída),conforme é mostrado na
. Tabela11.9,e cada categoria é amostrada separadamente.
í?
1 De forma geral, a tabela contingencial l x c (l é o
número de linhas; céo número de colunas) é usada para
testar a independência do fator linha e do fator coluna.
O número de graus de liberdade é determinado por:
i-
I
l
;•
Graus de Uberdade para
tabelas de contingência
gl = (/-1) (c-1)
em que / e c são ambos maiores que 1. (Esse valor para
gl deve concordar com o número de células contadas, de
acordo com a descrição geral das páginas 244 e 245).
As frequências esperadas para uma tabela de con¬
tingência l X c sãó encontradas por meio das fórmulas
fornecidas por cada célula da Tabela 11.8, em que n =
total geral. De forma geral,a frequência esperada na in¬
terseção da /-ésima linha e /-ésima coluna é dada por:
I
n
(11.4)
g
N
!a& Mtaçêeâ,
Frequências esperadas para tabelas
contingenciais
i
notação usada na Tabela 11.8
e a fórmula (11.5) podem ser
|novas para você. Por conveniência,
I quando nos referirmos a células ou
|entradas de uma tabela, usaremos
I E.. para denotar a entrada na
I /-ésima linha e/-ésima coluna.
I Ou seja, a primeira letra subscrita §
1 corresponde ao número da linha e
I a segunda, ao número da coluna.
i Portanto, Eu é a entrada daI primeira linha, segunda coluna, é
i £11 éa entrada da segunda linha,I primeira coluna. Na Tabeia 11.6I (página 246), Eu é 45,95 e E21 éH 42,72. A notação usada naTabela
H 11.8 é interpretada de forma
I similar, ou seja, L1 corresponde ao
1total da linha 1,e C, corresponde
H ao total da coluna 1.
A :ÿ_ totalde linhas x totalde colunas _ L. x C. 01.5)o ;total geral n i
Tabela 11.8 Frequênciasesperadas para uma tabela contingencial / x c v
i : IColuna
j-enésima
Í5 linha TotalLinha 21 Ic
LyxCi,xC, flXC21 n n n
1 Ii2xC, *22 n t
l
/-enésima WiLxCr Llinha n n
n
. aI :n II
Total ” J í
V.,srv',,
• "
247Capitulo 1 I: Aplicações de qu i-quadrado
U
b. Afirmaçao das hipóteses:
Ho: a proporção de eleitores a favor da iei proposta é
a mesma para os três grupos de locais de residência.
H\ a proporção deeleitores a favor da lei proposta não
é a mesma para os três grupos de locais de residência.
(Ou seja, em, pelo menos, um grupo uma proporção é
diferente da outra).
Tabela 11.9 Registroda eleição tom totais lineares
predeterminados iíI ':V‘,Proposta dogovernador
A favor Contra
:
TotalResidência
Residem na área central da cidade
Residem no subúrbio
Residem na zona rural
§
200
2Q0 ÍÍiÿgÍS%flÿl a. Premissas:
A informação amostrai é obtida utilizando três
amostras aleatórias retiradas de três populações se¬
paradas, nas quais cada indivíduo é classificado de
acordo com sua opinião.
100
y
500Total
; : " '
b. Teste estatístico a ser usado:Em um teste dessa natureza, estamos, na verdade,
testando a hipótese: a distribuição das proporções den¬
tro das linhas é a mesma para todas as linhas. Ou seja,
a distribuição das proporções da linha 1 é a mesma da
linha 2, que é a mesma da linha 3, e assim por dian¬
te. A alternativa é: a distribuição de proporções dentro
das linhas não é a mesma em todas as linhas. Este tipo
de exemplo pode ser considerado uma comparação de
vários experimentos multinomials. Além dessa diferença
conceituai, o verdadeiro teste de independência e homo¬
geneidade com tabelas contingenciais é o mesmo.
Vamos demonstrar esse teste de hipótese comple¬
tando o exemplo da pesquisa no nível de significâncía
0,05. A evidência amostrai apresentada na Tabela 11.10
sustenta a hipótese: “eleitores dentro dos diferentes gru¬
pos de locais de residência possuem diferentes opiniões
sobre a proposta do governador”?
A distribuição qui-quadrado e a fórmula (11.1), com
1: gl = (/-l)(c-l) = (3-l)(2-l) = 2
c. Nível de significância:a = 0,05.
a. Informação amostrai: veja a Tabela 11.10.
b. Teste estatístico calculado:
Os valores esperados são determinados utilizando-se
a fórmula (11.5) (página 247) e fornecidos pela Ta¬
bela 11.11.
Tabela 11.11 Resultados amostraise valoresesperados
IProposta do governador
Local de residência A favor Contra
Residem na área 143 (101,6) 57 (98,4)
central da cidade
Residem no
subúrbio
Residem na zona 13(50,8) 87(49,2)
:vTotal
200
98(101,6) 102(98,4) 200Tabela 11.10 Resultados amostrais para residência
eopinião
i
H.ft'. 100
I
I
s;ruralProposta do
governador
A favor Contra
Residem na área central da cidade 143 57
Residem no subúrbio
Residem na zona rural
Total 254 246 500. j
TotalLocal de residência
RSOTA: Cada valor esperado é usado duas vezes no cál- J
culo de x2*- Portanto, é uma boa ideia manter casas deci- Jj
mais extras enquanto os cálculos são feitos.
O qui-quadrado calculado é
200:
98 102
13 87
200J 4i 100 í~
254 246Total 500
(O-E)2.X2* = .? £todas as célulasa. Parâmetro de interesse:
A proporção dos eleitores que são a favor ou contra
(ou seja, a proporção de eleitores que residem no cen¬
tro da cidade e que são a favor, que residem no su¬
búrbio e que são a favor, que residem na zona rural
e que são a favor e a proporção dos três grupos, se¬
paradamente, que são contra).
(143- 101,6)2 , (57 — 98,4)2 , (98- 101,6)2
101,6
(102 — 98,4)2 , (13 — 50,8)2 , (87-49,2)2
X2* = 101,6 98,4
98,4 50,8 49,2
= 16,87 + 17,42 + 0,13 + 0,13 + 28,13 + 29,04
= 91,72
;
248 Parte 4: Mais estatística inferência I
'ÿ W£ :A distribuição de probabilidade:
Novamente, podemos usar tanto o valor-p
quanto o procedimento clássico:
flt
àUsando o procedimento do valor-p:
a. Utilize a cauda localizada à direita, pois os valores
maiores de qui-quadrado discordam da hipótese nula:
P = P(X2**>91,72|gl = 2)
conforme é mostrado na figura a seguir.
Usando o procedimento clássico:
a. A região crítica é a cauda localizada à direita,
pois os valores maiores de qui-quadrado discor¬
dam da hipótese nula. O valor crítico é obtido
da Tabela 8, na interseção da linha do gl = 2 e a i
coluna a = 0,05:
X2{2,0,05) = 5,99
!ÿ
í
!ÿ
r
!;•
valor-p
91,72 tf0 a= 0,05
i - 7ÿ".—Para determinar o valor-p, você tem duas opções:
1. Use a Tabela 8 do Apêndice B para atribuir limites
ao valor-p: P < 0,005.
2. Use um computador ou uma calculadora para
determinar o valor-p: P = 0,000+.
Para .instruções específicas, veja a página 201.
b. O valor-p é menor que a.
0 2 5,99 X?
91,72
Para instruções específicas, veja a página 199.
b. x2ÿ está na região crítica, como é mostrado
em vermelho na figura anterior.
r
a. A decisão é: rejeitar Ho.
b. Conclusão: os três grupos de eleitores não possuem
as mesmas proporções dos que são a favor da lei
proposta, no nível de significância 0,05.
[
\
.
•
mi
Á::,1 . • ' i . *•"
Ui ii-i ;.tj
j
P
. •
m
m; sr s0Wlvrr k- ••••
, , r ediSaMBItesi
249i4 Capítulo Aplicações de qui-quadrado
*JV* '
1- I
Si
- v>
*ijSj
Objetivo 11.1
11.1 Referente à amostra de 200 adultos entrevistados no
exemplo sobre comida apimentada e ao gráfico "Apagan¬
do o fogo”da página 236:
a. Quais informações foram coletadas de cada adulto na
amostra?
b. Defina a população e a variável envolvida na amostra.
c. Utilizando os dados amostrais,calcule as porcentagens
para os vários métodos de refrescar a boca.
11.2Encontre esses valores críticos utilizando a Tabela 8 do
Apêndice B.
a. xmo.01) b. 6,0,025)
c. )í(40,0,10) d. X2(45,0,01)
11.3Utilizando a notação vistanoproblema 11.2,nomeiee en¬
contre os valores críticos de x2-
A B C 0 E
27 17 15 22 19
TotalPolidor
Frequência
Solucione os problemas seguintes usando a abordagem
do valor-p e a abordagem clássica:
a. Elabore a hipótese para "sem preferência" na termino¬
logia estatística.
b. Qual teste estatístico será utilizado no teste da hipóte¬
se nula?
c Complete o teste de hipótese usando a=0,10.
11.8 As balas Skittles são vendidas em saquinhos com várias
balas coloridas em cada. Você pode "provar o arco-íris"
com suas cinco cores e sabores originais: verde (lima),
roxo (uva), amarelo (limão), laranja (laranja) e vermelho
(morango). Diferentemente de algumas balas multicolo-
ridas disponíveis no mercado, a Skittles afirma que suas
cinco cores são igualmente prováveis. Em uma tentativa
de rejeitar essa afirmação, um saquinho de 4 onças (113,4
gramas) de Skittles foi adquirido e as cores contadas:
100 I
V
:
.
a.
r:?f
Vermelhas Laranjas Amarelas Verdes Roxas
18 21 23 17 27b.
a=0,05
n=26 Essa amostra contradiz a afirmação da Skittles no nível
0,05?
a. Solucione utilizando a abordagem do valor-p.
b. Solucione utilizando a abordagem clássica.11.9A seção Snapshot do USA Todayde16de outubro de 2009
intitulada “Falar ao celular em lugares públicos é falta de
educação?" informou os seguintes resultados de um rela¬
tório de pesquisa da FoxTV/Rasmussen:
Objetivo 11.2
11.4Elabore a hipótese nula Hoe a hipótese alternativa Ha que
seriam usadas para testar as seguintes afirmações:
a. As quatro opções são igualmente prováveis.
b. A pesquisa mostrou as distribuições de partidos políti¬
cos de 23%,36%e 41% para republicanos, democratas
e independentes,respectivamente.
c. Respostas favoráveis com relação à sustentabilidade e
os quatro intervalos designados por geração estavam
na razão de 11:15:8:6.
11.5 Determine o valor-p para os seguintes testes de hipóteses
envolvendo a distribuição x2:
a. H:P(1)=P(2) =P(3)=P(4) =0,25,com x2*=12,25
b. H°:P(l)=0,25,P(ll)=0,40,P(lll)=0,35, com X2* =5,98
11.6Determine valor e região críticos que seriam utilizados na
abordagem clássica do teste de hipótese nula para cada
um dos experimentos multinomiais a seguir:
a. H\ P(1)=P(2) =P(3) =P(4)=0,25,coma=0,05
b. H:P(l) =0,25, P(ll)=0,40,P(lll) =0,35, coma= 0,01
11.7Um fabricante de polidores de pisos conduziu um expe¬
rimento de preferência do consumidor a fim de determi¬
nar qual dos cinco diferentes polidores de pisos resultava
na melhor aparência. Uma amostra de 100 consumidores
analisou cincoamostras depisos quehaviamrecebido um
tipo de polidor cada. Cada consumidor indicou a amos¬
tra de sua preferência.O brilho e o plano de fundo foram
aproximadamente os mesmos para todas as amostras de
pisos.Os resultados foram os seguintes:
Respostas à pesquisa Porcentagem
Sim 51
Não 37
Não têm certeza
Comomembro do Comité de Ética da sua faculdade,você
decide conduzir uma pesquisa com os estudantes sobre
esse assunto. A tabela a seguir apresenta as respostas de ,í
300 alunos:
12
Respostas à pesquisa Número
Sim 126
Não 118 :
Não têm certeza 56 :
A distribuição das respostas dos estudantes universitários
difere de forma significativa dos resultados publicados
pela pesquisa de opinião pública? Use um nível de signi-
ficância de 0,01.
11.10 Os sistemas nacionais de saúde constituem uma grande
preocupação para os norte-americanos,atualmente.O ar- -#
tigo do USA Today "Pesquisa: Os norte-americanos estão
apreensivos com relação às mudanças nos sistemas de *
saúde?" de 31 de outubro de 2009,informou as seguintes
porcentagens sobre"Requisitos das companhias de segu- . jfc
< ;
-
- Parte, U. 250
'
"iros que você deve atender para ter a cobertura de certos
tratamentos"e sobre as mudanças no sistema de saúde: Porcentagem
Situação dos funcionários
1. Desesperadamente semauxílio-o atendimento aos'
pacientesfoiprejudicado
2. Sem auxílio,porém o atendimento aos pacientes lião foi ; 32
prejudicado
3. Adequado
4. Mais que adequado
5. Excelente
l
Ponto de vista de11a13 de setembro Porcentagem
Melhorou
Não mudou
Piorou
Desconhecido
22
35
38-38
125
6
Um mês depois,de 16 a T9 de outubro,outra pesquisa foi
realizada com 1.521 adultos. Outros pontos de vista são
separados por categorias na tabela a seguir:
Uma pesquisa realizada com 500 enfermeiras de hospitais
não atrativos forneceu as seguintes respostas à situação
dos funcionários:
Situação dos funcionários
Número
Ponto de vista de16 a19 deoutubro
Melhorou
Não mudou
Piorou
Desconhecido
Número 1 2 3 4 5
165 140 125 50 20
Os dados indicam que as enfermeiras dos hospitais não
atrativos possuem uma distribuição diferente de opiniões?
Usea=0,05.
a. Solucione utilizando a abordagem do valor-p.
b. Solucione utilizandoa abordagem clássica.
11.14 A amostra de 200 adultos coletada no exemplo de comi¬
das apimentadas da página 236 mostra uma distribuição
significativamente diferente damostradanográfico"Apa¬
gando o fogo"(página 236)? Usea=0,05.
11.15 De acordo com o site"The Harris Poll", a proporção de to¬
dos os adultos que vivem em residências com rifles (29%),
espingardas (29%) ou pistolas (23%) não mudou deforma
significativa desde 1996. No entanto, atualmente, mais
pessoas vivem em residências sem armas (61%). Os 1.014
adultos que participaram da pesquisa forneceram os se¬
guintes resultados:
380
380
i700
61
No nível de significância 0,05, as distribuições dos pontos
de vista mudaram deforma significativa entresetembroe
outubro de 2009?
11.11 Ocomportamentodeaves à prbcuradealimentoestá sen¬
do estudado em uma floresta controlada constituída por
pinheiros das seguintes espécies: Pseudotsuga (52% do
volume da copa), Pinus Ponderosa (36%) e Abies Grandís
(12%). Duzentos e trinta e oito pássaros trepadeira-azul-
-do-canadá foram observados: 105 em Pseudotsugas, 92
em Pinus Ponderosas e 41 em Abies Grandis. A hipótese
nula a ser testada é:"as aves procuram por alimento alea¬
toriamente, independentemente da espécie da árvore".
a. Elabore a hipótese alternativa.
b. Determine os valores esperados para o número de
pássaros procurando por alimento em cada espécie
de árvore.
c. Complete otestedehipótese usando a=0,05 e elabo¬
re, cuidadosamente,a conclusão.
11.12 Um determinado tipo de semente de flor produzirá flores
nas cores magenta, verde-amarelado e ocre na razão 6:3
:1 (uma flor por semente). Ao todo,100 sementes foram
plantadas e todas germinaram, resultando no seguinte:
Magenta Verde-amarelado Ocre
1
*
1
Todos os Todos os
adultos (%) proprietários
de armas (%)3
Que possuem rifle, espingarda e pistola (3 dos 3 tipos)
Que possuem 2 dos3 tipos (rifle, espingarda oupistola)
Que possuem1dos3 tipos (rifle, espingarda oupistola)
Não quiseram responder/Não têm certeza_
16 41
11 27
11 29
1 1 3
Total 39% 100%
Em uma pesquisa realizada na cidade de Memphis, com
2 mil adultos que alegaram possuir armas, 780 alegaram
possuir os três tipos, 550 alegaram possuir 2 dos 3 tipos,
560 legaram possuir 1 dos 3 tipos e 110 recusaram-se a
especificar quais tipos de armas possuíam.
a. Teste a hipótese nula de a distribuição do número de
tipos de armas possuídas ser a mesma para Memphis
e para a nacionalmente informada na pesquisa do
site “The Harris Poll". Use um nível de significância
igual a 0,05.
b. O que fez que o valor calculado de x2* fosse tão
grande? Parece razoável uma célula exercer tanto
efeito sobre os resultados? De que maneira esse tes¬
te poderia ser realizado diferentemente (se possível,
mais significativamente) de forma que os resultados
não fossem afetados como foram no item (a)? Seja
específico.
36 1252 :
íSolucione os problemas seguintes usando a abordagem
do valor-p e a abordagemclássica:
a. Se a hipótese nula (6:3:1) for verdadeira, qual o nú¬
mero esperado de flores na cor magenta?
b. Quantos graus de liberdade estão associados ao qui-
-quadrado?
c. Complete o teste de hipótese usandoa=0,10.
11.13 A NursingMagazine publicou os resultados de uma pes¬
quisa realizada commais de1.800 enfermeiras por todo o
país sobrea satisfaçãonotrabalho e a retenção de pessoal.
Enfermeiras de hospitais atrativos (que atraem e mantêm
enfermeiras com sucesso) descrevem a situação dos fun¬
cionários em seus locais de trabalho,como segue:
I
1
3 !.l;
mm mm 251 .p,::É;ã íi....
:
l
11.21 A síndrome de Tourette é um distúrbio neurológico e
hereditário que ocorre ho início da infância e envolve
múltiplos tiques motores e, pelo menos, um tique vocal.
Um estudo realizado nos Estados Unidos, publicado no
Relatório semanal de morbidez e mortalidade do CDC de
5 de junho de 2009, indicou que a síndrome ocorre em
três entre cada mil crianças emidade escolar.Uma análise
aprofundada classificou os dados de acordo com a etnia
e a raça - veja a tabela a seguir. No nível de significância
0,05, a amostra indica que ter a síndrome de Tourette é
independente da etnia e da raça?
Objetivo 11.3
11.16 Elabore a hipótese nula Hoe a hipótese alternativa Hoque
seriam usadaspara testar as seguintes afirmações:
a. Os eleitores expressaram preferências que não eram
independentes de suas afiliações em partidos.
b. A distribuição das opiniões é a mesma para as três co¬
munidades.
c. A proporção derespostas afirmativas foi a mesma para
todas as categorias pesquisadas.
11.17 O"teste de independência"e o“teste de homogeneidade"
são realizados de forma idêntica, usando-se a tabela con-
tingencial para distribuir e organizar os cálculos.Explique
como esses dois testes de hipóteses diferem entre si.
11.18 Determineo valor esperado para cada célula apresentada:
Brancos não Negros não
hispânicos hispânicosHispânicos ’
TêmasíndramedeTourette 26
Nâo têm a síndrome de 7.321
Tourette
164 18
43.602 6.427 :
50
11.22 A síndrome deTourette éum distúrbio neurológico e here¬
ditário que ocorre no início da infância e envolve múltiplos
tiques motores e, pelo menos,um tique vocal. Um estudo
realizado nos Estados Unidos, publicado no Relatório se¬
manaldemorbidezemortalidade do CDC de 5 de junho de
2009,indicouque a síndromeocorreemtrêsentre cada mil
crianças em idade escolar. Uma análise aprofundada clas¬
sificou os dados de acordo com a renda familiar de acordo
com o nível federal de pobreza- veja a tabela a seguir.No
nível de significância 0,05, a amostra indica que ter a sín¬
dromedeTourette independe da renda familiar?
40 200
11.19 Os resultados da "2003 Youth Risk Behavior Survey" (pes¬
quisa sobre o comportamento de risco na juventude de
2003), com relação ao uso do cinto de segurança, foram
publicados na seção Snapshot do USA Today de 13 de ja¬
neiro de 2005. A tabela a seguir resume os resultados de
uma pesquisa realizada com estudantes do ensino médio
no estado de Nebraska.Foi perguntado se esses estudan¬
tes raramente ou nunca usam ocinto de segurança quan¬
do andam de carona no carro de alguém.
:-c
1
Estudantes do sexo Estudantes do sexo
masculino
Abaixo de 200%-400% Above 400%
feminino 200%
324Raramente oununca usam
o cinto de segurança
Usam cinto de segurança
FONTE: www.cdc.gov
Usando a=0,05, essa amostra apresenta evidências sufi¬
cientes para rejeitar a hipótese de o sexo ser independen¬
te do uso do cinto de segurança?
a. Solucione utilizando a abordagem do valor-p.
b. Solucione utilizando a abordagem clássica.
11.20 Uma pesquisa realizada com viajantes selecionados alea¬
toriamente que usaram os banheiros de um posto de ga¬
solina de uma grande distribuidora de petróleo dosEstados
Unidos apresentou os seguintes resultados:
208 Têm a síndromedeTourette
Não têm a síndrome de
Tourette
65 80 80
17581 21.795 24.432
1.217 1.184li
11.23 Animais doentes que,hipoteticamente, recebem uma de¬
terminada droga (grupo experimental) sobreviverão em
uma taxa mais favoráveldo que aqueles quenão recebem
a droga (grupo de controle).Os resultados a seguir foram
registrados.
-
Sobreviveram Não sobreviveram -Grupo experimental
Grupo de controle
a. Explique por que a hipótese do exercício não pode ser
a hipótese nula.
b. Expliquepor quea hipótese nula é corretamente afirma¬
da como"A sobrevivência independe do tratamento".
c. Complete o testedehipótese,determinando ovalor-p.
d. Seo teste for realizado usando a=0,02,elabore a deci¬
são que deve ser tomada.
e. Seo teste for realizado usando a=0,02,elabore,cuida¬
dosamente, a conclusão e o seu significado.
11.24 A seção Snapshot do USA Today de 12 de novembro de
2009 "Raiva em gatos em ascensão" informou que quase
7 mil animais foram declarados com raiva em 2008. Utili¬
zando informações do Journalof the American Veterinary
46 18
38 35
!
I
Qualidade das instalações do banheiro
Abaixo da
média
Acima da
média Na médiaSexodoreplicante
Mulheres
Homens
Totais .
! 597 24 28
26 7 418
15 50 35 100Totais
Usando a = 0,05, essa amostra apresenta evidências su¬
ficientes para rejeitar a hipótese "A opinião sobre a qua¬
lidade dos banheiros independe do sexo do replicante"?
a. Solucione utilizando a abordagem do valor-p.
b. Solucione utilizando a abordagem clássica.
”.....
-y ' ---f? r- - V/.-:
“r
';ÿ .MedicalAssociation {Periódico da associação norte-ameri¬
cana de medicina veterinária), os seguintes casos de raiva
foram registrados para cães e gatos:
ÂProfessor
Notas #1 12 .V: 13
11 27
29; 25
uA 12
:í mQes Gatos BAno 16
c2007 93 274 35 30 .• 15 "
•í 23 .
No nível de significância 0,01, há evidências suficientes
para concluir que"A distribuição das notas não é a mesma
para os três professores"?
a. Solucione utilizando a abordagem do valor-p.
b. Solucione utilizando a abordagem clássica.
c. Qual professor dá as melhores notas? Explique, men¬
cionando evidências específicas que sustentem sua
resposta.
11.27 Pessoas cada vez mais jovens são capazes de adquirir ar¬
mas ilegais? De acordo com o artigo publicado pelo De¬
mocratandChronicle em 11 de outubro de 2009, da cida¬
de de Rochester, Nova York,“A arma usada para atirar em
DiPonzio",que informou queum garoto de 14 anos atirou
em um oficial de polícia - aparentemente, o número de
grupos de pessoas muito jovens encontrados com armas
ilegaiscontinua a crescer.No níveldesignificância0,01,apa¬
rentemente, a distribuição das idades das pessoas que pos¬
suem armas ilegais éa mesma para os anos mencionados?
Outros75 294 272008 40
No nível de significância 0,05, a distribuição de casos de
raiva entre cães e gatos é a mesma para os anos mencio¬
nados?
:
11.25 De acordo com um relatório fornecido pela Substance
Abuse and Mental Health Services Administration (Admi¬
nistração Federal para Serviços de Saúde Mental e Abuso
de Substâncias), trabalhadores do ramo alimentício apre¬
sentam o índice mais elevado de fumantes: 45% relata¬
ramterem fumado cigarronoúltimo mês.Algumas carrei¬
ras estão mais propensas que outras a induziras pessoas a
tornarem-se fumantes? Se 100 pessoas em cada uma das
seguintes ocupações forem questionadas se fumaram no
último mês, os dados sustentam a hipótese de algumas
carreiras conter níveis mais elevados de fumantes? Use
um nível de significância dé 0,05.
-
Construção Produção Engenharia Política Educação
37 17 17 12
Ocupação
Número de fumantes í43
1126 Estudantes utilizam diversos critérios ao escolherem cur¬
sos."Professor que dá boas notas”é um critério frequente.
Três professores foram escalados para dar aula de estatísti¬
ca nopróximo semestre.Uma amostra das distribuições de
notas anteriores desses três professores é mostrada aqui.
Ano 21anos
oumenos
De 22 a
30 anos
De 31 a
50 anos
51 anos
oumais
r
2005 103 93 111 33
.1 2006 119 136 96 31
=7
2007 155 140 130 764
t 2008 159 160 104 60
=j
:
•:-=
!
i
b
...
,
,11 .
n ill• WÊÊÊIm•Mii

Outros materiais

Outros materiais