Baixe o app para aproveitar ainda mais
Prévia do material em texto
SBSSSS: jj|§§3ill Capítulo 11 I @ I; * i • de qui-quadrado ' objetivos; 11.1 Estatística qui-quadrado 11.1 Estatística qui-quadrado 11.2 Inferências referentes a experimentos multinomiais HÁ VÁRIOS PROBLEMAS PARA OS QUAIS OS DADOS ENUMERATIVOS SÃO CATEGORIZADOS E OS RESULTADOS, MOSTRADOS POR MEIO DE CONTAGENS. 11.3 Inferências sobre tabelas de contingência Para ilustrar esse fato, pense em comida apimentada. Se você gos¬ ta de comida apimentada, provavelmente, tem um jeito preferido de “refrescar” sua boca depois de comer seu prato apimentado favorito. Alguns dos métodos mais utilizados são: beber água, leite, refrigeran¬ te ou cerveja, ou ainda comer pão ou outro alimento. Há ainda algu¬ mas pessoas que preferem não refrescar a boca em tais ocasiões, logo, nada fazem. A seção snapshot do USA Today “Putting Out the Fire” (Apagando o fogo), mostrada a seguir, apresenta os seis métodos mais utilizados por adultos, após comerem alimentos apimentados. Recentemente, foi solicitado a 200 adultos, que afirmavam amar comida apimentada, que dissessem qual era sua maneira favorita de refrescar a boca, após comer alimentos com pimenta. É apresentado, a seguir, um resumo da amostra. Método Água Leite Refrigerante Cerveja Número 73 35 20 Dados de contagem como esses são, frequentemente, chamados dados enumerativos. De forma semelhante, um conjun- § to de notas de uma prova final pode f -ÿ —-ser exibido como uma distribuição de ? frequência. Esses números de frequên¬ cia são contagens, o número de dados que ficam em cada célula. Foi realiza-| da uma pesquisa na qual foi solicitado ; '% I °r, $Ví r Pão Outros Nada 19 29 11 13 1 Um1 E I lll&si -mm i ZL . 236 P„r,e 4: Mais estatística i n ferenci a I nniynw -i sail .Vfr-: , 1a eleitores que informassem se eram registrados como republicanos, democratas ou outro partido e se apoiavam ou não determinado candidato. Normalmente, os resultados são apresentados em forma de gráfico, que mostra o número de eleitores de cada possível categoria. Inúmeros exemplos dessa forma de apresentação de dados foram fornecidos ao longo dos dez capítulos anteriores. fí\ LI ; !Montagem de dados Suponha que temos um determinado número de células nas quais n observações foram organiza¬ das. (O termo célula é sinónimo de classe. Os termos classe e frequência foram definidos e utiliza¬ dos nos capítulos anteriores. Antes de continuar, uma breve revisão dos Objetivos 2.1,.2.2 e 2.3 pode ser útil). As frequências observadas em cada célula são denotadas por Oj, 02, O,, . . . , Ok (veja a Tabela 11.1 na próxima página). Perceba que a soma de todas as frequências observadas é Ol+02 + ...+ Ok = n em que né o tamanho da amostra. S Ifc :m i 1 c. •Vr pi *r. ãk» ’ . --I; U' .‘V%# rmr* , Á . JSiil .èLJ& 1I ; f Kl» » * r-rJ i .'7 ' % Pi - : ! 11 f: 1* /:jH-.' iJf Im WÍ - _ P ‘‘ SÉiSr*•- •- JÀr % .51 mm. ééSI Wm sV li1 Sis ;ill discordância. Portanto, é usual que esses testes sejam unicaudais, com a região crítica localizada à direita. Em amostragens repetidas, o valor calculado de na fórmula (11.1) terá uma distribuição amostrai que pode ser aproximada pela distribuição de probabilidade qui-quadrado quando n é alto. Essa aproximação é, geral¬ mente,considerada adequada quando todas as frequências esperadas são iguais ou maiores que 5.Lembre-se de que as distribuições qui-quadrado, assim como as distribuições-í de Student, formam uma família de distribuições de pro¬ babilidade, cada uma sendo identificada pelo número do parâmetro de graus de liberdade. O valor apropriado dos graus de liberdade será descrito em cada teste específico. A fim de usar a distribuição qui-quadrado, devemos estar cientes de suas propriedades, que foram listadas no Obje¬ tivo 9.3, na página 198. (Veja também a Figura 9.7). Os valores críticos para qui-quadrado são obtidos por meio da Tabela 8 do Apêndice B. (Instruções específicas foram fornecidas no Objetivo 9.3, na página 199). O que gostaríamos de fazer é comparar as frequências observadas a algumas frequências esperadas ou teó¬ ricas denotadas por Ev Ev Ev ... ,Ek (veja a Tabe¬ la 11.1), para cada uma dessas células. Novamente, a soma dessas frequências esperadas deve ser exatamente igual a n\ E, + E2 +...+ Ek = n !! Tabela 11.1 Frequências observadas Categorias Ar 1a 2a 3a ... /r-ésima Frequências 0, . 02 03 ... 0k observadas Frequências f, f2 £3 ... esperadas ITotal n n ...... Hipótese da utilização de qui-quadrado para a realização de inferências baseadas em dados enumerados: A informação amostrai é obtida usando-se a amostra aleatória retirada da população na qual cada indivíduo é classificado de acordo com a(s) variável(eis) categórica(s) envolvida(s) no teste. Uma variável categórica é aquela que classifica ou categoriza cada indivíduo dentro de uma célula ou classe específica, em meio às demais. Essas células ou classes são inclusivas e mutuamente exclusivas. A face voltada para cima de um dado lançado é uma variável categóri¬ ca: a lista de resultados {1, 2,3,4, 5, 6} é um conjunto de categorias inclusivas e mutuamente exclusivas. Neste capítulo, permitimos certa “liberalização” com respeito a hipóteses nulas e seus testes. Nos capítulos an¬ teriores, a hipótese nula foi sempre uma declaração sobre um parâmetro populacional (|x, a ou p). No entanto, há outros tipos de hipóteses que podem ser testadas, assim Decidiremos, então, se as frequências observadas pare¬ cem concordar ou discordar das frequências esperadas. Faremos isso por meio do teste de hipótese com qui- -quadrado, x2- í i : Resumo do procedimento do teste Para a realização de um teste de hipótese com qui-qua¬ drado, precisamos começar pela compreensão do se¬ guinte teste estatístico: Teste estatístico para qui-quadrado X2* = S —wtodas as células t (O-E)2 (11.1) Este valor calculado para qui-quadrado é a soma de vários números não negativos, um de cada célula (ou catego¬ ria). O numerador de cada termo da fórmula para x2ÿ- é o quadrado da diferença entre os valores das frequências observadas e esperadas. Quanto mais próximos estive¬ rem esses valores, menor será o valor de (O-E)2; quan¬ to mais separados estiverem, maior será o valor de (O- E)z. O denominador para cada célula coloca o tamanho do numerador em perspectiva, ou seja, uma diferença (O -E) de 10 resultante das frequências de 110 (O) e 100 (E) é muito diferente de uma diferença de 10 resultante de 15 (O) e 5 (E). Essas ideias sugerem que valores pequenos de qui- -quadrado indicam concordância entre os dois conjun¬ tos de frequências, enquanto valores maiores indicam Karl Pearson e o qui-quadrado Conhecido como um dos pais da estatística moderna, I 238 Parte 4: Mais estatística inferencial = <;como “este é um dado imparcial- possui seis lados com um número diferente em cada, sem repetições” ou “a altura e peso dos indivíduos são independentes”. Note que, essas hipóteses não são afirmações sobre um par⬠metro, apesar de, às vezes, elas serem mencionadas com valores de parâmetros específicos. Considere a afirmação “este é um dado imparcial”, p = P(outro número qualquer) =|e você quer testá-la. O que você faria? Sua resposta foi algo como: Lançar este dado várias vezes e registrar os resultados? Súponha que você decidiu lançar o dado 60 vezes. Se este dado é im¬ parcial, o que você espera que ocorra? Que cada número (1, 2,...,6) deva aparecer, aproximadamente g das vezes (ou seja, dez vezes). Se cada número aparecer, aproxima¬ damente, dez vezes, você certamente aceitará a afirmação de imparcialidade [p = \ para cada valor). Se, por acaso, o dado favorecer alguns determinados números, você re¬ jeitará a afirmação. (O teste estatístico calculado terá um valor alto neste caso, como veremos em breve). trerejeitar ou não a afirmação “este é urr/dado impar¬ cial”. (A probabilidade pára cada númeroé|).0,dádo é , lançado de um copo pára uma superfície plana e lisÿ 60 , f vezes, com as seguintes frequências observadas: Número Frequência observada A hipótese nula de que o dado é imparcial é considera¬ da como sendo verdadeira. Isso nos permite calcular as frequências esperadas. Se o dado é imparcial, esperamos dez ocorrências de cada número. Agora, vamos calcular um valor observado de x2- Esses cálculos são mostrados na Tabela 11.2. O valor calculado é x2"fc = 2,2. Agora,vamos usar nossoconhecido teste de hipóteses em cinco passos. i i, í 1234 .56; 7 12 10 12 8 11 a. Parâmetro de interesse: A probabilidade na qual cada lado fica voltado para cima: P(l), P(2), P(3), P(4), P(5), P(6). b. Afirmação das hipóteses: Wo: o dado é imparcial |cadap = Hjo dado não é imparcial (ao menos um p é diferente dos demais). 61.2' Inferências referentes a experimentos multinomiais \ a- Verifique as premissas: O dado foi coletado de maneira aleatória e cada re¬ sultado é um dos seis números. b. Teste estatístico: Em um experimento multinomial, o grau de liberda¬ de é = k-1, em que kéo número de células.PROBLEMA ANTERIOR SOBRE O DADO É UM BOM EXEMPLO DE UM EXPERIMENTO MULTINOMIAL. h% Vamos retomar esse problema. Suponha que vocêqueira testar esse dado (em a = 0,05) e decidir en- ..,.•11/ y.Tabela 11.2 Cálculos para obtenção de x2 (0-E)2 I ©•••W n deve ser «9ÿ avOÿE==n- Tabela V»-2' Número Observadas (0) Esperadas (£) 0 — E (0 — E)2 E 1 7 10 -3 9 0,9 ft 2 12 2 0,410 4 3 10 10 0 0 0,0Ii 0,4 §124 10 2 4 VocêP0! t umaV dona 5 8 10 -2 4 0,4 com° rnostra 16 11 10 1 0,11 &r P2'2 ITotal 60 60 0/ * 2394 Capítulo I I : Aplicações de qui-quadrado 'T Utilizando a fórmula (11.1), temos X2*= V A distribuição qui-quadrado e a fórmula (11.1),com grau de liberdade = k- l = 6- í = 5. c. Determine o nível de significância, OL. a = 0,05 {Q-E)\ E 'todas as células X2ÿ = 2,2 (os cálculos são mostrados na Tabela 11.2). a. Informação amostrai: veja a Tabela 11.2. b. Teste estatístico calculado: .|g||f Distribuição de probabilidade:Como sempre, podemos usar tanto o valor-p quanto o procedimento clássico: I \Usando o procedimento clássico: a. A região crítica é a cauda localizada à direita, pois os valores maiores de qui-quadrado discor¬ dam da hipótese nula O valor crítico é obtido da Tabela 8, na interseção da linha do grau de liberdade = 5 e a coluna a = 0,05: X2(5, 0,05) = 11,1 Usando o procedimento do valor-p: a. Utilize a cauda localizada à direita, pois os valores maiores de qui-quadrado discordam da hipótese nula: P = P(X2*>2,2|gl = 5) conforme é mostrado na figura a seguir. valor-pL £\l a = 0,05 V:0 2,2 5 I Para determinar o valor-p, você tem duas opções: 1. Use a Tabela 8 do Apêndice B para atribuir limi¬ tes ao valor-p: 0,75 < P < 0,90. 2. Use um computador ou uma calculadora para determinar o valor-p: P = 0,821. Para instruções específicas, veja a página 201. O valor-p não é menor que o nível de significância, a. 0 2,2 5 TC11,1 Para instruções específicas, veja a página 199. b. ’x2~k não está na região crítica, como é mostra¬ do em vermelho na figura anterior. s « 1Vb- 3. A probabilidade associada a cada célula foi de|, constante em todos os testes. (Seis valores de|so¬ mados a 1,0.) 4. Quando o experimento chegou ao fim, havia uma lista de seis frequências (7, 12, 10, 12, 8 e 11) que, somadas, totalizam 60, o que indica que cada resul¬ tado foi levado em conta. [jOsIsIglI] a. A decisão é: não rejeitar Ho. b. Conclusão: No nível 0,05 de significância, as frequências observadas não são significativamente diferentes daquelas de um dado imparcial. Antes de olharmos os outros exemplos, devemos de¬ finir o termo experimento multinomial e estabelecer as diretrizes de como completar o teste qui-quadrado. O exemplo do dado vai ao encontro da definição de um experimento multinomial, pois ele possui as quatro características descritas na definição. O procedimento de teste para experimentos multi- nomiais é muito parecido com o descrito nos capítulos anteriores. A grande mudança reside na declaração da hipótese nula. Ela pode ser uma declaração verbal, assim como no exemplo do dado: “Este é um dado imparcial”. Geralmente, a alternativa da hipótese nula não é decla¬ rada. No entanto, neste livro, a hipótese alternativa será mostrada, desde que auxilie na organização e na compre¬ ensão do problema. Contudo, ela não será usada para determinar a localização da região crítica, assim como no caso dos capítulos anteriores. Para experimentos 1, O dado foi lançado n (60) vezes de forma idêntica e os testes são independentes com relação uns aos outros. (O resultado de cada teste não foi afetado pelos resultados de outros testes). 2. A cada vez que o dado foi lançado, um dos seis núme¬ ros apareceu ecada número foi associado a uma célula. j í 240 Parte 4: Ma is estatística i n fe r e n c i a I I 4 7 Cada frequência esperada, £., será determinada multipji- cando-se o número total de testes n pela probabilidade correspondente (p.) para cada célula, Ouseja, 'iI; V tv e? %Valor esperado para experimentos multinomiais E, = n -P, Uma diretriz deve ser cumprida para assegurar uma boa aproximação da distribuição qui-quadrado: cada frequência esperada deve seg pelo menos, igual a 5 (ou seja, cada E. > 5). Algumas vezes, é possível combinar células “menores” para cumprir essa diretriz. Se essa di¬ retriz não pode ser cumprida, então, medidas corretivas devem ser tomadas para garantir uma boa aproximação. Essas medidas corretivas não são abordadas neste livro, no entanto, são discutidas em diversas outras fontes. -1 (11.3)If K- - ; te:£.1 I: Experimento multinomial Um experimento multinomial possui as seguintes características: TESTE DE HIPóTESE MULTINOMIAL COM FREQUêNCIAS IGUALMENTE ESPERADAS Situações multinomiais ocorrem regularmente na vida cotidiana. Considere o exemplo de matrículas para cur¬ sos universitários. Estudantes universitários têm insisti¬ do na liberdade de escolha quando se matriculam em determinado curso. Neste semestre, há sete turmas para um determinado curso de matemática. As turmas estão previstas para reunirem-se em diversos horários com uma variedade de professores. A Tabela 11.3 mostra o número de estudantes que escolheram cada uma das sete turmas. Os dados indicam que os estudantes tiveram preferência por certas turmas, ou que cada turma tinha a mesma probabilidade de ser escolhida? 1. Consiste em n testes independentes idênticos. 2. O resultado de cada teste encaixa-se perfeita- mente em uma das possíveis células k. 3. Há uma probabilidade associada a cada célula em particular. Além disso, essas probabilidades individuais permanecem constantes durante o experimento. (Este deve ser o caso de p, + p2 + •••+ Pk— T.) 4. O experimento resultará em um conjunto de frequências observadas k, 0]f 02, ...,Ok, no qual g; I cada O.é o número de vezes que um resultado * ! do teste cai em uma determinada célula. (Este deve sér o caso de 02 4 p2 -f ...+ Ok = n.) : í | I | l Tabela 11.3 Dados de matrículas para as turmas t íTurma 1 2 3 4 5 (j 7 Tptal Números de alunos 18 12 25 23 8 19 14 119 ; multinomiais, sempre utilizaremos uma região crítica umcauual, e esta será a cauda localizada à direita da distribuição "X2, pois desvios maiores (positivos ou ne¬ gativos) dos valores esperados levam a um aumento no valor x2ÿ calculado. O valor crítico será determinado pelo nível de signi- ficância atribuído (a) e pelo número de graus de liberda¬ de. O número de graus de liberdade (gl) será 1 a menos que o número de células (k), valor pelo qual os dados serão divididos: Se nenhuma preferênciafoi mostrada na seleção de turmas, então, podemos esperar que os 119 alunos se¬ jam igualmente distribuídos entre as sete turmas, ou seja, esperamos que 17 alunos se matriculem em cada turma. Utilizando o processo de cinco passos, vamos completar o teste de hipótese no nível de significância de 5% e ve¬ rificar se os estudantes foram igualmente distribuídos. a. Parâmetro de interesse: Preferência por cada turma ou a probabilidade de que uma determinada turma seja escolhida no ato da matrícula. PASSO 1Graus de liberdade para experimentos multinomiais gl = k-1 (11.2) 241Capítulo 11: Aplicações de qui-quadrado (n T b. Teste estatístico calculado: Utilizando a fórmula (11.1), temos b. Afirmação das hipóteses: Ho: não houve demonstração de preferência (igualmente distribuídos). Hg: houve demonstração de preferência (não igualmente distribuídos). I (O-E)2,X2* = Xtodas as células E 7(18- 17)2 , (12 — 17)2 , (25 — 17)2 í; I17 17 17 a. Premissa: Os 119 estudantes representam uma amostra alea¬ tória da população de todos os alunos que se matri¬ cularam para este curso em particular. Uma vez que nenhuma nova regra tenha sido introduzida na sele¬ ção de cursos e que as matrículas pareçam proceder em seu padrão usual, não há razão para acreditar que esta não seja uma amostra aleatória. b. Teste estatístico a ser usado: I 2 (23 — 17)2 , (8 — 17)2 , (19-17)2 , (14-17)2] 17 17 17 17 (1)2 , (~5)2 , (8)2 (6)2 (—9)2 (2)2 (—3)2_ 17 + 17 + 17 + 17" + 17 + — +17 171 +25 + 64 + 36 + 81 + 4 + 9 _ 220 — f 2 941117 17 = 12,94 Novamente, podemos usar tanto o valor-p quanto o procedimento clássico: Á distribuição qui-quadrado e a fórmula (11.1),comí gl = 6. c. Nível de significância: a = 0,05.: a. Informação amostrai: veja a Tabela 11.3. * Usando o procedimento do valor-p: Usando o procedimento clássico: a. A região crítica é a cauda localizada à direi¬ ta, pois os valores maiores de qui-quadrado discordam da hipótese nula. O valor crítico é obtido da Tabela 8, na interseção da linha do gl = 6 e a coluna a = 0,05: X2(6,0,05) = 12,6 a. Utilize a cauda localizada à direita, pois os valores maiores de qui-quadrado discordam da hipótese nula: P = P(X2T*>12,94|gl = 6) conforme é mostrado na figura a seguir. 7 7 7 i|valor-p * a = 0,05 í. X26 12,940 x20 6 12,6 12,94 Para determinar o valor-p, você tem duas opções: 1. Use a Tabela 8 do Apêndice B para atribuir limi¬ tes ao valor-p: 0,025 < P < 0,05. 2. Use um computador ou uma calculadora para determinar o valor-p: P = 0,044. I Para instruções específicas, veja a página 201. \ b. O valor-p é menor que o nível de significância,a. Para instruções específicas, veja a página 199. b. está na região crítica, como é mostrado em vermelho na figura anterior. I ,s*\ ———j. v ...... informações fornecidas. Pode ser preferência por professor, horário ou conflito de agenda. Conclusões devem ser tiradas com cuidado, a fim de evitar a sugestão de conclusões que os dados não pos- ;| sam sustentar. SítSSi a. A decisão é: rejeitar Hq. b. Conclusão: No nível de significância 0,05, parece haver uma demonstração de preferência. Contudo, não se pode determinar que preferência seja essa com base nas 7 :! 7242 Parte 4: Mais estatística inferencial •A I •I .?ÿ w \ a. Informação amostrai: / , , As frequências observadas são: 3*15, 101, ÍÒS t $i. b. Teste estatístico calculado: li ’ IA razão 9:3:3:1 indica probabilidades de \ T6’T6’T6el6- Í Portanto, as frequências esperadas são n = EO,= 315 + 101 + 108 + 32 = 556 Os cálculos para a obtenção de x2* são mostrados na Tabela 11.4. TESTE DE HIPóTESE MULTINOMIAL COM FREQUÊNCIAS IGUALMENTE ESPERADAS Nem todos os experimentos multinomiais re- fcjj * sultam em frequências igualmente esperadas. 1| Por exemplo, a teoria mendeliana da herança afirma f| que as frequências de ervilhas redondas e amarelas, £ rugosas e amarelas, redondas e verdes e rugosas e ver- 1 |des ocorrerão na razão 9:3:3:1 quando duas varieda- * des específicas de ervilhas são cruzadas.Para testar essa teoria,Mendel obteve frequências de 315,101,108 e 32, respectivamente. Ao completar nosso teste de hipótese de cinco passos no nível 0,05 de significância, vamos descobrir se os dados amostrais fornecem evidên¬ cias suficientes para rejeitar a teoria de Mendel. I *I Tabela 11.4 Dados necessários para calcularx2ÿ (0-f)20 E 0—Ea- Parâmetro de interesse: As proporções: P(redonda e amarela), P(rugosa e amarela), P(redonda e verde), P(rugosa e verde). b. Afirmação das hipóteses: Ho: 9:3:3:1 é a razão de herança. Hg: 9:3:3:1 não é a razão de herança. IE i.315 312,75 2,25 0,0162 101 104,25 -3,25 0,1013 108 104,25 3,75 0,1349 32 34,75 -2,75 0,2176 v <0-£Px!*=S556 556,00 0/ 0,4700 r~=W7 Itodas as células . a- Premissas: Suponhamos que os resultados de Mendel formem uma amostra aleatória. b. Teste estatístico a ser usado: A distribuição qui-quadrado e a fórmula (11.1), com grau de liberdade = 3. c. Nível de significância: a = 0,05. A distribuição de probabilidade: •#í Novamente, podemos usar tanto o valor-p quanto o procedimento clássico: Usando o procedimento do valor-p: j a. Utilize a cauda localizada à direita, pois os valores j maiores de qui-quadrado discordam da hipótese nula: i P = P(x2*->0,47|gl = 3) conforme é mostrado na figura a seguir. \Usando o procedimento clássico: a. A região crítica é a cauda localizada à direi¬ ta, pois os valores maiores de qui-quadrado discordam da hipótese nula. O valor crítico é obtido da Tabela 8, na interseção da linha do gl = 3 e a coluna a = 0,05: X2(3,0,05) = 7,81 :í--ivalor-p A , — f0 0,47 3 a = 0,05 Para determinar o valor-p, você tem duas opções: 1. Use a Tabela 8 do Apêndice B para atribuir limites ao valor-p: 0,90 < P < 0,95. j 2. Use um computador ou uma calculadora para determinar o valor-p: P = 0,925. Para instruções específicas, veja a página 201. b. O valor-p não é menor que o nível de significância, a. 0 0,47 3 7,81 Para instruções específicas, veja a página 199. j§ b. não está na região crítica, como é mos¬ trado em vermelho na figura anterior. 243Capítulo 11: Aplicações de qui-quadrado 3J T Teste de independência Para ilustrar um teste de independência,, consideremos uma amostra aleatória que apresente os sexos de estudan¬ tes universitários de artes liberais e suas áreas acadêmicas favoritas. Cada pessoa em um grupo de 300 estudantes foi identificada como do sexo masculino ou feminino e questionada sobre a preferência acadêmica: artes liberais na área de exatas, ciências sociais ou humanas. A Tabela 11.5 é uma tabela de contingência que mostra as frequên¬ cias encontradas para essas categorias. Essa amostra apre¬ senta evidências suficientes para rejeitar a hipótese nula “a preferência por exatas, ciências sociais ou humanas é independente do sexo de um estudante universitário”? Para descobriÿ vamos completar o teste de hipótese utili¬ zando o nível de significância 0,05. : a. A decisão é: não rejeitar Hq. b. Conclusão: No nível de significância 0,05, não há evidências su¬ ficientes para rejeitar a teoria de Mendel. : i 2 * % % - % -m t *?* I -n.3 5 Inferências sobre a. Parâmetro de interesse: A determinação da independência das variáveis “sexo” e “área acadêmica favorita” requer que discutamos a probabilidade dos vários casos e o efeito que respostas a respeito de uma variável têm sobre a probabilidade de respostas com relação à outra variável. Indepen¬ dência, conforme a definição do Capítulo 4, requer P(E|M) = P(E|F) = P(E); ou seja, o sexo não exerce influência sobre a probabilidade de escolha de uma área acadêmica por determinada pessoa. b. Afirmação das hipóteses: H:a preferência por exatas, ciências sociais ou humanas é independente do sexo de um estudante universitário.H:a preferência pela área acadêmica não é independente do sexo do estudante. tabelas de contingência UMA TABELA DE CONTINGÊNCIA É UMA DISPOSIÇÃO DE DADOS EM UMA CLASSIFICAÇÃO FEITA DE DUAS MANEIRAS. Os dados são organizados em células e o número de da¬ dos em cada célula é informado. A tabela de contingên¬ cia envolve dois fatores (ou variáveis). Além disso, uma questão comum a respeito dessas tabelas é se os dados indicam que as duas variáveis são dependentes ou inde¬ pendentes (veja as páginas 90 a 93). Dois diferentes testes utilizam o formato da tabela de contingência. O primeiro a ser abordado é o teste de independência. 1! I .5 1 MLik mTabela 11.5 Resultados amostrais para sexo e preferência de área acadêmica zfi *1 'TI Área acadêmica preferida Exatas Ciências Humanas (E) sociais (CS) (H) m ! ívTotalSexo y ' . t-Estudantes dosexo 37 masculino (M) Estudantes do 35 sexo feminino (F) 12241 44 *71 17872 ~r: —Total 115 30072 113 V- . " y rC mm < !í ;244 Parte 4: Mais estatística inferencial i__; ii ' E- Cy.% DE QUE DOIS EVENTOS “° primeiras células da primeira linha, os outros quatro valores de células são fixados: A o m?mm a. Premissas: A informação amostrai é obtida usando-se uma amostra aleatória retirada de uma população e, em seguida, cada indivíduo é classificado de acordo com o sexo e área acadêmica preferida. b. Teste estatístico a ser usado: No caso das tabelas contingenciais, o número de graus de liberdade é exatamente o mesmo que o nú¬ mero de células na tabela, que podem ser preenchi¬ das livrementé quando se tem os totais marginais. Os totais para nossos estudantes universitários são exibidos na tabela a seguir: 50 60 C 122 D E F 178 72 113 115 300 Os valores têm de ser C = 12, D = 22, E = 53 e F- 103. Caso contrário, os totais não estariam corretos. Portanto, há duas opções para este problema. Cada opção corresponde a 1 grau de liberdade. Logo, o número de graus de liberdade para o nosso exemplo é igual a 2 (gl = 2). A distribuição qui-quadrado será usada juntamente com a fórmula (11.1), com grau de liberdade = 2. Nível de significância:a = 0,05. 122 178 72 113 115 300 c. BBEEBB a- Informação amostrai: veja a Tabela 11.5. b. Teste estatístico calculado: Antes de podermos calcular o valor de qui-quadrado, precisamos determinar os valores esperados, E, para cada célula. Para fazê-lo, precisamos relembrar as Dados esses totais, podem-se preencher apenas duas células antes de todas as demais serem determina¬ das. (Os totais devem, obviamente, permanecer os mesmos.) Por exemplo, uma vez que escolhemos dois valores arbitrários (digamos, 50 e 60) para as duas V ir* : ' msm : - :SlijgfsS fn——r • .-•••1 i HPíIÍPÍÍPH ate que haja ev.dèncias para rejeitá-lã " suposição em nosso exemplo, estamo . dizendo que o evento de um estu’ a&H|méntejerdosexomasct __ íhálllS§lisulteafór verdade, multiplicando-se a probabilidade (ou proporção) M-.....—LL*áilino esexMW&- m\- u, isperace estúdantèsÿdo'sexo, 1| , ciências exatas " nf|n' - tern i ISenderitesÿitéri Wm jpárãS; WÊÊÊ mo rJr 1PZ6dem 't. 1 ’ilida. 3m ser deterimÊSmm '.'Mir de ÊÈÊÊÊ HI I t... asmM - Ilgi 1 Normalmente, a tabela de contingência é escrita de :i forma que contenha todas essas informações (veja a Ta- ' bela 11.7). T Tabeía 11.7 Tabela contingencial com os resultados amostrais e valores esperados hipóteses nulas, que afirmam que esses fatores são independentes. Portanto, esperamos que os valores sejam distribuídos na proporção dos totais margi¬ nais. Há 122 pessoas do sexo masculino e espera¬ mos que sejam distribuídas entre E, CS e H pro¬ porcionalmente aos totais 72, 113 e 115. Assim, as contagens esperadas da célula para pessoas do sexo masculino são Área acadêmica preferida Exatas Ciências sociais Humanas Estudantes 37(29,28) 41(45,95) 44(46,77) do sexo masculino Estudantes 35(42,72) 72(67,05) 71 (68,23) dosexo feminino TotalSexoM:-U2 4ÍI-122 4ÿ-122 122300 300300 Do mesmo modo, esperamos para pessoas do sexo feminino 178 4ÍI-178300300 Desta maneira, os valores esperados ficam conforme mostrado na Tabela 11.6. Sempre verifique os totais marginais para os valores esperados em comparação aos totais marginais para os valores observados. Total 72 113 115 300 O qui-quadrado calculado é (O-fl2.x2ÿ = StodasascélulasTabela 11.6 Valores esperados E CS Estudantes 29,28 45,95 46,77 do sexo masculino Estudantes do 42,72 67,05 68,23 sexo feminino E ' !,rTotal (37 — 29,28)2 , (41 — 45,95)2 , (44-46,77)2H X2ÿ — 29,28 45,95 46,77122,00| (35 — 42,72)2 , (72 — 67,05)2 , (71 -68,23)2 42,72 67,05 68,23 = 2,035 + 0,533 + 0,164 + 1,395 + 0,365 + 0,112178,00 7 = 4,604 IUI300,00|Total 72,00 113,00 115,00 Novamente, podemos usar tanto o valor-p quanto o procedimento clássico: . /Usando o procedimento clássico: a. A região crítica é a cauda localizada à direi¬ ta, pois os valores maiores de qui-quadrado discordam da hipótese nula. O valor crítico é obtido a partir da Tabela 8, na interseção 1 da linha do gl = 5 e a coluna a = 0,05: X2(2,0,05) = 5,99 Usando o procedimento do valor-p: a. Utilize a cauda localizada à direita, pois os valores maiores de qui-quadrado discordam da hipótese nula: P = P(X2-Ar>4,604|gl = 2) conforme é mostrado na figura a seguir. : . I* valor-p a=0,05 I 4,604 X20 2 X20 2 5,99 4,604Para determinar o valor-p, você tem duas opções: 1. Use a Tabela 8 do Apêndice B para atribuir limi¬ tes ao valor-p: 0,10 < P < 0,25. 2. Use um computador ou uma calculadora para determinar o valor-p: P = 0,1001. , Para instruções específicas, veja a página 201. \ b. O valor-p não é menor que a. | Para instruções específicas, veja a página 199. b. x2ÿ não está na região crítica, como é mos¬ trado em vermelho na figura anterior. ; -246 Parte 4: Mais esta tística inferencial : ? IT \ Í Deve-se, novamente, observar' a diretri? mencionada } previamente: Cada E. . deve sér, pelo menos; igual a 5. % le a.A decisão é: não rejeitar Ho. b. Conclusão: No nível de significância 0,05, as evidências não nos permitem rejeitar a independência existente entre o sexo de um estudante e sua preferência por determi¬ nada área acadêmica. i- $ ;sTeste de homogeneidade O segundo tipo de problema de tabela contingencial é chamado teste de homogeneidade. Esse teste é utilizado quando uma das duas variáveis é controlada pelo expe¬ rimentador, de forma que os totais da linha ou coluna sejam predeterminados. Por exemplo, suponha que queiramos fazer uma pes¬ quisa com eleitores registrados a respeito de uma lei pro¬ posta pelo governador. Na pesquisa, 200 moradores da área central da cidade, 200 do subúrbio e 100 da zona rural foram selecionados aleatoriamente e questionados se eram a favor ou contra a proposta do governador. Ou seja, é extraída uma amostra aleatória simples de cada um desses três grupos. Um total de 500 eleitores participa da pesquisa. Porém, repare que a quantidade de eleitores que ficará em cada categoria de linha foi predeterminada (antes de a amostra ser extraída),conforme é mostrado na . Tabela11.9,e cada categoria é amostrada separadamente. í? 1 De forma geral, a tabela contingencial l x c (l é o número de linhas; céo número de colunas) é usada para testar a independência do fator linha e do fator coluna. O número de graus de liberdade é determinado por: i- I l ;• Graus de Uberdade para tabelas de contingência gl = (/-1) (c-1) em que / e c são ambos maiores que 1. (Esse valor para gl deve concordar com o número de células contadas, de acordo com a descrição geral das páginas 244 e 245). As frequências esperadas para uma tabela de con¬ tingência l X c sãó encontradas por meio das fórmulas fornecidas por cada célula da Tabela 11.8, em que n = total geral. De forma geral,a frequência esperada na in¬ terseção da /-ésima linha e /-ésima coluna é dada por: I n (11.4) g N !a& Mtaçêeâ, Frequências esperadas para tabelas contingenciais i notação usada na Tabela 11.8 e a fórmula (11.5) podem ser |novas para você. Por conveniência, I quando nos referirmos a células ou |entradas de uma tabela, usaremos I E.. para denotar a entrada na I /-ésima linha e/-ésima coluna. I Ou seja, a primeira letra subscrita § 1 corresponde ao número da linha e I a segunda, ao número da coluna. i Portanto, Eu é a entrada daI primeira linha, segunda coluna, é i £11 éa entrada da segunda linha,I primeira coluna. Na Tabeia 11.6I (página 246), Eu é 45,95 e E21 éH 42,72. A notação usada naTabela H 11.8 é interpretada de forma I similar, ou seja, L1 corresponde ao 1total da linha 1,e C, corresponde H ao total da coluna 1. A :ÿ_ totalde linhas x totalde colunas _ L. x C. 01.5)o ;total geral n i Tabela 11.8 Frequênciasesperadas para uma tabela contingencial / x c v i : IColuna j-enésima Í5 linha TotalLinha 21 Ic LyxCi,xC, flXC21 n n n 1 Ii2xC, *22 n t l /-enésima WiLxCr Llinha n n n . aI :n II Total ” J í V.,srv',, • " 247Capitulo 1 I: Aplicações de qu i-quadrado U b. Afirmaçao das hipóteses: Ho: a proporção de eleitores a favor da iei proposta é a mesma para os três grupos de locais de residência. H\ a proporção deeleitores a favor da lei proposta não é a mesma para os três grupos de locais de residência. (Ou seja, em, pelo menos, um grupo uma proporção é diferente da outra). Tabela 11.9 Registroda eleição tom totais lineares predeterminados iíI ':V‘,Proposta dogovernador A favor Contra : TotalResidência Residem na área central da cidade Residem no subúrbio Residem na zona rural § 200 2Q0 ÍÍiÿgÍS%flÿl a. Premissas: A informação amostrai é obtida utilizando três amostras aleatórias retiradas de três populações se¬ paradas, nas quais cada indivíduo é classificado de acordo com sua opinião. 100 y 500Total ; : " ' b. Teste estatístico a ser usado:Em um teste dessa natureza, estamos, na verdade, testando a hipótese: a distribuição das proporções den¬ tro das linhas é a mesma para todas as linhas. Ou seja, a distribuição das proporções da linha 1 é a mesma da linha 2, que é a mesma da linha 3, e assim por dian¬ te. A alternativa é: a distribuição de proporções dentro das linhas não é a mesma em todas as linhas. Este tipo de exemplo pode ser considerado uma comparação de vários experimentos multinomials. Além dessa diferença conceituai, o verdadeiro teste de independência e homo¬ geneidade com tabelas contingenciais é o mesmo. Vamos demonstrar esse teste de hipótese comple¬ tando o exemplo da pesquisa no nível de significâncía 0,05. A evidência amostrai apresentada na Tabela 11.10 sustenta a hipótese: “eleitores dentro dos diferentes gru¬ pos de locais de residência possuem diferentes opiniões sobre a proposta do governador”? A distribuição qui-quadrado e a fórmula (11.1), com 1: gl = (/-l)(c-l) = (3-l)(2-l) = 2 c. Nível de significância:a = 0,05. a. Informação amostrai: veja a Tabela 11.10. b. Teste estatístico calculado: Os valores esperados são determinados utilizando-se a fórmula (11.5) (página 247) e fornecidos pela Ta¬ bela 11.11. Tabela 11.11 Resultados amostraise valoresesperados IProposta do governador Local de residência A favor Contra Residem na área 143 (101,6) 57 (98,4) central da cidade Residem no subúrbio Residem na zona 13(50,8) 87(49,2) :vTotal 200 98(101,6) 102(98,4) 200Tabela 11.10 Resultados amostrais para residência eopinião i H.ft'. 100 I I s;ruralProposta do governador A favor Contra Residem na área central da cidade 143 57 Residem no subúrbio Residem na zona rural Total 254 246 500. j TotalLocal de residência RSOTA: Cada valor esperado é usado duas vezes no cál- J culo de x2*- Portanto, é uma boa ideia manter casas deci- Jj mais extras enquanto os cálculos são feitos. O qui-quadrado calculado é 200: 98 102 13 87 200J 4i 100 í~ 254 246Total 500 (O-E)2.X2* = .? £todas as célulasa. Parâmetro de interesse: A proporção dos eleitores que são a favor ou contra (ou seja, a proporção de eleitores que residem no cen¬ tro da cidade e que são a favor, que residem no su¬ búrbio e que são a favor, que residem na zona rural e que são a favor e a proporção dos três grupos, se¬ paradamente, que são contra). (143- 101,6)2 , (57 — 98,4)2 , (98- 101,6)2 101,6 (102 — 98,4)2 , (13 — 50,8)2 , (87-49,2)2 X2* = 101,6 98,4 98,4 50,8 49,2 = 16,87 + 17,42 + 0,13 + 0,13 + 28,13 + 29,04 = 91,72 ; 248 Parte 4: Mais estatística inferência I 'ÿ W£ :A distribuição de probabilidade: Novamente, podemos usar tanto o valor-p quanto o procedimento clássico: flt àUsando o procedimento do valor-p: a. Utilize a cauda localizada à direita, pois os valores maiores de qui-quadrado discordam da hipótese nula: P = P(X2**>91,72|gl = 2) conforme é mostrado na figura a seguir. Usando o procedimento clássico: a. A região crítica é a cauda localizada à direita, pois os valores maiores de qui-quadrado discor¬ dam da hipótese nula. O valor crítico é obtido da Tabela 8, na interseção da linha do gl = 2 e a i coluna a = 0,05: X2{2,0,05) = 5,99 !ÿ í !ÿ r !;• valor-p 91,72 tf0 a= 0,05 i - 7ÿ".—Para determinar o valor-p, você tem duas opções: 1. Use a Tabela 8 do Apêndice B para atribuir limites ao valor-p: P < 0,005. 2. Use um computador ou uma calculadora para determinar o valor-p: P = 0,000+. Para .instruções específicas, veja a página 201. b. O valor-p é menor que a. 0 2 5,99 X? 91,72 Para instruções específicas, veja a página 199. b. x2ÿ está na região crítica, como é mostrado em vermelho na figura anterior. r a. A decisão é: rejeitar Ho. b. Conclusão: os três grupos de eleitores não possuem as mesmas proporções dos que são a favor da lei proposta, no nível de significância 0,05. [ \ . • mi Á::,1 . • ' i . *•" Ui ii-i ;.tj j P . • m m; sr s0Wlvrr k- •••• , , r ediSaMBItesi 249i4 Capítulo Aplicações de qui-quadrado *JV* ' 1- I Si - v> *ijSj Objetivo 11.1 11.1 Referente à amostra de 200 adultos entrevistados no exemplo sobre comida apimentada e ao gráfico "Apagan¬ do o fogo”da página 236: a. Quais informações foram coletadas de cada adulto na amostra? b. Defina a população e a variável envolvida na amostra. c. Utilizando os dados amostrais,calcule as porcentagens para os vários métodos de refrescar a boca. 11.2Encontre esses valores críticos utilizando a Tabela 8 do Apêndice B. a. xmo.01) b. 6,0,025) c. )í(40,0,10) d. X2(45,0,01) 11.3Utilizando a notação vistanoproblema 11.2,nomeiee en¬ contre os valores críticos de x2- A B C 0 E 27 17 15 22 19 TotalPolidor Frequência Solucione os problemas seguintes usando a abordagem do valor-p e a abordagem clássica: a. Elabore a hipótese para "sem preferência" na termino¬ logia estatística. b. Qual teste estatístico será utilizado no teste da hipóte¬ se nula? c Complete o teste de hipótese usando a=0,10. 11.8 As balas Skittles são vendidas em saquinhos com várias balas coloridas em cada. Você pode "provar o arco-íris" com suas cinco cores e sabores originais: verde (lima), roxo (uva), amarelo (limão), laranja (laranja) e vermelho (morango). Diferentemente de algumas balas multicolo- ridas disponíveis no mercado, a Skittles afirma que suas cinco cores são igualmente prováveis. Em uma tentativa de rejeitar essa afirmação, um saquinho de 4 onças (113,4 gramas) de Skittles foi adquirido e as cores contadas: 100 I V : . a. r:?f Vermelhas Laranjas Amarelas Verdes Roxas 18 21 23 17 27b. a=0,05 n=26 Essa amostra contradiz a afirmação da Skittles no nível 0,05? a. Solucione utilizando a abordagem do valor-p. b. Solucione utilizando a abordagem clássica.11.9A seção Snapshot do USA Todayde16de outubro de 2009 intitulada “Falar ao celular em lugares públicos é falta de educação?" informou os seguintes resultados de um rela¬ tório de pesquisa da FoxTV/Rasmussen: Objetivo 11.2 11.4Elabore a hipótese nula Hoe a hipótese alternativa Ha que seriam usadas para testar as seguintes afirmações: a. As quatro opções são igualmente prováveis. b. A pesquisa mostrou as distribuições de partidos políti¬ cos de 23%,36%e 41% para republicanos, democratas e independentes,respectivamente. c. Respostas favoráveis com relação à sustentabilidade e os quatro intervalos designados por geração estavam na razão de 11:15:8:6. 11.5 Determine o valor-p para os seguintes testes de hipóteses envolvendo a distribuição x2: a. H:P(1)=P(2) =P(3)=P(4) =0,25,com x2*=12,25 b. H°:P(l)=0,25,P(ll)=0,40,P(lll)=0,35, com X2* =5,98 11.6Determine valor e região críticos que seriam utilizados na abordagem clássica do teste de hipótese nula para cada um dos experimentos multinomiais a seguir: a. H\ P(1)=P(2) =P(3) =P(4)=0,25,coma=0,05 b. H:P(l) =0,25, P(ll)=0,40,P(lll) =0,35, coma= 0,01 11.7Um fabricante de polidores de pisos conduziu um expe¬ rimento de preferência do consumidor a fim de determi¬ nar qual dos cinco diferentes polidores de pisos resultava na melhor aparência. Uma amostra de 100 consumidores analisou cincoamostras depisos quehaviamrecebido um tipo de polidor cada. Cada consumidor indicou a amos¬ tra de sua preferência.O brilho e o plano de fundo foram aproximadamente os mesmos para todas as amostras de pisos.Os resultados foram os seguintes: Respostas à pesquisa Porcentagem Sim 51 Não 37 Não têm certeza Comomembro do Comité de Ética da sua faculdade,você decide conduzir uma pesquisa com os estudantes sobre esse assunto. A tabela a seguir apresenta as respostas de ,í 300 alunos: 12 Respostas à pesquisa Número Sim 126 Não 118 : Não têm certeza 56 : A distribuição das respostas dos estudantes universitários difere de forma significativa dos resultados publicados pela pesquisa de opinião pública? Use um nível de signi- ficância de 0,01. 11.10 Os sistemas nacionais de saúde constituem uma grande preocupação para os norte-americanos,atualmente.O ar- -# tigo do USA Today "Pesquisa: Os norte-americanos estão apreensivos com relação às mudanças nos sistemas de * saúde?" de 31 de outubro de 2009,informou as seguintes porcentagens sobre"Requisitos das companhias de segu- . jfc < ; - - Parte, U. 250 ' "iros que você deve atender para ter a cobertura de certos tratamentos"e sobre as mudanças no sistema de saúde: Porcentagem Situação dos funcionários 1. Desesperadamente semauxílio-o atendimento aos' pacientesfoiprejudicado 2. Sem auxílio,porém o atendimento aos pacientes lião foi ; 32 prejudicado 3. Adequado 4. Mais que adequado 5. Excelente l Ponto de vista de11a13 de setembro Porcentagem Melhorou Não mudou Piorou Desconhecido 22 35 38-38 125 6 Um mês depois,de 16 a T9 de outubro,outra pesquisa foi realizada com 1.521 adultos. Outros pontos de vista são separados por categorias na tabela a seguir: Uma pesquisa realizada com 500 enfermeiras de hospitais não atrativos forneceu as seguintes respostas à situação dos funcionários: Situação dos funcionários Número Ponto de vista de16 a19 deoutubro Melhorou Não mudou Piorou Desconhecido Número 1 2 3 4 5 165 140 125 50 20 Os dados indicam que as enfermeiras dos hospitais não atrativos possuem uma distribuição diferente de opiniões? Usea=0,05. a. Solucione utilizando a abordagem do valor-p. b. Solucione utilizandoa abordagem clássica. 11.14 A amostra de 200 adultos coletada no exemplo de comi¬ das apimentadas da página 236 mostra uma distribuição significativamente diferente damostradanográfico"Apa¬ gando o fogo"(página 236)? Usea=0,05. 11.15 De acordo com o site"The Harris Poll", a proporção de to¬ dos os adultos que vivem em residências com rifles (29%), espingardas (29%) ou pistolas (23%) não mudou deforma significativa desde 1996. No entanto, atualmente, mais pessoas vivem em residências sem armas (61%). Os 1.014 adultos que participaram da pesquisa forneceram os se¬ guintes resultados: 380 380 i700 61 No nível de significância 0,05, as distribuições dos pontos de vista mudaram deforma significativa entresetembroe outubro de 2009? 11.11 Ocomportamentodeaves à prbcuradealimentoestá sen¬ do estudado em uma floresta controlada constituída por pinheiros das seguintes espécies: Pseudotsuga (52% do volume da copa), Pinus Ponderosa (36%) e Abies Grandís (12%). Duzentos e trinta e oito pássaros trepadeira-azul- -do-canadá foram observados: 105 em Pseudotsugas, 92 em Pinus Ponderosas e 41 em Abies Grandis. A hipótese nula a ser testada é:"as aves procuram por alimento alea¬ toriamente, independentemente da espécie da árvore". a. Elabore a hipótese alternativa. b. Determine os valores esperados para o número de pássaros procurando por alimento em cada espécie de árvore. c. Complete otestedehipótese usando a=0,05 e elabo¬ re, cuidadosamente,a conclusão. 11.12 Um determinado tipo de semente de flor produzirá flores nas cores magenta, verde-amarelado e ocre na razão 6:3 :1 (uma flor por semente). Ao todo,100 sementes foram plantadas e todas germinaram, resultando no seguinte: Magenta Verde-amarelado Ocre 1 * 1 Todos os Todos os adultos (%) proprietários de armas (%)3 Que possuem rifle, espingarda e pistola (3 dos 3 tipos) Que possuem 2 dos3 tipos (rifle, espingarda oupistola) Que possuem1dos3 tipos (rifle, espingarda oupistola) Não quiseram responder/Não têm certeza_ 16 41 11 27 11 29 1 1 3 Total 39% 100% Em uma pesquisa realizada na cidade de Memphis, com 2 mil adultos que alegaram possuir armas, 780 alegaram possuir os três tipos, 550 alegaram possuir 2 dos 3 tipos, 560 legaram possuir 1 dos 3 tipos e 110 recusaram-se a especificar quais tipos de armas possuíam. a. Teste a hipótese nula de a distribuição do número de tipos de armas possuídas ser a mesma para Memphis e para a nacionalmente informada na pesquisa do site “The Harris Poll". Use um nível de significância igual a 0,05. b. O que fez que o valor calculado de x2* fosse tão grande? Parece razoável uma célula exercer tanto efeito sobre os resultados? De que maneira esse tes¬ te poderia ser realizado diferentemente (se possível, mais significativamente) de forma que os resultados não fossem afetados como foram no item (a)? Seja específico. 36 1252 : íSolucione os problemas seguintes usando a abordagem do valor-p e a abordagemclássica: a. Se a hipótese nula (6:3:1) for verdadeira, qual o nú¬ mero esperado de flores na cor magenta? b. Quantos graus de liberdade estão associados ao qui- -quadrado? c. Complete o teste de hipótese usandoa=0,10. 11.13 A NursingMagazine publicou os resultados de uma pes¬ quisa realizada commais de1.800 enfermeiras por todo o país sobrea satisfaçãonotrabalho e a retenção de pessoal. Enfermeiras de hospitais atrativos (que atraem e mantêm enfermeiras com sucesso) descrevem a situação dos fun¬ cionários em seus locais de trabalho,como segue: I 1 3 !.l; mm mm 251 .p,::É;ã íi.... : l 11.21 A síndrome de Tourette é um distúrbio neurológico e hereditário que ocorre ho início da infância e envolve múltiplos tiques motores e, pelo menos, um tique vocal. Um estudo realizado nos Estados Unidos, publicado no Relatório semanal de morbidez e mortalidade do CDC de 5 de junho de 2009, indicou que a síndrome ocorre em três entre cada mil crianças emidade escolar.Uma análise aprofundada classificou os dados de acordo com a etnia e a raça - veja a tabela a seguir. No nível de significância 0,05, a amostra indica que ter a síndrome de Tourette é independente da etnia e da raça? Objetivo 11.3 11.16 Elabore a hipótese nula Hoe a hipótese alternativa Hoque seriam usadaspara testar as seguintes afirmações: a. Os eleitores expressaram preferências que não eram independentes de suas afiliações em partidos. b. A distribuição das opiniões é a mesma para as três co¬ munidades. c. A proporção derespostas afirmativas foi a mesma para todas as categorias pesquisadas. 11.17 O"teste de independência"e o“teste de homogeneidade" são realizados de forma idêntica, usando-se a tabela con- tingencial para distribuir e organizar os cálculos.Explique como esses dois testes de hipóteses diferem entre si. 11.18 Determineo valor esperado para cada célula apresentada: Brancos não Negros não hispânicos hispânicosHispânicos ’ TêmasíndramedeTourette 26 Nâo têm a síndrome de 7.321 Tourette 164 18 43.602 6.427 : 50 11.22 A síndrome deTourette éum distúrbio neurológico e here¬ ditário que ocorre no início da infância e envolve múltiplos tiques motores e, pelo menos,um tique vocal. Um estudo realizado nos Estados Unidos, publicado no Relatório se¬ manaldemorbidezemortalidade do CDC de 5 de junho de 2009,indicouque a síndromeocorreemtrêsentre cada mil crianças em idade escolar. Uma análise aprofundada clas¬ sificou os dados de acordo com a renda familiar de acordo com o nível federal de pobreza- veja a tabela a seguir.No nível de significância 0,05, a amostra indica que ter a sín¬ dromedeTourette independe da renda familiar? 40 200 11.19 Os resultados da "2003 Youth Risk Behavior Survey" (pes¬ quisa sobre o comportamento de risco na juventude de 2003), com relação ao uso do cinto de segurança, foram publicados na seção Snapshot do USA Today de 13 de ja¬ neiro de 2005. A tabela a seguir resume os resultados de uma pesquisa realizada com estudantes do ensino médio no estado de Nebraska.Foi perguntado se esses estudan¬ tes raramente ou nunca usam ocinto de segurança quan¬ do andam de carona no carro de alguém. :-c 1 Estudantes do sexo Estudantes do sexo masculino Abaixo de 200%-400% Above 400% feminino 200% 324Raramente oununca usam o cinto de segurança Usam cinto de segurança FONTE: www.cdc.gov Usando a=0,05, essa amostra apresenta evidências sufi¬ cientes para rejeitar a hipótese de o sexo ser independen¬ te do uso do cinto de segurança? a. Solucione utilizando a abordagem do valor-p. b. Solucione utilizando a abordagem clássica. 11.20 Uma pesquisa realizada com viajantes selecionados alea¬ toriamente que usaram os banheiros de um posto de ga¬ solina de uma grande distribuidora de petróleo dosEstados Unidos apresentou os seguintes resultados: 208 Têm a síndromedeTourette Não têm a síndrome de Tourette 65 80 80 17581 21.795 24.432 1.217 1.184li 11.23 Animais doentes que,hipoteticamente, recebem uma de¬ terminada droga (grupo experimental) sobreviverão em uma taxa mais favoráveldo que aqueles quenão recebem a droga (grupo de controle).Os resultados a seguir foram registrados. - Sobreviveram Não sobreviveram -Grupo experimental Grupo de controle a. Explique por que a hipótese do exercício não pode ser a hipótese nula. b. Expliquepor quea hipótese nula é corretamente afirma¬ da como"A sobrevivência independe do tratamento". c. Complete o testedehipótese,determinando ovalor-p. d. Seo teste for realizado usando a=0,02,elabore a deci¬ são que deve ser tomada. e. Seo teste for realizado usando a=0,02,elabore,cuida¬ dosamente, a conclusão e o seu significado. 11.24 A seção Snapshot do USA Today de 12 de novembro de 2009 "Raiva em gatos em ascensão" informou que quase 7 mil animais foram declarados com raiva em 2008. Utili¬ zando informações do Journalof the American Veterinary 46 18 38 35 ! I Qualidade das instalações do banheiro Abaixo da média Acima da média Na médiaSexodoreplicante Mulheres Homens Totais . ! 597 24 28 26 7 418 15 50 35 100Totais Usando a = 0,05, essa amostra apresenta evidências su¬ ficientes para rejeitar a hipótese "A opinião sobre a qua¬ lidade dos banheiros independe do sexo do replicante"? a. Solucione utilizando a abordagem do valor-p. b. Solucione utilizando a abordagem clássica. ”..... -y ' ---f? r- - V/.-: “r ';ÿ .MedicalAssociation {Periódico da associação norte-ameri¬ cana de medicina veterinária), os seguintes casos de raiva foram registrados para cães e gatos: ÂProfessor Notas #1 12 .V: 13 11 27 29; 25 uA 12 :í mQes Gatos BAno 16 c2007 93 274 35 30 .• 15 " •í 23 . No nível de significância 0,01, há evidências suficientes para concluir que"A distribuição das notas não é a mesma para os três professores"? a. Solucione utilizando a abordagem do valor-p. b. Solucione utilizando a abordagem clássica. c. Qual professor dá as melhores notas? Explique, men¬ cionando evidências específicas que sustentem sua resposta. 11.27 Pessoas cada vez mais jovens são capazes de adquirir ar¬ mas ilegais? De acordo com o artigo publicado pelo De¬ mocratandChronicle em 11 de outubro de 2009, da cida¬ de de Rochester, Nova York,“A arma usada para atirar em DiPonzio",que informou queum garoto de 14 anos atirou em um oficial de polícia - aparentemente, o número de grupos de pessoas muito jovens encontrados com armas ilegaiscontinua a crescer.No níveldesignificância0,01,apa¬ rentemente, a distribuição das idades das pessoas que pos¬ suem armas ilegais éa mesma para os anos mencionados? Outros75 294 272008 40 No nível de significância 0,05, a distribuição de casos de raiva entre cães e gatos é a mesma para os anos mencio¬ nados? : 11.25 De acordo com um relatório fornecido pela Substance Abuse and Mental Health Services Administration (Admi¬ nistração Federal para Serviços de Saúde Mental e Abuso de Substâncias), trabalhadores do ramo alimentício apre¬ sentam o índice mais elevado de fumantes: 45% relata¬ ramterem fumado cigarronoúltimo mês.Algumas carrei¬ ras estão mais propensas que outras a induziras pessoas a tornarem-se fumantes? Se 100 pessoas em cada uma das seguintes ocupações forem questionadas se fumaram no último mês, os dados sustentam a hipótese de algumas carreiras conter níveis mais elevados de fumantes? Use um nível de significância dé 0,05. - Construção Produção Engenharia Política Educação 37 17 17 12 Ocupação Número de fumantes í43 1126 Estudantes utilizam diversos critérios ao escolherem cur¬ sos."Professor que dá boas notas”é um critério frequente. Três professores foram escalados para dar aula de estatísti¬ ca nopróximo semestre.Uma amostra das distribuições de notas anteriores desses três professores é mostrada aqui. Ano 21anos oumenos De 22 a 30 anos De 31 a 50 anos 51 anos oumais r 2005 103 93 111 33 .1 2006 119 136 96 31 =7 2007 155 140 130 764 t 2008 159 160 104 60 =j : •:-= ! i b ... , ,11 . n ill• WÊÊÊIm•Mii
Compartilhar