Buscar

Exercicios testes nao parametricos resoluçao parcial

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

ANÁLISE DE DADOS 
 
 
 
 
1 
 
 
Exercícios de ensaios de hipóteses não paramétricos 
 
 
1. Com o objetivo de caracterizar o comportamento de compra dos jovens e a fidelidade às 
marcas, a partir de uma amostra global dos 313 inquiridos, foram feitas algumas análises 
estatísticas cujos resultados se apresentam: 
 
 
 
 
 
a) Indique as hipóteses nula e alternativa do teste efetuado e a decisão a tomar para um nível de 
significância de 0,01. 
H0: As variáveis Costuma comprar artigos de marca? e Considera-se fiel a marcas específicas? 
são independentes 
H1: As variáveis não são independentes 
 
Como as condições de aplicabilidade do teste assimptótico estão verificadas, 1) não mais de 20% 
das ocorrências esperadas serem inferiores a 5 e 2) nenhuma ocorrência esperada ser inferior a 1, a 
decisão a tomar é rejeitar H0. Ou seja, as variáveis em causa estão relacionadas (Sig = 0,000) 
 
b) Que conclusões retira das análises efetuadas em termos de caracterização dos jovens? 
Na amostra, identificam-se as seguintes relações: 
 
Considera-se fiel a marcas 
específicas? Total 
Sim Não 
Costuma comprar 
artigos de marca? 
Sim 145 92 237 
Não 8 68 76 
Total 153 160 313 
 
Sim Não
Costuma comprar artigos de 
marca?
0
30
60
90
120
150
145
8
92
68
Considera-se 
consumidor fiel 
a marcas 
específicas?
Sim
Não
Bar Chart
Chi-Square Tests
59,094b 1 ,000
57,084 1 ,000
66,008 1 ,000
58,905 1 ,000
313
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Computed only for a 2x2 tablea. 
0 cells (,0%) have expected count less than 5. The minimum expected count is
37,15.
b. 
ANÁLISE DE DADOS 
 
 
 
 
2 
 
1) Do total de consumidores inquiridos, a maioria (237/313*100 = 75,7%) costumam 
comprar artigos de marca; e destes, a maioria (145/237*100= 61,18%) considera-se 
fiel a marcas específicas; 
2) Dos inquiridos que não costumam comprar artigos de marca, a maioria (68/76*100= 
89,47%) não se considera fiel a marcas específicas 
3) O nº de inquiridos que se considera fiel a marcas específicas é idêntico ao nº de 
inquiridos que não se considera fiel a marcas específicas (153 vs 160); 
4) Do total de inquiridos, cerca de 46,3% (145/313*100) costuma comprar artigos de 
marca e considera-se fiel a marcas específicas e 21,7% não costumam comprar 
artigos de marca e não se considera fiel a marcas específicas 
(…) 
2. Uma equipa de jovens investigadores numa grande empresa pretendeu analisar até que ponto o 
Sexo dos trabalhadores se relaciona com o seu Grau de Felicidade medido numa escala ordinal 
de 0 (extremamente infeliz) a 10 (extremamente feliz). Essa equipa obteve os seguintes 
outputs e agrupou-os da seguinte maneira: 
 
ANÁLISE DE DADOS 
 
 
 
 
3 
 
CASO A 
TABELA 1 
 Sexo N Mean Std. Deviation Std. Error Mean 
Grau de felicidade Masculino 55 6,53 1,676 ,226 
Feminino 235 7,07 1,795 ,117 
TABELA 2 
Sexo 
Kolmogorov-Smirnova Shapiro-Wilk 
Statistic df Sig. Statistic df Sig. 
Grau de 
felicidade 
Masculino ,156 55 ,002 ,954 55 ,036 
Feminino ,199 235 ,000 ,922 235 ,000 
a. Lilliefors Significance Correction 
TABELA 3 
 
Levene's Test for 
Equality of Variances t-test for Equality of Means 
F Sig. t df Sig. (2-tailed) 
Grau de 
felicidade 
Equal variances 
assumed ,000 ,998 -2,052 288 ,041 
Equal variances not 
assumed -2,141 85,450 ,035 
 
CASO B 
 TABELA 4 
 Sexo N Mean Rank Sum of Ranks 
Grau de felicidade Masculino 55 119,33 6563,00 
Feminino 235 151,63 35632,00 
Total 290 
TABELA 5 
 
Grau de 
felicidade 
Mann-Whitney U 5023,000 
Wilcoxon W 6563,000 
Z -2,624 
Asymp. Sig. (2-tailed) ,009 
Exact Sig. (2-tailed) ,008 
Exact Sig. (1-tailed) ,004 
Point Probability ,000 
a. Grouping Variable: Sexo 
 
a) Ajude-os e diga-lhes qual o procedimento estatístico correto, o agrupado no caso A ou o no caso 
B. Justifique a sua escolha sem se esquecer de validar os pressupostos. 
O procedimento correcto é o Caso B porque a variável em estudo é qualitativa ordinal em escala 
ordinal e como estamos perante duas amostras independentes (quem é do sexo masculino não 
pode fazer parte do grupo dos que são do sexo feminino), o teste Mann-Whitney é o adequado. 
b) A partir do procedimento estatístico adequado, formule as hipóteses e tome uma decisão no 
sentido de responder à questão inicial que é a de saber se existe alguma relação entre as 
variáveis identificadas. 
c) Qual o erro que se pode estar a incorrer com a decisão tomada na alínea anterior? 
ANÁLISE DE DADOS 
 
 
 
 
4 
 
d) Qual a medida de associação adequada a esta análise? 
 
 
3. Numa pesquisa no âmbito do Emprego, foi fornecido um conjunto de questões às quais os 
inquiridos se deveriam pronunciar numa escala de concordância de 1 a 5 (1: discordo totalmente 
a 5: concordo totalmente. Uma das variáveis analisadas foi o Nível de instrução e, num 
primeiro momento, quis decidir-se se a amostra recolhida poderia ter sido considerada não 
enviesada (no que respeita à escolaridade) face à população de onde foi retirada, tendo por base 
os dados publicados pelo INE. O procedimento usado consta das Tabelas A e B. 
TABELA A: Nível de instrução 
 
Observed 
N 
Expected 
N 
Residual 
Básico 39 42,8 -3,8 
Secundário 72 68,4 3,6 
Médio ou Superior 60 59,9 ,2 
Total 171 
 
TABELA B 
 Nível de instrução 
Chi-Square ,519 
df 2 
Asymp. Sig. ,772 
a. 0 cells (,0%) have expected frequencies less 
than 5. The minimum expected cell 
frequency is 42,8. 
 
a) Indique qual o teste realizado e diga se o acha adequado ao problema em causa. 
b) Indique quais as condições de aplicação deste teste e diga se as considera satisfeitas. 
c) Formule as hipóteses subjacentes ao teste e tome a decisão. 
 
4. Tem-se a ideia de que em certos tipos de comunidade o acesso ao ensino médio ou superior é 
limitado, pelo que a maioria dos seus habitantes termina os estudos com o ensino secundário. 
Para testar esta hipótese realizaram-se os procedimentos apresentados nas Tabelas A, B e C. 
TABELA A 
 
Escolaridade 
Até ao 
Secundário 
Médio ou 
Superior Total 
Tipo de 
comunidade 
Urbano 9 32 41 
Semi-rural 5 20 25 
Rural 15 10 25 
 Total 29 62 91 
 
ANÁLISE DE DADOS 
 
 
 
 
5 
 
TABELA B 
 Value 
df Asymp. 
Sig.(2-sided) 
Exact. 
Sig.(2-sided) 
Exact. 
Sig.(1-sided) 
Point 
Probability 
Pearson Chi-Square 16,282a 2 ,005 ,005 
Likelihood Ratio 12,965 2 ,006 ,006 
Fisher’s Exact Test ,644 ,007 
Linear-by-Linear Association ,644 1 ,016 ,022 ,012 ,006 
N of Valid Cases 91 
TABELA C 
 Value Appox. Sig. Exact.Sig 
Nominal by 
Nominal 
Phi ,324 ,005 ,005 
Cramer’s V ,324 ,005 ,005 
N of Valid Cases 91 
 
a) Qual o procedimento constante na tabela B? Será que este procedimento é o adequado às 
variáveis em análise? Formule as hipóteses e tome a decisão. 
É o teste do Qui-quadrado e é adequado porque o Tipo de comunidade é uma variável qualitativa e a 
Escolaridade é uma variável qualitativa ordinal que está a ser tratada como nominal. 
H0: não há relação entre o Tipo de comunidade e a Escolaridade. 
Há: há relação entre o Tipo de comunidade e a Escolaridade. 
Com um valor do χ2= 16,282 para gl=2 e Sig < 0,05 rejeita-se H0 e conclui-se que há relação entre o 
Tipo de comunidade e a Escolaridade na população. 
b) Descreva a relação entre as variáveis e diga o que pode concluir quanto ao grau de associação 
entre estas. 
1. Dos inquiridos que vivem num meio urbano, 32 (≡ 78%) têm um grau de escolaridade 
Médio ou Superior
enquanto dos inquiridos que vicem num meio rural, 60% possuem 
níveis educacionais Até ao secundário; 
2. Do total de inquiridos, 68,13% têm um grau de ensino médio ou superior; 
3. Do total de inquiridos, somente 27,47% habitam num meio rural. 
Concluindo, há uma relação amostral fraca a mediana entre estas variáveis (0,324) apesar de 
elas estarem relacionadas na população. 
 
 
5. Uma das hipóteses levantadas por uma equipa de investigação é a de que a quantidade de lixo 
doméstico produzido pode ser reduzida mediante uma campanha de informação que 
fornecesse conselhos práticos para reduzir o desperdício. Assim, os investigadores conduziram 
uma campanha de informação junto dos residentes num dado município. Dos 52 residentes que 
fizeram parte da presente amostra, 38 não foram alvo da campanha e 14 receberam informação 
sobre como reduzir o lixo doméstico. Para testar a hipótese em causa realizaram-se os 
procedimentos que constam das Tabelas 1, 2 e 3, apresentados em seguida. 
 
ANÁLISE DE DADOS 
 
 
 
 
6 
 
TABELA 1 
Tem recebido Informação 
sobre tratamento do lixo? 
Kolmogorov-Smirnov Shapiro-Wilk 
Statistics df Sig. Statistics df Sig. 
Quantos sacos de lixo 
são produzidos por dia? 
sim ,327 14 ,000 ,837 14 ,015 
não ,413 38 ,000 ,621 38 ,000 
a. Lilliefors Significance Correction 
 
TABELA 2 
Tem recebido Informação 
sobre tratamento do lixo? N 
Mean 
Rank 
Sum of 
Ranks 
Quantos sacos de 
lixo são produzidos 
por dia? 
sim 14 40,54 567,50 
não 38 21,33 810,50 
Total 52 
 
 
TABELA 3 
 
 
a) Indique qual o procedimento estatístico realizado para testar a hipótese em causa. Quais os 
motivos que levaram a essa opção? (se referir o recurso a algum teste auxiliar, formule as 
hipóteses e tome a decisão). 
De acordo com as variáveis em análise e com o que se pretende, o teste de 1ª escolha seria o teste para a 
diferença de médias, amostras independentes. 
No entanto, a amostra dos que receberam informação é pequena (n=14), pelo que não é possível invocar 
o TLC para satisfazer o pressuposto da normalidade (subjacente ao t test). Assim, recorrendo-se ao teste 
de Shapiro-Wilk, testa-se se o pressuposto da normalidade do nº de sacos de lixo produzidos no grupo 
dos que recebem informação sobre o tratamento do lixo. 
Ho: O nº de sacos de lixo produzidos segue uma distribuição normal no universo dos que recebem 
informação. 
Ha:O nº de sacos de lixo produzidos não segue uma distribuição normal no universo dos que recebem 
informação. 
S14= 0,837 ; Sig=0,015≤0,05 pelo que se rejeita H0 e se assume que o nº de sacos não segue uma 
distribuição normal naquele universo. 
Como não se verifica o pressuposto da normalidade do T- test recorre-se à sua alternativa não 
paramétrica → o teste de Mann-Whitney. 
b) Com base na informação disponível o que pode concluir sobre a hipótese dos investigadores? 
Ho: A média das ordenações do nº de sacos de lixo é igual ou superior no universo dos que recebem a 
informação relativamente aos que não recebem. 
Ha: A média das ordenações do nº de sacos de lixo é inferior no universo de quem recebe informação. 
Tabela 10: Test Statisticsa 
 
Quantos sacos de 
lixo são produzidos 
por dia 
Mann-Whitney U 69,500 
Wilcoxon W 810,500 
Z -4,460 
Asymp. Sig. (2-tailed) ,000 
Exact Sig. (2-tailed) ,000 
Exact Sig. (1-tailed) ,000 
Point Probability ,000 
a. Grouping Variable: Tem recebido 
informação sobre tratamento do lixo? 
 
ANÁLISE DE DADOS 
 
 
 
 
7 
 
T=69,5 e Sig ≅ 0, não se rejeita a H0. Conclui-se que a média das ordenações do nº de sacos de lixo não 
é igual, mas que vai no sentido contrário à hipótese teórica. Ou seja, conclui-se que efectivamente a 
informação amostral parece evidenciar que quem produz mais lixo é quem recebe informação. 
6. O diretor de Recursos Humanos de uma empresa de auditoria (Big 4) está preocupado em 
perceber o que motiva os colaboradores a adotarem as novas tecnologias para auditoria no seu 
trabalho diário. Para o efeito, selecionou aleatoriamente alguns colaboradores da organização e 
inquiriu-os sobre duas motivações para a efetiva utilização das tecnologias: ganhos de 
produtividade e facilidade de aprendizagem e utilização, em que ambas estão medidas numa 
escala de 1 (baixa motivação) a 7 (elevada motivação). Adicionalmente, o responsável procurou 
compreender se as motivações dependiam da experiência profissional e do sexo do colaborador e 
se a frequência da utilização das novas tecnologias (medida numa escala ordinal de sete pontos 
que vai de nunca utilizo (1) a utilizo constantemente (7)) é mais elevada nos colaboradores do sexo 
masculino. 
a) Uma primeira análise visou perceber se as duas motivações têm igual peso na decisão de adotar 
as novas tecnologias em cada grupo de colaboradores, definido pela combinação do sexo e da 
experiência profissional. Alguns outputs do IBM SPSS Statistics são apresentados em três 
blocos (Grupos A1 e A2, e Grupo C). 
Grupo A1 
 
 
 
 
 
 
 
 
 
 
ANÁLISE DE DADOS 
 
 
 
 
8 
 
Grupo A2 
 
 
 
 
 
 
 
 
 
ANÁLISE DE DADOS 
 
 
 
 
9 
 
Grupo B 
 
 
 
 
 
 
 
 
 
 
ANÁLISE DE DADOS 
 
 
 
 
10 
 
a1) No contexto do problema, qual a finalidade do output do Grupo A1 e o que retira da sua 
análise? 
 
a2) Qual a finalidade do output Paired Samples Correlation (Grupo A2) e o que retira da sua 
análise. Apresente as hipóteses de um dos testes estatísticos realizado. 
 
a3) Atendendo aos resultados das alíneas anteriores, em que grupos de colaboradores as médias 
das duas motivações (ganhos de produtividade e facilidade de aprendizagem e utilização) não 
são estatisticamente diferentes. 
 
a4) Como justifica a realização do procedimento cujos outputs se encontram no Grupo B? 
 
a5) Atendendo aos resultados anteriores, o que pode concluir sobre a comparação das duas 
motivações nos diferentes grupos. Apresente as hipóteses para um dos testes estatísticos 
realizados. 
 
a6) Para representar, em termos descritivos, os resultados relacionados com a comparação das duas 
motivações nos diferentes grupos que técnicas de estatística descritiva recomenda. 
 
 
b) Uma segunda análise visou perceber de que forma a frequência de utilização das folhas de 
cálculo é maior nos colaboradores do sexo masculino. Alguns resultados (outputs) são 
apresentados de seguida α= 0,1: 
 
 
 
 
b1) Identifique o procedimento realizado e diga se o considera adequado ao objetivo. 
 
b2) Apresente as hipóteses estatísticas do procedimento e tome a decisão. 
 
b3) A partir de que nível de significância a sua decisão seria alterada? 
 
b4) Como diretor dos Recursos Humanos encontra alguma justificação para estes resultados?

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando