Métodos quantitativos em processos decisórios: resumo do curso inteiro + atividades

•

MACKENZIE

Bárbara Marmit

10/09/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Métodos Quantitativos

15.542 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
Marmit, Barbara 
METÓDOS QUANTITATIVOS EM PROCESSOS DECISÓRIOS – CIÊNCIAS ECONÔMICAS/MACKENZIE 
Feito por Marmitão, a deusa, rainha e salvadora da vida de todos vocês nessa matéria meicu. 
➢ Simbologia, significados/interpretações 
 
N Tamanho da população finita n Tamanho da amostra 
 𝜇 Média populacional 𝑥 Média amostral 
𝜎 Desvio padrão populacional 𝑠 Desvio padrão amostral 
𝜌 Probabilidade/proporção populacional 𝑝 Probabilidade/proporção amostral 
 
𝑥𝑖 Valor dado 𝑧 Uso quando σ conhecido 
𝑥1 Valor 1 do intervalo na linha horizontal (x) 𝑡 Uso quando σ desconhecido 
𝑥2 Valor 2 do intervalo na linha horizontal (x) 𝛾 Confiança (90%, 95%, 99%) 
𝛼 Nível de signifiância 𝜀 Margem de erro 
 
 
1. AMOSTRAGEM 
 
▪ Teorema Limite Central (TLC) 
O TLC é atingido quando a forma de distribuição é aproximadamente normal. Geralmente, é atingido quando o tamanho 
da amostra é 30 ou mais. Para valores atípicos (com outliers), a amostra deverá ter 50 elementos ou mais. 
 
▪ Identificar número de amostras aleatórias possíveis, tendo uma população finita: 
 
𝑁!
𝑛! (𝑁 − 𝑛)!
 
 
▪ Montagem de um histograma: 
1. Montar tabela com três colunas: 
Agrupamento por faixa de valores (ex. 1 – 100; 101 – 200) 
Frequência absoluta de cada faixa de valor (quantos elementos da amostra se encaixam naquela faixa) 
Frequência relativa (densidade) de cada faixa de valor (frequência absoluta da faixa divido pelo número rotal de elementos) 
2. Colocar frequência relativa (densidade) dividida igualmente na linha vertical do gráfico (y). 
3. Colocar primeiro valor de cada faixa de valores na na linha horizontal do gráfico (x). 
4. Fazer colunas grudadas de acordo com as informações de faixa e densidade de cada linha da tabela. 
 
▪ Determinar quanto a probabilidade da média amostral estar longe da média populacional dada (intervalo). 
1. Através de cálculo de erro padrão da média (𝜎𝑥). 
Quando n/N ≤ 5%, usa-se a fórmula da população infinita para a população finita. 
 
Quando a população é finita usa-se: 
 
 
 Quando a população é infinita, usa-se: 
 
𝜎𝑥 = √
𝑁 − 𝑛
𝑁 − 1
 . (
𝜎
√𝑛
) 
 
 
𝜎𝑥 =
𝜎
√𝑛
 
 
 
2. Aplicar fórmula no Excel: 
= DIST.NORM.N(𝜇 + 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎𝑑𝑜; 𝜇; 𝜎𝑥 ; 𝑉𝐸𝑅𝐷𝐴𝐷𝐸𝐼𝑅𝑂) 
Pegar o resultado da fórmula, subtrair de 1 e multiplicar o resultado da subtração por 2, ou seja: 
(1 – resultado da fórmula de Excel)*2 → Resultado será a probabilidade de estar dentro de um intervalo especificado. 
 
2 
Marmit, Barbara 
 
▪ Determinar a probabilidade de uma amostra estar dentro de uma proporção populacional dada (intervalo). 
1. Através de cálculo de erro padrão da média (𝜎𝑝). 
Quando n/N ≤ 5%, usa-se a fórmula da população infinita para a população finita. 
 
Quando a população é finita usa-se: 
 
 
Quando a população é infinita, usa-se: 
 
𝜎𝑝 = √
𝑁 − 𝑛
𝑁 − 1
 . √
𝑝 (1 − 𝑝)
𝑛
 
 
 
𝜎𝑝 = √
𝑝 (1 − 𝑝)
𝑛
 
 
 
2. Aplicar fórmula no Excel: 
= DIST.NORM.N(𝑝 + 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎𝑑𝑜; 𝑝; 𝜎𝑝 ; 𝑉𝐸𝑅𝐷𝐴𝐷𝐸𝐼𝑅𝑂) 
Pegar o resultado da fórmula, subtrair de 1 e multiplicar o resultado da subtração por 2, ou seja: 
(1 – resultado da fórmula de Excel)*2 → Resultado será a probabilidade de estar dentro de um intervalo especificado. 
 
 
▪ Determinar o tamanho de uma amostra 
 
 
 
 
 
 
 
▪ Determinar o tamanho de uma amostra para proporções 
 
Quando a p conhecido usa-se: 
 
 
Quando a p desconhecido usa-se: 
 
𝑛 = 
𝑧𝛾
2 . 𝑝(1 − 𝑝)
𝜀²
 
 
 
𝑛 = 
𝑧𝛾
2 
4 . 𝜀²
 
 
 
 
2. ESTIMATIVA INTERVALAR E INTERVALO DE CONFIANÇA 
 
É a estimativa pontual ± a margem de erro. Os resultados do cálculo ± define os dois valores do intervalo. 
 
Quando desvio populacional conhecido usa-se: 
 
 Quando desvio populacional desconhecido usa-se 
 𝑥 ± 𝑧𝛼/2 .
𝜎
√𝑛
 
 
 
 𝑥 ± 𝑡𝛼/2 .
𝑠
√𝑛
 
 
Fórmula no Excel para encontrar z: = INV.NORMP.N((1 – confiança)/2) 
Fórmula no Excel para encontrar t: = INV.T.BC((1 – confiança); n-1) 
Quando faz a conta utilizando o sinal negativo, encontra-se 𝑥1 do intervalo, utilizando o positivo, encontra-se 𝑥2. 
 
Quando a população é finita usa-se: 
 
 
 Quando a população é infinita, usa-se: 
 
𝑛 =
𝑧2 . 𝜎2 . 𝑁
𝜀2 . (𝑁−1) + 𝑧2 . 𝜎2
 ou 𝑛 =
𝑧2 . 𝑝 . 𝑞 . 𝑁
𝜀2 . (𝑁−1) + 𝑧2 . 𝑝 . 𝑞
 
 
 
 𝑛 = 
𝜎2𝑧𝛾
2
𝜀²
 
 
3 
Marmit, Barbara 
3. HIPÓTESES 
A hipótese nula é a hipótese inicial e a hipótese alternativa é contrária à hipótese inicial. 
Só existem duas conclusões possíveis: não rejeitar a hipótese nula e rejeitar a hipótese nula. 
 
 Teste cauda inferior Teste cauda superior Teste bicaudal 
Hipótese 
𝐻0: 𝜇 ≥ 𝜇0 
𝐻1: 𝜇 < 𝜇0 
𝐻0: 𝜇 ≤ 𝜇0 
𝐻1: 𝜇 > 𝜇0 
𝐻0: 𝜇 = 𝜇0 
𝐻1: 𝜇 ≠ 𝜇0 
Estatística de teste 𝑧 = 
𝑥 − 𝜇0
𝜎
√𝑛
⁄
 𝑧 = 
𝑥 − 𝜇0
𝜎
√𝑛
⁄
 𝑧 = 
𝑥 − 𝜇0
𝜎
√𝑛
⁄
 
Critério valor-p 
Rejeitar 𝐻0 se 
valor-p 𝐻0 ≤ 𝛼 
Rejeitar 𝐻0 se 
valor-p 𝐻0 ≤ 𝛼 
Rejeitar 𝐻0 se 
valor-p 𝐻0 ≤ 𝛼 
Critério valor crítico 
Rejeitar 𝐻0 se 
 𝑧 ≤ −𝑧𝛼 
Rejeitar 𝐻0 se 
 𝑧 ≥ 𝑧𝛼 
Rejeitar 𝐻0 se 
 𝑧 ≤ −𝑧𝛼/2 𝑜𝑢 𝑧 ≥ 𝑧𝛼/2 
 
 
1. Desenvolve-se a hipótese nula e alternativa (teste cauda inferior ou superior ou bicaudal) 
2. Especificar nível de significância 
3. Realizar estatística de teste 
 
𝑧 = 
𝑥 − 𝜇0
𝜎
√𝑛
⁄
 
4. Usar um dos critérios: 
 
a) Critério valor-p 
Uso de uma das fórmulas: 
=DIST.NORMP.N(z; VERDADEIRO) 
=DIST.NORM.N(�̅� ; 𝜇 ; 𝜎𝑥 ; VERDADEIRO) 
 
Quando cauda inferior: resultado da fórmula já é o valor-p. 
Quando cauda superior: o resultado da fórmula deve ser subtraído de 1 para chegar ao valor-p: (1 – fórmula). 
Quando bicaudal: o resultado da fórmula deve ser subtraído de 1 e multiplcado por 2: (1 – fórmula)*2. 
 
Interpretação: 
valor-p ˂ 0,01 – esmagadora evidência de que hipótese alternativa é verdadeira. 
0,01 ≤ valor-p ˂ 0,05 – forte evidência de que hipótese alternativa é verdadeira. 
0,05 ≤ valor-p ≤ 0,10 – fraca evidência de que hipótese alternativa é verdadeira. 
valor-p ˃ 0,10 – insuficiente evidência de que hipótese alternativa é verdadeira 
 
 
b) Critério valor crítico: 
Uso de uma das fórmulas para 
= INV.NORMP.N(1 – confiança), para encontar 𝑧𝑎 e comparar com z (deixar o sinal conforme o teste da cauda utilizado) 
= INV.NORM.N(1 – confiança; 𝜇0 ; 𝜎𝑥), para encontrar x e comparar com o valor da hipótese nula. 
 
 
 
4 
Marmit, Barbara 
4. TESTES DE PRESSUPOSTOS 
 
▪ Teste de normalidade e Teste de Levene 
A hipótese nula para o Teste de Normalidade é de que a distribuição é normal. 
A hipótese nula para o Teste de Levene (Homogeneidade de variâncias) é de que as variâncias são iguais. 
 
1. Analisar → Estatísticas Descritivas → Explorar; 
2. Colocar variável quantitativa em “Lista de variáveis dependentes” e variável qualitativa em “Lista de fatores”; 
3. Na opção “Estatística”, colocar o intervalo de confiança espeficicado (95%, quando não especificado). 
4. Na opção “Gráficos”, marcar: gráficos de normalidade com teste e na parte “Dispersão vs. Nível com testes de 
Levene”, marcar “Não transformado”. 
 
Sig. é o p-valor. 
 
Interpretação Teste de Normalidade: 
Quando n < 30, analisar coluna de Shapiro-Wilk, quando n ≥ 30, analisar coluna Kolmogorov-Smirnov 
Sig. ≥ 0,05 – distribuição é normal (não rejeita a hipótese nula), usa-se teste paramétrico. 
Sig. < 0,05 – distribuição não é normal (rejeita a hipótese nula), usa-se testes não paramétricos. 
 
Interpretação Teste de Levene (Homogeneidade de variâncias): 
Sig. ≥ 0,05 – as variâncias são iguais (não rejeita a hipótese nula), usa-se teste paramétrico. 
Sig. < 0,05 – as variâncias não são iguais (rejeita a hipótese nula), usa-se testes não paramétricos. 
 
5. TESTES PARAMÉTRICOS 
 
▪ Teste de comparação de médias com valor de teste definido (valor para comparaçãojá dado). 
A hipótese nula desse teste assume que a média da amostra é igual ao valor de teste. 
 
Fazer Testes de Normalidade e Levene, se a distribuição for normal e as variâncias forem iguais, segue: 
 
1. Analisar → Comparar médias → Uma amostra de Teste-T 
2. Variável quantitativa no campo de “Variável(is) de teste” 
3. No campo “Valor de teste” colocar o valor de teste (valor para comparação) definido na hipótese nula 
4. Em “Opções”, colocar o intervalo de confiança (95%, quando não especificado) 
 
Interpretação p-valor: 
Sig. (2 extremidades) ≥ 0,05 – as médias são iguais (não rejeita a hipótese nula). 
Sig. (2 extremidades) < 0,05 – as médias não são iguais. (rejeita a hipótese nula). 
Interpretação por valores absolutos: 
Valor de teste + Diferença média = Média amostral 
Média amostral + valor inferior = 𝑥1 
Média amostral + valor superior = 𝑥2 
Se o valor de teste não estiver entre o intervalo de 𝑥1 e 𝑥2, considera que as médias são diferentes. 
 
 
 
5 
Marmit, Barbara 
▪ Teste de comparação de médias de duas amostras independentes (comparação da média de uma amostra com a 
média de outra amostra). 
A hipótese nula desse teste assume que as médias das duas amostras independentes são iguais. 
 
Fazer o Teste de Normalidade, se a distribuição for normal, segue: 
 
1. Analisar → Comparar médias → Teste-T de amostras Independentes. 
2. Colocar variável quantitativa no campo de “Variável(is) de teste” e variável qualitativa em “Variável de 
agrupamento” e define-se o nome dos dois grupos a serem analisados. 
3. Em “Opções”, colocar intervalo de confiança (95%, quando não especificado). 
 
Estatísticas de grupo: 
Média e desvio padrão individual das duas amostras analisadas. 
Interpretação da tabela de amostras independentes: 
Primeiro verificar o Sig. da coluna do Teste de Levene: 
Sig. ≥ 0,05 – análise da primeira linha (variâncias iguais). 
Sig. < 0,05 – análise da segunda linha (variâncias diferentes). 
Avaliar o Sig. (2 extremidades) do Teste-T da linha apropriada segundo o resultado do Teste de Levene. 
Sig. (2 extremidades) ≥ 0,05 – as médias são iguais (não rejeita a hipótese nula). 
Sig. (2 extremidades) < 0,05 – as médias não são iguais. (rejeita a hipótese nula). 
 
▪ Teste de comparação de médias de duas amostras dependentes (antes e depois) 
A hipótese nula desse teste assume que as médias de antes e depois são iguais. 
 
Fazer Testes de Normalidade e Levene, se a distribuição for normal e variâncias iguais, segue: 
 
1. Analisar → Comparar médias → Teste-T de amostras Pareadas 
2. Em variável 1, colocar a variável relacionada ao antes em variável 2, colocar a variável relacionada ao depois. 
3. Em “Opções”, colocar intervalo de confiança (95%, quando não especificado). 
 
Estatísticas de amostras emparelhadas: 
Média e desvio padrão individual das duas amostras (antes e depois) analisadas. 
Interpretação da tabela de amostras emparelhadas, por valor-p: 
Sig. (2 extremidades) ≥ 0,05 – as médias de antes e depois são iguais (não rejeita a hipótese nula). 
Sig. (2 extremidades) < 0,05 – as médias de antes e depois não são iguais. (rejeita a hipótese nula). 
Interpretação da tabela de amostras emparelhadas, por intervalo de confiança: 
Quando “Inferior” ≤ 0 e “Superior” ˃ 0, significa que o intervalo dos valores absolutos passa pelo valor 0. Com isso, 
vemos que a diferença entre as médias também pode ser 0. Se a diferença entre as médias é 0, logo, as médias das 
amostras dependentes são iguais, então não se rejeita a hipótese nula. 
Esses três testes são aplicados quando há no máximo duas amostras para comparação de médias. 
Quando há três amostras ou mais, utiliza-se ANOVA. 
 
 
 
6 
Marmit, Barbara 
▪ ANOVA 1 FATOR (comparação de média de 3 amostras ou mais, com um fator) 
A hipótese nula desse teste assume que as médias entre as amostras são iguais. 
 
Fazer Testes de Normalidade e Levene, se a distribuição for normal e variâncias iguais, segue: 
 
1. Analisar → Comparar médias → Médias 
2. Colocar a variável quantitativa em “Variáveis Dependentes” e a variável qualitativa em “Lista independente” 
3. Em “Opções”, marcar “Tabela de ANOVA e ETA. 
 
Relatório: 
Média e desvio padrão individual dos grupos analisados. 
Interpretação da tabela ANOVA, por valor-p: 
Sig. ≥ 0,05 – as médias entre os grupos são iguais (não rejeita a hipótese nula). 
Sig. < 0,05 – as médias entre os grupos não são iguais. (rejeita a hipótese nula). 
Em caso de Sig. < 0,05, para descobrir qual dos grupos destoa da média, é só visualizar o relatório. 
Descobrir qual dos grupos destoa da média pelo método Scheffé: 
1. Analisar → Modelo linear geral → Univariado 
2. Colocar a variável quantitativa em “Variáveis Dependentes” e qualitativa (grupo) em “Fator fixo” 
3. Em “Opções”, marcar “Testes de homogeneidade” 
4. Em “Posteriori” colocar o teste para ser aplicado à variável qualitativa (grupo) e marcar método Scheffé. 
 
Interpretação da tabela “Comparações múltiplas” 
A tabela compara um dos fornecedores com os outros, um de cada vez, em cada linha. 
 
A análise é feita a partir do Sig. para cada linha de comparação: 
Sig. ≥ 0,05 – as médias entre os dois grupos são iguais (não rejeita a hipótese nula). 
Sig. < 0,05 – as médias entre os dois grupos não são iguais. (rejeita a hipótese nula). 
Assim, verifica-se o grupo que destoa quando ele sempre estiver relacionado com um Sig. significativo (< 0,05). 
 
▪ ANOVA 2 FATORES (comparação de média de 3 amostras ou mais, com dois fatores) 
Verifica-se a relação entre grupos. 
1. Analisar → Modelo linear geral → Univariado 
2. Colocar a variável quantitativa em “Variáveis Dependentes” e qualitativas (grupos) em “Fator fixo” 
3. Em “Opções”, marcar “Testes de homogeneidade” 
4. Colocar nível de significância (1 – confiança). (0,05 quando não for especificado) 
 
Interpretação da tabela “Testes de efeitos entre sujeitos” 
A tabela compara cada fator fixo com a variável dependente e também compara os dois fatores juntos com a variável 
dependente. 
 
O resultado de cada comparação se dá no Sig. da linha de cada fator fixo escolhido, sendo: 
Sig. ≥ 0,05 – não há diferenças significativas na relação desse(s) grupo(s) (não rejeita a hipótese nula). 
Sig. < 0,05 – há diferenças significativas na relação desse(s) grupo(s). (rejeita a hipótese nula). 
 
 
 
 
7 
Marmit, Barbara 
6. TESTES NÃO PARAMÉTRICOS 
Utilizados quando o Teste de Normalidade é violado (Sig. < 0,05). Faz o teste baseado em medianas ou quartis em vez de 
média. Os testes não paramétricos são testes mais simples e podem tratar dados nominais e ordinais, de amostras obtidas de 
populações diferentes. 
 
Dimensão Mensuração Teste não paramétrico Teste paramétrico equivalente 
Uma amostra Nominal Binomial Não tem 
Nominal Qui-quadrado Não tem 
Duas amostras relacionadas Nominal McNemar Não tem 
Ordinal Sinais Não tem 
Ordinal Wilcoxon Teste-T de amostras dependentes 
Duas amostras independentes Ordinal Mann-Whitney Teste-T de amostras independentes 
K amostras dependentes Nominal Q de Cochran 
Ordinal Friedman 
K amostras independentes Ordinal Kuskal-Wallis ANOVA 
 
▪ Binomial – uma amostra 
Variável qualitativa (nominal), somente com dois tipos de resultado (binário – 0,1 ou dicotônico – F, M). 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → Binominal 
2. Coloca-se a variável qualitativa (categórica) de análise no campo “Lista de variáveis de teste” 
3. Colocar probabilidade esperada do teste em “Proporção de teste” 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação: 
Sig. (2 extremidades) ≥ 0,05 – a probabilidade esperada do teste é válida, igual a real. (não rejeita a hipótese nula). 
Sig. (2 extremidades) < 0,05 – a probabilidade esperada do teste é inválida, diferente da real. (rejeita a hipótese nula). 
 
 
▪ Qui-quadrado – uma amostra 
Variável qualitativa (nominal), com mais de dois tipos de resultado.1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → Qui-quadrado 
2. Coloca-se a variável qualitativa (categórica) de análise no campo “Lista de variáveis de teste” 
3. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação: 
Sig. Exata ≥ 0,05 – os resultados não diferem estatisticamente entre si. (não rejeita a hipótese nula). 
Sig. Exata < 0,05 – os resultados difererem estatisticamente entre si. (rejeita a hipótese nula). 
 
▪ McNemar – duas amostras relacionadas 
Variável qualitativa (nominal), somente com dois tipos de resultado (binário – 0,1 ou dicotônico – F, M). 
O teste verifica a diferença duas amostras relacionadas (antes x depois) 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 
2. Variável 1 = “Antes”; Variável 2 = “Depois” 
3. Tipo de teste: McNemar 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação: 
Sig. Exata ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). 
Sig. Exata < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). 
8 
Marmit, Barbara 
▪ Sinais – duas amostras relacionadas 
Variável qualitativa (ordinal), assume até três resultados (positivo, negativo, nulo). O teste verifica a diferença duas 
amostras relacionadas (antes x depois), dizendo se variou positivamente, negativamente, ou se a variação foi nula. 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 
2. Variável 1 = “Antes”; Variável 2 = “Depois” 
3. Tipo de teste: Sinais 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação tabela de Frequência: 
Se apareceu “Antes – Depois”, significa que é o valor de antes – valor de depois, ou seja, se der mais diferenças 
negativas, significa que o valor de depois é maior que o valor de antes (antes – depois < 0 = diferença negativa). 
 
Interpretação p-valor: 
Sig. Exata (bilateral) ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). 
Sig. Exata (bilateral) < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). 
 
 
▪ Wilcoxon – duas amostras relacionadas (equivalente: teste-t de amostras dependentes) 
Variável quantitativa. O teste verifica a diferença duas amostras relacionadas (antes x depois), dizendo se variou 
positivamente, negativamente, ou se a variação foi nula. 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 
2. Variável 1 = “Antes”; Variável 2 = “Depois” 
3. Tipo de teste: Wilcoxon 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação tabela de Ranks: 
Se apareceu “Antes – Depois”, significa que é o valor de antes – valor de depois, ou seja, se der mais diferenças 
negativas, significa que o valor de depois é maior que o valor de antes (antes – depois < 0 = diferença negativa). 
 
Interpretação p-valor: 
Sig. Exata (bilateral) ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). 
Sig. Exata (bilateral) < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). 
 
 
▪ Mann-Whitney – duas amostras independentes (equivalente: teste-t de amostras independentes) 
Variável quantitativa. Verifica a diferença entre duas amostras independentes. 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras independentes 
2. Variável quantitativa e variável qualitativa (grupos) em variável de agrupamento (1 e 2) 
3. Tipo de teste: U Mann-Whitney 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação tabela de Postos: 
Média de cada um dos grupos e a soma de cada um. 
 
Interpretação p-valor em Estatísticas de Teste: 
Sig. Exata (bilateral) ≥ 0,05 – não há diferenças significativas entre as duas amostras. (não rejeita a hipótese nula). 
Sig. Exata (bilateral) < 0,05 – há diferenças significativas entre as duas amostras. (rejeita a hipótese nula). 
 
 
 
9 
Marmit, Barbara 
 
▪ Q de Cochran – k amostras dependentes 
Variável qualitativa, assumindo somente dois resultados possíveis para várias amostras (binário; dicotônico) 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras relacionadas 
2. Colocar a variável qualitativa de análise (grupos) como variáveis de teste 
3. Tipo de teste: Q de Cochran 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação tabela de Frequências: 
Contagem dos dois resultados possíveis para cada grupo. 
 
Interpretação p-valor em Estatísticas de Teste: 
Sig. Exata ≥ 0,05 – não há diferenças significativas entre as duas amostras. (não rejeita a hipótese nula). 
Sig. Exata < 0,05 – há diferenças significativas entre as duas amostras. (rejeita a hipótese nula). 
 
 
▪ Friedman – k amostras dependentes 
Variável quantitativas/ordinais, assumindo mais de dois resultados possíveis para várias amostras 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras relacionadas 
2. Colocar os grupos como variáveis de teste 
3. Tipo de teste: Friedman 
4. Em “Exato”, marcar a opção “Exato”. 
 
Interpretação tabela de Postos: 
Postos médios de cada grupo. 
 
Interpretação p-valor em Estatísticas de Teste: 
Sig. Exata ≥ 0,05 – não há diferenças significativas entre as amostras. (não rejeita a hipótese nula). 
Sig. Exata < 0,05 – há diferenças significativas entre as amostras. (rejeita a hipótese nula). 
 
 
▪ Kruskall-Wallis – k amostras independentes (equivalente: ANOVA) 
Variável quantitativas/ordinais, assumindo mais de dois resultados possíveis para várias amostras 
 
1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras independentes 
2. Colocar a variável quantitativa/ordinal como variável de teste 
3. Colocar os grupos (fatores) que geraram o resultado, definindo a quantidade de grupos (1 – até n) 
4. Tipo de teste: Kruskall-Wallis 
5. Em “Exato”, marcar a opção “Assintótico” 
 
Interpretação p-valor em Estatísticas de Teste: 
Significância Sig. ≥ 0,05 – não há diferenças significativas entre as amostras. (não rejeita a hipótese nula). 
Significância Sig. < 0,05 – há diferenças significativas entre amostras. (rejeita a hipótese nula). 
 
 
 
 
 
 
 
 
10 
Marmit, Barbara 
7. ANÁLISES ENTRE VARIÁVEIS (EXCEL/SPSS) 
Verifica a influência que as variáveis têm entre si, se uma variável influencia a outra, dizemos que há probabilidade de 
associação. Quando uma variável não tem influência sobre a outra, dizemos que não há associação (completamente 
independentes). 
 
▪ Análise entre duas variáveis quantitativas 
1. Gráfico de dispersão através de uma tabela de duas colunas. 
 
2. Covariância 
Fórmula no Excel: 
= COVARIAÇÃO.P/S (coluna 1; coluna 2) 
a) maior covariância (alta influência entre as variáveis) – linha crescente: relação linear positiva 
b) maior covariância (alta influência entre as variáveis) – linha decrescente: relação linear negativa 
c) menor covariância (baixa influência entre as variáveis) – dispersão dos pontos: não há relação linear 
 
3. Correlação de Pearson – coeficiente de correlação 
Fórmula no Excel: 
= CORREL (coluna 1; coluna 2) 
 
a) correlação negativa – quando um aumenta, o outro diminui. 
b) correlação positiva – quando um aumenta, o outro também aumenta. 
c) quando for próximo de 0 – fraca correlação 
d) quando for próximo de 1 – forte correlação 
 
No SPSS 
1. Analisar→ Correlação → Bivariado 
2. Colocar as variáveis a serem estudadas no campo de “Variáveis” 
3. Selecionar o tipo de coeficiente de relação, no caso, Pearson. 
Interpretação da tabela: 
Se “Sig. (2 extremidades)” > 0,05, significa que não há correlação entre as variáveis. 
Se “Sig. (2 extremidades)” < 0,05, significa que há correlação entre as variáveis, sendo assim, verifica-se o 
coeficiente de relação a partir da linha de correlação de Pearson. Em “Correlação de Pearson”,aparece o coeficiente 
de correlação entre as variáveis. 
 
▪ Análise entre duas variáveis qualitativas 
1. Tabela quali-quali, que soma contagem quando há intersecção 
2. Dividir cada um dos elementos pelo total da sua respectiva coluna. 
a) se uma variável x afetar a variável y, as porcentagens serão diferentes. 
b) se as variáveis forem independentes, as porcentagens serão quase iguais. 
 
▪ Análise entre uma variável quantitativa e uma variável qualitativa 
1. Faz testes de pressupostos (Normalidade e Levene) 
a) Se for paramétrico, faz ANOVA. 
b) Se não for paramétrico, Kruskal Wallis. 
 
 
 
 
11 
Marmit, Barbara 
8. REGRESSÃO 
Uma regressão linear tem como principais contribuições: 
▪ A possibilidade de avaliar quanto uma variável é influenciada por outras, inclusive permitindo definir qual das outras têm 
maior ou menor influência sobre ela, em função do coeficiente padronizado. 
▪ A previsão de resultados futuros em uma variável desconhecida a partir de variáveis conhecidas e suas relações com ela no 
passado, pela equação de regressão. 
 
Importante: 
Entender o que afeta (x) e o que é afetado 
Faz-se a interpretação de cada variável na tabela de coeficientes de forma independente. 
 
▪ Regressão linear (x → y) 
1. Analisar → Regressão → Linear; 
2. Colocar variável y (a que é afetada) em “Dependentes” e variável x (que afeta) em “Independentes”; 
 
Interpretação da tabela Resumo: 
R: Correlação de Pearson 
R quadrado (R²), chamado de coeficiente de ajuste/explicação: porcentagem do quanto a variável y é explicada por x. 
▪ Quando o valor for 1, assumimos que todas os pontos de dispersão ficaram em cima de uma reta. Não há 
resíduos. 
▪ Quando as variáveis não forem adequadas para explicar o comportamento de Y, o valor ficará próximo a 0. Isso 
significa que os pontos estão muito dispersos no gráfico. 
 
Interpretação da tabela ANOVA: 
Se Sig. > 0,05, ignorar pois não é uma boa regressão. É necessário ter divergência de variância. 
 
Interpretação da tabela de Coeficientes: 
Sig. > 0,05, a variável não pode fazer parte da regressão. Se for maior na linha de constante, aplicar a regressão 
novamente sem considerar a constante, em “Opções”. 
Sig. < 0,05, ok. 
 
Coeficiente Beta Padronizado: significa o quanto daquela variável influencia no resultado. Quanto maior, mais 
influência. 
 
Montagem da equação a partir da tabela de Coeficientes: 
y = (valor que deu na linha de variável independente)x + (valor que deu na linha constante) 
 
 
▪ Regressão múltipla 
Olha-se o R² ajustado (coeficiente de explicação da regressão) quando há mais de uma variável para explicar Y. 
 
1. Analisar → Regressão → Linear; 
2. Colocar variável y (a que é afetada) em “Dependentes” e variáveis x (que afetam) em “Independentes”; 
3. Na opção “Estatística”, marcar “Alteração de R quadrado” 
 
Interpretação da tabela Resumo: 
R: Correlação de Pearson 
R² ajustado: porcentagem do quanto a variável y é explicada por x. 
 
Interpretação da tabela ANOVA: 
Se Sig. > 0,05, ignorar pois não é uma boa regressão. É necessário ter divergência de variância. 
 
Interpretação da tabela de Coeficientes: 
12 
Marmit, Barbara 
Sig. > 0,05, aplicar a regressão sem considerar o valor constante (desmarcar em “Opções”) 
Sig. < 0,05, ok. 
Beta padronizado: mostra quanto as variáveis independentes (x) influenciam mais na variável dependente (y) 
 
Montagem da equação a partir da tabela de Coeficientes, linha Beta não padronizado: 
y = (valor que deu na linha de variável independente)x + (valor que deu na linha constante) 
 
 
9. REGRESSÃO LOGÍSTICA 
Uma regressão logística verifica a probabilidade de ocorrência de um evento. Ou seja, é binário: ocorrência ou não 
ocorrência. 
 
1. Analisar → Regressão → Logística binária; 
2. Colocar variável binária em “Dependente” e variáveis independentes em “Covariáveis”; 
 
Interpretação da tabela de Classificação: 
Difere o observado do previsto. 
Porcentagem correta: coluna importante, visto que iremos testar a fórmula retirando as variáveis que não são importantes 
para ver se impacta essa porcentagem. O objetivo é deixar o mais próximo de 100%, utilizando somente as variáveis 
relevantes. 
 
Interpretação da tabela de Variáveis na Equação: 
Coluna B são os resultados que serão multiplicadas com seus respectivos valores da variável independente. 
Verificar a variável independente que tem menor resultado e rodar a regressão novamente tirando do cálculo; verificar se 
diminui a porcentagem correta da tabela classificação: se não diminuir, continua sem ela, se diminuir, coloca ela de volta 
no cálculo e roda a regressão novamente. 
▪ Lembrando que o objetivo é ter a fórmula com o menor número de termos possíveis (variáveis independentes 
e constante) e atingindo a maior porcentagem correta possível. 
 
Equação Logística: 
Depois de achar a fórmula com maior porcentagem e menor número de termos, fazemos a fórmula no Excel: 
 
=1/(1+EXP(-( x1*a + x2*b + constante))) 
 
Multiplica-se os valores das variáveis (ex: x1, x2) com seus respectivos resultados da coluna B da tabela Variáveis na 
Equação (ex: a, b). Se a constante não estiver inclusa na fórmula, não considerar. 
O resultado da equação logística é a probabilidade da ocorrência do evento. 
 
Análise discriminante: 
A análise discriminante é fazer a equação logística para os casos que as variáveis independentes possuem valores muito 
diferentes. Os resultados conferem a probabilidade da ocorrência e se faz a comparação. 
 
 
10. ANÁLISE DE CONGLOMERADOS 
Agrupa as linhas da tabela de acordo com suas características semelhantes. 
 
1. Calcular quartis, IQR (Q3-Q1) e outliers de cada coluna de análise no Excel. 
2. Excluir todas as linhas da tabela que são consideradas outliers. 
3. No SPSS, colar tabela 
4. Analisar → Estatística descritiva → Descritiva; 
5. Colocar colunas de valores em “variáveis” 
6. Marcar opção “Save standardized values and variables” 
 
13 
Marmit, Barbara 
Depois disso, novas colunas vão aparecer na tabela do SPSS. Esses são os valores padronizados. 
 
7. Analisar → K-means Cluster 
8. Colocar as colunas com os valores padronizados como variáveis. 
9. Escolher a quantidade de clusters (grupos). 
 
Interpretação da tabela Clusters 
Z-Scores de cada grupo. 
 
Interpretação da tabela de número de casos de Clusters 
Quantas “linhas” se encaixam em cada grupo. 
 
A partir dos resultados, nomear cada grupo de acordo com os integrantes. 
 
 
11. ANÁLISE FATORIAL 
Agrupa as colunas da tabela de acordo com suas características semelhantes. 
 
1. Analisar → Dimension Reduction → Factor 
2. Colocar as variáveis quantitativas de análise em “Variáveis” 
3. Em “Analyze”, selecionar “Matriz de correlação” e em “Display”, selecionar “Unrotated Scree Plot” 
4. Rotação Varimax, Rotated Solution 
 
Interpretação da tabela Variância Explicada 
A tabela explica a quantidade de grupos (fatores) escolhidos. A análise fatorial escolhe a quantidade de grupo sozinha. 
▪ Na coluna Ejgenvalues (Total), considerar número de fatores que possuem valores maiores que 1. 
▪ Na coluna de Rotação, provavelmente só vai aparecer valores nas linhas onde o Eigenvalue foi maior que 1. 
 
Tendo isso, o número de fatores (grupos) que foi separado equivale ao número de linhas que tiveram o 
Eigenvalue > 1. 
 
Interpretação do gráfico Scree 
Mostra a relação do Eigenvalue com a quantidade de grupos. Quando a curva começa a ficar horizontal, é o número de 
agrupamentos. 
 
Interpretação da tabela Rotation Component Matrix 
Nessa tabela mostra todas as variáveis de estudo e as colunas dos grupos. 
As variáveis são agrupadas de acordo com o maior valor de cada coluna. 
Nomeia-se, então, os grupos de acordo com as características das variáveis. 
 
5. Scale → Reliability 
6. Selecionar as variáveis de maior valor de um grupo, marcar “Show descriptives” 
 
Interpretação Alpha de Cronbach 
Medea confiabilidade e consistência dos instrumentos de mediação. 
Deve ser > 0,7. 
 
 
Good luck, gafanhotos. 
 
 
Questão 1 Correto Atingiu 2,00 de 2,00
Com base em uma amostra de 15 notas de alunos de Estatística (N desconhecido), foram aplicados testes no
SPSS e obtidos os resultados abaixo. Considere significância de 5% e avalie se a hipótese da nota da
população ser igual a 5,0 pode ou não pode ser rejeitada.
Testes de Normalidade
 
Kolmogorov-Smirnov Shapiro-Wilk
Estatística df Sig. Estatística df Sig.
AC1
(Real) ,190 15 ,152 ,948 15 ,497
a. Correlação de Significância de Lilliefors
 
Teste de uma amostra
 
Valor de Teste = 5
t df
Sig. (2
extremidades)
Diferença
média
95% Intervalo de
Confiança da Diferença
Inferior Superior
AC1
(Real) -,424 14 ,678 -,2667 -1,615 1,081
 
Escolha uma:
a. O teste a ser aplicado é o teste Qui-quadrado, pois a distribuição não é normal. Conclusão do teste: a
média não pode ser considerada diferente de 5,0.
b. O teste a ser aplicado é o teste Qui-quadrado, pois a distribuição não é normal. Conclusão do teste: a
média é diferente de 5,0.
c. O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média não pode ser
considerada diferente de 5,0. 
d. Não se pode tirar conclusões com estes valores, pois falta o teste de Levene.
e. O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média é diferente de
5,0.
Sua resposta está correta.
Distribuição é normal. Pois Sig (Shapiro Wilk) = 0,497, portanto, maior que 0,05
Sendo Normal, aplica-se o teste t de uma amostra. 
Como o valor do teste t deu sig (2 tail) = 0,678 (>0,05), a média igual a 5 não pode ser rejeitada.
A resposta correta é: O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média não pode
ser considerada diferente de 5,0..
a
Questão 2 Correto Atingiu 2,00 de 2,00
Com base no arquivo da prova da Turma 3K, analise se houve melhora ou piora do
desempenho da turma comparando as notas do 1º Bimestre (NB1) e as notas do 2º Bimestre
(NB2). Considere significância de 5%.
 
Testes de Normalidade
 
Kolmogorov-Smirnov Shapiro-Wilk
Estatística df Sig. Estatística df Sig.
NB1 ,098 48 ,200 ,965 48 ,161
NB2 ,188 48 ,000 ,886 48 ,000
*. Este é um limite inferior da significância verdadeira.
a. Correlação de Significância de Lilliefors
 
 
Teste de amostras emparelhadas
 
Diferenças emparelhadas
t df
Sig. (2
extremidades)Média
Desvio
Padrão
Erro
padrão
da média
95% Intervalo de
Confiança da
Diferença
Inferior Superior
Par
1
NB1 -
NB2 -1,97812 2,55407 ,36865 -2,71975 -1,23650 -5,366 47 ,000
 
 
Classificações
 N
Postos de
média
Soma de
Classificações
NB2 -
NB1
Classificações
Negativas 12 13,71 164,50
Classificações
Positivas 36 28,10 1011,50
Vínculos 0 
Total 48 
a. NB2 < NB1 b. NB2 > NB1 c. NB2 = NB1
 
Estatísticas de teste
 NB2 - NB1
Z -4,345
Significância Sig. (2
extremidades) ,000
a. Teste de Classificações
Assinadas por Wilcoxon
b. Com base em postos
negativos.
a
*
a
b
c
a
b
 
Estatísticas de teste
 NB2 - NB1
Z -3,320
Significância Sig. (2
extremidades) ,001
a. Teste de Sinal
 
Escolha uma:
a. NB2 é menor que NB1, sendo mais adequado aplicar o teste de Wilcoxon
b. NB2 é maior que NB1, sendo mais adequado aplicar o teste de Wilcoxon 
c. NB2 é maior que NB1, sendo mais adequado aplicar o teste de sinais
d. NB2 não é diferente de NB1, sendo mais adequado aplicar o teste t de amostras
emparelhadas
e. NB2 é maior que NB1, sendo mais adequado aplicar o teste t de amostras
emparelhadas
Sua resposta está correta.
Como NB2 não é normal, tem que ser aplicado o teste não paramétrico de Wilcoxon. p-valor = 0,000 e
NB2>NB1, pois NB2 - NB1 deu mais soma de classificações positivas.
A resposta correta é: NB2 é maior que NB1, sendo mais adequado aplicar o teste de Wilcoxon.
a
Questão 3 Correto Atingiu 2,00 de 2,00
Um arquivo compara notas da mesma prova entre duas turmas (3J e 3K). Considerando
que são duas turmas de alunos de Estatística, teste se a hipótese das médias serem iguais
entre as duas turmas pode ser rejeitada. Considere significância de 5%.
 
Testes de Normalidade
 
Turma
Kolmogorov-Smirnov Shapiro-Wilk
 Estatística df Sig. Estatística df Sig.
AC1 3J ,156 15 ,200 ,960 15 ,692
3K ,110 52 ,162 ,981 52 ,570
*. Este é um limite inferior da significância verdadeira.
a. Correlação de Significância de Lilliefors
 
Teste de amostras independentes
 
Teste de
Levene
para
igualdade
de
variâncias teste-t para Igualdade de Médias
Z Sig. t df
Sig. (2
extremidades)
Diferença
média
Erro
padrão
de
diferença
95% Intervalo
de Confiança da
Diferença
Inferior Superior
AC1Variâncias
iguais
assumidas
,003 ,955-1,678 65 ,098 -1,0571 ,6298 -2,3149 ,2008
Variâncias
iguais não
assumidas
 -1,64022,000 ,115 -1,0571 ,6446 -2,3938 ,2797
 
Estatísticas de teste
 AC1
U de Mann-Whitney 292,500
Wilcoxon W 412,500
Z -1,472
Significância Sig. (2
extremidades) ,141
a. Variável de Agrupamento:
Turma
 
a
*
a
Escolha uma:
a. As médias não são diferentes, e o p-valor é 0,115.
b. As médias não são diferentes, e o p-valor é 0,098. 
c. As médias são diferentes, e o p-valor é 0,098.
d. As médias não são diferentes, e o p-valor é 0,141.
e. As médias são diferentes, e o p-valor é 0,141.
Sua resposta está correta.
Como sig da normalidade da 3k é 0,162 (n>30), e da 3J é 0,692 (n<30), aplica-se o teste t de duas
amostras independentes (paramétrico).
O teste de Levene deu variâncias iguais (sig = 0,955), portanto o p-valor é 0,098, assumindo que as
médias entre os dois grupos não são diferentes (não rejeita H0).
A resposta correta é: As médias não são diferentes, e o p-valor é 0,098..
Questão 4 Correto Atingiu 2,00 de 2,00
No arquivo PROVA B – BRASIL, disponível em https://mackenzie365-
my.sharepoint.com/:u:/g/personal/1150621_mackenzie_br/ES5Ov9NBXFhHiCMPRpUvZO4BswLP1FHOmy1fQ1iN_D8qMg?
e=rAgu27,
qual a correlação entre DENSIDADE E SUPERFÍCIE (considere p-valor igual a 0,10)?
Escolha uma:
a. r = -0,38, o que significa que a densidade diminui quando a superfície aumenta. 
b. r = 0,053, o que significa que a densidade aumenta quando a superfície aumenta.
c. r = -0,38, o que significa que a densidade aumenta quando a superfície aumenta.
d. r = 0,053, o que significa que a densidade diminui quando a superfície aumenta.
e. Não tem correlação, porque o p-valor é menor que 0,10.
Sua resposta está correta.
A resposta correta é: r = -0,38, o que significa que a densidade diminui quando a superfície aumenta..
https://mackenzie365-my.sharepoint.com/:u:/g/personal/1150621_mackenzie_br/ES5Ov9NBXFhHiCMPRpUvZO4BswLP1FHOmy1fQ1iN_D8qMg?e=rAgu27
Temperatura Vendas
6 35
12 32
16 22
20 35
24 40
28 45
30 56
32 59
35 20
40 23
Questão 5 Incorreto Atingiu 0,00 de 2,00
1. Na tabela abaixo, deseja-se saber qual a relação entre VENDAS E TEMPERATURA:
 
 
 
 
Testes de Normalidade
 
Kolmogorov-Smirnov Shapiro-Wilk
Estatística df Sig. Estatística df Sig.
Temperatura ,135 10 ,200 ,978 10 ,952
Vendas ,150 10 ,200 ,928 10 ,432
*. Este é um limite inferior da significância verdadeira.
a. Correlação de Significância de Lilliefors
 
Correlações
 Temperatura Vendas
TemperaturaCorrelação de
Pearson 1 ,103
Sig. (2
extremidades) ,776
N 10 10
Vendas Correlação de
Pearson ,103 1
Sig. (2
extremidades) ,776 
N 10 10
 
Escolha uma:
a. A correlação é 0,103, sendo considerada baixa. 
b. Não há correlação significativa entre as variáveis Vendas e Temperatura, pois apesar da correlação ser
alta (0,776), o sig é maior que 0,05 (0,103).
c. A correlação é 0,776, sendo considerada alta.
d. Não se pode afirmar, pois o correto seria aplicar a correlação de Spearman.
e. Não há correlação significativa entre as variáveis Vendas e Temperatura, pois o sig é 0,776
Sua resposta está incorreta.
A correlação de Pearson entre vendas e temperatura está na tabela no cruzamento entre as duas variáveis: 0,103. Porém,
o sig > 0,05 (0,776), portanto, esse valor não é significativo.Não há correlação significativa.
A resposta correta é: Não há correlação significativa entre as variáveis Vendas e Temperatura, pois o sig é 0,776.
a
*
*
Questão 1 Correto Atingiu 1 de 1
Na análise de conglomerados, os dados precisam estar padronizados. Analise as afirmações:
I. Padronizar os dados significa colocar todos com o mesmo número de casas decimais.
II. Padronizar os dados é substituir os valores x por z, isto é, o valor estar expresso pela sua posição
relativa em termos de distância da média.
III. Sem padronizar os dados, as variáveis terão ordens de grandeza diferentes, desvirtuando os
cálculos das posições relativas entre os casos.
São corretas as afirmações:
Escolha uma:
II, apenas
I, II e III
I e III, apenas
II e III, apenas 
I e II, apenas
Sua resposta está correta.
A resposta correta é: II e III, apenas.
Questão 2 Correto Atingiu 1 de 1
Uma empresa contrata três vendedores. A fim de segmentar os clientes semelhantes para cada
vendedor, o gerente comercial resolve analisar o banco de dados de clientes, que tem várias
características como faixa salarial, nível social, gênero, idade, média de gasto por compra, número
de compras por mês, dentre outros. Qual técnica ele deve aplicar para segmentar clientes
semelhantes para os três vendedores?
Escolha uma:
Análise de conglomerados 
Regressão linear simples
Regressão logística
Regressão linear múltipla
Análise fatorial
Sua resposta está correta.
A resposta correta é: Análise de conglomerados.
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
Questão 3 Correto Atingiu 1 de 1
O professor aplicou uma pesquisa de ensino e aprendizagem com 12 perguntas feitas a centenas
de alunos. Depois, fez uma análise fatorial para avaliar se o número de variáveis poderia ser
agrupado em um número menor de fatores.
O resultado exploratório realizado com os componentes principais pelo critério do Eigenvalue >1 foi:
Forçando a solução com três fatores, o resultado foi:
A melhor decisão, com base no conteúdo dos fatores, é:
 
 
Escolha uma:
Assumir 3 fatores com 4 itens cada: 1. aplicação do conhecimento; 2. Pontualidade do
professor; e 3. Materiais Didáticos 
Eliminar os itens sobre material e referências e rodar novamente com dois fatores.
Tentar rodar com 4 fatores, visando buscar uma melhor distribuição dos itens.
Não deveria ter aplicado a análise fatorial
Assumir 2 fatores: 1. Aplicação do conhecimento e materiais de apoio (com 8 itens); e 2.
Pontualidade do professor (com 4 itens)
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
Sua resposta está correta.
A resposta correta é: Assumir 3 fatores com 4 itens cada: 1. aplicação do conhecimento; 2. Pontualidade do
professor; e 3. Materiais Didáticos.
Questão 4 Correto Atingiu 1 de 1
Um aluno do Mackenzie resolveu aplicar seus conhecimentos de estatística em um novo negócio da
família: uma sorveteria por quilo. Ele levantou dados de temperatura média do dia e quantidade de
quilos de sorvete vendidos, conforme tabela abaixo:
Para verificar se as vendas podem ser previstas em função da temperatura, qual técnica estatística
ele deve usar?
Escolha uma:
análise fatorial
regressão linear múltipla
regressão logística
análise de conglomerados
regressão linear simples 
Sua resposta está correta.
A resposta correta é: regressão linear simples.
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
Questão 5 Incorreto Atingiu 0 de 1
Um aluno do Mackenzie resolveu aplicar seus conhecimentos de estatística em um novo negócio da
família: uma sorveteria por quilo. Ele levantou dados de temperatura média do dia e quantidade de
quilos de sorvete vendidos, conforme tabela abaixo:
Resolveu aplicar uma regressão linear simples para prever as vendas em função da temperatura e
obteve os seguintes resultados:
A conclusão a que chegou foi:
Escolha uma:
Uma previsão de venda na temperatura de 20º é 35 Kg.
Deveria ter escolhido outra técnica estatística e não a regressão linear.
As vendas de sorvete não têm relação significativa com a temperatura
As variáveis não são adequadas para a regressão linear. 
A ANOVA revelou que é adequado aplicar a regressão linear e as vendas para 20º devem ser
36 Kg.
Sua resposta está incorreta.
A resposta correta é: As vendas de sorvete não têm relação significativa com a temperatura.
Questão 6 Correto Atingiu 1 de 1
A Butler Trucking é uma empresa que entrega manteiga. Ela deseja estimar o tempo de viagem em
função de duas variáveis: milhas percorridas e número de entregas. Para isso, levantou uma
amostra das última viagens, o que é apresentado na tabela abaixo:
Os resultados foram:
Pode-se concluir que:
Escolha uma:
A constante é o que mais influencia no tempo, porque a significância é maior.
A técnica aplicada foi inadequada, porque sig. da ANOVA é menor que 0,05.
A técnica aplicada foi inadequada, porque o coeficiente de explicação do modelo é inferior a
60%.
A variável que mais influencia no tempo é X2_Entregas, porque o B é maior.
A variável que mais influencia no tempo é X1_milhas, porque o Beta é maior. 
Sua resposta está correta.
A resposta correta é: A variável que mais influencia no tempo é X1_milhas, porque o Beta é maior..
Questão 7 Correto Atingiu 1 de 1
Uma empresa resolve analisar o banco de dados de clientes quanto a algumas dimensões, mas há
20 variáveis sobre os clientes, como: faixa salarial, nível social, gênero, idade, média de gasto por
compra, número de compras por mês, dentre outros. Qual técnica ele deve aplicar para reduzir o
número de variáveis e facilitar a análise?
Escolha uma:
Análise fatorial 
Regressão linear simples
Análise de conglomerados
Regressão logística
Regressão linear múltipla
Sua resposta está correta.
A resposta correta é: Análise fatorial.
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814
Questão 8 Correto Atingiu 1 de 1
Deseja-se criar um modelo estatístico para prever se uma pessoa com COVID-19 tem alta
probabilidade de morrer. Para isso, foi levantado um banco de dados com algumas variáveis:
- Tinha diabetes? (S/N)
- Tinha bronquite ou qualquer outra doença pulmonar preexistente? (S/N)
- Idade
- Peso
- Gênero (M/F)
- Morreu de covid? (S/N)
- Trabalha? (S/N)
Qual(is) deve(m) ser a(s) variável(is) dependente(s)?
Escolha uma:
Idade e peso
Tinha diabetes, Tinha bronquite ou outra doença pulmonar preexistente, morreu de covid,
trabalha e gênero
Esta técnica não tem variável dependente
Tinha diabetes, Tinha bronquite ou outra doença pulmonar preexistente (apenas)
Morreu de covid 
Sua resposta está correta.
A resposta correta é: Morreu de covid.
Questão 9 Correto Atingiu 1 de 1
O arquivo "Inadimplencia.sav" contém as variáveis de clientes, sendo:
 
STATUS = igual a 1 (inadimplente), igual a 0 (adimplente)
R = renda (x mil reais)
ND = número de dependentes
VE = igual a 0 (sem vínculo empregatício), igual a 1 (com vínculo empregatício).
Foi feita uma regressão logística com STATUS = f (R, ND e VE). Sobre os objetivos de se fazer esta
regressão, foram feitas três afirmativas:
I. Deseja-se prever, em função da renda, número de dependentes e se a pessoa tem vínculo
empregatício, qual a probabilidade que ela se torne inadimplente.
II. Deseja-se estabelecer quais das três variáveis mais interferem no fato de uma pessoa se tornar
inadimplente.
III. Deseja-se saber se o vínculo empregatício pode ser explicado pela renda e pelo número de
dependentes.
São corretas somente as afirmativas:
Escolha uma:
I e II, apenas 
I, apenas
I, II e III.
II, apenas
I e III, apenas
Sua resposta está correta.
A III não é correta, pois o vínculo empregatício é variável independente na fórmula.
A resposta correta é: I e II, apenas.
Questão 10 Correto Atingiu 1 de 1
Deseja-se criar um modelo estatístico para prever o desempenho de uma pessoa. Para isso, foi
levantado um banco de dados com algumas variáveis:
1. Conhecimento(0 a 100)
2. Habilidade (0 a 100)
3. Desempenho na última avaliação (0 a 100)
4. Nota da avaliação 360 (0 a 100)
5. Nota de metas atingidas (0 a 100)
 
Qual(is) a(s) variável(is) dependente(s) do modelo?
Escolha uma:
5, apenas
1, 2 e 4
2, apenas
1, 2, 4 e 5
3, apenas 
Sua resposta está correta.
A resposta correta é: 3, apenas.