Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Marmit, Barbara METÓDOS QUANTITATIVOS EM PROCESSOS DECISÓRIOS – CIÊNCIAS ECONÔMICAS/MACKENZIE Feito por Marmitão, a deusa, rainha e salvadora da vida de todos vocês nessa matéria meicu. ➢ Simbologia, significados/interpretações N Tamanho da população finita n Tamanho da amostra 𝜇 Média populacional 𝑥 Média amostral 𝜎 Desvio padrão populacional 𝑠 Desvio padrão amostral 𝜌 Probabilidade/proporção populacional 𝑝 Probabilidade/proporção amostral 𝑥𝑖 Valor dado 𝑧 Uso quando σ conhecido 𝑥1 Valor 1 do intervalo na linha horizontal (x) 𝑡 Uso quando σ desconhecido 𝑥2 Valor 2 do intervalo na linha horizontal (x) 𝛾 Confiança (90%, 95%, 99%) 𝛼 Nível de signifiância 𝜀 Margem de erro 1. AMOSTRAGEM ▪ Teorema Limite Central (TLC) O TLC é atingido quando a forma de distribuição é aproximadamente normal. Geralmente, é atingido quando o tamanho da amostra é 30 ou mais. Para valores atípicos (com outliers), a amostra deverá ter 50 elementos ou mais. ▪ Identificar número de amostras aleatórias possíveis, tendo uma população finita: 𝑁! 𝑛! (𝑁 − 𝑛)! ▪ Montagem de um histograma: 1. Montar tabela com três colunas: Agrupamento por faixa de valores (ex. 1 – 100; 101 – 200) Frequência absoluta de cada faixa de valor (quantos elementos da amostra se encaixam naquela faixa) Frequência relativa (densidade) de cada faixa de valor (frequência absoluta da faixa divido pelo número rotal de elementos) 2. Colocar frequência relativa (densidade) dividida igualmente na linha vertical do gráfico (y). 3. Colocar primeiro valor de cada faixa de valores na na linha horizontal do gráfico (x). 4. Fazer colunas grudadas de acordo com as informações de faixa e densidade de cada linha da tabela. ▪ Determinar quanto a probabilidade da média amostral estar longe da média populacional dada (intervalo). 1. Através de cálculo de erro padrão da média (𝜎𝑥). Quando n/N ≤ 5%, usa-se a fórmula da população infinita para a população finita. Quando a população é finita usa-se: Quando a população é infinita, usa-se: 𝜎𝑥 = √ 𝑁 − 𝑛 𝑁 − 1 . ( 𝜎 √𝑛 ) 𝜎𝑥 = 𝜎 √𝑛 2. Aplicar fórmula no Excel: = DIST.NORM.N(𝜇 + 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎𝑑𝑜; 𝜇; 𝜎𝑥 ; 𝑉𝐸𝑅𝐷𝐴𝐷𝐸𝐼𝑅𝑂) Pegar o resultado da fórmula, subtrair de 1 e multiplicar o resultado da subtração por 2, ou seja: (1 – resultado da fórmula de Excel)*2 → Resultado será a probabilidade de estar dentro de um intervalo especificado. 2 Marmit, Barbara ▪ Determinar a probabilidade de uma amostra estar dentro de uma proporção populacional dada (intervalo). 1. Através de cálculo de erro padrão da média (𝜎𝑝). Quando n/N ≤ 5%, usa-se a fórmula da população infinita para a população finita. Quando a população é finita usa-se: Quando a população é infinita, usa-se: 𝜎𝑝 = √ 𝑁 − 𝑛 𝑁 − 1 . √ 𝑝 (1 − 𝑝) 𝑛 𝜎𝑝 = √ 𝑝 (1 − 𝑝) 𝑛 2. Aplicar fórmula no Excel: = DIST.NORM.N(𝑝 + 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑎𝑑𝑜; 𝑝; 𝜎𝑝 ; 𝑉𝐸𝑅𝐷𝐴𝐷𝐸𝐼𝑅𝑂) Pegar o resultado da fórmula, subtrair de 1 e multiplicar o resultado da subtração por 2, ou seja: (1 – resultado da fórmula de Excel)*2 → Resultado será a probabilidade de estar dentro de um intervalo especificado. ▪ Determinar o tamanho de uma amostra ▪ Determinar o tamanho de uma amostra para proporções Quando a p conhecido usa-se: Quando a p desconhecido usa-se: 𝑛 = 𝑧𝛾 2 . 𝑝(1 − 𝑝) 𝜀² 𝑛 = 𝑧𝛾 2 4 . 𝜀² 2. ESTIMATIVA INTERVALAR E INTERVALO DE CONFIANÇA É a estimativa pontual ± a margem de erro. Os resultados do cálculo ± define os dois valores do intervalo. Quando desvio populacional conhecido usa-se: Quando desvio populacional desconhecido usa-se 𝑥 ± 𝑧𝛼/2 . 𝜎 √𝑛 𝑥 ± 𝑡𝛼/2 . 𝑠 √𝑛 Fórmula no Excel para encontrar z: = INV.NORMP.N((1 – confiança)/2) Fórmula no Excel para encontrar t: = INV.T.BC((1 – confiança); n-1) Quando faz a conta utilizando o sinal negativo, encontra-se 𝑥1 do intervalo, utilizando o positivo, encontra-se 𝑥2. Quando a população é finita usa-se: Quando a população é infinita, usa-se: 𝑛 = 𝑧2 . 𝜎2 . 𝑁 𝜀2 . (𝑁−1) + 𝑧2 . 𝜎2 ou 𝑛 = 𝑧2 . 𝑝 . 𝑞 . 𝑁 𝜀2 . (𝑁−1) + 𝑧2 . 𝑝 . 𝑞 𝑛 = 𝜎2𝑧𝛾 2 𝜀² 3 Marmit, Barbara 3. HIPÓTESES A hipótese nula é a hipótese inicial e a hipótese alternativa é contrária à hipótese inicial. Só existem duas conclusões possíveis: não rejeitar a hipótese nula e rejeitar a hipótese nula. Teste cauda inferior Teste cauda superior Teste bicaudal Hipótese 𝐻0: 𝜇 ≥ 𝜇0 𝐻1: 𝜇 < 𝜇0 𝐻0: 𝜇 ≤ 𝜇0 𝐻1: 𝜇 > 𝜇0 𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0 Estatística de teste 𝑧 = 𝑥 − 𝜇0 𝜎 √𝑛 ⁄ 𝑧 = 𝑥 − 𝜇0 𝜎 √𝑛 ⁄ 𝑧 = 𝑥 − 𝜇0 𝜎 √𝑛 ⁄ Critério valor-p Rejeitar 𝐻0 se valor-p 𝐻0 ≤ 𝛼 Rejeitar 𝐻0 se valor-p 𝐻0 ≤ 𝛼 Rejeitar 𝐻0 se valor-p 𝐻0 ≤ 𝛼 Critério valor crítico Rejeitar 𝐻0 se 𝑧 ≤ −𝑧𝛼 Rejeitar 𝐻0 se 𝑧 ≥ 𝑧𝛼 Rejeitar 𝐻0 se 𝑧 ≤ −𝑧𝛼/2 𝑜𝑢 𝑧 ≥ 𝑧𝛼/2 1. Desenvolve-se a hipótese nula e alternativa (teste cauda inferior ou superior ou bicaudal) 2. Especificar nível de significância 3. Realizar estatística de teste 𝑧 = 𝑥 − 𝜇0 𝜎 √𝑛 ⁄ 4. Usar um dos critérios: a) Critério valor-p Uso de uma das fórmulas: =DIST.NORMP.N(z; VERDADEIRO) =DIST.NORM.N(�̅� ; 𝜇 ; 𝜎𝑥 ; VERDADEIRO) Quando cauda inferior: resultado da fórmula já é o valor-p. Quando cauda superior: o resultado da fórmula deve ser subtraído de 1 para chegar ao valor-p: (1 – fórmula). Quando bicaudal: o resultado da fórmula deve ser subtraído de 1 e multiplcado por 2: (1 – fórmula)*2. Interpretação: valor-p ˂ 0,01 – esmagadora evidência de que hipótese alternativa é verdadeira. 0,01 ≤ valor-p ˂ 0,05 – forte evidência de que hipótese alternativa é verdadeira. 0,05 ≤ valor-p ≤ 0,10 – fraca evidência de que hipótese alternativa é verdadeira. valor-p ˃ 0,10 – insuficiente evidência de que hipótese alternativa é verdadeira b) Critério valor crítico: Uso de uma das fórmulas para = INV.NORMP.N(1 – confiança), para encontar 𝑧𝑎 e comparar com z (deixar o sinal conforme o teste da cauda utilizado) = INV.NORM.N(1 – confiança; 𝜇0 ; 𝜎𝑥), para encontrar x e comparar com o valor da hipótese nula. 4 Marmit, Barbara 4. TESTES DE PRESSUPOSTOS ▪ Teste de normalidade e Teste de Levene A hipótese nula para o Teste de Normalidade é de que a distribuição é normal. A hipótese nula para o Teste de Levene (Homogeneidade de variâncias) é de que as variâncias são iguais. 1. Analisar → Estatísticas Descritivas → Explorar; 2. Colocar variável quantitativa em “Lista de variáveis dependentes” e variável qualitativa em “Lista de fatores”; 3. Na opção “Estatística”, colocar o intervalo de confiança espeficicado (95%, quando não especificado). 4. Na opção “Gráficos”, marcar: gráficos de normalidade com teste e na parte “Dispersão vs. Nível com testes de Levene”, marcar “Não transformado”. Sig. é o p-valor. Interpretação Teste de Normalidade: Quando n < 30, analisar coluna de Shapiro-Wilk, quando n ≥ 30, analisar coluna Kolmogorov-Smirnov Sig. ≥ 0,05 – distribuição é normal (não rejeita a hipótese nula), usa-se teste paramétrico. Sig. < 0,05 – distribuição não é normal (rejeita a hipótese nula), usa-se testes não paramétricos. Interpretação Teste de Levene (Homogeneidade de variâncias): Sig. ≥ 0,05 – as variâncias são iguais (não rejeita a hipótese nula), usa-se teste paramétrico. Sig. < 0,05 – as variâncias não são iguais (rejeita a hipótese nula), usa-se testes não paramétricos. 5. TESTES PARAMÉTRICOS ▪ Teste de comparação de médias com valor de teste definido (valor para comparaçãojá dado). A hipótese nula desse teste assume que a média da amostra é igual ao valor de teste. Fazer Testes de Normalidade e Levene, se a distribuição for normal e as variâncias forem iguais, segue: 1. Analisar → Comparar médias → Uma amostra de Teste-T 2. Variável quantitativa no campo de “Variável(is) de teste” 3. No campo “Valor de teste” colocar o valor de teste (valor para comparação) definido na hipótese nula 4. Em “Opções”, colocar o intervalo de confiança (95%, quando não especificado) Interpretação p-valor: Sig. (2 extremidades) ≥ 0,05 – as médias são iguais (não rejeita a hipótese nula). Sig. (2 extremidades) < 0,05 – as médias não são iguais. (rejeita a hipótese nula). Interpretação por valores absolutos: Valor de teste + Diferença média = Média amostral Média amostral + valor inferior = 𝑥1 Média amostral + valor superior = 𝑥2 Se o valor de teste não estiver entre o intervalo de 𝑥1 e 𝑥2, considera que as médias são diferentes. 5 Marmit, Barbara ▪ Teste de comparação de médias de duas amostras independentes (comparação da média de uma amostra com a média de outra amostra). A hipótese nula desse teste assume que as médias das duas amostras independentes são iguais. Fazer o Teste de Normalidade, se a distribuição for normal, segue: 1. Analisar → Comparar médias → Teste-T de amostras Independentes. 2. Colocar variável quantitativa no campo de “Variável(is) de teste” e variável qualitativa em “Variável de agrupamento” e define-se o nome dos dois grupos a serem analisados. 3. Em “Opções”, colocar intervalo de confiança (95%, quando não especificado). Estatísticas de grupo: Média e desvio padrão individual das duas amostras analisadas. Interpretação da tabela de amostras independentes: Primeiro verificar o Sig. da coluna do Teste de Levene: Sig. ≥ 0,05 – análise da primeira linha (variâncias iguais). Sig. < 0,05 – análise da segunda linha (variâncias diferentes). Avaliar o Sig. (2 extremidades) do Teste-T da linha apropriada segundo o resultado do Teste de Levene. Sig. (2 extremidades) ≥ 0,05 – as médias são iguais (não rejeita a hipótese nula). Sig. (2 extremidades) < 0,05 – as médias não são iguais. (rejeita a hipótese nula). ▪ Teste de comparação de médias de duas amostras dependentes (antes e depois) A hipótese nula desse teste assume que as médias de antes e depois são iguais. Fazer Testes de Normalidade e Levene, se a distribuição for normal e variâncias iguais, segue: 1. Analisar → Comparar médias → Teste-T de amostras Pareadas 2. Em variável 1, colocar a variável relacionada ao antes em variável 2, colocar a variável relacionada ao depois. 3. Em “Opções”, colocar intervalo de confiança (95%, quando não especificado). Estatísticas de amostras emparelhadas: Média e desvio padrão individual das duas amostras (antes e depois) analisadas. Interpretação da tabela de amostras emparelhadas, por valor-p: Sig. (2 extremidades) ≥ 0,05 – as médias de antes e depois são iguais (não rejeita a hipótese nula). Sig. (2 extremidades) < 0,05 – as médias de antes e depois não são iguais. (rejeita a hipótese nula). Interpretação da tabela de amostras emparelhadas, por intervalo de confiança: Quando “Inferior” ≤ 0 e “Superior” ˃ 0, significa que o intervalo dos valores absolutos passa pelo valor 0. Com isso, vemos que a diferença entre as médias também pode ser 0. Se a diferença entre as médias é 0, logo, as médias das amostras dependentes são iguais, então não se rejeita a hipótese nula. Esses três testes são aplicados quando há no máximo duas amostras para comparação de médias. Quando há três amostras ou mais, utiliza-se ANOVA. 6 Marmit, Barbara ▪ ANOVA 1 FATOR (comparação de média de 3 amostras ou mais, com um fator) A hipótese nula desse teste assume que as médias entre as amostras são iguais. Fazer Testes de Normalidade e Levene, se a distribuição for normal e variâncias iguais, segue: 1. Analisar → Comparar médias → Médias 2. Colocar a variável quantitativa em “Variáveis Dependentes” e a variável qualitativa em “Lista independente” 3. Em “Opções”, marcar “Tabela de ANOVA e ETA. Relatório: Média e desvio padrão individual dos grupos analisados. Interpretação da tabela ANOVA, por valor-p: Sig. ≥ 0,05 – as médias entre os grupos são iguais (não rejeita a hipótese nula). Sig. < 0,05 – as médias entre os grupos não são iguais. (rejeita a hipótese nula). Em caso de Sig. < 0,05, para descobrir qual dos grupos destoa da média, é só visualizar o relatório. Descobrir qual dos grupos destoa da média pelo método Scheffé: 1. Analisar → Modelo linear geral → Univariado 2. Colocar a variável quantitativa em “Variáveis Dependentes” e qualitativa (grupo) em “Fator fixo” 3. Em “Opções”, marcar “Testes de homogeneidade” 4. Em “Posteriori” colocar o teste para ser aplicado à variável qualitativa (grupo) e marcar método Scheffé. Interpretação da tabela “Comparações múltiplas” A tabela compara um dos fornecedores com os outros, um de cada vez, em cada linha. A análise é feita a partir do Sig. para cada linha de comparação: Sig. ≥ 0,05 – as médias entre os dois grupos são iguais (não rejeita a hipótese nula). Sig. < 0,05 – as médias entre os dois grupos não são iguais. (rejeita a hipótese nula). Assim, verifica-se o grupo que destoa quando ele sempre estiver relacionado com um Sig. significativo (< 0,05). ▪ ANOVA 2 FATORES (comparação de média de 3 amostras ou mais, com dois fatores) Verifica-se a relação entre grupos. 1. Analisar → Modelo linear geral → Univariado 2. Colocar a variável quantitativa em “Variáveis Dependentes” e qualitativas (grupos) em “Fator fixo” 3. Em “Opções”, marcar “Testes de homogeneidade” 4. Colocar nível de significância (1 – confiança). (0,05 quando não for especificado) Interpretação da tabela “Testes de efeitos entre sujeitos” A tabela compara cada fator fixo com a variável dependente e também compara os dois fatores juntos com a variável dependente. O resultado de cada comparação se dá no Sig. da linha de cada fator fixo escolhido, sendo: Sig. ≥ 0,05 – não há diferenças significativas na relação desse(s) grupo(s) (não rejeita a hipótese nula). Sig. < 0,05 – há diferenças significativas na relação desse(s) grupo(s). (rejeita a hipótese nula). 7 Marmit, Barbara 6. TESTES NÃO PARAMÉTRICOS Utilizados quando o Teste de Normalidade é violado (Sig. < 0,05). Faz o teste baseado em medianas ou quartis em vez de média. Os testes não paramétricos são testes mais simples e podem tratar dados nominais e ordinais, de amostras obtidas de populações diferentes. Dimensão Mensuração Teste não paramétrico Teste paramétrico equivalente Uma amostra Nominal Binomial Não tem Nominal Qui-quadrado Não tem Duas amostras relacionadas Nominal McNemar Não tem Ordinal Sinais Não tem Ordinal Wilcoxon Teste-T de amostras dependentes Duas amostras independentes Ordinal Mann-Whitney Teste-T de amostras independentes K amostras dependentes Nominal Q de Cochran Ordinal Friedman K amostras independentes Ordinal Kuskal-Wallis ANOVA ▪ Binomial – uma amostra Variável qualitativa (nominal), somente com dois tipos de resultado (binário – 0,1 ou dicotônico – F, M). 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → Binominal 2. Coloca-se a variável qualitativa (categórica) de análise no campo “Lista de variáveis de teste” 3. Colocar probabilidade esperada do teste em “Proporção de teste” 4. Em “Exato”, marcar a opção “Exato”. Interpretação: Sig. (2 extremidades) ≥ 0,05 – a probabilidade esperada do teste é válida, igual a real. (não rejeita a hipótese nula). Sig. (2 extremidades) < 0,05 – a probabilidade esperada do teste é inválida, diferente da real. (rejeita a hipótese nula). ▪ Qui-quadrado – uma amostra Variável qualitativa (nominal), com mais de dois tipos de resultado.1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → Qui-quadrado 2. Coloca-se a variável qualitativa (categórica) de análise no campo “Lista de variáveis de teste” 3. Em “Exato”, marcar a opção “Exato”. Interpretação: Sig. Exata ≥ 0,05 – os resultados não diferem estatisticamente entre si. (não rejeita a hipótese nula). Sig. Exata < 0,05 – os resultados difererem estatisticamente entre si. (rejeita a hipótese nula). ▪ McNemar – duas amostras relacionadas Variável qualitativa (nominal), somente com dois tipos de resultado (binário – 0,1 ou dicotônico – F, M). O teste verifica a diferença duas amostras relacionadas (antes x depois) 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 2. Variável 1 = “Antes”; Variável 2 = “Depois” 3. Tipo de teste: McNemar 4. Em “Exato”, marcar a opção “Exato”. Interpretação: Sig. Exata ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). Sig. Exata < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). 8 Marmit, Barbara ▪ Sinais – duas amostras relacionadas Variável qualitativa (ordinal), assume até três resultados (positivo, negativo, nulo). O teste verifica a diferença duas amostras relacionadas (antes x depois), dizendo se variou positivamente, negativamente, ou se a variação foi nula. 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 2. Variável 1 = “Antes”; Variável 2 = “Depois” 3. Tipo de teste: Sinais 4. Em “Exato”, marcar a opção “Exato”. Interpretação tabela de Frequência: Se apareceu “Antes – Depois”, significa que é o valor de antes – valor de depois, ou seja, se der mais diferenças negativas, significa que o valor de depois é maior que o valor de antes (antes – depois < 0 = diferença negativa). Interpretação p-valor: Sig. Exata (bilateral) ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). Sig. Exata (bilateral) < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). ▪ Wilcoxon – duas amostras relacionadas (equivalente: teste-t de amostras dependentes) Variável quantitativa. O teste verifica a diferença duas amostras relacionadas (antes x depois), dizendo se variou positivamente, negativamente, ou se a variação foi nula. 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras relacionadas 2. Variável 1 = “Antes”; Variável 2 = “Depois” 3. Tipo de teste: Wilcoxon 4. Em “Exato”, marcar a opção “Exato”. Interpretação tabela de Ranks: Se apareceu “Antes – Depois”, significa que é o valor de antes – valor de depois, ou seja, se der mais diferenças negativas, significa que o valor de depois é maior que o valor de antes (antes – depois < 0 = diferença negativa). Interpretação p-valor: Sig. Exata (bilateral) ≥ 0,05 – não houveram diferenças significativas entre antes e depois. (não rejeita a hipótese nula). Sig. Exata (bilateral) < 0,05 – houveram diferenças significativas entre antes e depois. (rejeita a hipótese nula). ▪ Mann-Whitney – duas amostras independentes (equivalente: teste-t de amostras independentes) Variável quantitativa. Verifica a diferença entre duas amostras independentes. 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → 2 amostras independentes 2. Variável quantitativa e variável qualitativa (grupos) em variável de agrupamento (1 e 2) 3. Tipo de teste: U Mann-Whitney 4. Em “Exato”, marcar a opção “Exato”. Interpretação tabela de Postos: Média de cada um dos grupos e a soma de cada um. Interpretação p-valor em Estatísticas de Teste: Sig. Exata (bilateral) ≥ 0,05 – não há diferenças significativas entre as duas amostras. (não rejeita a hipótese nula). Sig. Exata (bilateral) < 0,05 – há diferenças significativas entre as duas amostras. (rejeita a hipótese nula). 9 Marmit, Barbara ▪ Q de Cochran – k amostras dependentes Variável qualitativa, assumindo somente dois resultados possíveis para várias amostras (binário; dicotônico) 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras relacionadas 2. Colocar a variável qualitativa de análise (grupos) como variáveis de teste 3. Tipo de teste: Q de Cochran 4. Em “Exato”, marcar a opção “Exato”. Interpretação tabela de Frequências: Contagem dos dois resultados possíveis para cada grupo. Interpretação p-valor em Estatísticas de Teste: Sig. Exata ≥ 0,05 – não há diferenças significativas entre as duas amostras. (não rejeita a hipótese nula). Sig. Exata < 0,05 – há diferenças significativas entre as duas amostras. (rejeita a hipótese nula). ▪ Friedman – k amostras dependentes Variável quantitativas/ordinais, assumindo mais de dois resultados possíveis para várias amostras 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras relacionadas 2. Colocar os grupos como variáveis de teste 3. Tipo de teste: Friedman 4. Em “Exato”, marcar a opção “Exato”. Interpretação tabela de Postos: Postos médios de cada grupo. Interpretação p-valor em Estatísticas de Teste: Sig. Exata ≥ 0,05 – não há diferenças significativas entre as amostras. (não rejeita a hipótese nula). Sig. Exata < 0,05 – há diferenças significativas entre as amostras. (rejeita a hipótese nula). ▪ Kruskall-Wallis – k amostras independentes (equivalente: ANOVA) Variável quantitativas/ordinais, assumindo mais de dois resultados possíveis para várias amostras 1. Analisar → Testes não paramétricos → Caixas de diálogo legadas → K amostras independentes 2. Colocar a variável quantitativa/ordinal como variável de teste 3. Colocar os grupos (fatores) que geraram o resultado, definindo a quantidade de grupos (1 – até n) 4. Tipo de teste: Kruskall-Wallis 5. Em “Exato”, marcar a opção “Assintótico” Interpretação p-valor em Estatísticas de Teste: Significância Sig. ≥ 0,05 – não há diferenças significativas entre as amostras. (não rejeita a hipótese nula). Significância Sig. < 0,05 – há diferenças significativas entre amostras. (rejeita a hipótese nula). 10 Marmit, Barbara 7. ANÁLISES ENTRE VARIÁVEIS (EXCEL/SPSS) Verifica a influência que as variáveis têm entre si, se uma variável influencia a outra, dizemos que há probabilidade de associação. Quando uma variável não tem influência sobre a outra, dizemos que não há associação (completamente independentes). ▪ Análise entre duas variáveis quantitativas 1. Gráfico de dispersão através de uma tabela de duas colunas. 2. Covariância Fórmula no Excel: = COVARIAÇÃO.P/S (coluna 1; coluna 2) a) maior covariância (alta influência entre as variáveis) – linha crescente: relação linear positiva b) maior covariância (alta influência entre as variáveis) – linha decrescente: relação linear negativa c) menor covariância (baixa influência entre as variáveis) – dispersão dos pontos: não há relação linear 3. Correlação de Pearson – coeficiente de correlação Fórmula no Excel: = CORREL (coluna 1; coluna 2) a) correlação negativa – quando um aumenta, o outro diminui. b) correlação positiva – quando um aumenta, o outro também aumenta. c) quando for próximo de 0 – fraca correlação d) quando for próximo de 1 – forte correlação No SPSS 1. Analisar→ Correlação → Bivariado 2. Colocar as variáveis a serem estudadas no campo de “Variáveis” 3. Selecionar o tipo de coeficiente de relação, no caso, Pearson. Interpretação da tabela: Se “Sig. (2 extremidades)” > 0,05, significa que não há correlação entre as variáveis. Se “Sig. (2 extremidades)” < 0,05, significa que há correlação entre as variáveis, sendo assim, verifica-se o coeficiente de relação a partir da linha de correlação de Pearson. Em “Correlação de Pearson”,aparece o coeficiente de correlação entre as variáveis. ▪ Análise entre duas variáveis qualitativas 1. Tabela quali-quali, que soma contagem quando há intersecção 2. Dividir cada um dos elementos pelo total da sua respectiva coluna. a) se uma variável x afetar a variável y, as porcentagens serão diferentes. b) se as variáveis forem independentes, as porcentagens serão quase iguais. ▪ Análise entre uma variável quantitativa e uma variável qualitativa 1. Faz testes de pressupostos (Normalidade e Levene) a) Se for paramétrico, faz ANOVA. b) Se não for paramétrico, Kruskal Wallis. 11 Marmit, Barbara 8. REGRESSÃO Uma regressão linear tem como principais contribuições: ▪ A possibilidade de avaliar quanto uma variável é influenciada por outras, inclusive permitindo definir qual das outras têm maior ou menor influência sobre ela, em função do coeficiente padronizado. ▪ A previsão de resultados futuros em uma variável desconhecida a partir de variáveis conhecidas e suas relações com ela no passado, pela equação de regressão. Importante: Entender o que afeta (x) e o que é afetado Faz-se a interpretação de cada variável na tabela de coeficientes de forma independente. ▪ Regressão linear (x → y) 1. Analisar → Regressão → Linear; 2. Colocar variável y (a que é afetada) em “Dependentes” e variável x (que afeta) em “Independentes”; Interpretação da tabela Resumo: R: Correlação de Pearson R quadrado (R²), chamado de coeficiente de ajuste/explicação: porcentagem do quanto a variável y é explicada por x. ▪ Quando o valor for 1, assumimos que todas os pontos de dispersão ficaram em cima de uma reta. Não há resíduos. ▪ Quando as variáveis não forem adequadas para explicar o comportamento de Y, o valor ficará próximo a 0. Isso significa que os pontos estão muito dispersos no gráfico. Interpretação da tabela ANOVA: Se Sig. > 0,05, ignorar pois não é uma boa regressão. É necessário ter divergência de variância. Interpretação da tabela de Coeficientes: Sig. > 0,05, a variável não pode fazer parte da regressão. Se for maior na linha de constante, aplicar a regressão novamente sem considerar a constante, em “Opções”. Sig. < 0,05, ok. Coeficiente Beta Padronizado: significa o quanto daquela variável influencia no resultado. Quanto maior, mais influência. Montagem da equação a partir da tabela de Coeficientes: y = (valor que deu na linha de variável independente)x + (valor que deu na linha constante) ▪ Regressão múltipla Olha-se o R² ajustado (coeficiente de explicação da regressão) quando há mais de uma variável para explicar Y. 1. Analisar → Regressão → Linear; 2. Colocar variável y (a que é afetada) em “Dependentes” e variáveis x (que afetam) em “Independentes”; 3. Na opção “Estatística”, marcar “Alteração de R quadrado” Interpretação da tabela Resumo: R: Correlação de Pearson R² ajustado: porcentagem do quanto a variável y é explicada por x. Interpretação da tabela ANOVA: Se Sig. > 0,05, ignorar pois não é uma boa regressão. É necessário ter divergência de variância. Interpretação da tabela de Coeficientes: 12 Marmit, Barbara Sig. > 0,05, aplicar a regressão sem considerar o valor constante (desmarcar em “Opções”) Sig. < 0,05, ok. Beta padronizado: mostra quanto as variáveis independentes (x) influenciam mais na variável dependente (y) Montagem da equação a partir da tabela de Coeficientes, linha Beta não padronizado: y = (valor que deu na linha de variável independente)x + (valor que deu na linha constante) 9. REGRESSÃO LOGÍSTICA Uma regressão logística verifica a probabilidade de ocorrência de um evento. Ou seja, é binário: ocorrência ou não ocorrência. 1. Analisar → Regressão → Logística binária; 2. Colocar variável binária em “Dependente” e variáveis independentes em “Covariáveis”; Interpretação da tabela de Classificação: Difere o observado do previsto. Porcentagem correta: coluna importante, visto que iremos testar a fórmula retirando as variáveis que não são importantes para ver se impacta essa porcentagem. O objetivo é deixar o mais próximo de 100%, utilizando somente as variáveis relevantes. Interpretação da tabela de Variáveis na Equação: Coluna B são os resultados que serão multiplicadas com seus respectivos valores da variável independente. Verificar a variável independente que tem menor resultado e rodar a regressão novamente tirando do cálculo; verificar se diminui a porcentagem correta da tabela classificação: se não diminuir, continua sem ela, se diminuir, coloca ela de volta no cálculo e roda a regressão novamente. ▪ Lembrando que o objetivo é ter a fórmula com o menor número de termos possíveis (variáveis independentes e constante) e atingindo a maior porcentagem correta possível. Equação Logística: Depois de achar a fórmula com maior porcentagem e menor número de termos, fazemos a fórmula no Excel: =1/(1+EXP(-( x1*a + x2*b + constante))) Multiplica-se os valores das variáveis (ex: x1, x2) com seus respectivos resultados da coluna B da tabela Variáveis na Equação (ex: a, b). Se a constante não estiver inclusa na fórmula, não considerar. O resultado da equação logística é a probabilidade da ocorrência do evento. Análise discriminante: A análise discriminante é fazer a equação logística para os casos que as variáveis independentes possuem valores muito diferentes. Os resultados conferem a probabilidade da ocorrência e se faz a comparação. 10. ANÁLISE DE CONGLOMERADOS Agrupa as linhas da tabela de acordo com suas características semelhantes. 1. Calcular quartis, IQR (Q3-Q1) e outliers de cada coluna de análise no Excel. 2. Excluir todas as linhas da tabela que são consideradas outliers. 3. No SPSS, colar tabela 4. Analisar → Estatística descritiva → Descritiva; 5. Colocar colunas de valores em “variáveis” 6. Marcar opção “Save standardized values and variables” 13 Marmit, Barbara Depois disso, novas colunas vão aparecer na tabela do SPSS. Esses são os valores padronizados. 7. Analisar → K-means Cluster 8. Colocar as colunas com os valores padronizados como variáveis. 9. Escolher a quantidade de clusters (grupos). Interpretação da tabela Clusters Z-Scores de cada grupo. Interpretação da tabela de número de casos de Clusters Quantas “linhas” se encaixam em cada grupo. A partir dos resultados, nomear cada grupo de acordo com os integrantes. 11. ANÁLISE FATORIAL Agrupa as colunas da tabela de acordo com suas características semelhantes. 1. Analisar → Dimension Reduction → Factor 2. Colocar as variáveis quantitativas de análise em “Variáveis” 3. Em “Analyze”, selecionar “Matriz de correlação” e em “Display”, selecionar “Unrotated Scree Plot” 4. Rotação Varimax, Rotated Solution Interpretação da tabela Variância Explicada A tabela explica a quantidade de grupos (fatores) escolhidos. A análise fatorial escolhe a quantidade de grupo sozinha. ▪ Na coluna Ejgenvalues (Total), considerar número de fatores que possuem valores maiores que 1. ▪ Na coluna de Rotação, provavelmente só vai aparecer valores nas linhas onde o Eigenvalue foi maior que 1. Tendo isso, o número de fatores (grupos) que foi separado equivale ao número de linhas que tiveram o Eigenvalue > 1. Interpretação do gráfico Scree Mostra a relação do Eigenvalue com a quantidade de grupos. Quando a curva começa a ficar horizontal, é o número de agrupamentos. Interpretação da tabela Rotation Component Matrix Nessa tabela mostra todas as variáveis de estudo e as colunas dos grupos. As variáveis são agrupadas de acordo com o maior valor de cada coluna. Nomeia-se, então, os grupos de acordo com as características das variáveis. 5. Scale → Reliability 6. Selecionar as variáveis de maior valor de um grupo, marcar “Show descriptives” Interpretação Alpha de Cronbach Medea confiabilidade e consistência dos instrumentos de mediação. Deve ser > 0,7. Good luck, gafanhotos. Questão 1 Correto Atingiu 2,00 de 2,00 Com base em uma amostra de 15 notas de alunos de Estatística (N desconhecido), foram aplicados testes no SPSS e obtidos os resultados abaixo. Considere significância de 5% e avalie se a hipótese da nota da população ser igual a 5,0 pode ou não pode ser rejeitada. Testes de Normalidade Kolmogorov-Smirnov Shapiro-Wilk Estatística df Sig. Estatística df Sig. AC1 (Real) ,190 15 ,152 ,948 15 ,497 a. Correlação de Significância de Lilliefors Teste de uma amostra Valor de Teste = 5 t df Sig. (2 extremidades) Diferença média 95% Intervalo de Confiança da Diferença Inferior Superior AC1 (Real) -,424 14 ,678 -,2667 -1,615 1,081 Escolha uma: a. O teste a ser aplicado é o teste Qui-quadrado, pois a distribuição não é normal. Conclusão do teste: a média não pode ser considerada diferente de 5,0. b. O teste a ser aplicado é o teste Qui-quadrado, pois a distribuição não é normal. Conclusão do teste: a média é diferente de 5,0. c. O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média não pode ser considerada diferente de 5,0. d. Não se pode tirar conclusões com estes valores, pois falta o teste de Levene. e. O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média é diferente de 5,0. Sua resposta está correta. Distribuição é normal. Pois Sig (Shapiro Wilk) = 0,497, portanto, maior que 0,05 Sendo Normal, aplica-se o teste t de uma amostra. Como o valor do teste t deu sig (2 tail) = 0,678 (>0,05), a média igual a 5 não pode ser rejeitada. A resposta correta é: O teste a ser aplicado é o teste t, pois a distribuição é normal. Conclusão do teste: a média não pode ser considerada diferente de 5,0.. a Questão 2 Correto Atingiu 2,00 de 2,00 Com base no arquivo da prova da Turma 3K, analise se houve melhora ou piora do desempenho da turma comparando as notas do 1º Bimestre (NB1) e as notas do 2º Bimestre (NB2). Considere significância de 5%. Testes de Normalidade Kolmogorov-Smirnov Shapiro-Wilk Estatística df Sig. Estatística df Sig. NB1 ,098 48 ,200 ,965 48 ,161 NB2 ,188 48 ,000 ,886 48 ,000 *. Este é um limite inferior da significância verdadeira. a. Correlação de Significância de Lilliefors Teste de amostras emparelhadas Diferenças emparelhadas t df Sig. (2 extremidades)Média Desvio Padrão Erro padrão da média 95% Intervalo de Confiança da Diferença Inferior Superior Par 1 NB1 - NB2 -1,97812 2,55407 ,36865 -2,71975 -1,23650 -5,366 47 ,000 Classificações N Postos de média Soma de Classificações NB2 - NB1 Classificações Negativas 12 13,71 164,50 Classificações Positivas 36 28,10 1011,50 Vínculos 0 Total 48 a. NB2 < NB1 b. NB2 > NB1 c. NB2 = NB1 Estatísticas de teste NB2 - NB1 Z -4,345 Significância Sig. (2 extremidades) ,000 a. Teste de Classificações Assinadas por Wilcoxon b. Com base em postos negativos. a * a b c a b Estatísticas de teste NB2 - NB1 Z -3,320 Significância Sig. (2 extremidades) ,001 a. Teste de Sinal Escolha uma: a. NB2 é menor que NB1, sendo mais adequado aplicar o teste de Wilcoxon b. NB2 é maior que NB1, sendo mais adequado aplicar o teste de Wilcoxon c. NB2 é maior que NB1, sendo mais adequado aplicar o teste de sinais d. NB2 não é diferente de NB1, sendo mais adequado aplicar o teste t de amostras emparelhadas e. NB2 é maior que NB1, sendo mais adequado aplicar o teste t de amostras emparelhadas Sua resposta está correta. Como NB2 não é normal, tem que ser aplicado o teste não paramétrico de Wilcoxon. p-valor = 0,000 e NB2>NB1, pois NB2 - NB1 deu mais soma de classificações positivas. A resposta correta é: NB2 é maior que NB1, sendo mais adequado aplicar o teste de Wilcoxon. a Questão 3 Correto Atingiu 2,00 de 2,00 Um arquivo compara notas da mesma prova entre duas turmas (3J e 3K). Considerando que são duas turmas de alunos de Estatística, teste se a hipótese das médias serem iguais entre as duas turmas pode ser rejeitada. Considere significância de 5%. Testes de Normalidade Turma Kolmogorov-Smirnov Shapiro-Wilk Estatística df Sig. Estatística df Sig. AC1 3J ,156 15 ,200 ,960 15 ,692 3K ,110 52 ,162 ,981 52 ,570 *. Este é um limite inferior da significância verdadeira. a. Correlação de Significância de Lilliefors Teste de amostras independentes Teste de Levene para igualdade de variâncias teste-t para Igualdade de Médias Z Sig. t df Sig. (2 extremidades) Diferença média Erro padrão de diferença 95% Intervalo de Confiança da Diferença Inferior Superior AC1Variâncias iguais assumidas ,003 ,955-1,678 65 ,098 -1,0571 ,6298 -2,3149 ,2008 Variâncias iguais não assumidas -1,64022,000 ,115 -1,0571 ,6446 -2,3938 ,2797 Estatísticas de teste AC1 U de Mann-Whitney 292,500 Wilcoxon W 412,500 Z -1,472 Significância Sig. (2 extremidades) ,141 a. Variável de Agrupamento: Turma a * a Escolha uma: a. As médias não são diferentes, e o p-valor é 0,115. b. As médias não são diferentes, e o p-valor é 0,098. c. As médias são diferentes, e o p-valor é 0,098. d. As médias não são diferentes, e o p-valor é 0,141. e. As médias são diferentes, e o p-valor é 0,141. Sua resposta está correta. Como sig da normalidade da 3k é 0,162 (n>30), e da 3J é 0,692 (n<30), aplica-se o teste t de duas amostras independentes (paramétrico). O teste de Levene deu variâncias iguais (sig = 0,955), portanto o p-valor é 0,098, assumindo que as médias entre os dois grupos não são diferentes (não rejeita H0). A resposta correta é: As médias não são diferentes, e o p-valor é 0,098.. Questão 4 Correto Atingiu 2,00 de 2,00 No arquivo PROVA B – BRASIL, disponível em https://mackenzie365- my.sharepoint.com/:u:/g/personal/1150621_mackenzie_br/ES5Ov9NBXFhHiCMPRpUvZO4BswLP1FHOmy1fQ1iN_D8qMg? e=rAgu27, qual a correlação entre DENSIDADE E SUPERFÍCIE (considere p-valor igual a 0,10)? Escolha uma: a. r = -0,38, o que significa que a densidade diminui quando a superfície aumenta. b. r = 0,053, o que significa que a densidade aumenta quando a superfície aumenta. c. r = -0,38, o que significa que a densidade aumenta quando a superfície aumenta. d. r = 0,053, o que significa que a densidade diminui quando a superfície aumenta. e. Não tem correlação, porque o p-valor é menor que 0,10. Sua resposta está correta. A resposta correta é: r = -0,38, o que significa que a densidade diminui quando a superfície aumenta.. https://mackenzie365-my.sharepoint.com/:u:/g/personal/1150621_mackenzie_br/ES5Ov9NBXFhHiCMPRpUvZO4BswLP1FHOmy1fQ1iN_D8qMg?e=rAgu27 Temperatura Vendas 6 35 12 32 16 22 20 35 24 40 28 45 30 56 32 59 35 20 40 23 Questão 5 Incorreto Atingiu 0,00 de 2,00 1. Na tabela abaixo, deseja-se saber qual a relação entre VENDAS E TEMPERATURA: Testes de Normalidade Kolmogorov-Smirnov Shapiro-Wilk Estatística df Sig. Estatística df Sig. Temperatura ,135 10 ,200 ,978 10 ,952 Vendas ,150 10 ,200 ,928 10 ,432 *. Este é um limite inferior da significância verdadeira. a. Correlação de Significância de Lilliefors Correlações Temperatura Vendas TemperaturaCorrelação de Pearson 1 ,103 Sig. (2 extremidades) ,776 N 10 10 Vendas Correlação de Pearson ,103 1 Sig. (2 extremidades) ,776 N 10 10 Escolha uma: a. A correlação é 0,103, sendo considerada baixa. b. Não há correlação significativa entre as variáveis Vendas e Temperatura, pois apesar da correlação ser alta (0,776), o sig é maior que 0,05 (0,103). c. A correlação é 0,776, sendo considerada alta. d. Não se pode afirmar, pois o correto seria aplicar a correlação de Spearman. e. Não há correlação significativa entre as variáveis Vendas e Temperatura, pois o sig é 0,776 Sua resposta está incorreta. A correlação de Pearson entre vendas e temperatura está na tabela no cruzamento entre as duas variáveis: 0,103. Porém, o sig > 0,05 (0,776), portanto, esse valor não é significativo.Não há correlação significativa. A resposta correta é: Não há correlação significativa entre as variáveis Vendas e Temperatura, pois o sig é 0,776. a * * Questão 1 Correto Atingiu 1 de 1 Na análise de conglomerados, os dados precisam estar padronizados. Analise as afirmações: I. Padronizar os dados significa colocar todos com o mesmo número de casas decimais. II. Padronizar os dados é substituir os valores x por z, isto é, o valor estar expresso pela sua posição relativa em termos de distância da média. III. Sem padronizar os dados, as variáveis terão ordens de grandeza diferentes, desvirtuando os cálculos das posições relativas entre os casos. São corretas as afirmações: Escolha uma: II, apenas I, II e III I e III, apenas II e III, apenas I e II, apenas Sua resposta está correta. A resposta correta é: II e III, apenas. Questão 2 Correto Atingiu 1 de 1 Uma empresa contrata três vendedores. A fim de segmentar os clientes semelhantes para cada vendedor, o gerente comercial resolve analisar o banco de dados de clientes, que tem várias características como faixa salarial, nível social, gênero, idade, média de gasto por compra, número de compras por mês, dentre outros. Qual técnica ele deve aplicar para segmentar clientes semelhantes para os três vendedores? Escolha uma: Análise de conglomerados Regressão linear simples Regressão logística Regressão linear múltipla Análise fatorial Sua resposta está correta. A resposta correta é: Análise de conglomerados. https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 Questão 3 Correto Atingiu 1 de 1 O professor aplicou uma pesquisa de ensino e aprendizagem com 12 perguntas feitas a centenas de alunos. Depois, fez uma análise fatorial para avaliar se o número de variáveis poderia ser agrupado em um número menor de fatores. O resultado exploratório realizado com os componentes principais pelo critério do Eigenvalue >1 foi: Forçando a solução com três fatores, o resultado foi: A melhor decisão, com base no conteúdo dos fatores, é: Escolha uma: Assumir 3 fatores com 4 itens cada: 1. aplicação do conhecimento; 2. Pontualidade do professor; e 3. Materiais Didáticos Eliminar os itens sobre material e referências e rodar novamente com dois fatores. Tentar rodar com 4 fatores, visando buscar uma melhor distribuição dos itens. Não deveria ter aplicado a análise fatorial Assumir 2 fatores: 1. Aplicação do conhecimento e materiais de apoio (com 8 itens); e 2. Pontualidade do professor (com 4 itens) https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 Sua resposta está correta. A resposta correta é: Assumir 3 fatores com 4 itens cada: 1. aplicação do conhecimento; 2. Pontualidade do professor; e 3. Materiais Didáticos. Questão 4 Correto Atingiu 1 de 1 Um aluno do Mackenzie resolveu aplicar seus conhecimentos de estatística em um novo negócio da família: uma sorveteria por quilo. Ele levantou dados de temperatura média do dia e quantidade de quilos de sorvete vendidos, conforme tabela abaixo: Para verificar se as vendas podem ser previstas em função da temperatura, qual técnica estatística ele deve usar? Escolha uma: análise fatorial regressão linear múltipla regressão logística análise de conglomerados regressão linear simples Sua resposta está correta. A resposta correta é: regressão linear simples. https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 Questão 5 Incorreto Atingiu 0 de 1 Um aluno do Mackenzie resolveu aplicar seus conhecimentos de estatística em um novo negócio da família: uma sorveteria por quilo. Ele levantou dados de temperatura média do dia e quantidade de quilos de sorvete vendidos, conforme tabela abaixo: Resolveu aplicar uma regressão linear simples para prever as vendas em função da temperatura e obteve os seguintes resultados: A conclusão a que chegou foi: Escolha uma: Uma previsão de venda na temperatura de 20º é 35 Kg. Deveria ter escolhido outra técnica estatística e não a regressão linear. As vendas de sorvete não têm relação significativa com a temperatura As variáveis não são adequadas para a regressão linear. A ANOVA revelou que é adequado aplicar a regressão linear e as vendas para 20º devem ser 36 Kg. Sua resposta está incorreta. A resposta correta é: As vendas de sorvete não têm relação significativa com a temperatura. Questão 6 Correto Atingiu 1 de 1 A Butler Trucking é uma empresa que entrega manteiga. Ela deseja estimar o tempo de viagem em função de duas variáveis: milhas percorridas e número de entregas. Para isso, levantou uma amostra das última viagens, o que é apresentado na tabela abaixo: Os resultados foram: Pode-se concluir que: Escolha uma: A constante é o que mais influencia no tempo, porque a significância é maior. A técnica aplicada foi inadequada, porque sig. da ANOVA é menor que 0,05. A técnica aplicada foi inadequada, porque o coeficiente de explicação do modelo é inferior a 60%. A variável que mais influencia no tempo é X2_Entregas, porque o B é maior. A variável que mais influencia no tempo é X1_milhas, porque o Beta é maior. Sua resposta está correta. A resposta correta é: A variável que mais influencia no tempo é X1_milhas, porque o Beta é maior.. Questão 7 Correto Atingiu 1 de 1 Uma empresa resolve analisar o banco de dados de clientes quanto a algumas dimensões, mas há 20 variáveis sobre os clientes, como: faixa salarial, nível social, gênero, idade, média de gasto por compra, número de compras por mês, dentre outros. Qual técnica ele deve aplicar para reduzir o número de variáveis e facilitar a análise? Escolha uma: Análise fatorial Regressão linear simples Análise de conglomerados Regressão logística Regressão linear múltipla Sua resposta está correta. A resposta correta é: Análise fatorial. https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 https://eadmoodle.mackenzie.br/mod/resource/view.php?id=710814 Questão 8 Correto Atingiu 1 de 1 Deseja-se criar um modelo estatístico para prever se uma pessoa com COVID-19 tem alta probabilidade de morrer. Para isso, foi levantado um banco de dados com algumas variáveis: - Tinha diabetes? (S/N) - Tinha bronquite ou qualquer outra doença pulmonar preexistente? (S/N) - Idade - Peso - Gênero (M/F) - Morreu de covid? (S/N) - Trabalha? (S/N) Qual(is) deve(m) ser a(s) variável(is) dependente(s)? Escolha uma: Idade e peso Tinha diabetes, Tinha bronquite ou outra doença pulmonar preexistente, morreu de covid, trabalha e gênero Esta técnica não tem variável dependente Tinha diabetes, Tinha bronquite ou outra doença pulmonar preexistente (apenas) Morreu de covid Sua resposta está correta. A resposta correta é: Morreu de covid. Questão 9 Correto Atingiu 1 de 1 O arquivo "Inadimplencia.sav" contém as variáveis de clientes, sendo: STATUS = igual a 1 (inadimplente), igual a 0 (adimplente) R = renda (x mil reais) ND = número de dependentes VE = igual a 0 (sem vínculo empregatício), igual a 1 (com vínculo empregatício). Foi feita uma regressão logística com STATUS = f (R, ND e VE). Sobre os objetivos de se fazer esta regressão, foram feitas três afirmativas: I. Deseja-se prever, em função da renda, número de dependentes e se a pessoa tem vínculo empregatício, qual a probabilidade que ela se torne inadimplente. II. Deseja-se estabelecer quais das três variáveis mais interferem no fato de uma pessoa se tornar inadimplente. III. Deseja-se saber se o vínculo empregatício pode ser explicado pela renda e pelo número de dependentes. São corretas somente as afirmativas: Escolha uma: I e II, apenas I, apenas I, II e III. II, apenas I e III, apenas Sua resposta está correta. A III não é correta, pois o vínculo empregatício é variável independente na fórmula. A resposta correta é: I e II, apenas. Questão 10 Correto Atingiu 1 de 1 Deseja-se criar um modelo estatístico para prever o desempenho de uma pessoa. Para isso, foi levantado um banco de dados com algumas variáveis: 1. Conhecimento(0 a 100) 2. Habilidade (0 a 100) 3. Desempenho na última avaliação (0 a 100) 4. Nota da avaliação 360 (0 a 100) 5. Nota de metas atingidas (0 a 100) Qual(is) a(s) variável(is) dependente(s) do modelo? Escolha uma: 5, apenas 1, 2 e 4 2, apenas 1, 2, 4 e 5 3, apenas Sua resposta está correta. A resposta correta é: 3, apenas.
Compartilhar