Buscar

Prova Objetiva

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Questão 1/10 - Análise Preditiva 
Uma amostra dos dados de clientes é apresentada no quadro 1, que são o número de vezes que cada 
cliente visita o restaurante por mês, o gasto médio do cliente por mês e forma de pagamento 
(Adaptado de SILVA, PERES e BOSCARIOLI, 2016, pg. 153). 
 
Quadro 1 – Frequência, consumo e forma de pagamento 
 
 
Fonte: Adaptado de SILVA, PERES e BOSCARIOLI, 2016, pg. 153) 
Para aplicar o método de classificação k-NN, escolha o procedimento correto a ser seguido. 
Nota: 0.0 
 
A Não é possível aplicar o método de classificação k-NN, pois a variáveis explicativas (frequência e consumo) devem ser qualitativas 
 
B As variáveis explicativas (frequência e consumo) devem ser normalizadas, isto é, devem ser colocadas no intervalo entre 0 e 1. 
Comentário: Para a aplicação da técnica de classificação k-NN, normalmente são usadas métricas de distância para medir similaridade e dissimilaridade entre dois elementos. Porém, antes de calcular as distâncias recomenda-se 
fazer a normalização de cada atributo (variável), isto é, colocar no intervalo de 0 a 1. Antes de calcular as distâncias recomenda-se fazer a normalização de cada atributo (variável), isto é, colocar no intervalo de 0 a 1. 
 
C A variável resposta (pagamento) deve ser transformada em uma variável quantitativa. 
 
D A variável resposta (pagamento) deve ser normalizada, isto é, deve ser colocada no intervalo entre 0 e 1. 
 
Questão 2/10 - Análise Preditiva 
Assinale a alternativa correta referente aos temas abordados na Aula 6. 
Nota: 0.0 
 
A A análise de agrupamento (cluster analysis) é uma técnica que permite agrupar observações e é uma importante técnica preditiva. 
 
B O objetivo da técnica de agrupamento é maximizar a homogeneidade entre os grupos e maximizar a heterogeneidade dentro dos grupos. 
 
C A similaridade entre os elementos é uma medida de distância entre os elementos a serem agrupados. 
 
D A distância euclidiana é uma das medidas de distâncias mais utilizada na análise de agrupamento. 
Comentário: A maioria dos algoritmos de análise de agrupamento opera com o conceito de distância (dissimilaridade). Distância euclidiana é certamente a mais conhecida e utilizada para calcular a distância entre dois objetos no 
espaço p-dimensional. 
 
Questão 3/10 - Análise Preditiva 
Os dados são referentes a avaliação da qualidade de serviço de um restaurante. Qual é o 
procedimento a ser adotado para utilizar a árvore de decisão para estimar se o restaurante terá lucro 
ou prejuízo? (Adaptado de SILVA, PERES e BOSCARIOLI, 2016, pg. 107). 
 
Quadro 1 – Experiência, qualidade, localização e resultado 
 
Fonte: Adaptado de SILVA, PERES e BOSCARIOLI, 2016, pg.107 
 
Descrição das variáveis: 
Experiência: Experiência dos profissionais 
Qualidade: Qualidade da refeição 
Localização: Localização do estabelecimento 
Resultado: Lucro ou prejuízo 
Assinale a alternativa correta. 
Nota: 10.0 
 
A Dividir o arquivo de dados em dois subarquivos, treinamento e teste, na proporção respectivamente de 75% e 25%. 
Você acertou! 
Comentário: o arquivo de dados deve ser dividido em dois subarquivos, um para treinamento, e outro para teste. A proporção deve ser entre 60% a 90% das observações do conjunto total para o treinamento e entre 40% e 10% do 
conjunto total de observações para o teste. 
 
B Dividir o arquivo de dados em dois subarquivos, treinamento e teste, na proporção respectivamente de 10% e 90%. 
 
C Dividir o arquivo de dados em dois subarquivos, treinamento e teste, sendo 50% para cada um deles. 
 
D Não é possível utilizar a árvore de decisão para estimar o resultado, se haverá lucro ou prejuízo, pois é necessário que seja uma variável quantitativa. 
 
Questão 4/10 - Análise Preditiva 
Ajustou-se a função linear (modelo de regressão linear simples) e a função potência, para analisar o 
comportamento das distâncias percorridas até parar (Y) em função da velocidade (X) em uma amostra 
de 30 carros. Os coeficientes de determinação ou explicação obtidos encontram-se na tabela 1. 
 
Tabela 1 – Coeficientes de determinação segundo função Ajustada 
 
 
Fonte: Arquivo de dados cars, disponível l na biblioteca datasets do Sistema R (2020). 
Ao analisar os coeficientes de determinação das duas funções ajustadas, é possível afirmar: 
Nota: 10.0 
 
A Dentre as duas funções ajustadas, a função potência explica melhor as variações da variável resposta Y. 
Você acertou! 
Comentário: A medida que indica a qualidade do ajuste é o coeficiente de determinação ou explicação (R2). Essa medida mostra o quanto das variações (em %) da variável Y é explicada pelo modelo ajustado. Quanto mais próximo 
de 100%, melhor é o ajuste do modelo. 
 
B Dentre as duas funções ajustadas, a função potência explica melhor as variações da variável independente X. 
 
C Dentre as duas funções ajustadas, a função linear é melhor, pois apresenta menor R2ajustado. 
 
D Dentre as duas funções ajustadas, a função linear explica melhor as variações da variável independente X. 
 
Questão 5/10 - Análise Preditiva 
O engenheiro de controle de qualidade decidiu extrair uma amostra aleatória de 49 rebites e medir 
seus diâmetros (cm). Ele deseja saber o comportamento de todos os diâmetros dos rebites, com base 
nessa amostra. Sabe-se que a média e o desvio padrão dos diâmetros dos rebites são iguais, 
respectivamente, a 2,4939 e 0,0554 (Adaptado de GUPTA e GUTTMAN, 2017, pg. 277). 
Qual é o procedimento correto que o engenheiro deve adotar? 
Nota: 10.0 
 
A Testar as hipóteses a seguir, utilizando teste de hipóteses para a média populacional, adotando nível de significância de 5%. 
 
H0: μ=2,0cmμ=2,0cm 
H1: μ>2,0cmμ>2,0cm 
Você acertou! 
Comentário: Nesse caso, deve-se utilizar o teste de hipóteses para a média populacional, com base na média e desvio padrão dos diâmetros dos rebites obtidos em uma amostra de 49 rebites. A hipótese H0 é sempre de igualdade 
e a hipótese H1 pode assumir diferentes situações, neste caso deseja-se testar se é maior do que 2,0. O nível de significância é escolhido pelo pesquisador, sendo os mais utilizados, 1% e 5% 
 
B Testar as hipóteses a seguir, utilizando teste de hipóteses para proporções, adotando nível de significância de 1%. 
 
H0: p=2p=2 
H1: p>2p>2 
 
C Testar as hipóteses a seguir, utilizando teste de hipóteses para a média populacional, adotando nível de significância de 5%. 
 
H0: μ>2,0cmμ>2,0cm 
H1: μ=2,0cmμ=2,0cm 
 
D As informações disponíveis não permitem saber o comportamento de todos os diâmetros de rebites. 
 
Questão 6/10 - Análise Preditiva 
Um revendedor de pneus recebe semanalmente vários carregamentos. O técnico responsável pelo 
controle de estoque retirou aleatoriamente 20 pneus e mediu a profundidade da banda de rodagem, 
em mm (Adaptado de GUPTA e GUTTMAN, pg. 49): 
Qual é a alternativa correta? 
Nota: 10.0 
 
A A profundidade da banda de rodagem é uma variável qualitativa 
 
B A profundidade da banda de rodagem é uma variável quantitativa discreta 
 
C Só permite calcular as frequências de cada valor da profundidade da banda de rodagem 
 
D A profundidade da banda de rodagem é uma variável quantitativa continua 
Você acertou! 
Comentário: Essa variável pode assumir qualquer valor no intervalo dos números reais, sendo assim uma variável quantitativa continua. 
 
Questão 7/10 - Análise Preditiva 
Os dados foram obtidos no arquivo Wages1, da biblioteca Ecdat, do Sistema R. São informações sobre 
tempo de experiência, anos de estudo e salário/hora (U$) de 3.294 pessoas. O objetivo é obter 
agrupamento de pessoas utilizando o método de k-médias. 
 
Gráfico 1 – Soma de quadrados dentro dos grupos para diferentes números de grupos 
 
 
Fonte: Elaborado a partir dos dados do arquivo Wages1, da biblioteca Ecdat, Sistema R (2020). 
 
 
Gráfico 2 – Índice de Silhouette segundo número de grupos 
 
 
Fonte: Elaborado a partir dos dados do arquivo Wages1, da biblioteca Ecdat, Sistema R (2020). 
Analisandoos gráficos acima, é possível concluir: 
Nota: 10.0 
 
A Através da análise dos gráficos 1 e 2, o número de grupos deve ser definido em 2, pois apresenta o maior valor da soma de quadrados e menor valor da média do índice de Silhouette. 
 
B Através da análise do gráfico 1, o número de grupos deve ser definido em 8, pois apresenta menor valor da soma de quadrados. 
 
C Através da análise dos gráficos 1 e 2, o número de grupos deve ser definido em 5, pois a redução da soma de quadrados é pequena, a partir de k igual a 5 e a média do índice de Silhouette é o maior valor. 
Você acertou! 
Comentário/justificativa: Analisando a soma de quadrados dentro dos grupos em função do número de grupos, observa-se redução até , porém, a partir disso, a redução é pequena e o índice Silhouette apresenta maior valor para 
número de grupos igual a 5. 
 
D Não é possível definir o número de grupos analisando apenas gráficos 1 e 2. 
 
Questão 8/10 - Análise Preditiva 
A distribuição normal ou Gaussiana é uma das distribuições de probabilidades mais importante para 
a Inferência Estatística. Sobre essa distribuição é correto afirmar: 
Nota: 10.0 
 
A É uma distribuição para variáveis aleatórias discretas, isto é, aquelas que assumem somente valores inteiros. 
 
B É possível afirmar que, quando uma variável aleatória comporta-se segundo uma distribuição normal, no intervalo entre a média mais ou menos 2 desvios padrão, a área compreendida é de 95,45%. 
Você acertou! 
Comentário: As áreas compreendidas nos intervalos entre a média e desvios padrão em uma distribuição normal é: 
 
μ±1σ=68,27μ±1σ=68,27 
μ±2σ=95,45μ±2σ=95,45 
μ±3σ=99,73μ±3σ=99,73 
 
 
C O gráfico da distribuição normal tem uma característica típica, que é uma curva desviada para esquerda. 
 
D A distribuição normal é simétrica em torno do desvio padrão σσ. 
 
 
 
Questão 9/10 - Análise Preditiva 
Ajustou-se o modelo de regressão linear simples para analisar o comportamento das distâncias 
percorridas até parar (Y) em função da velocidade (X) em uma amostra de 30 carros. Os dados foram 
obtidos do arquivo cars, da biblioteca datasets, disponível no Sistema R. O ajuste do modelo foi feito 
utilizando o Sistema R, tendo obtido os seguintes resultados: 
 
 
Analisando os valores obtidos é possível afirmar: 
Nota: 0.0 
 
A O modelo de regressão linear ajustado é: ˆY=−21,9382+4,0154XY^=−21,9382+4,0154X ; 
Comentário: O ajuste do modelo foi feito utilizando o Sistema R, tendo obtido os seguintes resultados: 
 
 
 
Portanto, o modelo ajustado para distância percorrida até parar (Y) é: ˆY=−21,9382+4,0154XY^=−21,9382+4,0154X 
 
B O valor-p (p-value) do teste de significância é 6,074 x 10-12, indicando que o modelo de regressão da variável Y sobre X não é significativa para o nível de significância de 5%; 
 
C O valor-p (p-value) do teste de significância é 6,074 x 10-12, indicando que o modelo de regressão da variável Y sobre X não é significativa para o nível de significância de 1%; 
 
D O modelo linear ajustado explica 81,37% das variações ocorridas na variável independente X. 
 
Questão 10/10 - Análise Preditiva 
Foi ajustado o método de suavização exponencial de Holt para analisar o índice de preços ao 
consumidor amplo (IPCA) mensal no Brasil, no período de janeiro de 2014 a novembro de 2020. Os 
resultados do ajuste utilizando o Sistema R, está apresentado a seguir: 
 
 
Assinale a alternativa correta a respeito dos parâmetros de suavização estimados. 
Nota: 10.0 
 
A A constante de suavização do nível é C = 0,7683 
 
B A constante de suavização da tendência é A = 0,7683 
 
C A constante de suavização do nível é A = 0,55 
 
D A constante de suavização da tendência é C = 0,0485 
Você acertou! 
Comentário: Os resultados do ajuste utilizando o Sistema R, está apresentado a seguir:

Continue navegando