Baixe o app para aproveitar ainda mais
Prévia do material em texto
Pergunta 1 /1 Leia o trecho a seguir. “A abordagem da regressão aplica a pontuação de cada fator preditivo a uma equação para proporcionar uma estimativa ou projeção numérica do critério. No caso da vaga de vendedor de computadores, uma equação poderia prever as vendas por mês em unidade monetária. Os fatores preditivos para essa ocupação poderiam ser a nota média na faculdade e pontuações no exercício de comunicação.” Fonte: SPECTOR, Paul. Psicologia nas organizações.São Paulo: Saraiva, 2009. p.165. Considerando a citação apresentada e os conteúdos abordados na unidade, avalie as alternativas: I. A regressão linear avalia probabilidade de correlação entre X e Y. II. Um R igual a 0,20 representa média dependência. III. A aba de estatísticas de SPSS é mais visual que a Plot. IV. Ascendência e descendência da linha com valor alto representam dependência de X e Y. Está correto apenas o que se afirma em: 1. • III e IV. 2. I e II. 3. I e IV. Resposta correta 4. II e IV. 5. I e III. • Pergunta 2 /1 Leia o trecho a seguir: "O último passo de um estudo de validação é a validação cruzada, ou a replicação dos resultados de uma amostra em outra amostra, isso é feito para nos certificar de que nossos resultados se devem a uma verdadeira correlação entre o critério e o fator preditivo e não devido a algum erro estatístico." Fonte: SPECTOR, Paul. Psicologia nas organizações. São Paulo: Saraiva, 2009. p.164. A partir dessas informações e do conteúdo estudado a respeito de validação cruzada, analise as afirmativas a seguir: I. A validação cruzada é feita primeiro treinando e depois testando. II. A validação cruzada é utilizada para testar funcionalidade de Python. III. A validação compara x e y para analisar correlação entre dados. IV. Pode-se utilizar 75% para treino e o restante para teste. Está correto apenas o que se afirma em: 1. • II e III. 2. Incorreta: I e II. 3. III e IV. 4. I e IV. Resposta correta 5. II e IV. • Pergunta 3 /1 Leia o trecho a seguir: “Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada diretamente para encontrar clientes semelhantes em uma base de dados.” Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. XIV. A partir dessas informações e do conteúdo estudado a respeito das técnicas de similaridades para análises de dados, pode-se afirmar que: 1. • quanto mais baixo o resultado da distância euclidiana, mais similar é o dado. Resposta correta 2. Incorreta: um dado similar tem vizinhos ímpares. 3. dados distantes podem ser colocados no mesmo grupo de similaridade, desde que a análise seja feita com knn. 4. clusters e knn são a mesma coisa, ambos são cálculos que geram árvores de decisão. 5. a distância euclidiana calcula valores similares nas árvores de regressão. • Pergunta 4 /1 Leia o trecho a seguir: "Estes passos são executados na sequência que eles aparecem. Entretanto, em muitas situações, é necessário alterar o fluxo de execução destas instruções. Pode ser que seja necessário executar um passo, ou um conjunto deles, apenas se uma determinada condição for verdadeira, ou talvez, pode ser que seja preciso repetir um conjunto de passos várias vezes até uma determinada condição." Fonte: ARAUJO, Eli et al. Introdução a programação. João Pessoa: UFPB, 2014. p. 32. A partir dessas informações e do conteúdo estudado a respeito de python e análises condicionais, pode-se afirmar que: 1. • IF significa uma variável que receberá um valor, para então ser testada. 2. para exibir uma resposta de iF ELSE, utiliza-se o print com chaves {}. 3. Incorreta: o IF e o ELSE dependem de NumPy. 4. se deve usar sinais de + ou - para comparar valores. 5. enquanto IF é a primeira condição, ELSE é outra condição, caso a primeira não seja realizada. Resposta correta • Pergunta 5 /1 Leia o trecho a seguir: “KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A idéia do KNN é extremamente simples e efetiva em várias aplicações.” Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 2008. p. 112. Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10. II. ( ) O ideal é escolher K par. III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo. IV. ( ) A distância euclidiana mede a distância entre os valores dos dados. Agora, assinale a alternativa que apresenta a sequência correta: 1. • F, F, V, V. Resposta correta 2. Incorreta: F, V, F, F. 3. V, V, F, F. 4. F, F, V, F. 5. V, F, F, V. • Pergunta 6 /1 Leia o trecho a seguir: “Uma matriz de confusão separa as decisões tomadas pelo classificador, tornando explícito como uma classe está sendo confundida com outra. Desta forma, diferentes tipos de erros podem ser tratados separadamente.” Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 189. A matriz de confusão pode ser explicada como: I. Uma tabela com quatro opções, onde analisa-se quatro itens de um dataset. II. TF sigifica que True (positivo) era a resposta certa. III. TP significa um acerto referente a um dado positivo, que pode ter uma doença por exemplo. IV. FN significa a ausência de erro naquela análise, ou seja, o modelo errou. Está correto o que se afirma em: 1. • II e III. 2. Incorreta: I e III. 3. II e IV. 4. III e IV. Resposta correta 5. I e II. • Pergunta 7 /1 Leia o trecho a seguir: “Quando há a necessidade de trabalhar com duas ou mais condições ao mesmo tempo, são utilizados os operadores lógicos que são responsáveis pela formação de novas proposições compostas a partir de proposições lógicas simples.” Fonte: HAYASHIDA, Daniel; REIS, José. Lógica de programação: Conhecendo Algoritmos e Criando Programas. São Paulo: Viena. 2015. p. 47. A partir do texto e do conteúdo estudado, analise as afirmações a seguir sobre operadores: I. Os operadores de diferente e de exponenciação são: ! e ^. II. O operador lógico de negação e o operador de divisão inteira são: not e //. III. Os operadores de igualdade e de divisão são: == e /. IV. Os operadores de comparação são: >, >=, <, <=, ! e ==. Está correto apenas o que se afirma em: 1. • I e II. 2. II e IV. 3. I e IV. 4. III e IV. Resposta correta 5. Incorreta: II e III. • Pergunta 8 /1 Leia o trecho a seguir: “Ao obter a matriz de confusão, foi possível calcular as seguintes medidas de desempenho: precisão, sensibilidade, especificidade e acurácia. A matriz é de extrema relevância ao trabalho, pois com a sensibilidade permitiu avaliar a classificação correta dos doentes e a especificidade permitiu avaliar a classificação correta dos sadios.” Fonte: MEDEIROS, Leonardo et.al. Análise no desempenho de algoritmos de aprendizagem supervisionada na classificação da marcha em Parkinsonianos. Alagoas: UFAL, 2017. p. 5. Com base no texto e no que foi aprendido em relação à sensibilidade e à especificidade, analise as afirmativas a seguir: I. Sensibilidade é o nível deproporção dos itens serem positivos, tanto para doenças e cancelamentos, quanto para oportunidades. II. Especificidade é a divisão dos totais pelos negativos. III. Especificidade é o nível de proporção dos itens seres negativos, tanto para doenças e cancelamentos, quanto para oportunidades. IV. Sensibilidade é a divisão dos totais pelos positivos. Está correto apenas o que se afirma em: 1. • Incorreta: I e II. 2. II e IV. 3. I e IV. Resposta correta 4. I e III. 5. II e III. • Pergunta 9 /1 Leia o trecho a seguir: “A regressão linear, a regressão logística e máquinas de vetores de suporte são instâncias muito semelhantes de nossa técnica básica fundamental: ajustar um modelo linear aos dados.” Fonte: PROVOST, Foster; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016. p. 88. A partir dessas informações e do conteúdo estudado a respeito de regressão linear, analise as afirmações a seguir. I. Slope significa o quanto a reta do gráfico está fora do quadrado, e isso pode ser em qualquer sentido. II. Intercept é o valor de y, quando x for igual a 1. III. R é o grau de correlação entre duas variáveis, ou seja, o nível de dependência. IV. Há uma fórmula para descobrir o R. Está correto apenas o que se afirma em: 1. • III e IV. Resposta correta 2. Incorreta: I e II. 3. II e IV. 4. I e IV. 5. II e III. • Pergunta 10 /1 Leia o trecho a seguir: Matplotlib é uma biblioteca versátil que gera visualizações de dados. Com variados tipos de desenhos e opções de estilos refinados, é um instrumento de trabalho bom para criar imagens profissionais e publicações científicas. Fonte: YU, Allen; CHUNG, Claire; YIM, Aldrin. Matplotlib 2.x. Mumbai: Packt, 2017. p. 8. Observe a seguir a sintaxe de uma matriz: plt.plot(matriz1, c='blue', label='êxitos') plt.title("comparação de vendas semestral em cinco meses") plt.ylabel(u'Aquisições') plt.legenda('lower right') plt.xlabel(u'Tentativas') plt.show() Com base no texto e no conteúdo estudado, analise as afirmativas abaixo sobre a sintaxe da matriz apresentada: I. “Aquisições” será digitado embaixo do gráfico. II. “Tentativas” será digitado ao lado do gráfico. III. “Plt.title” mostrará o nome do gráfico acima dele. IV. “Blue” é a cor da linha. Está correto apenas o que se afirma em: 1. III e IV. Resposta correta 2. II e IV. 3. Incorreta: I e IV. 4. II e III. 5. I e III.
Compartilhar