Baixe o app para aproveitar ainda mais
Prévia do material em texto
Data Science AV1 Conteúdo do exercício 1. Pergunta 1 0,5/0,5 Leia o trecho a seguir: “KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A idéia do KNN é extremamente simples e efetiva em várias aplicações.” Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 2008. p. 112. Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10. II. ( ) O ideal é escolher K par. III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo. IV. ( ) A distância euclidiana mede a distância entre os valores dos dados. Agora, assinale a alternativa que apresenta a sequência correta: Ocultar opções de resposta 1. V, V, F, F. 2. F, V, F, F. 3. Correta: F, F, V, V. Resposta correta 4. F, F, V, F. 5. V, F, F, V. 2. Pergunta 2 0,5/0,5 Leia o trecho a seguir: “A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou cluster) é uma coleção de registros similares entre si, porém diferente dos outros registros nos demais agrupamentos.” Fonte: SILVA, João; CAMILO, Cassio. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. Goiás: Instituto de Informática Universidade Federal de Goiás, 2009, p. 10. Analisando o texto e o conteúdo da disciplina referente à diferença entre sumarização e agrupamento, pode-se afirmar que: Ocultar opções de resposta 1. O agrupamento analisa as particularidades de cada indivíduo, criando uma propaganda para cada pessoa. 2. O agrupamento analisa principalmente as probabilidades, ignorando os fatos. 3. O agrupamento analisa o histórico de cada cliente e isso é um grupo de fatos. 4. O agrupamento analisa o preço de um produto ao longo do tempo e tenta estimar esse preço. 5. Correta: O agrupamento analisa as decisões e pontos em comum de um público, a fim de criar produtos direcionados para esse micro público. Resposta correta 3. Pergunta 3 0,5/0,5 Leia o trecho a seguir: “Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada diretamente para encontrar clientes semelhantes em uma base de dados.” FOSTER, Provost e FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016, p. XIV. A partir dessas informações e do conteúdo estudado a respeito das técnicas de correlações para análises de dados, pode-se afirmar que, além das semelhanças, uma outra correlação utilizada em análise supervisionada é: Ocultar opções de resposta 1. filtro automático. 2. Correta: regressão. Resposta correta 3. sumarização. 4. cluster. 5. agrupamento. 4. Pergunta 4 0,5/0,5 Leia o trecho a seguir: “Frequentemente, um armazenamento de dados fica extremamente ocupado, pois várias pessoas estão acessando partes diferentes do conjunto de dados. Nestas circunstâncias, podemos suportar a escalabilidade horizontal, colando partes diferentes dos dados em servidores diferentes.” Fonte: PRAMOD, Sadalage e FOWLER, Martim. NoSQL Essencial: Um guia conciso para o mundo emergente da persistência. São Paulo: Novatec, 2013, p. 74. Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s): I.( ) Escalabilidade é a capacidade de dados mudarem de valor. II.( ) Hoje em dia, vemos quantidades de dados exorbitantes, em terabytes. Por isso os sistemas necessitam de maior escalabilidade. III.( ) Tecnologias ligadas a mapas diminuíram a necessidade de escalabilidade. IV.( ) A velocidade de redes aumentada, devido à tecnologia, trouxe a necessidade de sistemas que suportassem mais dados. Agora, assinale a alternativa que apresenta a sequência correta: Ocultar opções de resposta 1. V, F, F, V. 2. F, F, V, F. 3. F, F, F, V. 4. Correta: F, V, F, V. Resposta correta 5. V, F, V, F. 5. Pergunta 5 0,5/0,5 Leia o trecho a seguir: “Ao obter a matriz de confusão, foi possível calcular as seguintes medidas de desempenho: precisão, sensibilidade, especificidade e acurácia. A matriz é de extrema relevância ao trabalho, pois com a sensibilidade permitiu avaliar a classificação correta dos doentes e a especificidade permitiu avaliar a classificação correta dos sadios.” Fonte: MEDEIROS, Leonardo et.al. Análise no desempenho de algoritmos de aprendizagem supervisionada na classificação da marcha em Parkinsonianos. Alagoas: UFAL, 2017. p. 5. Com base no texto e no que foi aprendido em relação à sensibilidade e à especificidade, analise as afirmativas a seguir: I. Sensibilidade é o nível de proporção dos itens serem positivos, tanto para doenças e cancelamentos, quanto para oportunidades. II. Especificidade é a divisão dos totais pelos negativos. III. Especificidade é o nível de proporção dos itens seres negativos, tanto para doenças e cancelamentos, quanto para oportunidades. IV. Sensibilidade é a divisão dos totais pelos positivos. Está correto apenas o que se afirma em: Ocultar opções de resposta 1. II e IV. 2. Correta: I e IV. Resposta correta 3. I e II. 4. II e III. 5. I e III. 6. Pergunta 6 0,5/0,5 Leia o trecho abaixo: “Aprendizado supervisionado: o usuário dispõe de um comportamento de referência preciso que ele deseja ensinar a rede. Sendo assim, a rede deve ser capaz de medir a diferença entre seu comportamento atual e o comportamento de referência, e então corrigir os pesos de maneira a reduzir este erro (desvio de comportamento em relação aos exemplos de referência). Fonte: OSÓRIO, Fernando. Redes neurais - Aprendizado artificial. Brasil, Porto Alegre: Unisinos, 2005. Disponível em: <http://osorio.wait4.org/oldsite/IForumIA/fia99.pdf> Acesso em: 20 dez. 2018. p. 91. Um exemplo de aprendizado supervisionado é: Ocultar opções de resposta 1. fazer perguntas aos clientes e, com base nas respostas, tomar decisões. 2. Correta: através de cálculos de receitas e despesas do cliente, que o banco libera ou não um empréstimo. Resposta correta 3. analisar os sentimentos de clientes para gerar combinações novas de respostas. 4. criar combinações novas, com base em respostas novas. 5. jogo ou vídeo que possuam um administrador manipulando as cenas. 7. Pergunta 7 0,5/0,5 Leia o trecho a seguir: “Pense cuidadosamente sobre quais dados você pode usar e como serão usados. Pense, especificamente, como a MegaTelCo deve escolher um conjunto de clientes para receber sua oferta a fim de melhor reduzir a rotatividade para uma verba de incentivo em particular? Responder a essa pergunta é muito mais complicado do que pode parecer inicialmente.” Fonte: FOSTER, Provost; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre mineração de dados e pensamento analítítico de dados? Rio de Janeiro: Altabooks, 2016, p. 4 Considerando essas informações e o conteúdo referente ao processo de análise de dados, ordene as etapas a seguir: ( ) Avaliação. ( ) Fonte de dados. ( ) Tratamento. ( ) Soluções. ( ) Análise. Agora, assinale a alternativa que apresenta a sequência correta: Ocultar opções de resposta 1. Correta: 4, 1, 3, 5, 2. Resposta correta 2. 2, 4, 3, 1, 5. 3. 1, 3, 5, 2, 4. 4. 5, 2, 4, 3, 1. 5. 2, 5, 1, 3, 4. 8. Pergunta 8 0,5/0,5 Leia trecho a seguir: “Expressões literais são aquelas cujo resultado da avaliação é um valor literal. Este tipo de expressão é bem menos freqüente que os anteriores. Os tipos de operadores existentes variam de uma linguagem de programação para outra, não havendo uma padronização. Para que o assunto não passe em branco, considere-se como exemplo a operaçãode concatenação de strings: toma-se duas strings e acrescenta- se (concatena-se) a segunda delas ao final da primeira. Em algumas linguagens esta operação é representada pelo símbolo (+).” Fonte: Moura Jonatas. Algoritmo - parte 1. Rio Grande do Norte: Departamento de Computação eAutomação. UFRN 2004, p. 20. A partir da leitura do texto e do conteúdo estudado a respeito de regressão logística e SPSS, pode-se dizer que: Ocultar opções de resposta 1. Len representa valor resultante de um cálculo. 2. Correta: concatenar é unir palavras com variáveis. Resposta correta 3. em python, a concatenação é feita com “;”. 4. resultados concatenados são exibidos com uso de System.out.println em pyhton. 5. a concatenação avalia gráficos. 9. Pergunta 9 0,5/0,5 Leia o trecho a seguir: “Uma variável é algo que você quer que o computador lembre enquanto seu programa estiver executando. Quando o Python se lembra de algo, é porque ele está armazenando esta informação no computador.” Fonte: PAINE, Bryson. Ensine seus filhos a formatar: Um guia amigável aos pais para a programação Python. São Paulo: Novatec, 2015. p. 32. As variáveis são “apelidos” que receberão algum valor. Ao referenciar esse apelido, o programador chama o valor recebido. Porém, para criar esses apelidos, é necessário seguir algumas regras. Analise as afirmações abaixo e assinale a alternativa correta. I. Duas variáveis com os apelidos cliente1 e cliente 4 são válidas. II. Uma variável com o apelido clienteespaco é válida. III. Uma variável com o apelido 3casa é válida. IV. Uma variável com o apelido cliente espaco3espaco é válida. Está correto apenas o que se afirma em: Ocultar opções de resposta 1. II e III. 2. I, II e IV. 3. I e II. 4. I, III e V. 5. Correta: II e IV. Resposta correta 10. Pergunta 10 0,5/0,5 Leia o trecho a seguir: “Banco de dados consiste em um conjunto de tabelas que podem ou não se relacionar entre si, e, em geral, são utilizadas por um ou vários sistemas de computadores que acessam essas tabelas tanto para incluírem novas informações quanto para consultá-las.”. Fonte: MYAGUSKU, Renata. Curso prático de SQL. São Paulo: Digerati Books, 2008, p. 6. A partir dessas informações e do conteúdo estudado a respeito de SQL, pode-se afirmar que: I.Dados SQL funcionam apenas off-line. II.SQL é uma linguagem usada para guardar dados. III.Sites de hospedagem possuem bancos de dados. IV.O acesso ao banco de dados pode ser feito via espaços de usuários web, em servidores como Hostnet, por exemplo. V.Hadoop e SQL são a mesma coisa. Está correto apenas o que se afirma em: Ocultar opções de resposta 1. II e V. 2. Correta: II, III e IV. Resposta correta 3. I, II e V. 4. I, III e IV. 5. III e V.
Compartilhar