Buscar

Data Science AV1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Data Science AV1 
Conteúdo do exercício 
1. Pergunta 1 
0,5/0,5 
Leia o trecho a seguir: 
“KNN é um método preguiçoso, no sentido de que nenhum modelo é aprendido com o treinamento. A 
idéia do KNN é extremamente simples e efetiva em várias aplicações.” 
Fonte: LIU, Bing. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Chicago: Springer, 
2008. p. 112. 
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V 
para a(s) verdadeira(s) e F para a(s) falsa(s). 
I. ( ) KNN estuda vizinhos mais próximos desde que menor que 10. 
II. ( ) O ideal é escolher K par. 
III. ( ) É possível calcular o melhor KNN, usando distâncias como a euclidiana, por exemplo. 
IV. ( ) A distância euclidiana mede a distância entre os valores dos dados. 
Agora, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
1. V, V, F, F. 
2. F, V, F, F. 
3. Correta: 
F, F, V, V. 
Resposta correta 
4. F, F, V, F. 
5. V, F, F, V. 
2. Pergunta 2 
0,5/0,5 
Leia o trecho a seguir: 
“A tarefa de agrupamento visa identificar e aproximar os registros similares. Um agrupamento (ou 
cluster) é uma coleção de registros similares entre si, porém diferente dos outros registros nos demais 
agrupamentos.” 
Fonte: SILVA, João; CAMILO, Cassio. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. 
Goiás: Instituto de Informática Universidade Federal de Goiás, 2009, p. 10. 
Analisando o texto e o conteúdo da disciplina referente à diferença entre sumarização e agrupamento, 
pode-se afirmar que: 
Ocultar opções de resposta 
1. O agrupamento analisa as particularidades de cada indivíduo, criando uma propaganda para 
cada pessoa. 
2. O agrupamento analisa principalmente as probabilidades, ignorando os fatos. 
3. O agrupamento analisa o histórico de cada cliente e isso é um grupo de fatos. 
4. O agrupamento analisa o preço de um produto ao longo do tempo e tenta estimar esse preço. 
5. Correta: 
O agrupamento analisa as decisões e pontos em comum de um público, a fim de criar produtos 
direcionados para esse micro público. 
Resposta correta 
3. Pergunta 3 
0,5/0,5 
Leia o trecho a seguir: 
“Por exemplo, um conceito fundamental é o de determinar a similaridade de duas entidades descritas 
pelos dados. Essa capacidade forma a base de várias tarefas específicas. Ela pode ser usada 
diretamente para encontrar clientes semelhantes em uma base de dados.” 
FOSTER, Provost e FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre 
mineração de dados e pensamento analítico de dados? Rio de Janeiro: Altabooks, 2016, p. XIV. 
A partir dessas informações e do conteúdo estudado a respeito das técnicas de correlações para 
análises de dados, pode-se afirmar que, além das semelhanças, uma outra correlação utilizada em 
análise supervisionada é: 
Ocultar opções de resposta 
1. filtro automático. 
2. Correta: 
regressão. 
Resposta correta 
3. sumarização. 
4. cluster. 
5. agrupamento. 
4. Pergunta 4 
0,5/0,5 
Leia o trecho a seguir: 
“Frequentemente, um armazenamento de dados fica extremamente ocupado, pois várias pessoas estão 
acessando partes diferentes do conjunto de dados. Nestas circunstâncias, podemos suportar a 
escalabilidade horizontal, colando partes diferentes dos dados em servidores diferentes.” 
Fonte: PRAMOD, Sadalage e FOWLER, Martim. NoSQL Essencial: Um guia conciso para o mundo 
emergente da persistência. São Paulo: Novatec, 2013, p. 74. 
Considerando essas informações e o conteúdo estudado, analise as afirmativas a seguir e assinale V 
para a(s) verdadeira(s) e F para a(s) falsa(s): 
I.( ) Escalabilidade é a capacidade de dados mudarem de valor. 
II.( ) Hoje em dia, vemos quantidades de dados exorbitantes, em terabytes. Por isso os sistemas 
necessitam de maior escalabilidade. 
III.( ) Tecnologias ligadas a mapas diminuíram a necessidade de escalabilidade. 
IV.( ) A velocidade de redes aumentada, devido à tecnologia, trouxe a necessidade de sistemas que 
suportassem mais dados. 
Agora, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
1. V, F, F, V. 
2. F, F, V, F. 
3. F, F, F, V. 
4. Correta: 
F, V, F, V. 
Resposta correta 
5. V, F, V, F. 
5. Pergunta 5 
0,5/0,5 
Leia o trecho a seguir: 
“Ao obter a matriz de confusão, foi possível calcular as seguintes medidas de desempenho: precisão, 
sensibilidade, especificidade e acurácia. A matriz é de extrema relevância ao trabalho, pois com a 
sensibilidade permitiu avaliar a classificação correta dos doentes e a especificidade permitiu avaliar a 
classificação correta dos sadios.” 
Fonte: MEDEIROS, Leonardo et.al. Análise no desempenho de algoritmos de aprendizagem 
supervisionada na classificação da marcha em Parkinsonianos. Alagoas: UFAL, 2017. p. 5. 
Com base no texto e no que foi aprendido em relação à sensibilidade e à especificidade, analise as 
afirmativas a seguir: 
I. Sensibilidade é o nível de proporção dos itens serem positivos, tanto para doenças e cancelamentos, 
quanto para oportunidades. 
II. Especificidade é a divisão dos totais pelos negativos. 
III. Especificidade é o nível de proporção dos itens seres negativos, tanto para doenças e 
cancelamentos, quanto para oportunidades. 
IV. Sensibilidade é a divisão dos totais pelos positivos. 
Está correto apenas o que se afirma em: 
Ocultar opções de resposta 
1. II e IV. 
2. Correta: 
I e IV. 
Resposta correta 
3. I e II. 
4. II e III. 
5. I e III. 
6. Pergunta 6 
0,5/0,5 
Leia o trecho abaixo: 
“Aprendizado supervisionado: o usuário dispõe de um comportamento de referência preciso que ele 
deseja ensinar a rede. Sendo assim, a rede deve ser capaz de medir a diferença entre seu 
comportamento atual e o comportamento de referência, e então corrigir os pesos de maneira a reduzir 
este erro (desvio de comportamento em relação aos exemplos de referência). 
Fonte: OSÓRIO, Fernando. Redes neurais - Aprendizado artificial. Brasil, Porto Alegre: Unisinos, 2005. 
Disponível em: <http://osorio.wait4.org/oldsite/IForumIA/fia99.pdf> Acesso em: 20 dez. 2018. p. 91. 
Um exemplo de aprendizado supervisionado é: 
Ocultar opções de resposta 
1. fazer perguntas aos clientes e, com base nas respostas, tomar decisões. 
2. Correta: 
através de cálculos de receitas e despesas do cliente, que o banco libera ou não um 
empréstimo. 
Resposta correta 
3. analisar os sentimentos de clientes para gerar combinações novas de respostas. 
4. criar combinações novas, com base em respostas novas. 
5. jogo ou vídeo que possuam um administrador manipulando as cenas. 
7. Pergunta 7 
0,5/0,5 
Leia o trecho a seguir: 
“Pense cuidadosamente sobre quais dados você pode usar e como serão usados. Pense, 
especificamente, como a MegaTelCo deve escolher um conjunto de clientes para receber sua oferta a 
fim de melhor reduzir a rotatividade para uma verba de incentivo em particular? Responder a essa 
pergunta é muito mais complicado do que pode parecer inicialmente.” 
Fonte: FOSTER, Provost; FAWCETT, Tom. Data Science para negócios: O que você precisa saber sobre 
mineração de dados e pensamento analítítico de dados? Rio de Janeiro: Altabooks, 2016, p. 4 
Considerando essas informações e o conteúdo referente ao processo de análise de dados, ordene as 
etapas a seguir: 
( ) Avaliação. 
( ) Fonte de dados. 
( ) Tratamento. 
( ) Soluções. 
( ) Análise. 
Agora, assinale a alternativa que apresenta a sequência correta: 
Ocultar opções de resposta 
1. Correta: 
4, 1, 3, 5, 2. 
Resposta correta 
2. 2, 4, 3, 1, 5. 
3. 1, 3, 5, 2, 4. 
4. 5, 2, 4, 3, 1. 
5. 2, 5, 1, 3, 4. 
8. Pergunta 8 
0,5/0,5 
Leia trecho a seguir: 
“Expressões literais são aquelas cujo resultado da avaliação é um valor literal. Este tipo de expressão é 
bem menos freqüente que os anteriores. Os tipos de operadores existentes variam de uma linguagem 
de programação para outra, não havendo uma padronização. Para que o assunto não passe em branco, 
considere-se como exemplo a operaçãode concatenação de strings: toma-se duas strings e acrescenta-
se (concatena-se) a segunda delas ao final da primeira. Em algumas linguagens esta operação é 
representada pelo símbolo (+).” 
Fonte: Moura Jonatas. Algoritmo - parte 1. Rio Grande do Norte: Departamento de Computação 
eAutomação. UFRN 2004, p. 20. 
A partir da leitura do texto e do conteúdo estudado a respeito de regressão logística e SPSS, pode-se 
dizer que: 
Ocultar opções de resposta 
1. Len representa valor resultante de um cálculo. 
2. Correta: 
concatenar é unir palavras com variáveis. 
Resposta correta 
3. em python, a concatenação é feita com “;”. 
4. resultados concatenados são exibidos com uso de System.out.println em pyhton. 
5. a concatenação avalia gráficos. 
9. Pergunta 9 
0,5/0,5 
Leia o trecho a seguir: 
“Uma variável é algo que você quer que o computador lembre enquanto seu programa estiver 
executando. Quando o Python se lembra de algo, é porque ele está armazenando esta informação no 
computador.” 
Fonte: PAINE, Bryson. Ensine seus filhos a formatar: Um guia amigável aos pais para a programação 
Python. São Paulo: Novatec, 2015. p. 32. 
As variáveis são “apelidos” que receberão algum valor. Ao referenciar esse apelido, o programador 
chama o valor recebido. Porém, para criar esses apelidos, é necessário seguir algumas regras. Analise 
as afirmações abaixo e assinale a alternativa correta. 
I. Duas variáveis com os apelidos cliente1 e cliente 4 são válidas. 
II. Uma variável com o apelido clienteespaco é válida. 
III. Uma variável com o apelido 3casa é válida. 
IV. Uma variável com o apelido cliente espaco3espaco é válida. 
Está correto apenas o que se afirma em: 
Ocultar opções de resposta 
1. II e III. 
2. I, II e IV. 
3. I e II. 
4. I, III e V. 
5. Correta: 
II e IV. 
Resposta correta 
10. Pergunta 10 
0,5/0,5 
Leia o trecho a seguir: 
“Banco de dados consiste em um conjunto de tabelas que podem ou não se relacionar entre si, e, em 
geral, são utilizadas por um ou vários sistemas de computadores que acessam essas tabelas tanto para 
incluírem novas informações quanto para consultá-las.”. 
Fonte: MYAGUSKU, Renata. Curso prático de SQL. São Paulo: Digerati Books, 2008, p. 6. 
A partir dessas informações e do conteúdo estudado a respeito de SQL, pode-se afirmar que: 
I.Dados SQL funcionam apenas off-line. 
II.SQL é uma linguagem usada para guardar dados. 
III.Sites de hospedagem possuem bancos de dados. 
IV.O acesso ao banco de dados pode ser feito via espaços de usuários web, em servidores como 
Hostnet, por exemplo. 
V.Hadoop e SQL são a mesma coisa. 
Está correto apenas o que se afirma em: 
Ocultar opções de resposta 
1. II e V. 
2. Correta: 
II, III e IV. 
Resposta correta 
3. I, II e V. 
4. I, III e IV. 
5. III e V.

Continue navegando