Buscar

Aprendizado de Máquinas e Visualização de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Curso
	POS0776 INTELIGÊNCIA ANALÍTICA PG0968211 - 202112.ead-15437.01
	Teste
	Teste Final (N2)
	Iniciado
	22/05/21 10:27
	Enviado
	23/05/21 08:41
	Status
	Completada
	Resultado da tentativa
	10 em 10 pontos  
	Tempo decorrido
	22 horas, 13 minutos
	Resultados exibidos
	Respostas enviadas, Respostas corretas, Comentários
· Pergunta 1
1 em 1 pontos
	
	
	
	Leia a seguinte citação a respeito do aprendizado supervisionado:
“O aprendizado supervisionado ocorre quando um algoritmo aprende a partir de dados de exemplo e respostas-alvo associadas que consistem de valores numéricos ou rótulos de string, como classes ou etiquetas, para prever a resposta correta diante de novos exemplos. A estratégia supervisionada é semelhante à aprendizagem humana sob a supervisão de um professor.”
Fonte: MUELLER, J.; MASSARON, Luca. Aprendizado de Máquinas. Rio de Janeiro: Alta Books. 2019, p.
Considerando o exposto e sobre os algoritmos de aprendizado supervisionado, analise as afirmativas a seguir.
I. Algoritmos de K-vizinhos mais próximos são usados no aprendizado supervisionado, com o objetivo de relacionar dados, por exemplo, categorizar músicas por gênero, artista e editor.
II. Algoritmos de regressões lineares são exemplos de aprendizado supervisionado usados para prever o valor de mercado de uma empresa com base na localização ou setor.
III. O agrupamento ou clustering é um processo de aprendizado supervisionado que organiza itens semelhantes e diferentes, porém, identificando relacionamentos entre os dados.
IV. A aprendizagem por regras de associação é um algoritmo de aprendizagem supervisionado para pesquisadores de mercado na busca de relacionamento de dados.
 
Está correto o que se afirma em:
	
	
	
	
		Resposta Selecionada:
	 
I e II, apenas.
	Resposta Correta:
	 
I e II, apenas.
	Comentário da resposta:
	Resposta correta. A alternativa está correta. Algoritmos de K-vizinhos mais próximos em vez de obter informações complexas a partir dos dados, eles estabelecem relações entre itens semelhantes, conforme o exemplo da música citado. Regressões lineares são algoritmos preveem o valor de uma variável desconhecida analisando outras variáveis.
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	A empresa Netfit, atuante na área de entretenimento via streaming, deseja segmentar seus clientes em grupos distintos para enviar ofertas de assinatura apropriadas. O objetivo principal é enviar ofertas específicas para o público correto, evitando assim despender tempo em realizar ação de marketing para um público que não consumirá o seu produto. Esta segmentação e o envio das ofertas ocorrerá no próximo ano e, com isso, espera-se que as vendas aumentem em 40%.
A partir do caso apresentado e do conteúdo estudado sobre mineração de dados e aprendizagem de máquina, podemos dizer corretamente que o caso acima é um exemplo de:
	
	
	
	
		Resposta Selecionada:
	 
Aprendizado supervisionado.
	Resposta Correta:
	 
Aprendizado supervisionado.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, a empresa deseja segmentar seus clientes em grupos distintos para enviar ofertas de assinatura apropriadas. Como temos os rótulos dos dados (nome, idade, sexo, formação, etc) e a empresa deseja enviar as ofertas para grupos distintos (todos os homens entre 20 e 30 anos, por exemplo), então temos dados para treinar o algoritmo supervisionado para que, com apoio desta base de conhecimento, o sistema possa concluir para qual grupo irá cada uma das ofertas.
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	Segundo o Fórum Econômico Mundial, o mundo produz 2,5 quintilhões de bytes de dados todos os dias. Com tantos dados, tornou-se cada vez mais difícil gerenciar e entender tudo. Seria impossível para uma única pessoa percorrer os dados linha por linha e ver padrões distintos e fazer observações. A proliferação de dados pode ser gerenciada como parte do processo de ciência de dados, que inclui o conceito de Data Visualization ou Visualização de Dados.
Fonte: THIRANI, V.; GUPTA, A. The value of data . 22 set. 2017. Disponível em: https://www.weforum.org/agenda/2017/09/the-value-of-data/ . Acesso em: 10 fev. 2020.
De acordo com o seu conhecimento adquirido durante os estudos e os conceitos e ferramentas de Data Visualization , assinale a alternativa correta em relação aos tipos e exemplos de visualização de dados.
	
	
	
	
		Resposta Selecionada:
	 
Distribuição de Frequência: Histogramas e Gráficos de Caixa.
	Resposta Correta:
	 
Distribuição de Frequência: Histogramas e Gráficos de Caixa.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, são exemplos de gráficos de distribuição de frequência o histograma e os gráficos de caixa. Os histogramas plotam o número de vezes que um evento ocorre em um determinado conjunto de dados e são apresentados em um formato de gráfico de barras. Os gráficos de caixa são visualizações não paramétricas que exibem uma medida de dispersão.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	Em 11 de março de 2011, um terremoto de magnitude 8,9 atingiu a costa do Japão, sacudindo uma região de 800 quilômetros e provocando um tsunami. Este foi um dos maiores terremotos já registrados no país. Com base nisso, pesquisadores reuniram os dados referente aos abalos sísmicos dos últimos 100 meses no Japão e agora desejam prever a magnitude do próximo terremoto.
Considerando as informações apresentadas e com base nos conteúdos estudados, podemos inferir que o caso apresentado é um exemplo de:
	
	
	
	
		Resposta Selecionada:
	 
Aprendizagem supervisionada
	Resposta Correta:
	 
Aprendizagem supervisionada
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, o aprendizado supervisionado refere-se a uma classe de sistemas e algoritmos que determinam um modelo preditivo usando pontos de dados com resultados conhecidos. Como os pesquisadores já possuem os dados e, a partir deles desejam realizar uma predição, logo, temos o conceito de aprendizado supervisionado.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	OLAP é uma abordagem para obter respostas para consultas multidimensionais. É usado no campo do BI para análises e relatórios sobre grandes quantidades de dados de várias fontes de dados. Os dados são coletados de várias fontes de dados e organizados na forma de cubos. Um cubo OLAP é um conjunto de dados estruturado que contém várias dimensões e medidas. Uma dimensão é uma maneira de categorizar fatos. Por exemplo, o total de vendas pode ser categorizado em dimensões como região e tempo.
De acordo com o conhecimento adquirido durante seus estudos, marque a alternativa correta a respeito de ETL.
	
	
	
	
		Resposta Selecionada:
	 
na fase de transformação, os dados carregados são modificados e seus valores são adequados ao modelo do data warehouse.
	Resposta Correta:
	 
na fase de transformação, os dados carregados são modificados e seus valores são adequados ao modelo do data warehouse.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois transformação é o processo de conversão dos dados extraídos do formato anterior para o formato exigido por outro banco de dados. A transformação ocorre usando regras ou tabelas de pesquisa ou combinando os dados com outros dados. Por exemplo, cálculo em que os valores monetários são convertidos de dólares americanos para euros.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	No “coração” do processo de mineração de dados, você apresentará os dados preparados às ferramentas de business intelligence (BI), como Tableau Server ou Microsoft Power BI. Essas ferramentas usarão diferentes algoritmos para extrair padrões a partir destes dados e prever tendências futuras.
De posse dos seus conhecimentos adquiridos durante os estudos e da informação apresentada, considere os diversos tipos de algoritmos utilizados para minerar dados. Dentre estes algoritmos, assinale a alternativa que apresenta aquele cuja técnica é utilizada para classificação, regressão e segmentação de dados de séries temporais:Resposta Selecionada:
	 
Redes neurais.
	Resposta Correta:
	 
Redes neurais.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois as redes neurais são usadas para modelar relacionamentos complexos entre entradas e saídas ou para encontrar padrões nos dados. As tarefas desempenhadas por um algoritmo de rede neural são de classificação, regressão e segmentação de dados heterogêneos.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	O algoritmo Apriori é uma sequência de etapas a serem seguidas para encontrar o conjunto de itens mais frequente no banco de dados fornecido. Essa técnica de mineração de dados segue as etapas de junção e remoção, iterativamente, até que o conjunto de itens mais frequente seja alcançado. Um limite mínimo de suporte é fornecido no problema ou é assumido pelo usuário.
De posse do seu conhecimento e de acordo com o conteúdo estudado, você viu que existem muitos métodos e técnicas disponíveis para melhorar a eficiência do algoritmo apriori, dentre eles podemos citar (marque a alternativa correta):
	
	
	
	
		Resposta Selecionada:
	 
Particionamento .
	Resposta Correta:
	 
Particionamento.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois a técnica de particionamento é um método que requer apenas duas varreduras de banco de dados para explorar os conjuntos de itens frequentes. Ele diz que, para qualquer conjunto de itens ser potencialmente frequente no banco de dados, deve ser frequente em pelo menos uma das partições do banco de dados.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	Considere o seguinte caso:
Uma empresa vendedora de produtos de praia deseja analisar a quantidade de vendas do produto “bola de praia”, na cidade de Florianópolis, no mês de fevereiro do ano passado pelo vendedor José Camilo, comparada com os números de receita com o mesmo produto em fevereiro deste ano na mesma cidade e, em seguida, fazer uma comparação de outras vendas do mesmo produto em Florianópolis no mesmo período, com o objetivo de realizar uma previsão de vendas bem como outros planejamentos.
Considerando o caso apresentado e o conteúdo estudado, assinale a alternativa que indica a melhor ferramenta a ser utilizada por essa empresa para esta ação.
	
	
	
	
		Resposta Selecionada:
	 
OLAP.
	Resposta Correta:
	 
OLAP.
	Comentário da resposta:
	Resposta correta. A alternativa está correta, pois, o OLAP (processamento analítico on-line) é um método de computação que permite aos usuários extrair e consultar dados de maneira fácil e seletiva, a fim de analisá-los sob diferentes pontos de vista. As consultas de OLAP geralmente ajudam na análise de tendências, relatórios financeiros, previsão de vendas, orçamento e outros fins de planejamento.
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	Leia a seguinte citação a respeito do aprendizado supervisionado:
“O aprendizagem não supervisionada ocorre quando um algoritmo aprende a partir de exemplos claros, sem nenhuma resposta associada, deixando o algoritmo determinar os padrões de dados por conta própria. Esse tipo de algoritmo tende a reestruturar os dados em algo diferente, como novas características que representam uma classe ou uma nova série de valores não correlacionados.”
Fonte: MUELLER, J.; MASSARON, Luca. Aprendizado de Máquinas. Rio de Janeiro: Alta Books. 2019, p
 
De acordo com o seu conhecimento adquirido durante os estudos, marque a alternativa que, corretamente, apresenta um algoritmo do aprendizado não supervisionado.
	
	
	
	
		Resposta Selecionada:
	 
Aprendizagem por regras de associação.
	Resposta Correta:
	 
Aprendizagem por regras de associação.
	Comentário da resposta:
	Resposta correta.  A alternativa está correta, pois aprendizagem de regras de associação é um algoritmo popular para pesquisadores de mercado. O aprendizado de associação procura relacionamentos interessantes entre variáveis ​​em conjuntos de dados massivos para revelar itens que ocorrem frequentemente juntos.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	É fácil confundir um data warehouse com um banco de dados, pois os dois conceitos compartilham algumas semelhanças. A principal diferença, no entanto, entra em vigor quando uma empresa precisa executar análises em uma grande coleta de dados. Os data warehouses
são criados para lidar com esse tipo de tarefa, enquanto os bancos de dados não.
 De acordo com o conhecimento adquirido durante seus estudos, assinale a alternativa que corretamente apresenta o tipo de integração de dados provenientes de várias fontes.
	
	
	
	
		Resposta Selecionada:
	 
ETL.
	Resposta Correta:
	 
ETL.
	Comentário da resposta:
	 Resposta correta. A alternativa está correta, pois ETL é um tipo de integração de dados que se refere às três etapas (extrair, transformar, carregar) usadas para integrar (misturar) dados de várias fontes. É frequentemente usado para construir um data warehouse. Durante esse processo, os dados são obtidos (extraídos) de um sistema de origem, convertidos (transformados) em um formato que pode ser analisado e armazenados (carregados) em um data warehouse ou outro sistema.
	
	
	
Domingo, 23 de Maio de 2021 08h45min23s BRT