Buscar

machine learning a2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 1/6
Minhas Disciplinas 222RGR1960A - MACHINE LEARNING UNIDADE 2 Atividade 2 (A2)
Iniciado em terça, 29 nov 2022, 10:51
Estado Finalizada
Concluída em domingo, 4 dez 2022, 17:38
Tempo
empregado
5 dias 6 horas
Avaliar 9,00 de um máximo de 10,00(90%)
Questão 1
Correto
Atingiu 1,00 de 1,00
Temos redundância de dados quando dois atributos possuem os mesmos valores ou valores muito parecidos, sendo que tal situação pode
ocorrer por conta dos mais diversos motivos. Para identificá-la, podemos utilizar a análise de correlação, técnicas manuais ou, ainda, a
análise de componentes principais ou PCA (Principal Component Analysis). Uma das questões que deve ser atacada na etapa de
integração de dados é a redundância de dados. 
 
Sobre a etapa de integração de dados e seus problemas, considere as afirmações a seguir. 
 
I. ( ) Um dos fatores que pode resultar em redundância de dados é o uso de nomenclaturas diferentes para atributos equivalentes, mas
originadas de fontes de dados distintas. 
II. ( ) Pode ocorrer redundância de dados em razão da inclusão de exemplares repetidos no conjunto de dados. 
III. ( ) Quando temos redundância de dados é interessante efetuar uma redução do conjunto de dados. 
IV. ( ) É considerada uma boa prática armazenar atributos do tipo derivado (valores que são previstos a partir de valores de outros
atributos). Tal prática resulta na redução do conjunto de dados. 
 
Está correto o que se afirma em:
a. F, V, F, V.
b. V, V, F, F.
c. V, V, V, F.
d. V, F, V, F.
e. F, F, F, V.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/my/
https://ambienteacademico.com.br/course/view.php?id=18504
https://ambienteacademico.com.br/course/view.php?id=18504&section=3
https://ambienteacademico.com.br/mod/quiz/view.php?id=521120
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 2/6
Questão 2
Correto
Atingiu 1,00 de 1,00
Questão 3
Correto
Atingiu 1,00 de 1,00
A análise de componentes principais é uma técnica na qual um conjunto de variáveis é reescrito por meio de transformações lineares em
outro conjunto de variáveis que recebe o nome de componentes principais. O propósito da PCA é reduzir a dimensão da massa de dados,
mas reduzindo, ao máximo, a perda de informação. 
Em relação à técnica PCA, considere as afirmações a seguir. 
I. ( ) A PCA é uma técnica que utiliza álgebra de Lie e, portanto, apresenta elevado custo computacional. 
II. ( ) A técnica de PCA pode ser aplicada exclusivamente a bases de dados com duas dimensões. 
III. ( ) PCA tem como uma de suas características permitir a identificação de padrões ocultos nos dados. 
IV. ( ) A PCA implementa uma correlação entre as variáveis. 
 
Assinale a alternativa que apresenta a sequência correta.
a. F, V, V, F.
b. V, V, F, F.
c. F, F, V, V.
d. F, V, F, V.
e. V, F, F, V.
Se temos uma base de dados na qual os indivíduos possuem rótulos com os quais podemos treinar modelos no conceito de aprendizagem
supervisionada, então, poderemos desenvolver um modelo preditivo. Modelos preditivos costumam ser classificados em modelos de
predição discreta e contínua. 
 
Assinale a alternativa correta sobre predição discreta e contínua.
a. Um exemplo de predição discreta é prever, com base no per�l do cliente (se está empregado ou desempregado, se é
homem ou mulher, faixa salarial, idade, se possui ou não �lhos, escolaridade etc.), se o indivíduo pagará ou não a dívida
contratada.

b. Na predição contínua, é bastante frequente o uso de árvores de decisão ou regras de classi�cação, nas quais estimamos o
valor de uma variável dentre dois possíveis valores do do tipo sim ou não.
c. Como exemplo de predição discreta podemos destacar a quantidade de pessoas que usa transporte coletivo na Região
Metropolitana de São Paulo, no horário de pico da manhã, em um dia útil da semana.
d. A predição discreta também recebe o nome de "estimação", fazendo a predição de valores contínuos de uma variável, sendo
exemplos de predição discreta a regressão logística, a regressão ridge e a regressão linear.
e. Um exemplo de predição contínua é um modelo preditivo que, com base em características dos pacientes (peso, idade, sexo,
se pratica ou não atividade física), fornece as probabilidades de o indivíduo ter ou não um infarto.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 3/6
Questão 4
Correto
Atingiu 1,00 de 1,00
Questão 5
Correto
Atingiu 1,00 de 1,00
A tarefa de classificação é a tarefa que possui a maior quantidade de algoritmos na Mineração de Dados. Na classificação, pretende-se
determinar a classe de um objeto em uma base de dados. Os algoritmos de agrupamento pretendem particionar um conjunto de dados em k
grupos. Como exemplos de algoritmos de agrupamento, temos o k-médias, o k-medoid, o DBSCAN e o Hierárquico. 
 
A respeito da classificação, agrupamento, predição discreta e contínua, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s)
e F para a(s) falsa(s). 
 
I. ( ) Um exemplo de predição contínua é prever, com base em características do viajante (sexo, renda familiar, posse de automóvel), se ele
vai utilizar automóvel (transporte individual) ou ônibus (transporte coletivo). 
II. ( ) Algoritmos de agrupamento caracterizam-se por agruparem os dados por similaridade. São exemplos recorrentes de aprendizado não
supervisionado. 
III. ( ) As árvores de decisão constituem uma das mais difundidas famílias de classificadores. A classificação é considerada predição
discreta. 
IV. ( ) Tarefas de classificação podem ser consideradas como casos particulares de uma estimação na qual a variável resposta é discreta.
Assim, qualquer algoritmo de estimação pode ser utilizado na classificação. 
Assinale a alternativa que apresenta a sequência correta.
a. V, F, V, F.
b. F, F, V, V.
c. F, V, V, V.
d. V, F, F, F.
e. V, V, F, F.
Como não existem rótulos ou classes na tarefa de clusterização, ela é uma tarefa de aprendizado não supervisionado. Logo, após as
tarefas de classificação e regressão em grau de utilização na mineração de dados, temos a clusterização. A clusterização tem por objetivo a
identificação automática dos rótulos em uma base de dados. 
 
A respeito de algoritmos de agrupamento de dados é correto afirmar que:
a. O k-médias particiona o conjunto em k grupos tal que a similaridade entre os objetos do grupo seja a mais baixa possível
b. Encontrar o medoide signi�ca determinar o ponto no cluster, tal que as dissimilaridades com todos os outros pontos
desse cluster sejam mínimas.

c. O k-means possui um número de passos para convergir limitado pelo tamanho do conjunto a ser particionado.
d. O algoritmo medoide apresenta característica determinística no seu processo, não possuindo nenhum elemento de
aleatoriedade.
e. No algoritmo medoide, não temos como parâmetro de entrada o parâmetro k associado ao número de grupos que se deseja
obter.
Guia Digital Carreiras e InternacionalizaçãoNAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 4/6
Questão 6
Correto
Atingiu 1,00 de 1,00
Questão 7
Correto
Atingiu 1,00 de 1,00
Existem diversas classificações das tarefas da Mineração de Dados. Alguns autores dividem as tarefas de Mineração de Dados em
preditivas e descritivas. Outros autores dividem as tarefas de Mineração de Dados em classificação e regressão; mineração de padrões
frequentes, associações e correlações, análise de agrupamentos e estudos sobre outliers. 
 
Sobre os modelos e técnicas de aprendizado preditivo e descritivo, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F
para a(s) falsa(s). 
 
I. ( ) As técnicas de aprendizado preditivo tem por objetivo desenvolver modelos e gerar conhecimento a partir de bases de dados e
experiências anteriores que possam ser utilizadas no futuro. 
II. ( ) Tarefas descritivas seguem o paradigma de aprendizado não supervisionado, de tal forma que busca-se uma função a qual, a partir de
dados passados ou de treinamento, permita sua utilização para prever valores no futuro ou a previsão de um rótulo. 
III. ( ) Algoritmos de aprendizado preditivo estão associados à hipótese por indução, seguindo o paradigma de aprendizado não
supervisionado e buscando regras de associação que relacionam um grupo de atributos a outro grupo de atributos. 
IV. ( ) As tarefas preditivas são divididas em tarefas de classificação e regressão. As tarefas de classificação são chamadas de predição
discreta e as tarefas de regressão são chamadas de predição contínua. 
 
Assinale a alternativa que apresenta a sequência correta.
a. F, V, V, F.
b. V, V, F, F.
c. V, F, F, V.
d. V, F, V, F.
e. F, F, V, V.
O termo agrupamento é utilizado quando se estuda a similaridade entre objetos de uma base de dados, objetivando determinar como eles
estão organizados em um número de grupos. Em um agrupamento, busca-se particionar a base de dados em k grupos. Existem estratégias
de agrupamento denominadas de hierárquicas e não hierárquicas. Costuma-se denominar classificação o processo de determinar uma
função que indica a qual classe pertence um objeto de uma base de dados sob estudo. 
 
Sobre aprendizado não supervisionado, clusterização e classificação, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e
F para a(s) falsa(s). 
 
I. ( ) O agrupamento ou clusterização tem por objetivo a organização dos objetos em categorias de acordo com alguma métrica de
similaridade ou distância. 
II. ( ) Nos algoritmos de classificação, a base não possui rótulos, sendo que cada objeto da base possui uma classe correspondente. 
III. ( ) O objetivo dos algoritmos de classificação é identificar a classe à qual pertence um novo objeto ainda não apresentado e com rótulo
desconhecido. 
IV. ( ) Na clusterização ou agrupamento, o objetivo é segmentar a base de dados (que já vem rotulada) em grupos com algum significado. 
 
Assinale a alternativa que apresenta a sequência correta.
a. V, V, F, F.
b. F, F, V, V.
c. V, F, V, F.
d. V, V, F, F.
e. F, V, F, V.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 5/6
Questão 8
Correto
Atingiu 1,00 de 1,00
Questão 9
Incorreto
Atingiu 0,00 de 1,00
A linguagem R é uma linguagem orientada a objetos, de código livre, de acesso gratuito e com uma comunidade mundial (e brasileira) de
colaboradores que desenvolve os chamados pacotes (packages) voltados à resolução de problemas específicos da Estatística, Ciência de
Dados e Machine Learning. Em maio de 2021, a linguagem R possuía mais de 17.000 pacotes em seu repositório oficial. 
 
THE R Project for Statistical Computing. R-project, [2021]. Disponível em: https://www.r-project.org/. Acesso em: 10 jun. 2021. 
 
Considere a utilização do software R para aplicar o algoritmo k-médias a um conjunto de dados e assinale a alternativa correta.
a. O k-médias tem como uma de suas principais características trabalhar por meio de técnica de re�namento iterativo.
b. Nos algoritmos de agrupamento, os objetos são considerados como saída (variáveis resposta) e possuem rótulos associados.
c. Para rodar k-médias no R, usamos a função k-means do pacote stats. Nesta implementação do k-médias, não é necessário
entrar com o número de clusters.
d. Na classi�cação, os registros não estão associados a rótulos pré-de�nidos. Como exemplo, podemos citar as árvores
aleatórias.
e. Dada a grande �exibilidade do software R, com a função k-means também podemos rodar o algoritmo de agrupamento
medoide.
A Análise de Componentes Principais (também conhecida por Método K-L ou Karhunen-Loève) é uma técnica que faz uso de elementos da
Álgebra Linear (vetores, autoespaços, autovetores e autovalores de uma matriz). Na abordagem da Análise de Componentes Principais,
cada observação na base de dados é um vetor com um certo número k de dimensões. 
 
Assinale a alternativa correta a respeito da técnica de análise de componentes principais.
a. Pode ser aplicada apenas a conjuntos de dados numéricos com até duas dimensões.
b. É uma técnica estatística de elevado custo computacional. 
c. É uma técnica para reduzir a dimensionalidade por meio da redução de redundância de dados.
d. É uma técnica que pode elevar a redundância dos dados.
e. Pode ser aplicada somente a conjuntos de dados qualitativos.
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://www.r-project.org/
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade
04/12/2022 17:38 Atividade 2 (A2): Revisão da tentativa
https://ambienteacademico.com.br/mod/quiz/review.php?attempt=1479292&cmid=521120 6/6
Questão 10
Correto
Atingiu 1,00 de 1,00
Enquanto nos algoritmos classificadores temos um atributo (classe) para o qual devemos efetuar a previsão a partir dos outros atributos,
nos algoritmos de agrupamento não existe esse atributo ou classe. Assim, os dados nesse tipo de situação não apresentam uma
característica que constitua o objetivo de previsão. 
 
Considerando os algoritmos fuzzy k-médias, k-médias e medoide, e métodos baseados em particionamento, assinale a alternativa correta.
a. O método baseado no particionamento é pautado na teoria dos grafos (árvores geradoras mínimas), sendo que ele impõe
uma forma aos grupos.
b. O algoritmo fuzzy k-médias é uma extensão do algoritmo k-médias, sendo que, no algoritmo fuzzy k-médias, um objeto
pode pertencer a mais de um grupo.

c. Tanto no fuzzy k-médias quanto no medoide um objeto pode pertencer a mais de um grupo. Apenas no fuzzy k-médias este
grau de pertinência é de�nido pelo analista.
d. O processo de agrupamento é bastante similar à análise discreta. Em ambos, utilizamos a distribuição de frequência para
classi�car os objetos.
e. O algoritmo k-means não foi completo e totalmente implementado até a última versão dosoftware R publicada em maio de
2021.
◄ Compartilhe
Seguir para...
Revisão Atividade 2 (A2) ►
Guia Digital Carreiras e Internacionalização NAP CPA Responsabilidade Socioambiental
https://ambienteacademico.com.br/mod/forum/view.php?id=521115&forceview=1
https://ambienteacademico.com.br/mod/quiz/view.php?id=521121&forceview=1
https://codely-fmu-content.s3.amazonaws.com/Moodle/GuiaDigital/Guia+digital/index.html
https://informa.fmu.br/carreiras/
https://codely-fmu-content.s3.amazonaws.com/Moodle/NAP/inicial/nap/fmu/index.html
https://codely-fmu-content.s3.amazonaws.com/Moodle/CPA/landing_CPA/index.html
https://portal.fmu.br/sustentabilidade

Continue navegando