gabarito -machine learning I Uniasselvi

0

1

Robespierre Silva

14/04/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Ciência de Dados

3.578 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

MACHINE LEARNING I – 
CLASSIFICAÇÃO E REGRESSÃO
2020
Prof. Rodrigo Ramos Nogueira
GABARITO DAS 
AUTOATIVIDADES
2
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
UNIDADE 1
TÓPICO 1 
1 Leia o texto a seguir: 
Os sistemas de Machine learning, em português conhecidos como sis-
tema de aprendizagem automática ou sistemas de aprendizado de 
máquina, podem ajudar a descobrir padrões, realizar determinadas 
tarefas através da generalização de casos e na utilização de dados.
FONTE: OLIVEIRA, P. M. M. de. Benchmarking sobre técnicas de otimização para 
modelos de apoio à decisão na medicina intensiva. 2015. Tese de Doutorado.
Os algoritmos de aprendizado de máquina têm um modo de 
aprendizado que depende de um especialista externo para avalizar 
seus resultados. Assinale a alternativa CORRETA que contenha 
esse modo: 
a) ( ) Aprendizado por reforço.
b) ( ) Aprendizado supervisionado.
c) (X) Aprendizado não supervisionado.
d) ( ) Aprendizado por inteligência.
2 Leia o texto a seguir: 
Os algoritmos de Machine learning podem ser aplicados para uma 
larga gama de situações problema, desde detecção de fraudes fiscais, 
até recomendações, porém isso só pode ser feito devido à grande 
quantidade de dados fornecidas pelos datasets.
FONTE: FREITAS, D. W. Recomendação de animes utilizando Machine learning: 
uma abordagem baseada em avaliações dos usuários. Engenharia da Computação, 
2018.
Com relação aos algoritmos de Machine learning, assinale a 
alternativa CORRETA que contenha os paradigmas de aprendizado:
3
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
a) (X) Simbólico, estatístico, conexionista e genético.
b) ( ) Supervisionado, estatístico, conexionista e genético.
c) ( ) Simbólico, estático, conexionista e genético.
d) ( ) Simbólico, estatístico, colaborador e georreferenciado.
3 A internet soma mais de 2 bilhões de sites publicados, sendo 
a principal fonte de informação deste século. No entanto, cada 
vez mais opções de sites implicam diversos veículos que não 
produzem notícias verdadeiras, as ditas fakes news. O sistema 
desenvolvido por Monteiro, Nogueira e Moser (2019) tem como 
objetivo implementar um algoritmo de Machine Leaning para 
classificar notícias em reais e fake news.
FONTE: MONTEIRO, R.; NOGUEIRA, R.; MOSER, G. Desenvolvimento de um sis-
tema para a classificação de Fakenews acoplado à etapa de ETL de um Data Wa-
rehouse de Textos de Notícias em língua Portuguesa. In: Anais da XV Escola Regio-
nal de Banco de Dados. SBC, 2019. p. 131-140. Disponível em: https://sol.sbc.org.
br/index.php/erbd/article/view/8486/8387. Acesso em: 2 out. 2020.
Sobre o problema de Machine learning apresentado no enunciado, 
indique a experiência, a tarefa e a medida de desempenho. 
R.: E: experiência com as notícias armazenadas e identificadas (re-
ais e fake news); T: a tarefa é de categorizar as notícias; P: a medida 
de desempenho é a porcentagem de mensagens de bots corretamente 
classificadas.
4
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
4 Leia o texto a seguir: 
A lucratividade promovida pelo Google em sua nova plataforma 
de distribuição de vídeos do YouTube atraiu um número crescente 
de usuários. No entanto, esse sucesso também atraiu usuários mal-
intencionados, que têm como objetivo autopromover seus vídeos ou 
disseminar vírus e malwares. Como o YouTube oferece ferramentas 
limitadas para moderação de comentários, o volume de spam 
aumenta surpreendentemente, o que leva os proprietários de canais 
famosos a desativar a seção de comentários em seus vídeos.
FONTE: ALBERTO, T. C.; LOCHTER, J. V.; ALMEIDA, T. A. TubeSpam: Comment 
spam filtering on YouTube. In: 2015 IEEE 14th International Conference on Machine 
learning and Applications (ICMLA). IEEE, 2015. p. 138-143. Disponível em: http://
www.dt.fee.unicamp.br/~tiago/papers/TCA_ICMLA15.pdf. Acesso em: 2 out. 2020.
No trabalho descrito pelo texto, foram implementados algoritmos 
de Machine learning para a detecção de comentários de publicidade 
(spam) em vídeos da internet. Sobre o problema de Machine learning 
apresentado, indique a experiência, a tarefa e a medida de desempenho. 
R.: E: experiência com histórico de várias mensagens anteriores cor-
retamente identificadas (spam ou não); T: tarefa de categorizar os co-
mentários como spam; P: a medida de desempenho é a porcentagem 
de mensagens corretamente classificadas
5 Os algoritmos de Machine learning têm seu aprendizado baseado 
em dados históricos e diversas aplicações: agricultura de precisão, 
reconhecimento de imagem, classificação de textos, desenvolvimento 
de chatbots. Torna-se difícil um setor do novo modelo tecnológico 
que não utilize suas técnicas. Sobre Machine learning, assinale a 
alternativa CORRETA que contenha as tarefas de aprendizado:
 
a) ( ) Classificação, revolução, agrupamento e associação.
b) (X) Classificação, regressão, agrupamento e associação.
c) ( ) Categorização, regressão, análise e dissociação.
d) ( ) Classificação, regressão, agrupamento e dissociação.
5
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
TÓPICO 2
1 Leia o texto a seguir: 
Machine learning pode ser utilizado para vários objetivos, para ofertar 
programação de acordo com sua utilização na Netflix, saber o que 
estão falando sobre sua marca no Twitter e detecção de fraudes em 
compras com cartão de crédito, por exemplo.
FONTE: STAUDT, J. M. Machine learning para análise do desgaste da força de tra-
balho. Monografia (Sistemas de Informação). Novo Hamburgo: Universidade Feeva-
le, 2017. Disponível em: https://tconline.feevale.br/NOVO/tc/files/0002_4351.pdf. 
Acesso em: 2 out. 2020
Assinale a alternativa CORRETA que contenha uma linguagem 
de programação que pode ser utilizada para desenvolvimento de 
algoritmos de Machine learning:
a) ( ) Matlab.
b) ( ) Python.
c) ( ) Java.
d) (X) Todas as alternativas.
2 No desenvolvimento de programas que aplicam algoritmos de 
Machine learning, a linguagem Python tem sido muito utilizada, 
principalmente pelo seu grande número de bibliotecas e pela 
participação da comunidade em sua evolução. Dentro do Python, 
o PIP tem uma importante contribuição. Assinale a alternativa 
CORRETA sobre o PIP: 
 
a) (X) O PIP é o gerenciador de pacotes do Python.
b) ( ) O PIP é o gerenciador de arquivos do Python.
c) ( ) O PIP é a linguagem de programação do Python.
d) ( ) O PIP é o sistema operacional do Python.
3 O Jupyter Notebook permite a execução de códigos Python no 
navegador, fazendo com que os usuários incluam texto formatado, 
visualizações estáticas e dinâmicas, equações matemáticas, entre 
outros recursos. Assinale a alternativa CORRETA com o comando 
para inicializar o Jupyter Notebook:
6
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
a) ( ) pip install jupyter.
b) ( ) sudo apt-get jupyter.
c) (X) jupyter notebook.
d) ( ) notebook jupyter.
4 Leia o texto a seguir:
Machine learning é uma técnica utilizada para auxiliar os programas 
a aprenderem a partir de informações existentes em bases de dados, 
cujo principal objetivo é a previsão de resultados futuros, por exemplo, 
indicando um produto do agrado de um consumidor de acordo com 
o comportamento de compras dele.
FONTE: STAUDT, J. M. Machine learning para análise do desgaste da força de tra-
balho. Monografia (Sistemas de Informação). Novo Hamburgo: Universidade Feeva-
le, 2017. Disponível em: https://tconline.feevale.br/NOVO/tc/files/0002_4351.pdf. 
Acesso em: 2 out. 2020.
Sobre o Google Colab Research, assinale a alternativa CORRETA:
a) ( ) É uma linguagem de programação.
b) (X) É uma plataforma colaborativa para codificação.
c) ( ) É um navegador de internet.
d) ( ) É um porta-documentos na nuvem.
5 As aplicações de Machine learning estão dominando os mais 
diversos setores, mandatoriamente os da tecnologia, mas também 
envolvendo diversas áreas multidisciplinares. Com isso, são 
gerados cada vez mais dados. Vimos alguns sites de datasets que 
fornecem dados para pesquisas com Machine learning. Busque na 
webe liste ao menos outros cinco sites que forneçam dados. 
R.: 1- http://labelme.csail.mit.edu/Release3.0/browserTools/php/da-
taset.php; 
2- http://image-net.org/; 
3- https://www.data.gov/; 
4- https://storage.googleapis.com/openimages/web/download.html; 
5- https://www.ukdataservice.ac.uk/.
7
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
TÓPICO 3
1 Considere o texto e a imagem a seguir:
Para que ocorra o armazenamento dos Tweets para posterior uso nas 
consultas, é efetuada a coleta dos textos, assim como o pré-processamento, 
compondo a etapa de ETL. Finalmente, após os dados pré-processados 
e limpos, podem ser realizadas consultas OLAP para explorar o cubo de 
dados. Com os textos já limpos, seleciona-se a data do registro e é efetuada 
sua formatação para que possa ser inserido na base. A partir disso, os 
dados do Tweet estão preparados para que possam ser “quebrados” 
e se efetue a Bag of Words. Com os dados do Tweet, as palavras são 
quebradas pelo script e inseridas na base de dados multidimensional. 
Caso a palavra já exista na base, é apenas atualizada sua frequência.
FONTE: SUTER, J. et al. Um Data Warehouse baseado no Twitter para análise de 
sentimento em língua portuguesa: estudo de caso das eleições de 2018. In: Anais 
da XV Escola Regional de Banco de Dados. Anais [...] SBC, 2019. p. 41-50. Disponí-
vel em: https://sol.sbc.org.br/index.php/erbd/article/view/8477/8378. Acesso em: 
2 out. 2020.
Analisando a imagem e associando com as etapas de aprendizado de 
um algoritmo de Machine learning, assinale a alternativa CORRETA 
sobre em qual etapa o processo de fonte de dados e Crawler estão 
relacionados: 
a) (X) Coleta de dados.
b) ( ) Preparação de dados.
c) ( ) Escolha do modelo.
d) ( ) Divisão em treino/teste.
8
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
2 Considere o texto a seguir: 
Uma coleção de 243 perguntas em português, curadas por profissionais 
médicos, também foi incluída na base de conhecimento do chatbot 
Dra. Lara, para ter capacidade de responder às perguntas comuns 
que as gestantes normalmente querem saber, como a possibilidade 
de comer um determinado elemento ou riscos associados à prática de 
um determinado exercício. 
FONTE: CARVALHO, L. et al. Dra. Lara: assistente virtual de apoio e acompanha-
mento ao pré-natal. In: Conferências IADIS Ibero-Americanas WWW/Internet e 
Computação Aplicada. Anais [...] 2019. Disponível em: https://www.researchgate.
net/publication/338668367_DRA_LARA_ASSISTENTE_VIRTUAL_DE_APOIO_E_
ACOMPANHAMENTO_AO_PRE-NATAL. Acesso em: 2 out. 2020.
Considerando que se deseja avaliar a base de dados, assinale 
a alternativa CORRETA com o nome de como a base de dados é 
dividida para tal fim:
a) (X) Treino/teste.
b) ( ) Coleta de dados.
c) ( ) Preparação de dados.
d) ( ) Seleção.
3 Machine Learning tem como objetivo principal a extração de 
conhecimentos a partir dos dados, na qual, entre suas técnicas, se 
destaca a classificação. Sobre a classificação de spams, considere 
a figura a seguir:
FONTE: <https://towardsdatascience.com/spam-or-ham-introduction-to-natural-lan-
guage-processing-part-2-a0093185aebd?gi=c3977479b17d>. Acesso em: 2 out. 2020.
9
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
Assinale a alternativa CORRETA sobre o que representa o campo 
Prediction:
a) (X) Predição de um campo (output).
b) ( ) Conjunto de características (input).
c) ( ) Conjunto de características (output).
d) ( ) Predição de um campo (input).
4 Os algoritmos de Machine learning geram conhecimento a partir 
de bases de dados, permitindo realizar, entre muitas tarefas, a 
classificação. Sobre a tarefa de classificação de spams, considere a 
figura a seguir:
FONTE: <https://towardsdatascience.com/spam-or-ham-introduction-to-natural-
-language-processing-part-2-a0093185aebd>. Acesso em: 2 out. 2020.
Assinale a alternativa CORRETA sobre o que representa o campo text:
a) (X) Conjunto de características (input).
b) ( ) Predição de um campo (output).
c) ( ) Conjunto de características (output).
d) ( ) Predição de um campo (input).
5 Considere o texto a seguir: 
Os algoritmos de Machine learning, também conhecidos como 
aprendizes, são diferentes: eles descobrem tudo sozinhos, fazendo 
inferências a partir de dados. E quanto mais dados têm, melhor ficam 
seus resultados.
10
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
FONTE: DOMINGOS, P. O algoritmo mestre: como a busca pelo algoritmo de Ma-
chine learning definitivo recriará nosso mundo. Novatec Editora, 2017.
Assinale a alternativa CORRETA sobre a etapa do processo 
de Machine learning que tem como objetivo obter os melhores 
parâmetros para os algoritmos:
a) (X) Tuning de parâmetros.
b) ( ) Predição de parâmetros.
c) ( ) Conjunto de parâmetros.
d) ( ) Aplicação de parâmetros.
UNIDADE 2
TÓPICO 1 
1 Nas mais diversas áreas do conhecimento, os sistemas de Machine 
learning podem ajudar a descobrir padrões, realizar determinadas 
tarefas, por meio da generalização de casos e da utilização de dados. 
Com relação à classificação, assinale a alternativa CORRETA:
a) (X) É um método supervisionado.
b) ( ) É um método não supervisionado.
c) ( ) É um método dessupervisionado.
d) ( ) É um método visionado.
2 Os métodos de classificação permitem rotular automaticamente 
novos registros com base em histórico de dados. Supondo que 
exista um conjunto de dados que possa receber rótulos 0-negativos 
ou 1-positivos, qual tipo de tarefa de classificação que será 
realizada? 
a) (X) Classificação binária.
b) ( ) Classificação unária.
c) ( ) Classificação ternária.
d) ( ) Classificação multiclasse.
11
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
3 A categorização de textos de notícias é a tarefa de rotular uma 
determinada notícia, com base em um conjunto de textos 
previamente rotulado. Considerando que, em uma base de 
dados, existam 35 categorias de notícias, qual tipo de tarefa de 
classificação será realizado? 
a) (X) Classificação multiclasse.
b) ( ) Classificação binária.
c) ( ) Classificação unária.
d) ( ) Classificação ternária.
4 O Python é uma linguagem de alto nível, interpretada, orientada 
a objetos com uma semântica dinâmica, amplamente utilizada em 
projetos de Machine learning. Sobre a utilização do Python, assinale 
a biblioteca que implementa os métodos de Machine learning: 
a) (X) Scikit-learn.
b) ( ) Pandas.
c) ( ) Matlab.
d) ( ) PIP.
5 Python é uma linguagem básica, simples, utilizada em diversos 
cenários da computação, com destaque para projetos de Machine 
learning. Sobre o Python, assinale qual biblioteca é utilizada para 
a visualização de dados: 
a) (X) MatplotLib.
b) ( ) Scikit-learn.
c) ( ) Pandas.
d) ( ) Numpy.
TÓPICO 2
1 A distância euclidiana é uma das medidas de dissimilaridade 
entre comunidades mais utilizadas na prática. Assim, quanto 
menor o valor da distância euclidiana entre dois objetos, 
mais próximas elas se apresentam em termos de parâmetros 
12
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
quantitativos. Considere a fórmula da distância euclidiana, 
apresentada a seguir, e assinale a alternativa CORRETA no que 
se refere ao n:
FONTE: O autor
a) (X) O número de objetos.
b) ( ) Um ponto no espaço
c) ( ) O somatório do espaço.
d) ( ) O erro de desvio.
2 A distância euclidiana é uma das medidas de dissimilaridade entre 
comunidades mais utilizadas na prática. Quanto menor o valor 
da distância euclidiana entre dois objetos, mais próximas elas se 
apresentam em termos de parâmetros quantitativos. Sobre a fórmula 
da distância euclidiana, assinale a alternativa CORRETA sobre x e y:
a) (X) Dois pontos no espaço.
b) ( ) Erro.
c) ( ) O número de objetos.
d) ( ) Inicio do vetor.
3 Considere a figura a seguir, na qual o ponto vermelho representa 
uma nova amostra a ser classificada pelo algoritmo KNN, e responda:
FONTE: O autor
13
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
a) Considerando que K = 6, qual é a classe da amostra vermelha?R.: Classe A.
b) Considerando que K = 3, qual é a classe da amostra vermelha?
R.: Classe B.
c) Considerando que K = 1, qual é a classe da amostra vermelha?
R.: É esperado que o aluno discorra que, visualmente, não é possível 
afirmar, tornando-se necessário fazer o cálculo.
TÓPICO 3
1 Considere o texto e a figura a seguir:
O classificador Naïve Bayes é construído utilizando dados de 
treinamento para estimar a probabilidade de um documento pertencer 
a uma classe. O teorema de Bayes, mostrado a seguir, é utilizado para 
estimar estas probabilidades.
FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta de combinação 
de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas Iberoamericanas de 
Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v. 1, p. 317-32, 2004.
a) Indique o significado de C.
R.: Representa o conjunto de categorias.
b) Indique o significado de x.
R.: É o conjunto de dados.
c) Indique o significado de P (c | x).
R.: É a probabilidade posterior da classe (c, alvo) dada preditor (x, 
atributos).
14
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
d) Indique o significado de P (C) 
R.: É a probabilidade original da classe.
e) Indique o significado de P (x | c) 
R.: É a probabilidade que representa a probabilidade de preditor 
dada a classe.
f) Indique o significado de P (x).
R.: É a probabilidade original do preditor.
2 Considere o texto a seguir:
A regressão linear é uma ferramenta estatística utilizada para traçar 
a tendência de funções com variação linear. Este método, apesar 
de simples, quando é convenientemente aplicado, pode produzir 
resultados satisfatórios na previsão de séries temporais, quando estas 
são lineares. 
FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta de combinação 
de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas Iberoamericanas 
de Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v. 1, p. 317-32, 
2004.
Sobre a regressão linear e sua implementação no scikit-learn, 
assinale a alternativa que apresenta o trecho de código que instancia 
um objeto classificador do tipo regressão linear:
a) (X) Classificador_RL = LinearRegression()
b) ( ) Classificador_RL = RegLIn()
c) ( ) Classificador_RL = RegressionMB()
d) ( ) Classificador_RL = Bernoullli()
15
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
UNIDADE 3
TÓPICO 1 
1 Regressão é uma tarefa que permite gerar modelos preditivos 
para valores contínuos. Tendo como objetivo encontrar a relação 
entre um conjunto de atributos de entrada (variáveis preditoras) 
e um atributo-meta contínuo. Assinale a alternativa CORRETA:
a) (X) É um método supervisionado.
b) ( ) É um método não supervisionado.
c) ( ) É um método desupervisionado.
d) ( ) É um método visionado.
2 Os sistemas de Machine learning podem ajudar a descobrir 
padrões, realizar determinadas tarefas por meio da generalização 
de casos e da utilização de dados. Os métodos de regressão, é 
possível rotular automaticamente novos registros, com base em 
histórico de dados. Sobre os tipos de dados em que as regressões 
atuam, assinale a alternativa CORRETA:
a) (X) Dados contínuos.
b) ( ) Dados discretos.
c) ( ) Dados binários.
d) ( ) Dados multiclasse.
3 Analise o texto a seguir:
A regressão é um método estatístico para estimar uma variável (y) 
em função dos valores de outra variável (x). A regressão é dita linear 
quando a função ajustada é uma função linear, ou seja, uma função 
de 1º grau. 
FONTE: NERY, C. V. M.; OLIVEIRA, D. B.; ABREU, L. H. G. Estudo comparativo entre 
os índices NDVI obtidos a partir dos sensores Landsat 5-TM e Resourcesat-liss III. 
Caminhos de Geografia, v. 14, n. 46, 2013.
Assinale a alternativa CORRETA que representa o significado de ŷ:
16
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
a) (X) O valor predito.
b) ( ) O rótulo original.
c) ( ) Os valores de entrada.
d) ( ) O erro.
4 As métricas de avaliação tem como objetivo verificar a eficácia 
do modelo, comparando com os dados originais. Assinale a 
alternativa CORRETA que contenha um tipo de erro:
a) (X) MSE.
b) ( ) Pandas.
c) ( ) Matlab.
d) ( ) PIP.
5 Python é uma linguagem básica e simples, utilizada em diversos 
cenários da computação, com destaque para projetos de Machine 
learning. Sobre o Python, assinale a alternativa CORRETA que 
indica o elemento utilizado para importar as métricas de avaliação:
a) (X) sklearn.metrics.
b) ( ) Scikit-learn.
c) ( ) Pandas.
d) ( ) Numpy.
TÓPICO 2
1 A regressão linear é uma tentativa de modelar uma equação 
matemática linear que descreva o relacionamento entre duas 
variáveis. Assinale a alternativa CORRETA que contenha uma 
função que represente a regressão linear.
a) (X) f(x) = a + bx.
b) ( ) f(x) = x+ 1.
c) ( ) f(x) = ax + b.
d) ( ) f(x) = x.
17
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
2 A regressão linear permite estimar valores com base em um 
conjunto de entrada e um rótulo esperado. Considere os seguintes 
dados: 
X 1 2 3 4 5 6
Y 80,5 81,6 82,1 83,7 83,9 85,0
FONTE: O autor
Qual a equação da regressão linear para os valores anteriores?
a) (X) ŷ = 79,9 + 0,886x.
b) ( ) ŷ = 79,9x+ 0,886.
c) ( ) ŷ = 80,5 + 0,81x.
d) ( ) ŷ =81,6 + 0,821x.
3 Para o conjunto de dados a seguir, considere o modelo de regressão 
linear hθ (x) = θ0 + θ1x. Assinale a alternativa CORRETA que 
contenha os valores de θ0 e θ1 na descida do gradiente descendente?
X 1 2 4 0
Y 0,5 1 2 0
FONTE: O autor
a) (X) θ0 = 0,θ1 = 0.5.
b) ( ) θ0 = 0.5,θ1 = 0.
c) ( ) θ0 = 0.5,θ1 = 0.5.
d) ( ) θ0 = 1,θ1 = 0.5.
4 Para a hipótese de uma regressão linear, definimos θ₀ = −1, θ₁ = 
0,5. Assinale a alternativa CORRETA para hθ (4): 
a) (X) 1.
b) ( ) –1.
c) ( ) 4.
d) ( ) 0,5.
18
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
5 Considere os seguintes dados: 
X 1 2 3 4 5 6
Y 80,5 81,6 82,1 83,7 83,9 85,0
FONTE: O autor
Assinale a alternativa CORRETA que contenha o valor de m:
a) (X) 6.
b) ( ) 82.
c) ( ) 2.
d) ( ) 5.
TÓPICO 3
1 Para as próximas questões, considere texto e fórmula a seguir:
A regressão logística é um método de associação de variáveis no qual 
se prediz a presença ou ausência de uma característica (no caso, o 
cancelamento da assinatura) por meio de um conjunto de variáveis 
preditoras ou explicativas.
FONTE: SILVA, L. P. M. da. O mercado de produtos digitais: um estudo de Churn 
de migrados de assinatura de jornal. Monografia (Administração) – Departamento 
de Ciências Administrativas, Escola de Administração, Universidade Federal do Rio 
Grande do Sul, Porto Alegre, 2017. Disponível em: https://lume.ufrgs.br/bitstream/
handle/10183/169919/001051430.pdf?sequence=1&isAllowed=y. Acesso em: 5 
nov. 2020.
a) Na equação apresentada, indique o significado de e.
R.: Representa o número de Euler.
b) Na equação apresentada, indique o significado de x₀.
R.: Representa o valor do ponto médio da sigmoide no eixo x.
19
MACHINE LEARNING I – CLASSIFICAÇÃO E REGRESSÃO
c) Na equação apresentada, indique o significado de L.
R.: Representa o valor máximo.
d) Na equação apresentada, indique o significado de k.
R.: Representa a inclinação da curva.