Buscar

MACHINE LEARNING - Avaliação Final (Objetiva)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1Machine Learning, compreendido como o aprendizado de máquina a partir dos
dados previamente conhecidos, é definido como um campo preocupado com a
questão de como construir programas de computador que melhorem
automaticamente a experiência do usuário. Também pode ser dividido em: Tarefa
(T), Medida de Desempenho (P) e Experiência de Treinamento (E). Com base no
diagnóstico de gravidez de risco, associe os itens, utilizando o código a seguir: I-
Tarefa T. II- Medida de Desempenho P. III- Experiência de Treinamento E. ( )
Classificar novas gestantes com potenciais riscos na gravidez. ( ) Porcentagem de
pacientes classificadas corretamente. ( ) Base de dados histórica contendo
exemplos de gestantes com ou sem gravidez de risco. Assinale a alternativa que
apresenta a sequência CORRETA: Sobre a associação dos itens acima, selecione a
alternativa CORRETA com a associação entre os itens.
A
I - II - III.
B
III - II - I.
C
III - I - II.
D
II - I - III.
2A arquitetura é organizada em cinco camadas: Fontes de dados, ETL +, Corpus,
OLAP e Consumidor / Solicitante. Podemos perceber que o framework suporta
interações e iterações porque os aplicativos (na camada Consumidor / Solicitante)
não apenas consomem cubos de dados, mas podem solicitar dados que se
adaptem melhor às suas necessidades. As fontes de dados são dinâmicas, pois são
notícias coletadas de sites. Inicialmente, fornecemos um corpus de textos em inglês.
Como parte do ETL +, o rastreador extrai dados de jornais digitais para obter o
corpus on-line. Com base na imagem e associando com as etapas de aprendizado
de um algoritmo de Machine Learning, classifique V para as sentenças verdadeiras
e F para as falsas: ( ) O Crawler faz a etapa de coleta de dados. ( ) O Crawler faz a
etapa de preparação dos dados. ( ) A etapa de Limpeza e integração de dados
coleta de dados. ( ) A etapa de Limpeza e integração de dados é a preparação dos
dados. Assinale a alternativa que apresenta a sequência CORRETA:
A
V - F - V - F.
B
F - V - V - V.
C
V - F - V - V.
D
V - F - F - V.
3A classificação, também denominada de categorização, é a atividade de rotular
dados com suas respectivas categorias temáticas, a partir de um conjunto de dados
predefinidos. Os métodos de classificação podem ser de aprendizado on-line ou
off-line, de acordo com a capacidade de construir e atualizar do classificador. Sobre
as métricas de classificação, classifique V para as sentenças verdadeiras e F para
as falsas: ( ) A precisão é a porcentagem de amostras classificadas como
pertencentes à classe positiva e que realmente fazem parte de tal classe. ( ) A
revocação, também chamada de sensibilidade ou recall, é uma métrica que, entre
todas as situações de classe positiva como valor esperado, indica quantas estão
corretas. ( ) Os verdadeiros negativos são baseados na classificação correta da
classe negativa. ( ) A revocação é a porcentagem de amostras classificadas como
pertencentes à classe positiva e que realmente fazem parte de tal classe. Assinale a
alternativa que apresenta a sequência CORRETA:
A
V - V - V - F.
B
F - V - F - V.
C
F - V - V - F.
D
V - F - V - F.
4Os sistemas de aprendizado de máquina apresentam características peculiares
que possibilitam uma classificação não exclusiva desses sistemas em função da
linguagem de descrição, do modo de aprendizado, do paradigma de aprendizado,
das formas e da tarefa de aprendizado. Com base nas características e seus tipos,
associe os itens, utilizando o código a seguir: I- Modos de aprendizado. II-
Paradigmas de aprendizado. III- Formas de aprendizado. IV- Tarefas de
aprendizado. ( ) Supervisionado, Não Supervisionado, Por Esforço. ( ) Incremental e
Não Incremental. ( ) Simbólico, Estatístico, Conexionista e Genético. ( )
Classificação, Regressão, Agrupamento e Associação. Assinale a alternativa que
apresenta a sequência CORRETA:
A
I - II - III - IV.
B
IV - III - II - I.
C
I - III - II - IV.
D
I - IV - III - II.
5O classificador Naïve Bayes é construído utilizando dados de treinamento para
estimar a probabilidade de um documento pertencer a uma classe. O teorema de
Bayes, mostrado em anexo, é utilizado para estimar estas probabilidades. Sobre a
fórmula, classifique V para as sentenças verdadeiras e F para as falsas: ( ) P (x) é a
probabilidade original do preditor. ( ) P (c l x) é a probabilidade posterior da classe
(c, alvo) dado preditor (x, atributos). ( ) x é o conjunto de dados. ( ) P(C) é a
probabilidade original da classe. Assinale a alternativa que apresenta a sequência
CORRETA: FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta
de combinação de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas
Iberoamericanas de Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v.
1, p. 317-32, 2004.
A
F - F - F - F.
B
V - V - V - V
C
V - F - F - F.
D
F - V - V - V.
6A regressão é uma técnica que permite explorar e inferir a relação de uma variável
dependente com variáveis independentes específicas. A análise da regressão pode
ser usada como um método descritivo da análise de dados sem a necessidade de
quaisquer suposições sobre as metodologias que permitiram gerar os dados. Sobre
a regressão e as funções de custo, classifique V para as sentenças verdadeiras e F
para as falsas: ( ) A função de custo tem como objetivo deixar a função de
regressão mais rápida ( ) O Gradiente Descendente é utilizado para diminuir o erro
da função de regressão ( ) No processo do Gradiente descendente o custo diminui
conforme as interações ( ) Apesar de funcionar na teoria, não é possível
implementar uma função de custo Assinale a alternativa CORRETA que apresenta a
sequência CORRETA: FONTE: MARTINS, Lais Santos; LIMA, Danielli A.
Aprendizado semi-supervisionado para análise de dados de base aberta pública
sobre casos de doenças do aparelho respiratório. EnPE, v. 7, n. 1, 2020.
A
F - V - V - F.
B
F - F - V - V.
C
V - V - V - F.
D
V - F - V - F.
7O dataset denominado Air Quality Dataset possui dados com diversos sensores. O
conjunto de dados contém 9358 ocorrências de respostas médias horárias de uma
matriz de 5 sensores químicos de óxido de metal incorporados em um dispositivo
multissensor químico de qualidade do ar. O dispositivo foi localizado no campo em
uma área significativamente poluída, ao nível da estrada, dentro de uma cidade
italiana. Os dados foram registrados de março de 2004 a fevereiro de 2005 (um
ano), representando as mais longas gravações disponíveis gratuitamente de
respostas de dispositivos sensores químicos de qualidade do ar implantados em
campo. As concentrações médias horárias do Ground Truth para CO,
hidrocarbonetos não metânicos, benzeno, óxidos de nitrogênio totais (NOx) e
dióxido de nitrogênio (NO2) foram fornecidas por um analisador certificado de
referência co-localizado. Sabendo que os dados do CO2 são dados contínuos,
assinale a alternativa CORRETA que apresenta o tipo de tarefa de aprendizado que
pode realizar a previsão de emissão de gás nos próximos dias:
A
Agrupamento.
B
Classificação.
C
Regressão.
D
Clusterização.
8A distância euclidiana é uma das medidas de dissimilaridade entre comunidades
mais utilizada na prática. Assim, quanto menor o valor da distância euclidiana entre
dois objetos, mais próximas elas se apresentam em termos de parâmetros
quantitativos. Considere a fórmula da distância euclidiana apresentada em anexo e
classifique V para as sentenças verdadeiras e F para as falsas: ( ) Xi representa um
determinado objeto (dentro de X) sob qual se calculará a distância. ( ) Yi representa
um determinado objeto (dentro de Y) sob qual se calculará a distância. ( ) i=o
significa que haverá uma iteração terminando em 0. ( ) n representa o número de
objetos que serão iterados. Assinale a alternativa que apresenta a sequência
CORRETA:
A
V - F - V - F.
B
V - V - F - V.
C
F - V - F - V.
D
V - F - F - V.
9No desenvolvimento de algoritmos de machine learning, as métricas de avaliação
têm como objetivo verificar a eficácia do modelo, comparando com os dados
originais.Tais métricas auxiliam a saber se o algoritmo está aprendendo bem ou
não. Sobre a métrica de avaliação da tarefa de regressão, assinale a alternativa
CORRETA:
A
F-Medida.
B
Erro Quadrático Médio.
C
Precisão.
D
Acurácia.
10A regressão é uma técnica de modelagem preditiva onde a variável-alvo a ser
avaliada é contínua. Constitui-se de uma metodologia estatística que utiliza o
relacionamento entre duas ou mais variáveis quantitativas de modo que a variável
meta possa ser predita a partir de outras sob a forma de uma representação. Sobre
a regressão, associe os itens, utilizando o código a seguir: I- Validação cruzada. II-
Overfitting. III- Underfitting. ( ) Um cenário no qual o modelo já é ruim no próprio
treinamento. O modelo não consegue encontrar relações entre as variáveis e o teste
nem precisa acontecer. ( ) Um cenário que ocorre quando, nos dados de treino, o
modelo tem um desempenho excelente, porém quando utilizamos os dados de teste
o resultado é ruim. ( ) Tem como objetivo avaliar o modelo da melhor maneira, do
que simplesmente a divisão dos dados em treino e teste. Assinale a alternativa que
apresenta a sequência CORRETA:
A
I - II - III.
B
II - III - I.
C
I - III - II.
D
III - II - I.

Continue navegando