Logo Passei Direto
Buscar

SIMULADO Inteligência Artificial para Fiscal de Tributos Estaduais (SEFAZ MT) 2023

Ferramentas de estudo

Questões resolvidas

A recente explosão de machine learning e deep learning tornou os tensores populares. TensorFlow e PyTorch são dois frameworks com suporte a API de tensor.
Em relação aos tensores, assinale a opção incorreta.
a) Tensor representa um array multidimensional junto com operações definidas.
b) Os tensores, internamente, são implementados como estruturas de dados leves que mantêm um ponteiro para o armazenamento e outros metadados, como tamanho e forma.
c) Os próprios dados do tensor são armazenados em um buffer contíguo.
d) Utilizar um buffer contíguo permite que vários tensores compartilhem os mesmos dados, mas forneçam diferentes visualizações.
e) Quando os tensores têm dimensões diferentes, certas operações não podem ser realizadas sem primeiro colocar os tensores nas mesmas dimensões, para isso possuem a operação automática denominada replicação.

As opções a seguir descrevem os passos de uma técnica genérica de deduplicação. A entrada é um novo bloco de dados (chunk) de um arquivo “DC” e a saída é um bloco de dados se é encontrado.
A esse respeito, assinale a opção incorreta.
a) Obtenha o novo bloco de dados do arquivo DC a ser armazenado.
b) Identifique o formato de um bloco de dados DC e o divida em objetos (fixos ou variáveis). Assim, DC= {dc1, dc2, ..., dcn}, onde dc1, dc2, ..., dcn são objetos.
c) Determine o valor hash ou o fingerprint. Assim, hv(DC) é o novo bloco de dados do arquivo DC.
d) Combine o valor hash de um novo bloco de dados hv(DC) com os valores hash anteriores ou existentes {hv1,hv2,..,hvn} no armazenamento ou memória, {hv1,hv2,..,hvn} são valores hash de blocos de dados já armazenados.
e) Atualize o bloco de dados, se houver uma correspondência. Caso contrário, armazene o novo bloco de dados na memória e mantenha o novo índice.

A respeito do Robotic Process Automation (RPA), assinale a afirmativa correta.
a) Possui baixa precisão nos resultados.
b) Executa tarefas humanas de rotina.
c) Realiza tarefas desde que envolva cálculos.
d) Necessita de customização para interagir com outros sistemas.
e) Dispensa a utilização de controlroom (sala de controle).

A capacidade de um agente computacional de alterar o próprio comportamento com base em situações anteriores é chamada de
a) autonomia.
b) cooperatividade.
c) inteligência.
d) aprendizagem.
e) proatividade.

Informe Verdadeiro (V) ou Falso (F) em relação às seguintes afirmativas abaixo.
( ) As abordagens de redução de dados vertical conhecidas como Filter realizam a seleção de atributos sem considerar o algoritmo de mineração de dados que será utilizado aos atributos selecionados. Por outro lado, as abordagens conhecidas como Wrapper experimentam o algoritmo de mineração de dados para cada conjunto selecionado, avaliando os resultados obtidos.
( ) Os algoritmos de clusterização e classificação automática visam modelar os dados utilizando padrões locais enquanto que algoritmos de regras de associação procuram modelar os dados utilizando padrões globais.
( ) São exemplos de métodos de clusterização: k-means, k-Modes, k-medoids e BIRCH.
( ) São exemplos de métodos de descoberta de sequencias: GSP, CART, MSDD, SPADE.
a) (F); (V); (F); (V).
b) (F); (V); (V); (F).
c) (V); (F); (F); (V).
d) (V); (F); (V); (F).

Machine Learning possui um grande conjunto de técnicas e algoritmos consagrados. Por possuírem características específicas, essas técnicas e algoritmos são adequados ou não para a solução de um problema, a depender do tipo de aprendizagem que será utilizado.
Marque a alternativa que indica o nome de um algoritmo que NÃO faz parte dos utilizados em cenários onde a aprendizagem supervisionada está presente.
a) KNN
b) K-means
c) Redes Neurais
d) Árvore de Decisão
e) SVM

Machine Learning é um ramo da ciência da computação que utiliza conceitos das áreas de Estatística, Engenharia e da própria Computação com o objetivo de reconhecer padrões e ensiná-los a uma máquina. Além das áreas citadas, outro aspecto importante para Machine Learning são os dados. Sem eles não é possível viabilizar o treinamento da máquina. Esses dados devem estar relacionados ao tema para o qual a máquina será treinada. Isso é fundamental pois o objetivo de Machine Learning é permitir que a máquina seja capaz de evidenciar informações que um humano não perceberia facilmente, permitindo, por exemplo, a predição de eventos ou a execução de diagnósticos precisos.
A respeito dos fundamentos que envolvem Machine Learning, analise as afirmativas abaixo e marque alternativa correta.
I. No processo de aprendizagem supervisionada o computador recebe um conjunto de dados. Ele encontrará neste conjunto dados de entrada atrelados as saídas esperadas. Neste tipo de aprendizagem o objetivo é encontrar as regras que conseguem mapear aquelas entradas com aquelas saídas.
II. A aprendizagem por reforço é um tipo de treinamento usado onde enfrentamos um ambiente complexo. Através das tentativas e erro o computador busca uma solução para o problema. Para que a máquina entenda o que são acertos e erros ela receberá recompensas e penalidades durante o processo de busca da solução.
III. Quando o conjunto de dados repassado para o computador possui apenas os valores de saída possíveis (rótulos) mas não conhecemos nada a respeito dos valores das entradas, devemos fazer uso do processo de aprendizagem não supervisionada. Ela foi criada justamente para atender este cenário. Esse aprendizagem envolve complexidades adicionais quando comparada a aprendizagem supervisionada.
a) Apenas a afirmativa II está correta.
b) Apenas as afirmativas I e II estão corretas.
c) Apenas as afirmativas II e III estão corretas.
d) Apenas a afirmativa I está correta.
e) Todas as afirmativas estão corretas.

Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o tipo de gráfico mais adequado para análise dos referidos dados.
a) Pizza.
b) Tendência.
c) Dispersão.
d) Histograma.

O Processamento de Linguagem Natural (PLN) é a subárea da Inteligência Artificial responsável por estudar a capacidade e as limitações de uma máquina de entender a linguagem dos seres humanos. Para poder realizar essa modelagem, são necessários pré-processamentos que abstraem e estruturam a língua, deixando apenas aquilo que representa uma informação relevante. Uma das etapas desse processo compreende a normalização. Uma tarefa que pode ser realizada dentro do processo de normalização é denominada de tokenização lexical.
Considere a seguinte sentença: A área de Ciência de Dados é muito interessante! Assinale a alternativa correta que representa o resultado da tokenização lexical para essa sentença.
a) [‘A’, ‘área’, ‘de’, ‘Ciência’, ‘de’, ‘Dados’, ‘é’, ‘muito’, ‘interessante’, ‘!’]
b) [‘A’, ‘área’, ‘Ciência’, ‘Dados’, ‘interessante’, ‘!’]
c) [‘A área de Ciência de Dados é muito interessante!’]
d) A ÁREA DE CIÊNCIA DE DADOS É MUITO INTERESSANTE!

A palavra cluster, do inglês, pode ser traduzida para o Português como aglomerado ou agrupamento. Na computação, essa palavra é utilizada em redes de computadores para designar o agrupamento de computadores para armazenamento e processamento de dados em software quando se busca analisar dados armazenados e que podem ser processados por técnicas de aprendizado de máquina. Nessas duas situações, é necessário identificar corretamente a quantidade de clusters que formam determinado sistema.
Considerando a figura a seguir, selecione a opção que melhor representa a quantidade de clusters.
a) 5
b) 10
c) 2
d) 3

A técnica de redução de dimensionalidade (PCA) permite transformar dados que inicialmente pertencem a um espaço de dimensão n em um espaço de dimensão m, em que m < n , sendo utilizada, por exemplo, para reduzir a dimensionalidade de certo conjunto de dados através do descarte de características não úteis e que ainda permita realizar o reconhecimento de padrões.
Julgue o item que se seguem.
Certo
Errado

As aplicações em inteligência artificial são definidas como uma subárea da área de aprendizagem de máquina (machine learning).
Certo
Errado

A utilização de valores aleatórios nos métodos modernos de inicialização dos pesos das camadas das redes neurais artificiais (RNA) permite evitar o problema do desaparecimento do gradiente (vanishing gradient problem).
Certo
Errado

Ao analisar um grande volume de dados, João encontrou algumas anomalias, por exemplo: pessoas com mais de 200 anos de idade e salário de engenheiro menor que salário de pedreiro.
A operação de limpeza da fase de preparação de dados para tratar os pontos extremos existentes em uma série temporal a ser executada por João é:
a) Normalização
b) Discretização
c) Classificação
d) Tratamento de outlier
e) Redução de dimensionalidade

O Chefe do Departamento de Treinamento de Modelos de I.A de determinado Banco de Investimento recebe em sua sala cinco cientistas de dados (cada um com um diferente modelo treinado e desenvolvido) e verifica que todos eles possuem a mesma queixa: o comprometimento da capacidade de generalização em decorrência da problemática do overfitting.
Cada opção abaixo representa um modelo desenvolvido e a respectiva proposta de solução de um dos cientistas de dados. Assim assinale a opção com a proposta INCORRETA.
a) Regressão Linear Composta. Retirar penalidade LASSO do modelo.
b) Regressão Logística. Reduzir número de variáveis explicativas.
c) Rede Neural Artificial. Aplicar técnica de early stopping.
d) Rede Neural Artificial. Reduzir a quantidade de camadas de neurônios.
e) Random Forest. Aumentar número de árvores de decisão.

O Departamento Secreto X da Marinha do Brasil se deparou com um conjunto de casos nos quais a etapa de pré-processamento foi crucial para o bom funcionamento dos diferentes sistemas que usam algoritmos de Aprendizado de Máquina.
Assinale a opção que corresponde ao uso da correta tarefa de preparação de dados, dentre os diferentes contextos (case) apresentados, segundo o processo KDD descrito por Goldschmidt (2015).
a) Picos no sistema interno da Fragata Tango fazem com que os radares detectem distâncias erradas, multiplicadas por altíssimo fator de erro, que faz o valor da distância fugir de um intervalo de valor plausível. Um algoritmo de remoção de outlier foi desenvolvido para remover amostras com ordens de grandeza anômalas. Neste caso, a tarefa de redução de dados vertical foi aplicada.
b) O Sistema de Monitoramento de Caças da Aviação Naval registrou um grande conjunto de dados e foi verificada uma elevada quantidade de pares de variáveis com correlações extremamente próximas a 100% (como a observada entre a quantidade de combustível consumido e a distância percorrida). Neste caso, aplicou-se o algoritmo de PGA (Principal Component Analysis).
c) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o objetivo de prever as condições de saúde de diferentes militares. Foi aplicada uma amostragem sobre a grande população inicial de indivíduos mantendo-se a proporção em relação à faixa etária por meio do método de redução de dados vertical.
d) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o objetivo de prever as condições de saúde de diferentes militares e uma das tarefas de pré-processamento utilizada foi a codificação que considera militares casados representados por "0001", militares solteiros ou divorciados como "0010", militares viúvos como "0100" e outros como "1000". Neste caso, o tipo de codificação aplicado foi binário por temperatura.
e) Antes do fornecimento de dados à rede neural profunda para detecção de mísseis, foi aplicado o algoritmo no qual cada distância foi subtraída da média amostral e dividida pela variância amostral. Desse modo, a tarefa de pré-processamento utilizada foi de enriquecimento de dados.

O sckit-learn suporta o processamento de algoritmos de aprendizado de máquina do tipo supervisionado como, por exemplo,
Assinale a alternativa correta.
a) o SVM e a clusterização.
b) o BIRCH e o vizinho mais próximo.
c) o PCA e os gaussian mixture models.
d) o naive bayes e as árvores de decisão.
e) o modelo cúbico e a densidade estimada.

Analise o script abaixo from pandas import DataFrame import matplotlib.pyplot as plt from sklearn.cluster import KMeans Data = {'x': [36,35,23,28,34,32,30,23,36,34,66,55,56,44,51,56,52,51,64,48,49,50,36,34,43,46,40,42,52,47], 'y': [76,52,52,79,60,73,73,58,70,76,52,33,41,45,52,37,36,59,60,51,26,21,15,13,21,10,30,28,10,17]} df = DataFrame(Data,columns=['x','y']) m = KMeans(n_clusters=3).fit(df) d = m.cluster_centers_ plt.xlabel("X") plt.ylabel("Y") plt.scatter(df['x'], df['y'], c= m.labels_.astype(float), s=100, alpha=0.5) plt.scatter(d[:, 0], d[:, 1], c='red', s=250, marker='*') plt.grid() plt.show() O resultado da execução é As estrelas indicam
Assinale a alternativa correta.
a) componentes principais.
b) centros de voronoi.
c) covariâncias.
d) centroides.
e) clusteres.

Aplicações de reconhecimento de voz fazem a transcrição de um áudio para texto diretamente, sem a necessidade de nenhum modelo intermediário.
Certo
Errado

A correta definição do termo “inteligência artificial” é tratar-se de:
a) uma tecnologia que interliga uma rede de computadores conectando dispositivos, pessoas e até animais através da nuvem
b) uma tecnologia que visa facilitar o trabalho com marketing digital, ao mesmo tempo em que traz mais eficiência e otimiza os processos dessa estratégia, aumentando as chances de sucesso
c) um sistema de identificação que permite rastrear e categorizar itens ou dispositivos, por meio da internet
d) uma ciência multidisciplinar que busca desenvolver e aplicar técnicas computacionais que simulem o comportamento humano em atividades específicas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

A recente explosão de machine learning e deep learning tornou os tensores populares. TensorFlow e PyTorch são dois frameworks com suporte a API de tensor.
Em relação aos tensores, assinale a opção incorreta.
a) Tensor representa um array multidimensional junto com operações definidas.
b) Os tensores, internamente, são implementados como estruturas de dados leves que mantêm um ponteiro para o armazenamento e outros metadados, como tamanho e forma.
c) Os próprios dados do tensor são armazenados em um buffer contíguo.
d) Utilizar um buffer contíguo permite que vários tensores compartilhem os mesmos dados, mas forneçam diferentes visualizações.
e) Quando os tensores têm dimensões diferentes, certas operações não podem ser realizadas sem primeiro colocar os tensores nas mesmas dimensões, para isso possuem a operação automática denominada replicação.

As opções a seguir descrevem os passos de uma técnica genérica de deduplicação. A entrada é um novo bloco de dados (chunk) de um arquivo “DC” e a saída é um bloco de dados se é encontrado.
A esse respeito, assinale a opção incorreta.
a) Obtenha o novo bloco de dados do arquivo DC a ser armazenado.
b) Identifique o formato de um bloco de dados DC e o divida em objetos (fixos ou variáveis). Assim, DC= {dc1, dc2, ..., dcn}, onde dc1, dc2, ..., dcn são objetos.
c) Determine o valor hash ou o fingerprint. Assim, hv(DC) é o novo bloco de dados do arquivo DC.
d) Combine o valor hash de um novo bloco de dados hv(DC) com os valores hash anteriores ou existentes {hv1,hv2,..,hvn} no armazenamento ou memória, {hv1,hv2,..,hvn} são valores hash de blocos de dados já armazenados.
e) Atualize o bloco de dados, se houver uma correspondência. Caso contrário, armazene o novo bloco de dados na memória e mantenha o novo índice.

A respeito do Robotic Process Automation (RPA), assinale a afirmativa correta.
a) Possui baixa precisão nos resultados.
b) Executa tarefas humanas de rotina.
c) Realiza tarefas desde que envolva cálculos.
d) Necessita de customização para interagir com outros sistemas.
e) Dispensa a utilização de controlroom (sala de controle).

A capacidade de um agente computacional de alterar o próprio comportamento com base em situações anteriores é chamada de
a) autonomia.
b) cooperatividade.
c) inteligência.
d) aprendizagem.
e) proatividade.

Informe Verdadeiro (V) ou Falso (F) em relação às seguintes afirmativas abaixo.
( ) As abordagens de redução de dados vertical conhecidas como Filter realizam a seleção de atributos sem considerar o algoritmo de mineração de dados que será utilizado aos atributos selecionados. Por outro lado, as abordagens conhecidas como Wrapper experimentam o algoritmo de mineração de dados para cada conjunto selecionado, avaliando os resultados obtidos.
( ) Os algoritmos de clusterização e classificação automática visam modelar os dados utilizando padrões locais enquanto que algoritmos de regras de associação procuram modelar os dados utilizando padrões globais.
( ) São exemplos de métodos de clusterização: k-means, k-Modes, k-medoids e BIRCH.
( ) São exemplos de métodos de descoberta de sequencias: GSP, CART, MSDD, SPADE.
a) (F); (V); (F); (V).
b) (F); (V); (V); (F).
c) (V); (F); (F); (V).
d) (V); (F); (V); (F).

Machine Learning possui um grande conjunto de técnicas e algoritmos consagrados. Por possuírem características específicas, essas técnicas e algoritmos são adequados ou não para a solução de um problema, a depender do tipo de aprendizagem que será utilizado.
Marque a alternativa que indica o nome de um algoritmo que NÃO faz parte dos utilizados em cenários onde a aprendizagem supervisionada está presente.
a) KNN
b) K-means
c) Redes Neurais
d) Árvore de Decisão
e) SVM

Machine Learning é um ramo da ciência da computação que utiliza conceitos das áreas de Estatística, Engenharia e da própria Computação com o objetivo de reconhecer padrões e ensiná-los a uma máquina. Além das áreas citadas, outro aspecto importante para Machine Learning são os dados. Sem eles não é possível viabilizar o treinamento da máquina. Esses dados devem estar relacionados ao tema para o qual a máquina será treinada. Isso é fundamental pois o objetivo de Machine Learning é permitir que a máquina seja capaz de evidenciar informações que um humano não perceberia facilmente, permitindo, por exemplo, a predição de eventos ou a execução de diagnósticos precisos.
A respeito dos fundamentos que envolvem Machine Learning, analise as afirmativas abaixo e marque alternativa correta.
I. No processo de aprendizagem supervisionada o computador recebe um conjunto de dados. Ele encontrará neste conjunto dados de entrada atrelados as saídas esperadas. Neste tipo de aprendizagem o objetivo é encontrar as regras que conseguem mapear aquelas entradas com aquelas saídas.
II. A aprendizagem por reforço é um tipo de treinamento usado onde enfrentamos um ambiente complexo. Através das tentativas e erro o computador busca uma solução para o problema. Para que a máquina entenda o que são acertos e erros ela receberá recompensas e penalidades durante o processo de busca da solução.
III. Quando o conjunto de dados repassado para o computador possui apenas os valores de saída possíveis (rótulos) mas não conhecemos nada a respeito dos valores das entradas, devemos fazer uso do processo de aprendizagem não supervisionada. Ela foi criada justamente para atender este cenário. Esse aprendizagem envolve complexidades adicionais quando comparada a aprendizagem supervisionada.
a) Apenas a afirmativa II está correta.
b) Apenas as afirmativas I e II estão corretas.
c) Apenas as afirmativas II e III estão corretas.
d) Apenas a afirmativa I está correta.
e) Todas as afirmativas estão corretas.

Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o tipo de gráfico mais adequado para análise dos referidos dados.
a) Pizza.
b) Tendência.
c) Dispersão.
d) Histograma.

O Processamento de Linguagem Natural (PLN) é a subárea da Inteligência Artificial responsável por estudar a capacidade e as limitações de uma máquina de entender a linguagem dos seres humanos. Para poder realizar essa modelagem, são necessários pré-processamentos que abstraem e estruturam a língua, deixando apenas aquilo que representa uma informação relevante. Uma das etapas desse processo compreende a normalização. Uma tarefa que pode ser realizada dentro do processo de normalização é denominada de tokenização lexical.
Considere a seguinte sentença: A área de Ciência de Dados é muito interessante! Assinale a alternativa correta que representa o resultado da tokenização lexical para essa sentença.
a) [‘A’, ‘área’, ‘de’, ‘Ciência’, ‘de’, ‘Dados’, ‘é’, ‘muito’, ‘interessante’, ‘!’]
b) [‘A’, ‘área’, ‘Ciência’, ‘Dados’, ‘interessante’, ‘!’]
c) [‘A área de Ciência de Dados é muito interessante!’]
d) A ÁREA DE CIÊNCIA DE DADOS É MUITO INTERESSANTE!

A palavra cluster, do inglês, pode ser traduzida para o Português como aglomerado ou agrupamento. Na computação, essa palavra é utilizada em redes de computadores para designar o agrupamento de computadores para armazenamento e processamento de dados em software quando se busca analisar dados armazenados e que podem ser processados por técnicas de aprendizado de máquina. Nessas duas situações, é necessário identificar corretamente a quantidade de clusters que formam determinado sistema.
Considerando a figura a seguir, selecione a opção que melhor representa a quantidade de clusters.
a) 5
b) 10
c) 2
d) 3

A técnica de redução de dimensionalidade (PCA) permite transformar dados que inicialmente pertencem a um espaço de dimensão n em um espaço de dimensão m, em que m < n , sendo utilizada, por exemplo, para reduzir a dimensionalidade de certo conjunto de dados através do descarte de características não úteis e que ainda permita realizar o reconhecimento de padrões.
Julgue o item que se seguem.
Certo
Errado

As aplicações em inteligência artificial são definidas como uma subárea da área de aprendizagem de máquina (machine learning).
Certo
Errado

A utilização de valores aleatórios nos métodos modernos de inicialização dos pesos das camadas das redes neurais artificiais (RNA) permite evitar o problema do desaparecimento do gradiente (vanishing gradient problem).
Certo
Errado

Ao analisar um grande volume de dados, João encontrou algumas anomalias, por exemplo: pessoas com mais de 200 anos de idade e salário de engenheiro menor que salário de pedreiro.
A operação de limpeza da fase de preparação de dados para tratar os pontos extremos existentes em uma série temporal a ser executada por João é:
a) Normalização
b) Discretização
c) Classificação
d) Tratamento de outlier
e) Redução de dimensionalidade

O Chefe do Departamento de Treinamento de Modelos de I.A de determinado Banco de Investimento recebe em sua sala cinco cientistas de dados (cada um com um diferente modelo treinado e desenvolvido) e verifica que todos eles possuem a mesma queixa: o comprometimento da capacidade de generalização em decorrência da problemática do overfitting.
Cada opção abaixo representa um modelo desenvolvido e a respectiva proposta de solução de um dos cientistas de dados. Assim assinale a opção com a proposta INCORRETA.
a) Regressão Linear Composta. Retirar penalidade LASSO do modelo.
b) Regressão Logística. Reduzir número de variáveis explicativas.
c) Rede Neural Artificial. Aplicar técnica de early stopping.
d) Rede Neural Artificial. Reduzir a quantidade de camadas de neurônios.
e) Random Forest. Aumentar número de árvores de decisão.

O Departamento Secreto X da Marinha do Brasil se deparou com um conjunto de casos nos quais a etapa de pré-processamento foi crucial para o bom funcionamento dos diferentes sistemas que usam algoritmos de Aprendizado de Máquina.
Assinale a opção que corresponde ao uso da correta tarefa de preparação de dados, dentre os diferentes contextos (case) apresentados, segundo o processo KDD descrito por Goldschmidt (2015).
a) Picos no sistema interno da Fragata Tango fazem com que os radares detectem distâncias erradas, multiplicadas por altíssimo fator de erro, que faz o valor da distância fugir de um intervalo de valor plausível. Um algoritmo de remoção de outlier foi desenvolvido para remover amostras com ordens de grandeza anômalas. Neste caso, a tarefa de redução de dados vertical foi aplicada.
b) O Sistema de Monitoramento de Caças da Aviação Naval registrou um grande conjunto de dados e foi verificada uma elevada quantidade de pares de variáveis com correlações extremamente próximas a 100% (como a observada entre a quantidade de combustível consumido e a distância percorrida). Neste caso, aplicou-se o algoritmo de PGA (Principal Component Analysis).
c) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o objetivo de prever as condições de saúde de diferentes militares. Foi aplicada uma amostragem sobre a grande população inicial de indivíduos mantendo-se a proporção em relação à faixa etária por meio do método de redução de dados vertical.
d) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o objetivo de prever as condições de saúde de diferentes militares e uma das tarefas de pré-processamento utilizada foi a codificação que considera militares casados representados por "0001", militares solteiros ou divorciados como "0010", militares viúvos como "0100" e outros como "1000". Neste caso, o tipo de codificação aplicado foi binário por temperatura.
e) Antes do fornecimento de dados à rede neural profunda para detecção de mísseis, foi aplicado o algoritmo no qual cada distância foi subtraída da média amostral e dividida pela variância amostral. Desse modo, a tarefa de pré-processamento utilizada foi de enriquecimento de dados.

O sckit-learn suporta o processamento de algoritmos de aprendizado de máquina do tipo supervisionado como, por exemplo,
Assinale a alternativa correta.
a) o SVM e a clusterização.
b) o BIRCH e o vizinho mais próximo.
c) o PCA e os gaussian mixture models.
d) o naive bayes e as árvores de decisão.
e) o modelo cúbico e a densidade estimada.

Analise o script abaixo from pandas import DataFrame import matplotlib.pyplot as plt from sklearn.cluster import KMeans Data = {'x': [36,35,23,28,34,32,30,23,36,34,66,55,56,44,51,56,52,51,64,48,49,50,36,34,43,46,40,42,52,47], 'y': [76,52,52,79,60,73,73,58,70,76,52,33,41,45,52,37,36,59,60,51,26,21,15,13,21,10,30,28,10,17]} df = DataFrame(Data,columns=['x','y']) m = KMeans(n_clusters=3).fit(df) d = m.cluster_centers_ plt.xlabel("X") plt.ylabel("Y") plt.scatter(df['x'], df['y'], c= m.labels_.astype(float), s=100, alpha=0.5) plt.scatter(d[:, 0], d[:, 1], c='red', s=250, marker='*') plt.grid() plt.show() O resultado da execução é As estrelas indicam
Assinale a alternativa correta.
a) componentes principais.
b) centros de voronoi.
c) covariâncias.
d) centroides.
e) clusteres.

Aplicações de reconhecimento de voz fazem a transcrição de um áudio para texto diretamente, sem a necessidade de nenhum modelo intermediário.
Certo
Errado

A correta definição do termo “inteligência artificial” é tratar-se de:
a) uma tecnologia que interliga uma rede de computadores conectando dispositivos, pessoas e até animais através da nuvem
b) uma tecnologia que visa facilitar o trabalho com marketing digital, ao mesmo tempo em que traz mais eficiência e otimiza os processos dessa estratégia, aumentando as chances de sucesso
c) um sistema de identificação que permite rastrear e categorizar itens ou dispositivos, por meio da internet
d) uma ciência multidisciplinar que busca desenvolver e aplicar técnicas computacionais que simulem o comportamento humano em atividades específicas

Prévia do material em texto

Inteligência Artificial para Fiscal de Tributos Estaduais (SEFAZ MT) 2023 (
https://www.tecconcursos.com.br/s/Q2apFd )
Ordenação: Por Matéria
TI - Desenvolvimento de Sistemas
Questão 1: FGV - AFRE MG/SEF MG/Tecnologia da Informação/2023
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A recente explosão de machine learning e deep learning tornou os tensores populares. TensorFlow e
PyTorch são dois frameworks com suporte a API de tensor.
Em relação aos tensores, assinale a opção incorreta.
 a) Tensor representa um array multidimensional junto com operações definidas.
 b) Os tensores, internamente, são implementados como estruturas de dados leves que mantêm um
ponteiro para o armazenamento e outros metadados, como tamanho e forma.
 c) Os próprios dados do tensor são armazenados em um buffer contíguo.
 d) Utilizar um buffer contíguo permite que vários tensores compartilhem os mesmos dados, mas
forneçam diferentes visualizações.
 e) Quando os tensores têm dimensões diferentes, certas operações não podem ser realizadas sem
primeiro colocar os tensores nas mesmas dimensões, para isso possuem a operação automática
denominada replicação.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2266853
Questão 2: FGV - AFRE MG/SEF MG/Tecnologia da Informação/2023
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
As opções a seguir descrevem os passos de uma técnica genérica de deduplicação. A entrada é um novo
bloco de dados (chunk) de um arquivo “DC” e a saída é um bloco de dados se é encontrado.
 
A esse respeito, assinale a opção incorreta.
 a) Obtenha o novo bloco de dados do arquivo DC a ser armazenado.
 b) Identifique o formato de um bloco de dados DC e o divida em objetos (fixos ou variáveis). Assim,
DC= {dc1, dc2, ..., dcn}, onde dc1, dc2, ..., dcn são objetos.
 c) Determine o valor hash ou o fingerprint. Assim, hv(DC) é o novo bloco de dados do arquivo DC.
 d) Combine o valor hash de um novo bloco de dados hv(DC) com os valores hash anteriores ou
existentes {hv1,hv2,..,hvn} no armazenamento ou memória, {hv1,hv2,..,hvn} são valores hash de blocos
de dados já armazenados.
 e) Atualize o bloco de dados, se houver uma correspondência. Caso contrário, armazene o novo bloco
de dados na memória e mantenha o novo índice.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2266855
Questão 3: CEBRASPE (CESPE) - AAAJ (DP DF)/DP DF/Informática Banco de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item subsequente, a respeito de inteligência artificial.
 
A inteligência artificial geralmente se enquadra em duas categorias abrangentes: narrow AI, às vezes
referida como weak AI, que é uma simulação da inteligência humana e opera dentro de um contexto
limitado; e AGI (artificial general intelligence), que é uma máquina com inteligência geral e, assim como
um ser humano, pode aplicar essa inteligência para resolver qualquer problema.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1970721
Questão 4: CEBRASPE (CESPE) - AAAJ (DP DF)/DP DF/Informática Banco de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item subsequente, a respeito de inteligência artificial.
 
Computação cognitiva, um subcampo da inteligência artificial, refere-se à computação que se concentra
no raciocínio e na compreensão em alto nível, sendo análoga à cognição, à lógica e ao julgamento
humanos.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1970723
Questão 5: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A respeito do Robotic Process Automation (RPA), assinale a afirmativa correta.
 a) Possui baixa precisão nos resultados.
 b) Executa tarefas humanas de rotina.
 c) Realiza tarefas desde que envolva cálculos.
 d) Necessita de customização para interagir com outros sistemas.
 e) Dispensa a utilização de controlroom (sala de controle).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1989837
Questão 6: CEBRASPE (CESPE) - Esc Pol (PC PB)/PC PB/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A capacidade de um agente computacional de alterar o próprio comportamento com base em situações
anteriores é chamada de
 a) autonomia.
 b) cooperatividade.
 c) inteligência.
 d) aprendizagem.
 e) proatividade.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2013082
Questão 7: DIRENS Aeronáutica - EAOAp (CIAAR)/CIAAR/Análise de Sistemas/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Informe Verdadeiro (V) ou Falso (F) em relação às seguintes afirmativas abaixo.
 
Em seguida marque a opção que apresenta a sequência correta:
 
( ) As abordagens de redução de dados vertical conhecidas como Filter realizam a seleção de
atributos sem considerar o algoritmo de mineração de dados que será utilizado aos atributos
selecionados. Por outro lado, as abordagens conhecidas como Wrapper experimentam o algoritmo de
mineração de dados para cada conjunto selecionado, avaliando os resultados obtidos.
 
( ) Os algoritmos de clusterização e classificação automática visam modelar os dados utilizando
padrões locais enquanto que algoritmos de regras de associação procuram modelar os dados
utilizando padrões globais.
 
( ) São exemplos de métodos de clusterização: k-means, k-Modes, k-medoids e BIRCH
 
( ) São exemplos de métodos de descoberta de sequencias: GSP, CART, MSDD, SPADE
 a) (F); (V); (F); (V).
 b) (F); (V); (V); (F).
 c) (V); (F); (F); (V).
 d) (V); (F); (V); (F).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2058686
Questão 8: QUADRIX - Ana Sis I (CRA PR)/CRA PR/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Com relação aos conceitos de machine learning e deep learning, julgue o item.
 
Para que os algoritmos de deep learning sejam capazes de analisar dados não estruturados, é
imprescindível que haja algum tipo de pré-processamento do conjunto de dados a ser analisado.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2106501
Questão 9: QUADRIX - Ana Sis I (CRA PR)/CRA PR/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Com relação aos conceitos de machine learning e deep learning, julgue o item.
 
O deep learning pode ser definido como sendo a aplicação de uma quantidade massiva de camadas de
processamento em um algoritmo de rede neural.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2106502
Questão 10: IDECAN - AJ (TJ PI)/TJ PI/Apoio Especializado/Analista de Sistemas - Banco
de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Machine Learning possui um grande conjunto de técnicas e algoritmos consagrados. Por possuírem
características específicas, essas técnicas e algoritmos são adequados ou não para a solução de um
problema, a depender do tipo de aprendizagem que será utilizado.
 
Marque a alternativa que indica o nome de um algoritmo que NÃO faz parte dos utilizados em cenários
onde a aprendizagem supervisionada está presente.
 a) KNN
 b) K-means
 c) Redes Neurais
 d) Árvore de Decisão
 e) SVM
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2196712
Questão 11: IDECAN - AJ (TJ PI)/TJ PI/Apoio Especializado/Analista de Sistemas - Banco
de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Machine Learning é um ramo da ciência da computação que utiliza conceitos das áreas de Estatística,
Engenharia e da própria Computação com o objetivo de reconhecer padrões e ensiná-los a uma
máquina. Além das áreas citadas, outro aspecto importante para Machine Learningsão os dados. Sem
eles não é possível viabilizar o treinamento da máquina. Esses dados devem estar relacionados ao tema
para o qual a máquina será treinada. Isso é fundamental pois o objetivo de Machine Learning é permitir
que a máquina seja capaz de evidenciar informações que um humano não perceberia facilmente,
permitindo, por exemplo, a predição de eventos ou a execução de diagnósticos precisos.
 
A respeito dos fundamentos que envolvem Machine Learning, analise as afirmativas abaixo e marque
alternativa correta.
 
I. No processo de aprendizagem supervisionada o computador recebe um conjunto de dados. Ele
encontrará neste conjunto dados de entrada atrelados as saídas esperadas. Neste tipo de
aprendizagem o objetivo é encontrar as regras que conseguem mapear aquelas entradas com
aquelas saídas.
 
II. A aprendizagem por reforço é um tipo de treinamento usado onde enfrentamos um ambiente
complexo. Através das tentativas e erro o computador busca uma solução para o problema. Para que
a máquina entenda o que são acertos e erros ela receberá recompensas e penalidades durante o
processo de busca da solução.
 
III. Quando o conjunto de dados repassado para o computador possui apenas os valores de saída
possíveis (rótulos) mas não conhecemos nada a respeito dos valores das entradas, devemos fazer
uso do processo de aprendizagem não supervisionada. Ela foi criada justamente para atender este
cenário. Esse aprendizagem envolve complexidades adicionais quando comparada a aprendizagem
supervisionada.
 a) Apenas a afirmativa II está correta.
 b) Apenas as afirmativas I e II estão corretas.
 c) Apenas as afirmativas II e III estão corretas.
 d) Apenas a afirmativa I está correta.
 e) Todas as afirmativas estão corretas.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2196724
Questão 12: Com. Org. (IFSP) - Ana TI (IF SP)/IF SP/Ciência de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software
acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos
dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados
extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados
à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o
tipo de gráfico mais adequado para análise dos referidos dados.
 a) Pizza.
 b) Tendência.
 c) Dispersão.
 d) Histograma.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2200271
Questão 13: Com. Org. (IFSP) - Ana TI (IF SP)/IF SP/Ciência de Dados/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
O Processamento de Linguagem Natural (PLN) é a subárea da Inteligência Artificial responsável por
estudar a capacidade e as limitações de uma máquina de entender a linguagem dos seres humanos. Para
poder realizar essa modelagem, são necessários pré-processamentos que abstraem e estruturam a
língua, deixando apenas aquilo que representa uma informação relevante. Uma das etapas desse
processo compreende a normalização. Uma tarefa que pode ser realizada dentro do processo de
normalização é denominada de tokenização lexical. Considere a seguinte sentença:
 
A área de Ciência de Dados é muito interessante!
 
Assinale a alternativa correta que representa o resultado da tokenização lexical para essa sentença.
 a) [‘A’, ‘área’, ‘de’, ‘Ciência’, ‘de’, ‘Dados’, ‘é’, ‘muito’, ‘interessante’, ‘!’]
 b) [‘A’, ‘área’, ‘Ciência’, ‘Dados’, ‘interessante’, ‘!’]
 c) [‘A área de Ciência de Dados é muito interessante!’]
 d) A ÁREA DE CIÊNCIA DE DADOS É MUITO INTERESSANTE!
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2200358
Questão 14: Com. Org. (IFSP) - Tec (IF SP)/IF SP/Tecnologia da Informação/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A palavra cluster, do inglês, pode ser traduzida para o Português como aglomerado ou agrupamento. Na
computação, essa palavra é utilizada em redes de computadores para designar o agrupamento de
computadores para armazenamento e processamento de dados em software quando se busca analisar
dados armazenados e que podem ser processados por técnicas de aprendizado de máquina. Nessas duas
situações, é necessário identificar corretamente a quantidade de clusters que formam determinado
sistema. Considerando a figura a seguir, selecione a opção que melhor representa a quantidade de
clusters.
 
 a) 5
 b) 10
 c) 2
 d) 3
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2204563
Questão 15: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item a seguir, relativos a aprendizado supervisionado.
 
A despeito do alto grau de aplicabilidade das técnicas de regularização na classificação e na regressão,
no que se refere à sua acurácia, tais técnicas tendem a causar o sobreajuste (overfitting) devido à
influência de coeficientes responsáveis por flutuações excessivas.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208924
Questão 16: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item a seguir, relativos a aprendizado supervisionado.
 
Considerando-se, nos gráficos a seguir, que o resultado #2 corresponda ao melhor desempenho do
algoritmo, é correto afirmar que o resultado #1 indica que houve underfitting.
 
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208930
Questão 17: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item a seguir, relativos a aprendizado supervisionado.
 
O trade off entre variância e viés é afetado pela utilização de polinômios, com graus que variam de zero
a três, em que o emprego de polinômios de ordem ímpar produz sempre melhores resultados no que diz
respeito à redução da variância e viés que os de ordem par, seja para estimativas com regressões locais
constantes e lineares, seja para as estimativas de ordem quadrática e cúbica.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208934
Questão 18: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Em relação a aprendizado não supervisionado, julgue o item que se seguem.
 
A ação de realizar agrupamento hierárquico tem como premissa básica encontrar elementos em um
conjunto de dados que impliquem a presença de outros elementos na mesma transação, com um grau
de certeza definido pelos índices de fator de suporte e o fator de confiança, que pode ser realizado, por
exemplo, por meio do algoritmo a priori.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208941
Questão 19: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Em relação a aprendizado não supervisionado, julgue o item que se seguem.
 
O algoritmo random forest é um algoritmo de aprendizado de máquina supervisionado em que se
agrupam os resultados de várias árvores de decisão de cada nó para se obter uma conclusão própria e
aumentar a precisão do modelo, não sendo o referido algoritmo adequado para grandes conjuntos de
dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208942
Questão 20: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Em relação a aprendizadonão supervisionado, julgue o item que se seguem.
 
A técnica de redução de dimensionalidade (PCA) permite transformar dados que inicialmente pertencem
a um espaço de dimensão n em um espaço de dimensão m, em que m < n , sendo utilizada, por
exemplo, para reduzir a dimensionalidade de certo conjunto de dados através do
descarte de características não úteis e que ainda permita realizar o reconhecimento de padrões.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208946
Questão 21: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o próximo item, a respeito dos métodos de aprendizagem de máquina.
 
As aplicações em inteligência artificial são definidas como uma subárea da área de aprendizagem de
máquina (machine learning).
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208953
Questão 22: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o próximo item, a respeito dos métodos de aprendizagem de máquina.
 
As redes neurais convolucionais (CNN) são aplicadas exclusivamente a problemas de regressão de dados,
a partir da utilização da função de regressão logística.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208955
Questão 23: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o próximo item, a respeito dos métodos de aprendizagem de máquina.
 
A utilização de valores aleatórios nos métodos modernos de inicialização dos pesos das camadas das
redes neurais artificiais (RNA) permite evitar o problema do desaparecimento do gradiente (vanishing
gradient problem).
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208959
Questão 24: FGV - ACE (TCE TO)/TCE TO/Tecnologia da Informação/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Ao analisar um grande volume de dados, João encontrou algumas anomalias, por exemplo: pessoas com
mais de 200 anos de idade e salário de engenheiro menor que salário de pedreiro.
A operação de limpeza da fase de preparação de dados para tratar os pontos extremos existentes em
uma série temporal a ser executada por João é:
 a) Normalização;
 b) Discretização;
 c) Classificação;
 d) Tratamento de outlier;
 e) Redução de dimensionalidade.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220057
Questão 25: Marinha - QT (Marinha)/Marinha/Informática/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
O Chefe do Departamento de Treinamento de Modelos de I.A de determinado Banco de Investimento
recebe em sua sala cinco cientistas de dados (cada um com um diferente modelo treinado e
desenvolvido) e verifica que todos eles possuem a mesma queixa: o comprometimento da capacidade de
generalização em decorrência da problemática do overfitting. Cada opção abaixo representa um modelo
desenvolvido e a respectiva proposta de ·solução de um dos cientistas de dados. Assim assinale a opção
com a proposta INCORRETA.
 a) Regressão Linear Composta. Retirar penalidade LASSO do modelo.
 b) Regressão Logística. Reduzir número de variáveis explicativas.
 c) Rede Neural Artificial. Aplicar técnica de early stopping.
 d) Rede Neural Artificial. Reduzir a quantidade de camadas de neurônios.
 e) Random Forest. Aumentar número de árvores de decisão.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220766
Questão 26: Marinha - QT (Marinha)/Marinha/Informática/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
O Departamento Secreto X da Marinha do Brasil se deparou com um conjunto de casos nos quais a etapa
de pré-processamento foi crucial para o bom funcionamento dos diferentes sistemas que usam
algoritmos de Aprendizado de Máquina. Assinale a opção que corresponde ao uso da correta tarefa de
preparação de dados, dentre os diferentes contextos ( case) apresentados, segundo o processo KDD
descrito por Goldschmidt (2015).
 a) Picos no sistema interno da Fragata Tango fazem com que os radares detectem distâncias erradas,
multiplicadas por altíssimo fator de erro, que faz o valor da distância fugir de um intervalo de valor
plausível. Um algoritmo de remoção de outlier foi desenvolvido para remover amostras com ordens de
grandeza anômalas. Neste caso, a tarefa de redução de dados vertical foi aplicada.
 b) O Sistema de Monitoramento de Caças da Aviação Naval registrou um grande conjunto de dados e
foi verificada uma elevada quantidade de pares de variáveis com correlações extremamente próximas a
100% (como a observada entre a quantidade de combustível consumido e a distância percorrida). Neste
caso, aplicou-se o algoritmo de PGA (Principal Component Analysis).
 c) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o
objetivo de prever as condições de saúde de diferentes militares. Foi aplicada uma amostragem sobre a
grande população inicial de indivíduos mantendo-se a proporção em relação à faixa etária por meio do
método de redução de dados vertical.
 d) O Sistema "PrevSaude" foi desenvolvido utilizando algoritmos de Aprendizado de Máquina com o
objetivo de prever as condições de saúde de diferentes militares e uma das tarefas de pré-
processamento utilizada foi a codificação que considera militares casados representados por "0001",
militares solteiros ou divorciados como "0010", militares viúvos como "0100" e outros como "1000".
Neste caso, o tipo de codificação aplicado foi binário por temperatura.
 e) Antes do fornecimento de dados à rede neural profunda para detecção de misseis, foi aplicado o
algoritmo no qual cada distância foi subtraída da média amostral e dividida pela variância amostral.
Desse modo, a tarefa de pré-processamento utilizada foi de enriquecimento de dados.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220960
Questão 27: FGV - AJ TRT13/TRT 13/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
O sckit-learn suporta o processamento de algoritmos de aprendizado de máquina do tipo supervisionado
como, por exemplo,
 a) o SVM e a clusterização.
 b) o BIRCH e o vizinho mais próximo.
 c) o PCA e os gaussian mixture models.
 d) o naive bayes e as árvores de decisão.
 e) o modelo cúbico e a densidade estimada.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2233755
Questão 28: FGV - AJ TRT13/TRT 13/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Analise o script abaixo from pandas import DataFrame import matplotlib.pyplot as plt from sklearn.cluster
import KMeans
Data = {'x':
 
[36,35,23,28,34,32,30,23,36,34,66,55,56,44,51,56,52,51,64,48,49,50,36,34,43,46,40,42,52,47],
'y':
[76,52,52,79,60,73,73,58,70,76,52,33,41,45,52,37,36,59,60,51,26,21,15,13,21,10,30,28,10,17] }
 
df = DataFrame(Data,columns=['x','y'])
m = KMeans(n_clusters=3).fit(df)
d = m.cluster_centers_
plt.xlabel("X")
plt.ylabel("Y")
plt.scatter(df['x'], df['y'], c= m.labels_.astype(float),
s=100, alpha=0.5)
plt.scatter(d[:, 0], d[:, 1], c='red', s=250, marker='*')
plt.grid()
plt.show()
O resultado da execução é
 
 
As estrelas indicam
 a) componentes principais.
 b) centros de voronoi.
 c) covariâncias.
 d) centroides.
 e) clusteres.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2233759
Questão 29: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item a seguir, referentes a conceitose especificidades de MDM (master data management).
 
A grande diferença entre algoritmos fuzzy matching e stemming reside no fato de que, enquanto o
primeiro combina palavras com a mesma raiz linguística, o segundo trabalha com semelhanças de
ortografia.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628709
Questão 30: CEBRASPE (CESPE) - AF (SEFAZ CE)/SEFAZ CE/Tecnologia da Informação da
Receita Estadual/2021
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A respeito de inteligência artificial, julgue o item seguinte.
 
Aplicações de reconhecimento de voz fazem a transcrição de um áudio para texto diretamente, sem a
necessidade de nenhum modelo intermediário.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1718788
Questão 31: SELECON - Prof (Lucas RV)/Pref L do Rio Verde/Informática/2021
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A correta definição do termo “inteligência artificial” é tratar-se de:
 a) uma tecnologia que interliga uma rede de computadores conectando dispositivos, pessoas e até
animais através da nuvem
 b) uma tecnologia que visa facilitar o trabalho com marketing digital, ao mesmo tempo em que traz
mais eficiência e otimiza os processos dessa estratégia, aumentando as chances de sucesso
 c) um sistema de identificação que permite rastrear e categorizar itens ou dispositivos, por meio da
internet
 d) uma ciência multidisciplinar que busca desenvolver e aplicar técnicas computacionais que simulem
o comportamento humano em atividades específicas
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1913444
Questão 32: IBADE - Prof (Vila Velha)/Pref Vila Velha/Tecnologias Educacionais/2020
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A Inteligência Artificial não está presente apenas nos filmes, centros de pesquisas ou empresas de
tecnologia, mas em nosso cotidiano, à nossa porta.
 
Os estudos e aplicações de IA visam aprimorar a computação cognitiva, por meio do desenvolvimento de
algoritmos que permitam às máquinas adquirirem capacidades antes apenas atribuídas a seres humanos,
tais como, a resolução de problemas, a compreensão da linguagem natural das conversações, a visão, a
apreensão e a interpretação de conteúdo. (https://www.ibm.com )
 
A ideia de IA com potencial de substituir o ser humano ou de automatizar determinadas atividades é,
mais propriamente, uma visão desta última década, substituída pelo desenvolvimento de aplicações que
ampliam ou complementam as habilidades cognitivas do homem, o que é denominado de:
 a) inteligência ampliada.
 b) sistema complexo.
 c) tecnologia alterada.
 d) algoritmo adaptado.
 e) linguagem diferenciada.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1224796
Questão 33: Instituto AOCP - Cie D (MJSP)/MJSP/Big Data/2020
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A inteligência artificial (IA) pode ser aplicada hoje em diferentes áreas. Uma dessas áreas é a de análise
de dados que, dependendo do contexto, refere-se a uma grande quantidade de possíveis operações de
dados, às vezes específicas de determinados setores ou tarefas. Sabendo disso, assinale a alternativa
que apresenta corretamente as quatro grandes categorias do processo de análise de dados com o uso da
IA.
 a) Carga, correção, transformação e uso.
 b) Identificação, transformação, apresentação e decisão.
 c) Triagem, carga, limpeza e apresentação.
 d) Processamento, modelagem, triagem e apresentação.
 e) Transformação, limpeza, inspeção e modelagem.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1376708
Questão 34: COCP IFMT - PEBTT (IF MT)/IF MT/Informática/2018
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Em seu site institucional, a Gartner Group afirma que “a inteligência artificial (IA) gera valor com base
nos resultados de negócios em torno da experiência do cliente, redução de custos e geração de receita.
Os CIOs de sucesso entendem que os aplicativos de IA são mais do que projetos técnicos e táticos - e
que a aplicação da IA como uma capacidade tecnológica pode possibilitar novas oportunidades e ajudar a
atingir as metas de negócios”. Tais aplicações, incluindo os Sistemas de Apoio à Decisão (SAD) utilizam
de diversas tecnologias de IA para entregar resultados a gestores. Das sentenças a seguir, qual não
corresponde corretamente a um tipo de sistema especialista:
 a) Os sistemas especialistas procuram através de suas bases de conhecimento formular conclusões
denominadas mecanismos de inferência que “dispara” as regras relacionadas aos fatos que o usuário
reuniu e inseriu.
 b) Baseado em regras imprecisas, os sistemas especialistas baseados em lógica fuzzy utilizam valores
aproximados e subjetivos para criar escalas de valores. Utilizada para apresentar soluções para
problemas difíceis de representar na lógica tradicional SE_ENTÃO.
 c) Os sistemas especialistas baseados em Redes Neurais são utilizados para resolver problemas
específicos e bem delineados. Eles são programados para funcionar mudando e reorganizando suas
partes componentes, por meio de processos, como reprodução, mutação e seleção natural de seus
neurônios.
 d) Os sistemas especialistas baseados em Agentes Inteligentes são programas que trabalham sem a
intervenção humana direta, em grandes quantidades de informação, executando tarefas específicas,
repetitivas e previsíveis para um único usuário, processo de negócio ou software de aplicativo.
 e) Sistemas com Raciocínio Baseado em Casos é um tipo de sistema especialista que utiliza das
experiências passadas feitas por especialistas humanos e que foram armazenadas em um banco de
dados, para solucionar novos casos com características semelhantes. Soluções de sucesso são anexadas
ao novo caso e armazenadas para se tornar, também, fonte de consulta futura.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1110592
Questão 35: QUADRIX - Ana (CFO)/CFO/Desenvolvimento de Sistemas de
Informação/2017
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item que se segue acerca de engenharia de software e inteligência computacional.
 
Inteligência computacional é um conjunto de métodos e(ou) técnicas que procura desenvolver sistemas
dotados de comportamento semelhante a certos aspectos do comportamento inteligente.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1055759
Questão 36: QUADRIX - Ana (CFO)/CFO/Desenvolvimento de Sistemas de
Informação/2017
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item que se segue acerca de engenharia de software e inteligência computacional.
 
São exemplos de técnicas de inteligência computacional os algoritmos genéticos, as redes neurais e a
lógica nebulosa (fuzzy).
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1055760
Questão 37: IESES - Ass (CRC SC)/CRC SC/Jurídico/2015
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Uma linguagem de programação é um conjunto de convenções e regras que especificam como instruir o
computador a executar determinadas tarefas. Os sistemas que utilizam mecanismos da área da
Inteligência Artificial, como por exemplo, sistemas especialistas são denominados de:
 a) Linguagem de montagem.
 b) Linguagem orientada ao usuário.
 c) Linguagem em nível de máquina.
 d) Linguagem do conhecimento.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1005639
Questão 38: CS UFG - Tec Lab (UEAP)/UEAP/Engenharia de Produção/2014
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
São exemplos de inteligência artificial (AI) utilizados em sistemas de informação:
 a) Lógica fuzzy, redes neuraise algoritmos genéticos.
 b) RFID, CRM e ERP.
 c) Datamining, drill-down e banco de dados.
 d) Bluetooth, Wi-Fi e internet.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/1876526
Questão 39: CEBRASPE (CESPE) - Temp NS (MPOG)/MPOG/Atividade Técnica de
Complexidade Intelectual/Tecnologia da Informação/2013
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
Julgue o item, a respeito dos conceitos de inteligência computacional.
 
Um dos modelos de garimpagem de dados que pode ser utilizado na fase de análise é a agregação, que
tem por objetivo calcular a probabilidade de uma amostra desconhecida pertencer a cada uma das
classes possíveis, isto é, predizer a classe mais provável.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1547451
Questão 40: CESGRANRIO - PPNS (PETROBRAS)/PETROBRAS/Analista de
Sistemas/Processos de Negócio/2012
Assunto: Conceitos Iniciais e Gerais de Inteligência Artificial
A construção de sistemas de informação com técnicas de inteligência artificial refere-se, muitas vezes, à
tendência de as pessoas pensarem em certos objetos ou máquinas como se esses tivessem
características humanas.
Essa tendência é denominada
 a) autorreplicação
 b) antropomorfismo
 c) personalização
 d) polimorfismo
 e) interação
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/222453
Questão 41: FGV - Aud Est (CGE SC)/CGE SC/Ciências da Computação/2023
Assunto: Sistemas de Aprendizado de Máquina
Considere o algoritmo K-Means. Suponha os seguintes pontos: x1=(1,2,5); x2=(3,4,2); x3=(9,5,3); x4=
(7,6,1); x5=(2,3,5); x6=(8,7,2). Escolha x1 e x4 como centros iniciais.
Assinale a opção que apresenta corretamente os pontos em que seriam formados os grupos após a
primeira iteração e quais seriam os novos centros.
 a) Grupo 1: {x1, x3, x5}, Grupo 2: {x2, x4, x6}. Centros: c1= (4,3,4), c2 = (6,5,1).
 b) Grupo 1: {x1, x2}, Grupo 2: {x3, x4}, Grupo 3: {x5, x6}. Centros: c1=(2,3,3), c2 = (8,5,2) , c3 =
(5,5,3).
 c) Grupo 1: {x1, x2, x5}, Grupo 2: {x3, x4, x6}. Centros: c1= (2,3,4), c2 = (8,6,2).
 d) Grupo 1: {x1, x2, x3}, Grupo 2: {x4, x5, x6}. Centros: c1= (4,3,3), c2 = (5,5,2).
 e) Grupo 1: {x2, x3, x5}, Grupo 2: {x1, x4, x6}. Centros: c1= (4,4,3), c2 = (5,5,2).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2295384
Questão 42: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de
underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem
de máquina adotado, com o erro de predição.
A região do gráfico entre as duas curvas, indicada pela letra B, mostra a região de erro de generalização
para o modelo de aprendizado de máquina.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936914
Questão 43: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Os modelos ditos fracos, também chamados modelos de base, muitas vezes são combinados com o
objetivo de se construir um modelo mais forte, no qual a variância e o viés atinjam equilíbrio satisfatório.
Esse procedimento, denominado ensembles, é muito utilizado em ciência de dados e aprendizado de
máquinas. Quanto às formas de ensembles, julgue o próximo item.
O ensemble denominado bagging tem como foco principal a redução do viés e não da variância,
treinando-se os modelos em sequência, tal que os erros dos primeiros modelos treinados são utilizados
para o ajuste nos pesos matemáticos dos próximos modelos.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936925
Questão 44: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer
previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto
utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma
série de ferramentas utilizadas no ajuste de modelos e no pré-processamento de dados, para a seleção e
avaliação de modelos.
Tendo como referência essas informações, julgue o item a seguir.
No código a seguir, DecisionTreeClassifier é um classificador que recebe como entrada dois arrays: um
array X, de valores inteiros, contendo os rótulos de classe para as amostras de treinamento; e um array
Y, esparso ou denso, contendo as amostras de treinamento.
>>> from sklearn import tree
>>> X = [[0, 0], [1, 1]]
>>> Y = [0, 1]
>>> clf = tree.DecisionTreeClassifier()
>>> clf = clf.fit(X, Y)
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936926
Questão 45: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer
previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto
utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma
série de ferramentas utilizadas no ajuste de modelos e no pré-processamento de dados, para a seleção e
avaliação de modelos.
Tendo como referência essas informações, julgue o item a seguir.
 
SVC, NuSCV e LinearSVC são classes do scikit-learn capazes de realizar classificação binária e multiclasse
em um conjunto de dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936927
Questão 46: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Os hiperparâmetros de um modelo são todos os parâmetros que podem ser definidos antes do inicio do
treinamento, diferentemente dos parâmetros do modelo, que são aprendidos durante o treino do modelo.
A busca por hiperparâmetros de determinado algoritmo de aprendizado de máquina que retorne o
melhor desempenho medido em um conjunto de validação deu origem ao conceito de otimização de
hiperparâmetros.
Acerca dos conceitos de otimização de hiperparâmetros de modelos de aprendizado de máquinas, julgue
o item que se segue.
A otimização bayesiana se utiliza do conceito de probabilidade para encontrar o valor de entrada de uma
função que possa retornar o menor valor de saída possível. Nesse método, o número de iterações de
pesquisa pode ser reduzido a partir da escolha dos valores de entrada, levando em consideração os
resultados anteriores, o que caracteriza um processo iterativo.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936928
Questão 47: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a machine learning aplicado, julgue o próximo item.
Classificação de imagens é um método de aprendizado não supervisionado no qual se aplica um modelo
de treinamento para o reconhecimento de padrões gráficos presentes em amostras de imagens.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936956
Questão 48: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a machine learning aplicado, julgue o próximo item.
 
Mask RCNN (region-based convolutional neural network) é um método para segmentação de objetos e
instâncias que se baseia em detecção, enquanto o método SSAP (single-shot instance segmentation) se
baseia em pixels.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936958Questão 49: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a machine learning aplicado, julgue o próximo item.
 
Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado
de uma frase.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936960
Questão 50: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a machine learning aplicado, julgue o próximo item.
 
O CBOW é um modelo de aprendizado de máquina desenhado para prever contexto com base em
determinada palavra.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936961
Questão 51: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a machine learning aplicado, julgue o próximo item.
 
Suponha que a palavra amor ocorra 1.000 vezes no último livro escrito por certo autor, que escreveu, no
total, 10 livros. Nesse caso, se a palavra amor for encontrada em todos os livros desse autor, então o
valor do TF-IDF (term frequencyinverse document frequency) referente à palavra amor no último livro
escrito será igual a 1/1.000.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936964
Questão 52: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Com respeito a métodos para imputação de dados, julgue o seguinte item.
O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade
presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de
distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap
metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos
resultados da imputação.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936972
Questão 53: CEBRASPE (CESPE) - ATT (SEFAZ SE)/SEFAZ SE/2022
Assunto: Sistemas de Aprendizado de Máquina
No aprendizado de máquina, o algoritmo de classificação considerado mais rudimentar e simples, que
cria o modelo simplesmente baseado na moda da classe, ou seja, classifica todas as instâncias de acordo
com a classe dominante, é conhecido como
 a) ZeroR.
 b) validação cruzada.
 c) florestas aleatórias.
 d) K-means.
 e) DBSCAN.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1942670
Questão 54: CEBRASPE (CESPE) - AAAJ (DP DF)/DP DF/Informática Banco de Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Julgue o item subsequente, a respeito de inteligência artificial.
Machine learning é um tipo de aprendizado de máquina que executa entradas por meio de uma
arquitetura de rede neural de inspiração biológica.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1970720
Questão 55: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Sistemas de Aprendizado de Máquina
Certo grupo de pesquisadores utilizou a regressão logística para construir um classificador binário que
estima se uma observação pertence a certo grupo de interesse. Este classificador é baseado em uma
única variável explicativa x.
Suponha que a função obtida, após o treinamento, é (com indicando que a
observação pertence ao grupo de interesse). Uma nova observação tem variável (3).
Esta nova observação deve ser classificada pelo classificador como
 a) pertencente ao grupo de interesse.
 b) inconclusivo.
 c) pertencente ao grupo de interesse e também ao seu complementar.
 d) não pertencente ao grupo de interesse.
 e) não pertencente nem ao grupo de interesse nem ao seu complementar.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990105
Questão 56: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Sistemas de Aprendizado de Máquina
Sobre aprendizado profundo (Deep Learning), é correto afirmar que
 a) só pode ser aplicado para produzir classificações binárias.
 b) consiste em aprendizado de um perceptron de uma camada única.
 c) é uma família de métodos de aprendizado de máquinas baseado em redes neurais com múltiplas
camadas.
 d) não é adequado para visão computacional.
 e) oferece a vantagem de sempre conter poucos parâmetros a ajustar durante o processo de
aprendizagem.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990108
Questão 57: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Sistemas de Aprendizado de Máquina
O algoritmo KNN (K-nearest neighbors ou k-vizinhos mais próximos) se insere na categoria de
 a) aprendizado por reforço.
 b) aprendizado não supervisionado.
 c) aprendizado supervisionado.
 d) redução de dimensionalidade.
 e) modelo paramétrico.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990111
Questão 58: FGV - AFCTE (Sefaz AM)/SEFAZ AM/2022
Assunto: Sistemas de Aprendizado de Máquina
x
p(x) = 1
1+ex
p(x) = 1
x ≈ ln
O tipo de aprendizado máquina, que consiste em treinar um sistema a partir de dados que não estão
rotulados e/ou classificados e utilizar algoritmos que buscam descobrir padrões ocultos que agrupam as
informações de acordo com semelhanças ou diferenças, é denominado
 a) dinâmico.
 b) sistêmico.
 c) por reforço.
 d) supervisionado.
 e) não supervisionado.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990665
Questão 59: FGV - AFTE (SEFAZ AM)/SEFAZ AM/2022
Assunto: Sistemas de Aprendizado de Máquina
Com relação ao algoritmo de K-Means, analise as afirmativas a seguir e assinale (V) para a verdadeira e
(F) para a falsa.
 
( ) Consiste em fixar k centroides de modo quadrático, sendo um para cada novo cluster.
 
( ) Associa cada indivíduo ao centroide do seu vizinho, obtido pelo cálculo da minimização da soma
quadrática das distâncias entre os dados e os centroides mais próximos.
 
( ) Recalcula os centroides com base nos indivíduos classificados.
 
As afirmativas são, na ordem apresentada, respectivamente,
 a) V – F – F.
 b) V – V – F.
 c) V – F – V.
 d) F – F – V.
 e) F – V – F.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1992142
Questão 60: FGV - Ana (MPE SC)/MPE SC/Dados e Pesquisas/2022
Assunto: Sistemas de Aprendizado de Máquina
Uma biblioteca está classificando os seus frequentadores em grupos literários para facilitar a aquisição e
a organização dos livros. Isso foi feito aplicando o algoritmo KNN ao banco de dados de usuários da
biblioteca, incluindo alguns dos campos de informação como atributos, tais como idade e nível de
formação acadêmica. Em um experimento, uma segunda classificação foi feita usando um conjunto maior
de atributos, incluindo ambos de maior ou menor relevância percebida com relação aos grupos definidos.
A segunda classificação tende a ser:
 a) diferente da primeira, pois o algoritmo perde acurácia com o aumento da quantidade de atributos;
 b) próxima à primeira, pois o algoritmo é robusto a ruído nos dados;
 c) diferente da primeira, pois o algoritmo sofrerá underfitting;
 d) próxima à primeira, pois o algoritmo pode balancear a influência dos atributos mais e menos
relevantes;
 e) diferente da primeira, pois o algoritmo é sensível a atributos não relevantes.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2058667
Questão 61: QUADRIX - Ana Sis I (CRA PR)/CRA PR/2022
Assunto: Sistemas de Aprendizado de Máquina
Com relação aos conceitos de machine learning e deep learning, julgue o item.
 
Os sistemas de machine learning podem ser empregados em situações em que os softwares tradicionais
não conseguemresolver os problemas ou que suas soluções não são consideradas como satisfatórias.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2106498
Questão 62: QUADRIX - Ana Sis I (CRA PR)/CRA PR/2022
Assunto: Sistemas de Aprendizado de Máquina
Com relação aos conceitos de machine learning e deep learning, julgue o item.
 
Um dos tipos de sistema machine learning é a aprendizagem supervisionada, que é caracterizada pela
aprendizagem de padrões com base na entrada (dados de treinamento) e que não apresenta um
feedback explícito quanto a esse aprendizado.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2106499
Questão 63: QUADRIX - Ana Sis I (CRA PR)/CRA PR/2022
Assunto: Sistemas de Aprendizado de Máquina
Com relação aos conceitos de machine learning e deep learning, julgue o item.
 
Entre as técnicas de machine learning, a random forest é capaz de solucionar problemas de classificação
e de regressão, por meio da construção e dos treinamentos de árvores de decisão.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2106500
Questão 64: FCC - TJ TRT4/TRT 4/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
Um Técnico necessitou estudar a respeito de aprendizado de máquina. Durante as pesquisas observou,
corretamente, que
 a) regras de associação são tarefas inerentes a modelos descritivos.
 b) regras de associação não representam padrões existentes nas transações de um banco de dados.
 c) para usar os algoritmos de regras de associação os dados no formato de tabela não necessitam ser
convertidos para o formato de transação.
 d) regras de associação são tarefas inerentes a modelos preditivos.
 e) em uma regra de associação deve existir uma definição explícita de classe.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2114249
Questão 65: FCC - AJ (TJ CE)/TJ CE/Ciência da Computação/Sistemas da Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
A implantação de uma solução de machine learning tipicamente passa por 5 fases. Na fase inicial, deve-
se ter clareza quanto à pergunta ou problema para o qual se busca uma solução e quanto às
informações que serão utilizadas, sejam elas de propriedade do interessado ou a serem adquiridas no
mercado. As outras fases são:
I. Treinar o modelo ajustando os atributos, parâmetros de treinamento e algoritmos até que o
modelo produza os resultados desejados. A validação é realizada comparando-se as predições com
os resultados reais.
II. Monitorar os resultados das predições para verificar se o modelo continua generalizando. Se
houver uma diminuição significativa na capacidade de predição do modelo, este deve ser treinado
novamente com novos dados ou até mesmo os algoritmos, atributos e parâmetros de treinamento
devem ser ajustados.
III. Definir o objetivo do aprendizado de máquina, estruturar o modelo que será o responsável por
realizar as predições e adequar os dados para os algoritmos selecionados.
IV. Verificar se o modelo generaliza. No caso de o modelo não generalizar, deve-se retornar para as
fases anteriores ou até mesmo para a fase inicial. Se generalizar, o modelo já pode seguir para a
produção.
A ordem sequencial correta das outras fases é:
 
FASE 2 FASE 3 FASE 4 FASE 5
 a) 
III I IV II
 b) 
I IV II III
 c) 
IV III I II
 d) 
I II III IV
 e) 
III II I IV
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2152882
Questão 66: FCC - AJ TRT22/TRT 22/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
Considere, abaixo, as situações que envolvem métodos de aprendizado de máquina que podem ser
supervisionados (S) ou não supervisionados (NS).
 
I. Uma empresa monitora e coleta dados em tempo real de mais de 1.000 veículos de divulgação,
100 mil blogs e das principais redes sociais do mundo. Utiliza um método capaz de identificar e
segmentar grupos de eleitores a favor ou contra determinado assunto, de acordo com o interesse do
cliente.
 
II. A partir de uma base de dados na qual são identificadas pessoas que estão fumando e pessoas
que não estão fumando, são formados dois subconjuntos disjuntos: a base de treino (contendo 70%
dos dados originais) e a base de teste (contendo o restante dos dados originais, 30%). Em seguida,
a base de treino é submetida ao modelo para que seus parâmetros sejam calibrados e, após esta
etapa, ocorre a predição de classes.
 
III. O sistema de recomendação de um site de comércio eletrônico monitora todos os itens vendidos
e, quando um cliente está realizando uma compra, apresenta para ele itens semelhantes
frequentemente comprados juntos.
 
Os itens I, II e III, são exemplos, respectivamente, de métodos
 a) S − S − NS.
 b) NS − NS − S.
 c) S − NS − S.
 d) NS − S − NS.
 e) S − NS − NS.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2159010
Questão 67: FCC - TJ TRT22/TRT 22/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
No âmbito do Aprendizado de Máquina, uma das métricas mais conhecidas para problemas de regressão
é o RMSE (Root Mean Squared Error). Considere os dados abaixo (valores fornecidos: raiz quadrada de
81,25 = 9,01; raiz quadrada de 325 = 18,03; raiz quadrada de 100 = 10; raiz quadrada de 25 = 5).
Com base nos dados fornecidos,
 a) a média de X (erro elevado ao quadrado) é 325/4 = 81,25 e o RMSE corresponde a 9,01.
 b) o RMSE corresponde à média da soma dos valores da coluna X, ou seja, 325/4 = 81,25.
 c) o RMSE corresponde à raiz quadrada da soma dos valores da coluna X, ou seja, 18,03.
 d) X corresponde ao RMSE de cada valor do modelo comparado ao valor real.
 e) o RMSE de cada valor do modelo comparado ao valor real é a raiz quadrada de X, ou seja: 10, 10,
5 e 10.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2160555
Questão 68: Com. Org. (IFSP) - Ana TI (IF SP)/IF SP/Ciência de Dados/2022
Assunto: Sistemas de Aprendizado de Máquina
Entre os modelos de aprendizado de máquina mais comuns, estão as árvores de decisão. Elas são
métodos de aprendizado de máquinas muito utilizados em tarefas de classificação e regressão. Em
problemas de classificação, os modelos em árvore são designados de árvore de decisão. Para resolver um
problema de decisão, esse tipo de método utiliza a estratégia de dividir para conquistar. Uma proposta
natural é rotular cada conjunto da divisão por sua classe mais frequente e escolher a divisão que tem
menores erros. O conceito fundamental nessa proposta é denominado de entropia. Considerando as
árvores de decisão, assinale a alternativa que define corretamente o conceito de entropia.
 a) A entropia é uma medida que representa a soma de todos os valores, dividida pelo número de
valores do conjunto de dados.
 b) A entropia é uma medida que representa a probabilidade de obter uma ocorrência do evento, a
partir de uma seleção aleatória do subconjunto de dados.
 c) A entropia é uma medida que representa a diferença entre o maior e o menor valor, dentro de um
conjunto de dados.
 d) A entropia é uma medida que representa a categoria, ou o valor, de maior ocorrência em um
conjunto de dados.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2200321
Questão 69: FGV - AJ TRT16/TRT 16/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
Com relação aos conceitos de aprendizado de máquina, assinale V para a afirmativa verdadeira e F para
a falsa.
I. Os três principais paradigmas de aprendizado de máquina são os de aprendizado supervisionado,
não supervisionado e por inteligência profunda.
II. os algoritmos de classificação e clusterização estão correlacionados com paradigma de
aprendizado supervisionado.
III. os algoritmosde support vector machines e randon forest são paradigmas do aprendizado de
inteligência profunda.
As afirmativas são, respectivamente,
 a) V, V e V.
 b) V, V e F.
 c) V, F e V.
 d) F, V e V.
 e) F, F e F.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2214554
Questão 70: FUMARC - AJ TRT3/TRT 3/Apoio Especializado/Tecnologia da
Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
Considere o trecho de código abaixo escrito na linguagem Python 3.x sobre modelos preditivos de
classificação usando a biblioteca scikit learn (sklearn):
 
CÓDIGO PYTHON
 
from sklearn import tree
X = [[0, 0, 0], [1, 1, 1], [0, 0, 1], [1, 1, 0] ]
y = [0, 1, 0, 1]
clf = tree.DecisionTreeClassifier()
# inserir o código que irá construir/treinar o modelo classificador
Assinale a alternativa CORRETA que corresponde à linha de código que irá construir um classificador
(estimador) baseado em árvores de decisão a partir do conjunto de dados de treinamento:
 a) clf.classifier(X, y)
 b) clf.estimate(X, y)
 c) clf.fit(X, y)
 d) clf.predict(X, y)
 e) clf.train(X, y)
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2233579
Questão 71: CEBRASPE (CESPE) - AJ TRT8/TRT 8/Apoio Especializado/Tecnologia da
Informação/2022
Assunto: Sistemas de Aprendizado de Máquina
Acerca de modelos preditivos e descritivos, assinale a opção correta.
 a) Com um modelo não supervisionado consegue-se construir um estimador a partir de exemplos
rotulados.
 b) Um modelo supervisionado refere-se à identificação de informações relevantes nos dados sem a
presença de um elemento externo para orientar o aprendizado.
 c) Com o uso de técnicas do modelo não supervisionado, consegue-se prever com exatidão o
resultado de uma eleição utilizando pesquisas como parâmetro.
 d) A análise de agrupamento pertence ao paradigma de aprendizado não supervisionado, em que o
aprendizado é dirigido aos dados, não requerendo conhecimento prévio sobre as suas classes ou
categorias.
 e) Tendo como objetivo encontrar padrões ou tendências para auxiliar o entendimento dos dados,
deve-se usar técnicas do modelo supervisionado.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2267577
Questão 72: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Sistemas de Aprendizado de Máquina
No que se refere a técnicas de regressão, técnicas de agrupamento e aprendizado profundo, julgue o
item a seguir.
 
Nos agrupamentos hierárquicos, um dendrograma é uma árvore que controla quando os clusters são
criados e que determina qual é a métrica das distâncias.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628559
Questão 73: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Sistemas de Aprendizado de Máquina
No que se refere a técnicas de regressão, técnicas de agrupamento e aprendizado profundo, julgue o
item a seguir.
 
O modelo de regressão linear é suscetível à multicolinearidade, a qual diz respeito ao fato de o erro
da predição permanecer estável, dentro de um intervalo de confiança aceitável, à medida que os valores
de entrada mudam.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628563
Questão 74: CESGRANRIO - Esc BB/BB/Agente de Tecnologia/2021
Assunto: Sistemas de Aprendizado de Máquina
Um pesquisador conseguiu uma base de dados que mostrava terrenos classificados de acordo com:
 
• características físicas;
• tipo de negócio a ser nele implantado;
• risco esperado, que compreendia os rótulos alto, médio, baixo ou nenhum.
 
Decidiu, então, usar um algoritmo de aprendizado de máquina que, a partir das características físicas do
terreno e do tipo de negócio a ser nele implantado, aprenderia a determinar o risco esperado,
enquadrando o terreno em questão em um daqueles rótulos.
 
Nesse cenário, que algoritmo de aprendizado de máquina é indicado para resolver esse problema?
 a) PCA
 b) K-NN
 c) DBSCAN
 d) K-Medoids
 e) Redes de Kohonen
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1757784
Questão 75: FGV - AJ (TJ RO)/TJ RO/Analista de Sistemas/2021
Assunto: Sistemas de Aprendizado de Máquina
A Inteligência Artificial (IA) apoia o desenvolvimento de soluções tecnológicas capazes de realizar
atividades similares às capacidades cognitivas humanas. Como exemplo, a plataforma Sinapses,
desenvolvida pelo Tribunal de Justiça do Estado de Rondônia (TJRO) e adaptada para uso nacional,
gerencia o treinamento supervisionado de modelos de IA.
Em soluções de IA, a tecnologia que possui a capacidade de melhorar o desempenho na realização de
alguma tarefa por meio da experiência usando dados de treinamento, podendo ser supervisionado ou
não, é o(a):
 a) Motor de Inferência (Inference Engine) de Sistemas Especialistas (Expert Systems);
 b) Raciocínio Automatizado (Automated Reasoning);
 c) Compreensão de Linguagem Natural (Natural-Language Understanding);
 d) Representação do Conhecimento (Knowledge Representation) usando Lógica de Primeira Ordem
(First Logic Order);
 e) Aprendizado de Máquina (Machine Learning).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1786463
Questão 76: CEBRASPE (CESPE) - AFCA (SEFAZ AL)/SEFAZ AL/2021
Assunto: Sistemas de Aprendizado de Máquina
Acerca de conceitos de modelagem preditiva e algoritmos de classificação, julgue o item a seguir.
 
O método k-NN (k-nearest neighbors) é um dos classificadores não paramétricos baseados em distância.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1790647
Questão 77: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Sistemas de Aprendizado de Máquina
A modelagem de tópicos latentes é uma técnica de aprendizado de máquina
 a) supervisionada
 b) em batch
 c) baseado em instâncias
 d) não supervisionada
 e) baseado em modelo
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821269
Questão 78: CETAP - TIRM (JUCEPA)/JUCEPA/Nível I Classe A/2021
Assunto: Sistemas de Aprendizado de Máquina
Quando uma loja de e-commerce sugere um produto para o cliente com base em suas compras e/ou
pesquisas recentes ou uma plataforma de streaming sugere um filme ou série com base no que o cliente
comumente assiste, os algoritmos destes ambientes estão usando o conceito de aprendizado de
máquina. Tipicamente, estes algoritmos são classificados como:
 a) aprendizagem supervisionada (ou com supervisão).
 b) aprendizagem não supervisionada (ou sem supervisão).
 c) aprendizagem por reforço.
 d) aprendizagem aleatória.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1992228
Questão 79: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Sistemas de Aprendizado de Máquina
Um Oficial recebeu a determinação para montar três turmas de treinamento físico em uma Organização
Militar, baseado no desempenho em um teste físico com cinco atividades. O Oficial possui registros, sem
nenhuma classificação de nivelamento, de 200 militares com os tempos dos testes de corrida, natação,
tempo máximo de permanência na água, número de barras realizadas e número de flexões de braço
realizadas. Assim, para cumprir a determinação adequadamente, o Oficial deverá utilizar:
 a) um algoritmo baseado em treinamento supervisionado.
 b) o algoritmo Regressão Linear.
 c) um Perceptron.
 d) o algoritmo Regressão Linear Múltipla.
 e) um algoritmo baseado em treinamento nãosupervisionado.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727219
Questão 80: CEBRASPE (CESPE) - EPF/PF/2018
Assunto: Sistemas de Aprendizado de Máquina
Em um big data, alimentado com os dados de um sítio de comércio eletrônico, são armazenadas
informações diversificadas, que considerama navegação dos usuários, os produtos comprados e outras
preferências que o usuário demonstre nos seus acessos.
Tendo como referência as informações apresentadas, julgue o item seguinte.
 
Uma aplicação que reconheça o acesso de um usuário e forneça sugestões diferentes para cada tipo de
usuário pode ser considerada uma aplicação que usa machine learning.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/686758
Questão 81: PR4 (UFRJ) - ATI (UFRJ)/UFRJ/Bioinformática/2014
Assunto: Sistemas de Aprendizado de Máquina
Baseado em estudos de aprendizado de máquina, marque a alternativa que melhor explica a diferença
entre algoritmos supervisionados e não supervisionados.
 a) Algoritmos não supervisionados necessitam de modelos para aprendizado de padrões, enquanto
que métodos supervisionados extraem os padrões dos próprios conjuntos de dados.
 b) Ambos os métodos necessitam de conjuntos de dados modelos para aprendizado, a diferença
reside na forma como os dados são computados.
 c) Algoritmos supervisionados têm esse nome, pois é necessário o acompanhamento do
processamento de um agente humano.
 d) Algoritmos supervisionados necessitam de dados rotulados para aprender o padrão, enquanto que
métodos não supervisionados extraem os padrões dos próprios conjuntos de dados.
 e) As definições de supervisionado e não supervisionado são antigas formas de se classificar os
primeiros algoritmos, nos primeiros modelos de computadores, e não são mais utilizados nos modelos
modernos.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/2018276
Questão 82: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem Especialidade"/2022
Assunto: Métodos de Classificação (Machine Learning)
Dois colegas de um time de ciência de dados discutem o novo projeto do time: avaliar um grupo de
unidades de negócio e tentar, através de algumas características compartilhadas, separá-las em grupos.
O objetivo é migrar de um cenário em que são elaborados contratos individuais para um cenário em que
possam ser elaborados contratos por grupo.
 
Alice acha que deve ser usado um método supervisionado. Ela escolhe o K-means Clustering e propõe
ajustar os hiperparâmetros C e sigma para alcançar um resultado adequado.
 
Bob prefere métodos não supervisionados, já que a base de dados não possui rótulos, e está em dúvida
entre utilizar Naive Bayes (em razão de a base de dados ser pequena) ou Decision Trees (por talvez ser
necessário ter um modelo explicável).
 
Analisando as posições de Alice e Bob sobre esse projeto, pode-se afirmar que:
 a) Alice e Bob estão corretos. Entretanto, não é possível realizar uma análise prévia dos algoritmos –
avaliam-se apenas modelos e suas métricas de desempenho;
 b) Alice e Bob estão errados. K-means Clustering é um método não supervisionado e não possui os
parâmetros C e sigma. Naive Bayes e Decision Trees são métodos supervisionados;
 c) Alice está correta, mas a sugestão de Bob de utilizar Naive Bayes é fraca, pois esse algoritmo não
apresenta bom desempenho com pequenos conjuntos de dados;
 d) Bob está correto e Alice está errada. K-means Clustering é um algoritmo não supervisionado;
 e) Bob está errado e Alice está correta. Modelos baseados em Decision Trees não são explicáveis.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925025
Questão 83: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem Especialidade"/2022
Assunto: Métodos de Classificação (Machine Learning)
Considere uma matriz de confusão de um modelo de classificação binária de relatórios financeiros. O
modelo classifica os relatórios em fraudulentos ou não fraudulentos.
Se essa matriz apresenta 200 verdadeiros positivos, 100 verdadeiros negativos, 40 erros do “tipo 1” e 20
erros do “tipo 2”, podem-se calcular as métricas de desempenho aproximadas como:
 a) Precision = 0.71. Recall = 0.83;
 b) Precision = 0.83. Recall = 0.71;
 c) Precision = 0.83. Recall = 0.90;
 d) Precision = 0.90. Recall = 0.71;
 e) Precision = 0.90. Recall = 0.83.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925032
Questão 84: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem Especialidade"/2022
Assunto: Métodos de Classificação (Machine Learning)
Considere as sentenças a seguir.
 
A = “Eu gostei do livro, apesar do livro ser longo”;
B = “Esse livro é muito legal”;
C = “Eu não gostei do livro, não gosto muito desse autor”.
 
Vamos considerar a seguinte classificação sobre o sentido das sentenças acima:
 
A – positiva;
B – positiva;
C – negativa.
 
Para calcular as probabilidades de uma sentença ser positiva e de uma determinada palavra aparecer na
sentença, dado que a sentença é positiva, em Aprendizado de Máquinas, pode-se usar o Naive Bayes.
 
Com a utilização dessa técnica, e com base nos dados das três sentenças acima, os valores das
estimativas de máxima verossimilhança de P(positiva) e P(livro|positiva) são, respectivamente:
 a) 1/3 e 1/2;
 b) 1/3 e 3/14;
 c) 2/3 e 3/14;
 d) 2/3 e 1/2;
 e) 2/3 e 2/3.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925042
Questão 85: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Métodos de Classificação (Machine Learning)
As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um
componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da
generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas
mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de
características operacionais do receptor (ROC).
Acerca das características específicas dessas métricas, julgue o próximo item.
A matriz de confusão a seguir apresenta três rótulos de classe; os elementos diagonais representam o
número de pontos para os quais o rótulo previsto é igual ao rotulo verdadeiro, enquanto qualquer coisa
fora da diagonal teve um rótulo atribuído erroneamente pelo classificador. Quanto menores forem os
valores diagonais da matriz de confusão, melhor o modelo adotado.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936909
Questão 86: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Métodos de Classificação (Machine Learning)
As métricas de avaliação de desempenho de um modelo de aprendizado de máquina, que é um
componente integrante de qualquer projeto de ciência de dados, destinam-se a estimar a precisão da
generalização de um modelo sobre os dados futuros (não vistos ou fora da amostra). Dentre as métricas
mais conhecidas, estão a matriz de confusão, precisão, recall, pontuação, especificidade e a curva de
características operacionais do receptor (ROC).
Acerca das características específicas dessas métricas, julgue o próximo item.
 
As curvas ROC a seguir mostram a taxa de especificidade (verdadeiros positivos) versus a taxa de
sensibilidade (falsos positivos) do modelo adotado; a linha tracejada é a linha de base da métrica de
avaliação e define uma adivinhação aleatória.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936912
Questão 87: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Métodos de Classificação (Machine Learning)
A técnica de validação cruzada é usada para avaliar modelos de classificação.
 
Com relação a esta técnica, é correto afirmar que
 a) o erro do modelo é medido sobre os mesmos dados usados para treinar o modelo.
 b) o conjunto de treinamento contém exatamente os mesmos dados do conjunto de testes.
 c) o conjunto de treinamento contém o conjunto de testes.
 d) o conjunto de testes contém o conjunto de treinamento.
 e) os conjuntos de treinamento e de testes devem ser uma partição disjunta do conjunto de dados.
Esta questão possuicomentário do professor no site. www.tecconcursos.com.br/questoes/1990113
Questão 88: FGV - AJ (TJDFT)/TJDFT/Apoio Especializado/Análise de Dados/2022
Assunto: Métodos de Classificação (Machine Learning)
Um analista decidiu aplicar um modelo Naive Bayes a um problema cujo conjunto de dados disponível
possui apenas atributos categóricos codificados em one-hot.
O modelo de eventos mais apropriado nesse caso é o:
 a) Multinomial;
 b) Bernoulli;
 c) Gaussiano;
 d) Exponencial;
 e) Uniforme.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2049404
Questão 89: FGV - AJ (TJDFT)/TJDFT/Apoio Especializado/Análise de Dados/2022
Assunto: Métodos de Classificação (Machine Learning)
Considerando a seguinte matriz de confusão obtida de um experimento de classificação:
 
real \ previsto gato rato cachorro
gato 10 2 3
rato 5 14 1
cachorro 1 2 12
 
Os valores corretos das métricas de precisão e recall (revocação/sensibilidade), para a classe rato, são,
respectivamente:
 a) 0,62 e 0,67;
 b) 0,64 e 0,77;
 c) 0,67 e 0,62;
 d) 0,78 e 0,7;
 e) 0,8 e 0,85.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2049414
Questão 90: FGV - Ana (MPE SC)/MPE SC/Dados e Pesquisas/2022
Assunto: Métodos de Classificação (Machine Learning)
Na avaliação de um modelo para detecção de fraude, foi utilizado um conjunto de dados conhecido que
resultou na matriz de confusão abaixo.
 
Predito
Modelo Fraude Não
Fraude
Fraude 4 96
Não Fraude 1 9,999
 
É correto afirmar que o modelo apresenta:
 a) acurácia de 99%, e por isso é adequado para a tarefa;
 b) acurácia de 99% e precisão de 80%, o que indica que é adequado para a tarefa;
 c) acurácia de 99%, precisão de 80% e revocação de 3%, o que indica que é adequado para a
tarefa;
 d) acurácia de 99%, precisão de 80% e revocação de 3%, o que indica que não é adequado para a
tarefa;
 e) acurácia de 99%, precisão de 99% e revocação de 99,99%, o que indica que é adequado para a
tarefa.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2058632
Questão 91: FGV - Ana (MPE SC)/MPE SC/Dados e Pesquisas/2022
Assunto: Métodos de Classificação (Machine Learning)
O método random forests para classificação ou regressão potencializa alguns benefícios das árvores de
decisão e por isso é preferido em certas situações.
O uso de random forests seria vantajoso em relação à árvore de decisão no seguinte caso:
 a) redução do custo computacional;
 b) conjunto de dados com propensão à overfitting;
 c) melhor interpretabilidade do modelo;
 d) conjunto de dados muito pequeno;
 e) número elevado de classes.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2058669
Questão 92: FGV - Ana (MPE SC)/MPE SC/Dados e Pesquisas/2022
Assunto: Métodos de Classificação (Machine Learning)
Um modelo semântico vetorial foi criado com a seguinte definição:
 
onde é o vetor correspondente à palavra , é o i-ésimo documento da coleção de artigos da
Wikipédia, ordenados alfabeticamente por título, e e são, respectivamente, as funções de
frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a
classificação é:
 a) latente, pois descreve uma distribuição de tópicos em ;
 b) latente, pois o modelo produz vetores densos;
 c) explícito, pois há uma interpretação intrínseca ao modelo para cada dimensão dos vetores;
 d) latente, pois o modelo é construído de forma não supervisionada;
 e) explícito, pois a informação do modelo é específica a um corpus.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/2059888
Questão 93: FCC - TJ TRT4/TRT 4/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Métodos de Classificação (Machine Learning)
O Gráfico ROC de uma Análise ROC:
v(w = tf(w, ) ⋅ idf(w,D))i di
v w di D
tf idf
v(w) D
 
I. é bidimensional, onde o eixos Y e X do gráfico representam as medidas TVP (Taxa de Verdadeiros
Positivos) e TFP (Taxa de Falsos Positivos), respectivamente.
 
II. tem sete regiões importantes que representam: Céu ROC, Inferno ROC, Quase Nunca Positivo,
Quase Sempre Positivo, Quase Nunca Negativo, Quase Sempre Negativo e Variáveis Fora da Curva.
 
III. tem uma linha diagonal que representa Classificadores Aleatórios.
 
Está correto o que se afirma APENAS em
 a) I.
 b) I e II.
 c) I e III.
 d) II e III.
 e) III.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2114250
Questão 94: FCC - AJ TRT22/TRT 22/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Métodos de Classificação (Machine Learning)
A matriz de confusão é utilizada na avaliação de modelos de classificação, no contexto do aprendizado de
máquina. Dentre as métricas que podem ser extraídas da matriz de confusão, que resumem a
capacidade de um modelo de acertar suas predições, estão o percentual que foi predito:
 
I. Positivo corretamente sobre o total que de fato era positivo.
II. Negativo corretamente sobre o total que de fato era negativo.
III. Positivo sobre o total que de fato era negativo.
IV. Negativo sobre o total que de fato era positivo.
 
Os itens de I a IV correspondem, correta e respectivamente, a
 a) Verdadeiro Positivo − Verdadeiro Negativo − Falso Positivo − Falso Negativo.
 b) Falso Positivo − Verdadeiro Positivo − Verdadeiro Negativo − Falso Negativo.
 c) Falso Negativo − Verdadeiro Positivo − Falso Positivo − Verdadeiro Negativo.
 d) Verdadeiro Positivo − Falso Negativo − Verdadeiro Negativo − Falso Positivo.
 e) Falso Negativo − Falso Positivo − Verdadeiro Negativo − Verdadeiro Positivo.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2159009
Questão 95: FUNDATEC - POSCOMP (SBC)/SBC/2022
Assunto: Métodos de Classificação (Machine Learning)
Considerando o estudo em Inteligência Artificial, assinale a alternativa que apresenta, corretamente, os
algoritmos de classificação no aprendizado supervisonado.
 a) Naive Bayes, Redes Neurais Artificiais e K-means.
 b) Árvores de Decisão, Simulated Annealing e Backpropagation.
 c) k-means, Naive Bayes e Algoritmos Genéticos.
 d) Árvore de Decisão, Redes Neurais Artificiais e KNN.
 e) Regressão Logística, K-means e Lógica Fuzzy.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2171902
Questão 96: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Métodos de Classificação (Machine Learning)
Julgue o item a seguir, relativos a aprendizado supervisionado.
 
Em se tratando de modelos de regressão linear, indica-se a utilização dos seguintes métodos não
paramétricos para a estimação dos resultados: mínimos quadrados (MQ) e de support vector machines
(SVM).
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208919
Questão 97: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Métodos de Classificação (Machine Learning)
Em relação a aprendizado não supervisionado, julgue o item que se seguem.
 
A validação cruzada pode ser utilizada para detectar quando uma rede neural está sendo treinada de
maneira excessiva (overtraining) e assim interromper o treinamento antes que isso ocorra, como, por
exemplo, por meio do princípio orientador atrativo para o ajuste dos pesos e bias durante o processo de
treinamento da RNA.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208938
Questão 98: FGV - AJ TRT16/TRT 16/Apoio Especializado/Tecnologia da Informação/2022
Assunto: Métodos de Classificação (Machine Learning)
Analise o script python abaixo:
import pandas as pd
from sklearn.datasets import make_hastie_10_2
x, y = make_hastie_10_2(n_samples=6000, random_state=42)
from sklearn.model_selection import train_test_split
x_train,x_test, y_train, y_test = train_test_split(x, y, test_size=0.25,
random_state=42)
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier( n_estimators=100,
oob_score=True, n_jobs=-1)
clf.fit(x_train, y_train)
y_pred_proba = clf.predict_proba(x_test)[:,1]
from sklearn.metrics import roc_curve
fpr, tpr, thr = roc_curve(y_test, y_pred_proba)
pd.DataFrame( {'FPR': fpr, 'TPR': tpr}
).set_index('FPR')['TPR'].plot(kind='line')
O gráfico plotado como resultado do processamento do script é
 a) 
 b) 
 c) 
 d) 
 e) 
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2214552
Questão 99: IBADE - Ana Info (SEA SC)/SEA SC/2022
Assunto: Métodos de Classificação (Machine Learning)
O processo pelo qual os computadores desenvolvem o reconhecimento de padrões, ou a capacidade de
aprender continuamente, ou fazer previsões com base em dados, e então, fazer ajustes sem serem
especificamente programados para isso, é chamado:
 a) Machine learning.
 b) Auto-Adjust.
 c) Business Intelligence.
 d) Systems Intelligence.
 e) Smart.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2216095
Questão 100: Marinha - QT (Marinha)/Marinha/Informática/2022
Assunto: Métodos de Classificação (Machine Learning)
Um modelo de classificação de salda binária (0 ou 1) foi projetado pelo Departamento de IA da Marinha
do Brasil. Por abstração, saldas iguais a zero foram associadas ao caso negativo e saldas unitárias
associadas ao caso positivo. Após o treino, o teste e a validação do modelo, obteve-se como resultado a
matriz de confusão exposta na tabela abaixo. Esse sistema é empregado por um banco comercial e seus
diferentes departamentos para classificar indivíduos propensos a não arcar com suas dividas (ou seja,
propensos ao problema denominado default). A resposta igual a 1, positivo, representa clientes cuja
previsão é a de default, enquanto a resposta igual a 0, negativo, é a de clientes cuja previsão é a de não
default. Assim, assinale a opção na qual a pergunta e a resposta feita pelo departamento descrito se
encontra INCORRETA.
 
 
Classificação
prevista
Positivo Negativo
Classificação
real
Positivo 800 20
Negativo 10 1600
 a) O departamento de risco pretende focar nos indivíduos que irão ter problema de default. Assim, tal
departamento faz a pergunta: "quando a classificação é de default, qual o grau de acerto da
classificação?". Nesse caso, calcula-se a sensibilidade do modelo, que será igual a 40/ 41.
 b) O departamento de ciência de dados poderá treinar o modelo buscando um máximo de acurácia
que, neste caso, será igual a 240/243. A acurácia garante que não haja disparidade entre verdadeiros
positivos e verdadeiros negativos, uma vez que ambos são considerados no numerador de seu cálculo: A
= (VP + VN) / (VP + FN + VN + FN).
 c) O departamento de ciência de dados poderá treinar o modelo buscando um máximo do F score
que, neste caso, será igual a 1600/1630, sendo calculado pela média harmônica entre precisão e recall.
 d) Um dos modelos mais simples para se gerar um classificador similar ao descrito acima é o de
regressão logística.
 e) O departamento de marketing pretende que o modelo classifique os indivíduos sem chance de
default para prospectar ofertas ao grupo de indivíduos mais próximo do ideal. Para isso, eles avaliam o
Índice calculado por VN / (VN + FP) = 160/161.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220773
Questão 101: CEBRASPE (CESPE) - ET (BNB)/BNB/Analista de Sistemas/Desenvolvimento
de Sistemas/2022
Assunto: Métodos de Classificação (Machine Learning)
Julgue o próximo item a respeito dos conceitos de Machine Learning.
Classificadores bayesianos são classificadores estatísticos usados para predizer a probabilidade de
pertinência de um objeto a determinada classe.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2265611
Questão 102: CEBRASPE (CESPE) - AJ TRT8/TRT 8/Apoio Especializado/Tecnologia da
Informação/2022
Assunto: Métodos de Classificação (Machine Learning)
Quanto à avaliação de modelos preditivos, assinale a opção correta.
 a) A taxa de acerto da métrica de classificação é o complemento da taxa de erro; valores próximos de
0 são considerados melhores.
 b) O gráfico ROC é tridimensional, plotado em um espaço chamado de espaço ROC, com eixos X, Y e
Z.
 c) As duas medidas de erro mais comumente utilizadas na métrica de regressão são o potencial erro
definido e a distância média, sempre utilizando números negativos.
 d) Nas métricas de classificação, a taxa de erro varia entre 0 e 1, sendo os valores próximos ao
extremo 0 melhores.
 e) Uma forma de avaliar classificadores em problemas complexos, ou seja, que possuem mais de duas
classes, é com o uso das curvas ROC (Receiving Operating Characteristics).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2267576
Questão 103: FEPESE - Ana Info (FAPESC)/FAPESC/2022
Assunto: Métodos de Classificação (Machine Learning)
É necessário utilizar um algoritmo de Machine Learning para realizar a classificação de um objeto em três
ou mais classes que possuem uma ordem determinada antecipadamente.
Assinale a alternativa que indica corretamente um algoritmo que possa realizar esta tarefa.
 a) Regressão Linear Simples
 b) Regressão Linear Múltipla
 c) Árvores de Regressão Ordinal
 d) Regressão Logísitica Ordinal
 e) Regressão Logística Binomial
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2293524
Questão 104: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Métodos de Classificação (Machine Learning)
Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.
 
Devido ao fato de pressupor independência entre atributos, o algoritmo Naive Bayes é capaz de realizar,
com precisão, o treinamento de um modelo com uma quantidade reduzida de amostras.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628551
Questão 105: CEBRASPE (CESPE) - AF (SEFAZ CE)/SEFAZ CE/Tecnologia da Informação da
Receita Estadual/2021
Assunto: Métodos de Classificação (Machine Learning)
A respeito de inteligência artificial, julgue o item seguinte.
A classificação Naive Bayes parte da suposição de que as variáveis envolvidas em machine learning são
independentes entre si.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1718777
Questão 106: CESGRANRIO - Esc BB/BB/Agente de Tecnologia/2021
Assunto: Métodos de Classificação (Machine Learning)
Ao tentar resolver um problema de aprendizado de máquina que separava um evento entre duas classes,
um desenvolvedor encontrou uma acurácia de exatamente 90%.
 
Analisando a matriz de confusão, o desenvolvedor constatou que os verdadeiros positivos eram 14169,
que os verdadeiros negativos eram 15360, os falsos positivos eram 1501, e os falsos negativos eram
 a) 1778
 b) 1779
 c) 1780
 d) 1781
 e) 1782
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1757747
Questão 107: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Classificação (Machine Learning)
Com relação ao classificador Naive Bayes marque a alternativa incorreta.
 a) O Naive Bayes parte do princípio de que as variáveis envolvidas no modelo são dependentes entre
si.
 b) O Naive Bayes parte do princípio de que as variáveis envolvidas no modelo são independentes
entre si.
 c) O Naive Bayes possibilita fazer o treinamento de um modelo a partir de um número pequeno de
amostras.
 d) Uma das desvantagens do Naive Bayes é não conseguir captar interações entre os atributos.
 e) O Naive Bayes pode ser utilizado para classificação de textos.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821080
Questão108: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Classificação (Machine Learning)
O classificador Naive Bayes utiliza a biblioteca Scikit-Learn para fazer suas classificações.
 
As classes utilizadas pelo modelo são:
 
I - GaussianNB, que é utilizada para distribuição gaussiana.
II - MultinomialNB, que é utilizada para contadores de ocorrência discreta.
III - BernoulliNB, que é utilizada para atributos booleanos discretos.
 
Está(ão) correta(s) a(s) afirmativa(s)
 a) II e III, apenas
 b) I e II, apenas
 c) I, II e III
 d) I e III, apenas
 e) III, apenas
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821083
Questão 109: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Classificação (Machine Learning)
De acordo com o classificador Naive Bayes julgue os próximos itens.
 
I - Mesmo que haja dependência das variáveis envolvidas no modelo, ele é incapaz de captar
interações entre os atributos
 
II - Uma das formas de se utilizar o Naive Bayes é com classificação de textos, dentre as quais
podemos citar a identificação de spams.
 
III - O classificador Naive Bayes pode ser utilizado para Análise de Sentimento.
 
Está(ão) correta(s) a(s) afirmativa(s)
 a) I e III
 b) II e III
 c) I, II e III
 d) I e II
 e) apenas II
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821089
Questão 110: NC UFPR (FUNPAR) - Prof NU Jr (ITAIPU)/ITAIPU/Gestão da
Informação/2019
Assunto: Métodos de Classificação (Machine Learning)
Classificação é uma tarefa que identifica a qual classe um objeto pertence. O desempenho do
classificador depende da sua flexibilidade (bias) e da qualidade do treinamento (variância). No entanto,
não existe um classificador que seja melhor que todos os outros para todos os problemas de
classificação. As medidas de avaliação de desempenho de classificadores trazem informações sobre taxas
de erro ou acerto para um ou mais conjuntos de dados. Nesse sentido, considere a matriz de confusão
binária abaixo:
 
 Classe predita+ -
Classe
original
 + 8 2
 - 4 6
 
Realize os cálculos e identifique como verdadeiras (V) ou falsas (F) as seguintes afirmativas:
 
( ) TVP (Taxa de Verdadeiros Positivos) = 0,9.
 
( ) TFP (Taxa de Falsos Positivos) = 0,1.
 
( ) ACC (Acurácia) = 0,7.
 
( ) E (Erro) = 0,3.
 
Assinale a alternativa que apresenta a sequência correta, de cima para baixo.
 a) V – F – V – F.
 b) F – F – F – V.
 c) V – V – F – V.
 d) F – F – V – V.
 e) V – V – F – F.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/789050
Questão 111: FUNDEP - Ana Adm (CODEMIG)/CODEMIG/Analista de
Geoprocessamento/2018
Assunto: Métodos de Classificação (Machine Learning)
O processo de atribuir um significado a um pixel de uma imagem digital em função de suas propriedades
numéricas é denominado de classificação. Em decorrência do grau de participação do analista no
processo de classificação, esse processo pode ser denominado de classificação supervisionada e
classificação não supervisionada. Posto isso, analise as afirmativas a seguir e assinale com V as
verdadeiras e com F as falsas.
 
( ) A classificação supervisionada é um passo importante a ser executado antes da classificação
não supervisionada.
( ) Na classificação não supervisionada, os pixels de uma imagem são alocados automaticamente
em classes criadas pelo sistema computacional.
( ) A matriz de confusão é um artifício utilizado para computar os erros do processo de classificação
e conhecer a qualidade desse processo, seja pelo método supervisionado ou pelo não
supervisionado.
( ) O método de classificação pelas K-médias tem por essência fazer com que todas as classes
tenham valor médio e variância similares.
 
Assinale a sequência CORRETA.
 a) V F V V
 b) F V V F
 c) V F F V
 d) V F V F
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/626757
Questão 112: FGV - APPGG (CGM Niterói)/Pref Niterói/Gestão de Tecnologia/2018
Assunto: Métodos de Classificação (Machine Learning)
Rafael aplicou um teste de múltipla escolha de cem questões para um numeroso grupo de alunos e
notou que houve uma variada distribuição de notas.
Rafael resolveu trabalhar esses dados, e agrupar esses alunos de modo que cada um ficasse no grupo
mais adequado para a sua nota. Assim, poderia preparar atividades específicas para cada grupo.
Assinale a opção que indica o algoritmo mais adequado para essa tarefa.
 a) Bubble sort.
 b) K-means.
 c) Monte Carlo.
 d) Linear regression.
 e) Logistic regression.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/632361
Questão 113: CESGRANRIO - Esc BB/BB/Agente Comercial/2018
Assunto: Métodos de Classificação (Machine Learning)
Um desenvolvedor de uma instituição bancária foi designado para tentar usar técnicas de aprendizado de
máquina para, dado o saldo diário durante um ano de um cliente, classificá-lo como BOM ou MAU
candidato a receber um cartão de crédito VIP. Para isso, a única informação que pode usar — e que ele
recebeu — é um conjunto de treinamento com 50.000 clientes préclassificados pelos seus gerentes,
contendo 365 campos com os saldos diários e um campo com o número 1, caso o cliente fosse um BOM
candidato, ou o número 0 (zero), caso fosse um MAU candidato. Essas respostas são consideradas
corretas.
 
Considerando as práticas tradicionais de aprendizado de máquina, o desenvolvedor deve escolher um
algoritmo
 a) supervisionado, porque humanos precisarão verificar a execução do algoritmo.
 b) supervisionado, porque o conjunto de treinamento possui dados e rótulo, sendo necessário
aprender a função que prediz o rótulo correto.
 c) não supervisionado, porque humanos não precisarão verificar a execução do algoritmo.
 d) não supervisionado, porque o conjunto de treinamento possui dados e rótulo, sendo necessário
aprender a função que prediz o rótulo correto.
 e) não supervisionado, porque, no futuro, os rótulos não estarão disponíveis.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/654570
Questão 114: FGV - AFRE MG/SEF MG/Tecnologia da Informação/2023
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Machine Learning é um subconjunto da Inteligência Artificial que utiliza dados e algoritmos para imitar o
raciocínio humano.
Em relação aos algoritmos de machine learning, assinale a afirmativa incorreta.
 a) Algoritmo de regressão: prevê valores de saída usando recursos de entrada dos dados fornecidos
ao sistema. Os algoritmos mais populares são Linear Regression, Logistic Regression Multivariate
Adaptive Regression Splines (MARS) e Locally Estimated Scatter plot Smoothing (LOESS).
 b) Algoritmo de agrupamento: agrupamento de pontos de dados com base em recursos semelhantes.
Alguns algoritmos são KMeans, K-Medians e Hierárquical Clustering.
 c) Algoritmo de regularização: é um processo de diminuir informações adicionais para evitar o
overfitting ou resolver um problema mal definido. Os algoritmos mais comuns são Least Absolute
Shrinkage and Selection Operator (LASSO), Least-Angle Regression (LARS) e Elastic Net and Ridge
Regression.
 d) Algoritmos de redução de dimensionalidade: reduzem o número de características obtendo um
conjunto de variáveis principais. Alguns algoritmos são Principal Component Analysis (PCA) e Principal
Component Regression (PCR).
 e) Algoritmos de regras de associação: é usado para descobrir a relação entre os pontos de dados.
Alguns algoritmos comuns são o algoritmo Apriori e o algoritmo Eclat.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2266836
TI - Redes de Computadores
Questão 115: FGV - AFRE MG/SEF MG/Tecnologia da Informação/2023
Assunto: Dados, Multimídia, Streaming etc.
Considere a consulta de streaming que conta os cliques dos usuáriospor país para uma campanha
publicitária na web a cada 30 minutos. Ao aplicar o modelo de processamento de micro batch a esta
consulta, o fluxo de dados é dividido em duas fases: batching e processing, como mostra a figura a
seguir.
 
O processamento stream é obtido repetindo as fases de batching e processing para as novas tuplas de
dados.
Em relação ao processamento stream em micro-batches, assinale a opção incorreta.
 a) As fases de batching e processing não são sobrepostas para quaisquer dois batches consecutivos.
 b) Na fase batching, as tuplas de dados de fluxo são acumuladas por um intervalo de lote
predeterminado. Em seguida, o conteúdo do lote é particionado e emitido na forma de blocos de dados
para processamento paralelo.
 c) Na fase processing, a consulta é executada na memória como um pipeline dos estágios map e
reduce.
 d) No estágio map, uma função definida pelo usuário é aplicada em paralelo a cada bloco de dados
(por exemplo, um filtro sobre as tuplas clickstream).
 e) O estágio reduce agrega o resultado do estágio map para produzir a saída batch (por exemplo,
soma os cliques para cada país).
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2266846
TI - Desenvolvimento de Sistemas
Questão 116: FADESP - FRE PA/SEFA PA/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Considerando-se as estratégias para treinamento, validação e teste nas análises preditivas, a estratégia
que pressupõe a criação de dois subconjuntos de dados disjuntos, a partir do conjunto de dados
disponível para uso na indução do modelo, em que um dos subconjuntos será usado para treinamento
(indução) do modelo preditivo e o segundo, para teste após o término de treinamento e,
consequentemente, para aplicação das medidas de avaliação do modelo, é
 a) resubstituição.
 b) holdout.
 c) validação cruzada.
 d) bootstrap.
 e) validação cruzada leave-one-out.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1921415
Questão 117: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem
Especialidade"/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Um time de ciência de dados utilizou um modelo linear para resolver uma tarefa de análise de dados
financeiros provenientes de diferentes unidades de uma organização. Um membro do time, que não
participou da modelagem, testa o modelo e verifica que ele apresenta um péssimo resultado.
Preocupado, ele busca os resultados apresentados no treino e pode concluir que ocorreu:
 a) underfitting, se o resultado do treino foi ótimo. Uma possível solução é a utilização de um modelo
mais complexo e a redução do tempo de treinamento;
 b) underfitting, se o resultado do treino também foi péssimo. Uma possível solução é a utilização de
um modelo menos complexo e métodos de validação cruzada;
 c) overfitting, se o resultado do treino também foi péssimo. Uma possível solução é a utilização de
técnicas de regularização e métodos de validação cruzada;
 d) overfitting, se o resultado do treino foi ótimo. Uma possível solução é a utilização de um modelo
menos complexo e métodos de validação cruzada;
 e) overfitting, se o resultado do treino foi ótimo. Uma possível solução é a utilização de um modelo
mais complexo e o aumento do tempo de treinamento.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925037
Questão 118: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem
Especialidade"/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Como parte de um esforço para melhorar a produtividade, uma empresa vem medindo o tempo gasto em
cada tarefa do seu principal processo produtivo. Uma das tarefas, que envolve carregar material em uma
máquina, ocorre uma vez por dia e teve os seguintes tempos medidos na semana anterior, em minutos:
 
Seg Ter Qua Qui Sex
80 76 85 68 56
Considerando um modelo de regressão linear ajustado para perda mínima, usando as medições da
semana anterior, o valor residual com relação ao modelo, para o tempo de 70 minutos medido na quinta-
feira da semana atual é, em minutos:
 a) -3;
 b) -2;
 c) 1;
 d) 2;
 e) 3.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925051
Questão 119: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de
underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem
de máquina adotado, com o erro de predição.
 
O Set de Treinamento é usado para qualificar o desempenho do modelo, enquanto o Set de Validação é
utilizado para criar o modelo de aprendizado de máquina.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936916
Questão 120: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de
underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem
de máquina adotado, com o erro de predição.
 
Considerando que a variância é um erro de sensibilidade para pequenas flutuações no conjunto de
treinamento, infere-se que um baixo nível de variância pode fazer que o algoritmo associado a um
modelo de aprendizado de máquina perca as relações relevantes entre os atributos de entrada e a
variável de saída, caracterizando o erro de overfitting, percebido na região à direita do ponto A.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936918
Questão 121: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Julgue o próximo item, considerando o gráfico precedente, que representa as regiões de overfitting e de
underfitting, permitindo uma avaliação do relacionamento da complexidade do modelo de aprendizagem
de máquina adotado, com o erro de predição.
 
Quando se verifica um alto erro no treinamento com valor próximo ao erro na validação, percebido na
região à esquerda do ponto A, tem-se um clássico problema de underfitting, caracterizado pelo alto valor
do bias.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936919
Questão 122: Com. Org. (IFSP) - Ana TI (IF SP)/IF SP/Ciência de Dados/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Machine Learning, ou aprendizado de máquina, é um subcampo da inteligência artificial baseada na ideia
de que os sistemas podem aprender a identificar padrões e tomar decisões, por meio da análise de
dados. De acordo com o tipo de técnica utilizada no processo de aprendizagem, existem vários
algoritmos que podem ser aplicados para gerar o modelo de aprendizado. Os parâmetros desse modelo
podem ser atualizados por meio de técnicas de otimização. Com base nessas informações, assinale a
alternativa correta.
 a) O gradiente descendente é um algoritmo de otimização utilizado pelos cientistas de dados para
encontrar um máximo local de uma função diferenciável, movendo-se iterativamente na direção da
descida mais íngreme, conforme definido pelo negativo do gradiente.
 b) O método do gradiente descendente é utilizado pelos cientistas de dados para encontrar os valores
de parâmetros de uma função, que reduzem ao máximo uma função de custo.
 c) O gradiente descendente é um algoritmo de otimização iterativa, que necessita do cálculo da
segunda derivada para poder realizar atualizações dos parâmetros do modelo preditivo.
 d) No método do gradiente descendente, o tamanho do passo (também conhecido como taxa de
aprendizado, ou learning rate) não exerce nenhuma influência no resultado.
Esta questão possui comentáriodo professor no site. www.tecconcursos.com.br/questoes/2200278
Questão 123: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Julgue o item a seguir, relativos a aprendizado supervisionado.
 
As técnicas de regressão são utilizadas tanto para prever quando para entender como o sinal avaliado é
afetado pela variação dos preditores, ou ainda, para identificar os preditores mais importantes na relação
entre o sinal avaliado e cada um deles.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208921
Questão 124: CEBRASPE (CESPE) - Ativ Reg (ANP)/ANP/Novas Atribuições IV/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Em relação a aprendizado não supervisionado, julgue o item que se seguem.
 
O modelo de mistura gaussiana (GMM) é um método que descreve um agrupamento de amostras para
determinado espaço de características, em que o GMM é uma mistura de k distribuições gaussianas
associadas à mudança de estado dos pixels.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2208950
Questão 125: FEPESE - Ana (CELESC)/CELESC/Sistemas/Negócios Transformação
Digital/2022
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Análises preditivas usam dados, algoritmos estatísticos e técnicas de machine learning para identificar a
probabilidade de resultados futuros, a partir de dados históricos. O objetivo é ir além de saber o que
aconteceu para obter uma melhor avaliação do que poderá acontecer no futuro.
 
Analise as afirmativas abaixo em relação ao assunto.
1. A análise preditiva é usada para determinar as respostas ou compras dos clientes, além de
promover oportunidades de venda cruzada. Os modelos preditivos ajudam as empresas a atrair, reter
e expandir seus clientes mais valiosos.
2. As pontuações de crédito são usadas para avaliar a probabilidade de padrões de compra de um
consumidor e são um exemplo bem conhecido de análise preditiva.
3. Apesar da predominância de softwares interativos e fáceis de usar, a análise preditiva ainda é
exclusividade de matemáticos e estatísticos.
Assinale a alternativa que indica todas as afirmativas corretas.
 a) É correta apenas a afirmativa 2.
 b) É correta apenas a afirmativa 3.
 c) São corretas apenas as afirmativas 1 e 2.
 d) São corretas apenas as afirmativas 1 e 3.
 e) São corretas apenas as afirmativas 2 e 3.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2226899
Questão 126: CEBRASPE (CESPE) - AFCA (SEFAZ AL)/SEFAZ AL/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Acerca de conceitos de modelagem preditiva e algoritmos de classificação, julgue o item a seguir.
 
O dilema bias-variância é evitado quando o treinamento é feito de modo que o modelo capture todas as
irregularidades estatísticas dos dados, com uma quantidade maior de rodadas de treinamento.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1790644
Questão 127: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Marque a opção correta com relação ao overfitting.
 a) Devido ao nível de generalização ser muito alto, o modelo de treinamento não funciona bem.
 b) Acontece quando o modelo utilizado é complexo.
 c) Acontece quando o modelo de dados treinado não possui uma alta complexidade e com isso não é
possível prever as relações entre os recursos do conjunto e uma variável de destino.
 d) Acontece quando o modelo se ajusta bem aos dados treinados, porém o seu nível de
generalização não é tão alto.
 e) Acontece quando o modelo de dados treinado é muito simples e com isso se tem uma grande
generalização dos dados.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821073
Questão 128: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Marque a opção correta com relação ao underfitting.
 a) Devido ao nível de generalização ser muito alto, o modelo de treinamento não funciona bem.
 b) Acontece quando o modelo utilizado é complexo.
 c) Acontece quando o modelo de dados treinado não possui uma alta complexidade e com isso não é
possível prever as relações entre os recursos do conjunto e uma variável de destino.
 d) Acontece quando o modelo se ajusta bem aos dados treinados, porém o seu nível de
generalização não é tão alto.
 e) Acontece quando o modelo de dados treinado é muito simples e com isso se tem uma grande
generalização dos dados.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821076
Questão 129: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Uma das formas utilizadas para redução de overfitting é aumentar a quantidade de dados de treinamento
no modelo. Porém, existem outras formas de atingir esse objetivo. Uma dessas formas pode ser
encontrada em:
 a) Redução de dimensionalidade
 b) Técnicas de regularização
 c) Otimização de hiperparâmetros
 d) Árvores de decisão
 e) Regressão linear
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821078
Questão 130: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Sobre validação e avaliação de modelos preditivos marque a alternativa correta.
 a) A validação de um modelo preditivo pode ser utilizada para comparar o desempenho do modelo
em diferentes processos de modelagem.
 b) A técnica de validação cruzada é utilizada para avaliar os erros em modelos preditivos.
 c) Uma forma de validação de um modelo consiste em separar um trecho dos dados utilizados no
treinamento e fazer previsões sobre o restante dos dados. Essa técnica é conhecida como KNN.
 d) O holdout é uma função matemática que procura identificar padrões ocultos e prever o que poderá
acontecer com o modelo.
 e) A validação de um modelo preditivo é utilizada quando é necessário descrever um conjunto de
dados que se mostra ineficaz para prever novos resultados em um dado modelo.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821084
Questão 131: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
O método holdout é uma técnica de validação cruzada utilizada para avaliar modelos preditivos. Sobre
esse método marque a alternativa correta.
 a) Esse modelo é uma exceção entre as técnicas de validação cruzada, pois avalia o conjunto de
dados como único.
 b) Divide um conjunto de dados em exatamente dois conjuntos e testa o melhor desempenho entre
eles.
 c) Divide uma parte de um conjunto com a intenção de avaliar vários modelos concorrentes e
seleciona o melhor deles
 d) É utilizado quando a intenção é aproximar a variância de um conjunto e o seu viés.
 e) Divide um conjunto de dados em exatamente três conjuntos e testa o melhor desempenho entre
eles.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821086
Questão 132: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Sobre as fontes de erros em modelos preditivos marque a alternativa correta.
 a) O erro de Bias (Viés) é considerado o produto entre a previsão esperada do modelo e o valor real
que se quer prever.
 b) O erro de Variância é considerado a diferença entre a previsão esperada no modelo e o valor real
que se quer prever.
 c) O erro de Bias (Viés) é a capacidade de variação de um modelo para um ponto de dados.
 d) O erro de Variância é considerado o produto entre a previsão esperada do modeloe o valor real
que se quer prever.
 e) O erro de Bias (Viés) é considerado a diferença entre a previsão esperada no modelo e o valor real
que se quer prever.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821090
Questão 133: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Sobre as fontes de erros em modelos preditivos marque a alternativa correta.
 
Independentemente do tipo de algoritmo que for utilizado, esse erro não pode ser eliminado, ou
reduzido. Esse tipo de erro é também conhecido como ruído.
 
A afirmativa acima é a definição de:
 a) Erro variável
 b) Erro irredutível
 c) Erro não reconhecido
 d) Erros de bias
 e) Erro de variância
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821091
Questão 134: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Um dos modelos lineares utilizados em Machine Learning é a regressão linear. Sobre esse tema marque a
opção correta.
 a) A regressão linear simples se dá pelo fato de termos uma ou mais variáveis independentes para se
fazer a predição.
 b) Regressão linear é um tipo de algoritmo não supervisionado.
 c) A regressão linear múltipla se dá pelo fato de termos duas ou mais varáveis independentes para se
fazer a predição.
 d) A regressão linear somente pode ser utilizada quando os valores de entrada e saída não são
contínuos.
 e) Uma função que representa uma regressão linear é f(x) = w0 + w1 * x1, em que o w0 é utilizado
para representar a inclinação da reta, w1 é o atributo de entrada e x1, o ponto inicial da reta.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821094
Questão 135: Marinha - QT (Marinha)/Marinha/Informática/2021
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Segundo GRUS (2016), sobre o procedimento de utilização de Gradiente Descendente para encontrar
mínimas e máximas de funções, é correto afirmar que:
 a) Se uma função possui uma mínima global única, é provável que esse procedimento a encontre.
 b) Se uma função possui mínimas múltiplas (locais), esse procedimento encontrará a melhor mínima.
 c) Se uma função possui mínimas múltiplas (locais}, esse procedimento talvez encontre a errada e,
nesse caso, você talvez tenha que reiniciar o procedimento a partir do mesmo ponto inicial.
 d) Se uma função não possui mínima, então ao final do procedimento será encontrada a máxima.
 e) Gradiente é o vetor das integrais parciais.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1953774
Questão 136: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Métodos de Treinamento de Modelos (Machine Learning)
Analise as afirmativas abaixo, em relação à técnica de otimização gradiente descendente.
 
I - Se uma função possui um ponto de mínimo global único, pode ser encontrado pela técnica.
 
II - É utilizada para minimizar o erro de um modelo.
 
IlI - Se uma função possui pontos mínimos múltiplos (locais), o procedimento talvez não encontre o
mínimo global.
 
Assinale a opção correta.
 a) Apenas a afirmativa I é verdadeira.
 b) Apenas a afirmativa II é verdadeira.
 c) Apenas a afirmativa IlI é verdadeira.
 d) Apenas as afirmativas I e lI são verdadeiras.
 e) Todas as afirmativas são verdadeiras.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727246
Questão 137: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Máquinas de Vetores de Suporte (SVM)
As máquinas de vetores de suporte (SVMs) são originalmente utilizadas para a classificação de dados em
duas classes, ou seja, na geração de dicotomias. Nas SVMs com margens rígidas, conjuntos de
treinamento linearmente separáveis podem ser classificados. Acerca das características das SVMs com
margens rígidas, julgue o item a seguir.
Um conjunto linearmente separável é composto por exemplos que podem ser separados por pelo menos
um hiperplano. As SVMs lineares buscam o hiperplano ótimo segundo a teoria do aprendizado estatístico,
definido como aquele em que a margem de separação entre as classes presentes nos dados é
minimizada.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936924
Questão 138: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Máquinas de Vetores de Suporte (SVM)
Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.
 
Em razão de seu bom desempenho, o algoritmo SVM (support vector machines) é invariante à escala
dimensional dos conjuntos de dados, o que torna dispensável a padronização e o pré-processamento dos
dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628554
Questão 139: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Máquinas de Vetores de Suporte (SVM)
São técnicas de validação e avaliação de modelos preditivos, exceto
 a) Holdout
 b) Cross-Validation
 c) Support Vector Machine
 d) K-Fold
 e) Leave-one-out
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821088
Questão 140: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Máquinas de Vetores de Suporte (SVM)
No contexto de classificação de padrões, uma abordagem possível é a busca de um hiperplano que
melhor separe as classes nos dados de treinamento. A ideia de maximizar a distância desse hiperplano
para o ponto mais próximo em cada classe pertence a qual algoritmo?
 a) Arvore de decisão.
 b) Regressão Múltipla.
 c) k-Vizinhos mais próximos.
 d) Máquina de Vetor de Suporte.
 e) Redes Neurais.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727243
Questão 141: FADESP - FRE PA/SEFA PA/2022
Assunto: Árvores de Decisão
A estratégia de agrupamento hierárquico em que a construção da árvore é iniciada pelo nó raiz, onde
todos os exemplares são alocados, inicialmente, a um único grupo e, interativamente, os grupos são
divididos de acordo com algum critério de dissimilaridade, aplicado aos exemplares que os constituem e,
além disso, enquanto houver grupos formados por mais de um exemplar, dois grupos distintos são
criados a cada divisão, dando origem aos demais nós internos da árvore, é conhecida como
 a) método AGNES.
 b) método DIANA.
 c) método de k-médias.
 d) método DBSCAN.
 e) mapa auto organizáveis.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1921416
Questão 142: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Árvores de Decisão
Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os
resultados de cada um deles, apresentando muitos pontos positivos, ou seja, são fáceis de entender e
interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos
atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem
atributos definidos.
De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
Se o processo adotado para a construção de árvores de decisão for determinístico, uma forma de
obtenção de árvores aleatórias, que compõem as florestas aleatórias, pode ser realizada por meio do
bootstrap dos dados, em que cada árvore é treinada com base no resultado de bootstrap_sample
(inputs).
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936922
Questão 143: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Árvores de Decisão
Uma árvore de decisão representa um determinado número de caminhos possíveis de decisão e os
resultados de cada um deles, apresentando muitos pontos positivos,ou seja, são fáceis de entender e
interpretar. Elas têm processo de previsão completamente transparente e lidam facilmente com diversos
atributos numéricos, assim como atributos categóricos, podendo até mesmo classificar dados sem
atributos definidos.
De acordo com os aspectos construtivos de uma árvore de decisão, julgue o item a seguir.
 
A entropia de uma árvore de decisão aborda o aspecto da quantidade de informações que está associada
às respostas que podem ser obtidas às perguntas formuladas, representando o grau de incerteza
associado aos dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936923
Questão 144: CEBRASPE (CESPE) - Ag Inv (PC PB)/PC PB/2022
Assunto: Árvores de Decisão
A árvore de decisão é uma técnica utilizada em mineração de dados cuja abordagem para a criação de
regras para utilização nos próximos eventos é a
 a) estratificação.
 b) identificação de interações.
 c) predição.
 d) segmentação.
 e) combinação de categorias.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2013225
Questão 145: Marinha - QT (Marinha)/Marinha/Informática/2022
Assunto: Árvores de Decisão
Dentro das técnicas estatísticas empregadas no processo de data mining, sobre o emprego da técnica de
árvore de decisão, segundo Barbieri (2011), a abordagem de:
 a) segmentação é responsável pela divisão dos dados em duas partes, a partir de um elemento
inicial, permitindo balancear os dados, dentre as várias categorias existentes.
 b) segmentação utiliza algoritmos de agrupamento para determinação de regras, com base em
eventos passados, utilizando suas características em comum, dentre as várias categorias existentes.
 c) estratificação é responsável pela determinação de regras para que se possa designar cada caso a
uma dentre várias categorias existentes, como, por exemplo, classificar um cliente tomador de crédito
em grupo de risco elevado, risco médio, risco baixo.
 d) ampliação de dados realiza o preenchimento de lacunas, quando há falta de variáveis em um
processo. É passivei a utilização de técnicas avançadas para identificar quais nós têm mais influência
sobre a resposta, preenchendo por similaridade, de forma a melhorar o volume de variáveis em estudo e,
consequentemente, sua análise.
 e) predição é responsável pela prevenção de falhas com base nos eventos ocorridos anteriormente,
permitindo, assim, a configuração da árvore de decisão com maior segurança dos dados.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220957
Questão 146: CEBRASPE (CESPE) - Ana (SERPRO)/SERPRO/Ciência de Dados/2021
Assunto: Árvores de Decisão
Sobre as técnicas de classificação em aprendizado de máquina, julgue o item a seguir.
 
As árvores de decisão apresentam significativa independência dos dados de treinamento, o que garante
forte estabilidade dos caminhos em caso de mudanças nos dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1628550
Questão 147: CEBRASPE (CESPE) - AF (SEFAZ CE)/SEFAZ CE/Tecnologia da Informação da
Receita Estadual/2021
Assunto: Árvores de Decisão
A respeito de inteligência artificial, julgue o item seguinte.
 
Uma das vantagens da técnica de árvore de decisão para regressão é evitar a propagação de erros,
mesmo que uma divisão ocorra indevidamente.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1718779
Questão 148: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Árvores de Decisão
Sobre árvores de decisão marque a opção correta.
 a) É um algoritmo de aprendizagem de máquina que possibilita executar tarefas de classificação e
regressão e possui capacidade de se adaptar a conjuntos de dados complexos.
 b) É um modelo muito robusto e versátil de aprendizado de máquina, capaz de fazer classificações
lineares, não lineares, de regressão e até mesmo detecção de outliers.
 c) É um modelo que, dada uma instância de teste, encontra o termo mais próximo do teste no
conjunto de treinamento.
 d) É um classificador probabilístico com independência entre os recursos.
 e) É utilizado para estimar a probabilidade de uma instância pertencer a uma classe específica.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821050
Questão 149: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Árvores de Decisão
Para responder a questão, considere o conjunto de dados íris. Considere também o código a seguir, que
gera uma árvore de decisão.
 
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
iris = load_iris()
X = iris.data[:, 2:]
y = iris.target
tree_clf = DecisionTreeClassifier(max_depth=2, random_state=42)
tree_clf.fit(X, y)
 
DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=2,
max_features=None, max_leaf_nodes=None,
min_impurity_decrease=0.0, min_impurity_split=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, presort=False, random_state=42,
splitter='best')
 
from sklearn.tree import export_graphviz
export_graphviz(
tree_clf,
out_file=image_path("iris_tree.dot"),
feature_names=iris.feature_names[2:],
class_names=iris.target_names,
rounded=True,
filled=True
)
$dot -Tpng iris_tree.dot -o iris_tree.png
A árvore gerada pode ser vista na imagem abaixo.
 
Da árvore acima podemos concluir que
 a) Caso uma pétala possua um comprimento maior que 2.45 ela é do tipo Setosa.
 b) Caso uma pétala possua comprimento maior que 2.45 e largura menor que 1.75 ela é do tipo
Versicolor.
 c) Caso uma pétala possua uma largura menor que 1.75 é do tipo Virginica.
 d) Caso uma pétala possua comprimento menor que 2.45 é do tipo Versicolor
 e) Caso uma pétala possua comprimento maior que 2.45 e largura maior que 1.75 é do tipo Setosa.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821051
Questão 150: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Árvores de Decisão
Para responder a questão, considere o conjunto de dados íris. Considere também o código a seguir, que
gera uma árvore de decisão.
 
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
iris = load_iris()
X = iris.data[:, 2:]
y = iris.target
tree_clf = DecisionTreeClassifier(max_depth=2, random_state=42)
tree_clf.fit(X, y)
 
DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=2,
max_features=None, max_leaf_nodes=None,
min_impurity_decrease=0.0, min_impurity_split=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, presort=False, random_state=42,
splitter='best')
 
from sklearn.tree import export_graphviz
export_graphviz(
tree_clf,
out_file=image_path("iris_tree.dot"),
feature_names=iris.feature_names[2:],
class_names=iris.target_names,
rounded=True,
filled=True
)
$dot -Tpng iris_tree.dot -o iris_tree.png
A árvore gerada pode ser vista na imagem abaixo.
 
Os atributos
(1) Gini
(2) Sample
(3) Value
são utilizados para
( ) calcular a quantidade de instâncias às quais se aplica.
( ) informar a quantidade de instâncias de treinamento de cada classe às quais o nó se aplica.
( ) calcular a impureza de um nó.
A correta associação entre o atributo e sua utilização é dada em:
 a) 1 - 2 - 3
 b) 3 - 1 - 2
 c) 3 - 2 - 1
 d) 1 - 2 - 3
 e) 2 - 3 - 1
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821052
Questão 151: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Árvores de Decisão
Para responder a questão, considere o conjunto de dados íris. Considere também o código a seguir, que
gera uma árvore de decisão.
 
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
iris = load_iris()
X = iris.data[:, 2:]
y = iris.target
tree_clf = DecisionTreeClassifier(max_depth=2,random_state=42)
tree_clf.fit(X, y)
 
DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=2,
max_features=None, max_leaf_nodes=None,
min_impurity_decrease=0.0, min_impurity_split=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, presort=False, random_state=42,
splitter='best')
 
from sklearn.tree import export_graphviz
export_graphviz(
tree_clf,
out_file=image_path("iris_tree.dot"),
feature_names=iris.feature_names[2:],
class_names=iris.target_names,
rounded=True,
filled=True
)
$dot -Tpng iris_tree.dot -o iris_tree.png
A árvore gerada pode ser vista na imagem abaixo.
 
O algoritmo CART, utilizado pela biblioteca Scikit-Learn,
 a) pode gerar apenas árvore binárias.
 b) pode gerar tanto árvores binárias, quanto árvores que possuem mais de dois filhos.
 c) não permite dividir um conjunto de treinamento.
 d) não pode percorrer um conjunto de dados de forma recursiva.
 e) não pode ser utilizado para treinar árvores de decisão.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821053
Questão 152: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Árvores de Decisão
Os hiperparâmetros são parâmetros que podem ser ajustados e com isso permitir que o processo de
treinamento de um modelo seja mais bem controlado.
 
O processo de localizar e configurar os hiperparâmetros, que resultará no melhor desempenho do
modelo, é chamado de
 a) Validação de modelo
 b) Separabilidade de dados
 c) Redução de dimensionalidade
 d) Otimização de hiperparâmetros
 e) Underfitting
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821054
Questão 153: FCC - Ana TI (SANASA)/SANASA/Suporte de Infraestrutura TI/2019
Assunto: Árvores de Decisão
O PIM − Protocol Independent Multicast é o protocolo de roteamento multicast que, no modo de
operação SM (PIM-SM), constrói árvores compartilhadas e unidirecionais a partir de mensagens de
inscrição (join) em um grupo multicast enviadas ao nó
 a) PMR − Phantom Multicast Router.
 b) BMR − Bootstrap Master Router.
 c) MAD − Mapping Agent Discovery.
 d) RP − Rendezvous Point.
 e) IGM − Intern Gateway Manager.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/989053
Questão 154: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Redução de Dimensionalidade
Certo conjunto de dados contém 10000 observações, em que cada observação possui 10 variáveis. A
análise de componentes principais (PCA) sobre estes dados apontou que a primeira componente principal
é dada pelo vetor w.
 
A esse respeito, assinale a afirmativa correta.
 a) A variância dos dados é a mesma nas direções dadas por w ou pelas demais componentes
principais.
 b) A variância dos dados é a menor na direção de w e aumenta na direção das demais componentes
principais.
 c) A variância ao longo da direção dada por w é igual a 1.
 d) A variância ao longo da direção dada por w é menor do que 1.
 e) A variância dos dados é máxima na direção dada por w.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990123
Questão 155: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
As duas principais abordagens presentes na redução de dimensionalidade são
 a) Projeção e aprendizado manifold
 b) Teste e validação
 c) Aprendizado supervisionado e não supervisionado
 d) Matriz de confusão e análise de erro
 e) Regressão Linear e regressão logística
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821068
Questão 156: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
São técnicas de redução de dimensionalidade, exceto
 a) Projeções Randomizadas
 b) Isomap
 c) Escalonamento Multidimensional
 d) Gradiente Descendente
 e) Distributed Stochastic Neighbor Embedding
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821069
Questão 157: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
Uma das principais abordagens quando se trata de redução de dimensionalidade é a Análise de
Componente Principal (PCA). Sobre essa abordagem marque a alternativa correta.
 a) É utilizada para decompor um conjunto de componentes ortogonais em um conjunto de dados
multivalorados.
 b) É possível projetar os dados em um espaço único enquanto dimensiona cada componente para a
variação da unidade utilizando o parâmetro opcional whiten = True.
 c) Centraliza e dimensiona os dados de entrada para cada recurso antes de aplicar a decomposição
de valores singular (SVD).
 d) Uma das limitações dessa abordagem é não suportar o processamento em batch, pois esse tipo de
processamento requer que todos os dados a serem processados estejam na memória principal.
 e) O objeto PCA não fornece uma interpretação probabilística do PCA que pode dar uma
probabilidade de dados com base na quantidade de variação que ele explica.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821071
Questão 158: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
O processo utilizado para diminuir a quantidade de dimensões de um conjunto de dados para que se
tenha uma visão mais encorpada de um conjunto de treinamento de alta dimensão é denominado de:
 a) Técnicas de regularização
 b) Otimização de hiperparâmetros
 c) Redução de Dimensionalidade
 d) Análise de sentimentos
 e) Separabilidade de dados
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821258
Questão 159: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
Sobre a redução de dimensionalidade julgue as afirmativas a seguir.
 
I - Mesmo que se aplique a redução de dimensionalidade em um conjunto, os dados sempre
permanecem intactos, ou seja, mesmo reduzindo a quantidade de dimensões não haverá perda de
informações.
 
II - Reduzir a dimensão de um conjunto de dados pode acelerar o seu treinamento, porém o seu
desempenho pode não ser tão eficiente.
 
III - A redução de dimensionalidade permite uma melhor visualização dos dados.
 
Está(ão) correta(s) a(s) afirmativa(s)
 a) II e III
 b) I e III
 c) I e II
 d) II apenas
 e) III apenas
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821260
Questão 160: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
Com relação às técnicas de redução de dimensionalidade, relacione as colunas.
 
(1) PCA
(2) Kernel PCA
(3) LLE
 
( ) É uma técnica para redução de dimensionalidade não linear e que não depende de projeções.
 
( ) Permite aplicar projeções não lineares complexas para redução de dimensionalidade.
 
( ) Sua característica principal é identificar qual o hiperplano está mais próximo dos dados e, em
seguida, projetar os dados nele.
 
A correta relação se dá em
 a) 1 - 2 - 3
 b) 2 - 3 - 1
 c) 2 - 1 - 3
 d) 3 - 2 - 1
 e) 3 - 1 - 2
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821264
Questão 161: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redução de Dimensionalidade
A redução da dimensionalidade pode ser definida como
 a) processo de aprendizado de máquina que permite executar tarefas de classificação e regressão de
dados.
 b) processo utilizado para trazer uma melhor visualização dos dados diminuindo a quantidade de
dimensões de um conjunto.
 c) processo em que não permite que haja perdas de dados mantendo sempre o conjunto com o
mesmo tamanho do original.
 d) processo em que aumenta o rendimento do conjunto, porém faz o treinamento dos dados ficar
mais lento.
 e) processo de remoção de dados considerados impróprios.Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821266
Questão 162: FGV - Aud Est (CGE SC)/CGE SC/Ciências da Computação/2023
Assunto: Redes Neurais
Sobre modelos de otimização de redes neurais, assinale a afirmativa incorreta.
 a) O gradiente descendente é um algoritmo de otimização de redes neurais em que a derivada da
função de otimização leva a direção mais baixa do gráfico da função de custo.
 b) A ideia da Regularização é adicionar um termo extra à função de custo. Intuitivamente, o efeito da
regularização é fazer com que a rede prefira aprender pesos pequenos, minimizando a função de custo.
 c) O momento acumula pesos anteriores para estabilizar a convergência da rede; o objetivo é ajudar
a desviar de mínimos locais e pode acelerar treinamento em regiões muito planas da superfície de erro.
 d) O algoritmo de otimização ADAM guarda, além dos valores dos pesos passados, o decaimento
exponencial da média de gradientes passados e possui o mesmo objetivo do momento.
 e) A regularização L1 transforma valores pequenos em zeros e, consequentemente, permite reduzir o
número de pesos, enquanto a regularização L2 procura manter todos os pesos pequenos de forma que
maximiza a função de custo.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/2295381
Questão 163: FGV - Aud Est (CGE SC)/CGE SC/Ciências da Computação/2023
Assunto: Redes Neurais
Sobre as redes neurais convolucionais (CNNs) é correto afirmar que
 a) ao treinar CNNs utilizando transferência de aprendizado, começamos com um modelo pré-treinado
e executamos numa nova tarefa qualquer, sem precisar se preocupar com o formato e o tipo de dados.
 b) ao treinar CNNs utilizando transferência de aprendizado para ajuste fino, começamos com um
modelo pré-treinado e atualizamos todos os parâmetros do modelo para nossa nova tarefa, basicamente
retreinando todo o modelo.
 c) uma rede neural convolucional pode ser utilizada para reconhecer os mais variados tipos de dados.
Por exemplo, textos, imagens e dados de clientes. Para isso, basta que os dados de entrada sejam
transformados por alguma técnica de extração de características em simples vetores de características.
 d) as últimas camadas convolucionais de uma rede neural CNN são capazes de extrair características
mais baixo nível dos dados, como linhas, círculos e pontos, enquanto as primeiras camadas extraem
características mais alto nível, detalhes mais específicos dos objetos reconhecidos.
 e) as camadas de pooling das CNNS são capazes de extrair características de médio nível,
reconhecendo características que são mais detalhadas que as primeiras camadas convolucionais.
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/2295403
Questão 164: FGV - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2022
Assunto: Redes Neurais
Seja uma rede neural com camada de entrada com dimensão dois que recebe dados (x1, x2). Essa rede
aplica pesos w1 em x1, w2 em x2 e adiciona um viés w0. A função de ativação é dada pela função sinal
s(z) = +1, se z 0, e s(z) = -1, se z 0. Essa rede não tem nenhuma camada oculta e será utilizada
para classificar observações em y=+1 ou y=-1.
Para pesos w1 = 2, w2 = 3 e viés w0 = 1, a região de classificação é uma reta que passa nos pontos:
 a) (x1 = -1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como -1 os pontos acima da reta;
 b) (x1 = 1/2, x2 = 0) e (x1 = 0, x2 = 1/3) e classifica como +1 os pontos acima da reta;
≥ <
 c) (x1 = -1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como +1 os pontos acima da reta;
 d) (x1 = -1/2, x2 = 0) e (x1 = 0, x2 = 1/3) e classifica como +1 os pontos acima da reta;
 e) (x1 = 1/2, x2 = 0) e (x1 = 0, x2 = -1/3) e classifica como -1 os pontos acima da reta.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1916104
Questão 165: FGV - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2022
Assunto: Redes Neurais
Durante o treinamento de uma rede neural artificial para classificação de imagens, foi observado o
comportamento descrito pelo gráfico abaixo, que mostra a evolução do erro conforme o número de
iterações.
 
 
O classificador em questão foi treinado em um conjunto de dados particionado (holdout) em
60%/30%/10% (treinamento/validação/teste). Entretanto, os especialistas envolvidos consideraram o
modelo obtido insatisfatório após analisarem o gráfico.
Considerando essas informações, duas técnicas que poderiam ser utilizadas para contornar o problema
encontrado são:
 a) Parada precoce, Minimização de Entropia Cruzada;
 b) Validação cruzada, Dropout;
 c) Sobreamostragem, Gradiente Descendente Estocástico;
 d) Dropout, Parada em convergência;
 e) Minimização de Entropia Cruzada, Validação cruzada.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1916148
Questão 166: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
Uma RNA é formada por unidades que fazem operações a partir das entradas (sinais) recebidas pelas
suas conexões; cada sinal é multiplicado por um peso e, após a soma ponderada dos sinais, caso o nível
de atividade atinja o threshold, a unidade produz uma determinada resposta de saída.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936940
Questão 167: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
Em RNA formada unicamente de perceptron, uma pequena alteração nos pesos de um único perceptron
na rede pode ocasionar grandes mudanças na saída desse perceptron; mesmo com a inserção das
funções de ativação, não é possível controlar o nível da mudança, por isso, essas redes são voltadas para
a resolução de problemas específicos, tais como regressão e previsão de séries temporais.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936942
Questão 168: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem
componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações
lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também
relações não lineares.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936943
Questão 169: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as
entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o
termo de correção dos pesos e, por conseguinte, a atualização dos pesos.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936945
Questão 170: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
Rede neural recorrente é uma arquitetura similar à feedforward; a diferença é que a cada nova camada
oculta (hidden layer) é acrescentada outra camada recorrente à arquitetura conectada à camada anterior,
duplicando assim a quantidade de camadas.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936946
Questão 171: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neuraisartificiais (RNA).
 
Em RNA, o uso de early stopping, ainda que não evite o overfitting, permite calcular com mais precisão a
classificação nos dados de validação e, assim, melhorar a acurácia do treinamento.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936947
Questão 172: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
As redes neurais convolucionais se utilizam de uma arquitetura especial que é adaptada para classificar
imagens por meio de algoritmo de aprendizado profundo que pode captar uma imagem de entrada,
atribuir importância por meio de pesos e ser capaz de diferenciar um do outro.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936950
Questão 173: CEBRASPE (CESPE) - PPNS (PETROBRAS)/PETROBRAS/Ciência de
Dados/2022
Assunto: Redes Neurais
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
 
Uma rede neural convolucional é composta por camadas convolucionais, unidades de processamento não
linear e camadas de subamostragem (pooling); ela possui como característica a habilidade em explorar
correlações temporais e espaciais nos dados.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1936951
Questão 174: FGV - AJ (TJDFT)/TJDFT/Apoio Especializado/Análise de Dados/2022
Assunto: Redes Neurais
Após alguns resultados insatisfatórios usando funções de ativação linear em um projeto de rede neural
artificial, um cientista de dados resolve tentar outras funções e recebe algumas sugestões de um colega.
 
Dadas as alternativas abaixo, cada uma representando uma sugestão de função recebida, aquela que
apresenta uma função apropriada ao uso como ativação em uma rede neural é:
 a) 
 b) 
 c) 
 d) 
 e) 
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2049408
Questão 175: FGV - AJ (TJDFT)/TJDFT/Apoio Especializado/Análise de Dados/2022
Assunto: Redes Neurais
Durante o processo de treinamento e validação de uma rede neural, foi observado o fenômeno de
underfitting do modelo, necessitando de ajustes ao procedimento. A arquitetura utilizada foi a Multilayer
Perceptron (MLP) e o conjunto de dados foi separado em regime de holdout (50%, 30% e 20% para
treinamento, validação e teste, respectivamente).
 
Dois fatores que podem ter condicionado o fenômeno observado são:
 a) iterações insuficientes; amostragem dos dados;
 b) excesso de parâmetros; excesso de iterações;
 c) insuficiência de parâmetros; excesso de camadas;
 d) excesso de iterações; entrada não normalizada;
 e) insuficiência de camadas; saída normalizada.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2049412
Questão 176: Com. Org. (IFSP) - Ana TI (IF SP)/IF SP/Ciência de Dados/2022
Assunto: Redes Neurais
Uma rede neural é um modelo preditivo motivado pela forma como o cérebro funciona. Redes neurais
artificiais são formadas por neurônios artificiais, que desenvolvem cálculos similares sobre suas entradas.
Elas podem resolver uma variedade de problemas, tais como o reconhecimento de caligrafia e a detecção
sen ( )x2
−−√
∣x ∣
1
+ 1e−x
ex
− 1e−x
1
1 − log x
facial, entre outros. São geralmente representadas por meio de um grafo orientado, onde os vértices
representam os neurônios e as arestas representam as sinapses. Podem ser classificadas em três
categorias específicas: Redes Neurais Feed-Forward, Redes Recorrentes e Redes Conectadas
Simetricamente. Dentro dessas categorias, existem diversos tipos de arquiteturas.
 
Assinale a alternativa que define corretamente uma Rede Neural Perceptron Multicamadas.
 a) Uma Rede Neural Perceptron Multicamadas é uma rede neural profunda, que pode ser utilizada
para classificar imagens, agrupá-las por similaridade e realizar o reconhecimento de objetos dentro de
cenas.
 b) Uma Rede Neural Perceptron Multicamadas é uma rede neural artificial composta por mais de um
Perceptron. Elas são compostas por uma camada de entrada, para receber o sinal, e uma camada de
saída, que toma uma decisão ou previsão sobre a entrada. Entre essas camadas podem existir um
número arbitrário de camadas ocultas.
 c) Uma Rede Neural Perceptron Multicamadas é um tipo de rede neural artificial projetada para
reconhecer padrões em sequências de dados, como texto, genomas, sons, dados de série temporais ou
linguagem natural.
 d) Uma Rede Neural Perceptron Multicamadas é um tipo de rede neural recorrente estocástica, na
qual os nós tomam decisões binárias com alguma tendência. Esse tipo de rede neural é capaz de
representar e resolver problemas combinatórios difíceis.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2200391
Questão 177: Marinha - QT (Marinha)/Marinha/Informática/2022
Assunto: Redes Neurais
Determinada topologia de Rede Neural Artificial profunda (RNA) foi treinada em diferentes funções
escritas em linguagem Python. Cada uma das formas de treino foram parametrizadas nas funções
treino1, treino2 e treino3, expressas no código abaixo.
 
def treino1(rede_neural, n0, learning_rate):
 
gradiente = 0
for amostra in lista_amostras:
 
saida = rede_neural.get_saida(amostra.valor)
erro = rede_neural.get_erro(saida, amostra.saida_esperada)
gradiente += rede_neural.backpropagation(erro)
 
rede_neural.update.weights(n0 = gradiente)
return rede_neural
 
def treino2(reda_neural, n0):
 
for amostra in lista_amostras:
 
saida = rede_neural,get_saida(amostra.valor)
erro = rede_neural.get_erro(saida, amostra.saida_esperada)
gradiente = rede_neural, backpropagation(erro)
rede_neural.update_weights (n0 = gradiente)
 
return rede_neural
 
def treino3{rede_neural, n0, fator_n);
 
n = n0
for amostra in lista_amostras:
 
saida = rede_neural.get_saida(amostra.valor)
erro = rede_neural.get_erro(saida, amostra.saida_esperada)
gradiente = rede_neural.backpropagation(erro)
rede_neural.update_weights(n = gradiente)
n += fator n
 
return rede_neural
 
Assim, "rede_neural" representa o modelo de Aprendizado de Máquina e possui os métodos get_saida,
que calcula o valor previsto pela rede com base na entrada e o método get_erro, que calcula o erro com
base no valor previsto e no valor de referência, respectivamente. Além disso, o objeto "rede_neural"
armazena todos os parâmetros da rede, possui a função "backpropagation" para calcular o gradiente do
erro em um hiperespaço vetorial, no qual cada dimensão corresponde a um peso e a função
"update_weights" para somar aos pesos o valor fornecido em seu argumento. Assinale a opção correta
tendo como base os códigos apresentados.
 a) Para um hipotético sistema de detecção em tempo real do nível de segurança das ruas do Rio de
Janeiro, que se atualiza automaticamente conforme os dados de câmera são fornecidos, o código
"treino1" é o que utiliza método ideal para a aplicação.
 b) Usualmente, utiliza-se valor levemente abaixo de 1 para "n0" nas funções "treino1", "treino2" e
"treino3", como, por exemplo 0.95.
 c) Um valor de "fator_n" superior a 1 como 1.3 é usualmente utilizado por aumentar a velocidade de
convergência do algoritmo.
 d) O algoritmo apresentado em "treino3" possui alteração que aumenta velocidade de convergência e
precisão do resultado, ainda que valores um pouco maiores de no venham a ser usados.
 e) O erro em função dos pesos da rede neural profunda tem convergência a mínimos locais impedida
por meio do código expresso em "treino3".
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/2220743
Questão 178: FGV - AJ TRT13/TRT 13/Apoio Especializado/Tecnologia da
Informação/2022
Assunto: Redes Neurais
Com relação a Pytorch, assinale V para a afirmativa verdadeira e F para a falsa.
 
I. Trata-se de uma biblioteca de tensores que pode ser utilizada em problemasde aprendizado
profundo, podendo utilizar tanto GPU quanto CPU.
 
II. O pacote torch.parallel.gpu é capaz de suportar o processamento paralelo de tensores do tipo
multidimensionais dimensionais e CUDA em processadores GPU.
 
III. O pacote torch.distributed.elasticstack é capaz distribuir um script tornando-o elástico e
tolerante a falhas em diversos tipos de ambientes distribuídos.
 
As afirmativas são, respectivamente,
 a) F, V e V.
 b) F, F e V.
 c) F, V e F.
 d) V, V e F.
 e) V, F e F.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2233754
Questão 179: CEBRASPE (CESPE) - AF (SEFAZ CE)/SEFAZ CE/Tecnologia da Informação da
Receita Estadual/2021
Assunto: Redes Neurais
A respeito de inteligência artificial, julgue o item seguinte.
 
Cada unidade de uma rede neural artificial possui um valor e um peso, no seu nível mais básico, para
indicar sua importância relativa.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1718781
Questão 180: CEBRASPE (CESPE) - AF (SEFAZ CE)/SEFAZ CE/Tecnologia da Informação da
Receita Estadual/2021
Assunto: Redes Neurais
A respeito de inteligência artificial, julgue o item seguinte.
 
Redes neurais do tipo LSTM (long short-term memory) mantêm o nível de precisão independentemente
do tamanho do modelo utilizado.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1718784
Questão 181: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redes Neurais
Analise o modelo de redes neurais a seguir.
Com base na rede neural acima, podemos concluir que é uma rede neural:
 a) Markov Chain
 b) Feed-Forward
 c) Recurrent Neutral Network
 d) Boltzmann Machine
 e) Neutral Turing Machine
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821064
Questão 182: Tec - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2021
Assunto: Redes Neurais
As redes neurais do tipo Feed-Forward
 a) só podem ter camada única.
 b) o fluxo de informação é bidirecional.
 c) o fluxo de informação é unidirecional.
 d) são redes dinâmicas, pois a saída não depende da entrada.
 e) pode haver camadas que não se conectam com outras e com isso há caminhos de "ida" e "volta".
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1821066
Questão 183: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
Sobre as redes Perceptron Multicamadas (PMC), é correto afirmar que:
 a) não são utilizadas para previsão de séries temporais.
 b) possuem uma ou mais camadas de neurônios.
 c) seu treinamento é realizado de forma supervisionada.
 d) não possui camada neural de salda.
 e) durante seu processo de treinamento, os pesos sinápticos são fixos.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727205
Questão 184: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
Dada uma rede Perceptron, com n sinais de entrada (sendo n > 1 ), é correto afirmar que a rede possui:
 a) n neurônios artificiais e n camadas de salda.
 b) n camadas neurais e n neurônios artificiais.
 c) uma camada neural e n neurônios artificiais.
 d) uma camada neural e somente um neurônio artificial.
 e) n camadas neurais e somente um neurônio artificial.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727208
Questão 185: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
Assinale a opção que apresenta o parâmetro que em uma rede neural, define a velocidade do processo
de treinamento até que seja alcançada a sua convergência, sabendo que esse parâmetro deve ser
escolhido com cuidado, para que se evite instabilidade no processo treinamento.
 a) Limiar de ativação.
 b) Número de camadas.
 c) Taxa de aprendizagem.
 d) Número de neurônios.
 e) Número de épocas.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727230
Questão 186: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
No contexto de redes neurais artificiais, são funções de ativação parcialmente diferenciáveis as funções:
 a) logística e tangente hiperbólica.
 b) degrau e rampa simétrica.
 c) tangente hiperbólica e gaussiana.
 d) gaussiana e degrau.
 e) tangente hiperbólica e degrau bipolar.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727242
Questão 187: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
Sobre as funções de ativação das redes neurais artificiais, assinale a opção correta.
 a) O resultado da saída pela aplicação da função degrau sempre assumirá valores reais entre zero e
um.
 b) O resultado da saída pela aplicação da função degrau bipolar nunca será negativo.
 c) O resultado da saída peía aplicação da função tangente hiperbólica sempre assumirá varares
positivos.
 d) O resultado da saída pela aplicação da função linear sempre assumirá os vaíores menos um ou
um.
 e) O resultado da saída pela aplicação da função logística sempre assumirá varares reais entre zero e
um.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727260
Questão 188: Marinha - QT (Marinha)/Marinha/Informática/2020
Assunto: Redes Neurais
Assinale a opção que NÃO corresponde a um passo do funcionamento de um neurônio artificial.
 a) Subtrair o limiar de ativação da soma ponderada dos sinais de entrada.
 b) Aplicar uma função de ativação apropriada sobre o potencial de ativação.
 c) Multiplicar cada entrada pelo peso sináptico.
 d) Apresentar as entradas.
 e) Aplicar a função de ativação sobre cada entrada.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1727268
Questão 189: FGV - APPGG (CGM Niterói)/Pref Niterói/Gestão de Tecnologia/2018
Assunto: Redes Neurais
Analise a rede neural exibida a seguir.
 
 
Sobre essa rede, analise as afirmativas a seguir.
I. Não possui camadas intermediárias (hidden layers).
II. Admite três sinais de entrada (input units) além do intercept term.
III. É apropriada para aplicações de deep learning.
Está correto o que se afirma em
 a) I, apenas.
 b) II, apenas.
 c) III, apenas.
 d) I e II, apenas.
 e) I , II e III.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/632363
Questão 190: FGV - APPGG (CGM Niterói)/Pref Niterói/Gestão de Tecnologia/2018
Assunto: Redes Neurais
No contexto das redes neurais, é comum o uso da função sigmoid no papel de função de ativação.
Assinale a definição correta dessa função na referida aplicação.
 a) 
 b) 
f(z) = 1
1−ez
f(z) = e−z
 c) 
 d) 
 e) 
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/632375
Questão 191: CEBRASPE (CESPE) - PEBTT (IFF)/IFF/Engenharia da Computação/2018
Assunto: Redes Neurais
Os mapas de Kohonen fazem parte das redes neurais auto-organizáveis, as quais se caracterizam por
 a) utilizar treinamento supervisionado.
 b) possuir uma topologia em que os neurônios são dispostos em N camadas estruturadas em N
dimensões.
 c) gerar um mapa de saída em uma estrutura unidimensional de neurônios.
 d) dividir o conjunto de padrões de entrada em grupos inerentes aos dados, formando-se
agrupamentos denominados clusters.
 e) resolver problemas lineares de baixa dimensionalidade.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/666220
Questão 192: CEBRASPE (CESPE) - Temp NS (MPOG)/MPOG/Atividade Técnica de
Complexidade Intelectual/Tecnologia da Informação/2013
Assunto: Redes Neurais
Julgue o item, a respeito dos conceitos de inteligência computacional.
 
As redes neurais são sistemas computacionais embasados em codificação do conjunto das possíveis
soluções, e não nos parâmetros de otimização; para relacionar cada caso a uma categoria, entre as
várias categoriasexistentes, elas utilizam regras.
 Certo
 Errado
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1547453
Questão 193: ITCO - Ana (UFTM)/UFTM/Tecnologia da Informação/2009
Assunto: Redes Neurais
Sistemas desenvolvidos para atuarem através de reconhecimento de padrões, tendo como principal
característica a capacidade de adquirem conhecimento através da experiência são definidos como:
 a) Redes Neurais Artificiais
 b) Sistemas Especialistas
 c) Sistemas Distribuídos
 d) Lógica Fuzzy
Esta questão não possui comentário do professor no site. www.tecconcursos.com.br/questoes/1849254
Questão 194: FGV - Aud Est (CGE SC)/CGE SC/Ciências da Computação/2023
Assunto: Processamento de Linguagem Natural (IA)
No processamento de linguagem natural, é preciso realizar transformações de textos em números,
geralmente vetores ou matrizes, de forma que sirvam de entrada para os algoritmos computacionais de
aprendizado de máquina.
Sobre esses algoritmos de extração de características de textos, assinale a afirmativa incorreta.
f(z) = 1
z+e−z
f(z) = z
1+ez
f(z) = 1
1+e−z
 a) Os algoritmos de extração de características Bag of Words (BoW) e TF-IDF são diferentes entre si
porque o primeiro conta a quantidade de vezes que uma palavra aparece num texto e o segundo
normaliza essa informação utilizando a quantidade de vezes que a palavra aparece no corpus de texto.
 b) O algoritmo de word embeddings Word2Vec depende do princípio da distribuição, em que as
palavras que geralmente têm as mesmas palavras vizinhas tendem a ser semanticamente semelhantes e
as colocam num vetor de tamanhos fixos que representam semanticamente as palavras vizinhas.
 c) O algoritmo de word embeddings Glove combina estatísticas locais com estatísticas globais fazendo
a análise de uma matriz de co-ocorrência palavra-palavra, de forma que se conta a frequência que essa
palavra aparece relacionada com algum “contexto” em um grande corpus.
 d) O algoritmo de word embeddings Word2Vec possui duas arquiteturas de construção. A primeira é
a CBOW, em que se treina uma rede neural com a tarefa de prever uma palavra dado o contexto e a
outra é a Skip-Gram, em que a tarefa da rede neural será dada uma palavra, prever o contexto.
 e) Na matriz de co-ocorrência do algoritmo de word embeddings Glove, ao correlacionar uma palavra
p1 com um contexto c1, se a palavra p1 possui correlação alta com c1, o valor será mais alto do que o
contrário; essa correlação poderá ser utilizada para calcular correlações entre quaisquer palavras do
corpus de texto e esse contexto.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/2295392
Questão 195: FGV - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2022
Assunto: Processamento de Linguagem Natural (IA)
Um analista do TCU gostaria de aplicar um modelo de Latent Dirichlet Allocation (LDA) em um conjunto
de textos.
A alternativa que melhor descreve o resultado do modelo é:
 a) uma lista de tópicos, cada um com um título diferente;
 b) uma lista das palavras mais importantes no conjunto de documentos;
 c) cada documento é classificado em somente um tópico, onde cada tópico é formado por uma lista
de palavras;
 d) cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde
cada tópico é formado por uma lista de palavras e cada palavra pertence a somente um tópico;
 e) cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde
cada tópico é formado por uma distribuição de probabilidade sobre todas as palavras presentes nos
documentos.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1916108
Questão 196: FGV - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2022
Assunto: Processamento de Linguagem Natural (IA)
Considere os documentos A e B a seguir.
 
A = “Há pessoas que choram por saber que as rosas têm espinho”
 
B = “Há outras que sorriem por saber que os espinhos têm rosas”
 
A submatriz da matriz de TF-IDF desses dois documentos correspondente aos termos “Rosas”, “Choram”
e “Sorriem”, nessa ordem, é:
 a) 
 b) 
 c) 
 d) 
 e) 
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1916129
Questão 197: FGV - AUFC (TCU)/TCU/Controle Externo/Auditoria Governamental/2022
Assunto: Processamento de Linguagem Natural (IA)
Uma organização está implementando um sistema de busca de informações interno, e a equipe de
desenvolvimento resolveu avaliar diferentes modelos de linguagem vetoriais que ajudariam a conectar
melhor documentos e consultas em departamentos que usam terminologias distintas em áreas de
negócio que se sobrepõem. Um dos analistas ressaltou que seria interessante guardar os vetores de todo
o vocabulário do modelo em um cache, de forma a aumentar a eficiência de acesso e reduzir certos
custos de implantação.
Das alternativas abaixo, aquela que lista apenas os modelos compatíveis com essa estratégia de caching
é:
 a) TF-IDF, BERT; 
 b) Word2Vec, BERT, GPT-2; ,
 c) GloVe, GPT-2;
 d) Word2Vec, GloVe;
 e) GPT-2, BERT.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1916140
Questão 198: FGV - AFFC (CGU)/CGU/Tecnologia da Informação/"Sem
Especialidade"/2022
Assunto: Processamento de Linguagem Natural (IA)
Durante a elaboração de um sistema de busca de informações biomédicas, foi construído um modelo de
linguagem vetorial não contextual para estimar relações de similaridade semântica necessárias para
[ ]
0
0
0
log2
11
1
11
0
[ ]
1
11
1
11
1
11
0
0
1
11
[ ]
0
0
log2
11
0
0
log2
11
[ ]0
0
0
1
11
log2
11
0
[ ]
1
11
1
11
log2
11
0
0
log2
11
comparação entre queries e documentos. Entretanto, verificou-se nos testes iniciais que o desempenho
do modelo ficou insatisfatório, devido a muitos termos técnicos presentes nos documentos testados, que
não haviam sido incorporados ao modelo.
Para aliviar esse problema, uma tarefa de processamento do texto e seu estágio correspondente no
processamento de linguagem natural que poderiam ser aplicados na construção do modelo são,
respectivamente:
 a) Word embedding; Análise léxic;
 b) Lematização; Análise sintática;
 c) Decomposição morfológica; Análise léxica;
 d) Word embedding; Análise semântica;
 e) Decomposição morfológica; Análise sintática.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1925053
Questão 199: CEBRASPE (CESPE) - ATT (SEFAZ SE)/SEFAZ SE/2022
Assunto: Processamento de Linguagem Natural (IA)
Na mineração de texto, o processo utilizado para remover os prefixos e sufixos de palavras, de modo a
permanecer somente a raiz delas, com a finalidade de melhorar o armazenamento, é conhecido como
 a) stemming.
 b) análise léxica.
 c) remoção de stop-words.
 d) determinação de pesos.
 e) criação de tesauros.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1942673
Questão 200: FGV - ATIFE (Sefaz AM)/SEFAZ AM/2022
Assunto: Processamento de Linguagem Natural (IA)
O índice de Jaccard, dado por , entre os conjuntos de palavras
 e é
 a) 1/2.
 b) 2/3.
 c) 1/3.
 d) 3/4.
 e) 1/4.
Esta questão possui comentário do professor no site. www.tecconcursos.com.br/questoes/1990121
J(A,B) =
|A∩B|
|A∪B|
A = {bolo, vela, faca,aniversário} B = {crime, vela, faca,polícia}
Gabarito
1) E 2) Anulada 3) Certo 4) Certo 5) B 6) D 7) D
8) Errado 9) Certo 10) B 11) B 12) C 13) A 14) D
15) Errado 16) Certo 17) Errado 18) Errado 19) Errado 20) Certo 21) Errado
22) Errado 23) Certo 24) D 25) A 26) B 27) D 28) D
29) Errado 30) Errado 31) D 32) A 33) E 34) C 35) Certo
36) Certo 37) D 38) A 39) Errado 40) B 41) C 42) Certo
43) Errado 44) Errado 45) Anulada 46) Certo 47) Anulada 48) Certo 49) Certo
50) Errado 51) Errado 52) Certo 53) A 54) Errado 55) D 56) C
57) C 58) E 59) D 60) E 61) Certo 62) Errado 63) Certo64) A 65) A 66) D 67) A 68) B 69) E 70) C
71) D 72) Certo 73) Errado 74) B 75) E 76) Certo 77) D
78) B 79) E 80) Certo 81) D 82) B 83) C 84) C
85) Errado 86) Errado 87) E 88) B 89) D 90) D 91) B
92) C 93) C 94) A 95) D 96) Errado 97) Certo 98) C
99) A 100) B 101) Certo 102) D 103) D 104) Certo 105) Certo
106) C 107) A 108) C 109) B 110) D 111) B 112) B
113) B 114) Anulada 115) Anulada 116) B 117) D 118) A 119) Errado
120) Errado 121) Certo 122) B 123) Certo 124) Certo 125) C 126) Errado
127) D 128) C 129) B 130) A 131) C 132) E 133) B
134) C 135) A 136) E 137) Errado 138) Errado 139) C 140) D
141) B 142) Certo 143) Certo 144) C 145) C 146) Errado 147) Errado
148) A 149) B 150) E 151) A 152) D 153) D 154) E
155) A 156) D 157) B 158) C 159) A 160) D 161) B
162) E 163) B 164) C 165) B 166) Anulada 167) Errado 168) Certo
169) Certo 170) Errado 171) Errado 172) Anulada 173) Certo 174) C 175) A
176) B 177) Anulada 178) E 179) Certo 180) Errado 181) B 182) C
183) C 184) D 185) C 186) B 187) E 188) E 189) B
190) E 191) D 192) Errado 193) A 194) Anulada 195) E 196) C
197) D 198) C 199) A 200) C

Mais conteúdos dessa disciplina