Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
1) Leia e associe as duas colunas: Assinale a alternativa que traz a associação correta entre as duas colunas: Alternativas: · I – A; II – B; III – C. · I – B; II – C; III – A. · I – C; II – B; III – A. · I – B; II – A; III – C. checkCORRETO · I – A; II – C; III – B. Resolução comentada: métodos de classificação buscam discriminar classes de objetos. Técnicas de agrupamento objetivam formar grupos por estratégias de similaridade. Aplicações de mineração de itens frequentes buscam pela associação entre diferentes tipos de objetos. Código da questão: 61697 2) A respeito da avaliação de modelos preditivos, é correto afirmar que: Alternativas: · A avaliação é realizada sobre os dados de treinamento durante a otimização do modelo. · A estimação ou classificação sobre novos dados é realizada antes da etapa de treinamento. · Uma mesma medida de desempenho pode ser aplicada em problemas de regressão e classificação. · A avaliação é realizada sobre os dados de treinamento em problemas de regressão. · Os dados históricos devem ser divididos em subconjuntos distintos para fins experimentais. checkCORRETO Resolução comentada: considerando o processo de avaliação de modelos, é correto dividir os dados históricos em subconjuntos distintos. Problemas de regressão e classificação utilizam medidas diferentes em razão do rótulo. A avaliação é sempre realizada sobre os dados não vistos no treinamento. A última etapa do processo de avaliação é a predição de novos valores. Código da questão: 61706 3) Sobre as principais atividades realizadas durante o pré-processamento de dados visando a modelagem para Analytics, analise as afirmativas a seguir e assinale-as com V (verdadeiro) ou F (falso): ( ) Os atributos menos importantes são removidos durante a integração de dados entre conjuntos de dados diferentes. ( ) O desbalanceamento de objetos entre classes pode ser corrigido durante o processo de aprendizagem de algoritmos evolutivos. ( ) A inconsistência de dados reflete a qualidade e a distribuição multiplataforma dos dados. Assinale a alternativa que contenha a sequência correta: Alternativas: · F – V – V. · V – V – V. · V – V – F. · F – F – V. · F – F – F. checkCORRETO Resolução comentada: os atributos menos importantes são eliminados na atividade de remoção de atributos. O desbalanceamento de dados entre classes não pode ser corrigido durante o processo de aprendizagem por nenhum algoritmo de classificação. A inconsistência dos dados em soluções analíticas reflete a qualidade dos dados, mas não a distribuição deles entre plataformas. Código da questão: 61696 4) A composição dos atributos é uma peça fundamental na modelagem preditiva. Em geral, eles descrevem as características do problema e indicam um possível caminho ao analista para encontrar a solução. Diante disso, responda: qual é o papel dos atributos na análise e modelagem preditiva? Alternativas: · Uma desvantagem da seleção de atributos é a necessidade de seleção manual das características que formatam o problema. · O propósito da seleção de atributos na modelagem preditiva é otimizar o desempenho do estimador, especialmente dos classificadores. · A análise e modelagem preditiva dependem menos dos atributos do que dos algoritmos empregados na solução. · Os atributos devem ser selecionados de acordo com critérios que respondam ao negócio a fim de reduzir as incertezas sobre o problema. checkCORRETO · Um atributo deve ser suficientemente explicativo em qualquer contexto de predição. Resolução comentada: os atributos escolhidos para a modelagem devem reduzir a incerteza a respeito do problema que queremos solucionar. Código da questão: 61708 5) A modelagem preditiva para Analytics compreende não apenas a construção de algoritmos estatísticos, mas também a avaliação de desempenho dos resultados gerados por eles. Diante disso, responda: como garantir que um modelo será construído corretamente? Alternativas: · Trabalhando com especialistas do negócio e de tecnologia. · Por meio de um processo de avaliação dos experimentos. checkCORRETO · Por meio de experimentos usando análise ROC. · Aumentando a quantidade de dados experimentais. · Avaliando a qualidade do código dos algoritmos implementados. Resolução comentada: não existe uma única técnica capaz de resolver todos os problemas. Assim, métodos de diferentes paradigmas precisam ser experimentados, bem como diferentes algoritmos desses métodos. E, neste caso, também devem ser avaliados. Além disso, a melhor configuração de hiperparâmetros deve ser encontrada, exigindo também a experimentação. Código da questão: 61701 6) A respeito das 12 lições do professor Pedro Domingos para a prática de machine learning, analise as afirmativas a seguir e assinale-as com V (verdadeiro) ou F (falso): ( ) A primeira lição diz que o segredo da aprendizagem de máquina é escolher bem uma representação dos dados, uma função de avaliação e uma estratégia de otimização. ( ) Uma das lições ensina que a experimentação de diferentes modelos pode formar um viés na escolha do melhor algoritmo. ( ) As lições dizem que usar muitos dados é positivo para a aprendizagem, mas apenas eles são insuficientes para que o modelo generalize bem. Assinale a alternativa que contenha a sequência correta: Alternativas: · F – V – V. · V – V – V. · F – F – V. · V – F – F. · V – F – V. checkCORRETO Resolução comentada: a segunda afirmativa é falsa, porque é na nona lição que o professor Pedro Domingos ensina que a chave do sucesso para machine learning é a experimentação de diferentes modelos. Código da questão: 61717 7) Sobre overfitting, underfitting e as técnicas de regularização, podemos afirmar que: I. Overfitting corresponde ao comportamento de modelos preditivos que não generalizam bem além dos dados de treinamento. II. Underfitting é uma característica dos modelos de classificação que favorece o desempenho preditivo do estimador. III. Tanto overfitting quanto underfitting prejudicam a generalização dos modelos preditivos. IV. Técnicas de regularização podem ser utilizadas para evitar overfitting. São verdadeiras: Alternativas: · I, III e IV, apenas. checkCORRETO · II e IV, apenas. · I, apenas. · I e II, apenas. · II, III e IV, apenas. Resolução comentada: a afirmação I é verdadeira, pois overfitting é um comportamento de modelos que se ajustam aos dados de treinamento, impedindo boa generalização para novos dados; já a II é falsa, pois underfitting não favorece o desempenho preditivo do estimador; a III é correta, pois ambos os comportamentos prejudicam a generalização; por fim, a IV está certa, pois o objetivo das técnicas de regularização é evitar overfitting. Código da questão: 61712 8) Sobre o processo de avaliação de modelos preditivos, analise as afirmativas a seguir e assinale-as com V (verdadeiro) ou F (falso): ( ) A divisão da base de dados histórica deve ser feita em três subconjuntos disjuntos: treinamento, validação e teste. ( ) O treinamento deve ser realizado sobre os dados de teste e avaliados nos dados de validação. ( ) Os dados históricos são divididos para que as estimativas sejam menos otimistas sobre o desempenho do preditor. ( ) A estimação é realizada pelo algoritmo de aprendizagem sobre os dados de teste. Assinale a alternativa que contenha a sequência correta: Alternativas: · F – F – V – F. · V – V – F – V. · F – F – V – V. · V – F – V – F. checkCORRETO · F – V – F – V. Resolução comentada: o treinamento deve ser realizado sobre os dados de treinamento e avaliados nos dados de teste. A estimação é realizada pelo algoritmo preditor sobre os dados de teste. Código da questão: 61703 9) A construção de qualquer produto de dados (data product) requer a adoção de uma metodologia de desenvolvimento que compreenda o papel do tomador de decisão no produto. Diante disso, responda: qual é o papel do tomador de decisão no processo de desenvolvimento de um projeto de ciência de dados? Alternativas: · Um processo de ciência de dados é formado por etapas sequenciais que começa com a análise do problema de negócio descrito ou sofrido pelo tomador de decisão. checkCORRETO · O tomador de decisão tem um papel minoritário no desenvolvimento do produto de dados, uma vez que a sua atuação acontece apenas nas etapas finais do processo. · O tomador de decisão é o responsável pelo projeto de ciência de dados, sendo o ator principal nas etapas de análise do problema de negócio e treinamento e avaliação de modelos. · Durante a distribuição do produto de dados, o tomador de decisão atua como líder na confecção do produto final, sendo também responsável por implantá-lo em ambientes adequados. · Um processo de ciência de dados objetiva a construção de um produto de dados idealizado pelo tomador de decisão, que também é o responsável pela análise dos dados e da modelagem preditiva. Resolução comentada: o tomador de decisão é o principal usuário do projeto e a partir dele devem ser entendidas as necessidades de negócio. Código da questão: 61715 10) Leia e associe as duas colunas: Assinale a alternativa que traz a associação correta entre as duas colunas: Alternativas: · I – C; II – A; III – B. · I – A; II – C; III – B. checkCORRETO · I – B; II – C; III – A. · I – B; II – A; III – C. · I – C; II – B; III – A. Resolução comentada: Classificador linear realiza a soma ponderada dos valores dos atributos. Discriminante linear é uma função por partes que separa os valores em classes conhecidas. Na regressão linear, seu algoritmo de aprendizagem tem como meta ajustar o modelo aos dados de entrada, buscando pelos parâmetros ótimos da função linear em um atributo-alvo numérico. image1.png image2.png