Baixe o app para aproveitar ainda mais
Prévia do material em texto
5/3/23, 6:33 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956656 1/4 Análise e modelagem preditiva Professor(a): Orlando da Silva Junior (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Em 2012, o professor Pedro Domingos publicou o artigo “A few useful things to know about machine learning”, com 12 lições sobre a prática de machine learning para pesquisadores e profissionais. Assinale a alternativa que apresenta um dessas lições. Alternativas: Código da questão: 61720 Leia e associe as duas colunas: Assinale a alternativa que traz a associação correta entre as duas colunas: Alternativas: Código da questão: 61697 Sobre overfitting, underfitting e as técnicas de regularização, podemos afirmar que: I. Overfitting corresponde ao comportamento de modelos preditivos que não generalizam bem além dos dados de treinamento. II. Underfitting é uma característica dos modelos de classificação que favorece o desempenho preditivo do estimador. III. Tanto overfitting quanto underfitting prejudicam a generalização dos modelos preditivos. IV. Técnicas de regularização podem ser utilizadas para evitar overfitting. São verdadeiras: Alternativas: Código da questão: 61712 Aprendizagem = representação + otimização. Aprendizagem = representação + avaliação + modelagem. Otimização = aprendizagem + avaliação + representação. Aprendizagem = representação + avaliação. Aprendizagem = representação + avaliação + otimização. CORRETO I – B; II – C; III – A. I – C; II – B; III – A. I – A; II – B; III – C. I – B; II – A; III – C. CORRETO I – A; II – C; III – B. I, III e IV, apenas. CORRETO I, apenas. I e II, apenas. II e IV, apenas. II, III e IV, apenas. 5/3/23, 6:33 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956656 2/4 4) 5) 6) 7) A ciência de dados pode ser formulada a partir de um processo que enxergue o desenvolvimento de projetos analíticos como uma série de etapas, que vão da __________ até a _________ do que foi construído. Entre essas etapas, o cientista de dados ou especialista em Analytics deverá aplicar estratégias para obter e __________, preparar os dados obtidos para modelagem, executar o treinamento e a avaliação dos modelos e, finalmente, _________ o melhor modelo da etapa anterior. Assinale a alternativa que completa adequadamente as lacunas. Alternativas: Código da questão: 61721 Para avaliar um modelo preditivo, devemos seguir três passos. O primeiro deles é determinar a _________ que será utilizada para avaliar o modelo. E, neste caso, podemos usar mais de uma ao mesmo tempo. Em seguida, devemos preparar os experimentos, particionando os dados em 80% para treinamento e 20% para _________. Por fim, vamos executar os algoritmos nos dados de _________ e coletar os resultados nos dados de _________ e _________. Assinale a alternativa que completa adequadamente as lacunas: Alternativas: Código da questão: 61702 Otimizar um modelo é uma etapa importante em projetos de ciência de dados. A respeito da otimização de modelos preditivos, é correto afirmar que: Alternativas: Código da questão: 61713 Dados do tipo texto requerem extensos procedimentos de pré-processamento antes de serem aplicados à modelagem de dados. Sobre a preparação de dados textuais, podemos afirmar que: I. A geração de tokens promove a remoção de sinais como pontos, vírgulas, hífens e outros diacríticos durante a análise lexical. II. Na etapa de representação é realizado o mapeamento entre termos, documentos e corpus para dados numéricos, formando um conjunto de dados que será utilizado pelos Análise de dados; distribuição; visualizar dados; otimizar. INCORRETO Análise do problema de negócio; pré-processar; visualizar dados; otimizar. Análise do problema de negócio; implantação; visualizar dados; implantar. Análise do problema de negócio; distribuição; visualizar dados; otimizar. Análise de dados; implantação; pré-processar dados; implantar. Métrica; teste; treinamento; avaliação; teste. CORRETO Medida; treinamento; avaliação; treinamento; teste. Métrica; treinamento; treinamento; avaliação; teste. Métrica; teste; teste; treinamento; avaliação. Medida; treinamento; avaliação; teste; avaliação. O preditor de base é a referência do processo de otimização algorítmica, sendo responsável por predizer o desempenho dos modelos lineares. O processo de otimização se caracteriza pela busca de parâmetros e hiperparâmetros ótimos em um conjunto pré-definido de modelos. A otimização corresponde ao processo de melhora no desempenho preditivo, realizado antes da implantação do modelo em produção. CORRETO O desempenho de um modelo de classificação depende da otimização de hiperparâmetros realizada em conjunto com a regularização. A base da classificação de dados é a otimização de modelos preditivos em um processo centrado na aprendizagem de dados. 5/3/23, 6:33 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956656 3/4 8) 9) 10) algoritmos de aprendizagem de máquina. III. O processo de redução do termo ao radical tem como objetivo encontrar os sufixos de palavras semelhantes a fim de identificá-las como únicas. IV. Na eliminação de termos irrelevantes são removidas as palavras que não fazem parte do domínio da aplicação. São verdadeiras: Alternativas: Código da questão: 61719 A modelagem preditiva para Analytics compreende não apenas a construção de algoritmos estatísticos, mas também a avaliação de desempenho dos resultados gerados por eles. Diante disso, responda: como garantir que um modelo será construído corretamente? Alternativas: Código da questão: 61701 Analytics é uma disciplina focada em entender os porquês de um determinado fenômeno estar acontecendo e/ou o que vai acontecer com esse fenômeno no futuro. A respeito das aplicações analíticas, é correto afirmar que. Alternativas: Código da questão: 61694 Um modelo preditivo é construído a partir de um __________ formado por objetos únicos e __________ que representam a informação sobre um domínio particular. Ao modelar um problema, os atributos escolhidos deverão reduzir a __________ sobre o que desejamos descobrir. Quando um novo modelo é construído, ele é criado por um algoritmo em um processo de __________, que generalizará os dados particulares do conjunto de dados em uma regra geral. Em machine learning, essa regra consiste no algoritmo __________, aquele que é aplicado a novos casos. Assinale a alternativa que completa adequadamente as lacunas: Alternativas: II e IV, apenas. INCORRETO I e II, apenas. I, III e IV, apenas. I, apenas. II, III e IV, apenas. Por meio de um processo de avaliação dos experimentos. CORRETO Avaliando a qualidade do código dos algoritmos implementados. Aumentando a quantidade de dados experimentais. Trabalhando com especialistas do negócio e de tecnologia. Por meio de experimentos usando análise ROC. O conhecimento construído pelos tomadores de decisão a partir dos dados permite que novas aplicações sejam desenvolvidas. A tomada de decisão se origina com o uso eficiente dos dados, transformados em conhecimento e previamente pré-processados. Elas têm como propósito a compreensão atual do negócio e a construção de um arcabouço de conhecimentos para tomada de decisão. CORRETO As áreas de negócio dependem do arcabouço de conhecimentos construído pelas áreas de tecnologia para tomarem decisões. Os ambientes organizacionais servem como local para construção e experimentação de protótipos de sistemas baseados em dados. 5/3/23, 6:33 PM Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/59566564/4 Código da questão: 61709 Base de dados; funções; confiança; indução; indutor. Conjunto de dados; atributos; desconfiança; dedução; preditor. Base de dados; funções; certeza; indução; preditor. Conjunto de dados; atributos; incerteza; indução; preditor. CORRETO Conjunto de dados; variáveis; incerteza; dedução; indutor. Arquivos e Links
Compartilhar