Baixe o app para aproveitar ainda mais
Prévia do material em texto
1Machine Learning, compreendido como o aprendizado de máquina a partir dos dados previamente conhecidos, é definido como um campo preocupado com a questão de como construir programas de computador que melhorem automaticamente a experiência do usuário. Também pode ser dividido em: Tarefa (T), Medida de Desempenho (P) e Experiência de Treinamento (E). Com base no diagnóstico de gravidez de risco, associe os itens, utilizando o código a seguir: I- Tarefa T. II- Medida de Desempenho P. III- Experiência de Treinamento E. ( ) Classificar novas gestantes com potenciais riscos na gravidez. ( ) Porcentagem de pacientes classificadas corretamente. ( ) Base de dados histórica contendo exemplos de gestantes com ou sem gravidez de risco. Assinale a alternativa que apresenta a sequência CORRETA: Sobre a associação dos itens acima, selecione a alternativa CORRETA com a associação entre os itens. A I - II - III. B III - II - I. C III - I - II. D II - I - III. 2A arquitetura é organizada em cinco camadas: Fontes de dados, ETL +, Corpus, OLAP e Consumidor / Solicitante. Podemos perceber que o framework suporta interações e iterações porque os aplicativos (na camada Consumidor / Solicitante) não apenas consomem cubos de dados, mas podem solicitar dados que se adaptem melhor às suas necessidades. As fontes de dados são dinâmicas, pois são notícias coletadas de sites. Inicialmente, fornecemos um corpus de textos em inglês. Como parte do ETL +, o rastreador extrai dados de jornais digitais para obter o corpus on-line. Com base na imagem e associando com as etapas de aprendizado de um algoritmo de Machine Learning, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O Crawler faz a etapa de coleta de dados. ( ) O Crawler faz a etapa de preparação dos dados. ( ) A etapa de Limpeza e integração de dados coleta de dados. ( ) A etapa de Limpeza e integração de dados é a preparação dos dados. Assinale a alternativa que apresenta a sequência CORRETA: A V - F - V - F. B F - V - V - V. C V - F - V - V. D V - F - F - V. 3A classificação, também denominada de categorização, é a atividade de rotular dados com suas respectivas categorias temáticas, a partir de um conjunto de dados predefinidos. Os métodos de classificação podem ser de aprendizado on-line ou off-line, de acordo com a capacidade de construir e atualizar do classificador. Sobre as métricas de classificação, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A precisão é a porcentagem de amostras classificadas como pertencentes à classe positiva e que realmente fazem parte de tal classe. ( ) A revocação, também chamada de sensibilidade ou recall, é uma métrica que, entre todas as situações de classe positiva como valor esperado, indica quantas estão corretas. ( ) Os verdadeiros negativos são baseados na classificação correta da classe negativa. ( ) A revocação é a porcentagem de amostras classificadas como pertencentes à classe positiva e que realmente fazem parte de tal classe. Assinale a alternativa que apresenta a sequência CORRETA: A V - V - V - F. B F - V - F - V. C F - V - V - F. D V - F - V - F. 4Os sistemas de aprendizado de máquina apresentam características peculiares que possibilitam uma classificação não exclusiva desses sistemas em função da linguagem de descrição, do modo de aprendizado, do paradigma de aprendizado, das formas e da tarefa de aprendizado. Com base nas características e seus tipos, associe os itens, utilizando o código a seguir: I- Modos de aprendizado. II- Paradigmas de aprendizado. III- Formas de aprendizado. IV- Tarefas de aprendizado. ( ) Supervisionado, Não Supervisionado, Por Esforço. ( ) Incremental e Não Incremental. ( ) Simbólico, Estatístico, Conexionista e Genético. ( ) Classificação, Regressão, Agrupamento e Associação. Assinale a alternativa que apresenta a sequência CORRETA: A I - II - III - IV. B IV - III - II - I. C I - III - II - IV. D I - IV - III - II. 5O classificador Naïve Bayes é construído utilizando dados de treinamento para estimar a probabilidade de um documento pertencer a uma classe. O teorema de Bayes, mostrado em anexo, é utilizado para estimar estas probabilidades. Sobre a fórmula, classifique V para as sentenças verdadeiras e F para as falsas: ( ) P (x) é a probabilidade original do preditor. ( ) P (c l x) é a probabilidade posterior da classe (c, alvo) dado preditor (x, atributos). ( ) x é o conjunto de dados. ( ) P(C) é a probabilidade original da classe. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: OLIVEIRA, G. L.; NETO, M. G. M. Expertext: Uma ferramenta de combinação de múltiplos classificadores naive bayes. Anales de la 4ª Jornadas Iberoamericanas de Ingeniería de Software e Ingeniería de Conocimiento. Madrid, v. 1, p. 317-32, 2004. A F - F - F - F. B V - V - V - V C V - F - F - F. D F - V - V - V. 6A regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente com variáveis independentes específicas. A análise da regressão pode ser usada como um método descritivo da análise de dados sem a necessidade de quaisquer suposições sobre as metodologias que permitiram gerar os dados. Sobre a regressão e as funções de custo, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A função de custo tem como objetivo deixar a função de regressão mais rápida ( ) O Gradiente Descendente é utilizado para diminuir o erro da função de regressão ( ) No processo do Gradiente descendente o custo diminui conforme as interações ( ) Apesar de funcionar na teoria, não é possível implementar uma função de custo Assinale a alternativa CORRETA que apresenta a sequência CORRETA: FONTE: MARTINS, Lais Santos; LIMA, Danielli A. Aprendizado semi-supervisionado para análise de dados de base aberta pública sobre casos de doenças do aparelho respiratório. EnPE, v. 7, n. 1, 2020. A F - V - V - F. B F - F - V - V. C V - V - V - F. D V - F - V - F. 7O dataset denominado Air Quality Dataset possui dados com diversos sensores. O conjunto de dados contém 9358 ocorrências de respostas médias horárias de uma matriz de 5 sensores químicos de óxido de metal incorporados em um dispositivo multissensor químico de qualidade do ar. O dispositivo foi localizado no campo em uma área significativamente poluída, ao nível da estrada, dentro de uma cidade italiana. Os dados foram registrados de março de 2004 a fevereiro de 2005 (um ano), representando as mais longas gravações disponíveis gratuitamente de respostas de dispositivos sensores químicos de qualidade do ar implantados em campo. As concentrações médias horárias do Ground Truth para CO, hidrocarbonetos não metânicos, benzeno, óxidos de nitrogênio totais (NOx) e dióxido de nitrogênio (NO2) foram fornecidas por um analisador certificado de referência co-localizado. Sabendo que os dados do CO2 são dados contínuos, assinale a alternativa CORRETA que apresenta o tipo de tarefa de aprendizado que pode realizar a previsão de emissão de gás nos próximos dias: A Agrupamento. B Classificação. C Regressão. D Clusterização. 8A distância euclidiana é uma das medidas de dissimilaridade entre comunidades mais utilizada na prática. Assim, quanto menor o valor da distância euclidiana entre dois objetos, mais próximas elas se apresentam em termos de parâmetros quantitativos. Considere a fórmula da distância euclidiana apresentada em anexo e classifique V para as sentenças verdadeiras e F para as falsas: ( ) Xi representa um determinado objeto (dentro de X) sob qual se calculará a distância. ( ) Yi representa um determinado objeto (dentro de Y) sob qual se calculará a distância. ( ) i=o significa que haverá uma iteração terminando em 0. ( ) n representa o número de objetos que serão iterados. Assinale a alternativa que apresenta a sequência CORRETA: A V - F - V - F. B V - V - F - V. C F - V - F - V. D V - F - F - V. 9No desenvolvimento de algoritmos de machine learning, as métricas de avaliação têm como objetivo verificar a eficácia do modelo, comparando com os dados originais.Tais métricas auxiliam a saber se o algoritmo está aprendendo bem ou não. Sobre a métrica de avaliação da tarefa de regressão, assinale a alternativa CORRETA: A F-Medida. B Erro Quadrático Médio. C Precisão. D Acurácia. 10A regressão é uma técnica de modelagem preditiva onde a variável-alvo a ser avaliada é contínua. Constitui-se de uma metodologia estatística que utiliza o relacionamento entre duas ou mais variáveis quantitativas de modo que a variável meta possa ser predita a partir de outras sob a forma de uma representação. Sobre a regressão, associe os itens, utilizando o código a seguir: I- Validação cruzada. II- Overfitting. III- Underfitting. ( ) Um cenário no qual o modelo já é ruim no próprio treinamento. O modelo não consegue encontrar relações entre as variáveis e o teste nem precisa acontecer. ( ) Um cenário que ocorre quando, nos dados de treino, o modelo tem um desempenho excelente, porém quando utilizamos os dados de teste o resultado é ruim. ( ) Tem como objetivo avaliar o modelo da melhor maneira, do que simplesmente a divisão dos dados em treino e teste. Assinale a alternativa que apresenta a sequência CORRETA: A I - II - III. B II - III - I. C I - III - II. D III - II - I.
Compartilhar