Buscar

CIÊNCIA DE DADOS QUESTIONÁRIO UNIDADE II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

CIÊNCIA DE DADOS QUESTIONÁRIO UNIDADE II 
Pergunta 1 
1. Considerando nosso material didático, indique qual é a etapa do processo de análise de dados que envolve 
a obtenção das informações necessárias para a análise. 
 a. Limpeza de dados. 
 b. Organização dos dados. 
 c. Tabulação. 
 d. Coleta de dados. 
 e. Seleção de atributos. 
Pergunta 2 
1. “Normalizar os dados é importante em muitos algoritmos de aprendizado de máquina, como regressão 
linear, redes neurais e algoritmos baseados em distância (por exemplo, k-Nearest Neighbors), porque ajuda 
a evitar que recursos com escalas diferentes dominem o processo de aprendizado. A normalização, 
geralmente, envolve a transformação dos dados para que eles tenham uma média zero e uma variância 
unitária. Isso pode ser feito subtraindo a média de cada valor e dividindo pelo desvio-padrão dos dados.” 
Fonte: Adaptado de: JAMES, G.; WITTEN, D.; HASTIE, T.; TIBSHIRANI, R. An Introduction to 
statistical learning. New York: Springer, 2013. 
Qual é a técnica de normalização que transforma os dados para terem média zero e desvio-padrão um? 
 a. Normalização por escala logarítmica. 
 b. Normalização Min-Max. 
 c. Normalização Z-score. 
 d. Padronização. 
 e. Codificação de variáveis categóricas. 
0,5 pontos 
Pergunta 3 
1. Após analisar em nosso material didático as informações sobre validação cruzada, assinale a alternativa 
que indica qual é a principal vantagem da validação cruzada em relação ao split tradicional de treinamento 
e teste. 
 a. Permite uma avaliação justa e imparcial do desempenho do modelo. 
 b. Utiliza todos os dados disponíveis tanto para treinamento quanto para teste. 
 c. Reduz a variância da estimativa do desempenho do modelo. 
 d. Preserva a ordem temporal dos dados em problemas de séries temporais. 
 e. Garante que a proporção de classes seja preservada em cada conjunto. 
Pergunta 4 
1. Qual é a importância do benchmarking na ciência de dados? 
 a. Permite comparar o desempenho relativo de diferentes abordagens. 
 b. Identifica as melhores práticas, técnicas e modelos em um determinado domínio. 
 c. Fornece uma referência para medir o desempenho do modelo em dados não vistos. 
 d. Avalia a capacidade de generalização do modelo. 
 e. Todas as alternativas estão corretas. 
Pergunta 5 
1. Qual é o objetivo principal da remoção de stopwords em processamento de linguagem natural? 
 a. Reduzir a dimensionalidade do texto. 
 b. Melhorar a compreensão de palavras complexas. 
 c. Aumentar o número de palavras-chave no texto. 
 d. Aumentar a variabilidade das palavras em um texto. 
 e. Destacar as palavras de ligação em um texto. 
Pergunta 6 
1. Considerando a definição de visão computacional aplicada à ciência de dados, qual das aplicações a seguir 
pode ser associada a ela? 
 a. Previsão do tempo. 
 b. Tradução automática de idiomas. 
 c. Vigilância por vídeo. 
 d. Composição musical automática. 
 e. Diagnóstico médico por imagem. 
Pergunta 7 
1. Quando a regressão logística é mais apropriada em análise estatística? 
 a. Quando a relação entre a variável de resposta e a variável explicativa é linear. 
 b. Quando a variável de resposta é contínua. 
 c. Quando a relação entre as variáveis é não linear. 
 d. Quando se deseja modelar séries temporais. 
 e. Quando a variável de resposta é categórica e binária. 
Pergunta 8 
1. Qual é uma das limitações da métrica de acurácia na avaliação de modelos de aprendizado de máquina? 
 a. A acurácia não leva em consideração os falsos positivos. 
 b. A acurácia não considera a sensibilidade do modelo. 
 c. A acurácia não é adequada para problemas de classificação binária. 
 d. A acurácia não fornece uma medida geral do desempenho do modelo. 
 e. A acurácia não é afetada pela presença de dados desbalanceados. 
0,5 pontos 
Pergunta 9 
1. Leia o texto a seguir e indique a alternativa correta: 
Uso do Processamento de Linguagem Natural (PLN) na área da saúde. 
“A seção de dados não organizados na área da saúde chega a 80%. Sem PNL, é quase impossível obter os 
dados compreensíveis e úteis. Com PNL, fica mais simples lidar com esse pedaço. Não é à toa que todo o 
investimento em PNL na área da saúde foi de US$ 1 bilhão em 2016. Ele continua a aumentar e está 
previsto que se tornará US$ 2,6 bilhões em 2021. 
Um dos resultados imediatos de PNL foi a diminuição do tempo necessário para chegar a uma diretriz 
clínica. Segundo especialistas, caiu 60%. Em uma dessas pesquisas, a IBM Watson conduziu um programa 
piloto em que a IBM executou seu algoritmo em enormes 21 milhões de gravações e, com uma eficiência 
de 85%, reconheceu 8.500 pacientes que correm o risco de insuficiência cardíaca congestiva em uma 
semana...” 
Fonte: SAINI, Parul. O papel da PNL na saúde. Disponível em: https://webmedy.com/blog/pt/the-role-of-
nlp-in-healthcare/. Acesso em: 6 set. 2023. 
O texto anterior traz alguns fatos importantes sobre o uso de PLN na área da saúde, considerando o texto e 
nosso conhecimento sobre o que tema, indique qual das alternativas descreve melhor como o PLN pode 
beneficiar a área de saúde. 
 a. 
Melhorando a precisão no diagnóstico de doenças com base na análise de registros médicos 
eletrônicos. 
 b. Automatizando a cirurgia robótica para procedimentos mais seguros. 
 c. Desenvolvendo medicamentos por meio da análise de textos científicos. 
 d. Gerenciando a logística de hospitais para reduzir custos operacionais. 
 e. 
Aumentando a eficiência da administração de hospitais por meio de chatbots de atendimento ao 
paciente. 
Pergunta 10 
1. Qual é a principal vantagem das APIs de Inteligência Artificial (IA) para os desenvolvedores? 
 a. Permitem que os desenvolvedores criem recursos de IA do zero. 
 b. Economizam tempo e recursos ao aproveitar recursos de IA pré-criados. 
 c. Oferecem suporte técnico apenas para problemas básicos. 
 d. Exigem que os desenvolvedores sejam especialistas em IA para integração. 
 e. São projetadas apenas para chatbots e assistentes virtuais. 
 
 
ATIVIDADE TELEAULA II 
Pergunta 1 
1. Quais dos passos a seguir fazem parte do pré-processamento usando na tabulação cruzada? 
 a. Padronização e indexação. 
 b. Contagem de frequência e cálculo de proporções. 
 c. Mapeamento de dados e limpeza de dados. 
 d. Exercícios de sistemas e avaliação de probabilidades. 
 e. Apresentação de tabelas e normalização de dados. 
Pergunta 2 
1. Qual dos modelos abaixo é o recomendado quando se pretende minimizar a diferença entre os valores 
previstos e os valores reais? 
 a. Regressão linear simples. 
 b. Regressão linear múltipla. 
 c. Regressão logística. 
 d. Regressão descendente. 
 e. Ajuste com mínimos quadrados. 
Pergunta 3 
1. Indique qual das alternativas abaixo melhor completa a lacuna. 
A (O) ____________ é a métrica mais simples e direta. No entanto, em situações de desequilíbrio de 
classes, esta métrica pode ser enganosa, pois o modelo pode ficar viciado para prever a classe majoritária. 
 a. Precisão. 
 b. Aproximação. 
 c. Acurácia. 
 d. F1-score. 
 e. Recall. 
Pergunta 4 
1. Considerando o que foi abordado sobre as tecnologias de aplicações avançadas relacionadas ao 
aprendizado de máquina, qual das alternativas abaixo não indica uma tecnologia citada em nosso material 
de estudos? 
 a. Reconhecimento biométrico. 
 b. Visão computacional. 
 c. Processamento de linguagem natural. 
 d. Reconhecimento de fala. 
 e. APIs de IA.

Continue navegando