Logo Passei Direto
Buscar

Introdução a Ciência de Dados - COM350 - Semana 4 - Atividade Avaliativa

User badge image
Ninjaboy

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

Qual é a biblioteca capaz de gerar um relatório em HTML com informações acerca dos atributos de um conjunto de dados, incluindo comparação entre atributos? MatPlotLib. Seaborn. Scikit-Learn. BeautifulSoup. KDD (Knowledge Discovery in Databases) geralmente é dividido em cinco fases, Qual delas consiste em fazer a verificação da qualidade dos dados, exceções e ruídos são removidos, também limpeza, correção, remoção de dados inconsistentes, e identificação de dados ausentes, incompletos ou não integros? Mineração de Dados. Seleção. Transformação. Interpretação. Na Ciência de Dados e na Mineração de Dados podemos ter a existência de valores que não condizem com a realidade de um determinado conjunto de dados. Tais valores são conhecidos rotineiramente por Os outliers são importantes para descrição de dados do tipo: a. dados aleatórios. b. dados multidimensionais. C. dados com ruídos. d. dados redundantes. e. dados inconsistentes. A nomenclatura Mineração de Dados que é derivada do termo inglês Data Mining, é uma metodologia processual para identificar irregularidades, padrões, correlações e regressões em grandes banco de dados para estimar resultados e gerar decisões assertivas, por intermédio de várias tipologias de dados, melhorando por exemplo, receitas e lucros e a relação com clientes. Neste contexto, 0 pré-processamento de dados é usado para modificar dados brutos em informações relevantes e úteis, tendo três passos principais com suas peculiares atividades, que são: a limpeza de dados, transformação de dados e redução de dados. Considerando 0 pré-processamento de dados e seus passos fundamentais, avalie as afirmações a seguir, e relacione-as adequadamente aos passos do pré-processamento. 1 Limpeza de dados. 2 Transformação de dados. 3 Redução de dados. É 0 passo do pré-processamento que envolve as atividades de normalização, seleção de atributos, discretização e geração de hierarquia de conceitos. grau de complexidade do sistema computacional pode ser reduzido consideravelmente por meio da redução de dados, permitindo uma melhor eficiência e diminuição de custos envolvidos no processo. III Os dados brutos do dataset podem possuir pontos irrelevantes ou ausentes, assim sendo, a limpeza de dados se torna um ponto essencial no processo. Assinale a alternativa que correlaciona adequadamente dois grupos de informação. b. 1-II;A aplicabilidade dos métodos e técnicas associadas à Ciência de Dados visa, em muitas situações, a redução do grau de complexidade do processo em si. Assim, um dos processos que compõem a Ciência de Dados é 0 Processo de Descoberta do Conhecimento (KDD) que se caracteriza como um processo dividido em algumas etapas de interação não triviais, ou seja, não tão simples de serem interpretadas e que tendem a identificar padronizações válidas e pertinentes para uso via conjunto de dados. Salienta-se que uma das etapas do KDD é exatamente a Mineração de Dados (Data Mining). Com base nas informações apresentadas, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a seguir. I. Data Mining envolve diretamente a utilização de algoritmos e técnicas para caracterizar padrões nos dados e validar hipóteses. II. As apurações na Data Mining tem cunho descritivas ou preditivas. III. A Data Mining possui intuitos envolvendo regressões, clusters ou conglomerados, associações e divergências entre variáveis que compõem 0 banco de dados. Assinale a alternativa que apresenta a sequência correta. Observe a seguir comando e sua respectiva saída abaixo. Verifique que no Dataset de Prêmios da Netflix há 8 tipos de programas, além de alguns registros que contém valor nulo (nan). [14] array mini series', 'movie', 'video movie', 'tv movie', nan, 'episode', 'tv series', 'video game', 'tv short'], dtype=object) Baseado no comando acima e no dataset apresentado, qual dos comandos abaixo é capaz de substituir, de forma definitiva, todos registros com valor "nan" para valor "indefinido" no atributo kind? d3["kind"]=="nan"="indefinido" d3['kind']='indefinido' d3['kind']="indefinido"Observa-se que a Mineração de Dados do Processo de Descoberta do Conhecimento de Dados (KDD) vincula-se de forma substancial com as técnicas de inteligência de máquina, identificando regras, otimalidade, simulação e análises estatísticas multivariadas a fim de gerar padrões por intermédio do banco de dados em questão. Nota-se que a Mineração de Dados é uma das etapas do KDD, sendo que ela é organizada em seis fases ou etapas, que integram 0 CRISP-DM (Processo Padrão Intersetorial de Mineração de Dados, tradução da nomenclatura em inglês Cross-Industry Standard Process of Data Mining). Dessa maneira, assinale a alternativa que apresenta as etapas que integram 0 CRISP-DM. a. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem, simulação dos resultados, divulgação dos resultados. b. Compreensão dos negócios, entendimento dos dados, caracterização dos dados, modelagem, análise dos resultados, divulgação dos resultados. C. Compreensão dos negócios, entendimento dos dados, preparação dos dados, modelagem, análise dos resultados, divulgação dos resultados. d. Compreensão dos negócios, simulação dos dados, preparação dos dados, modelagem, análise dos resultados, divulgação dos resultados. e. Identificação dos parâmetros, entendimento dos dados, preparação dos dados, modelagem, análise dos resultados, divulgação dos resultados. No contexto do mercado empresarial e/ou organizacional, a Mineração de Dados assume algumas identidades com relação às nomenclaturas, sendo conhecida, por exemplo, como inteligência de negócios, modelagem e análise preditiva, descoberta do conhecimento, dentre outras. Ressalta-se que as técnicas voltadas para a Mineração de Dados são recentes, todavia a Mineração de Dados não é um aparato recente, já que indivíduos já interpretavam dados desde a invenção dos primeiros computadores. Existem tarefas principais vinculadas à Mineração de Dados, assinale a alternativa que apresenta algumas das principais tarefas da Mineração de a. Otimização e simulação, separação de parâmetros, padrões de associação, enquadramento de variáveis. b. Separação de parâmetros, clustering, padrões de associação, avaliação. C. Descrição, enquadramento de variáveis, padrões de independência, predição. d. Otimização e simulação, enquadramento de variáveis, padrões discriminantes, predição. e. Otimização e simulação, clustering, padrões de associação, predição.

Mais conteúdos dessa disciplina