Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercício por Temas avalie sua aprendizagem Quase todas as grandes plataformas de anúncios on-line têm um algoritmo de aprendizado que a partir de algumas informações sobre um anúncio e sobre o per�l do usuário, o algoritmo então pode determinar qual anúncio um usuário está mais propenso a clicar. Que tipo de algoritmo é usado no texto acima? A ciência de dados é um campo multidisciplinar que usa diferentes ferramentas, métodos e tecnologias que mudam com o passar do tempo. O que diferencia a ciência de dados da estatística tradicional? PROGRAMAÇÃO E CIÊNCIA DE DADOS KESSIA FULGENCIO SILVA 202209314159 PROGRAMAÇÃO E CIÊN 2023.3 EAD (GT) / EX Prezado (a) Aluno(a), Você fará agora seu EXERCÍCIO! Lembre-se que este exercício é opcional, mas não valerá ponto para sua avaliação. O mesmo será composto de questões de múltipla escolha. Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se familiarizar com este modelo de questões que será usado na sua AV e AVS. 7349 - FUNDAMENTOS DA CIÊNCIA DE DADOS 1. Redes Neurais. Supervisionado. Não Supervisionado. Processamento de Linguagem Natural. Lógica Fuzzy. Data Resp.: 07/12/2023 11:23:53 Explicação: Nesse caso temos como atributos de entrada (X) o anúncio e informações do usuário. Nosso rótulo ou classe de saída (Y) é a informação se o usuário irá clicar ou não no anúncio. Como é fornecida para o algoritmo a resposta certa para que ele aprenda a prever a resposta futuramente, então se trata de um algoritmo de aprendizado supervisionado. 2. A estatística é uma habilidade dispensável no campo da ciência de dados. javascript:voltar(); javascript:voltar(); javascript:voltar(); javascript:voltar(); O aprendizado por reforço é um dos tópicos de pesquisa mais quentes no campo da inteligência arti�cial e sua popularidade cresce a cada dia. Ele permite que um agente aprenda em um ambiente interativo por tentativa e erro usando feedbacks de suas próprias ações e experiências.Quais são os dois modelos matemáticos frequentemente usados no desenvolvimento de aplicações de aprendizado por reforço? A imagem abaixo representa qual elemento de uma rede neural? (Essa imagem foi criada pelo conteudista) A ciência de dados possui uma abordagem mais holística. Ela também está envolvida na coleta, armazenamento (big data), tratamento e limpeza dos dados, bem como em transmitir as percepções extraídas da análise desses dados (visualização dos dados). Nada as diferenciam, na realidade, trata-se do mesmo conceito com nomes diferentes. A estatística se preocupa na análise de varáveis com valores �nitos como sexo, estado civil e idade, enquanto a ciência de dados trata das variáveis com valores in�nitos como peso, altura, tempo online etc. A estatística utiliza a tecnologia de big data para armazenar dados estruturados e não estruturados. Data Resp.: 07/12/2023 11:23:56 Explicação: A ciência de dados está relacionada à estatística, mas difere da estatística de várias maneiras importantes. No mesmo sentido em que a medicina está relacionada à química, mas não pode ser reduzida à química, pois a medicina lida com seus próprios sistemas distintos e com suas próprias propriedades. 3. Processo de decisão Markov e Método de Monte Carlo. Redes Neurais Recorrentes e Redes Neurais Convolucionais. Dimensionality Reduction e Anomaly Detection. Agrupamento e Random Forest. K-means e PCA. Data Resp.: 07/12/2023 11:24:00 Explicação: O aprendizado por reforço é baseado em dois tópicos. O mais importante é o processo de decisão de Markov (MDP), uma estrutura que ajuda a descrever o problema. O método de Monte Carlo está no centro de todos os algoritmos que utilizam MDP. 4. Bias. Neurônio arti�cial (também conhecido como nó ou unidade). Sinapse. Observe as seguintes descrições sobre um dataset: I. Possui valores contáveis especí�cos. II. Alguns exemplos são o número de alunos, o número de �lhos e idade. III. Valores de dados ordinais e valores inteiros representam esse tipo de dados. IV. Facilmente contado com algo tão simples quanto uma linha numérica. As informações acima descrevem que tipo de dados? A imagem abaixo exibe uma linguagem de marcação chamada de HTML. As linguagens de marcação possuem esquemas que podem ser descritivos, incompletos ou mutáveis. Outro exemplo de linguagem de marcação são os documentos XML. As linguagens de marcação são exemplos de qual tipo de estrutura de dados? Peso. Função de ativação. Data Resp.: 07/12/2023 11:24:04 Explicação: O neurônio arti�cial é um modelo simpli�cado do neurônio biológico. O neurônio arti�cial recebe um ou mais sinais de entrada e devolve um único sinal de saída, que pode ser distribuído como sinal de saída da rede, ou como sinal de entrada para um ou vários outros neurônios da camada posterior (que formam a rede neural arti�cial). 5. Nominal. Continuo. Categórico. Estruturado. Discreto. Data Resp.: 07/12/2023 11:24:08 Explicação: Uma variável discreta é uma variável que assume valores distintos e contáveis. Em teoria, você sempre deve ser capaz de contar os valores de uma variável discreta. Exemplos de variáveis discretas incluem: Anos de escolaridade e número de gols marcados em uma partida de futebol. 6. https://www.shutterstock.com/pt/image-photo/html-html5-source-code-title-programming-2023859888 O aprendizado supervisionado é uma subcategoria de algoritmos de machine learning. É de�nido pelo uso de datasets rotulados para treinar algoritmos que classi�cam dados ou preveem resultados com precisão. Quais são os dois principais tipos de aprendizado supervisionado? "São dados que foram processados, estruturados ou contextualizados para que sejam signi�cativos para os seres humanos". Categórico. Semi-estruturado. Quantitativo. Estruturado. Não estruturado. Data Resp.: 07/12/2023 11:24:11 Explicação: Além dos dados estruturados e não estruturados, existe uma terceira categoria, que basicamente é uma mistura entre os dois. O tipo de dado de�nido como semi-estruturado tem algumas características de�nidas e consistentes, mas não obedece a uma estrutura tão rígida quanto se espera de um banco de dados relacional. 7. Clustering e Random Forest. Regressão logística e Regressão linear. Árvores de decisão e Naive Bayes. PCA e Agrupamento K-means. Regressão e Classi�cação. Data Resp.: 07/12/2023 11:24:16 Explicação: Em um problema de regressão, como a previsão de preços de casas, o algoritmo precisa prever in�nitos números de saída possíveis. Já nos problemas onde a classi�cação é usada, o algoritmo faz a previsão de uma categoria, ou seja, um pequeno conjunto de saídas possíveis. 8. A a�rmação anterior se aplica a qual das seguintes opções abaixo? Ao contrário do aprendizado supervisionado, o aprendizado não supervisionado usa dados não rotulados. A partir desses dados, ele descobre padrões que ajudam a resolver problemas de agrupamento ou associação. Isso é particularmente útil quando não temos certeza das propriedades comuns dentro de um dataset. Das opções abaixo, qual você abordaria usando um algoritmo de aprendizado não supervisionado? No aprendizado não supervisionado, o objetivo é obter insights a partir de grandes volumes de dados. O algoritmo de aprendizado não supervisionado determina o que é diferente ou interessante no dataset. Quais são as três categorias mais comuns de algoritmos de aprendizado não supervisionado? Variável. Entidade. Informação. Sabedoria. Conhecimento. Data Resp.: 07/12/2023 11:24:19 Explicação: A informação é um grupo de dados que carregam coletivamente um signi�cado lógico, já o conhecimento é a informação que foi interpretada e compreendida por um ser humano para que ele possa agir conforme necessário e �nalmente sabedoria é agir sobre o conhecimento de maneira apropriada. 9. Classi�car se um e-mail é um spam ou não. Dado um conjunto de artigos de notícias encontrados na web, agrupe-os em conjuntos de artigos sobre as mesmashistórias. Dado um conjunto de dados de pacientes diagnosticados como tendo diabetes ou não, classi�car novos pacientes como tendo ou não diabetes. Em carros autônomos, onde há vários aspectos a serem considerados, como limites de velocidade, zonas dirigíveis e evitar colisões. Retenção de cliente prevendo aqueles que estão propensos a procurar a concorrência. Data Resp.: 07/12/2023 11:24:22 Explicação: Essa é uma típica aplicação de aprendizado não supervisionado chamado clustering. O algoritmo de clustering utiliza dados sem rótulos e tenta agrupá-los automaticamente em clusters (grupos). 10. Regressão, Dimensionality Reduction e Anomaly Detection. Regressão, Classi�cação a Clustering. Agrupamento de deslocamento médio, PCA e K-means. K-means, PCA e Random Forest. Clustering, Dimensionality Reduction e Anomaly Detection. Data Resp.: 07/12/2023 11:24:25 Explicação: Os algoritmos que se enquadram na categoria Clustering irão lidar principalmente com a localização de uma estrutura ou padrão em um dataset não categorizado. Já a classe Dimensionality Reduction refere-se a técnicas para reduzir o número de variáveis (atributos) de entrada em um dataset. Por �m, a classe Anomaly Detection aborda a identi�cação de itens em um dataset que diferem da norma. Não Respondida Não Gravada Gravada Exercício por Temas inciado em 07/12/2023 11:23:49.
Compartilhar