Teste 17 Programação e Ciência de Dados

0

Kessia Fulgencio Silva

04/03/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Ciência de Dados

3.730 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Exercício por
Temas
avalie sua aprendizagem
Quase todas as grandes plataformas de anúncios on-line têm um algoritmo de aprendizado que a partir de algumas
informações sobre um anúncio e sobre o per�l do usuário, o algoritmo então pode determinar qual anúncio um
usuário está mais propenso a clicar.
Que tipo de algoritmo é usado no texto acima?
A ciência de dados é um campo multidisciplinar que usa diferentes ferramentas, métodos e tecnologias que mudam
com o passar do tempo. O que diferencia a ciência de dados da estatística tradicional?
PROGRAMAÇÃO E CIÊNCIA DE DADOS
KESSIA FULGENCIO SILVA 202209314159
PROGRAMAÇÃO E CIÊN 2023.3 EAD (GT) / EX
Prezado (a) Aluno(a),
Você fará agora seu EXERCÍCIO! Lembre-se que este exercício é opcional, mas não valerá ponto para sua avaliação. O
mesmo será composto de questões de múltipla escolha.
Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se
familiarizar com este modelo de questões que será usado na sua AV e AVS.
7349 - FUNDAMENTOS DA CIÊNCIA DE DADOS
1.
Redes Neurais.
Supervisionado.
Não Supervisionado.
Processamento de Linguagem Natural.
Lógica Fuzzy.
Data Resp.: 07/12/2023 11:23:53
Explicação:
Nesse caso temos como atributos de entrada (X) o anúncio e informações do usuário. Nosso rótulo ou classe de
saída (Y) é a informação se o usuário irá clicar ou não no anúncio. Como é fornecida para o algoritmo a resposta
certa para que ele aprenda a prever a resposta futuramente, então se trata de um algoritmo de aprendizado
supervisionado.
2.
A estatística é uma habilidade dispensável no campo da ciência de dados.
javascript:voltar();
javascript:voltar();
javascript:voltar();
javascript:voltar();
O aprendizado por reforço é um dos tópicos de pesquisa mais quentes no campo da inteligência arti�cial e sua
popularidade cresce a cada dia. Ele permite que um agente aprenda em um ambiente interativo por tentativa e erro
usando feedbacks de suas próprias ações e experiências.Quais são os dois modelos matemáticos frequentemente
usados no desenvolvimento de aplicações de aprendizado por reforço?
A imagem abaixo representa qual elemento de uma rede neural?
(Essa imagem foi criada pelo conteudista)
A ciência de dados possui uma abordagem mais holística. Ela também está envolvida na coleta,
armazenamento (big data), tratamento e limpeza dos dados, bem como em transmitir as percepções extraídas
da análise desses dados (visualização dos dados).
Nada as diferenciam, na realidade, trata-se do mesmo conceito com nomes diferentes.
A estatística se preocupa na análise de varáveis com valores �nitos como sexo, estado civil e idade, enquanto
a ciência de dados trata das variáveis com valores in�nitos como peso, altura, tempo online etc.
A estatística utiliza a tecnologia de big data para armazenar dados estruturados e não estruturados.
Data Resp.: 07/12/2023 11:23:56
Explicação:
A ciência de dados está relacionada à estatística, mas difere da estatística de várias maneiras importantes. No
mesmo sentido em que a medicina está relacionada à química, mas não pode ser reduzida à química, pois a
medicina lida com seus próprios sistemas distintos e com suas próprias propriedades.
3.
Processo de decisão Markov e Método de Monte Carlo.
Redes Neurais Recorrentes e Redes Neurais Convolucionais.
Dimensionality Reduction e Anomaly Detection.
Agrupamento e Random Forest.
K-means e PCA.
Data Resp.: 07/12/2023 11:24:00
Explicação:
O aprendizado por reforço é baseado em dois tópicos. O mais importante é o processo de decisão de Markov
(MDP), uma estrutura que ajuda a descrever o problema. O método de Monte Carlo está no centro de todos os
algoritmos que utilizam MDP.
4.
Bias.
Neurônio arti�cial (também conhecido como nó ou unidade).
Sinapse.
Observe as seguintes descrições sobre um dataset:
I. Possui valores contáveis especí�cos.
II. Alguns exemplos são o número de alunos, o número de �lhos e idade.
III. Valores de dados ordinais e valores inteiros representam esse tipo de dados.
IV. Facilmente contado com algo tão simples quanto uma linha numérica.
As informações acima descrevem que tipo de dados?
A imagem abaixo exibe uma linguagem de marcação chamada de HTML. As linguagens de marcação possuem
esquemas que podem ser descritivos, incompletos ou mutáveis. Outro exemplo de linguagem de marcação são os
documentos XML. As linguagens de marcação são exemplos de qual tipo de estrutura de dados?
Peso.
Função de ativação.
Data Resp.: 07/12/2023 11:24:04
Explicação:
O neurônio arti�cial é um modelo simpli�cado do neurônio biológico.
O neurônio arti�cial recebe um ou mais sinais de entrada e devolve um único sinal de saída, que pode ser
distribuído como sinal de saída da rede, ou como sinal de entrada para um ou vários outros neurônios da camada
posterior (que formam a rede neural arti�cial).
5.
Nominal.
Continuo.
Categórico.
Estruturado.
Discreto.
Data Resp.: 07/12/2023 11:24:08
Explicação:
Uma variável discreta é uma variável que assume valores distintos e contáveis.
Em teoria, você sempre deve ser capaz de contar os valores de uma variável discreta.
Exemplos de variáveis discretas incluem: Anos de escolaridade e número de gols marcados em uma partida de
futebol.
6.
https://www.shutterstock.com/pt/image-photo/html-html5-source-code-title-programming-2023859888
O aprendizado supervisionado é uma subcategoria de algoritmos de machine learning. É de�nido pelo uso de
datasets rotulados para treinar algoritmos que classi�cam dados ou preveem resultados com precisão. Quais são
os dois principais tipos de aprendizado supervisionado?
"São dados que foram processados, estruturados ou contextualizados para que sejam signi�cativos para os seres
humanos".
Categórico.
Semi-estruturado.
Quantitativo.
Estruturado.
Não estruturado.
Data Resp.: 07/12/2023 11:24:11
Explicação:
Além dos dados estruturados e não estruturados, existe uma terceira categoria, que basicamente é uma mistura
entre os dois.
O tipo de dado de�nido como semi-estruturado tem algumas características de�nidas e consistentes, mas não
obedece a uma estrutura tão rígida quanto se espera de um banco de dados relacional.
7.
Clustering e Random Forest.
Regressão logística e Regressão linear.
Árvores de decisão e Naive Bayes.
PCA e Agrupamento K-means.
Regressão e Classi�cação.
Data Resp.: 07/12/2023 11:24:16
Explicação:
Em um problema de regressão, como a previsão de preços de casas, o algoritmo precisa prever in�nitos números
de saída possíveis.
Já nos problemas onde a classi�cação é usada, o algoritmo faz a previsão de uma categoria, ou seja, um pequeno
conjunto de saídas possíveis.
8.
A a�rmação anterior se aplica a qual das seguintes opções abaixo?
Ao contrário do aprendizado supervisionado, o aprendizado não supervisionado usa dados não rotulados. A partir
desses dados, ele descobre padrões que ajudam a resolver problemas de agrupamento ou associação. Isso é
particularmente útil quando não temos certeza das propriedades comuns dentro de um dataset. Das opções
abaixo, qual você abordaria usando um algoritmo de aprendizado não supervisionado?
No aprendizado não supervisionado, o objetivo é obter insights a partir de grandes volumes de dados. O algoritmo
de aprendizado não supervisionado determina o que é diferente ou interessante no dataset. Quais são as três
categorias mais comuns de algoritmos de aprendizado não supervisionado?
Variável.
Entidade.
Informação.
Sabedoria.
Conhecimento.
Data Resp.: 07/12/2023 11:24:19
Explicação:
A informação é um grupo de dados que carregam coletivamente um signi�cado lógico, já o conhecimento é a
informação que foi interpretada e compreendida por um ser humano para que ele possa agir conforme
necessário e �nalmente sabedoria é agir sobre o conhecimento de maneira apropriada.
9.
Classi�car se um e-mail é um spam ou não.
Dado um conjunto de artigos de notícias encontrados na web, agrupe-os em conjuntos de artigos sobre as
mesmashistórias.
Dado um conjunto de dados de pacientes diagnosticados como tendo diabetes ou não, classi�car novos
pacientes como tendo ou não diabetes.
Em carros autônomos, onde há vários aspectos a serem considerados, como limites de velocidade, zonas
dirigíveis e evitar colisões.
Retenção de cliente prevendo aqueles que estão propensos a procurar a concorrência.
Data Resp.: 07/12/2023 11:24:22
Explicação:
Essa é uma típica aplicação de aprendizado não supervisionado chamado clustering. O algoritmo de clustering
utiliza dados sem rótulos e tenta agrupá-los automaticamente em clusters (grupos).
10.
Regressão, Dimensionality Reduction e Anomaly Detection.
Regressão, Classi�cação a Clustering.
Agrupamento de deslocamento médio, PCA e K-means.
K-means, PCA e Random Forest.
Clustering, Dimensionality Reduction e Anomaly Detection.
Data Resp.: 07/12/2023 11:24:25
Explicação:
Os algoritmos que se enquadram na categoria Clustering irão lidar principalmente com a localização de uma
estrutura ou padrão em um dataset não categorizado. Já a classe Dimensionality Reduction refere-se a técnicas
para reduzir o número de variáveis (atributos) de entrada em um dataset. Por �m, a classe Anomaly Detection
aborda a identi�cação de itens em um dataset que diferem da norma.
Não Respondida Não Gravada Gravada
Exercício por Temas inciado em 07/12/2023 11:23:49.