Logo Passei Direto
Buscar
A ciência de dados é um campo multidisciplinar que usa diferentes ferramentas, métodos e tecnologias que mudam com o passar do tempo. O que diferencia a ciência de dados da estatística tradicional? O aprendizado supervisionado é uma subcategoria de algoritmos de machine learning. É definido pelo uso de datasets rotulados para treinar algoritmos que classificam dados ou preveem resultados com precisão. Quais são os dois principais tipos de aprendizado supervisionado?

A estatística é uma habilidade dispensável no campo da ciência de dados.
A estatística utiliza a tecnologia de big data para armazenar dados estruturados e não estruturados.
Nada as diferenciam, na realidade, trata-se do mesmo conceito com nomes diferentes.
A estatística se preocupa na análise de variáveis com valores finitos como sexo, estado civil e idade, enquanto a ciência de dados trata das variáveis com valores infinitos como peso, altura, tempo online etc.
A ciência de dados possui uma abordagem mais holística. Ela também está envolvida na coleta, armazenamento (big data), tratamento e limpeza dos dados, bem como em transmitir as percepções extraídas da análise desses dados (visualização dos dados).
User badge image
Praticando Para Aprender

há 2 anos

Respostas

User badge image

Ed Verified user icon

há 2 anos

A principal diferença entre a ciência de dados e a estatística tradicional é que a ciência de dados é mais abrangente e multidisciplinar, envolvendo não apenas a análise estatística, mas também a coleta, armazenamento, tratamento e visualização de dados. A estatística tradicional, por outro lado, é mais focada na análise de variáveis com valores finitos. Os dois principais tipos de aprendizado supervisionado são: classificação e regressão. Na classificação, o algoritmo é treinado para classificar dados em categorias pré-definidas. Na regressão, o algoritmo é treinado para prever valores numéricos contínuos.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Além dos dados estruturados e não estruturados, existe uma terceira categoria, que basicamente é uma mistura entre os dois. O tipo de dado definido como semi-estruturado tem algumas características definidas e consistentes, mas não obedece a uma estrutura tão rígida quanto se espera de um banco de dados relacional.

Categórico.
Estruturado.
Quantitativo.
Não estruturado.
Semi-estruturado.

Ao contrário do aprendizado supervisionado, o aprendizado não supervisionado usa dados não rotulados. A partir desses dados, ele descobre padrões que ajudam a resolver problemas de agrupamento ou associação. Isso é particularmente útil quando não temos certeza das propriedades comuns dentro de um dataset. Das opções abaixo, qual você abordaria usando um algoritmo de aprendizado não supervisionado?

Sabedoria.
Variável.
Conhecimento.
Entidade.
Informação.

Retenção de cliente prevendo aqueles que estão propensos a procurar a concorrência. Dado um conjunto de dados de pacientes diagnosticados como tendo diabetes ou não, classificar novos pacientes como tendo ou não diabetes. Em carros autônomos, onde há vários aspectos a serem considerados, como limites de velocidade, zonas dirigíveis e evitar colisões. Classificar se um e-mail é um spam ou não. Dado um conjunto de artigos de notícias encontrados na web, agrupe-os em conjuntos de artigos sobre as mesmas histórias.

Nominal.
Categórico.
Discreto.
Estruturado.
Contínuo.

Mais conteúdos dessa disciplina