Buscar

Conceitos Básicos de Ciência de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1. 
Diversos materiais na Internet definem a ciência de dados como responsável apenas 
pelo processamento de dados. Entretanto, ela é responsável por outras etapas 
extremamente importantes para o uso de dados. Qual alternativa mostra a sequência 
correta de todas as etapas do ciclo da ciência de dados? 
C. 
Entender o problema, coletar os dados, armazenar os dados, processar os dados, explorar as 
informações dos resultados, comunicar os resultados e fornecer feedback. 
 
2. 
O uso da ciência de dados vem se tornando comum nos últimos anos. Apesar disso, 
ainda existem pessoas que expressam de forma errada a correlação entre estatística 
e ciência de dados. 
Qual é a explicação correta sobre a correlação entre estatística e ciência de dados? 
E. 
A estatística é uma ferramenta da ciência de dados e é utilizada nas etapas de processar os dados 
e explorar as informações dos resultados. 
 
3. 
Um questionário geral visando a analisar um grupo de pessoas com 
acompanhamento nutricional foi desenvolvido, composto pelas variáveis sexo, peso, 
altura, número de filhos, telefone e mês de início do acompanhamento. Classifique a 
classe de cada variável e assinale a alternativa que representa a sequência correta. 
A. 
Qualitativa nominal, quantitativa contínua, quantitativa contínua, quantitativa discreta, qualitativa 
nominal e qualitativa ordinal. 
 
Em uma escola no interior de São Paulo, é comum que o professor de Educação Física 
faça a medição de altura dos alunos no início do ano letivo e faça uma comparação 
entre as alturas medidas. Para isso, o professor mediu a altura de 100 alunos e montou 
uma tabela com a distribuição de frequência de altura. 
O que é possível concluir a partir da tabela? 
B. 
A maioria dos alunos tem entre 1,70 e 1,75m de altura. A minoria dos alunos tem entre 1,75 e 1,80m. 
Do total de alunos, 59% têm entre 1,50 e 1,70m. 
 
 
5. 
A estatística descritiva é responsável pela etapa inicial de análise de dados. Por meio 
de suas métricas, é possível analisar a posição das variáveis e analisar a dispersão. 
Escolha a alternativa que melhor explica as medidas em estatística descritiva. 
 
E. 
Média, mediana, moda e quartis (1.º e 3.º) são medidas para análise de posição. A média é a soma 
de todas as observações dividida pelo número total de observações. A moda é o valor que a variável 
assume com maior frequência. A mediana, também conhecida como 2.º quartil, indica um valor que 
é maior que 50% das amostras ordenadas. O 1.º quartil (25%) indica um valor em que 25% das 
amostras ordenadas são menores, e o 3.º quartil (75%) indica um valor em que 75% das amostras 
ordenadas são menores. A amplitude e o coeficiente de variação são medidas de dispersão. A 
amplitude é dada pela diferença entre o valor máximo e o valor mínimo da variável. O coeficiente de 
variação é uma medida de dispersão relativa, que elimina o efeito da magnitude dos dados.

Outros materiais