Buscar

Análise de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

5/3/23, 6:32 PM Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 1/4
Análise de dados
Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
A análise de dados fornece suporte para extrair informações e realizar inferências que
tragam escopo e suporte para a tomada de decisão de um negócio. À medida que o
mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise
de dados tem um papel cada vez mais importante nos negócios. Acerca desse tema, analise
as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas (F):
( ) Existem somente técnicas de visualização de dados.
( ) Um parâmetro faz uma descrição sobre as características da população.
( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa.
( ) Gráficos facilitam a comunicação dos resultados.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
Código da questão: 58497
Medidas de tendência central são formas de descrever o valor central de uma
distribuição de dados. Dentre essas medidas, podemos citar a mediana (Md) de um
conjunto de elementos, a qual é o valor que divide um conjunto de dados (ordenados) em
dois subconjuntos de mesmo número de elementos. Com base nesse conceito, determine a
mediana do conjunto:
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2]
Alternativas:
Código da questão: 58503
A correlação é uma técnica estatística que mostra o quão forte são os pares de variáveis.
Ela denota a associação entre duas variáveis quantitativas.
Sobre correlação, podemos afirmar que:
I. Correlação e causalidade têm a mesma definição.
II. A correlação avalia somente os relacionamentos entre variáveis V.
III. A correlação avalia todos os fatores que levam aos relacionamentos entre variáveis.
IV. O motivo de um determinado evento ocorrer junto com outro significa que os dois são
dependentes.
São verdadeiras:
Alternativas:
V – F – F – F.
F – V – F – V. CORRETO
F – F – F – V.
V – V – F – V.
V – V – V – F.
7.1. CORRETO
8.
5.2.
6.
6.3.
I – IV.
I – II – III – IV.
II – IV.
5/3/23, 6:32 PM Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 2/4
4)
5)
6)
Código da questão: 58513
O tratamento é um dos momentos mais importantes da análise de dados, pois podemos
remover os valores inconsistentes e faltosos. Uma boa limpeza define qualidade do que
precisa ser analisado. Sobre o processo de limpeza, podemos afirmar que:
Alternativas:
Código da questão: 58521
O intervalo de confiança é simplesmente uma maneira de medir quão bem sua amostra
representa a população. A probabilidade de o intervalo de confiança incluir o verdadeiro
valor médio dentro de uma população é denominada nível de confiança do IC. Sobre o
intervalo de confiança, podemos afirmar que:
I. É uma maneira de medir somente a população.
II. Antes de construir um intervalo de confiança, temos que, inicialmente, identificar uma
estatística de amostra.
III. Devemos calcular um IC apenas para 95%.
IV. O intervalo de confiança (IC) inclui o valor verdadeiro da população com um certo grau
de confiança, que é expresso por um valor em percentagem (%), indicando um intervalo
superior e inferior.
V. À medida que o tamanho da amostra aumenta, o intervalo de valores do intervalo
aumenta.
São verdadeiras:
Alternativas:
Código da questão: 58506
Python é uma aplicação web de código aberto que permite criar e compartilhar
documentos. Ele permite resolver vários tipos de problemas, como: exploração de dados,
estatística, limpeza e transformação de dados, visualização, entre outras funcionalidades.
Sobre as funcionalidades do Python para exploração e limpeza de dados, identifique as
opções corretas.
I. Matplotlib: biblioteca fundamental para exploração de dados.
II. Para modificar um valor nulo pela média dos valores: data.fillna(data.mean(0)).
III. O comando data.drop('E', inplace=True, axis=1) é usado com frequência para excluir
linhas e colunas no banco.
IV. O comando data.dropna() remove do banco todos os valores com NaN.
São verdadeiras:
Alternativas:
Apenas a II. CORRETO
II – III.
A manipulação dos dados é a única maneira de tratá-los.
Com Python, podemos excluir linhas e colunas a partir do comando .fillna().
O Python oferece várias formas de tratar os dados, como exclusão da coluna ou linha
que não é mais útil e manipulando valores nulos. CORRETO
Com Python, podemos manipular os valores nulos a partir do comando drop().
Remover linhas e colunas é a maneira mais simples de tratar os dados.
I – II – III.
I – II – IV.
II – V.
II – III – V.
III – V. INCORRETO
Apenas a I.
I – IV.
I – II – III.
5/3/23, 6:32 PM Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 3/4
7)
8)
9)
10)
Código da questão: 58520
Uma variável é qualquer característica, número ou quantidade que possa ser medida ou
contada.
Baseando-se no contexto de variável, rotule o tipo de grandeza das variáveis: peso, altura,
temperatura.
Alternativas:
Código da questão: 58496
Medidas de tendência central descrevem a posição de um elemento dentro do conjunto
de dados, ou seja, são medidas que fornecem uma ideia de todo os elementos, como as de
tendência central: média, mediana e moda. A média (x ̅) de um conjunto de dados é
encontrada por meio da soma de todos os números no conjunto de dados e depois
dividindo pelo número de valores no conjunto. Com base nesse conceito, determine a
média da distribuição a seguir:
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2]
Alternativas:
Código da questão: 58502
Vamos avaliar a situação: suponha que você precise avaliar um conjunto de dados sobre
o grau de escolaridade dos habitantes de município X. Cite o tipo de mensuração correta
para a variável escolaridade.
Alternativas:
Código da questão: 58501
Um conjunto de dados com valores inconsistentes pode não fornecer insumos
suficientes para gerar uma boa análise. Informações consistentes, sem duplicação,
atualizadas e formatadas são fundamentais para uma boa análise. A precisão é essencial
para uma análise com alta qualidade. Dados com problemas precisam ser identificados e
tratados. Em relação à qualidade dos dados, marque V para a opção verdadeira e F para a
falsa.
( ) O pré-processamento de dados é uma técnica de exploração para transformar dados
brutos coletados em informações mais limpas.
( ) No pré-processamento, os dados não são transformados ou codificados, a técnica
II – IV. CORRETO
I – II – III.
Altura = discreta; peso e temperatura = contínua.
Altura = contínua; peso e temperatura = discreta.
Peso e altura = discreta; temperatura = contínua.
Todas discretas.
Todas contínuas. CORRETO
10.39. CORRETO
11.40.
13.
12.
14.5.
Razão.
Qualitativa.
Intervalar.
Nominal.
Ordinal. CORRETO
5/3/23, 6:32 PM Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2806601/5956655 4/4
precisa do auxílio de algoritmos de machine learning para isso.
( ) A normalização reorganiza os dados de maneira que os valores se tornem úteis apenas
para serem processados por algoritmos.
( ) A normalização formata os dados e os converte de forma que permite processamento e
análise adicionais.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
Código da questão: 58518
V – F – V – V.
F – F – V – F.
V – F – F – V. CORRETO
F – F – V – V.
F – F – F – F.
Arquivos e Links

Continue navegando