Buscar

Análise de dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

18/07/2022 23:53 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 1/4
Análise de dados
Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
Medidas de dispersão são maneiras de resumir um grupo de dados descrevendo a
variabilidade dos dados. Ela significa até que ponto é provável que os dados numéricos
variem sobre um valor médio. Em outras palavras, a dispersão ajuda a entender a
distribuição dos dados. Determine o desvio-padrão e a variância do conjunto de valores: 
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2].
Alternativas:
Código da questão: 58505
Em um banco de dados, muitas vezes, encontramos dados nulos. Esses valores precisam
ser removidos do DataFrame antes da exploração de dados. O Python fornece vários
métodos para limpeza e tratamento. Portanto, ao analisar o conjunto de dados a seguir,
notamos que existem alguns valores nulos.
Figura 1 – Conjunto de dados
Fonte: elaborada pela autora.
Vamos supor que seja necessário substituir os valores nulos pelas médias dos valores. Qual
opção a seguir indica o método para substituir os valores pela média?
Alternativas:
Código da questão: 58517
Uma distribuição de probabilidade é uma função que descreve a probabilidade de obter
os possíveis valores que uma variável aleatória pode assumir. Dentre as distribuições de
probabilidade, temos as do tipo discreta, que descreve a probabilidade de valores
contábeis, como uma lista de números inteiros não negativos. Com uma distribuição de
probabilidade discreta, cada valor possível da variável aleatória discreta pode ser associado
a uma probabilidade diferente de zero. Sobre distribuição de probabilidade, podemos
afirmar que: 
I. A mais básica de todas as variáveis aleatórias discretas é a binomial. Diz-se que X tem
uma distribuição de binomial se X = 1 ocorrer com probabilidade π e X = 0. 
II. A distribuição Normal segue X1, X2,…, Xn como variáveis aleatórias Bernoulli
independentes e identicamente distribuídas (iid).
Desvio-padrão: 9.49 e variância: 90.15. CORRETO
Desvio-padrão: 8.7 e variância: 90.15.
Desvio-padrão: 8.7 e variância: 50.15.
Desvio-padrão: 9.49 e variância: 50.15.
Desvio-padrão: 8.1 e variância: 90.15.
data.fillna(data.mean(0)). CORRETO
data.fillna(data.mean(A e C)).
data.drop('data', inplace=True, axis=media).
data.fillna(data.mean(A)).
data.drop('data', inplace=True, axis=mediana).
18/07/2022 23:53 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 2/4
4)
5)
6)
III. Na distribuição Bernoulli E(X) = V (X) = λ. 
IV. A distribuição contínua binomial é conhecida como n eventos de Bernoulli. 
V. A distribuição exponencial é utilizada para análise de sobrevivência. 
São verdadeiras:
Alternativas:
Código da questão: 58499
A distribuição de uma variável é definida como a quantidade de vezes que cada
resultado possível pode ocorrer dentre várias tentativas. 
Com base nesse conceito, vamos supor que você trabalha em uma fábrica que produz
geladeiras e precisa estimar o tempo de funcionamento esperado das geladeiras
produzidas. Descreva qual distribuição de probabilidade que podemos usar para calcular
esse tempo?
Alternativas:
Código da questão: 58498
As análises de correlação e regressão são frequentemente usadas dentro das pesquisas
de todas as áreas de interesse. Embora parecidas, correlação e regressão não são
sinônimos, e cada abordagem estatística é usada para uma finalidade determinada,
baseada em um conjunto de suposições específicas. Sobre a correlação, podermos afirmar
que:
Alternativas:
Código da questão: 58514
Medidas de tendência central descrevem a posição de um elemento dentro do conjunto
de dados, ou seja, são medidas que fornecem uma ideia de todo os elementos, como as de
tendência central: média, mediana e moda. A média (x ̅) de um conjunto de dados é
encontrada por meio da soma de todos os números no conjunto de dados e depois
dividindo pelo número de valores no conjunto. Com base nesse conceito, determine a
média da distribuição a seguir: 
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2]
Alternativas:
Apenas V. CORRETO
I – II – III – V.
II – IV.
II – V.
I – II – IV.
Distribuição Poisson. INCORRETO
Distribuição normal.
Distribuição exponencial.
Distribuição uniforme.
Distribuição binomial.
A análise de correlação (r) fornece um valor que resume o grau de relacionamento
linear somente em uma variável.
Ao testar a correlação entre duas variáveis, usamos o coeficiente de correlação (r)
para quantificar a força e a direção do relacionamento entre duas variáveis
numéricas. CORRETO
Em uma correlação negativa, não existe correlação entre as variáveis.
Na correlação positiva, um valor diminui à medida que o outro aumenta.
Os resultados do coeficiente de correlação (r) varia entre -1 a 0.
12.
18/07/2022 23:53 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 3/4
7)
8)
9)
Código da questão: 58502
Uma variável é uma característica de uma unidade observada que pode assumir mais de
um conjunto de valores, tipos e mensurações. 
Logo, defina o tipo de mensuração que tem as variáveis: sexo, cor dos olhos e cor da pele.
Alternativas:
Código da questão: 58495
Normalização é uma técnica de organização dos elementos no banco de dados é uma
abordagem para eliminar a redundância e pontos indesejáveis, como anomalias de
inserção, atualização e exclusão. Em relação a pré-processamento e normalização,
identifique a opção correta.
Alternativas:
Código da questão: 58519
Uma variável é qualquer característica, número ou quantidade que possa ser medida ou
contada. 
Baseando-se no contexto de variável, rotule o tipo de grandeza das variáveis: peso, altura,
temperatura.
Alternativas:
Código da questão: 58496
14.5.
11.40.
10.39.
13. INCORRETO
Ordinal.
Intervalar.
Nominal. CORRETO
Contínua.
Razão.
A normalização pega os dados e os converte em um formato que permite
processamento e análise adicionais, porém, sempre é necessário apenas para análises
com algoritmos de machine learning.
O propósito do processo é agrupar os valores de maneira lógica. Na normalização, os
valores dos elementos ficam sempre em um determinado intervalo específico. Esse
intervalo é sempre de [1,0].
A normalização não é utilizada com frequência, pois quase sempre os dados são
limpos.
Processo em que os dados de um conjunto de valores são reorganizados de forma
que se torne utilizável para consultas e análises exploratórias. Na normalização, os
valores dos elementos ficam em um determinado intervalo específico, como
[-1,0]. CORRETO
A normalização é feita apenas com o auxílio de algoritmos de machine learning.
Todas contínuas. CORRETO
Altura = contínua; peso e temperatura = discreta.
Altura = discreta; peso e temperatura = contínua.
Todas discretas.
Peso e altura = discreta; temperatura = contínua.
18/07/2022 23:53 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2573782/4116846 4/4
10) Sobre o que foi estudado em relação às distribuições estatísticas, que definem o
número de vezes que cada resultado possível pode ocorrer em várias tentativas, vamos
analisar a seguinte situação: podemos usar essa distribuição quando temos eventos nos
pontos aleatórios de tempo. Classifique a que distribuição pertence esse conceito?
Alternativas:
Código da questão: 58500
Binomial.
Exponencial.
Bernoulli.
Normal.
Poisson. CORRETO
Arquivos e Links

Continue navegando