Análise de dados

Análise de Dados

•

Anhanguera

0

jwkeepwalking1820

17/02/2024

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Análise de Dados

8.786 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1) O pré-processamento transforma os dados brutos coletados de diversas fontes distintas em informações mais limpas e claras. Existem diversas formas para tratar um conjunto de dados, logo, podemos citar a normalização como uma delas. Sobre a normalização, qual afirmativa representa melhor o conceito de normalização?
Alternativas:
O processo de normalização de dados reorganiza-os de forma que se tornem utilizáveis para consultas e análises exploratórias. CORRETO
A normalização de dados é um processo que precisa de outras técnicas de manipulação para fornecer resultados eficazes.
A normalização dos dados visa solucionar apenas problemas de informações que conflitam entre si.
O propósito do processo é a remoção de dados duplicados, porém não é capaz de eliminar as redundâncias nos valores.
Sempre usamos algoritmos de machine learning para normalizar os dados.
Código da questão: 58522
2) A análise de dados fornece suporte para extrair informações e realizar inferências que tragam escopo e suporte para a tomada de decisão de um negócio. À medida que o mercado se torna mais impulsionado pela tecnologia e rapidez nas informações, a análise de dados tem um papel cada vez mais importante nos negócios. Acerca desse tema, analise as afirmativas a seguir e classifique-as em verdadeiras (V) ou falsas (F):
( ) Existem somente técnicas de visualização de dados.
( ) Um parâmetro faz uma descrição sobre as características da população.
( ) A análise de dados pode ser aplicada somente no setor gerencial de uma empresa.
( ) Gráficos facilitam a comunicação dos resultados.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
F – V – F – V. CORRETO
V – V – V – F.
V – F – F – F.
F – F – F – V.
V – V – F – V.
Código da questão: 58497
3) Teste de hipóteses é uma metodologia estatística em que um pesquisador testa uma suposição sobre um parâmetro populacional, no qual precisamos avaliar a natureza dos dados para indica qual teste seguir. Sobre o teste de hipótese t de Student, determine a opção correta.
Alternativas:
Os dados não precisam seguir normalidade para aplicar o teste T de Student.
O teste t tipo não paramétrico, podendo ser usado para testar amostras independentes.
T de Student testa hipóteses sobre a média de uma amostra extraída de uma população. CORRETO
O teste t de Student é uma metodologia usada para testar hipóteses retirada diretamente de uma população.
A amostra em um teste t de Student testa apenas a hipótese alternativa.
Código da questão: 58509
4) A limpeza dos dados é um processo muito importante que antecede sua exploração, com base nesse processo, podemos extrair inconsistências e valores faltosos. A limpeza contém vários métodos para tratar as informações. Com base nesse texto, identifique o comando para remover a coluna B de um conjunto de dados
Alternativas:
data.fillna(data.mean(B)).
data.drop('B', inplace=True, axis=0).
data.drop('data', inplace=True, axis=B).
data.fillna(data.mean(0)).
data.drop('B', inplace=True, axis=1). CORRETO
Código da questão: 58516
5) O teste t para amostras independentes compara as médias de dois grupos distintos para verificar se existe evidência estatística de que as médias da população associada são significativamente diferentes. Sobre o teste t para amostras independentes, determine qual a opção correta.
Alternativas:
O teste é do tipo não paramétrico e não precisa assumir que os dados seguem uma distribuição normal.
Compara as médias de dois grupos relacionados para determinar se existe uma diferença estatisticamente significativa entre essas médias.
Procura a diferenças entre as médias quando os elementos são medidos sob a mesma variável dependente em duas condições diferentes.
O teste é do tipo paramétrico, isto é, assume que os dados seguem uma distribuição normal. CORRETO
Nesse teste, as análises são feitas no mesmo elemento do conjunto mais de uma vez.
Código da questão: 58515
6) Medidas de dispersão são maneiras de resumir um grupo de dados descrevendo a variabilidade dos dados. Ela significa até que ponto é provável que os dados numéricos variem sobre um valor médio. Em outras palavras, a dispersão ajuda a entender a distribuição dos dados. Determine o desvio-padrão e a variância do conjunto de valores:
[6,8,4.5,6.3,7.1,8.9,5.2,9.1,23,34,2.2].
Alternativas:
Desvio-padrão: 9.49 e variância: 90.15. CORRETO
Desvio-padrão: 8.7 e variância: 50.15.
Desvio-padrão: 8.7 e variância: 90.15.
Desvio-padrão: 8.1 e variância: 90.15.
Desvio-padrão: 9.49 e variância: 50.15.
Código da questão: 58505
7) Em um banco de dados, muitas vezes, encontramos dados nulos. Esses valores precisam ser removidos do DataFrame antes da exploração de dados. O Python fornece vários métodos para limpeza e tratamento. Portanto, ao analisar o conjunto de dados a seguir, notamos que existem alguns valores nulos.
Figura 1 – Conjunto de dados

A
B
C
0
NaN
23
NaN
1
67.0
51
78.0
2
90.0
45
13.0
Fonte: elaborada pela autora.
Vamos supor que seja necessário substituir os valores nulos pelas médias dos valores. Qual opção a seguir indica o método para substituir os valores pela média?
Alternativas:
data.fillna(data.mean(A e C)).
data.fillna(data.mean(0)). CORRETO
data.fillna(data.mean(A)).
data.drop('data', inplace=True, axis=mediana).
data.drop('data', inplace=True, axis=media).
Código da questão: 58517
8) A correlação mostra a força de um relacionamento entre duas variáveis e é expressa numericamente pelo coeficiente de correlação, o qual expressa-se numericamente pelo coeficiente de correlação (r). Com base no que estudamos sobre correlação, marque V para as opções verdadeiras e F para as falsas.
( ) Correlação é positiva quando um valor diminui à medida que o outro aumenta.
( ) A correlação é negativa quando os valores aumentam juntos.
( ) Na análise de correlação, estimamos um coeficiente de correlação da amostra que varia entre -1 e +1
( ) Valores altos/baixos de uma das variáveis não são capazes de implicar valores altos/baixos da outra variável.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – F – V.
V – F – V – V.
V – F – F – F.
F – F – V – F. CORRETO
F – V – F – V.
Código da questão: 58511
9) A distribuição de uma variável é definida como a quantidade de vezes que cada resultado possível pode ocorrer dentre várias tentativas.
Com base nesse conceito, vamos supor que você trabalha em uma fábrica que produz geladeiras e precisa estimar o tempo de funcionamento esperado das geladeiras produzidas. Descreva qual distribuição de probabilidade que podemos usar para calcular esse tempo?
Alternativas:
Distribuição normal.
Distribuição binomial.
Distribuição Poisson.
Distribuição uniforme.
Distribuição exponencial. CORRETO
Código da questão: 58498
10) Testes de hipóteses são métodos estatísticos em que um pesquisador testa uma suposição sobre um parâmetro populacional e realiza experimentos. Classifique em verdadeiro (V) ou falso (F) os resultados esperados de um teste de hipótese.
( ) Pesquisadores testam uma hipótese por meio dos dados da própria população em análise.
( ) Teste de hipóteses é usado para avaliar uma hipótese usando dados de amostra.
( ) O teste fornece evidências sobre a hipótese.
( ) O teste fornece não fornece evidências sobre a hipótese e assim precisamos fazer intervalos de confiança.
Assinale a alternativa que contenha a sequência correta
Alternativas:
V – V – V – F.
V – V – F – V.
F – V – F – F.
F – V – V – F. CORRETO
V – F – F – V.
Código da questão: 58504