Avaliação da Disciplina Analise Estatistica de Dados (17320)

•

UNIASSELVI

2

0

2

0

FABIO ESTEVES

27/04/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística e Análise de Dados

474 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645435)
Peso da Avaliação 10,00
Prova 63284318
Qtd. de Questões 20
Nota 9,50
À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar essas
informações é essencial. Por esse motivo, a análise de dados tem um papel cada vez mais importante nos
negócios.Com base neste contexto, responda à seguinte questão.
Quais as vantagens que a análise de dados pode fornecer para a empresa? Assinale o item correto:
A A análise de dados não gera resultados confiáveis, por esse motivo é pouco utilizada em empresas.
B A análise de dados faz uso das medidas estatísticas para obter comparações apenas de grupos pequenos de
clientes.
C A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma
empresa, porém ela não é boa para ser usada na tomada de decisões.
D A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma
empresa, através dela um negócio pode ter estratégias inteligentes perante o mercado.
As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado
conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Dentre as
medidas de posição, temos a moda como o elemento que acontece com maior frequência em um conjunto de
dados.
Foram pesadas algumas crianças com idade entre 6 e 12 anos, para medir os seus níveis de nutrição.
Os dados da pesagem foram: 29,34,56,23,29,24,27,28,32,34,33,36,47,28,29,25,26
Avalie os itens abaixo e marque a opção que contém a moda e a mediana do conjunto:
A Mediana = 28 e Moda = 27.
B Mediana = 27 e Moda = 29.
C Mediana = 29 e Moda = 28.
D Mediana = 29 e Moda = 29.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de
Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior
frequência dentre as k amostras mais próximas, através do esquema de votação.
Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:
A Para calcular a probabilidade de vendas.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
VOLTAR
A+ Alterar modo de visualização
1
2
3
D Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos
que precisam ser otimizados, e proporcionam aos setores da organização elaborar um planejamento eficiente,
baseando-se em dados consistentes.

Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os gráficos é preciso
seguir alguns princípios.
Assinale a opção que informa corretamente o que é necessário para construir um gráfico:
A O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O
gráfico pode conter várias informações, como: Título e Nota de rodapé.
B O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender as
informações.
C O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
D O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de colocar
título.
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados sem
referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos vistos no capítulo
sobre algoritmos de aprendizado de máquina não supervisionado, responda à próxima questão.
Quais os métodos a seguir são classificados como não supervisionados. Marque o item correto:
A Clustering, Anomaly detection, Association mining e Latent variable models.
B Clustering, Anomaly detection, Classificação e Previsão.
C Clustering, Anomaly detection, Association mining e Previsão.
D Clustering, Anomaly detection, Association mining e Classificação.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das
informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização e
interpretação. Com base neste contexto, responda ao questionamento.
Sobre o que aprendemos de gráficos, marque o item correto:
A Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
B Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos o
suficiente para esta função.
C Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, porém,
somente se usados junto com medidas estatísticas.
D Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a
outras medidas estatísticas.
4
5
6
Mineração de dados é a análise semiautomática ou automática do processo de identificação de padrões
desconhecidos e interessantes ao estudo no conjunto de dados. Ela engloba métodos de aprendizado de máquina,
estatística e sistemas de banco de dados. O objetivo principal é a extração de padrões em um grande volume de
dados (PROVOST, 2013).
Assinale a opção que contenha a afirmação correta sobre processo de mineração de dados:
A No Deployment transforma a informação numérica expressa em termos. Essas informações podem estar
relacionadas a todos os fenômenos que desejam ser estudados.
B A Data Preparation configura os dados de uma maneira que torne suas análises possíveis.
C No Evaluation é a fase de preparação de dados que geralmente prossegue com a compreensão dos dados, em
que eles serão manipulados e consolidados em formulários que gerem melhores resultados.
D
No Business Understanding é o momento onde as técnicas de mineração de dados são aplicadas aos dados,
sendo aplicados estatísticas e padrões para gerar previsões e fazer inferências sobre as informações
extraídas.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que
pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre regressão, responda à
próxima questão.
Qual opção abaixo podemos definir como um problema de regressão? Marque o item correto:
A Os clientes da empresa X precisam ser agrupados a partir das suas características.
B Os clientes poderão comprar ou não o novo produto lançado?
C Calcular a probabilidade de um cliente comprar o produto.
D Previsão da quantidade de produtos vendidos durante um determinado período.
Os dados coletados de uma pesquisa de mercado podem ser de natureza quantitativa ou qualitativa. Os dados
quantitativos são usados para quantificar o problema por meio da geração de dados numéricos. Porém, os dados
qualitativos são usados para revelar tendências de pensamento e opiniões.

Com base no que vimos no capítulo sobre pesquisas de mercado, analise os itens abaixo e assinale a opção que
contém apenas variáveis qualitativas:
A Cor da pele. Aprovou ou não o produto. Fumantes ou não.
B Quantidade de clientes que frequentam uma loja. Quantidade de clientes que compraram o produto X. Cor
dos olhos.
C Quantidade de clientes que compraram o produto X. Fumantes ou não Q. Quantidade de clientes que
frequentam uma loja.
D Cor da pele. Aprovou ou não o produto Q. Quantidade de clientes.
7
8
9
A análise de cluster classifica objetos de maneira que cada objeto seja semelhante aos outros no agrupamento
com base em um conjunto de características escolhidas (HAIR, (2009). Os grupos formados devem então conter
uma grande homogeneidade dentro de cada grupo, e uma taxa alta de heterogeneidade entre os grupos. Portanto,
os objetos dentro dos agrupamentos estarão próximos quando forem representados graficamente, e cada grupo
estará distante do outro.
Assinale a opção que contém corretamente os conceitos iniciais sobre a análise de cluster.A A análise de cluster classifica objetos de maneira que cada objeto seja semelhante aos outros no
agrupamento.
B Podemos usar somente para dados discretos.
C Na análise de cluster faz-se previsões sobre os elementos que pertencem a grupos diferentes.
D A análise de cluster pode-se usar apenas para dados bivariados e univariados.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de
Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior
frequência dentre as k amostras mais próximas, através do esquema de votação.
Quais as medidas de distâncias usadas pelo algoritmo KNN? Assinale o item correto:
A Somente Distância Euclidiana.
B Distância Manhattan e Centroide.
C Distância Euclidiana e a Distância Manhattan.
D Somente Distância Manhattan.
K-médias é um algoritmo não supervisionado, isto é, seus dados não possuem rótulos. O principal propósito é
identificar as similaridades entre os dados e agrupá-los conforme o número de cluster. O algoritmo de k-médias é
interativo e poderoso para dividir um conjunto de dados em grupos separados.
Sobre as etapas dos processos de K-Means, marque V para verdadeiro e F para falso:
( ) Inicialização: nesta etapa acontece a atribuição ao cluster e a movimentação de centroides é repetida até o
cluster se tornar estático.
( ) Atribuição ao Cluster: Nesta etapa calcula-se a distância entre os pontos dos dados e cada um dos centroides.
( ) Movimentação de Centroides: nesta etapa é modificada a localização do centroide.
( ) Otimização: nesta etapa calcula-se a média dos valores dos pontos de dados de cada cluster, e o valor médio
será o novo centroide.
Marque a opção que contém a sequência correta:
A F - F - F - F.
B F - V - V - F.
C F - V - V - V.
D F - V - F - F.
10
11
12
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se
dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou previsões de maneira
correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à próxima questão.
Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:
A Classificação e Previsão.
B Somente classificação.
C Somente previsão.
D Agrupamento espontâneo.
Um modelo representa de maneira simples a realidade criada no intuito de servir de instrumento de análise para
algum objetivo de interesse. Ele é feito com base em suposições sobre o que deve ou não ser levado em
consideração, ou, às vezes, com base em restrições sobre informações (PROVOST, 2013).
Sobre o modelo preditivo é correto afirmar. Assinale a opção correta:
A A predição tem o propósito de estimar um valor desconhecido, o qual pode ser algo no futuro, porém
também poderia ser algo no presente ou no passado.
B A predição tem o propósito de estimar um valor conhecido, o qual pode ser algo no futuro, porém também
poderia ser algo no presente ou no passado.
C A predição tem o propósito de estimar um valor desconhecido, o qual pode ser somente no presente.
D A predição tem o propósito de classificar um valor desconhecido, o qual pode ser algo no futuro, porém
também poderia ser algo no presente ou no passado.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das
informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização e
interpretação. Com base neste contexto, responda ao questionamento.
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:
A Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
B Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma
amostra.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas como lista e tabela.
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos
que precisam ser otimizados, e proporcionam aos setores da organização elaborar um planejamento eficiente,
baseando-se em dados consistentes.
Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:
A Utiliza-se para comparar um único valor entre vários grupos.
13
14
15
16
B Utiliza-se para verificar a relação entre duas variáveis.
C Ele representa os dados contínuos como tempo e pressão.
D Representa dados da medição de uma variável contínua.
A análise de regressão é frequentemente usada por economistas e pesquisadores de negócios, para auxiliar
gerentes e donos de empresas a prever condições futuras, e fornece suporte quantitativo para a tomada de decisão
dos gerentes. Também auxilia na detecção de falhas das estratégias gerenciais e fornece novos feedbacks que
podem mudar as prospecções do negócio (PROVOST, 2013).
Dentre as alternativas abaixo, qual caracteriza a regressão? Assinale a opção correta:
A A análise de regressão pode ser usada para inferir as relações entre variáveis independentes e dependentes,
porém somente para valores positivos.
B A análise de regressão pode ser usada para inferir a classificação entre uma variável independente e uma
dependente.
C A análise de regressão pode ser usada para inferir as relações somente entre uma variável independente e
uma dependente.
D A análise de regressão também é usada para entender quais dentre as variáveis independentes estão
relacionadas à variável dependente e explorar as formas dessas relações.
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e gradativamente os
grupos são formados até que um único conjunto contendo todos os dados seja gerado (SILVA, 2005). Ao iniciar o
processo, os grupos são pequenos e os elementos de cada grupo possuem um alto grau de similaridade.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção
correta:

A Através da média do agrupamento.
B Através do coeficiente aglomerativo.
C Através do desvio-padrão do agrupamento.
D Através do coeficiente de correlação.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se
dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou previsões de maneira
correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à próxima questão.
Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.
A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os
elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa
forma é possível calcular as features.
17
18
19
C O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
D O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar
padrões.
As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado
conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Podemos
definir a mediana como uma medida de posição que ocupa a posição central de um conjunto de dados. Ela é o
valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos.
Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados.
29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26,
35, 26, 28, 34, 29, 23, 28
Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:
A 26.
B 27.
C 29.
D 28.
20
Imprimir