Buscar

Analise Estatistica de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

18/10/2023, 19:47 Avaliação da Disciplina
about:blank 1/8
Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645435)
Peso da Avaliação 10,00
Prova 73228213
Qtd. de Questões 20
Nota 10,00
A análise de regressão é frequentemente usada por economistas e pesquisadores de negócios, para 
auxiliar gerentes e donos de empresas a prever condições futuras, e fornece suporte quantitativo para 
a tomada de decisão dos gerentes. Também auxilia na detecção de falhas das estratégias gerenciais e 
fornece novos feedbacks que podem mudar as prospecções do negócio (PROVOST, 2013).
 Dentre as alternativas abaixo, qual caracteriza a regressão? Assinale a opção correta: 
A A análise de regressão pode ser usada para inferir as relações entre variáveis independentes e
dependentes, porém somente para valores positivos.
B A análise de regressão também é usada para entender quais dentre as variáveis independentes
estão relacionadas à variável dependente e explorar as formas dessas relações. 
C A análise de regressão pode ser usada para inferir a classificação entre uma variável
independente e uma dependente.
D A análise de regressão pode ser usada para inferir as relações somente entre uma variável
independente e uma dependente. 
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, 
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou 
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, 
responda à próxima questão.
 Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto: 
A Agrupamento espontâneo.
B Classificação e Previsão.
C Somente classificação. 
D Somente previsão.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor 
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos 
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção 
verdadeira:
 
 VOLTAR
A+ Alterar modo de visualização
1
2
3
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 2/8
A Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma
amostra.
B Ela pode ser formatada apenas como lista e tabela.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados
de uma amostra.
O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente 
(Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes, 
elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade 
associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.
 
Em qual opção abaixo podemos aplicar um modelo logístico para resolver a problemática 
apresentada? Assinale a opção correta:
 
A Uma empresa que deseja verificar se um produto vai ser comprado ou não pelo cliente.
B Uma empresa que deseja calcular a quantidade de produtos que serão comparados durante um
determinado período.
C Uma empresa que deseja calcular a probabilidade de um produto ser comprado.
D Uma empresa que deseja avaliar o perfil dos seus clientes.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, 
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou 
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, 
responda à próxima questão.
 
Vimos no capítulo 2 os conceitos da aprendizagem supervisionada e as principais formas de 
aplicação. Com base no que estudamos, marque a opção que apresenta uma situação que podemos 
resolver usando a aprendizagem supervisionada.
 Marque o item correto: 
A Calcular a probabilidade de os clientes comprarem o novo produto desenvolvido. 
B Agrupar os clientes de forma espontânea com base nos seus perfis, onde eles se enquadram em
diferentes grupos.
C Encontrar grupos de clientes que têm uma maior probabilidade de usar os serviços que uma
empresa oferece.
D Separar os clientes em grupos em que eles são reconhecidos por meio de características
próprias.
4
5
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 3/8
 O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Quais as medidas de distâncias usadas pelo algoritmo KNN? Assinale o item correto:
A Distância Euclidiana e a Distância Manhattan.
B Somente Distância Euclidiana.
C Somente Distância Manhattan.
D Distância Manhattan e Centroide.
As medidas de posição determinam a localização que um determinado valor possui dentro de um 
determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto 
de dados. Dentre as medidas de posição, temos a moda como o elemento que acontece com maior 
frequência em um conjunto de dados.
 Foram pesadas algumas crianças com idade entre 6 e 12 anos, para medir os seus níveis de nutrição. 
Os dados da pesagem foram: 29,34,56,23,29,24,27,28,32,34,33,36,47,28,29,25,26 
Avalie os itens abaixo e marque a opção que contém a moda e a mediana do conjunto: 
A Mediana = 28 e Moda = 27.
B Mediana = 29 e Moda = 28.
C Mediana = 27 e Moda = 29.
D Mediana = 29 e Moda = 29.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, 
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou 
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, 
responda à próxima questão.
 Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado. 
A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível
agrupar os elementos de forma espontânea.
B O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa
identificar padrões.
C O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data,
pois dessa forma é possível calcular as features. 
D O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
6
7
8
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 4/8
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados 
sem referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos 
vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à 
próxima questão.
 Quais os métodos a seguir são classificados como não supervisionados. Marque o item correto: 
A Clustering, Anomaly detection, Association mining e Previsão.
B Clustering, Anomaly detection, Association mining e Latent variable models.
C Clustering, Anomaly detection, Association mining e Classificação. 
D Clustering, Anomaly detection, Classificação e Previsão.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta: 
A Para analisar o perfil do cliente.
B Para calcular a probabilidade de vendas.
C Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
D Para estimar o total de vendas em um período.
Depois de coletar os dados é convenienteorganizá-los de forma simples e clara, para melhor 
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos 
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 Sobre o que aprendemos de gráficos, marque o item correto: 
A Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
porém, somente se usados junto com medidas estatísticas.
B Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos
o suficiente para esta função.
C Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
em relação a outras medidas estatísticas.
D Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
9
10
11
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 5/8
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e 
gradativamente os grupos são formados até que um único conjunto contendo todos os dados seja 
gerado (SILVA, 2005). Ao iniciar o processo, os grupos são pequenos e os elementos de cada grupo 
possuem um alto grau de similaridade.
 
Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? 
Assinale a opção correta:
 
A Através do coeficiente aglomerativo.
B Através do desvio-padrão do agrupamento.
C Através do coeficiente de correlação.
D Através da média do agrupamento.
 As medidas de posição determinam a localização que um determinado valor possui dentro de um 
determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto 
de dados. Podemos definir a mediana como uma medida de posição que ocupa a posição central de 
um conjunto de dados. Ela é o valor que divide um conjunto de dados (ordenados) em dois 
subconjuntos de mesmo número de elementos.
 Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados.
 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 
26, 30, 26, 35, 26, 28, 34, 29, 23, 28
 Avalie os itens abaixo e marque a opção que contém a mediana do conjunto: 
A 27.
B 28.
C 26.
D 29.
À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar 
essas informações é essencial. Por esse motivo, a análise de dados tem um papel cada vez mais 
importante nos negócios.Com base neste contexto, responda à seguinte questão.
 Quais as vantagens que a análise de dados pode fornecer para a empresa? Assinale o item correto: 
A A análise de dados faz uso das medidas estatísticas para obter comparações apenas de grupos
pequenos de clientes.
B A análise de dados não gera resultados confiáveis, por esse motivo é pouco utilizada em
empresas.
12
13
14
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 6/8
C A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de
uma empresa, porém ela não é boa para ser usada na tomada de decisões.
D A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de
uma empresa, através dela um negócio pode ter estratégias inteligentes perante o mercado. 
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, 
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização 
elaborar um planejamento eficiente, baseando-se em dados consistentes.
 Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta: 
A Utiliza-se para comparar um único valor entre vários grupos. 
B Utiliza-se para verificar a relação entre duas variáveis.
C Representa dados da medição de uma variável contínua. 
D Ele representa os dados contínuos como tempo e pressão.
Mineração de dados é a análise semiautomática ou automática do processo de identificação de 
padrões desconhecidos e interessantes ao estudo no conjunto de dados. Ela engloba métodos de 
aprendizado de máquina, estatística e sistemas de banco de dados. O objetivo principal é a extração de 
padrões em um grande volume de dados (PROVOST, 2013).
 Assinale a opção que contenha a afirmação correta sobre processo de mineração de dados: 
A No Deployment transforma a informação numérica expressa em termos. Essas informações
podem estar relacionadas a todos os fenômenos que desejam ser estudados.
B A Data Preparation configura os dados de uma maneira que torne suas análises possíveis.
C
No Evaluation é a fase de preparação de dados que geralmente prossegue com a compreensão dos
dados, em que eles serão manipulados e consolidados em formulários que gerem melhores
resultados.
D
No Business Understanding é o momento onde as técnicas de mineração de dados são aplicadas
aos dados, sendo aplicados estatísticas e padrões para gerar previsões e fazer inferências sobre as
informações extraídas. 
Um modelo representa de maneira simples a realidade criada no intuito de servir de instrumento de 
análise para algum objetivo de interesse. Ele é feito com base em suposições sobre o que deve ou não 
ser levado em consideração, ou, às vezes, com base em restrições sobre informações (PROVOST, 
2013).
 Sobre o modelo preditivo é correto afirmar. Assinale a opção correta: 
A A predição tem o propósito de estimar um valor conhecido, o qual pode ser algo no futuro, porém
também poderia ser algo no presente ou no passado.
15
16
17
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 7/8
B A predição tem o propósito de classificar um valor desconhecido, o qual pode ser algo no futuro,
porém também poderia ser algo no presente ou no passado.
C A predição tem o propósito de estimar um valor desconhecido, o qual pode ser algo no futuro,
porém também poderia ser algo no presente ou no passado. 
D A predição tem o propósito de estimar um valor desconhecido, o qual pode ser somente no
presente.
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, 
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização 
elaborar um planejamento eficiente, baseando-se em dados consistentes.
 
Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os 
gráficos é preciso seguir alguns princípios.
 Assinale a opção que informa corretamente o que é necessário para construir um gráfico: 
A O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações
contidas. O gráfico pode conter várias informações, como: Título e Nota de rodapé. 
B O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender
as informações.
C O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de
colocar título.
D O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
Os dados coletados de uma pesquisa de mercado podem ser de natureza quantitativa ou qualitativa. 
Os dados quantitativos são usados para quantificar o problema por meio da geração de dados 
numéricos. Porém, os dados qualitativos são usados para revelar tendências de pensamento e 
opiniões.
 
Com base no que vimos no capítulo sobre pesquisas de mercado, analise os itens abaixo e assinale a 
opção que contém apenas variáveis qualitativas:
A Quantidade de clientes que compraram o produto X. Fumantes ou não Q. Quantidade de clientes
que frequentam uma loja.
B Cor da pele. Aprovou ou não o produto Q. Quantidade de clientes. 
C Cor da pele. Aprovou ou não o produto. Fumantes ou não. 
D Quantidade de clientes que frequentam uma loja. Quantidade de clientes que compraram o
produto X. Cor dos olhos. 
18
19
18/10/2023, 19:47 Avaliação da Disciplina
about:blank 8/8
O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente 
(Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveisindependentes, 
elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade 
associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.
 Sobre o modelo logístico, coloque F para falso e V para verdadeiro, nas alternativas abaixo:
( ) Os parâmetros do modelo devem seguir normalidade.
( ) Ele é usado frequentemente para variáveis quantitativas.( ) Podemos usá-lo no caso univariado.
( ) As variáveis do modelo devem ser dicotômicas. Assinale a opção que contém a sequência correta: 
 
A V-F-F-F.
B F-F-V-V.
C F-F-F-V.
D F-F-F-F.
20
Imprimir

Continue navegando