Buscar

Análise Estatística de Dados (17320)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Análise Estatística de Dados (17320) 
Nota: 10 
Prova: 37479248
As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão
uma ideia condensada de todo o conjunto de dados. Dentre as medidas de posição temos a média aritmética, a qual representa o valor central do conjunto de
dados.
Um professor fez uma avaliação na turma e o conjunto de notas foi: 
 
6; 5.6; 7; 8; 9; 10; 5; 7; 8.9; 4.3; 8.1; 4.1; 7.8; 3.2 ;9
 
Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto: 
A)    6,15.
B)    6,59.
C)    6,87. 
D)    7,23.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 
Assinale a opção que contém a principal característica da técnica de regressão.
 
A) O propósito da regressão é minerar os dados de maneira descritiva.
B) O propósito da regressão é agrupar indivíduos com as mesmas características.

C) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis independentes
(denotadas por X).
D) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente (denotada por X).
Os métodos hierárquicos criam uma hierarquia de relacionamentos entre os elementos, na qual os dados são particionados várias vezes, para produzir uma
representação hierárquica dos agrupamentos (EVERITT, 2001), com o propósito de melhorar a visualização sobre a formação dos agrupamentos em cada
estágio onde ela ocorreu e com o grau de semelhança entre os agrupamentos.
 
Métodos hierárquicos precisam de uma matriz que contém as métricas de distância entre os agrupamentos em cada estágio do algoritmo. Essa matriz é
conhecida como matriz de similaridades entre agrupamentos. Conforme a matriz a seguir, quais são as variáveis que têm agrupamento similar?
 
  Y1 Y2 Y3
Y 1 0 0,3 0,2
Y2 0,6 0 0,8
Y3 0,2 0,7 0
 
Assinale o item que contém o resultado correto:
 
 
A)  Y1 E Y2 
B)  Y2 E Y3
C)  Nehuma das variáveis mostra agrupamento similar. 
Alterar modo de visualização
1
2
3
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
) g p
D)  Y1 E Y3 
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de dengue aumenta com a chegada da quadra
invernosa.
 
Quem são nossas variáveis dependente e independente? Assinale a opção correta:
 
A) Y: Casos de dengue X: Quadra invernosa.
B) Y:Habitantes da cidade de São Paulo X: Quadra invernosa.
C) Y: Quadra invernosa X: Casos de dengue.
D) Y: Casos de dengue X: Habitantes da cidade de São Paulo.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis podem ter relação
ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das variáveis, e seja
determinada a correlação entre elas (DAGNELIE, 1985).
 
Assinale a opção na qual podemos aplicar a técnica de multivariada para fazer a análise dos dados.
 
 
A) Em uma empresa que deseja veri�car a probabilidade de um cliente comprar um produto.
B) Em um estudo em que precisamos analisar a relação entre as variáveis preço, produto, local e consumidor. 
C) Em uma empresa que deseja analisar se um cliente irá frequentar uma loja dado que o horário de funcionamento foi alterado.
D) Em uma pesquisa em que é preciso analisar a relação entre cliente e produto. 
À medida que o mercado se torna tecnológico, o �uxo de informações �ca mais rápido, e avaliar essas informações é essencial. Por esse motivo, a análise de
dados tem um papel cada vez mais importante nos negócios. Com base neste contexto, responda à seguinte questão.
 
 Assinale a alternativa que contém de forma correta os impactos que a análise de dados pode trazer para uma empresa.
A) Baixa compreensão do mercado.
B) Com a aplicação da análise de dados, os custos de uma empresa podem aumentar, por conta do alto valor que precisa ser investido para gerar
informações consolidadas.
C) Melhorar a e�ciência da tomada de decisão da empresa.
D) Devido à complexidade do �uxo de informações, a análise de dados pode se tornar pouco e�ciente.
O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:
 
A)   Para estimar o total de vendas em um período.
B)   Para analisar o per�l do cliente.
C)   Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
D)   Para calcular a probabilidade de vendas.
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados sem referência a resultados conhecidos ou rotulados
(MONARD, 2003). Com base nos conceitos vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à próxima questão.
 
4
5
6
7
8
Quais os métodos a seguir são classi�cados como não supervisionados. Marque o item correto:
 
A) Clustering, Anomaly detection, Association mining e Previsão.
B) Clustering, Anomaly detection, Association mining e Latent variable models.
C) Clustering, Anomaly detection, Association mining e Classi�cação. 
D) Clustering, Anomaly detection, Classi�cação e Previsão.
As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão
uma ideia condensada de todo o conjunto de dados. Dentre as medidas de posição, temos a moda como o elemento que acontece com maior frequência em
um conjunto de dados.
 
Foram pesadas algumas crianças com idade entre 6 e 12 anos, para medir os seus níveis de nutrição.
 
Os dados da pesagem foram: 29,34,56,23,29,24,27,28,32,34,33,36,47,28,29,25,26
 
Avalie os itens abaixo e marque a opção que contém a moda e a mediana do conjunto:
 
A) Mediana = 29 e Moda = 28.
B) Mediana = 29 e Moda = 29.
C) Mediana = 28 e Moda = 27.
D) Mediana = 27 e Moda = 29.
  O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
  Sobre o KNN, marque V para verdadeiro e F para falso:
 
  ( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K .
 
  ( ) Na fase de classi�cação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não
conseguir decidir qual a classe a que esse elemento K pertença.
 
  ( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classi�cador KNN busca os K elementos do conjunto de
treinamento que tenham a menor distância do elemento desconhecido.
 
   Marque a opção que contém a sequência correta:
A)  V-F-F.
B)  F-F-F.
C)  V-V-V.
D)  V-V-F.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis podem ter relação
ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitamque se faça uma exploração da performance conjunta das variáveis, e seja
determinada a correlação entre elas (DAGNELIE, 1985).
Quais conceitos é preciso seguir para uma distribuição ser considerada multivariada?
 
Assinale a opção correta:
 
 
A) Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis podem ser signi�cativamente interpretados se analisadas separadamente.
B) Algumas variáveis devem ser aleatórias mas não todas Todas a variáveis devem ser inter relacionadas Os efeitos das variáveis não podem ser
9
10
11
B) Algumas variáveis devem ser aleatórias, mas não todas. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser
signi�cativamente interpretados se analisadas separadamente.

C) Todas as variáveis devem ser aleatórias. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser signi�cativamente
interpretados se analisadas separadamente.
D) Todas as variáveis devem ser aleatórias. Todas a variáveis não podem ser inter-relacionadas.
Um modelo representa de maneira simples a realidade criada no intuito de servir de instrumento de análise para algum objetivo de interesse. Ele é feito com
base em suposições sobre o que deve ou não ser levado em consideração, ou, às vezes, com base em restrições sobre informações (PROVOST, 2013).
 
Sobre o modelo preditivo é correto a�rmar. Assinale a opção correta:
 

A) A predição tem o propósito de estimar um valor desconhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no
passado. 
B) A predição tem o propósito de classi�car um valor desconhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no
passado.
C) A predição tem o propósito de estimar um valor conhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no passado.
D) A predição tem o propósito de estimar um valor desconhecido, o qual pode ser somente no presente.
Os dados coletados de uma pesquisa de mercado podem ser de natureza quantitativa ou qualitativa. Os dados quantitativos são usados para quanti�car o
problema por meio da geração de dados numéricos. Porém, os dados qualitativos são usados para revelar tendências de pensamento e opiniões.
 
Com base no que vimos no capítulo sobre pesquisas de mercado, analise os itens abaixo e assinale a opção que contém apenas variáveis qualitativas:
A) Quantidade de clientes que frequentam uma loja. Quantidade de clientes que compraram o produto X. Cor dos olhos. 
B)  Cor da pele. Aprovou ou não o produto. Fumantes ou não. 
C) Quantidade de clientes que compraram o produto X. Fumantes ou não Q. Quantidade de clientes que frequentam uma loja.
D) Cor da pele. Aprovou ou não o produto Q. Quantidade de clientes. 
À medida que o mercado se torna tecnológico, o �uxo de informações �ca mais rápido, e avaliar essas informações é essencial. Por esse motivo, a análise de
dados tem um papel cada vez mais importante nos negócios.Com base neste contexto, responda à seguinte questão.
 
Quais as vantagens que a análise de dados pode fornecer para a empresa?
 
Assinale o item correto:  
A) A análise de dados não gera resultados con�áveis, por esse motivo é pouco utilizada em empresas.

B) A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma empresa, através dela um negócio pode ter
estratégias inteligentes perante o mercado. 
C) A análise de dados faz uso das medidas estatísticas para obter comparações apenas de grupos pequenos de clientes.
D) A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma empresa, porém ela não é boa para ser usada na
tomada de decisões.
Os grá�cos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos que precisam ser otimizados, e
proporcionam aos setores da organização elaborar um planejamento e�ciente, baseando-se em dados consistentes.
 
Com base no que foi visto sobre grá�cos, responda ao próximo questionamento. Para gerar os grá�cos é preciso seguir alguns princípios.
 
Assinale a opção que informa corretamente o que é necessário para construir um grá�co:
 

A) O grá�co precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O grá�co pode conter várias informações,
como: Título e Nota de rodapé. 
B) O grá�co precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de colocar título.
C) O grá�co não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações.
D) O grá�co precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
12
13
14
15
  O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
  Quais as medidas de distâncias usadas pelo algoritmo KNN? Assinale o item correto:
A)   Somente Distância Euclidiana.
B)   Somente Distância Manhattan.
C)   Distância Manhattan e Centroide.
D)   Distância Euclidiana e a Distância Manhattan.
A análise de cluster classi�ca objetos de maneira que cada objeto seja semelhante aos outros no agrupamento com base em um conjunto de características
escolhidas (HAIR, (2009). Os grupos formados devem então conter uma grande homogeneidade dentro de cada grupo, e uma taxa alta de heterogeneidade
entre os grupos. Portanto, os objetos dentro dos agrupamentos estarão próximos quando forem representados gra�camente, e cada grupo estará distante do
outro.
 
Assinale a opção que contém corretamente os conceitos iniciais sobre a análise de cluster.
 
 
A) Podemos usar somente para dados discretos.
B) A análise de cluster classi�ca objetos de maneira que cada objeto seja semelhante aos outros no agrupamento.
C) A análise de cluster pode-se usar apenas para dados bivariados e univariados.
D) Na análise de cluster faz-se previsões sobre os elementos que pertencem a grupos diferentes. 
  As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão
uma ideia condensada de todo o conjunto de dados. Podemos de�nir a mediana como uma medida de posição que ocupa a posição central de um conjunto de
dados. Ela é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos.
 
  Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados.
  29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28
 
  Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:  
A)   26.
B)   27.
C)   29.
D)   28.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados
em formas de tabelas ou grá�cos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:
 
A) Ela pode ser em formato de lista, tabela ou grá�co, mostrando a frequência de vários resultados de uma amostra.
B) Ela é pouco usada devido à sua complexidade.
C) Ela pode ser formatada apenas como lista e tabela.
D) Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados
em formas de tabelas ou grá�cos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Sobre o que aprendemos de grá�cos, marque o item correto:16
17
18
19
20
Uniasselvi © 2021
 
A) Grá�cos identi�cam padrões, resultados e comparam medidas de forma mais rápida e simples, porém, somente se usados junto com medidas
estatísticas.
B) Grá�cos não podem identi�car padrões devido à sua simplicidade para analisar dados.
C) Os grá�cos não são con�áveis para fazer análises dos dados, pois não existem softwares precisos o su�ciente para esta função.
D) Grá�cos identi�cam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a outras medidas estatísticas.
Voltar

Continue navegando