Buscar

AVA - Análise Estatística de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 1/7
Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Análise Estatística de Dados (17320) 
Prova: 42344187
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se dizer ao algoritmo os resultados esperados
para que ele possa fazer as classi�cações ou previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à
próxima questão.
 
Vimos no capítulo 2 os conceitos da aprendizagem supervisionada e as principais formas de aplicação. Com base no que estudamos, marque a opção que
apresenta uma situação que podemos resolver usando a aprendizagem supervisionada.
 
Marque o item correto:
 

A)
Agrupar os clientes de forma espontânea com base nos seus per�s, onde eles se enquadram em diferentes grupos.
B)
Calcular a probabilidade de os clientes comprarem o novo produto desenvolvido. 

C)
Encontrar grupos de clientes que têm uma maior probabilidade de usar os serviços que uma empresa oferece.
D)
Separar os clientes em grupos em que eles são reconhecidos por meio de características próprias.
  O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
  Sobre o KNN, marque V para verdadeiro e F para falso:
 
  ( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K .
 
  ( ) Na fase de classi�cação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não
conseguir decidir qual a classe a que esse elemento K pertença.
 
  ( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classi�cador KNN busca os K elementos do conjunto de
treinamento que tenham a menor distância do elemento desconhecido.
 
   Marque a opção que contém a sequência correta:
A)
 V-V-F.
B)
 V-F-F.

C)
 V-V-V.
D)
 F-F-F.
Alterar modo de visualização
1
2
3
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 2/7
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 
Assinale a opção que contém a principal característica da técnica de regressão.
 

A)
O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis independentes (denotadas
por X).
B)
O propósito da regressão é minerar os dados de maneira descritiva.
C)
O propósito da regressão é agrupar indivíduos com as mesmas características.

D)
O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente (denotada por X).
A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar, seja o per�l do cliente ou do mercado. Com base no que
foi visto no capítulo sobre coleta e extração de informações, vamos avaliar a seguinte questão.
 
Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo.
 
“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas”. 
A)
Telemarketing.
B)
Questionário.

C)
Entrevista.
D)
Face a face. 
Os métodos hierárquicos criam uma hierarquia de relacionamentos entre os elementos, na qual os dados são particionados várias vezes, para produzir uma
representação hierárquica dos agrupamentos (EVERITT, 2001), com o propósito de melhorar a visualização sobre a formação dos agrupamentos em cada
estágio onde ela ocorreu e com o grau de semelhança entre os agrupamentos.
 
Métodos hierárquicos precisam de uma matriz que contém as métricas de distância entre os agrupamentos em cada estágio do algoritmo. Essa matriz é
conhecida como matriz de similaridades entre agrupamentos. Conforme a matriz a seguir, quais são as variáveis que têm agrupamento similar?
 
  Y1 Y2 Y3
Y 1 0 0,3 0,2
Y2 0,6 0 0,8
Y3 0,2 0,7 0
 
Assinale o item que contém o resultado correto:
 
 

A)
 Nehuma das variáveis mostra agrupamento similar. 
B)
 Y2 E Y3

C)
 Y1 E Y3 
D)
4
5
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 3/7
D)
 Y1 E Y2 
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de dengue aumenta com a chegada da quadra
invernosa.
 
Quem são nossas variáveis dependente e independente? Assinale a opção correta:
 
A)
Y:Habitantes da cidade de São Paulo X: Quadra invernosa.

B)
Y: Casos de dengue X: Quadra invernosa.
C)
Y: Quadra invernosa X: Casos de dengue.
D)
Y: Casos de dengue X: Habitantes da cidade de São Paulo.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados
em formas de tabelas ou grá�cos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:
 
A)
Ela é pouco usada devido à sua complexidade.
B)
Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
C)
Ela pode ser formatada apenas como lista e tabela.

D)
Ela pode ser em formato de lista, tabela ou grá�co, mostrando a frequência de vários resultados de uma amostra.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis podem ter relação
ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das variáveis, e seja
determinada a correlação entre elas (DAGNELIE, 1985).
Quais conceitos é preciso seguir para uma distribuição ser considerada multivariada?
 
Assinale a opção correta:
 
 

A)
Todas as variáveis devem ser aleatórias. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser signi�cativamente
interpretados se analisadas separadamente.
B)
Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis podem ser signi�cativamente interpretados se analisadas separadamente.
C)
Todas as variáveis devem ser aleatórias. Todas a variáveis não podem ser inter-relacionadas.
D)
6
7
8
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 4/7
)
Algumas variáveis devem ser aleatórias, mas não todas. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser
signi�cativamente interpretados se analisadas separadamente.
Um modelo representa de maneira simples a realidade criada no intuito de servir de instrumento de análise para algum objetivo de interesse. Ele é feito com
base em suposições sobre o que deve ou não ser levado em consideração, ou, às vezes, com base em restrições sobre informações (PROVOST, 2013).
 
Sobre o modelo preditivo é correto a�rmar. Assinale a opção correta:
 
A)
A predição tem o propósito de estimar um valor conhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no passado.
B)
A predição tem o propósito de estimar um valor desconhecido, o qual pode sersomente no presente.

C)
A predição tem o propósito de estimar um valor desconhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no passado. 
D)
A predição tem o propósito de classi�car um valor desconhecido, o qual pode ser algo no futuro, porém também poderia ser algo no presente ou no
passado.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis podem ter relação
ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das variáveis, e seja
determinada a correlação entre elas (DAGNELIE, 1985).
 
Assinale a opção na qual podemos aplicar a técnica de multivariada para fazer a análise dos dados.
 
 
A)
Em uma pesquisa em que é preciso analisar a relação entre cliente e produto. 

B)
Em um estudo em que precisamos analisar a relação entre as variáveis preço, produto, local e consumidor. 
C)
Em uma empresa que deseja analisar se um cliente irá frequentar uma loja dado que o horário de funcionamento foi alterado.
D)
Em uma empresa que deseja veri�car a probabilidade de um cliente comprar um produto.
A compreensão das técnicas estatísticas depende do entendimento de alguns conceitos básicos, como saber a diferença entre população e amostra.
População é todos os elementos do conjunto e a amostra é apenas uma parte desse conjunto.
 
Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta:
 
A)
 Estimador: característica não numérica estabelecida na amostra.

B)
Parâmetro: característica que descreve a população.
C)
 População: conjuntos de todos os itens que não têm características em comum.
D)
 Amostra: conjuntos de todos os elementos da população que será analisada.
9
10
11
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 5/7
Os grá�cos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos que precisam ser otimizados, e
proporcionam aos setores da organização elaborar um planejamento e�ciente, baseando-se em dados consistentes.
 
Com base no que foi visto sobre grá�cos, responda ao próximo questionamento. Para gerar os grá�cos é preciso seguir alguns princípios.
 
Assinale a opção que informa corretamente o que é necessário para construir um grá�co:
 
A)
O grá�co não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações.

B)
O grá�co precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O grá�co pode conter várias informações, como:
Título e Nota de rodapé. 
C)
O grá�co precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de colocar título.
D)
O grá�co precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
  O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
  Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:
 
A)
  O algoritmo gera de forma automática. 

B)
  De�nição pelo pesquisador ou Gerar pela própria amostra.
C)
   Não é necessário gerar pontos de semente.
D)
  Somente pela de�nição do pesquisador.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados
em formas de tabelas ou grá�cos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Sobre o que aprendemos de grá�cos, marque o item correto:
 
A)
Grá�cos identi�cam padrões, resultados e comparam medidas de forma mais rápida e simples, porém, somente se usados junto com medidas estatísticas.
B)
Os grá�cos não são con�áveis para fazer análises dos dados, pois não existem softwares precisos o su�ciente para esta função.
C)
Grá�cos não podem identi�car padrões devido à sua simplicidade para analisar dados.

D)
Grá�cos identi�cam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a outras medidas estatísticas.
As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão
uma ideia condensada de todo o conjunto de dados. Dentre as medidas de posição temos a média aritmética, a qual representa o valor central do conjunto de
dados.
12
13
14
15
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 6/7
Um professor fez uma avaliação na turma e o conjunto de notas foi: 
 
6; 5.6; 7; 8; 9; 10; 5; 7; 8.9; 4.3; 8.1; 4.1; 7.8; 3.2 ;9
 
Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto: 
A)
   6,59.
B)
   6,15.

C)
   6,87. 
D)
   7,23.
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e gradativamente os grupos são formados até que um único conjunto
contendo todos os dados seja gerado (SILVA, 2005). Ao iniciar o processo, os grupos são pequenos e os elementos de cada grupo possuem um alto grau de
similaridade.
 
Nos métodos aglomerativos existem alguns passos que precisam ser seguidos. Assinale a opção que contém os passos necessários para usar o método
aglomerativo.
 
A)
 Primeiro deve-se calcular um único padrão para cada agrupamento. Após o passo inicial é gerado um novo agrupamento, o qual é formado pela união dos
agrupamentos com maior grau de similaridade. Os passos 1 e 2 são executados diversas vezes, até que todos os objetos estejam em um único
agrupamento.
B)
Primeiro deve-se calcular a matriz de similaridades. Após o passo inicial é gerado um novo agrupamento, o qual é formado pela união dos agrupamentos
com maior grau de similaridade. Os passos 1 e 2 são executados diversas vezes, até que todos os objetos estejam em um único agrupamento. 

C)
Primeiro deve-se calcular um único padrão para cada agrupamento. O segundo passo é calcular a matriz de similaridades. Após os passos iniciais é gerado
um novo agrupamento, o qual é formado pela união dos agrupamentos com maior grau de similaridade. Os passos 2 e 3 são executados diversas vezes, até
que todos os objetos estejam em um único agrupamento.
D)
 O passo inicial é gerar um novo agrupamento, o qual é formado pela união dos agrupamentos com maior grau de similaridade. O segundo passo é calcular
a matriz de similaridades. Os passos 2 e 3 são executados diversas vezes, até que todos os objetos estejam em um único agrupamento.
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados sem referência a resultados conhecidos ou rotulados
(MONARD, 2003). Com base nos conceitos vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à próxima questão.
 
Assinale a alternativa correta sobre o aprendizado não supervisionado.
 
 

A)
O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a
priori. 
B)
O aprendizado não supervisionado é usado para problemas de classi�cação.
C)
O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a
priori, porém não é usado na análise exploratória de dados.
D)
O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa identi�car padrões.
16
17
13/06/2022 19:31 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 7/7
Uniasselvi © 2022
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se dizer ao algoritmo os resultados esperadospara que ele possa fazer as classi�cações ou previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à
próxima questão.
 
Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:
 

A)
Classi�cação e Previsão.
B)
Somente previsão.
C)
Agrupamento espontâneo.
D)
Somente classi�cação. 
O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 
Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:
 

A)
  Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B)
  Para analisar o per�l do cliente.
C)
  Para calcular a probabilidade de vendas.
D)
  Para estimar o total de vendas em um período.
Os algoritmos de classi�cação tem por objetivo: classi�car um indivíduo em uma classe ou conjunto (WEBB, 2002) no qual elas precisam ser mutuamente
exclusivas (PROVOST, 2013). Com base nos conceitos vistos no capítulo sobre classi�cação, responda à próxima questão.
 
Qual opção abaixo podemos de�nir como um problema de classi�cação? Marque o item correto:
 
A)
Calcular a probabilidade de um cliente comprar o produto.

B)
Os clientes da empresa X precisam ser agrupados a partir das suas características.
C)
Previsão da quantidade de produtos vendidos durante um determinado período.

D)
Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto lançado. 
18
19
20
Voltar

Continue navegando