Analise estatistica de dados

•

UNIASSELVI

5

0

5

0

Christine Schmals van Doorne

07/12/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística e Análise de Dados

499 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 1/6
Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina
Disciplina: Análise Estatística de Dados (17320)
Prova: 39958217
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
Qual opção abaixo podemos de�nir como um problema de regressão? Marque o item correto:
A) Os clientes da empresa X precisam ser agrupados a partir das suas características.
B) Calcular a probabilidade de um cliente comprar o produto.
C) Os clientes poderão comprar ou não o novo produto lançado?
D) Previsão da quantidade de produtos vendidos durante um determinado período.
Pesquisas de mercado são frequentemente usadas para coletar os dados dos clientes, e informações do mercado. Com base no conceito visto sobre pesquisa
de mercado, avalie a próxima questão.
Avalie o próximo trecho: “Este é um tipo de pesquisa que está focado nas avaliações subjetivas e tem o propósito de identi�car as percepções humanas sobre
produtos, serviços e empresas, a �m de apontar comportamentos e tendências.” De qual tipo de pesquisa o trecho se refere?
Assinale a alternativa correta:
A) Pesquisas Contínuas.
B) Pesquisas Discretas.
C) Qualitativa.
D) Quantitativa.
Os algoritmos de classi�cação tem por objetivo: classi�car um indivíduo em uma classe ou conjunto (WEBB, 2002) no qual elas precisam ser mutuamente
exclusivas (PROVOST, 2013). Com base nos conceitos vistos no capítulo sobre classi�cação, responda à próxima questão.
Qual opção abaixo podemos de�nir como um problema de classi�cação? Marque o item correto:
A) Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto lançado.
 B) Os clientes da empresa X precisam ser agrupados a partir das suas características.
C) Calcular a probabilidade de um cliente comprar o produto.
D) Previsão da quantidade de produtos vendidos durante um determinado período.
Mineração de dados é a análise semiautomática ou automática do processo de identi�cação de padrões desconhecidos e interessantes ao estudo no conjunto
de dados. Ela engloba métodos de aprendizado de máquina, estatística e sistemas de banco de dados. O objetivo principal é a extração de padrões em um
grande volume de dados (PROVOST, 2013).
Assinale a opção que contenha a a�rmação correta sobre processo de mineração de dados:
A) No Business Understanding é o momento onde as técnicas de mineração de dados são aplicadas aos dados, sendo aplicados estatísticas e padrões para
gerar previsões e fazer inferências sobre as informações extraídas.
B) A Data Preparation con�gura os dados de uma maneira que torne suas análises possíveis.
Alterar modo de visualização
1
2
3
4
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 2/6
B) A Data Preparation con�gura os dados de uma maneira que torne suas análises possíveis.
C) No Deployment transforma a informação numérica expressa em termos. Essas informações podem estar relacionadas a todos os fenômenos que
desejam ser estudados.
D) No Evaluation é a fase de preparação de dados que geralmente prossegue com a compreensão dos dados, em que eles serão manipulados e
consolidados em formulários que gerem melhores resultados.
Os modelos de regressão são frequentemente utilizados em diversas áreas do conhecimento, tais como: computação, engenharias, biologia, saúde etc. Na
modelagem estatística, a análise de regressão é um conjunto de processos estatísticos usados para estimar as relações entre as variáveis (MORETTIN, 2017).
Sobre o que foi visto no capítulo sobre modelos de regressão, responda ao questionamento.
Em quais problemas podemos aplicar os modelos de regressão? Assinale a opção correta:
A) Uma empresa deseja ter a previsão do total de vendas de um produto durante a black friday.
B) Os clientes poderão comprar ou não o novo produto lançado?
C) Os clientes da empresa X precisam ser agrupados a partir das suas características.
D) Uma empresa deseja classi�car seus clientes de acordo com a quantidade de compras, estes serão classi�cados em: �éis e esporádicos.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis podem ter relação
ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das variáveis, e seja
determinada a correlação entre elas (DAGNELIE, 1985).
Assinale a opção na qual podemos aplicar a técnica de multivariada para fazer a análise dos dados.
A) Em uma empresa que deseja analisar se um cliente irá frequentar uma loja dado que o horário de funcionamento foi alterado.
B) Em uma empresa que deseja veri�car a probabilidade de um cliente comprar um produto.
C) Em uma pesquisa em que é preciso analisar a relação entre cliente e produto.
D) Em um estudo em que precisamos analisar a relação entre as variáveis preço, produto, local e consumidor.
À medida que o mercado se torna tecnológico, o �uxo de informações �ca mais rápido, e avaliar essas informações é essencial. Por esse motivo, a análise de
dados tem um papel cada vez mais importante nos negócios. Com base neste contexto, responda à seguinte questão.
Assinale a alternativa que contém de forma correta os impactos que a análise de dados pode trazer para uma empresa.
A) Com a aplicação da análise de dados, os custos de uma empresa podem aumentar, por conta do alto valor que precisa ser investido para gerar
informações consolidadas.
B) Devido à complexidade do �uxo de informações, a análise de dados pode se tornar pouco e�ciente.
C) Baixa compreensão do mercado.
D) Melhorar a e�ciência da tomada de decisão da empresa.
Os grá�cos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos que precisam ser otimizados, e
proporcionam aos setores da organização elaborar um planejamento e�ciente, baseando-se em dados consistentes.
Com base no que foi visto sobre grá�cos, responda ao próximo questionamento. Para gerar os grá�cos é preciso seguir alguns princípios.
Assinale a opção que informa corretamente o que é necessário para construir um grá�co:

A) O grá�co precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O grá�co pode conter várias informações,
como: Título e Nota de rodapé.
B) O grá�co não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações.
C) O grá�co precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de colocar título.
D) O grá�co precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
5
6
7
8
06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 3/6
Os grá�cos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos que precisam ser otimizados, e
proporcionam aos setores da organização elaborar um planejamento e�ciente, baseando-se em dados consistentes.
Sobre as características que o grá�co de dispersão possui, assinale a alternativa correta:
A) Ele representa os dados contínuos como tempo e pressão.
B) Representa dados da medição de uma variável contínua.
C) Utiliza-se para veri�car a relação entre duas variáveis.
D) Utiliza-se para comparar um único valor entre vários grupos.
Os dados coletados de uma pesquisa de mercado podem ser de natureza quantitativa ou qualitativa. Os dados quantitativos são usados para quanti�car o
problema por meio da geração de dados numéricos. Porém, os dados qualitativos são usados para revelar tendências de pensamento e opiniões.
Combase no que vimos no capítulo sobre pesquisas de mercado, analise os itens abaixo e assinale a opção que contém apenas variáveis qualitativas:
A) Quantidade de clientes que compraram o produto X. Fumantes ou não Q. Quantidade de clientes que frequentam uma loja.
B) Cor da pele. Aprovou ou não o produto Q. Quantidade de clientes.
C) Quantidade de clientes que frequentam uma loja. Quantidade de clientes que compraram o produto X. Cor dos olhos.
D) Cor da pele. Aprovou ou não o produto. Fumantes ou não.
A compreensão das técnicas estatísticas depende do entendimento de alguns conceitos básicos, como saber a diferença entre população e amostra.
População é todos os elementos do conjunto e a amostra é apenas uma parte desse conjunto.
Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta:
A) População: conjuntos de todos os itens que não têm características em comum.
B) Parâmetro: característica que descreve a população.
C) Amostra: conjuntos de todos os elementos da população que será analisada.
D) Estimador: característica não numérica estabelecida na amostra.
O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Quais as medidas de distâncias usadas pelo algoritmo KNN? Assinale o item correto:
A) Somente Distância Manhattan.
B) Distância Manhattan e Centroide.
C) Distância Euclidiana e a Distância Manhattan.
D) Somente Distância Euclidiana.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de dengue aumenta com a chegada da quadra
invernosa.
Quem são nossas variáveis dependente e independente? Assinale a opção correta:
A) Y: Quadra invernosa X: Casos de dengue.
B) Y: Casos de dengue X: Habitantes da cidade de São Paulo.
C) Y C d d X Q d i
9
10
11
12
13
06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 4/6
C) Y: Casos de dengue X: Quadra invernosa.
D) Y:Habitantes da cidade de São Paulo X: Quadra invernosa.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos
conceitos vistos no capítulo sobre regressão, responda à próxima questão.
Assinale a opção que contém a principal característica da técnica de regressão.
A) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente (denotada por X).

B) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis independentes
(denotadas por X).
C) O propósito da regressão é minerar os dados de maneira descritiva.
D) O propósito da regressão é agrupar indivíduos com as mesmas características.
O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:
A) De�nição pelo pesquisador ou Gerar pela própria amostra.
B) Somente pela de�nição do pesquisador.
C) Não é necessário gerar pontos de semente.
D) O algoritmo gera de forma automática.
Os métodos hierárquicos criam uma hierarquia de relacionamentos entre os elementos, na qual os dados são particionados várias vezes, para produzir uma
representação hierárquica dos agrupamentos (EVERITT, 2001), com o propósito de melhorar a visualização sobre a formação dos agrupamentos em cada
estágio onde ela ocorreu e com o grau de semelhança entre os agrupamentos.
Métodos hierárquicos precisam de uma matriz que contém as métricas de distância entre os agrupamentos em cada estágio do algoritmo. Essa matriz é
conhecida como matriz de similaridades entre agrupamentos. Conforme a matriz a seguir, quais são as variáveis que têm agrupamento similar?
Y1 Y2 Y3
Y 1 0 0,3 0,2
Y2 0,6 0 0,8
Y3 0,2 0,7 0
Assinale o item que contém o resultado correto:
A) Y1 E Y3
B) Y1 E Y2
 C) Y2 E Y3
D) Nehuma das variáveis mostra agrupamento similar.
K-médias é um algoritmo não supervisionado, isto é, seus dados não possuem rótulos. O principal propósito é identi�car as similaridades entre os dados e
agrupá-los conforme o número de cluster. O algoritmo de k-médias é interativo e poderoso para dividir um conjunto de dados em grupos separados.
Sobre as etapas dos processos de K-Means, marque V para verdadeiro e F para falso:
( ) Inicialização: nesta etapa acontece a atribuição ao cluster e a movimentação de centroides é repetida até o cluster se tornar estático.
( ) At ib i ã Cl t N t t l l di tâ i t t d d d d d t id
14
15
16
17
06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 5/6
( ) Atribuição ao Cluster: Nesta etapa calcula-se a distância entre os pontos dos dados e cada um dos centroides.
( ) Movimentação de Centroides: nesta etapa é modi�cada a localização do centroide.
( ) Otimização: nesta etapa calcula-se a média dos valores dos pontos de dados de cada cluster, e o valor médio será o novo centroide.
Marque a opção que contém a sequência correta:
A) F - V - V - V.
B) F - F - F - F.
C) F - V - V - F.
D) F - V - F - F.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se dizer ao algoritmo os resultados esperados
para que ele possa fazer as classi�cações ou previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à
próxima questão.
Vimos no capítulo 2 os conceitos da aprendizagem supervisionada e as principais formas de aplicação. Com base no que estudamos, marque a opção que
apresenta uma situação que podemos resolver usando a aprendizagem supervisionada.
Marque o item correto:
A) Encontrar grupos de clientes que têm uma maior probabilidade de usar os serviços que uma empresa oferece.
B) Calcular a probabilidade de os clientes comprarem o novo produto desenvolvido.
C) Agrupar os clientes de forma espontânea com base nos seus per�s, onde eles se enquadram em diferentes grupos.
D) Separar os clientes em grupos em que eles são reconhecidos por meio de características próprias.
O KNN é um algoritmo supervisionado que tem por objetivo classi�car objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classi�car
o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Sobre o KNN, marque V para verdadeiro e F para falso:
( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K .
( ) Na fase de classi�cação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não
conseguir decidir qual a classe a que esse elemento K pertença.
( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classi�cador KNN busca os K elementos do conjunto de
treinamento que tenham a menor distância do elemento desconhecido.
Marque a opção que contém a sequência correta:
A) V-F-F.
B) V-V-V.
C) F-F-F.
D) V-V-F.
A análise de cluster classi�ca objetos de maneira que cada objeto seja semelhante aos outros no agrupamento com base em um conjunto decaracterísticas
escolhidas (HAIR, (2009). Os grupos formados devem então conter uma grande homogeneidade dentro de cada grupo, e uma taxa alta de heterogeneidade
entre os grupos. Portanto, os objetos dentro dos agrupamentos estarão próximos quando forem representados gra�camente, e cada grupo estará distante do
outro.
Assinale a opção que contém corretamente os conceitos iniciais sobre a análise de cluster.
18
19
20
06/12/2021 21:32 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645435 6/6
Uniasselvi © 2021
A) A análise de cluster pode-se usar apenas para dados bivariados e univariados.
B) Na análise de cluster faz-se previsões sobre os elementos que pertencem a grupos diferentes.
C) A análise de cluster classi�ca objetos de maneira que cada objeto seja semelhante aos outros no agrupamento.
D) Podemos usar somente para dados discretos.
Voltar