Avaliação da Disciplina

Análise Estatística

IFSC

Prova impressa (gabarito) com questões de múltipla escolha sobre aprendizado de máquina e estatística: medidas de similaridade (Distância Euclidiana), medidas de posição (mediana com amostra de idades), aprendizado não supervisionado, KNN e aprendizado supervisionado.

sara lobo

em 15/07/2023

Questões resolvidas

Sobre essa medida, podemos afirmar. Assinale a opção correta:

A Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de maneira significativa na análise multivariada.
B Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
C A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.
D Podemos definir como a medida generalizada de distância que explica as correlações entre variáveis de modo que se pondera da mesma forma todas as variáveis.

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:

A 29.
B 27.
C 28.
D 26.

Assinale a alternativa correta sobre o aprendizado não supervisionado.

A O aprendizado não supervisionado é usado para problemas de classificação.
B O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
C O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori.
D O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori, porém não é usado na análise exploratória de dados.

Sobre o KNN, marque V para verdadeiro e F para falso:

( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K.
( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença.
( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância do elemento desconhecido.
A V-F-F.
B V-V-V.
C F-F-F.
D V-V-F.

Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.

A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma é possível calcular as features.
C O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões.
D O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:
A 6,59.
B 6,87.
C 6,15.
D 7,23.

A 6,59.
B 6,87.
C 6,15.
D 7,23.

Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:

A Interpretação. Com base neste contexto, responda ao questionamento.
B Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
C Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra.
D Ela pode ser formatada apenas como lista e tabela.

Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:

A Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
B Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas como lista e tabela.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:

A O algoritmo gera de forma automática.
B Somente pela definição do pesquisador.
C Não é necessário gerar pontos de semente.
D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:

A Somente classificação.
B Classificação e Previsão.
C Agrupamento espontâneo.
D Somente previsão.

Conteúdos escolhidos para você

42 pág.

Análise de Dados

6 pág.

Análise Estatística de Dados

UNIASSELVI

10 pág.

Avaliação N2 - UAM

UAM

43 pág.

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

ESTÁCIO EAD

14 pág.

Análise Estatística de Dados

ITPAC

Perguntas dessa disciplina

Uma empresa de marketing digital decidiu analisar os dados de interação dos usuários em suas campanhas publicitárias. Para isso, a equipe de análise d

UNIVESP

A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjuntos de dados sem que haja rótulos previa...

Anhanguera

mentas da qualidade são técnicas utilizadas com a finalidade de definir, mensurar, analisar e propor soluções para os problemas que interferem no dese

Questão 1 Sem resposta A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjunto de dados sem q...

ª) Para se utilizar a estatística como um todos, são necessários conhecimentos do processo de identificação, coleta, apresentação e interpretação d...

UFRRJ

Material

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Sobre essa medida, podemos afirmar. Assinale a opção correta:

A Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de maneira significativa na análise multivariada.
B Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
C A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.
D Podemos definir como a medida generalizada de distância que explica as correlações entre variáveis de modo que se pondera da mesma forma todas as variáveis.

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:

A 29.
B 27.
C 28.
D 26.

Assinale a alternativa correta sobre o aprendizado não supervisionado.

A O aprendizado não supervisionado é usado para problemas de classificação.
B O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
C O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori.
D O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori, porém não é usado na análise exploratória de dados.

Sobre o KNN, marque V para verdadeiro e F para falso:

( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K.
( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença.
( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância do elemento desconhecido.
A V-F-F.
B V-V-V.
C F-F-F.
D V-V-F.

Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.

A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma é possível calcular as features.
C O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões.
D O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:
A 6,59.
B 6,87.
C 6,15.
D 7,23.

A 6,59.
B 6,87.
C 6,15.
D 7,23.

Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:

A Interpretação. Com base neste contexto, responda ao questionamento.
B Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
C Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra.
D Ela pode ser formatada apenas como lista e tabela.

Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:

A Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.
B Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas como lista e tabela.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:

A O algoritmo gera de forma automática.
B Somente pela definição do pesquisador.
C Não é necessário gerar pontos de semente.
D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:

A Somente classificação.
B Classificação e Previsão.
C Agrupamento espontâneo.
D Somente previsão.

Conteúdos escolhidos para você

42 pág.

Análise de Dados

6 pág.

Análise Estatística de Dados

UNIASSELVI

10 pág.

Avaliação N2 - UAM

UAM

43 pág.

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

ESTÁCIO EAD

14 pág.

Análise Estatística de Dados

ITPAC

Perguntas dessa disciplina

Uma empresa de marketing digital decidiu analisar os dados de interação dos usuários em suas campanhas publicitárias. Para isso, a equipe de análise d

UNIVESP

A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjuntos de dados sem que haja rótulos previa...

Anhanguera

mentas da qualidade são técnicas utilizadas com a finalidade de definir, mensurar, analisar e propor soluções para os problemas que interferem no dese

Questão 1 Sem resposta A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjunto de dados sem q...

ª) Para se utilizar a estatística como um todos, são necessários conhecimentos do processo de identificação, coleta, apresentação e interpretação d...

UFRRJ

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645435)
Peso da Avaliação 10,00
Prova 63904359
Qtd. de Questões 20
Nota 9,50
Segundo Witten e Frank (2005), as medidas de similaridade consistem em um aprendizado baseado
em instância, em que cada nova instância é comparada com as existentes usando uma métrica de
distância, e a instância existente mais próxima é usada para atribuir a classe à nova. Isso é chamado
de método de classificação de vizinho mais próximo.

Dentre as medidas de similaridade, temos a Distância Euclidiana, a qual é definida como a soma da
raiz quadrada da diferença entre x e y em suas respectivas dimensões.
Sobre essa medida, podemos afirmar. Assinale a opção correta:
A Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de
maneira significativa na análise multivariada.
B Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a
distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
C A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.
D Podemos definir como a medida generalizada de distância que explica as correlações entre
variáveis de modo que se pondera da mesma forma todas as variáveis.
As medidas de posição determinam a localização que um determinado valor possui dentro de um
determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto
de dados. Podemos definir a mediana como uma medida de posição que ocupa a posição central de
um conjunto de dados. Ela é o valor que divide um conjunto de dados (ordenados) em dois
subconjuntos de mesmo número de elementos.
Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados.
29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24,
26, 30, 26, 35, 26, 28, 34, 29, 23, 28
Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:
A 29.
B 27.
C 28.
D 26.
VOLTAR
A+ Alterar modo de visualização
1
2
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados
sem referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos
vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à
próxima questão.
Assinale a alternativa correta sobre o aprendizado não supervisionado.
A O aprendizado não supervisionado é usado para problemas de classificação.
B O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
C O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos
dados sem a necessidade de existir um conjunto de dados a priori.
D
O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados
sem a necessidade de existir um conjunto de dados a priori, porém não é usado na análise
exploratória de dados.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Sobre o KNN, marque V para verdadeiro e F para falso:
( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais
próximos a K .

( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos
podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse
elemento K pertença.

( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o
classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância
do elemento desconhecido.
Marque a opção que contém a sequência correta:
A V-F-F.
B V-V-V.
C F-F-F.
D V-V-F.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é,
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada,
responda à próxima questão.
Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.
3
4
5
A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível
agrupar os elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data,
pois dessa forma é possível calcular as features.
C O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa
identificar padrões.
D O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:
A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
D Para calcular a probabilidade de vendas.
As medidas de posição determinam a localização que um determinado valor possui dentro de um
determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto
de dados. Dentre as medidas de posição temos a média aritmética, a qual representa o valor central do
conjunto de dados.
Um professor fez uma avaliação na turma e o conjunto de notas foi:
6; 5.6; 7; 8; 9; 10; 5; 7; 8.9; 4.3; 8.1; 4.1; 7.8; 3.2 ;9
Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:
A 6,59.
B 6,87.
C 6,15.
D 7,23.
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo,
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização
elaborar um planejamento eficiente, baseando-se em dados consistentes.
Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:
6
7
8
A Ele representa os dados contínuos como tempo e pressão.
B Utiliza-se para verificar a relação entre duas variáveis.
C Utiliza-se para comparar um único valor entre vários grupos.
D Representa dados da medição de uma variável contínua.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é,
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada,
responda à próxima questão.

Vimos no capítulo 2 os conceitos da aprendizagem supervisionada e as principais formas de
aplicação. Com base no que estudamos, marque a opção que apresenta uma situação que podemos
resolver usando a aprendizagem supervisionada.
Marque o item correto:
A Encontrar grupos de clientes que têm uma maior probabilidade de usar os serviços que uma
empresa oferece.
B Calcular a probabilidade de os clientes comprarem o novo produto desenvolvido.
C Agrupar os clientes de forma espontânea com base nos seus perfis, onde eles se enquadram em
diferentes grupos.
D Separar os clientes em grupos em que eles são reconhecidos por meio de características
próprias.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.

Em relaçãoao que estudamos no capítulo sobre distribuição de frequência, marque a opção
verdadeira:

A Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de
uma amostra.
B Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados
de uma amostra.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas como lista e tabela.
9
10
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:
A O algoritmo gera de forma automática.
B Somente pela definição do pesquisador.
C Não é necessário gerar pontos de semente.
D Definição pelo pesquisador ou Gerar pela própria amostra.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é,
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada,
responda à próxima questão.
Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:
A Somente classificação.
B Classificação e Previsão.
C Agrupamento espontâneo.
D Somente previsão.
A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar,
seja o perfil do cliente ou do mercado. Com base no que foi visto no capítulo sobre coleta e extração
de informações, vamos avaliar a seguinte questão.
Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo.
“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais
pessoas”.
A Face a face.
B Telemarketing.
C Entrevista.
D Questionário.
11
12
13
Os modelos de regressão são frequentemente utilizados em diversas áreas do conhecimento, tais
como: computação, engenharias, biologia, saúde etc. Na modelagem estatística, a análise de regressão
é um conjunto de processos estatísticos usados para estimar as relações entre as variáveis
(MORETTIN, 2017). Sobre o que foi visto no capítulo sobre modelos de regressão, responda ao
questionamento.
Em quais problemas podemos aplicar os modelos de regressão? Assinale a opção correta:
A Os clientes da empresa X precisam ser agrupados a partir das suas características.
B Uma empresa deseja ter a previsão do total de vendas de um produto durante a black friday.
C Os clientes poderão comprar ou não o novo produto lançado?
D Uma empresa deseja classificar seus clientes de acordo com a quantidade de compras, estes
serão classificados em: fiéis e esporádicos.
A análise de cluster classifica objetos de maneira que cada objeto seja semelhante aos outros no
agrupamento com base em um conjunto de características escolhidas (HAIR, (2009). Os grupos
formados devem então conter uma grande homogeneidade dentro de cada grupo, e uma taxa alta de
heterogeneidade entre os grupos. Portanto, os objetos dentro dos agrupamentos estarão próximos
quando forem representados graficamente, e cada grupo estará distante do outro.
Assinale a opção que contém corretamente os conceitos iniciais sobre a análise de cluster.
A A análise de cluster pode-se usar apenas para dados bivariados e univariados.
B A análise de cluster classifica objetos de maneira que cada objeto seja semelhante aos outros no
agrupamento.
C Podemos usar somente para dados discretos.
D Na análise de cluster faz-se previsões sobre os elementos que pertencem a grupos diferentes.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
Sobre o que aprendemos de gráficos, marque o item correto:
A Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares
precisos o suficiente para esta função.
B Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
porém, somente se usados junto com medidas estatísticas.
C Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
D Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
em relação a outras medidas estatísticas.
14
15
16
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo,
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização
elaborar um planejamento eficiente, baseando-se em dados consistentes.

Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os
gráficos é preciso seguir alguns princípios.
Assinale a opção que informa corretamente o que é necessário para construir um gráfico:
A O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de
colocar título.
B O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender
as informações.
C O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
D O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações
contidas. O gráfico pode conter várias informações, como: Título e Nota de rodapé.
Os algoritmos de classificação tem por objetivo: classificar um indivíduo em uma classe ou conjunto
(WEBB, 2002) no qual elas precisam ser mutuamente exclusivas (PROVOST, 2013). Com base nos
conceitos vistos no capítulo sobre classificação, responda à próxima questão.
Qual opção abaixo podemos definir como um problema de classificação? Marque o item correto:
A Previsão da quantidade de produtos vendidos durante um determinado período.
B Os clientes da empresa X precisam ser agrupados a partir das suas características.
C Calcular a probabilidade de um cliente comprar o produto.
D Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto
lançado.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas
variáveis independentes. Essas variáveis podem ter relação ou não de causa/efeito entre duas ou mais
variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das
variáveis, e seja determinada a correlação entre elas (DAGNELIE, 1985).
Assinale a opção na qual podemos aplicar a técnica de multivariada para fazer a análise dos dados.
A Em uma empresa que deseja analisar se um cliente irá frequentar uma loja dado que o horário de
funcionamento foi alterado.
B Em uma pesquisa em que é preciso analisar a relação entre cliente e produto.
C Em um estudo em que precisamos analisar a relação entre as variáveis preço, produto, local e
consumidor.
17
18
19
D Em uma empresa que deseja verificar a probabilidade de um cliente comprar um produto.
Mineração de dados é a análise semiautomática ou automática do processo de identificação de
padrões desconhecidos e interessantes ao estudo no conjunto de dados. Ela engloba métodos de
aprendizado de máquina, estatística e sistemas de banco de dados. O objetivo principal é a extração
de padrões em um grande volume de dados (PROVOST, 2013).
Assinale a opção que contenha a afirmação correta sobre processo de mineração de dados:
A No Deployment transforma a informação numérica expressa em termos. Essas informações
podem estar relacionadas a todos os fenômenos que desejam ser estudados.
B
No Business Understanding é o momento onde as técnicas de mineração de dados são aplicadas
aos dados, sendo aplicados estatísticas e padrões para gerar previsões efazer inferências sobre as
informações extraídas.
C
No Evaluation é a fase de preparação de dados que geralmente prossegue com a compreensão dos
dados, em que eles serão manipulados e consolidados em formulários que gerem melhores
resultados.
D A Data Preparation configura os dados de uma maneira que torne suas análises possíveis.
20
Imprimir

Avaliação da Disciplina

Análise Estatística

IFSC

Ferramentas de estudo

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:A 29.B 27.C 28.D 26.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.B Para estimar o total de vendas em um período.C Para analisar o perfil do cliente.D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:A 6,59.B 6,87.C 6,15.D 7,23.A 6,59.B 6,87.C 6,15.D 7,23.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:A O algoritmo gera de forma automática.B Somente pela definição do pesquisador.C Não é necessário gerar pontos de semente.D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:A Somente classificação.B Classificação e Previsão.C Agrupamento espontâneo.D Somente previsão.

Conteúdos escolhidos para você

Análise de Dados

Análise Estatística de Dados

Avaliação N2 - UAM

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

Análise Estatística de Dados

Perguntas dessa disciplina

Uma empresa de marketing digital decidiu analisar os dados de interação dos usuários em suas campanhas publicitárias. Para isso, a equipe de análise d

A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjuntos de dados sem que haja rótulos previa...

mentas da qualidade são técnicas utilizadas com a finalidade de definir, mensurar, analisar e propor soluções para os problemas que interferem no dese

Questão 1 Sem resposta A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjunto de dados sem q...

ª) Para se utilizar a estatística como um todos, são necessários conhecimentos do processo de identificação, coleta, apresentação e interpretação d...

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:A 29.B 27.C 28.D 26.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.B Para estimar o total de vendas em um período.C Para analisar o perfil do cliente.D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:A 6,59.B 6,87.C 6,15.D 7,23.A 6,59.B 6,87.C 6,15.D 7,23.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:A O algoritmo gera de forma automática.B Somente pela definição do pesquisador.C Não é necessário gerar pontos de semente.D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:A Somente classificação.B Classificação e Previsão.C Agrupamento espontâneo.D Somente previsão.

Conteúdos escolhidos para você

Análise de Dados

Análise Estatística de Dados

Avaliação N2 - UAM

Tema 3 - Treinamento de modelos de aprendizado não supervisionado

Análise Estatística de Dados

Perguntas dessa disciplina

Uma empresa de marketing digital decidiu analisar os dados de interação dos usuários em suas campanhas publicitárias. Para isso, a equipe de análise d

A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjuntos de dados sem que haja rótulos previa...

mentas da qualidade são técnicas utilizadas com a finalidade de definir, mensurar, analisar e propor soluções para os problemas que interferem no dese

Questão 1 Sem resposta A clusterização é uma técnica de aprendizado não supervisionado utilizada para identificar grupos em conjunto de dados sem q...

ª) Para se utilizar a estatística como um todos, são necessários conhecimentos do processo de identificação, coleta, apresentação e interpretação d...

Mais conteúdos dessa disciplina

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:

A 29.
B 27.
C 28.
D 26.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:
A 6,59.
B 6,87.
C 6,15.
D 7,23.

A 6,59.
B 6,87.
C 6,15.
D 7,23.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:

A O algoritmo gera de forma automática.
B Somente pela definição do pesquisador.
C Não é necessário gerar pontos de semente.
D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:

A Somente classificação.
B Classificação e Previsão.
C Agrupamento espontâneo.
D Somente previsão.

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:

A 29.
B 27.
C 28.
D 26.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
B Para estimar o total de vendas em um período.
C Para analisar o perfil do cliente.
D Para calcular a probabilidade de vendas.

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:

Avalie os itens abaixo e assinale a opção que contém a média aritmética do conjunto:
A 6,59.
B 6,87.
C 6,15.
D 7,23.

A 6,59.
B 6,87.
C 6,15.
D 7,23.

Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta:

A O algoritmo gera de forma automática.
B Somente pela definição do pesquisador.
C Não é necessário gerar pontos de semente.
D Definição pelo pesquisador ou Gerar pela própria amostra.

Quais são os tipos de técnicas da aprendizagem supervisionada? Marque o item correto:

A Somente classificação.
B Classificação e Previsão.
C Agrupamento espontâneo.
D Somente previsão.