Grátis: Avaliação da Disciplina - Analise Estatistica - Questões Resolvidas com Gabarito em PDF

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:

A Utiliza-se para comparar um único valor entre vários grupos.
B Utiliza-se para verificar a relação entre duas variáveis.
C Representa dados da medição de uma variável contínua.
D Ele representa os dados contínuos como tempo e pressão.

Quais conceitos é preciso seguir para uma distribuição ser considerada multivariada? Assinale a opção correta:

A Todas as variáveis devem ser aleatórias. Todas a variáveis não podem ser inter-relacionadas.
B Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis podem ser significativamente interpretados se analisadas separadamente.
C Algumas variáveis devem ser aleatórias, mas não todas. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser significativamente interpretados se analisadas separadamente.
D Todas as variáveis devem ser aleatórias. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser significativamente interpretados se analisadas separadamente.

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. "Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas".

A) Face a face.
B) Entrevista.
C) Questionário.
D) Telemarketing.

Qual opção abaixo podemos definir como um problema de classificação? Marque o item correto:

A Os clientes da empresa X precisam ser agrupados a partir das suas características.
B Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto lançado.
C Calcular a probabilidade de um cliente comprar o produto.
D Previsão da quantidade de produtos vendidos durante um determinado período.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta:

A Através do desvio-padrão do agrupamento.
B Através da média do agrupamento.
C Através do coeficiente de correlação.
D Através do coeficiente aglomerativo.

Sobre o KNN, marque V para verdadeiro e F para falso:

( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K.
( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença.
( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância do elemento desconhecido.
A V-V-F.
B V-V-V.
C F-F-F.
D F-V-V.

Em qual opção abaixo podemos aplicar um modelo logístico para resolver a problemática apresentada? Assinale a opção correta:

A Uma empresa que deseja verificar se um produto vai ser comprado ou não pelo cliente.
B Uma empresa que deseja avaliar o perfil dos seus clientes.
C Uma empresa que deseja calcular a probabilidade de um produto ser comprado.
D Uma empresa que deseja calcular a quantidade de produtos que serão comparados durante um determinado período.

Assinale a alternativa correta sobre o aprendizado não supervisionado.

A O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
B O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori.
C O aprendizado não supervisionado é usado para problemas de classificação.
D O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados sem a necessidade de existir um conjunto de dados a priori, porém não é usado na análise exploratória de dados.

Assinale a opção que contém a principal característica da técnica de regressão.

A O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis independentes (denotadas por X).
B O propósito da regressão é minerar os dados de maneira descritiva.
C O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente (denotada por X).
D O propósito da regressão é agrupar indivíduos com as mesmas características.

Sobre essa medida, podemos afirmar. Assinale a opção correta:

A Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de maneira significativa na análise multivariada.
B Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
C Podemos definir como a medida generalizada de distância que explica as correlações entre variáveis de modo que se pondera da mesma forma todas as variáveis.
D A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.

Com base nos conceitos iniciais da aprendizagem supervisionada, responda à próxima questão. Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.

A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
C O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma é possível calcular as features.
D O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões.

Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira:

A Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra.
B Ela pode ser formatada apenas como lista e tabela.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra.

Sobre o que aprendemos de gráficos, marque o item correto:

A Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, porém, somente se usados junto com medidas estatísticas.
B Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a outras medidas estatísticas.
C Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
D Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos o suficiente para esta função.

Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados. 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28. Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:

A) 27.
B) 29.
C) 28.
D) 26.

Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta:

A Estimador: característica não numérica estabelecida na amostra.
B Parâmetro: característica que descreve a população.
C Amostra: conjuntos de todos os elementos da população que será analisada.
D População: conjuntos de todos os itens que não têm características em comum.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para analisar o perfil do cliente.
B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
C Para estimar o total de vendas em um período.
D Para calcular a probabilidade de vendas.

Sobre o modelo logístico, coloque F para falso e V para verdadeiro, nas alternativas abaixo: ( ) Os parâmetros do modelo devem seguir normalidade. ( ) Ele é usado frequentemente para variáveis quantitativas. ( ) Podemos usá-lo no caso univariado. ( ) As variáveis do modelo devem ser dicotômicas. Assinale a opção que contém a sequência correta:

A F-F-V-V.
B F-F-F-V.
C V-F-F-F.
D F-F-F-F.

Assinale a opção que informa corretamente o que é necessário para construir um gráfico:

A O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de colocar título.
B O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
C O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O gráfico pode conter várias informações, como: Título e Nota de rodapé.
D O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações.

Dentre as alternativas abaixo, qual caracteriza a regressão? Assinale a opção correta:

A A análise de regressão pode ser usada para inferir a classificação entre uma variável independente e uma dependente.
B A análise de regressão pode ser usada para inferir as relações somente entre uma variável independente e uma dependente.
C A análise de regressão pode ser usada para inferir as relações entre variáveis independentes e dependentes, porém somente para valores positivos.
D A análise de regressão também é usada para entender quais dentre as variáveis independentes estão relacionadas à variável dependente e explorar as formas dessas relações.

Conteúdos escolhidos para você

7 pág.

Avaliação da Disciplina Analise Estatistica de Dados (17320)

UNIASSELVI

9 pág.

Machine Learning - Atividade 2

ESTÁCIO

6 pág.

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

UNILAVRAS

A Classificação é uma tarefa de Mineração de Dados supervisionada, empregada em conjuntos de dados rotulados, realizando a predição discreta dos da...

UNIASSELVI

Uma equipe de pesquisadores está analisando o desempenho financeiro de empresas e o impacto de certas políticas corporativas. Eles têm acesso a dad...

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afirmações abaixo: () Uma medida é uma coleção de itens de dad...

UniCesumar

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afrmações abaixo: () Uma medida é uma coleção de itens de dado...

UniCesumar

Prévia do material em texto

Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645435)
Peso da Avaliação 10,00
Prova 92950987
Qtd. de Questões 20
Nota 10,00
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo,
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização
elaborar um planejamento eficiente, baseando-se em dados consistentes.

Sobre as características que o gráfico de dispersão possui, assinale a alternativa correta:

A Utiliza-se para comparar um único valor entre vários grupos.
B Utiliza-se para verificar a relação entre duas variáveis.
C Representa dados da medição de uma variável contínua.
D Ele representa os dados contínuos como tempo e pressão.
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas
variáveis independentes. Essas variáveis podem ter relação ou não de causa/efeito entre duas ou mais
variáveis. Esses métodos possibilitam que se faça uma exploração da performance conjunta das
variáveis, e seja determinada a correlação entre elas (DAGNELIE, 1985).
Quais conceitos é preciso seguir para uma distribuição ser considerada multivariada?

Assinale a opção correta:

VOLTAR
A+ Alterar modo de visualização
1
2
A Todas as variáveis devem ser aleatórias. Todas a variáveis devem ser inter-relacionadas. Os
efeitos das variáveis não podem ser significativamente interpretados se analisadas separadamente.
B Todas as variáveis devem ser aleatórias. Todas a variáveis não podem ser inter-relacionadas.
C Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis podem ser
significativamente interpretados se analisadas separadamente.
D
Algumas variáveis devem ser aleatórias, mas não todas. Todas a variáveis devem ser inter-
relacionadas. Os efeitos das variáveis não podem ser significativamente interpretados se
analisadas separadamente.
A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar,
seja o perfil do cliente ou do mercado. Com base no que foi visto no capítulo sobre coleta e extração
de informações, vamos avaliar a seguinte questão.

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo.

“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais
pessoas”.
A Face a face.
B Telemarketing.
C Entrevista.
D Questionário.
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados
sem referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos
vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à
próxima questão.
3
4

Quais os métodos a seguir são classificados como não supervisionados. Marque o item correto:

A Clustering, Anomaly detection, Association mining e Classificação.
B Clustering, Anomaly detection, Association mining e Previsão.
C Clustering, Anomaly detection, Association mining e Latent variable models.
D Clustering, Anomaly detection, Classificação e Previsão.
Os algoritmos de classificação tem por objetivo: classificar um indivíduo em uma classe ou conjunto
(WEBB, 2002) no qual elas precisam ser mutuamente exclusivas (PROVOST, 2013). Com base nos
conceitos vistos no capítulo sobre classificação, responda à próxima questão.

Qual opção abaixo podemos definir como um problema de classificação? Marque o item correto:

A Os clientes da empresa X precisam ser agrupados a partir das suas características.
B Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto
lançado.
C Calcular a probabilidade de um cliente comprar o produto.
D Previsão da quantidade de produtos vendidos durante um determinado período.
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e
gradativamente os grupos são formados até que um único conjunto contendo todos os dados seja
gerado (SILVA, 2005). Ao iniciar o processo, os grupos são pequenos e os elementos de cada grupo
possuem um alto grau de similaridade.
5
6

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo?
Assinale a opção correta:

A Através do desvio-padrão do agrupamento.
B Através da média do agrupamento.
C Através do coeficiente de correlação.
D Através do coeficiente aglomerativo.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.

Sobre o KNN, marque V para verdadeiro e F para falso:

( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais
próximos a K .

( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos
podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse
elemento K pertença.

( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o
classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância
do elemento desconhecido.

Marque a opção que contém a sequência correta:
A V-F-F.
7
B V-V-F.
C V-V-V.
D F-F-F.
O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente
(Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes,
elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade
associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.

Em qual opção abaixo podemos aplicar um modelo logístico para resolver a problemática
apresentada? Assinale a opção correta:

A Uma empresa que deseja verificar se um produto vai ser comprado ou não pelo cliente.
B Uma empresa que deseja avaliar o perfil dos seus clientes.
C Uma empresa que deseja calcular a probabilidade de um produto ser comprado.
D Uma empresa que deseja calcular a quantidade de produtos que serão comparados durante um
determinado período.
Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados
sem referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos
vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à
próxima questão.

Assinale a alternativa correta sobre o aprendizado não supervisionado.

8
9

A O aprendizado não supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
B O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados
sem a necessidade de existir um conjunto de dados a priori.
C O aprendizado não supervisionado é usado para problemas de classificação.
D
O aprendizado não supervisionado pode ser usado para descobrir a estrutura subjacente dos dados
sem a necessidade de existir um conjunto de dados a priori, porém não é usado na análise
exploratória de dados.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma
variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre
regressão, responda à próxima questão.

Assinale a opção que contém a principal característica da técnica de regressão.

A O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e
somente uma variável independente (denotada por X).
B O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e
uma série de outras variáveis independentes (denotadas por X).
C O propósito da regressão é agrupar indivíduos com as mesmas características.
D O propósito da regressão é minerar os dados de maneiradescritiva.
Segundo Witten e Frank (2005), as medidas de similaridade consistem em um aprendizado baseado
em instância, em que cada nova instância é comparada com as existentes usando uma métrica de
distância, e a instância existente mais próxima é usada para atribuir a classe à nova. Isso é chamado
de método de classificação de vizinho mais próximo.
10
11

Dentre as medidas de similaridade, temos a Distância Euclidiana, a qual é definida como a soma da
raiz quadrada da diferença entre x e y em suas respectivas dimensões.

Sobre essa medida, podemos afirmar. Assinale a opção correta:

A Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de
maneira significativa na análise multivariada.
B Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a
distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
C Podemos definir como a medida generalizada de distância que explica as correlações entre
variáveis de modo que se pondera da mesma forma todas as variáveis.
D A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é,
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada,
responda à próxima questão.

Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado.

A O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível
agrupar os elementos de forma espontânea.
B O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
C O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data,
pois dessa forma é possível calcular as features.
12
D O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa
identificar padrões.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.

Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção
verdadeira:

A Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados
de uma amostra.
B Ela pode ser formatada apenas como lista e tabela.
C Ela é pouco usada devido à sua complexidade.
D Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma
amostra.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.

Sobre o que aprendemos de gráficos, marque o item correto:

A Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
porém, somente se usados junto com medidas estatísticas.
13
14
B Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
em relação a outras medidas estatísticas.
C Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
D Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos
o suficiente para esta função.
As medidas de posição determinam a localização que um determinado valor possui dentro de um
determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto
de dados. Podemos definir a mediana como uma medida de posição que ocupa a posição central de
um conjunto de dados. Ela é o valor que divide um conjunto de dados (ordenados) em dois
subconjuntos de mesmo número de elementos.

Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados.
29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24,
26, 30, 26, 35, 26, 28, 34, 29, 23, 28

Avalie os itens abaixo e marque a opção que contém a mediana do conjunto:
A 27.
B 26.
C 29.
D 28.
A compreensão das técnicas estatísticas depende do entendimento de alguns conceitos básicos, como
saber a diferença entre população e amostra. População é todos os elementos do conjunto e a amostra
é apenas uma parte desse conjunto.

15
16
Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta:

A Estimador: característica não numérica estabelecida na amostra.
B Parâmetro: característica que descreve a população.
C Amostra: conjuntos de todos os elementos da população que será analisada.
D População: conjuntos de todos os itens que não têm características em comum.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para analisar o perfil do cliente.
B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
C Para estimar o total de vendas em um período.
D Para calcular a probabilidade de vendas.
O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente
(Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes,
elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade
associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias.

Sobre o modelo logístico, coloque F para falso e V para verdadeiro, nas alternativas abaixo:
17
18
( ) Os parâmetros do modelo devem seguir normalidade.
( ) Ele é usado frequentemente para variáveis quantitativas.
( ) Podemos usá-lo no caso univariado.
( ) As variáveis do modelo devem ser dicotômicas.

Assinale a opção que contém a sequência correta:

A F-F-V-V.
B F-F-F-V.
C V-F-F-F.
D F-F-F-F.
Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo,
evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização
elaborar um planejamento eficiente, baseando-se em dados consistentes.

Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os
gráficos é preciso seguir alguns princípios.

Assinale a opção que informa corretamente o que é necessário para construir um gráfico:

A O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidade de
colocar título.
B O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé.
19
C O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações
contidas. O gráfico pode conter várias informações, como: Título e Nota de rodapé.
D O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender
as informações.
A análise de regressão é frequentemente usada por economistas e pesquisadores de negócios, para
auxiliar gerentes e donos de empresas a prever condições futuras, e fornece suporte quantitativo para
a tomada de decisão dos gerentes. Também auxilia na detecção de falhas das estratégias gerenciais e
fornece novos feedbacks que podem mudar as prospecções do negócio (PROVOST, 2013).

Dentre as alternativas abaixo, qual caracteriza a regressão? Assinale a opção correta:

A A análise de regressãopode ser usada para inferir a classificação entre uma variável
independente e uma dependente.
B A análise de regressão pode ser usada para inferir as relações somente entre uma variável
independente e uma dependente.
C A análise de regressão pode ser usada para inferir as relações entre variáveis independentes e
dependentes, porém somente para valores positivos.
D A análise de regressão também é usada para entender quais dentre as variáveis independentes
estão relacionadas à variável dependente e explorar as formas dessas relações.
20
Imprimir

Avaliação da Disciplina - Analise Estatistica

UFPA

Ferramentas de estudo

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. "Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas".A) Face a face.B) Entrevista.C) Questionário.D) Telemarketing.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta:A Através do desvio-padrão do agrupamento.B Através da média do agrupamento.C Através do coeficiente de correlação.D Através do coeficiente aglomerativo.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:A Para analisar o perfil do cliente.B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.C Para estimar o total de vendas em um período.D Para calcular a probabilidade de vendas.

Conteúdos escolhidos para você

Avaliação da Disciplina Analise Estatistica de Dados (17320)

Análise Estatística de Dados

prova mba II

Machine Learning - Atividade 2

Análise Estatística de Dados

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

A Classificação é uma tarefa de Mineração de Dados supervisionada, empregada em conjuntos de dados rotulados, realizando a predição discreta dos da...

Uma equipe de pesquisadores está analisando o desempenho financeiro de empresas e o impacto de certas políticas corporativas. Eles têm acesso a dad...

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afirmações abaixo: () Uma medida é uma coleção de itens de dad...

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afrmações abaixo: () Uma medida é uma coleção de itens de dado...

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Crie sua conta grátis para liberar esse material. 🤩

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. "Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas".A) Face a face.B) Entrevista.C) Questionário.D) Telemarketing.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta:A Através do desvio-padrão do agrupamento.B Através da média do agrupamento.C Através do coeficiente de correlação.D Através do coeficiente aglomerativo.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:A Para analisar o perfil do cliente.B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.C Para estimar o total de vendas em um período.D Para calcular a probabilidade de vendas.

Conteúdos escolhidos para você

Avaliação da Disciplina Analise Estatistica de Dados (17320)

Análise Estatística de Dados

prova mba II

Machine Learning - Atividade 2

Análise Estatística de Dados

Perguntas dessa disciplina

1. Variável é toda característica que, observada em uma unidade da população ou amostra, pode variar de um indivíduo para outro (Callegari-Jacques...

A Classificação é uma tarefa de Mineração de Dados supervisionada, empregada em conjuntos de dados rotulados, realizando a predição discreta dos da...

Uma equipe de pesquisadores está analisando o desempenho financeiro de empresas e o impacto de certas políticas corporativas. Eles têm acesso a dad...

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afirmações abaixo: () Uma medida é uma coleção de itens de dad...

Considerando os elementos que fazem parte da modelagem multidimensional, analise as afrmações abaixo: () Uma medida é uma coleção de itens de dado...

Mais conteúdos dessa disciplina

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. "Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas".

A) Face a face.
B) Entrevista.
C) Questionário.
D) Telemarketing.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta:

A Através do desvio-padrão do agrupamento.
B Através da média do agrupamento.
C Através do coeficiente de correlação.
D Através do coeficiente aglomerativo.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para analisar o perfil do cliente.
B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
C Para estimar o total de vendas em um período.
D Para calcular a probabilidade de vendas.

Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. "Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas".

A) Face a face.
B) Entrevista.
C) Questionário.
D) Telemarketing.

Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta:

A Através do desvio-padrão do agrupamento.
B Através da média do agrupamento.
C Através do coeficiente de correlação.
D Através do coeficiente aglomerativo.

Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta:

A Para analisar o perfil do cliente.
B Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
C Para estimar o total de vendas em um período.
D Para calcular a probabilidade de vendas.