Buscar

Análise Estatística de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Peso da Avaliação
10,00
Qtd. de Questões
20
Nota
10,00
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). 
Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de dengue aumenta com a 
chegada da quadra invernosa.
 Quem são nossas variáveis dependente e independente? Assinale a opção correta: 
A Y: Quadra invernosa X: Casos de dengue.
B Y:Habitantes da cidade de São Paulo X: Quadra invernosa.
C Y: Casos de dengue X: Habitantes da cidade de São Paulo.
D Y: Casos de dengue X: Quadra invernosa.
À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar essas informações é essencial. Por esse 
motivo, a análise de dados tem um papel cada vez mais importante nos negócios.Com base neste contexto, responda à seguinte questão.
 Quais as vantagens que a análise de dados pode fornecer para a empresa? Assinale o item correto:  
A
A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma empresa, porém ela não é boa
para ser usada na tomada de decisões.
B A análise de dados faz uso das medidas estatísticas para obter comparações apenas de grupos pequenos de clientes.
C A análise de dados não gera resultados confiáveis, por esse motivo é pouco utilizada em empresas.
D
A análise de dados permite comparar grupos e obter um quadro simples e resumido do cenário de uma empresa, através dela um negócio
pode ter estratégias inteligentes perante o mercado. 
A compreensão das técnicas estatísticas depende do entendimento de alguns conceitos básicos, como saber a diferença entre população e 
amostra. População é todos os elementos do conjunto e a amostra é apenas uma parte desse conjunto.
 Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta: 
A  População: conjuntos de todos os itens que não têm características em comum.
B Parâmetro: característica que descreve a população.
C  Estimador: característica não numérica estabelecida na amostra.
D  Amostra: conjuntos de todos os elementos da população que será analisada.
Pesquisas de mercado são frequentemente usadas para coletar os dados dos clientes, e informações do mercado. Com base no conceito visto 
sobre pesquisa de mercado, avalie a próxima questão.
 
1
2
3
4
Avalie o próximo trecho: “Este é um tipo de pesquisa que está focado nas avaliações subjetivas e tem o propósito de identificar as 
percepções humanas sobre produtos, serviços e empresas, a fim de apontar comportamentos e tendências.” De qual tipo de pesquisa o 
trecho se refere?
 Assinale a alternativa correta: 
A Pesquisas Discretas.
B Quantitativa.
C Qualitativa.
D Pesquisas Contínuas.
A análise de regressão é frequentemente usada por economistas e pesquisadores de negócios, para auxiliar gerentes e donos de empresas a 
prever condições futuras, e fornece suporte quantitativo para a tomada de decisão dos gerentes. Também auxilia na detecção de falhas das 
estratégias gerenciais e fornece novos feedbacks que podem mudar as prospecções do negócio (PROVOST, 2013).
 Dentre as alternativas abaixo, qual caracteriza a regressão? Assinale a opção correta: 
A A análise de regressão pode ser usada para inferir as relações somente entre uma variável independente e uma dependente. 
B
A análise de regressão também é usada para entender quais dentre as variáveis independentes estão relacionadas à variável
dependente e explorar as formas dessas relações. 
C
A análise de regressão pode ser usada para inferir as relações entre variáveis independentes e dependentes, porém somente para
valores positivos.
D A análise de regressão pode ser usada para inferir a classificação entre uma variável independente e uma dependente.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). 
Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 Qual opção abaixo podemos definir como um problema de regressão? Marque o item correto: 
A Previsão da quantidade de produtos vendidos durante um determinado período.
B Os clientes da empresa X precisam ser agrupados a partir das suas características.
C Os clientes poderão comprar ou não o novo produto lançado?
D Calcular a probabilidade de um cliente comprar o produto.
K-médias é um algoritmo não supervisionado, isto é, seus dados não possuem rótulos. O principal propósito é identificar as similaridades 
entre os dados e agrupá-los conforme o número de cluster. O algoritmo de k-médias é interativo e poderoso para dividir um conjunto de 
dados em grupos separados.
 Sobre as etapas dos processos de K-Means, marque V para verdadeiro e F para falso: 
(  ) Inicialização: nesta etapa acontece a atribuição ao cluster e a movimentação de centroides é repetida até o cluster se tornar estático.
(  ) Atribuição ao Cluster: Nesta etapa calcula-se a distância entre os pontos dos dados e cada um dos centroides.
(  ) Movimentação de Centroides: nesta etapa é modificada a localização do centroide.
(  ) Otimização: nesta etapa calcula-se a média dos valores dos pontos de dados de cada cluster, e o valor médio será o novo centroide. 
Marque a opção que contém a sequência correta:
A F - F - F - F.
B F - V - V - F.
C F - V - F - F.
D F - V - V - V.
5
6
7
À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar essas informações é essencial. Por esse 
motivo, a análise de dados tem um papel cada vez mais importante nos negócios. Com base neste contexto, responda à seguinte questão.
  Assinale a alternativa que contém de forma correta os impactos que a análise de dados pode trazer para uma empresa.
A
Com a aplicação da análise de dados, os custos de uma empresa podem aumentar, por conta do alto valor que precisa ser investido para
gerar informações consolidadas.
B Baixa compreensão do mercado.
C Devido à complexidade do fluxo de informações, a análise de dados pode se tornar pouco eficiente.
D Melhorar a eficiência da tomada de decisão da empresa.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se dizer ao algoritmo os 
resultados esperados para que ele possa fazer as classificações ou previsões de maneira correta. Com base nos conceitos iniciais da 
aprendizagem supervisionada, responda à próxima questão.
 Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado. 
A O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões.
B
O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os elementos de forma
espontânea.
C O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões.
D
O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma é possível calcular as
features. 
A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar, seja o perfil do cliente ou do mercado. 
Com base no que foi visto no capítulo sobre coleta e extração de informações, vamos avaliar a seguinte questão.
 Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. 
“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas”. 
A Telemarketing.
B Questionário.
C Face a face. 
D Entrevista.
  O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de Machine learning tem como 
propósito classificar o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, atravésdo 
esquema de votação.
   Quais as medidas de distâncias usadas pelo algoritmo KNN? Assinale o item correto:
A   Distância Manhattan e Centroide.
B   Somente Distância Euclidiana.
C   Distância Euclidiana e a Distância Manhattan.
D   Somente Distância Manhattan.
8
9
10
11
01/04/24, 22:19 AVA
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjQ1NDM1IiwiZGVzY3JpcHRpb24iOiJBdmFsaWHDp8OjbyBkYSBEaXNjaXBsaW5hIiwicGFyYW1ldGVyIjpudWxs… 4/6
Os métodos hierárquicos criam uma hierarquia de relacionamentos entre os elementos, na qual os dados são particionados várias vezes, para 
produzir uma representação hierárquica dos agrupamentos (EVERITT, 2001), com o propósito de melhorar a visualização sobre a formação 
dos agrupamentos em cada estágio onde ela ocorreu e com o grau de semelhança entre os agrupamentos.
 
Métodos hierárquicos precisam de uma matriz que contém as métricas de distância entre os agrupamentos em cada estágio do algoritmo. 
Essa matriz é conhecida como matriz de similaridades entre agrupamentos. Conforme a matriz a seguir, quais são as variáveis que têm 
agrupamento similar?
 
  Y1 Y2 Y3
Y 1 0 0,3 0,2
Y2 0,6 0 0,8
Y3 0,2 0,7 0
 Assinale o item que contém o resultado correto:  
A  Y1 E Y3 
B  Y1 E Y2 
C  Y2 E Y3
D  Nehuma das variáveis mostra agrupamento similar. 
Os dados coletados de uma pesquisa de mercado podem ser de natureza quantitativa ou qualitativa. Os dados quantitativos são usados para 
quantificar o problema por meio da geração de dados numéricos. Porém, os dados qualitativos são usados para revelar tendências de 
pensamento e opiniões.
 
Com base no que vimos no capítulo sobre pesquisas de mercado, analise os itens abaixo e assinale a opção que contém apenas variáveis 
qualitativas:
A Quantidade de clientes que frequentam uma loja. Quantidade de clientes que compraram o produto X. Cor dos olhos. 
B Quantidade de clientes que compraram o produto X. Fumantes ou não Q. Quantidade de clientes que frequentam uma loja.
C Cor da pele. Aprovou ou não o produto Q. Quantidade de clientes. 
D  Cor da pele. Aprovou ou não o produto. Fumantes ou não. 
As técnicas multivariadas analisam as relações de múltiplas variáveis dependentes e/ou múltiplas variáveis independentes. Essas variáveis 
podem ter relação ou não de causa/efeito entre duas ou mais variáveis. Esses métodos possibilitam que se faça uma exploração da 
performance conjunta das variáveis, e seja determinada a correlação entre elas (DAGNELIE, 1985).
Quais conceitos é preciso seguir para uma distribuição ser considerada multivariada? Assinale a opção correta:  
A Todas as variáveis devem ser aleatórias. Todas a variáveis não podem ser inter-relacionadas.
B
Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis podem ser significativamente interpretados se analisadas
separadamente.
C
Algumas variáveis devem ser aleatórias, mas não todas. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não
podem ser significativamente interpretados se analisadas separadamente.
D
Todas as variáveis devem ser aleatórias. Todas a variáveis devem ser inter-relacionadas. Os efeitos das variáveis não podem ser
significativamente interpretados se analisadas separadamente.
Os algoritmos de classificação tem por objetivo: classificar um indivíduo em uma classe ou conjunto (WEBB, 2002) no qual elas precisam ser 
mutuamente exclusivas (PROVOST, 2013). Com base nos conceitos vistos no capítulo sobre classificação, responda à próxima questão.
12
13
14
15
 Qual opção abaixo podemos definir como um problema de classificação? Marque o item correto: 
A Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto lançado. 
B Previsão da quantidade de produtos vendidos durante um determinado período.
C Calcular a probabilidade de um cliente comprar o produto.
D Os clientes da empresa X precisam ser agrupados a partir das suas características.
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e gradativamente os grupos são formados até que 
um único conjunto contendo todos os dados seja gerado (SILVA, 2005). Ao iniciar o processo, os grupos são pequenos e os elementos de 
cada grupo possuem um alto grau de similaridade.
 
Nos métodos aglomerativos existem alguns passos que precisam ser seguidos. Assinale a opção que contém os passos necessários para usar 
o método aglomerativo.
 
A
 Primeiro deve-se calcular um único padrão para cada agrupamento. Após o passo inicial é gerado um novo agrupamento, o qual é
formado pela união dos agrupamentos com maior grau de similaridade. Os passos 1 e 2 são executados diversas vezes, até que todos os
objetos estejam em um único agrupamento.
B
 O passo inicial é gerar um novo agrupamento, o qual é formado pela união dos agrupamentos com maior grau de similaridade. O segundo
passo é calcular a matriz de similaridades. Os passos 2 e 3 são executados diversas vezes, até que todos os objetos estejam em um único
agrupamento.
C
Primeiro deve-se calcular um único padrão para cada agrupamento. O segundo passo é calcular a matriz de similaridades. Após os passos
iniciais é gerado um novo agrupamento, o qual é formado pela união dos agrupamentos com maior grau de similaridade. Os passos 2 e 3
são executados diversas vezes, até que todos os objetos estejam em um único agrupamento.
D
Primeiro deve-se calcular a matriz de similaridades. Após o passo inicial é gerado um novo agrupamento, o qual é formado pela união dos
agrupamentos com maior grau de similaridade. Os passos 1 e 2 são executados diversas vezes, até que todos os objetos estejam em um
único agrupamento. 
  O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de Machine learning tem como 
propósito classificar o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do 
esquema de votação.
   Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta: 
A   O algoritmo gera de forma automática. 
B   Definição pelo pesquisador ou Gerar pela própria amostra.
C    Não é necessário gerar pontos de semente.
D   Somente pela definição do pesquisador.
O método aglomerativo é iniciado com cada padrão formando seu próprio agrupamento, e gradativamente os grupos são formados até que 
um único conjunto contendo todos os dados seja gerado (SILVA, 2005). Ao iniciar o processo, os grupos são pequenos e os elementos de 
cada grupo possuem um alto grau de similaridade.
 Como podemos medir a qualidade do agrupamento formado a partir do método aglomerativo? Assinale a opção correta: 
A   Através do coeficiente aglomerativo.
B  Através do desvio-padrão do agrupamento.
C   Através do coeficiente de correlação.
D  Através da média do agrupamento.
16
17
18
https://ava2.uniasselvi.com.br/subject/grades-and-tests/answer-book/eyJ0ZXN0Ijp7InRlc3RDb2RlIjoiNjQ1NDM1IiwiZGVzY3JpcHRpb24iOiJBdmFsaWHDp8OjbyBkYSBEaXNjaXBsaW5hIiwicGFyYW1ldGVyIjpudWxs… 6/6
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). 
Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima questão.
 Assinale a opção que contém a principal característica da técnica de regressão. 
A
O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis
independentes (denotadas por X).
B O propósito da regressão é minerar os dados de maneira descritiva.
C
O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente
(denotada por X).
D O propósito da regressão é agrupar indivíduos com as mesmas características.
  O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de Machine learningtem como 
propósito classificar o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do 
esquema de votação.
   Sobre o KNN, marque V para verdadeiro e F para falso: 
  ( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K . 
  ( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o 
algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença.
 
  ( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN busca os K elementos do 
conjunto de treinamento que tenham a menor distância do elemento desconhecido.
    Marque a opção que contém a sequência correta:
A  F-F-F.
B  V-V-V.
C  V-F-F.
D  V-V-F.
19
20
Imprimir

Continue navegando