Buscar

Análise Estatística de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

02/07/2022 11:09 Avaliação da Disciplina
about:blank 1/8
Prova Impressa
GABARITO | Avaliação da Disciplina (Cod.:645435)
Peso da Avaliação 10,00
Prova 51414403
Qtd. de Questões 20
Nota 7,50
Segundo Witten e Frank (2005), as medidas de similaridade consistem em um aprendizado baseado 
em instância, em que cada nova instância é comparada com as existentes usando uma métrica de 
distância, e a instância existente mais próxima é usada para atribuir a classe à nova. Isso é chamado 
de método de classificação de vizinho mais próximo.
 
Dentre as medidas de similaridade, temos a Distância Euclidiana, a qual é definida como a soma da 
raiz quadrada da diferença entre x e y em suas respectivas dimensões.
 Sobre essa medida, podemos afirmar. Assinale a opção correta: 
A Podemos definir como a medida generalizada de distância que explica as correlações entre
variáveis de modo que se pondera da mesma forma todas as variáveis.
B A Distância Euclidiana é definida pela soma das diferenças entre x e y em cada dimensão.
C Devido ao seu alto grau de complexidade, a Distância Euclidiana não pode ser aplicada de
maneira significativa na análise multivariada.
D Podemos considerar como a medida mais conhecida, onde é frequentemente usada para medir a
distância. Ela simplesmente é a distância geométrica no espaço multidimensional.
O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta: 
A Para estimar o total de vendas em um período.
B Para analisar o perfil do cliente.
C Para calcular a probabilidade de vendas.
D Para encontrar as empresas mais semelhantes aos melhores clientes do negócio.
A compreensão das técnicas estatísticas depende do entendimento de alguns conceitos básicos, como 
saber a diferença entre população e amostra. População é todos os elementos do conjunto e a amostra 
é apenas uma parte desse conjunto.
 Com base nos conceitos básicos das técnicas estatísticas, assinale a opção correta: 
A Amostra: conjuntos de todos os elementos da população que será analisada.
 VOLTAR
A+ Alterar modo de visualização
1
2
3
02/07/2022 11:09 Avaliação da Disciplina
about:blank 2/8
B População: conjuntos de todos os itens que não têm características em comum.
C Parâmetro: característica que descreve a população.
D Estimador: característica não numérica estabelecida na amostra.
As pessoas podem ser competentes ou não em suas habilidades sociais, capacidade essa que influi 
diretamente na qualidade das relações pessoais e profissionais, bem como na própria qualidade de 
vida do indivíduo. Nesse sentido, associe os itens que seguem conforme suas respectivas 
características:
 I – Habilidade Social.II – Desempenho Social.III - Competência Social. 
( ) Caracteriza-se por possuir propósito avaliativo.( ) Caracteriza-se pela emissão de comportamentos.
( ) Caracteriza-se pela pluralidade de comportamentos. 
Assinale a alternativa que apresenta a sequência correta de respostas:
A I – II – III.
B III – II – I.
C III – I – II.
D II – I – III.
 O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Sobre o KNN, marque V para verdadeiro e F para falso: 
 ( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais 
próximos a K .
 
 ( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos 
podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse 
elemento K pertença.
 
 ( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o 
classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância 
do elemento desconhecido.
 Marque a opção que contém a sequência correta:
A F-F-F.
B V-F-F.
C V-V-F.
D V-V-V.
4
5
02/07/2022 11:09 Avaliação da Disciplina
about:blank 3/8
Os algoritmos de classificação tem por objetivo: classificar um indivíduo em uma classe ou conjunto 
(WEBB, 2002) no qual elas precisam ser mutuamente exclusivas (PROVOST, 2013). Com base nos 
conceitos vistos no capítulo sobre classificação, responda à próxima questão.
 Qual opção abaixo podemos definir como um problema de classificação? Marque o item correto: 
A Previsão da quantidade de produtos vendidos durante um determinado período.
B Calcular a probabilidade de um cliente comprar o produto.
C Os clientes da empresa X precisam ser agrupados a partir das suas características.
D Uma empresa que investiga a chance dos seus clientes comprarem ou não o novo produto
lançado. 
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma 
variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre 
regressão, responda à próxima questão.
 Qual opção abaixo podemos definir como um problema de regressão? Marque o item correto: 
A Os clientes da empresa X precisam ser agrupados a partir das suas características.
B Os clientes poderão comprar ou não o novo produto lançado?
C Calcular a probabilidade de um cliente comprar o produto.
D Previsão da quantidade de produtos vendidos durante um determinado período.
A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar, 
seja o perfil do cliente ou do mercado. Com base no que foi visto no capítulo sobre coleta e extração 
de informações, vamos avaliar a seguinte questão.
 Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. 
“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais 
pessoas”. 
A Telemarketing.
B Face a face. 
C Questionário.
D Entrevista.
6
7
8
02/07/2022 11:09 Avaliação da Disciplina
about:blank 4/8
O automonitoramento do desempenho das relações interpessoais oportuniza o desenvolvimento de 
habilidades sociais significativas no campo metacognitivo e afetivo-comportamental.
 Nesse contexto, analise as sentenças que seguem sobre automonitoria: 
I – É a capacidade de compreender as suas próprias emoções, pensamentos e comportamentos.
II – As pessoas com essa habilidade têm maior probabilidade de sucesso em circunstâncias 
complexas.
III – As pessoas com essa habilidade apresentam autoestima e autoconfiança elevadas.
IV – As pessoas com essa habilidade possuem menor controle da impulsividade. 
Assinale a alternativa que apresenta a resposta correta:
A As sentenças I, II e IV estão corretas.
B As sentenças I, III e IV estão corretas.
C As sentenças I, II e III estão corretas.
D As sentenças I, II, III e IV estão corretas.
 O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Como podemos selecionar os pontos da semente do algoritmo KNN? Assinale a opção correta: 
A Somente pela definição do pesquisador.
B Definição pelo pesquisador ou Gerar pela própria amostra.
C O algoritmo gera de forma automática. 
D Não é necessário gerar pontos de semente.
 O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O 
algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que 
representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação.
 Quais as medidas de distânciasusadas pelo algoritmo KNN? Assinale o item correto:
A Distância Euclidiana e a Distância Manhattan.
B Distância Manhattan e Centroide.
C Somente Distância Manhattan.
D Somente Distância Euclidiana.
9
10
11
02/07/2022 11:09 Avaliação da Disciplina
about:blank 5/8
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor 
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos 
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção 
verdadeira:
 
A Ela é pouco usada devido à sua complexidade.
B Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados
de uma amostra.
C Ela pode ser formatada apenas como lista e tabela.
D Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de
uma amostra.
K-médias é um algoritmo não supervisionado, isto é, seus dados não possuem rótulos. O principal 
propósito é identificar as similaridades entre os dados e agrupá-los conforme o número de cluster. O 
algoritmo de k-médias é interativo e poderoso para dividir um conjunto de dados em grupos 
separados.
 Sobre as etapas dos processos de K-Means, marque V para verdadeiro e F para falso: 
( ) Inicialização: nesta etapa acontece a atribuição ao cluster e a movimentação de centroides é 
repetida até o cluster se tornar estático.
( ) Atribuição ao Cluster: Nesta etapa calcula-se a distância entre os pontos dos dados e cada um dos 
centroides.
( ) Movimentação de Centroides: nesta etapa é modificada a localização do centroide.
( ) Otimização: nesta etapa calcula-se a média dos valores dos pontos de dados de cada cluster, e o 
valor médio será o novo centroide.
 Marque a opção que contém a sequência correta:
A F - V - V - F.
B F - V - F - F.
C F - V - V - V.
D F - F - F - F.
Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor 
entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos 
para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento.
 Sobre o que aprendemos de gráficos, marque o item correto: 
A Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
em relação a outras medidas estatísticas.
B Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados.
12
13
14
02/07/2022 11:09 Avaliação da Disciplina
about:blank 6/8
C Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples,
porém, somente se usados junto com medidas estatísticas.
D Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares
precisos o suficiente para esta função.
O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, 
precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou 
previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, 
responda à próxima questão.
 Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado. 
A O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa
identificar padrões.
B O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível
agrupar os elementos de forma espontânea.
C O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data,
pois dessa forma é possível calcular as features. 
D O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa
identificar padrões.
Saber formular perguntas pode parecer simples, mas é uma habilidade complexa que exige 
discernimento e flexibilidade, conforme o conteúdo, a forma e a função da pergunta.
 Nesse contexto, quanto às formas de perguntas, associe os itens que seguem: I – Abertas.
II – Fechadas.III – Difusas.IV – Dirigidas. 
( ) São caracterizadas por garantirem a fonte de informação desejada.
( ) São caracterizadas por incentivarem indivíduos com habilidades verbais.
( ) São caracterizadas por produzirem maior quantidade de informações.
( ) São caracterizadas por suscitarem respostas objetivas e precisas. 
Assinale a alternativa que apresenta a sequência correta de respostas:
A IV – III – II – I.
B IV – III – I – II.
C III – II – IV – I.
D II – III – I – IV.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma 
variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre 
regressão, responda à próxima questão.
 
15
16
17
02/07/2022 11:09 Avaliação da Disciplina
about:blank 7/8
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número 
de casos de dengue aumenta com a chegada da quadra invernosa.
 Quem são nossas variáveis dependente e independente? Assinale a opção correta: 
A Y:Habitantes da cidade de São Paulo X: Quadra invernosa.
B Y: Quadra invernosa X: Casos de dengue.
C Y: Casos de dengue X: Quadra invernosa.
D Y: Casos de dengue X: Habitantes da cidade de São Paulo.
A competência para elogiar consiste em um elemento relevante para a obtenção e manutenção da 
qualidade das relações interpessoais. Essa competência pode ser compreendida como...
 Assinale a alternativa que completa corretamente a frase:
A Uma habilidade eficaz em decodificar, interpretar e responder determinadas mensagens.
B Uma habilidade essencial para controlar nossos desempenhos e dos indivíduos com quem
convivemos.
C Um conhecimento aprimorado sobre nossas emoções, pensamentos e comportamentos.
D Um comentário positivo direcionado ao indivíduo, sobre ele mesmo ou algo realizado por ele.
Pesquisas de mercado são frequentemente usadas para coletar os dados dos clientes, e informações do 
mercado. Com base no conceito visto sobre pesquisa de mercado, avalie a próxima questão.
 
Avalie o próximo trecho: “Este é um tipo de pesquisa que está focado nas avaliações subjetivas e tem 
o propósito de identificar as percepções humanas sobre produtos, serviços e empresas, a fim de 
apontar comportamentos e tendências.” De qual tipo de pesquisa o trecho se refere?
 Assinale a alternativa correta: 
A Pesquisas Contínuas.
B Pesquisas Discretas.
C Quantitativa.
D Qualitativa.
A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma 
variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre 
regressão, responda à próxima questão.
 Assinale a opção que contém a principal característica da técnica de regressão. 
18
19
20
02/07/2022 11:09 Avaliação da Disciplina
about:blank 8/8
A
O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e
somente uma variável independente (denotada por X).
B O propósito da regressão é agrupar indivíduos com as mesmas características.
C O propósito da regressão é minerar os dados de maneira descritiva.
D O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e
uma série de outras variáveis independentes (denotadas por X).
Imprimir

Continue navegando