Buscar

Análise Estatística de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Avaliação da Disciplina 
Disciplina: Análise Estatística de Dados 
Nota: 10 
 
1) O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente (Y) é de 
natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes, elas podem ser 
categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade associada à ocorrência de 
determinado evento em face de um conjunto de variáveis explanatórias. 
 
Sobre o modelo logístico, coloque F para falso e V para verdadeiro, nas alternativas abaixo: 
( ) Os parâmetros do modelo devem seguir normalidade. 
( ) Ele é usado frequentemente para variáveis quantitativas. 
( ) Podemos usá-lo no caso univariado. 
( ) As variáveis do modelo devem ser dicotômicas. 
 
Assinale a opção que contém a sequência correta: 
A) F-F-V-V. 
B) V-F-F-F. 
C) F-F-F-F. 
D) F-F-F-V. 
 
2) O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de 
Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior 
frequência dentre as k amostras mais próximas, através do esquema de votação. 
 
Sobre o KNN, marque V para verdadeiro e F para falso: 
( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K . 
( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma 
mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença. 
( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN 
busca os K elementos do conjunto de treinamento que tenham a menor distância do elemento desconhecido. 
 
Marque a opção que contém a sequência correta: 
A) V-V-F. 
B) F-F-F. 
C) V-V-V. 
D) V-F-F. 
 
3) Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados sem 
referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos vistos no capítulo 
sobre algoritmos de aprendizado de máquina não supervisionado, responda à próxima questão. 
 
Quais os métodos a seguir são classificados como não supervisionados. Marque o item correto: 
A) Clustering, Anomaly detection, Association mining e Previsão. 
B) Clustering, Anomaly detection, Association mining e Classificação. 
C) Clustering, Anomaly detection, Classificação e Previsão. 
D) Clustering, Anomaly detection, Association mining e Latent variable models. 
 
4) O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se 
dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou previsões de maneira 
correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à próxima questão. 
 
Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado. 
A) O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões. 
B) O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma 
é possível calcular as features. 
C) O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os 
elementos de forma espontânea. 
D) O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões. 
 
5) O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de 
Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior 
frequência dentre as k amostras mais próximas, através do esquema de votação. 
 
Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta: 
A) Para analisar o perfil do cliente. 
B) Para calcular a probabilidade de vendas. 
C) Para encontrar as empresas mais semelhantes aos melhores clientes do negócio. 
D) Para estimar o total de vendas em um período. 
 
6) Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das 
informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização e 
interpretação. Com base neste contexto, responda ao questionamento. 
 
Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira: 
A) Ela é pouco usada devido à sua complexidade. 
B) Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra. 
C) Ela pode ser formatada apenas como lista e tabela. 
D) Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra. 
 
7) O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente (Y) é de 
natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes, elas podem ser 
categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade associada à ocorrência de 
determinado evento em face de um conjunto de variáveis explanatórias. 
 
Em qual opção abaixo podemos aplicar um modelo logístico para resolver a problemática apresentada? Assinale a 
opção correta: 
A) Uma empresa que deseja calcular a probabilidade de um produto ser comprado. 
B) Uma empresa que deseja verificar se um produto vai ser comprado ou não pelo cliente. 
C) Uma empresa que deseja calcular a quantidade de produtos que serão comparados durante um determinado 
período. 
D) Uma empresa que deseja avaliar o perfil dos seus clientes. 
 
8) A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que 
pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima 
questão. 
 
No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de 
dengue aumenta com a chegada da quadra invernosa. 
 
Quem são nossas variáveis dependente e independente? Assinale a opção correta: 
A) Y:Habitantes da cidade de São Paulo X: Quadra invernosa. 
B) Y: Casos de dengue X: Habitantes da cidade de São Paulo. 
C) Y: Casos de dengue X: Quadra invernosa. 
D) Y: Quadra invernosa X: Casos de dengue. 
 
9) A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que 
pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima 
questão. 
 
Assinale a opção que contém a principal característica da técnica de regressão. 
A) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de 
outras variáveis independentes (denotadas por X). 
B) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma 
variável independente (denotada por X). 
C) O propósito da regressão é minerar os dados de maneira descritiva. 
D) O propósito da regressão é agrupar indivíduos com as mesmas características. 
 
10) Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os 
pontos que precisam ser otimizados, e proporcionam aos setores da organização elaborar um planejamento 
eficiente, baseando-se em dados consistentes. 
 
Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os gráficos é preciso 
seguir alguns princípios. 
 
Assinale a opção que informa corretamente o que é necessário para construir um gráfico: 
A) O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé. 
B) O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O gráfico 
pode conter várias informações, como: Título e Nota de rodapé. 
C) O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidadede colocar título. 
D) O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações. 
 
11) À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar essas 
informações é essencial. Por esse motivo, a análise de dados tem um papel cada vez mais importante nos 
negócios. Com base neste contexto, responda à seguinte questão. 
 
Assinale a alternativa que contém de forma correta os impactos que a análise de dados pode trazer para uma 
empresa. 
A) Com a aplicação da análise de dados, os custos de uma empresa podem aumentar, por conta do alto valor que 
precisa ser investido para gerar informações consolidadas. 
B) Baixa compreensão do mercado. 
C) Devido à complexidade do fluxo de informações, a análise de dados pode se tornar pouco eficiente. 
D) Melhorar a eficiência da tomada de decisão da empresa. 
 
12) As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado 
conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Dentre as 
medidas de posição, temos a moda como o elemento que acontece com maior frequência em um conjunto de 
dados. 
 
Foram pesadas algumas crianças com idade entre 6 e 12 anos, para medir os seus níveis de nutrição. 
Os dados da pesagem foram: 29,34,56,23,29,24,27,28,32,34,33,36,47,28,29,25,26 
 
Avalie os itens abaixo e marque a opção que contém a moda e a mediana do conjunto: 
A) Mediana = 29 e Moda = 28. 
B) Mediana = 29 e Moda = 29. 
C) Mediana = 27 e Moda = 29. 
D) Mediana = 28 e Moda = 27. 
 
13) As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado 
conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Podemos 
definir a mediana como uma medida de posição que ocupa a posição central de um conjunto de dados. Ela é o 
valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. 
Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados. 
29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 
28, 34, 29, 23, 28 
 
Avalie os itens abaixo e marque a opção que contém a mediana do conjunto: 
A) 29. 
B) 26. 
C) 28. 
D) 27. 
 
14) A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar, seja o 
perfil do cliente ou do mercado. Com base no que foi visto no capítulo sobre coleta e extração de informações, 
vamos avaliar a seguinte questão. 
 
Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. 
“Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas”. 
A) Entrevista. 
B) Telemarketing. 
C) Questionário. 
D) Face a face. 
 
15) O planejamento deve ser realizado seguindo uma sequência de passos. O primeiro passo é a definição dos 
objetivos, ou seja, onde se deseja chegar. Em paralelo, deve-se analisar a situação atual, verificando onde se está 
e o que precisa ser feito para atingir o objetivo. A etapa que ocorre paralelamente à definição dos objetivos, 
chama-se... 
 
Assinale a alternativa que completa corretamente a frase: 
A) Ameaças. 
B) Oportunidades. 
C) Estratégia. 
D) Diagnóstico. 
 
16) O planejamento é uma das funções básicas da administração de qualquer organização e pessoa, seja no ramo 
empresarial, educacional ou pessoal, sendo uma ferramenta que possibilita prever problemas e reduzir os 
impactos que eles trarão. Nesse sentido, podemos afirmar que o planejamento permite que... 
 
Assinale a alternativa que completa corretamente a frase: 
A) Sejam organizados os recursos que serão utilizados, identificando pessoas para atribuir tarefas e funções. 
B) Sejam corrigidas imperfeições nos processos de trabalho, adequando o ambiente interno. 
C) Sejam analisados os caminhos e suas chances de sucesso, rumo ao alcance dos objetivos. 
D) Sejam definidas as ações a serem seguidas, analisando o que é mais adequado de acordo com os objetivos. 
 
17) Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento 
das informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização 
e interpretação. Com base neste contexto, responda ao questionamento. 
 
Sobre o que aprendemos de gráficos, marque o item correto: 
A) Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados. 
B) Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos o suficiente para 
esta função. 
C) Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a 
outras medidas estatísticas. 
D) Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, porém, somente 
se usados junto com medidas estatísticas. 
 
18) Pesquisas de mercado são frequentemente usadas para coletar os dados dos clientes, e informações do 
mercado. Com base no conceito visto sobre pesquisa de mercado, avalie a próxima questão. 
 
Avalie o próximo trecho: “Este é um tipo de pesquisa que está focado nas avaliações subjetivas e tem o propósito de 
identificar as percepções humanas sobre produtos, serviços e empresas, a fim de apontar comportamentos e 
tendências.” De qual tipo de pesquisa o trecho se refere? 
 
Assinale a alternativa correta: 
A) Pesquisas Discretas. 
B) Pesquisas Contínuas. 
C) Qualitativa. 
D) Quantitativa. 
 
19) Tanto as empresas como as famílias podem elaborar um planejamento para que as metas estabelecidas sejam 
alcançadas. No planejamento, são estabelecidas ações baseadas em estudos dos ambientes interno e externo. 
Sobre o planejamento e suas características, analise as sentenças que seguem: 
I – O planejamento deve ser um processo rígido, no qual as ações não podem ser alteradas. 
II – O planejamento é um processo dinâmico, pois novos objetivos podem ser inseridos. 
III – O planejamento deve ser fundamentado em aspectos emocionais e informações concretas. 
IV – O planejamento tem como objetivo melhorar o desempenho e antecipar situações. 
 
Assinale a alternativa que apresenta a resposta correta: 
A) As sentenças II e III, estão corretas. 
B) As sentenças II e IV, estão corretas. 
C) As sentenças I e III, estão corretas. 
D) As sentenças I e IV, estão corretas. 
 
20) Para garantir o sucesso de um planejamento, ele deve seguir uma sequência de ações que são ordenadas de 
modo a analisar o presente e o futuro, sempre tendo como ponto final nossos objetivos. 
 
Sobre o planejamento, assinale a alternativa correta: 
A) Depois de elaborado, o plano de ação deve ser implantado, avaliado e adotadas medidas de correção sempre que 
necessário. 
B) O plano de ação deve considerar apenas o cenário futuro, realizando previsões baseadas na emoção e na razão. 
C) Não podemos definir um plano de ação como o mais adequado, pois os cenários estão em constante mudança. 
D) Uma vez definido, o plano de ação deve ser implantado e, caso julgado incoerente, deve ser refeito.

Continue navegando