Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação da Disciplina Disciplina: Análise Estatística de Dados Nota: 10 1) O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente (Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes, elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias. Sobre o modelo logístico, coloque F para falso e V para verdadeiro, nas alternativas abaixo: ( ) Os parâmetros do modelo devem seguir normalidade. ( ) Ele é usado frequentemente para variáveis quantitativas. ( ) Podemos usá-lo no caso univariado. ( ) As variáveis do modelo devem ser dicotômicas. Assinale a opção que contém a sequência correta: A) F-F-V-V. B) V-F-F-F. C) F-F-F-F. D) F-F-F-V. 2) O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação. Sobre o KNN, marque V para verdadeiro e F para falso: ( ) Para estimar a classe a que o elemento K pertença, o algoritmo KNN calcula os K-vizinhos mais próximos a K . ( ) Na fase de classificação para um dado elemento de teste K, seus K-vizinhos mais próximos podem ser de uma mesma classe, e o algoritmo pode não conseguir decidir qual a classe a que esse elemento K pertença. ( ) Para encontrar a classe de um elemento que ainda não pertença a algum conjunto formado, o classificador KNN busca os K elementos do conjunto de treinamento que tenham a menor distância do elemento desconhecido. Marque a opção que contém a sequência correta: A) V-V-F. B) F-F-F. C) V-V-V. D) V-F-F. 3) Algoritmos de aprendizado de máquina não supervisionado inferem padrões de um conjunto de dados sem referência a resultados conhecidos ou rotulados (MONARD, 2003). Com base nos conceitos vistos no capítulo sobre algoritmos de aprendizado de máquina não supervisionado, responda à próxima questão. Quais os métodos a seguir são classificados como não supervisionados. Marque o item correto: A) Clustering, Anomaly detection, Association mining e Previsão. B) Clustering, Anomaly detection, Association mining e Classificação. C) Clustering, Anomaly detection, Classificação e Previsão. D) Clustering, Anomaly detection, Association mining e Latent variable models. 4) O aprendizado supervisionado tenta segmentar a população com base em rótulos conhecidos, isto é, precisa-se dizer ao algoritmo os resultados esperados para que ele possa fazer as classificações ou previsões de maneira correta. Com base nos conceitos iniciais da aprendizagem supervisionada, responda à próxima questão. Assinale a opção que aborda a característica correta sobre o aprendizado supervisionado. A) O aprendizado supervisionado precisa que os dados sejam rotulados para que se possa identificar padrões. B) O aprendizado supervisionado precisa que os dados sejam rotulados obrigatoriamente por data, pois dessa forma é possível calcular as features. C) O aprendizado supervisionado precisa que os dados sejam rotulados, para que possa ser possível agrupar os elementos de forma espontânea. D) O aprendizado supervisionado não precisa que os dados sejam rotulados para que se possa identificar padrões. 5) O KNN é um algoritmo supervisionado que tem por objetivo classificar objetos (WEBB, 2002). O algoritmo de Machine learning tem como propósito classificar o elemento e atribuir a ele o rótulo que representa a maior frequência dentre as k amostras mais próximas, através do esquema de votação. Como podemos utilizar o algoritmo KNN em negócios? Assinale a opção correta: A) Para analisar o perfil do cliente. B) Para calcular a probabilidade de vendas. C) Para encontrar as empresas mais semelhantes aos melhores clientes do negócio. D) Para estimar o total de vendas em um período. 6) Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento. Em relação ao que estudamos no capítulo sobre distribuição de frequência, marque a opção verdadeira: A) Ela é pouco usada devido à sua complexidade. B) Ela pode ser formatada apenas em tabela, a qual mostra a frequência de vários resultados de uma amostra. C) Ela pode ser formatada apenas como lista e tabela. D) Ela pode ser em formato de lista, tabela ou gráfico, mostrando a frequência de vários resultados de uma amostra. 7) O modelo logístico é uma técnica frequentemente usada para situações em que a variável dependente (Y) é de natureza dicotômica ou binária (PROVOST, 2013). Em relação às variáveis independentes, elas podem ser categóricas ou não. O modelo é um recurso que nos permite estimar a probabilidade associada à ocorrência de determinado evento em face de um conjunto de variáveis explanatórias. Em qual opção abaixo podemos aplicar um modelo logístico para resolver a problemática apresentada? Assinale a opção correta: A) Uma empresa que deseja calcular a probabilidade de um produto ser comprado. B) Uma empresa que deseja verificar se um produto vai ser comprado ou não pelo cliente. C) Uma empresa que deseja calcular a quantidade de produtos que serão comparados durante um determinado período. D) Uma empresa que deseja avaliar o perfil dos seus clientes. 8) A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima questão. No seguinte exemplo: Na cidade de São Paulo, a Secretaria de Saúde deseja investigar se o número de casos de dengue aumenta com a chegada da quadra invernosa. Quem são nossas variáveis dependente e independente? Assinale a opção correta: A) Y:Habitantes da cidade de São Paulo X: Quadra invernosa. B) Y: Casos de dengue X: Habitantes da cidade de São Paulo. C) Y: Casos de dengue X: Quadra invernosa. D) Y: Quadra invernosa X: Casos de dengue. 9) A técnica de regressão tenta estimar ou prever para cada indivíduo o valor numérico de alguma variável que pertença a ele (CHARNET, 1999). Com base nos conceitos vistos no capítulo sobre regressão, responda à próxima questão. Assinale a opção que contém a principal característica da técnica de regressão. A) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e uma série de outras variáveis independentes (denotadas por X). B) O propósito da regressão é encontrar a relação entre uma variável dependente (denotada por Y) e somente uma variável independente (denotada por X). C) O propósito da regressão é minerar os dados de maneira descritiva. D) O propósito da regressão é agrupar indivíduos com as mesmas características. 10) Os gráficos podem mostrar o desempenho do negócio em determinado período de tempo, evidenciando os pontos que precisam ser otimizados, e proporcionam aos setores da organização elaborar um planejamento eficiente, baseando-se em dados consistentes. Com base no que foi visto sobre gráficos, responda ao próximo questionamento. Para gerar os gráficos é preciso seguir alguns princípios. Assinale a opção que informa corretamente o que é necessário para construir um gráfico: A) O gráfico precisa ser claro e legível, mas não é necessário fornecer legenda e nota de rodapé. B) O gráfico precisa ser claro e legível, e fornecer uma legenda clara que descreva as informações contidas. O gráfico pode conter várias informações, como: Título e Nota de rodapé. C) O gráfico precisa ser claro e legível, porém, devido à sua simplicidade, não há necessidadede colocar título. D) O gráfico não precisa ser claro e legível, pois somente com a sua visualização podemos entender as informações. 11) À medida que o mercado se torna tecnológico, o fluxo de informações fica mais rápido, e avaliar essas informações é essencial. Por esse motivo, a análise de dados tem um papel cada vez mais importante nos negócios. Com base neste contexto, responda à seguinte questão. Assinale a alternativa que contém de forma correta os impactos que a análise de dados pode trazer para uma empresa. A) Com a aplicação da análise de dados, os custos de uma empresa podem aumentar, por conta do alto valor que precisa ser investido para gerar informações consolidadas. B) Baixa compreensão do mercado. C) Devido à complexidade do fluxo de informações, a análise de dados pode se tornar pouco eficiente. D) Melhorar a eficiência da tomada de decisão da empresa. 12) As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Dentre as medidas de posição, temos a moda como o elemento que acontece com maior frequência em um conjunto de dados. Foram pesadas algumas crianças com idade entre 6 e 12 anos, para medir os seus níveis de nutrição. Os dados da pesagem foram: 29,34,56,23,29,24,27,28,32,34,33,36,47,28,29,25,26 Avalie os itens abaixo e marque a opção que contém a moda e a mediana do conjunto: A) Mediana = 29 e Moda = 28. B) Mediana = 29 e Moda = 29. C) Mediana = 27 e Moda = 29. D) Mediana = 28 e Moda = 27. 13) As medidas de posição determinam a localização que um determinado valor possui dentro de um determinado conjunto, são as medidas estatísticas que dão uma ideia condensada de todo o conjunto de dados. Podemos definir a mediana como uma medida de posição que ocupa a posição central de um conjunto de dados. Ela é o valor que divide um conjunto de dados (ordenados) em dois subconjuntos de mesmo número de elementos. Considere a amostra das idades dos alunos de pós-graduação do curso de Ciências de Dados. 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28 Avalie os itens abaixo e marque a opção que contém a mediana do conjunto: A) 29. B) 26. C) 28. D) 27. 14) A partir da coleta de dados, podemos extrair as informações sobre o fenômeno que desejamos avaliar, seja o perfil do cliente ou do mercado. Com base no que foi visto no capítulo sobre coleta e extração de informações, vamos avaliar a seguinte questão. Assinale a alternativa que indica corretamente o tipo de coleta de dados citado no trecho abaixo. “Esse tipo de coleta consiste em uma conversação para obter informações envolvendo duas ou mais pessoas”. A) Entrevista. B) Telemarketing. C) Questionário. D) Face a face. 15) O planejamento deve ser realizado seguindo uma sequência de passos. O primeiro passo é a definição dos objetivos, ou seja, onde se deseja chegar. Em paralelo, deve-se analisar a situação atual, verificando onde se está e o que precisa ser feito para atingir o objetivo. A etapa que ocorre paralelamente à definição dos objetivos, chama-se... Assinale a alternativa que completa corretamente a frase: A) Ameaças. B) Oportunidades. C) Estratégia. D) Diagnóstico. 16) O planejamento é uma das funções básicas da administração de qualquer organização e pessoa, seja no ramo empresarial, educacional ou pessoal, sendo uma ferramenta que possibilita prever problemas e reduzir os impactos que eles trarão. Nesse sentido, podemos afirmar que o planejamento permite que... Assinale a alternativa que completa corretamente a frase: A) Sejam organizados os recursos que serão utilizados, identificando pessoas para atribuir tarefas e funções. B) Sejam corrigidas imperfeições nos processos de trabalho, adequando o ambiente interno. C) Sejam analisados os caminhos e suas chances de sucesso, rumo ao alcance dos objetivos. D) Sejam definidas as ações a serem seguidas, analisando o que é mais adequado de acordo com os objetivos. 17) Depois de coletar os dados é conveniente organizá-los de forma simples e clara, para melhor entendimento das informações. Os dados podem ser organizados em formas de tabelas ou gráficos para facilitar sua visualização e interpretação. Com base neste contexto, responda ao questionamento. Sobre o que aprendemos de gráficos, marque o item correto: A) Gráficos não podem identificar padrões devido à sua simplicidade para analisar dados. B) Os gráficos não são confiáveis para fazer análises dos dados, pois não existem softwares precisos o suficiente para esta função. C) Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, em relação a outras medidas estatísticas. D) Gráficos identificam padrões, resultados e comparam medidas de forma mais rápida e simples, porém, somente se usados junto com medidas estatísticas. 18) Pesquisas de mercado são frequentemente usadas para coletar os dados dos clientes, e informações do mercado. Com base no conceito visto sobre pesquisa de mercado, avalie a próxima questão. Avalie o próximo trecho: “Este é um tipo de pesquisa que está focado nas avaliações subjetivas e tem o propósito de identificar as percepções humanas sobre produtos, serviços e empresas, a fim de apontar comportamentos e tendências.” De qual tipo de pesquisa o trecho se refere? Assinale a alternativa correta: A) Pesquisas Discretas. B) Pesquisas Contínuas. C) Qualitativa. D) Quantitativa. 19) Tanto as empresas como as famílias podem elaborar um planejamento para que as metas estabelecidas sejam alcançadas. No planejamento, são estabelecidas ações baseadas em estudos dos ambientes interno e externo. Sobre o planejamento e suas características, analise as sentenças que seguem: I – O planejamento deve ser um processo rígido, no qual as ações não podem ser alteradas. II – O planejamento é um processo dinâmico, pois novos objetivos podem ser inseridos. III – O planejamento deve ser fundamentado em aspectos emocionais e informações concretas. IV – O planejamento tem como objetivo melhorar o desempenho e antecipar situações. Assinale a alternativa que apresenta a resposta correta: A) As sentenças II e III, estão corretas. B) As sentenças II e IV, estão corretas. C) As sentenças I e III, estão corretas. D) As sentenças I e IV, estão corretas. 20) Para garantir o sucesso de um planejamento, ele deve seguir uma sequência de ações que são ordenadas de modo a analisar o presente e o futuro, sempre tendo como ponto final nossos objetivos. Sobre o planejamento, assinale a alternativa correta: A) Depois de elaborado, o plano de ação deve ser implantado, avaliado e adotadas medidas de correção sempre que necessário. B) O plano de ação deve considerar apenas o cenário futuro, realizando previsões baseadas na emoção e na razão. C) Não podemos definir um plano de ação como o mais adequado, pois os cenários estão em constante mudança. D) Uma vez definido, o plano de ação deve ser implantado e, caso julgado incoerente, deve ser refeito.
Compartilhar