Prévia do material em texto
Semana 6 – Introdução a ciências de dados PERGUNTA 1 1. Observe a figura a seguir: Indique a qual método de amostragem ela se refere. Holdout. Amostragem Aleatória. Validação Cruzada. Bootstrap. Amostragem. 1,3 pontos PERGUNTA 2 1. No mundo globalizado de intensa concorrência entre indivíduos e organizações, ferramentas voltadas ao agrupamento de ações que permitam vantagem competitiva são de extrema importância. Diante disso, data science se caracteriza como alicerce interessante, pois a predição de dados permite criar modelos de comportamentos e predizer ações futuras; logo, as indagações adiante podem ser mais bem estudadas pela análise de predição de dados. Qual marca o cliente pesquisou antes de comprar? O cliente visualizou que tipo de propaganda sobre os produtos avaliados? Quanto tempo levou para o cliente decidir pelo produto A ou B? Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir. I. ( ) Análise preditiva é a capacidade de prever resultados e gerar insights futuros alicerçados numa base de dados (passado e presente). II. ( ) As grandes organizações mundiais se utilizam substancialmente da análise preditiva de dados com o intuito de gerar soluções mais assertivas. III. ( ) A análise preditiva se utiliza de Machine Learning e modelagem estatística. Assinale a alternativa que apresenta a sequência CORRETA. a. F; F; V. b. F; V; V. c. V; V; F. d. V; F; F. e. V; V; V. 1,3 pontos PERGUNTA 3 1. A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor. Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN (K-Nearest Neighbors) o qual pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc. Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir. I. ( ) A biblioteca Scikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN. II. ( ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação. III. ( ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado de inteligência de máquina usado para situações/problemas organizacionais de classificação. Assinale a alternativa que apresenta a sequência CORRETA. a. V; V; F. b. V; V; V. c. F; V; V. d. V; F; F. e. F; F; V. 1,3 pontos PERGUNTA 4 1. Um método de avaliação bastante utilizado em aprendizado de máquina em que o conjunto de exemplos é dividido em r subconjuntos de tamanho aproximadamente igual. Os objetos de r – 1 partições são utilizados no treinamento de um preditor, o qual é então testado na partição restante. Esse processo é repetido r vezes, utilizando em cada ciclo uma partição diferente para teste. O desempenho final do preditor é dado pela média dos desempenhos observados sobre cada subconjunto de teste. Qual é esse método? MSE – Mean Squared Error (Erro Quadrático Médio). Amostragem aleatória. Validação Cruzada. Bootstrap. Holdout. 1,2 pontos PERGUNTA 5 1. Sempre que se fala em data science ou big data vem à tona o termo “predição”, ressaltando que ambos os contextos visam à tomada de decisão com confiabilidade por parte das organizações. Com base no exposto, assinale a alternativa voltada corretamente a predição de dados e tomada de decisão no big data alicerçadas por meio de fatos já ocorridos. a. Decisões essencialmente pautadas no que aconteceu. b. Decisões pautadas no que aconteceu e não necessariamente naquilo que pode acontecer. c. Decisões pautadas no que aconteceu e naquilo que pode acontecer. d. Decisões arbitrárias com base nos fatos já ocorridos. e. Decisões específicas com base nos fatos já ocorridos. 1,2 pontos PERGUNTA 6 1. Analise as informações a seguir sobre modelos, no contexto de ciência de dados. I. A visualização é parte fundamental e integrante de um modelo de Machine Learning. II. Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da compreensão sobre algo que está acontecendo. III. Um modelo é uma representação matemática de um objeto ou um processo. IV. Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas transações. De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas. Apenas as afirmações II e III. Apenas as afirmações I e IV. Apenas as afirmações II, III e IV. Apenas as afirmações III e IV. Apenas a afirmação II. 1,85 pontos PERGUNTA 7 1. Observe a imagem a seguir: Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre a imagem que é uma análise exploratória que seguirá para um algoritmo KNN. ( ) O gráfico apresentado é tridimensional. ( ) O ponto mais inferior no gráfico representa medidas de uma flor Versicolor. ( ) Petal Length (cm) é um dos atributos que representa uma dimensão do gráfico. ( ) Setosa é uma das classes disponíveis para classificação dos pontos plotados. A sequência correta de preenchimento dos parênteses, de cima para baixo, é: V, F, F, V V, V, F, F V, F, V, V F, V, F, V F, F, V, F image1.png image2.png