Buscar

Introdução a ciencias de dados Semana 6

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Semana 6 – Introdução a ciências de dados
PERGUNTA 1
1. Observe a figura a seguir:
Indique a qual método de amostragem ela se refere.
 
	
	
	Holdout.
	
	
	Amostragem Aleatória.
	
	
	Validação Cruzada.
	
	
	Bootstrap.
	
	
	Amostragem.
1,3 pontos   
PERGUNTA 2
1. No mundo globalizado de intensa concorrência entre indivíduos e organizações, ferramentas voltadas ao agrupamento de ações que permitam vantagem competitiva são de extrema importância. Diante disso, data science se caracteriza como alicerce interessante, pois a predição de dados permite criar modelos de comportamentos e predizer ações futuras; logo, as indagações adiante podem ser mais bem estudadas pela análise de predição de dados. Qual marca o cliente pesquisou antes de comprar? O cliente visualizou que tipo de propaganda sobre os produtos avaliados? Quanto tempo levou para o cliente decidir pelo produto A ou B?
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir.
I. (  ) Análise preditiva é a capacidade de prever resultados e gerar insights futuros alicerçados numa base de dados (passado e presente).
II. (  ) As grandes organizações mundiais se utilizam substancialmente da análise preditiva de dados com o intuito de gerar soluções mais assertivas.
III. (  ) A análise preditiva se utiliza de Machine Learning e modelagem estatística.
Assinale a alternativa que apresenta a sequência CORRETA.
	
	a.
	F; F; V.
	
	b.
	F; V; V.
	
	c.
	V; V; F.
	
	d.
	V; F; F.
	
	e.
	V; V; V.
1,3 pontos   
PERGUNTA 3
1. A utilização de algoritmos por parte da ciência de dados é de fundamental importância para diversos estudos envolvendo dados a fim de criar padrões ou modelagens de comportamentos ou para estimar ações futuras. Para organizações como um todo, qualquer tipo de vantagem competitiva faz com que as mesmas estejam à frente das demais, ou seja, saber mais, um pouco antes, sempre é melhor. Para a análise preditiva de dados, temos algoritmos próprios utilizados, dentre eles o algoritmo KNN (K-Nearest Neighbors) o qual pode ser utilizado para vários contextos da gestão de negócios, seja para classificação ou regressão etc. 
Com base nas informações apresentadas, identifique se são (V) verdadeiras ou (F) falsas as afirmativas a seguir.
I. (   ) A biblioteca Scikit-Learn propicia um leque extenso de aplicações envolvendo o algoritmo KNN.
II. (   ) No âmbito da ciência de dados, o algoritmo KNN é conhecido por “K-vizinhos mais próximos” e apresenta fácil implementação.
III. (  ) Essencialmente falando, o algoritmo KNN se traduz como um algoritmo supervisionado de inteligência de máquina usado para situações/problemas organizacionais de classificação.
Assinale a alternativa que apresenta a sequência CORRETA.
	
	a.
	V; V; F.
	
	b.
	V; V; V.
	
	c.
	F; V; V.
	
	d.
	V; F; F.
	
	e.
	F; F; V.
1,3 pontos   
PERGUNTA 4
1. Um método de avaliação bastante utilizado em aprendizado de máquina em que o conjunto de exemplos é dividido em r subconjuntos de tamanho aproximadamente igual. Os objetos de r – 1 partições são utilizados no treinamento de um preditor, o qual é então testado na partição restante. Esse processo é repetido r vezes, utilizando em cada ciclo uma partição diferente para teste. O desempenho final do preditor é dado pela média dos desempenhos observados sobre cada subconjunto de teste. Qual é esse método?
	
	
	MSE – Mean Squared Error (Erro Quadrático Médio).
	
	
	Amostragem aleatória.
	
	
	Validação Cruzada.
	
	
	Bootstrap.
	
	
	Holdout.
1,2 pontos   
PERGUNTA 5
1. Sempre que se fala em data science ou big data vem à tona o termo “predição”, ressaltando que ambos os contextos visam à tomada de decisão com confiabilidade por parte das organizações.
Com base no exposto, assinale a alternativa voltada corretamente a predição de dados e tomada de decisão no big data alicerçadas por meio de fatos já ocorridos.
	
	a.
	Decisões essencialmente pautadas no que aconteceu.
	
	b.
	Decisões pautadas no que aconteceu e não necessariamente naquilo que pode acontecer.
	
	c.
	Decisões pautadas no que aconteceu e naquilo que pode acontecer. 
	
	d.
	Decisões arbitrárias com base nos fatos já ocorridos.
	
	e.
	Decisões específicas com base nos fatos já ocorridos.
1,2 pontos   
PERGUNTA 6
1. Analise as informações a seguir sobre modelos, no contexto de ciência de dados.
I. A visualização é parte fundamental e integrante de um modelo de Machine Learning.
II. Modelos são construídos para simular um fenômeno do mundo real como um passo investigativo, em busca da compreensão sobre algo que está acontecendo.
III. Um modelo é uma representação matemática de um objeto ou um processo.
IV. Um modelo pode nascer da análise de transações históricas, na busca por um padrão consistente nessas transações.
De acordo com as afirmações apresentadas, indique qual alternativa traz todas as afirmativas corretas.
	
	
	Apenas as afirmações II e III.
	
	
	Apenas as afirmações I e IV.
	
	
	Apenas as afirmações II, III e IV.
	
	
	Apenas as afirmações III e IV.
	
	
	Apenas a afirmação II.
1,85 pontos   
PERGUNTA 7
1. Observe a imagem a seguir:
Considere como verdadeiras (V) ou falsas (F) as afirmações a seguir sobre a imagem que é uma análise exploratória que seguirá para um algoritmo KNN.
(  ) O gráfico apresentado é tridimensional.
(  ) O ponto mais inferior no gráfico representa medidas de uma flor Versicolor.
(  ) Petal Length (cm) é um dos atributos que representa uma dimensão do gráfico.
(  ) Setosa é uma das classes disponíveis para classificação dos pontos plotados.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é:
 
	
	
	V, F, F, V
	
	
	V, V, F, F
	
	
	V, F, V, V
	
	
	F, V, F, V
	
	
	F, F, V, F
image1.png
image2.png

Mais conteúdos dessa disciplina