Buscar

ATIVIDADE ICD SEMANA 3_2

Prévia do material em texto

A TIVIDAD E ICD S EMANA 3 – TENTAT IVA 2 
 
PERGUNTA 1 
 
1. Assinale com V (verdadeiro) ou F (falso) as afirmações a seguir sobre a atividade de Web Scraping em 
Ciência de Dados: 
( ) – O processo de Web Scraping pode ser realizado por consumo de dados via API (Interface de 
Programação de Aplicações). 
( ) – As bibliotecas BeautifulSoup e Selenium são duas bibliotecas para realizar atividades de Web 
Scraping. 
( ) – A biblioteca BeautifulSoup constrói uma árvore a partir de vários elementos de uma página. 
( ) – Ao usar o comando soup.find_all('a'), é possível recuperar todos os parágrafos html que estão no 
objeto soup. 
 
A sequência correta de preenchimento dos parênteses, de cima para baixo, é: 
 
F, F, V, V. 
 
V, V, F, V. 
 
V, F, V, V. 
 
V, F, V, F. 
 
F, V, V, F. 
1,7 pontos 
PERGUNTA 2 
 
1. Conceitualmente, as bibliotecas voltadas para a linguagem Python podem ser interpretadas como 
um conjunto de módulos e funções extremamente importantes visando a redução da codificação no 
programa em questão, permitindo, assim, a tratativa de dados Python. A grosso modo, atualmente, 
existem mais de 137 mil bibliotecas vinculadas à linguagem Python para os propósitos diversos da 
Ciência de Dados, sejam diretos ou indiretos. 
 
Com base nas informações apresentadas, identifique se são verdadeiras (V) ou falsas (F) as 
afirmativas a seguir. 
 
I. A biblioteca Scikit-Learn possui diversos algoritmos de modelos de classificação, modelos de 
regressão e vários modelos de agrupamento, sendo encarada, fundamentalmente, como uma 
biblioteca de aprendizado de máquina. 
 
II. A biblioteca Seaborn oferece uma biblioteca de alto grau para a plotagem de gráficos interessantes 
de cunho estatístico. 
 
III. A biblioteca Matplotlib possui como extensão a biblioteca Numpy, sendo dedicada para a plotagem 
de diversos gráficos. 
 
Assinale a alternativa que apresenta a sequência correta. 
a. F - V - F. 
 
b. F - F - F. 
 
c. V - V - F. 
 
d. V - V - V. 
 
e. V - F - F. 
 
 
1,7 pontos 
PERGUNTA 3 
 
1. É sabido que a gestão estratégica das empresas não permite o achismo no contexto da tomada de 
decisão, já que tal processo é muito complexo. Além disso, hoje existe um __________________ 
cada vez mais denso de ___________________ que ajudam os gestores decisores no processo de 
tomada de decisão, já que permite uma tomada de decisão mais assertiva e confiável. Nesse 
contexto, surge o ___________________ que se traduz como uma técnica utilizada para impulsionar 
________________________ em todos os níveis empresariais, sendo encarado como um tipo de 
_____________________ em sites ______________________________. 
 
Preencha as lacunas escolhendo a alternativa correta. 
 
 
a. O volume é o maior nível, informações, Web Scraping, negócios, garimpo de dados, peculiares. 
 
b. O volume é o menor nível, informações, Seaborn, negócios, garimpo de dados, peculiares. 
 
c. O volume é o menor nível, informações, Numpy, negócios, garimpo de dados, peculiares. 
 
d. O volume é o menor nível, informações, Web Scraping, negócios, garimpo de dados, peculiares. 
 
e. O volume é o maior nível, informações, Web Scraping, planos, garimpo de dados, peculiares. 
1,7 pontos 
PERGUNTA 4 
 
1. A busca por informações gerenciais sempre foi de grande valia para as organizações e/ou 
empresas para que possam aumentar o seu leque competitivo de mercado. No mundo globalizado 
isso se faz extremamente necessário, assim, a busca por uma quantidade exponencial de 
informações relevantes é um aparato para a criação de estratégias organizacionais. 
 
Nesse sentido, a importância da utilização do Web Scraping deve-se pela: 
 
a. busca de um número exponencial de informações de forma mais rápida e dinâmica, a fim de treinar e 
aprimorar algoritmos de aprendizagem de máquina. 
 
b. busca de um número finito de informações de forma simples, a fim de treinar e aprimorar algoritmos de 
aprendizagem de máquina. 
 
c. criação de um número exponencial de informações de forma simples, a fim de treinar e aprimorar 
algoritmos de aprendizagem de máquina. 
 
d. busca de um número infinito de informações de forma mais rápida e dinâmica, a fim de treinar e aprimorar 
algoritmos de aprendizagem de máquina. 
 
e. busca de um número limitado e restrito de informações de forma mais rápida e dinâmica, a fim de treinar e 
aprimorar algoritmos de aprendizagem de máquina. 
1,15 pontos 
PERGUNTA 5 
 
1. A funcionalidade dos Web Scrapers, no contexto da Ciência de Dados, é de fundamental 
importância para a busca eficiente de dados. Assim, eles podem buscar todos os dados de sites 
peculiares e até mesmo os dados específicos que o pesquisador-usuário desejar. 
Nesse sentido, com base na tipologia dos Web Scrapers, o número de critérios que os classifica é: 
 
a. 5. 
 
b. 3. 
 
c. 2. 
 d. 1. 
 
e. 4. 
 
1,15 pontos 
PERGUNTA 6 
 
1. Dada a imagem a seguir, que representa um dataframe Pandas nomeado df: 
 
 
 
Após ser executado o comando df2=df[df['QtdeFunc']>1000], analise as afirmações a seguir: 
 
I. Serão listadas as linhas de df que tem o atributo QtdeFunc com mais de 1000. 
II. Será criado um dataframe df2, que conterá 2 linhas. 
III. Será criado um dataframe df2, que conterá 3 linhas. 
IV. Será criado um dataframe df2, que será uma réplica exata do dataframe df. 
V. A linha indexada como 6 no dataframe df, também fará parte do dataframe df2, que será criado. 
 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
Apenas as afirmações I, II e IV estão corretas. 
 
Apenas as afirmações I, IV e V estão corretas. 
 
Apenas as afirmações II e V estão corretas. 
 
Apenas as afirmações III, IV e V estão corretas. 
 
Apenas a afirmação I é correta. 
1,3 pontos 
PERGUNTA 7 
 
1. Scikit-Learn é uma biblioteca de aprendizado de máquina para linguagem Python. Sobre a biblioteca Scikit-
Learn, veja as afirmações a seguir: 
 
I. A biblioteca Scikit-Learn é uma biblioteca open source (de código aberto). 
II. Scikit-Learn é uma biblioteca exclusiva para algoritmos de aprendizado de máquina supervisionado e 
aprendizado de máquina não supervisionado. 
III. A biblioteca Scikit-Learn, além de algoritmos, também disponibiliza datasets para serem utilizados 
em estudos e treinamentos de aprendizado de máquina. 
IV. A biblioteca NumPy é uma das bibliotecas básicas utilizadas para a construção da biblioteca Scikit-
Learn. 
 
De acordo com as afirmações apresentadas, indique qual alternativa é a correta: 
 
 
Apenas a afirmação IV está correta. 
 
Apenas as afirmações II, III e IV estão corretas. 
 
Apenas as afirmações I e II estão corretas. 
 
Apenas as afirmações I, III e IV estão corretas. 
 
Apenas as afirmações I e III estão corretas.