Logo Passei Direto
Buscar

Frameworks para Big Data - Prova

Ferramentas de estudo

Questões resolvidas

O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics.
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características.
I) Análise Descritiva
II) Análise Preditiva
III) Análise Prescritiva
IV) Análise Diagnóstica
( ) busca responder perguntas de porque algo aconteceu.
( ) diferente das demais, busca projeções futuras.
( ) se baseia nas predições evitar problemas antes de acontecerem.
( ) é uma análise do estado atual de uma instituição ou empresa.
III, I, IV, II.
IV, II, III, I.
II, IV, I, IV.
III, II, IV, I.
I, III, II, IV.

A análise em grandes conjuntos de dados tem sido essencial para as funções de várias equipes de analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, como aplicativos de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva e prescritiva.
Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais utilizadas para atender grandes empresas são:
HDFS e CBS.
DDL e DML.
Sql e Digg.
Hive e Hadoop.
MapReduce e Hi5.

O projeto Spark é utilizado em diversas aplicações, mas tem sido muito utilizado em Data Science. Ele contém diversos componentes integrados que agenda, distribuem e monitoram aplicações. O projeto Spark é composto por diversas ferramentas, como o Spark Framework, Spark Core, e outros.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Spark oferece consegue integrar ferramentas como Hadoop MapReduce e Streaming.
II. É uma solução perfeita para a computação de dados no mundo do Big Data.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições falsas.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.

O Hive possui um linguagem própria para consulta, chamada de HQL ou HiveQL. Esta linguagem possui características semelhantes a linguagem SQL. Além desta linguagem, ainda possui outra, uma linguagem procedural, chamada HPL (Hive Procedural Language).
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. No exemplo é utilizado um exemplo em linguagem HQL com a presença de comandos select e show tables.
II. Possui a característica de comandos semelhantes ao da linguagem SQL.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.

Para trabalhar com Spark, é necessário escolher uma linguagem de programação que tenha suporte para a ferramenta. Atualmente, as linguagens que dão suporte para ela são Java, Scala, R e Python.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O exemplo mostra a importação de bibliotecas com suas respectivas classes e métodos a serem utilizados.
II. São importados funções que retornam a data, hora e minuto, sendo concatenado em uma variável.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.

O Hadoop é um framework que pode ser utilizado em diversas linguagens, como, por exemplo, Java e Python. No framework há ferramentas importantes, podemos citar o MapReduce, que contém um mapeador e uma redutor. Um exemplo muito utilizado para expor o funcionamento do MapReduce é por meio de um contador de palavras.
A respeito deste exemplo do contador de palavras, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
1. ( ) É utilizado o stdin e stdout para ler e gravar dados.
2. ( ) O redutor gera palavra como chave e número de contagens como valor.
3. ( ) A função Mapper divide chave-valores em palavras complexas.
4. ( ) O redutor recebe linhas de entrada e conta o número de instâncias.
F, F, F, F.
V, V, V, V.
F, V, F, V.
V, V, F, F.
V, V, F, V.

O Hadoop é ideal para trabalhos que possuem grande número de dados, e isso acontece devido a ele possuir características como disponibilidade, durabilidade e disponibilidade. Ele, ainda, é composto de módulos que carregam tarefas essenciais de análise de dados.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Hadoop armazena e processa dados estruturados, semi e não estruturados sem requisitos de formato.
II. O Hadoop é ideal para a construção de lagos de dados, para apoiar iniciativas de análise de Big Data.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
A asserção I é uma proposição verdadeira, e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.

O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande volumes de dados em ambientes com a característica de ser distribuído.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop.
II. Possui a característica de facilitar a junção de dados para a análise.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições falsas.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.

O Hadoop Streaming possui duas fases, o mapeador e o redutor. Uma tarefa importante realizada é o teste do código para confirmação de funcionamento do mesmo. Esta é uma tarefa que não é muito complicada, mas exige que seja feita conforme a determinação de algumas etapas.
Sobre o MapReduce, podemos afirmar corretamente que as etapas são:
Função Stdin e Função Stdout.
Código do Mapeador e Código do Redutor.
Job Stdin e Job Stdout.
Cluster Hadoop e Script Hadoop.
API Streaming Map e API Streaming Std.

O Hadoop pertence ao Apache e possibilita realizar o processamento de grandes volumes de dados se utilizando de uma característica importante, a programação simples. No processamento e análise dos dados, temos ferramentas como o MapReduce, que pode ser aplicado em diversas linguagens, como o Python.
Considerando o trecho apresentado e conceitos relacionados à linguagem Python, analise as afirmativas a seguir:
1. Python é uma linguagem de programação orientada a objetos, open-source, e, atualmente, bastante popular.
2. A linguagem foi lançada em 1994, no entanto, ela se tornou popular somente a partir de 2016.
3. É uma linguagem closed source, ou seja, código fechado, não podendo ser alterada.
4. É muito utilizada na linguagem de programação web para a análise de ciência de dados.
II e III, apenas.
I, II e IV, apenas.
III e IV, apenas.
I, II e III, apenas.
I e IV, apenas.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics.
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características.
I) Análise Descritiva
II) Análise Preditiva
III) Análise Prescritiva
IV) Análise Diagnóstica
( ) busca responder perguntas de porque algo aconteceu.
( ) diferente das demais, busca projeções futuras.
( ) se baseia nas predições evitar problemas antes de acontecerem.
( ) é uma análise do estado atual de uma instituição ou empresa.
III, I, IV, II.
IV, II, III, I.
II, IV, I, IV.
III, II, IV, I.
I, III, II, IV.

A análise em grandes conjuntos de dados tem sido essencial para as funções de várias equipes de analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, como aplicativos de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva e prescritiva.
Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais utilizadas para atender grandes empresas são:
HDFS e CBS.
DDL e DML.
Sql e Digg.
Hive e Hadoop.
MapReduce e Hi5.

O projeto Spark é utilizado em diversas aplicações, mas tem sido muito utilizado em Data Science. Ele contém diversos componentes integrados que agenda, distribuem e monitoram aplicações. O projeto Spark é composto por diversas ferramentas, como o Spark Framework, Spark Core, e outros.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Spark oferece consegue integrar ferramentas como Hadoop MapReduce e Streaming.
II. É uma solução perfeita para a computação de dados no mundo do Big Data.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições falsas.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.

O Hive possui um linguagem própria para consulta, chamada de HQL ou HiveQL. Esta linguagem possui características semelhantes a linguagem SQL. Além desta linguagem, ainda possui outra, uma linguagem procedural, chamada HPL (Hive Procedural Language).
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. No exemplo é utilizado um exemplo em linguagem HQL com a presença de comandos select e show tables.
II. Possui a característica de comandos semelhantes ao da linguagem SQL.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.

Para trabalhar com Spark, é necessário escolher uma linguagem de programação que tenha suporte para a ferramenta. Atualmente, as linguagens que dão suporte para ela são Java, Scala, R e Python.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O exemplo mostra a importação de bibliotecas com suas respectivas classes e métodos a serem utilizados.
II. São importados funções que retornam a data, hora e minuto, sendo concatenado em uma variável.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.

O Hadoop é um framework que pode ser utilizado em diversas linguagens, como, por exemplo, Java e Python. No framework há ferramentas importantes, podemos citar o MapReduce, que contém um mapeador e uma redutor. Um exemplo muito utilizado para expor o funcionamento do MapReduce é por meio de um contador de palavras.
A respeito deste exemplo do contador de palavras, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s).
1. ( ) É utilizado o stdin e stdout para ler e gravar dados.
2. ( ) O redutor gera palavra como chave e número de contagens como valor.
3. ( ) A função Mapper divide chave-valores em palavras complexas.
4. ( ) O redutor recebe linhas de entrada e conta o número de instâncias.
F, F, F, F.
V, V, V, V.
F, V, F, V.
V, V, F, F.
V, V, F, V.

O Hadoop é ideal para trabalhos que possuem grande número de dados, e isso acontece devido a ele possuir características como disponibilidade, durabilidade e disponibilidade. Ele, ainda, é composto de módulos que carregam tarefas essenciais de análise de dados.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Hadoop armazena e processa dados estruturados, semi e não estruturados sem requisitos de formato.
II. O Hadoop é ideal para a construção de lagos de dados, para apoiar iniciativas de análise de Big Data.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
A asserção I é uma proposição verdadeira, e a asserção II é uma proposição falsa.
As asserções I e II são proposições falsas.

O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande volumes de dados em ambientes com a característica de ser distribuído.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop.
II. Possui a característica de facilitar a junção de dados para a análise.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
As asserções I e II são proposições falsas.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.

O Hadoop Streaming possui duas fases, o mapeador e o redutor. Uma tarefa importante realizada é o teste do código para confirmação de funcionamento do mesmo. Esta é uma tarefa que não é muito complicada, mas exige que seja feita conforme a determinação de algumas etapas.
Sobre o MapReduce, podemos afirmar corretamente que as etapas são:
Função Stdin e Função Stdout.
Código do Mapeador e Código do Redutor.
Job Stdin e Job Stdout.
Cluster Hadoop e Script Hadoop.
API Streaming Map e API Streaming Std.

O Hadoop pertence ao Apache e possibilita realizar o processamento de grandes volumes de dados se utilizando de uma característica importante, a programação simples. No processamento e análise dos dados, temos ferramentas como o MapReduce, que pode ser aplicado em diversas linguagens, como o Python.
Considerando o trecho apresentado e conceitos relacionados à linguagem Python, analise as afirmativas a seguir:
1. Python é uma linguagem de programação orientada a objetos, open-source, e, atualmente, bastante popular.
2. A linguagem foi lançada em 1994, no entanto, ela se tornou popular somente a partir de 2016.
3. É uma linguagem closed source, ou seja, código fechado, não podendo ser alterada.
4. É muito utilizada na linguagem de programação web para a análise de ciência de dados.
II e III, apenas.
I, II e IV, apenas.
III e IV, apenas.
I, II e III, apenas.
I e IV, apenas.

Prévia do material em texto

PER GUNTA 1 
1. O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de 
dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo 
muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics. 
 
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas 
respectivas características. 
 
I) Análise Descritiva 
II) Análise Preditiva 
III) Análise Prescritiva 
IV) Análise Diagnóstica 
 
( ) busca responder perguntas de porque algo aconteceu. 
( ) diferente das demais, busca projeções futuras. 
( ) se baseia nas predições evitar problemas antes de acontecerem. 
( ) é uma análise do estado atual de uma instituição ou empresa. 
 
A seguir, assinale a alternativa com a sequência correta. 
 
 
 
 
III, I, IV, II. 
 
 
IV, II, III, I. 
 
 
II, IV, I, IV. 
 
 
III, II, IV, I. 
 
 
I, III, II, IV. 
1 pontos 
PER GUNTA 2 
1. A análise em grandes conjuntos de dados tem sido essencial para as funções de várias 
equipes de analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, 
como aplicativos de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva 
e prescritiva. 
 
Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais 
utilizadas para atender grandes empresas são: 
 
 
 
HDFS e CBS. 
 
 
DDL e DML. 
 
 
Sql e Digg 
 
 
Hive e Hadoop. 
 
 
MapReduce e Hi5. 
1 pontos 
PER GUNTA 3 
1. O projeto Spark é utilizado em diversas aplicações, mas tem sido muito utilizado em Data 
Science. Ele contém diversos componentes integrados que agenda, distribuem e monitoram 
aplicações. O projeto Spark é composto por diversas ferramentas, como o Spark Framework, 
Spark Core, e outros. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. O Spark oferece consegue integrar ferramentas como Hadoop MapReduce e Streaming. 
 
Pois: 
 
II. É uma solução perfeita para a computação de dados no mundo do Big Data. 
 
A seguir, assinale a alternativa correta: 
 
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
 
 
A asserção I é uma proposição verdadeira e a asserção II é uma 
proposição falsa. 
 
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa 
correta da I. 
 
 
As asserções I e II são proposições falsas. 
 
 
As asserções I e II são proposições verdadeiras, mas a II não é uma 
justificativa correta da I. 
1 pontos 
PER GUNTA 4 
1. O Hive possui um linguagem própria para consulta, chamada de HQL ou HiveQL. Esta 
linguagem possui características semelhantes a linguagem SQL. Além desta linguagem, ainda 
possui outra, uma linguagem procedural, chamada HPL (Hive Procedural Language ). Nesse 
sentido, analise o exemplo abaixo: 
 
hive> select * from tb_clientes; hive> show tables; 
2. 
 elaborado pelo autor 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. No exemplo é utilizado um exemplo em linguagem HQL com a presença de comandos select 
e show tables. 
Pois: 
II. Possui a característica de comandos semelhantes ao da linguagem SQL. 
 
A seguir, assinale a alternativa correta: 
 
 
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
 
 
As asserções I e II são proposições verdadeiras, mas a II não é uma 
justificativa correta da I. 
 
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa 
correta da I. 
 
 
A asserção I é uma proposição verdadeira e a asserção II é uma 
proposição falsa. 
 
 
As asserções I e II são proposições falsas. 
1 pontos 
PER GUNTA 5 
1. Para trabalhar com Spark, é necessário escolher uma linguagem de programação que tenha 
suporte para a ferramenta. Atualmente, as linguagens que dão suporte para ela são Java, 
Scala, R e Python. Nesse sentido, analise o trecho a seguir: 
 
import pyspark from pyspark.sql.types import * from pyspark.sql import Row import 
unix_timestamp from pyspark.sql.functions import from_unixtime from pyspark.sql.functions 
import year, month, dayofmonth, hour, minute, concat_ws, date_format 
2. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. O exemplo mostra a importação de bibliotecas com suas respectivas classes e métodos a 
serem utilizados. 
 
Pois: 
 
II. São importados funções que retornam a data, hora e minuto, sendo concatenado em uma 
variável. 
 
A seguir, assinale a alternativa correta: 
 
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa 
correta da I. 
 
 
As asserções I e II são proposições verdadeiras, mas a II não é uma 
justificativa correta da I. 
 
 
A asserção I é uma proposição verdadeira e a asserção II é uma 
proposição falsa. 
 
 
As asserções I e II são proposições falsas. 
 
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
1 pontos 
PER GUNTA 6 
1. O Hadoop é um framework que pode ser utilizado em diversas linguagens, como, por exemplo, 
Java e Python. No framework há ferramentas importantes, podemos citar o MapReduce, que 
contém um mapeador e uma redutor. Um exemplo muito utilizado para expor o funcionamento 
do MapReduce é por meio de um contador de palavras. 
 
A respeito deste exemplo do contador de palavras, analise as afirmativas a seguir e 
assinale V para a(s) verdadeira(s) eF para a(s) falsa(s). 
 
1. ( ) É utilizado o stdin e stdout para ler e gravar dados. 
2. ( ) O redutor gera palavra como chave e número de contagens como valor. 
3. ( ) A função Mapper divide chave-valores em palavras complexas. 
4. ( ) O redutor recebe linhas de entrada e conta o número de instâncias. 
 
 
Assinale a alternativa que apresenta a sequência correta. 
 
 
F, F, F, F. 
 
 
V, V, V, V. 
 
 
F, V, F, V. 
 
 
V, V, F, F. 
 
 
V, V, F, V. 
1 pontos 
PER GUNTA 7 
1. O Hadoop é ideal para trabalhos que possuem grande número de dados, e isso acontece 
devido a ele possuir características como disponibilidade, durabilidade e disponibilidade. Ele, 
ainda, é composto de módulos que carregam tarefas essenciais de análise de dados. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
 
I. O Hadoop armazena e processa dados estruturados, semi e não estruturados sem requisitos 
de formato. 
Pois: 
II. O Hadoop é ideal para a construção de lagos de dados, para apoiar iniciativas de análise 
de Big Data . 
 
A seguir, assinale a alternativa correta. 
 
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
 
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa 
correta da I. 
 
 
As asserções I e II são proposições verdadeiras, mas a II não é uma 
justificativa correta da I. 
 
 
A asserção I é uma proposição verdadeira, e a asserção II é uma 
proposição falsa. 
 
 
As asserções I e II são proposições falsas. 
 
 
PER GUNTA 8 
1. O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma 
aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande 
volumes de dados em ambientes com a característica de ser distribuído. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop. 
Pois: 
II. Possui a característica de facilitar a junção de dados para a análise. 
 
A seguir, assinale a alternativa correta: 
 
 
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
 
 
As asserções I e II são proposições verdadeiras, mas a II não é uma 
justificativa correta da I. 
 
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa 
correta da I. 
 
 
As asserçõesI e II são proposições falsas. 
 
 
A asserção I é uma proposição verdadeira e a asserção II é uma 
proposição falsa. 
1 pontos 
PER GUNTA 9 
1. O Hadoop Streaming possui duas fases, o mapeador e o redutor. Uma tarefa importante 
realizada é o teste do código para confirmação de funcionamento do mesmo. Esta é uma tarefa 
que não é muito complicada, mas exige que seja feita conforme a determinação de algumas 
etapas. 
Sobre o MapReduce, podemos afirmar corretamente que as etapas são: 
 
 
 
Função Stdin e Função Stdout. 
 
 
Código do Mapeador e Código do Redutor. 
 
 
Job Stdin e Job Stdout. 
 
 
Cluster Hadoop e Script Hadoop. 
 
 
API Streaming Map e API Streaming Std. 
 
 
 
1 pontos 
PER GUNTA 10 
1. O Hadoop pertence ao Apache e possibilita realizar o processamento de grandes volumes de 
dados se utilizando de uma característica importante, a programação simples. No 
processamento e análise dos dados, temos ferramentas como o MapReduce, que pode ser 
aplicado em diversas linguagens, como o Python. 
 Considerando o trecho apresentado e conceitos relacionados à linguagem Python, analise as 
afirmativas a seguir: 
 
1. Python é uma linguagem de programação orientada a objetos, open-source, e, atualmente, 
bastante popular. 
2. A linguagem foi lançada em 1994, no entanto, ela se tornou popular somente a partir de 2016. 
3. É uma linguagem closed source, ou seja, código fechado, não podendo ser alterada. 
4. É muito utilizada na linguagem de programação web para a análise de ciência de dados. 
 
 
Está correto o que se afirma em: 
 
 
 
II e III, apenas. 
 
 
I, II e IV, apenas. 
 
 
 
III e IV, apenas. 
 
 
I, II e III, apenas. 
 
 
I e IV, apenas.

Mais conteúdos dessa disciplina