O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta qu...
O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark.
a) Python e Escala b) Casandra e Spark c) Hadoop e Spark d) Java e Python e) R: Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo _init_.py em branco e outro para a lógica do módulo.
A opção correta que contém os pré-requisitos de instalação para utilização do PySpark é a letra d) Java e Python. Estes são os pré-requisitos necessários para utilizar o PySpark.
0
0
Faça como milhares de estudantes: teste grátis o Passei Direto
Compartilhar