Buscar

Python Fundamentos Para Análise de Dados 3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 11 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Python Fundamentos Para Análise de Dados 3.0
Indentação em Python não é importante. Falso
Quantos elementos serão impressos na tela com o código abaixo:
temperatura = 40  
while temperatura > 35: 
    print(temperatura)
    temperatura = temperatura - 1 : 5
Qual o resultado do código abaixo:
listaB = [32,53,85,10,15,17,19]
soma = 0
for i in listaB:
    double_i = i * 2
soma += double_i
print(soma): 462
Qual dos itens abaixo não é uma estrutura e repetição em Python? GoTo
Podemos usar a estrutura Elif para evitar vários bloco if aninhados! Falso
Qual o resultado da expressão abaixo:
def imprimeDados( nome, idade ):
    print ("%s tem %s anos." %(nome, idade))
    return;
imprimeDados( idade=30, nome="Bob" ) Bob tem 30 anos.
Qual o resultado da expressão:
def add(a,b):
    print (a, "+", b, "=", a + b)
add(4, 12): 4 + 12 = 16
Qual o resultado da expressão abaixo:
sum = lambda x, y:   x + y  
sum(2,9): 11
Em geral a função map() oferece melhor performance que List Comprehension.Falso
A Data Science Academy oferece acesso remoto gratuito a um super servidor com 2 GPUs, a todos os alunos dos cursos da Formação IA. Verdadeiro
O que é uma classe? 
Uma classe é um gabarito para definição de objetos.
O que é um Método? 
Um método nada mais é que o equivalente a uma função, com a restrição que ele manipula apenas suas variáveis locais e os atributos que foram definidos para a classe.
O que é um objeto?
Objeto é uma instância de uma classe que contém atributos (ou propriedades) e possui um comportamentos (ou métodos).
class Ordena:
 def __init__(self):
 # inicializa a raiz da árvore
 self.root = None
 def AdicionaNo(self, valor):
 return Nó(valor)
 def Inserir(self, raiz, valor):
 # inserir novo valor
 if raiz == None:
 # não há nenhum valor
 return self.AdicionaNo(valor)
 else:
 # já está na árvore
 if valor <= raiz.valor:
 # se os dados forem menores do que os armazenados
 # entra na sub-árvore do lado esquerdo
 raiz.esquerda = self.Inserir (raiz.esquerda, valor)
 else:
 # entra na sub-árvore do lado direito
 raiz.direita = self.Inserir (raiz.direita, valor)
 return raiz 3
Dado o código abaixo, qual o nome do objeto?
class Point:
 def __init( self, x=0, y=0):
 self.x = x
 self.y = y
 def __del__(self):
 class_name = self.__class__.__name__
 print (class_name, "destroyed")
pt1 = Point() : pt1
Bancos de dados relacionas e bancos no sql são a mesma coisa? Falso
Qual das instruções abaixo NÃO é uma instrução SQL?
import sqlite3
Qual o resultado do comando abaixo:
CREATE TABLE IF NOT EXISTS produtos(id INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL, date TEXT, prod_name TEXT, valor REAL): É criada a tabela produtos com 4 colunas, caso ela não exista, sendo a primeira coluna auto incremental.
O que faz o comando abaixo?
conn = MongoClient('localhost', 27017): 
Estabelece conexão ao MongoDB.
Coleções são conjuntos de documentos no MongoDB.Verdadeiro
NumPy, um acronimo para Numerical Python, é o pacote fundamental para computação matemática em Python.Verdadeiro
Embora NumPy não ofereça funcionalidades analíticas de alto nível, a compreensão sobre arrays ajudará a utilizar as ferramentas do Pandas de forma muito mais eficaz, além de ser a base para construção de modelos de Machine Learning em Python.Verdadeiro
Pandas não possui uma sofisticada funcionalidade de indexação que torna fácil o “slice and dice”, agregações e seleção de subsets de dados.Falso
_________ é uma biblioteca criada para manipular de forma rápida e expressiva, dados estruturados.
Pandas
Em qual dos cursos abaixo na Data Science Academy, você pode estudar em mais detalhes o NumPy e o Pandas?
Deep Learning Frameworks
Machine Learning com R e Python
Business Analytics com R e Python
Todas as anteriores estão corretas
Quais dos módulos abaixo, não são módulos módulos Python para análise de dados? 
igraph, caret, rpart
Qual dos módulos abaixo é usado para manipulação de séries temporais e dataframes? 
Pandas
Este módulo é um módulo Python para visualização de dados. Este módulo permite que você crie facilmente gráficos, histogramas e outras visualizações profissionais. Usando este módulo você pode personalizar cada aspecto de uma visualização. Este módulo é? Matplotlib
PyData Stack é um conjunto de bibliotecas Python para análise de dados.Verdadeiro
As 4 etapas principais do processo de análise de dados são: 
Preparação, Transformação, Modelagem, Apresentação
Em que etapa você realiza o pré-processamento dos dados?
Na preparação e exploração dos dados
As variáveis representam as colunas em um dataframe.Verdadeiro
Em qual dos cursos abaixo na DSA, a Análise Exploratória é estudada em mais detalhes?
Big Data Real-Time Analytics com Python e Spark
Machine Learning com R e Python
Business Analytics com R e Python
Todas estão corretas.
Marque as etapas normalmente presentes em processos de Data Science. 
Exploração de Dados - Criação do Modelo - Apresentação
O Kaggle é um site de competições de Data Science.: Verdadeiro
Machine Learning é o método de análise de dados que automatiza a construção de modelos analíticos. Utilizando algoritmos que iterativamente aprendem a partir dos dados, Machine Learning permite que computadores encontrem insights ocultos, sem que sejam necessariamente programados para isso.Verdadeiro
Matemática e Estatística não  tem importância dentro do processo de aprendizagem de máquina.Falso
Na aprendizagem supervisionada, cada linha, ou seja, cada observação dentro dos dados, possui atributos (variáveis) com os inputs e o valor que nós queremos que o algoritmo faça as previsões, ou seja, o output. Verdadeiro
No processo de aprendizagem não supervisionada, o algoritmo busca dentro do seu conjunto de dados, clusters de dados com características semelhantes.Verdadeiro
Qual é a etapa mais importante dentro do processo de Machine Learning?
Identificação do problema de negócio.
Preparação dos dados.
Seleção dos algoritmos.
Treinamento do modelo.
Teste e avaliação do modelo.
Todas as etapas são importantes!
O comando abaixo retorna uma descrição das principais medidas estatísticas do dataframe chamado df.
print(df.describe()) Verdadeiro
Entre outras coisas, NumPy oferece (marque a opção correta):Um rápido e eficiente array multidimensional
Listas não têm tamanho fixo (o que significa que não precisamos especificar quão grande uma lista será).Verdadeiro
Um dicionário Python consiste de uma chave e, em seguida, um valor associado. Esse valor pode ser quase qualquer objeto Python.Verdadeiro
O que faz a instrução abaixo quando executada no Juyter Notebook?
!pip install rpy2: Instala o pacote rpy2.
A função type() retorna o tipo de qualquer objeto em Python.Verdadeiro
Selecione a definição correta para Aprendizagem Supervisionada em Machine Learning.
É o termo usado sempre que o programa é “treinado” sobre um conjunto de dados pré-definido. Baseado no treinamento com os dados pré-definidos, o programa pode tomar decisões precisas quando recebe novos dados. Exemplo: Pode-se usar um conjunto de dados de recursos humanos para treinamento da Machine Learning, que tenha tweets marcados como positivos, negativos e neutros e assim treinar um classificador de análise de sentimento.
Qual o resultado da instrução abaixo?
s = 'Data Science Academy'
s[:-1]
Data Science Academ
H
M
A classe é a estrutura básica do paradigma de orientação a objetos, que representa o tipo do objeto, um modelo a partir do qual os objetos serão criados.
Verdadeiro 
Existem 3 grupos de instruções em linguagem SQL. Marque a opção correta: Instruções DML, DDL e DCL. 
Qual o resultado da expressão abaixo e por que?
Par = lambda x: x%2==0
Par(3): False, porque a divisão de 3 por 2 é diferente de zero. 
Normalização de dados é o processo de organização de campos e tabelas em um banco de dados relacional para minimizar a redundância e a dependência. Verdadeiro 
Qual o resultado da instruçãoabaixo:
estudantes = {"Pedro":24, "Fernando":22, "Tania":26, "Cris":25}len(estudantes): 4
Qual o resultado da expressão abaixo?
var = lambda s: s[1]
var('Python'): y
O que faz a instrução abaixo quando executada no Juyter Notebook? !pip install rpy2: 
Instala o pacote rpy2.
NumPy, um acronimo para Numerical Python, é o pacote fundamental para computação científica em Python. NumPy fornece suporte para arrays e matrizes, além de funções matemáticas para operações com esses objetos. Verdadeiro 
Machine Learning é a construção de um modelo a partir de dados de exemplo, com o objetivo de realizar previsões sobre novos dados recebidos. Verdadeiro
Por que o comando abaixo gera uma mensagem de erro?
break = 1
Porque break é uma palvra reservada e não pode ser usada como nome de variável. 
Python não suporta Programação Orientada a Objetos.Falso 
Qual o resultado da instrução abaixo:
dia = "Terça"
if dia == "Segunda":
  print("Hoje fará sol!")
elif dia == "Terça":
  print("Hoje vai chover!")
else:
  print("Sem previsão do tempo para o dia selecionado"): Hoje vai chover. 
Pandas possui uma sofisticada funcionalidade de indexação que torna fácil o slice e dice, agregações e seleção de subsets de dados. Pandas possui ainda funcionalidades de manipulação de dados de séries temporais de alta performance, ideal para manipulação de dados financeiros.Verdadeiro 
Strings são usadas em Python para gravar informações em formato de texto, como nomes por exemplo. Strings em Python são na verdade uma sequência de caracteres, o que significa, basicamente, que  Python mantém o controle de cada elemento da sequência. Verdadeiro 
O comando abaixo gera uma mensagem de erro ao ser executado no Jupyter Notebook:
pessoa1, pessoa2, pessoa3 = "Maria", "José", "Tobias" Verdadeiro 
Em Python, tuplas são muito semelhantes às listas, no entanto, ao contrário de listas, tuplas são imutáveis, o que significa que não podem ser alteradas. Verdadeiro 
O que faz o comando abaixo?
df = pd.read_csv("pima-data.csv"): Faz a leitura do arquivo CSV e gera um objeto do tipo dataframe do Pandas. 
Qual Formação da Data Science Academy oferece um curso de Análise de Dados em Tempo Real com Python e Spark? Formação Cientista de Dados 
H
M
Marque a opção incorreta:
Listas são identificadas por []
Tuplas são identificadas por ()
Dicionários são identificados por {}
Listas são identificadas por ()
Para dados núméricos, o NumPy é mais eficiente para armazenar e manipular dados, em relação a outros objetos built-in in Python: Verdadeiro 
O que ocorre ao executar a instrução abaixo:
tupla1 = ("Matemática", 23, "Gatos")
tupla1.append("Chocolate")  
Ocorrerá um erro, pois as duplas são objetos imutáveis e não suportam o método append().  
Para construir um modelo preditivo, dividimos os dados em dados de treino e dados de teste.Verdadeiro 
Existem algumas regras que devem ser seguidas ao definir nomes de variáveis em Python. Marque a opção incorreta. Não é possível usar qualquer um desses símbolos .”/%$&¨¨%$$#”
Entre 50 a 80% do tempo de trabalho de um Cientista de Dados é usado na fase de limpeza, manipulação e transformação dos dados.
Verdadeiro 
Função é um dispositivo que agrupa um conjunto de instruções para que elas possam ser executadas mais de uma vez. Funções também permitem especificar os parâmetros que podem servir como entrada para as funções. Verdadeiro
Data Munging/Wrangling é basicamente o processo de converter e mapear dados de um estado "crú" em outro formato que permita manipular os dados com ferramentas de mais alto nível, como por exemplo aplicar algoritmos de Machine Learning. Verdadeiro
Qual o resultado da instrução abaixo?
s = 'Data Science Academy'
s[0]
Falso 
Qual o objetivo de usar o comando abaixo no Jupyter Notebook? %matplotlib inline
Evitar que os gráficos do matplotlib sejam gerados dentro do Jupyter Notebook. 
Parâmetros não podem ser usados como argumentos extras em métodos.  Falso
Qual o resultado da instrução abaixo?
dict = {'k1':'martelo', 'k2':'serrote', 'k3':'machado'}
dict['k4'] = 'parafuso'
print(dict): Vai retornar uma mensagem de erro!
Scikit-Learn é usado com NumPy, SciPy e Matplotlib, permitindo a criação de ferramentas eficientes para Machine Learning e modelagem estatística como classificação, regressão, clustering e redução de dimensionalidade: Verdadeiro 
Qual o resultado da instrução abaixo:
counter = 0
while counter < 100:
    if counter == 4:
        break
    else:
        pass
    print(counter)
counter = counter + 1: 0,1,2,3
Qual o resultado da instrução abaixo?
idade1 = 25
idade2 = 35
idade2 % idade1: 875
Python é uma linguagem orientada a objeto, sendo assim as estruturas de dados possuem atributos (propriedades) e métodos (rotinas associadas às propriedades). Tanto os atributos quanto os métodos são acessados usando ponto (.). Verdadeiro 
Qual o resultado do comando abaixo?
int(6.5): 6
Qual o resultado da expressão abaixo?
for i in range(0, -10, -2):
    print(i):0,-2,-4,-6,-8
Problemas de negócio podem ser definidos DURANTE o processo de análise de dados.Falso 
Uma expressão regular é um método formal de se especificar um padrão de texto e em Python podemos usar o pacote re (regular expressions). Verdadeiro 
Por que a expressão abaixo vai gerar como resultado a frase "Operação não permitida"?
try:
    8 + 's'
except TypeError:
print("Operação não permitida"): Porque não é possível realizar a operação 8 + `s` gerando um TypeErro. 
Uma grande característica de estruturas de dados em Python é que elas suportam aninhamento. Isto significa que podemos usar estruturas de dados dentro de estruturas de dados. Verdadeiro
Para criar um gráficos de barras com Matplotlib usamos:plt.bar()

Outros materiais