Buscar

Análise de Dados em Linguagem R

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Iniciado em domingo, 17 jul 2022, 11:15 
Estado Finalizada 
Concluída em domingo, 17 jul 2022, 11:16 
Tempo empregado 1 minuto 42 segundos 
Notas 5,00/5,00 
Avaliar 25,00 de um máximo de 25,00(100%) 
Questão 1 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Sobre a análise de dados no setor público, assinale a alternativa correta: 
Escolha uma opção: 
a. A utilização de dados pelos órgãos públicos para basear a tomada de decisões ainda é uma 
prática pouco utilizada. 
b. Os dados não conseguem auxiliar as instituições públicas no processo de tomada de 
decisões, ainda que bem trabalhados, monitorados e analisados. 
c. Os dados podem ser utilizados pelos órgãos públicos para auxiliar na detecção de anomalias 
no monitoramento de indicadores ou na melhoria de processos. 
d. Embora se reconheça a importância do uso de dados para transparência, não há registro de 
sua disponibilização por parte dos órgãos públicos no Brasil. 
e. Os dados disponibilizados em painéis pelos órgãos públicos brasileiros devem ser utilizados 
apenas para consulta online, ou seja, não existe a possibilidade de um usuário baixar os dados 
do painel para fazer suas próprias análises. 
Feedback 
Your answer is correct. 
A letra “A” está errada. Cada vez mais os órgãos públicos vêm tomando decisões com base 
nos dados, seja para detecção de anomalias, monitoramento de indicadores ou melhoria de 
processos. 
A letra “B” está errada. Quando bem trabalhados, monitorados e analisados, os dados servem 
para auxiliar as instituições em muitos aspectos. 
A letra “C” está correta. Os órgãos públicos cada vez mais vêm tomando decisões com base 
nos dados, seja para detecção de anomalias, monitoramento de indicadores ou melhoria de 
processos. 
A letra “D” está errada. Com o objetivo de dar mais transparência em suas ações, os órgãos 
públicos têm disponibilizado dados governamentais em suas páginas na internet, seguindo o 
disposto na LAI. 
A letra “E” está errada. A maioria dos órgãos públicos disponibilizam os seus dados na internet, 
exceto aqueles que se enquadram nas hipóteses de sigilo e de informações pessoais. Muitos 
desses dados estão disponíveis em painéis sobre diversos temas, permitindo que sejam 
baixados para análise individual. 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Com relação aos dados abertos e à Lei de Acesso à Informação, assinale a alternativa correta: 
Escolha uma opção: 
a. A disponibilização dos dados abertos não pode ser considerada uma forma de dar 
transparência aos cidadãos. 
b. Somente os servidores ou agentes públicos podem acessar, utilizar, modificar e compartilhar 
os dados abertos para qualquer finalidade. 
c. No Brasil, todos os dados do governo podem ser acessados livremente por qualquer 
cidadão. 
d. Somente os países desenvolvidos disponibilizam bases de dados por meio da internet. 
e. Podemos definir dados abertos como aqueles que qualquer pessoa pode livremente acessá-
los, utilizá-los, modificá-los e compartilhá-los para qualquer finalidade, estando sujeito a, no 
máximo, a exigências que visem preservar sua proveniência e sua abertura. 
Feedback 
Your answer is correct. 
A letra “A” está errada. A disponibilização dos dados abertos é uma forma de dar transparência 
aos cidadãos. 
A letra “B” está errada. Qualquer pessoa pode livremente acessar, utilizar, modificar e 
compartilhar os dados abertos para qualquer finalidade. 
A letra “C” está errada. No Brasil, temos a Lei de Acesso à Informação (LAI) que define as 
hipóteses de sigilo e de informações pessoais, ou seja, nem todos os dados do governo podem 
ser acessados. 
A letra “D” está errada. Vários países disponibilizam na internet bases de dados 
governamentais classificadas como dados abertos, visando dar transparência ao cidadão, 
sejam países desenvolvidos ou não. 
A letra “E” está correta. Essa é a definição disponibilizada no Portal Brasileiro de Dados 
Abertos. 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta os 4 Vs que caracterizam o Big Data: 
Escolha uma opção: 
a. Volume, veracidade, volatilidade e vulnerabilidade. 
b. Variedade, volume, viabilidade e validade. 
c. Variedade, volatilidade, velocidade e veracidade. 
d. Volume, variedade, velocidade e veracidade. 
e. Viabilidade, velocidade, veracidade e variedade. 
Feedback 
Your answer is correct. 
A alternativa correta é a letra “D”. Os 4 Vs que caracterizam o Big Data são volume, variedade, 
velocidade e veracidade. 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta o conceito de Hadoop estudado neste módulo: 
Escolha uma opção: 
a. Hadoop é uma linguagem de programação para análise e apresentação estatística. 
b. Hadoop é um ecossistema para análise de dados que não permite armazenamento 
distribuído. 
c. Hadoop é um banco de dados relacional para armazenamento de dados estruturados. 
d. Hadoop é um framework open source para processamento e gerenciamento de pequenos 
volumes de dados. 
e. Hadoop é um framework open source para processamento e gerenciamento de grandes 
volumes de dados. 
Feedback 
Your answer is correct. 
A letra “A” está errada. Hadoop é um framework open source para processamento e 
gerenciamento de grandes volumes de dados. 
A letra “B” está errada. Hadoop é um ecossistema de ferramentas e métodos para 
armazenamento distribuído e análise de dados estruturados e não estruturados. 
A letra “C” está errada. Hadoop não é um banco de dados. 
A letra “D” está errada. O Hadoop é usado para processamento e gerenciamento de grandes 
volumes de dados e não de pequenos. 
A letra “E” está correta. Hadoop é um framework open source para processamento e 
gerenciamento de grandes volumes de dados. 
 
 
Questão 5 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Acerca da definição de data science, assinale a alternativa correta: 
Escolha uma opção: 
a. É um ecossistema para análise de dados e armazenamento distribuído. 
b. Consiste em desenvolver e aplicar métodos para coletar, analisar e interpretar os dados. 
c. É a arte de extrair conhecimento por meio dos dados para se tomar melhores decisões, 
realizar previsões e entender o passado. 
d. Área de estudo que busca dar aos computadores a habilidade de aprender. 
e. É uma técnica utilizada para agrupar os dados com base em características similares. 
Feedback 
Your answer is correct. 
A letra “A” está errada. Esse é o conceito do Hadoop. 
A letra “B” está errada. A estatística é o ramo da ciência que consiste em desenvolver e aplicar 
métodos para coletar, analisar e interpretar os dados. 
A letra “C” está correta. Data science ou ciência de dados é a arte de extrair conhecimento por 
meio dos dados para se tomar melhores decisões, realizar previsões e entender o passado. 
A letra “D” está errada. Esse é o conceito de machine learning. 
A letra “E” está errada. Esse é o conceito de aprendizagem não supervisionada. 
 
 
Iniciado em domingo, 17 jul 2022, 11:17 
Estado Finalizada 
Concluída em domingo, 17 jul 2022, 11:20 
Tempo empregado 2 minutos 23 segundos 
Notas 6,00/7,00 
Avaliar 30,00 de um máximo de 35,00(86%) 
Questão 1 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Acerca dos programas linguagem R e RStudio, assinale a alternativa correta: 
Escolha uma opção: 
a. A linguagem R é um software livre de ambiente de desenvolvimento integrado para RStudio. 
b. A linguagem R é uma linguagem de programação usada para análise estatística e produção 
de gráficos. Uma das suas vantagens é a linguagem acessível, fator que facilita a sua 
usabilidade. 
c. O RStudio possui uma interface gráfica que complica o uso da linguagem R na manipulação 
de dados, na criação de gráficos e nos cálculos estatísticos. 
d. O RStudio é dividido em três janelas: “Source”,“Console” e “Environment”. 
e. Ao executar o arquivo de instalação da linguagem R, não é permitido ao usuário escolher o 
idioma do instalador. 
Feedback 
Your answer is correct. 
A letra “A” está errada. O conceito apresentado é do RStudio. 
A letra “B” está correta. A linguagem R é uma linguagem de programação usada para análise 
estatística e produção de gráficos. Trata-se de um software gratuito com código aberto e com 
uma linguagem acessível, o que facilita a sua usabilidade. 
A letra “C” está errada. O RStudio possui uma interface gráfica que simplifica o uso da 
linguagem R na manipulação de dados, na criação de gráficos e nos cálculos estatísticos. 
A letra “D” está errada. O RStudio é dividido em quatro janelas: “Source”, “Console”, 
“Environment” e “Visualização”. 
A letra “E” está errada. Depois de executar o arquivo de instalação, o usuário deve selecionar o 
idioma do instalador na caixa de diálogo exibida e, em seguida, clicar em “OK”. 
 
 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
O RStudio possui diversas abas com diferentes funcionalidades. Assinale a alternativa que 
relaciona a descrição mais adequada para a atividade citada: 
Escolha uma opção: 
a. A aba “Files” exibe os gráficos do RStudio. 
b. A aba “Plots” exibe a documentação de uma determinada função ou pacote quando a função 
“help()” é executada. 
c. A aba “Packages” é o local onde os gráficos gerados serão exibidos. 
d. A única janela que exibe os objetos é a “Environment”. 
e. “Environment” é a janela que exibe o resultado do que é executado na “Source”. 
Feedback 
Your answer is correct. 
A letra “A” está errada. A aba “Plots” é a área que exibe os gráficos do programa RStudio. 
A letra “B” está errada. A aba que exibe a documentação de uma determinada função ou 
pacote quando a função “help()” é executada é a “Help”. 
A letra “C” está errada. A aba que exibe os gráficos gerados é a “Plots”. 
A letra “D” está correta. A janela “Environment” exibe objetos que estão carregados na 
memória. Também é possível removê-los ou salvá-los. 
A letra “E” está errada. A janela “Console” exibe o resultado do que é executado na “Source”. 
 
 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Sobre a janela “Console”, assinale a alternativa que descreve as suas funcionalidades: 
Escolha uma opção: 
a. Exibe a estrutura de arquivos do projeto, além de remover ou salvar os objetos. 
b. Exibe objetos que estão carregados na memória. 
c. Expressa o resultado das ações realizadas na janela “Source”. 
d. É o local para escrever o código. 
e. Permite instalar, atualizar e pesquisar os pacotes. 
Feedback 
Your answer is correct. 
A letra “A” está errada. Essa descrição refere-se, parcialmente, à aba “Files”. 
A letra “B” está errada. Essa funcionalidade descreve a janela “Environment”. 
A letra “C” está correta. A janela “Console” expressa o resultado das ações realizadas na 
“Source”. 
A letra “D” está errada. A janela destinada para escrever o código é a “Source”. 
A letra “E” está errada. A aba “Packages” permite instalar, atualizar e pesquisar os pacotes. 
 
 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
A respeito das estruturas na linguagem R, assinale a alternativa que melhor descreve um data 
frame: 
Escolha uma opção: 
a. Semelhante ao vetor, porém permite adicionar elementos de tipos diferentes. 
b. Armazena um conjunto de valores ordenados, todos do mesmo tipo. 
c. Armazena valores categóricos (nominal ou ordinal). 
d. Armazena dados tabulares, porém só aceita um tipo de dado. 
e. Usado para organizar elementos como em uma planilha, possui linhas e colunas e pode ser 
formado por listas ou vetores. 
Feedback 
Your answer is correct. 
A letra “A” está errada. Essa é a definição de lista. 
A letra “B” está errada. Essa é a definição de vetor. 
A letra “C” está errada. Essa é a definição de fator. 
A letra “D” está errada. Essa é a definição de matriz. 
A letra “E” está correta. O data frame é uma estrutura que armazena dados tabulares e aceita 
vários tipos de dados. 
 
 
Questão 5 
Incorreto 
Atingiu 0,00 de 1,00 
Marcar questão 
Texto da questão 
Imagine a seguinte situação: você está trabalhando com análise de dados no R e surge uma 
dúvida sobre qualquer função ou parâmetro. A partir desse problema, assinale a alternativa que 
apresenta o procedimento para consultar a documentação da função: 
Escolha uma opção: 
a. Utilizar o ponto de interrogação antes do nome da função. Em seguida, a documentação será 
aberta na aba “Files”. 
b. Após a devida aplicação da função, a documentação será aberta na aba “Plots”. 
c. Inserir o ponto de interrogação antes do nome da função. 
d. Inserir o caractere asterisco antes do nome da função. 
e. Inserir o ponto de exclamação antes do nome da função. 
Feedback 
Your answer is incorrect. 
A alternativa correta é a letra “E”. Para consultar a documentação da função, é necessário 
utilizar o ponto de interrogação antes do nome da função. Em seguida, a documentação será 
aberta na aba “Help”. 
Questão 6 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Em relação às funções dos pacotes “dplyr” e “tidyr”, assinale a alternativa correta: 
Escolha uma opção: 
a. A função “arrange()” exibe informações do dataset, como quantidade linhas e o tipo das 
variáveis. 
b. A função “glimpse()” é usada para separar os dados de uma coluna em duas colunas. 
c. A função “mutate()” permite criar uma nova coluna, com base em dados de outras colunas. 
d. A função “select()” é utilizada para filtrar as linhas de um dataset. 
e. A função “separate()” é utilizada para ordenar os dados de um dataset. 
Feedback 
Your answer is correct. 
A letra “A” está errada. A função “arrange()” é utilizada para ordenar os dados de um dataset. 
A letra “B” está errada. A função “glimpse()” exibe informações do dataset, como quantidade de 
linhas e o tipo das variáveis. 
A letra “C” está correta. A função “mutate()” combina o valor de duas ou mais colunas e cria 
uma nova coluna com o resultado. 
A letra “D” está errada. A função “select()” é utilizada para filtrar as colunas, e não as linhas, de 
um dataset. 
A letra “E” está errada. A função “separate()” é usada para separar um texto com base em uma 
condição. 
 
 
Questão 7 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
A respeito das funções utilizadas na manipulação de dados na linguagem R, assinale a 
alternativa correta: 
Escolha uma opção: 
a. O “dplyr” é um pacote que permite selecionar e manipular os data frames. 
b. Para utilizar as funções “joins”, é necessário carregar o pacote “tidyr”. 
c. Para remover uma coluna de uma seleção, usa-se a função “select()” com o nome da coluna 
e o sinal de divisão. 
d. Todas as operações executadas na linguagem R exigem a adição do operador %>% ao final 
da função. 
e. A função “gather()” permite mudar o formato do data frame, transformando linhas em 
colunas. 
Feedback 
Your answer is correct. 
A letra “A” está correta. O “dplyr” é um pacote que permite selecionar e manipular os data 
frames. 
A letra “B” está errada. Para utilizar as funções “joins”, é necessário carregar o pacote “dplyr”. 
A letra “C” está errada. Para remover uma coluna de uma seleção, usa-se a função “select()” 
com o nome da coluna e o sinal de subtração. 
A letra “D” está errada. Somente para executar mais de uma operação na linguagem R é que 
se faz necessário adicionar o operador %>% ao final da função. 
A letra “E” está errada. A função “gather()” permite mudar o formato do data 
frame transformando colunas em linhas. 
 
 
Iniciado em domingo, 17 jul 2022, 11:21 
Estado Finalizada 
Concluída em domingo, 17 jul 2022, 11:24 
Tempo empregado 2 minutos 13 segundos 
Notas 4,00/4,00 
Avaliar 20,00 de um máximo de 20,00(100%) 
Questão 1 
Correto 
Atingiu 1,00 de 1,00Marcar questão 
Texto da questão 
Em relação a machine learning e tipos de aprendizagem, assinale a alternativa correta: 
Escolha uma opção: 
a. Os algoritmos de machine learning são aplicados a um conjunto de dados com objetivo de 
identificar os relacionamentos existentes e gerar um modelo a partir desses dados. 
b. Clustering é uma atividade usada nos algoritmos de aprendizagem supervisionada para se 
agrupar os dados que possuem características similares. 
c. A aprendizagem não supervisionada pode ser utilizada para resolver problemas de 
classificação e regressão. 
d. A classificação tem como resultado uma saída numérica. Já a regressão tem como resultado 
uma saída categórica/discreta. 
e. Qualquer algoritmo pode ser usado na aprendizagem de máquina independentemente do 
problema a ser solucionado. 
Feedback 
Your answer is correct. 
A letra “A” está correta. Essa é exatamente a função dos algoritmos de machine learning. 
A letra “B” está errada. O Clustering é uma atividade frequentemente utilizada para se agrupar 
os dados que possuem características similares nos algoritmos de aprendizagem não 
supervisionada. 
A letra “C” está errada. A aprendizagem supervisionada que pode ser utilizada para resolver os 
problemas de classificação e de regressão. 
A letra “D” está errada. A classificação tem como resultado uma saída categórica/discreta. Já a 
regressão tem como resultado uma saída numérica. A alternativa inverteu os conceitos. 
A letra “E” está errada. Existem muitos algoritmos utilizados na aprendizagem de máquina, por 
isso, é importante escolher o mais adequado ao problema proposto. 
 
 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Acerca dos algoritmos de aprendizagem supervisionada ou não supervisionada, assinale a 
alternativa correta: 
Escolha uma opção: 
a. A regressão linear é um algoritmo de classificação que se baseia nos vizinhos mais 
próximos. 
b. O objetivo do algoritmo KNN é prever o valor de uma variável contínua. 
c. Árvore de decisão é uma estrutura que armazena regras de decisão e possui nós, ramos e 
folhas. Os nós representam as variáveis, os ramos representam os valores possíveis de cada 
nó e as folhas representam o valor final de um nó. 
d. O objetivo da regressão linear é dividir os dados em grupos com base na similaridade dos 
dados (clusters), ou seja, temos dados que são similares dentro de um grupo, porém diferentes 
quando comparados com os dados de outros grupos. 
e. Clustering é uma atividade frequentemente utilizada para agrupar os dados que possuem 
características distintas. 
Feedback 
Your answer is correct. 
A letra “A” errada. O algoritmo de classificação que se baseia nos vizinhos mais próximos é o 
KNN. 
A letra “B” errada. Esse é o objetivo da regressão linear. 
A letra “C” correta. Essa é a definição de árvore de decisão. 
A letra “D” errada. Esse é o objetivo do algoritmo K-means. 
A letra “E” errada. Clustering é uma atividade frequentemente utilizada para agrupar os dados 
que possuem características similares. 
 
 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Em relação às etapas e técnicas de construção do modelo de machine learning, assinale a 
alternativa correta: 
Escolha uma opção: 
a. Feature selection consiste na técnica de criar variáveis a partir de um conjunto de dados para 
melhorar a performance do modelo. 
b. Feature engineering é uma técnica utilizada para selecionar os atributos mais relevantes que 
serão utilizados para treinar o modelo. 
c. A técnica da normalização é utilizada para treinar e validar um modelo com o mesmo 
conjunto de dados. 
d. Cross-validation é uma técnica utilizada na fase de pré-processamento dos dados. 
e. Divisão dos dados em treino e teste é uma técnica usada na fase de pré-processamento dos 
dados. 
Feedback 
Your answer is correct. 
A letra “A” está errada. A técnica descrita é a feature engineering. 
A letra “B” está errada. A técnica descrita é a feature selection. 
A letra “C” está errada. Cross-validation é a técnica utilizada para treinar e validar um modelo 
com o mesmo conjunto de dados. A normalização é usada para padronizar os dados que 
contêm variáveis em diferentes escalas. 
A letra “D” está errada. Cross-validation é uma técnica utilizada durante a fase de 
aprendizagem (treinamento do modelo). 
A letra “E” está correta. A divisão dos dados em treino e teste é uma técnica usada na fase de 
pré-processamento dos dados, assim como a feature selection, a feature engineering, 
a normalização e a redução da dimensionalidade. 
 
 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta a sequência das etapas usadas na construção do modelo 
preditivo: 
Escolha uma opção: 
a. Avaliação do modelo, pré-processamento dos dados, aprendizagem e predição. 
b. Pré-processamento dos dados, avaliação do modelo, predição e aprendizagem. 
c. Avaliação do modelo, pré-processamento dos dados, predição e aprendizagem. 
d. Pré-processamento dos dados, aprendizagem, avaliação do modelo e predição. 
e. Predição, avaliação do modelo, pré-processamento dos dados e aprendizagem. 
Feedback 
Your answer is correct. 
A alternativa correta é a letra “D”. As etapas usadas na construção do modelo preditivo 
correspondem à seguinte sequência: pré-processamento dos dados, aprendizagem 
(construção do modelo), avaliação do modelo e predição. 
Iniciado em domingo, 17 jul 2022, 11:25 
Estado Finalizada 
Concluída em domingo, 17 jul 2022, 11:26 
Tempo empregado 1 minuto 9 segundos 
Notas 4,00/4,00 
Avaliar 20,00 de um máximo de 20,00(100%) 
Questão 1 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta a sequência das etapas do processo de análise de dados 
em linguagem R: 
Escolha uma opção: 
a. Obtenção dos dados, exploração dos dados, transformação dos dados obtidos, definição do 
problema, visualização dos resultados e avaliação dos resultados. 
b. Obtenção dos dados, definição do problema, transformação dos dados obtidos e 
visualização dos resultados. 
c. Definição do problema, obtenção dos dados, transformação dos dados obtidos, exploração 
dos dados e visualização dos resultados. 
d. Obtenção dos dados, exploração dos dados, definição do problema, transformação dos 
dados obtidos e visualização dos resultados. 
e. Obtenção dos dados, definição do problema, exploração dos dados, transformação dos 
dados obtidos, visualização dos resultados e avaliação dos resultados. 
Feedback 
Your answer is correct. 
A alternativa correta é a letra “C”. As etapas do processo de análise de dados em linguagem R 
são: definição do problema, obtenção dos dados, transformação dos dados obtidos, exploração 
dos dados e visualização dos resultados. 
Questão 2 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Com relação às funções usadas nas etapas do processo de análise de dados, assinale a 
alternativa correta: 
Escolha uma opção: 
a. Para utilizar a função “read.csv()”, é necessário inserir o parâmetro “file”, que é o diretório do 
arquivo que se deseja carregar. 
b. O parâmetro “sep” representa o separador das casas decimais. 
c. A função “view()” permite uma melhor apresentação em formato de gráfico. 
d. Com a função “dim()”, é possível recuperar algumas informações do dataset, como valor 
mínimo, máximo e média. 
e. A função “summary()” verifica o número de observações e colunas do dataset. 
Feedback 
Your answer is correct. 
A letra “A” está correta. Para utilizar a função “read.csv()”, é necessário inserir o parâmetro 
“file”, que é o diretório do arquivo que se deseja carregar. 
A letra “B” está errada. O parâmetro “dec()” que representa o separador das casas decimais. 
A letra “C” está errada. A função “view()” permite uma melhor apresentação em formato de 
tabela. 
A letra “D”está errada. A função “dim()” verifica o número de observações e colunas 
do dataset. 
A letra “E” está errada. A função “summary()” recupera informações do dataset, como valor 
mínimo, máximo e média. 
 
 
Questão 3 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Assinale a alternativa que apresenta a sequência das etapas necessárias para a construção do 
modelo preditivo: 
Escolha uma opção: 
a. Definição do problema, preparação dos dados, análise exploratória, construção do modelo, 
visualização dos resultados e avaliação dos resultados. 
b. Análise exploratória, definição do problema, obtenção dos dados, construção do modelo e 
visualização dos resultados. 
c. Obtenção dos dados, preparação dos dados, definição do problema, construção do modelo e 
análise exploratória. 
d. Definição do problema, obtenção dos dados, preparação dos dados, análise exploratória, 
construção do modelo e visualização dos resultados. 
e. Obtenção dos dados, definição do problema, preparação dos dados, análise exploratória, 
construção do modelo, visualização dos resultados e avaliação dos resultados. 
Feedback 
Your answer is correct. 
A alternativa correta é a letra “D”. As etapas necessárias para a construção do modelo preditivo 
são: definição do problema, obtenção dos dados, preparação dos dados, análise exploratória, 
construção do modelo e visualização dos resultados. 
Questão 4 
Correto 
Atingiu 1,00 de 1,00 
Marcar questão 
Texto da questão 
Considerando a aplicação da linguagem R na análise de dados para o modelo preditivo, 
assinale a alternativa correta: 
Escolha uma opção: 
a. É possível verificar se a divisão foi feita corretamente com a função “predict()”. 
b. Para treinar a construção do modelo preditivo, primeiro, é necessário dividir os dados em 
treino e teste. Para isso, deve-se usar o pacote “caTools”, que tem a função “sample.split()”. 
c. Para dividir o dataset em treino e teste, deve-se utilizar a função “train_test_split()” do pacote 
“caret”. 
d. A função “predict()” é utilizada para calcular o desempenho do modelo. 
e. O parâmetro “bestTune” da função “train()” é utilizado para testar diferentes valores de um 
determinado parâmetro. 
Feedback 
Your answer is correct. 
A letra “A” está errada. A função “predict()” é utilizada para gerar novas previsões. Para 
verificar se a divisão foi feita corretamente, é usada a função “dim()”. 
A letra “B” está correta. A construção do modelo preditivo tem como passo inicial a divisão dos 
dados em treino e teste. Essa operação é possível com a utilização do pacote “caTools”, no 
qual há a função “sample.split()”. 
A letra “C” está errada. Atualmente, não existe a função “train_test_split()” no pacote “caret”. 
A letra “D” está errada. É a função “confusionMatrix()” que possibilita calcular o desempenho do 
modelo. 
A letra “E” está errada. Para testar diferentes valores de um determinado parâmetro, utiliza-se 
o parâmetro “tuneGrid” da função “train()”.

Continue navegando