Buscar

AV Tecnicas estatisticas- teoria e pratica (R Programing)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

AV 
Técnicas estatísticas: teoria e prática (R 
Programing) 
 
 
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A 
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média 
final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente 
corrigidas. Você pode responder as questões consultando o material de estudos, mas 
lembre-se de cumprir o prazo estabelecido. Boa prova! 
1) 
Existe uma série de gráficos que podem ser utilizados como recursos de visualização de 
dados para apresentação de resultados de análise de dados. Com relação aos tipos de 
gráficos, avalie as afirmativas a seguir. 
I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada. 
II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, 
tanto nominais quanto discretas. 
III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual 
informações de variáveis qualitativas. 
IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao 
longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que 
tenham alguma dependência entre si. 
V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser 
realizada com o uso de um diagrama de dispersão bidimensional. 
Assinale as alternativas que contém as afirmativas CORRETAS. 
 
Alternativas: 
• I, II e IV. 
• III, IV e V. 
• II, IV e V. 
• II, III e V. 
• I, III e IV. 
checkCORRETO 
Resolução comentada: 
Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que 
será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis 
categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para 
apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, 
também podem apresentar frequências absolutas. Um gráfico de série temporal é 
apropriado para apresentar resultados coletados ao longo do tempo, de um determinado 
período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em 
determinado período é o gráfico de dispersão unidimensional. 
Código da questão: 47609 
2) 
Sobre o uso da linguagem de programação R para elaboração de gráficos estatísticos, avalie 
as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa. 
( ) O RStudio é uma IDE (Ambiente de Desenvolvimento Integrado) para uso da linguagem R. 
( ) O RStudio tem uma série de facilidades que ajudam na manipulação da linguagem R para 
elaboração de gráficos. 
( ) O comando barplot( ) é utilizado para elaborar gráfico de setores com a linguagem R. 
( ) A opção “ylab=” de um comando R é usada para inserir rótulo no eixo horizontal de um 
gráfico. 
( ) O comando stripchart( ) é usado para produzir gráfico de séries temporais no R. 
Assinale a alternativa que contenha a sequência correta: 
 
Alternativas: 
• V – V – F – F – F. 
checkCORRETO 
• V – V – F – V – F. 
• F – V – F – V – F. 
• F – F – F – F – F. 
• V – V – V – V – V. 
Resolução comentada: 
O RStudo é uma IDE para uso da linguagem R e apresenta uma série de facilidades em seu 
uso. O comando barplot( ) é usado para elaborar gráficos de colunas com o R. A opção 
“ylab=” é usada em comandos de elaboração de gráficos para inserir rótulos no eixo vertical. 
O comando stripchart( ) é utilizado para produzir gráficos de dispersão unidimensional. 
Código da questão: 47610 
3) 
A linguagem R, quando utilizada para cálculos mais complexos, necessita fazer uso do 
conceito de objeto ou variável para a correta manipulação de dados. Com base no texto, 
avalie as afirmativas sobre e assinale (V), se verdadeiras, e (F), se falsas. 
( ) Objeto ou variável é uma estrutura pré-definida que recebe um valor ou resultado de um 
comando. 
( ) A criação de um objeto só pode ser feita através do uso do símbolo de atribuição “<-“. 
( ) O nome de um objeto só pode ser iniciado com letra, maiúscula ou minúscula. 
( ) Ao digitar o comando 15 -> y.A está sendo criado o objeto com nome 15 que recebe o 
conteúdo y.A . 
Referência: OLIVEIRA, P.F.; GUERRA, S.; McDONNELL, R. Ciência de dados com R: introdução. 
Brasília: IBPAD. 2018. Disponível em: https://www.ibpad.com.br/o-que-
fazemos/publicacoes/introducao-ciencia-de-dados-com-r#download. Acesso em: 28 jun. 
2019. 
Assinale a alternativa que contenha a sequência CORRETA: 
 
Alternativas: 
• V – F – V – F. 
checkCORRETO 
• F – F – V – V. 
• F – V – F – V. 
• V – V – F – F. 
• F – F – F – F. 
Resolução comentada: 
A sequência correta é V – F – V – F. A definição de objeto, segundo Oliveira, Guerra e 
McDonnell (2018, p. 15), é “uma estrutura pré-definida que ‘recebe’ algum valor”. Para criar 
um objeto através da atribuição de valores ou conteúdos, basta utilizar os símbolos <- ou =, 
e, para ser nomeado, um objeto necessariamente precisa ter nome iniciado por letra, 
maiúscula ou minúscula, tanto faz. Ao digitar o comando 15 -> y.A está sendo criado o 
objeto com nome y.A, que recebe o conteúdo 15. 
Código da questão: 47600 
4) 
Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com 
rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A 
primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo de 
padrão existente, assim como a identificação de possíveis erros. Como é denominada a 
metodologia estatística utilizada na primeira etapa de uma análise de dados? 
Assinale a alternativa CORRETA.. 
 
Alternativas: 
• Inferência estatística. 
• Estatística descritiva. 
checkCORRETO 
• Causalidade. 
• Amostragem. 
• Teste de hipóteses. 
Resolução comentada: 
Toda análise de dados é iniciada com uma exploração dos dados. As técnicas utilizadas para 
tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva. 
Código da questão: 47592 
5) 
A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre esta 
linguagem de programação, avalie as afirmativas a seguir. 
I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) que foram 
elaboradas para facilitar o seu uso. 
II. A IDE RStudio tem interface dividida em três partes. 
III. Um dos pacotes que permite elaboração de tabelas de frequências é o crosstab. 
IV. O comando “summary( )” é utilizado para se obter medidas resumo das variáveis de um 
conjunto de dados. 
V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis quantitativas. 
Assinale a alternativa que apresenta a sequência CORRETA. 
 
Alternativas: 
• I e IV. 
checkCORRETO 
• I, II e IV. 
• II, III e IV. 
• IV e V. 
• II e III. 
Resolução comentada: 
A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o seu uso. A IDE 
RStudio tem interface dividida em quatro partes. Um dos pacotes da linguagem R que 
permite a elaboração de tabelas de frequências é o “descr”. O comando “summary( )” é 
utilizado para obter medidas resumo de variáveis de um conjunto de dados. A função 
“fisher.test( )” é utilizada para verificar associação entre variáveis qualitativas. 
Código da questão: 47604 
6) 
O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R 
em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. 
I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar 
tal comando apertando a tecla enter. 
II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele 
existente. 
III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à 
internet. 
IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na 
sessão de trabalho.V. Os argumentos de uma função do R não podem ser omitidos quando uma função 
específica for utilizada. 
Assinale a alternativa que contém as afirmativas verdadeiras. 
 
Alternativas: 
• III, IV e V. 
• I, IV e V. 
• III e V. 
• II, III e IV. 
checkCORRETO 
• I, II e IV. 
Resolução comentada: 
As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do 
RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se 
um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para 
instalar um novo pacote, é necessário estar com o computador conectado à internet. Para 
utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em 
curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam 
digitados na ordem em que estão implementados no código. 
Código da questão: 47599 
7) 
Os modelos preditivos podem ser implementados em linguagem R de diversas formas. 
Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as 
afirmativas a seguir. 
I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes 
iguais. 
II. A função factor( ) converte uma variável para quantitativa. 
III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. 
IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um 
conjunto de dados. 
V. A função table( ) cria uma tabela de resultados de variáveis. 
Assinale a alternativa que contém as afirmativas CORRETAS. 
 
Alternativas: 
• III, IV e V, apenas. 
• I, II, III, IV e V. 
• III e V, apenas. 
checkCORRETO 
• I, II e IV, apenas. 
• I, II e III, apenas. 
Resolução comentada: 
Para criar um modelo de classificação, divide-se o banco de dados em duas partes, onde 
70% fica em uma delas e 30% na outra. A função factor( ) converte uma variável para 
categórica. A função summary( ) exibe resumo descritivo das variáveis do banco de dados. A 
função sample(ncol(dados), 0.7*nrow(dados)) seleciona 70% das colunas de um conjunto de 
dados. A função table( ) cria uma tabela de resultados de variáveis. 
Código da questão: 47619 
8) 
O uso de recurso gráfico para apresentação de resultados de análise de dados é uma boa 
opção quando se deseja atingir um amplo público e, também, quando se deseja facilitar a 
compreensão dos resultados encontrados. É uma forma rápida de divulgação de 
informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017) listaram 
alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca de 
padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da esquerda 
para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o que pode 
ser concluído desta visualização? 
BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. 
Assinale a alternativa CORRETA. 
 
Alternativas: 
• Os dados plotados apresentam variância negativa. 
• Os dados plotados não são apropriados para o tipo de gráfico. 
• Os dados plotados não têm correlação entre eles. 
• Os dados plotados têm correlação negativa entre eles. 
• Os dados plotados apresentam correlação positiva entre eles. 
checkCORRETO 
Resolução comentada: 
Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda para a 
direita, há um indício de que os dados plotados apresentam correlação positiva entre eles. 
Código da questão: 47607 
9) 
Sobre criação de bancos de dados em ambiente R, avalie as afirmações a seguir e assinale 
(V) para verdadeira e (F) para falsa. 
( ) Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz. 
( ) O comando para selecionar as duas primeiras colunas de conjuntos de dados 
denominado “dados” é dados[1:3]. 
( ) O comando R para selecionar uma variável de um banco de dados é igual a 
“nome_variável$dados”. 
( ) Para juntar vetores em colunas, utiliza-se a função cbind( ) em linguagem R. 
( ) O comando aggregate( ) resume variáveis quantitativas segundo algumas variáveis 
categórica. 
Assinale a alternativa que contenha a sequência correta: 
 
Alternativas: 
• V – V – V – V – V. 
• F – V – V – F – F. 
• V – F – F – V – V. 
checkCORRETO 
• F – F – F – F – F. 
• F – V – F – V – F. 
Resolução comentada: 
Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz, porque pode 
conter diversos tipos de variáveis. O comando que seleciona as duas primeiras colunas de 
um conjunto chamado “dados” é dados[1:2]. O comando que seleciona uma variável do 
conjunto “dados” é dados$nome_variável. A junção de vetores em colunas é feita com o uso 
do comando cbind( ). O comando aggregate( ) resume variáveis quantitativas em médias, 
por exemplo, segundo alguma outra variável categórica. 
Código da questão: 47615 
10) 
A classe de modelos preditivos é diversa e, também, classificada segundo os objetivos que 
se tem com os dados. A esse respeito, avalie a afirmativa a seguir para completar 
corretamente suas lacunas. 
Os modelos preditivos são uma classe de modelos ____________ utilizados para representarem 
__________ para tomada de decisão. Os modelos preditivos para ____________ também são 
conhecidos como modelos de _____________ supervisionada. 
Assinale a alternativa que completa adequadamente as lacunas acima: 
 
Alternativas: 
• Constantes; problemas; classificação; aprendizagem. 
• Estatísticos; problemas; classificação; atividade. 
• Visuais; problemas; equação; atividade. 
• Visuais; fórmulas; equação; atividade. 
• Matemáticos; problemas; classificação; aprendizagem. 
checkCORRETO 
Resolução comentada: 
Os modelos preditivos são uma classe de modelos matemáticos utilizados para 
representarem problemas para tomada de decisão. Os modelos preditivos para classificação 
também são conhecidos como modelos de aprendizagem supervisionada. 
Código da questão: 47618 
 
 
	AV
	Técnicas estatísticas: teoria e prática (R Programing)

Continue navegando