Ciclo de Vida e introdução a linguagem R

Introdução A Linguagem R

•

ESTÁCIO

Bielan Camilo Neres

22/08/2019

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

R
	Big Data é:
	a) Volume + variedade + agilidade + efetividade, tudo agregando + valor + atualidade.
	b) Volume + oportunidade + segurança + veracidade, tudo agregando + valor.
	c) Dimensão + variedade + otimização + veracidade, tudo agregando + agilidade.
	x	d) Volume + variedade + velocidade + veracidade, tudo agregando + valor.
	e) Volume + disponibilidade + velocidade + portabilidade, tudo requerendo - valor.
	Um técnico de TI precisa utilizar um subconjunto de dados de um Data Warehouse direcionado à área administrativa de um Tribunal. 
Esses dados serão armazenados em um banco de dado modelado multidimensionalmente, que será criado capturando-se dados diretamente de sistemas transacionais, buscando as informações relevantes para os processos de negócio da área administrativa. Esse banco de dados será um:
	a) OLAP.
	b) MOLAP.
	c) Data Mining.
	d) Big Data.
	x	e) Data Mart.
	Trata-se de uma infinidade de informações não estruturadas que, quando usadas com inteligência, se tornam uma arma poderosa para empresas tomarem decisões cada vez melhores. As soluções tecnológicas que trabalham com esse conceito permitem analisar um enorme volume de dados de forma rápida e ainda oferecem total controle ao gestor das informações. E as fontes de dados são as mais diversas possíveis: de textos e fotos em rede sociais, passando por imagens e vídeos, até jogadas específicas no esporte e até tratamentos na medicina.
	O conceito definido no texto é:
	a) Governança de TI.
	b) QoS.
	x	c) Big Data.
	d) Data Center.
	e) ITIL.
	Um termo está associado a uma coleção de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão. É implementado por meio de um banco de dados contendo dados extraídos do ambiente de produção da empresa, que foram selecionados e depurados, tendo sido otimizados para processamento de consulta e não para processamento de transações. Em geral, requer a consolidação de outros recursos de dados além dos armazenados em base de dados relacionais, incluindo informações provenientes de planilhas eletrônicas e documentos textuais. Seu objetivo é fornecer uma "imagem única da realidade do negócio". De uma forma geral, são sistemas que compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários. O termo aqui tratado define o conceito de:
	a) Data Mining.
	x	b) Data Warehouse.
	c) Data Systems.
	d) Data Business.
	e) Data Processing.
	A expressão Big Data é utilizada para descrever o contexto da informação contemporânea, caracterizada pelo volume, velocidade e variedade de dados disponíveis, em escala inédita.
	Com relação às características do Big Data, analise as afirmativas a seguir:
	I. O volume da informação se refere ao fato de que certas coleções de dados atingem a faixa de gigabytes (bilhões de bytes), terabytes (trilhões), petabytes (milhares de trilhões) ou mesmo exabytes (milhões de trilhões).
	II. A velocidade está relacionada à rapidez com a qual os dados são produzidos e tratados para atender á demanda, o que significa que não é possível armazená-los todos, de modo que somos obrigados a escolher dados para guardar e outros para descartar.
	III. A variedade significa que os dados de hoje aparecem em todos os tipos de formatos, como, por exemplo, arquivos de texto, e-mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado ou transações financeiras.
	a) Se somente a afirmativa I estiver correta.
	b) Se somente a afirmativa II estiver correta.
	c) Se somente a afirmativa III estiver correta.
	d) Se somente as afirmativas I e II estiverem corretas.
	x	e) Se todas as afirmativas estiverem corretas.
	“Hoje, 4 bilhões de pessoas têm celular, mas apenas 1,5 bilhão acessam a Internet. Em alguns anos, qualquer pessoa, não importa onde viva, participará e usará ferramentas com o Twitter”. (Stone, Biz, Veja).
	A declaração enfoca o sistema que permite a publicação, em tempo real, de mensagens curtas, chamado Twitter. Além da conectividade entre os seus usuários, o recurso tecnológico descrito apoia-se, principalmente, no aspecto da:
	a) Espontaneidade.
	b) Solidariedade.
	x	c) Instantaneidade.
	d) Reversibilidade.
	e) Impessoalidade.
	Para o processamento de grandes massas de dados, no contexto de Big Data, é muito utilizada uma plataforma de software em Java, de computação distribuída, voltada para clusters, inspirada no MapReduce e no GoogleFS. Esta plataforma é o(a):
	a) Yam Common.
	b) Google Crush.
	c) EMRx.
	x	d) Hadoop.
	e) Map Fix.
	Um programador visual, responsável pelo site de sua empresa, precisa escolher uma ferramenta que forneça soluções de análise de resultados do site (web analytics), através de números significativos sobre visitação e navegação de seus usuários.
	Nesse caso, o serviço que esse profissional deverá escolher é o:
	a) Google Trends.
	x	b) Omniture.
	c) Google Adwords.
	d) IBOPE Online.
	e) Nielsen Broadcast Data System.
	A estatística descritiva:
	a) Permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
	b) É um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
	x	c) É a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes.
	d) É a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever os fenômenos aleatórios ou seja, aqueles em que está presente a incerteza.
	e) É a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
	“Costuma ser encontrada com maior frequência em jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de simplificar informações.” O texto faz referência à:
	a) Estatística inferencial.
	b) Estatística de probabilidade.
	c) Estatística por amostragem.
	x	d) Estatística descritiva.
	e) Estatística aritmética.
	Estatística é a parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para utilização dos mesmos na tomada de decisões. Com relação ao trabalho estatístico, assinale a alternativa incorreta.
	a) Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística.
	b) Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são denominados dados absolutos.
	c) Amostragem casual ou aleatória simples é semelhante a um sorteio lotérico.
	d) Variável discreta é aquela que só pode assumir valores pertencentes a um conjunto enumerável. Ex: contagem de documentos.
	x	e) Uma população é um subconjunto finito de uma amostra.
	Para selecionar uma amostra aleatória de tamanho n de uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N / n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denomina-se amostragem:
	x	a) Sistemática.
	b) Por etapas.
	c) Estratificada.
	d) Aleatória simples.
	e) Por quotas.
	O R possui basicamente quatro tipos de dados, que são:
	a) Vetores, listas, caracteres, lógicos.
	b) Listas, caracteres, lógicos, tabelas.
	c) Caracteres,
lógicos, tabelas, números complexos.
	x	d) Numéricos, caracteres, lógicos, números complexos.
	e) Vetores, listas, tabelas, numéricos.
	A variável especial que armazena o último valor inserido em uma variável é:
	x	a) .Last.value.
	b) .Last.number.
	c) .First.value.
	d) .First.number.
	e) .This.value
	O comando abaixo em R produzirá como saída:
	> seq(from=1,to=10,by=1.5)
	a) [1] 1.0 1.5 3.0 4.5 6.0 8.5 10.0.
	b) [1] 1.0 1.5 4.5 5.5 7.0 8.5 10.0.
	c) [1] 1.0 2.5 4.5 5.5 7.0 8.5 10.0.
	d) [1] 1.0 2.5 5.0 6.5 7.5 8.5 10.0.
	x	e) [1] 1.0 2.5 4.0 5.5 7.0 8.5 10.0.
	O comando abaixo em R produz como saída:
	> A <- matrix(c(1:10),2,5,1)
	> A
	a) 1    3    5    7    9
	    2    4    6    8    10
	x	b) 1    2    3    4    5
	    6    7    8    9    10
	c) 1    4    6    8    10
	    2    3    5    7    9
	d) 1    2    5    6    9
	    3    4    7    8    10
	e) 1    2    3    4    5
	    10    9    8    7    6
	A respeito de gráficos estatísticos, assinale a alternativa correta.
	a) A representação em um gráfico de linhas, utiliza símbolos relacionados à ideia central dos dados que se deseja representar. Nesse gráfico, as barras são substituídas pelos símbolos e a quantidade de símbolos em cada “barra” corresponde à frequência relativa.
	b) Em um gráfico de colunas, as alturas de cada retângulo independem dos dados.
	x	c) Dados que estejam organizados apenas em uma coluna ou linha, em uma planilha, podem ser plotados em um gráfico de setor e os setores representam as proporções das categorias.
	d) Um gráfico de barras apresenta a frequência absoluta (ou relativa) cumulativa.
	e) Em um gráfico de linhas, os dados de categorias são distribuídos uniformemente ao longo do eixo vertical, e todos os valores são distribuídos igualmente ao longo do eixo horizontal.
	Observe os gráficos e analise as afirmações I, II e III.
	I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001, foi igual a 50%.
	II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior.
	III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à distância foi de 2 para 5.
	É correto o que se afirma em:
	a) I e II, apenas.
	b) II, apenas.
	c) I, apenas.
	x	d) II e III, apenas.
	e) I, II e III.
	Associe a série de dados estatísticos com o tipo de gráfico mais adequado para apresentá-la.
	SÉRIE DE DADOS
	S1: Evolução do número de processos mensais protocolados;
	S2: Participação de cada bairro de um município nos processos protocolados;
	S3: Quantidade de funcionários de uma repartição pública por faixa etária.
	GRÁFICOS
	G1: Gráfico Setorial;
	G2: Gráfico de linhas;
	G3: Histograma.
	Marque a alternativa CORRETA:
	a) (S1,G1);(S2,G2);(S3,G3).
	b) (S1,G3);(S2,G1);(S3,G2).
	c) (S1,G2);(S2,G3);(S3,G2).
	d) (S1,G1);(S2,G3);(S3,G2).
	x	e) (S1,G2);(S2,G1);(S3,G3).
	Assinale a alternativa que representa a nomenclatura dos três gráficos abaixo, respectivamente.
	x	a) Gráficos de Barras – Gráfico de Setores – Gráfico de Linha.
	b) Gráfico de Setores – Gráfico de Barras – Gráfico de Linha.
	c) Gráfico de Pareto – Gráfico de Pizza – Gráfico de Tendência.
	d) Gráfico de Linhas – Gráfico de Pizza – Gráfico de Barras.
	e) Gráfico de Tendência – Gráfico de Setores – Gráfico de Linha.
	A estatística descritiva:
	a) Permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
	b) É um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento.
	x	c) É a etapa inicial da análise, utilizada para, descrever e resumir os dados, que foi revigorada pela disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes.
	d) É a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever os fenômenos aleatórios ou seja, aqueles em que está presente a incerteza.
	e) É a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra.
	Observe as fórmulas:
	Assinale a alternativa que contém, correta e respectivamente, os nomes dos cálculos estatísticos.
	a) Média aritmética e desvio padrão.
	x	b) Média aritmética e média ponderada.
	c) Média ponderada e média geométrica.
	d) Média ponderada e média aritmética.
	e) Média ponderada e desvio padrão.
	Um analista de computação ao se deparar com um problema de estatística descritiva, sabe de antemão que o(s) valor(es):
	a) da moda é sempre maior ou igual que a média.
	b) da média é sempre maior que a mediana.
	c) da média é sempre maior que a moda.
	d) da mediana é sempre maior ou igual que a moda.
	x	e) de média, mediana e moda podem ser iguais.
	Em relação à estatística descritiva, pode-se afirmar que:
	I) A mediana não é afetada pelos valores extremos.
	II) A moda é o valor com maior frequência de ocorrência de dados.
	III) A média é afetada por todos os itens da amostra.
	As afirmações verdadeiras são:
	a) Apenas I e II.
	b) Apenas I e III.
	c) Apenas II e III.
	x	d) I, II e III.
	e) Apenas III.
	Assinale a alternativa que preenche, correta e respectivamente, os espaços. Se o tamanho da população for N = 20, cada uma das observações terá ______________1/20, se for escolhida para integrar a amostra _____________.
	a) Variáveis ... aleatória.
	b) Intervalo... aleatória.
	c) Probabilidade ... aleatória.
	x	d) Probabilidade ... probabilística.
	e) Intencionalidade ... probabilística.
	Em estatística, a técnica que nos permite fazer inferências sobre uma população, a partir da análise de uma parte dela, denomina-se:
	a) Dedução.
	x	b) Amostragem.
	c) Probabilidade.
	d) Descrição.
	e) Extração.
	A probabilidade de um evento A ocorrer é de p% e a probabilidade de um evento B ocorrer é de q%. Qual é a probabilidade de não ocorrer A e de não ocorrer B simultaneamente?
	a) 2 x p x q.
	b) (1+p) x (1+q).
	x	c) (1-p) x (1-q).
	d) (1-p) x (1+q).
	e) p x (q-1).
	Em uma empresa carioca, foi feita uma pesquisa sobre o time de futebol preferido por cada funcionário, e o resultado está na tabela abaixo:
	Times	Número funcionários
	Botafogo	52
	Flamengo	102
	Vasco	65
	Fluminense	70
	Não opinaram	11
	Escolhendo ao acaso um funcionário, a probabilidade de que ele seja Flamenguista é:
	a) 31%.
	b) 40%.
	c) 43%.
	d) 37%.
	x	e) 34%
	Para o seguinte trecho de código abaixo, marque a alternativa correta:
	> x = vector()
	> tab = 3
	> for(i in 1:10)
	> x[i] = i*tab
	> x
	a) Os valores de x serão: 4 6 8 10 12 14 16 18 20 22 24 26 28 30.
	b) Os valores de x serão: 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36.
	c) Os valores de x serão: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20.
	d) O próximo comando depois da execução dessa estrutura terá 20 como o valor da variável x.
	x	e) Os valores de x serão: 3 6 9 12 15 18 21 24 27 30.
	Para o seguinte trecho de código abaixo, marque a alternativa correta que representa os valores de saída da função:
	exemplo2.funcao = function(x, y) {
	  z1 <- 2*x + y
	  z2 <- x + 2*y
	  z3 <- 2*x + 2*y
	  z4 <- x/y
	  c(z1, z2, z3, z4)
	}
	exemplo.funcao(1,2)
	x	a) [1] 4.0 5.0 6.0 0.5.
	b) [1] 5.0 4.0 6.0 0.5.
	c) [1] 6.0 4.0. 5.0 1.0.
	d) [1] 6.0 5.0 4.0 1.0.
	e) [1] 4.0 5.0 6.0 1.0.
	Para o seguinte trecho de código abaixo, marque a alternativa correta que representa o valor de saída da função:
	z=0
	exemplo3.funcao = function(x) {
	  for(i in c(1, 3, 6, 9)) {
	     if (i>x) {
	      z <- z + i + 1
	     }
	   }
	   z
	}
	exemplo3.funcao(5)
	a) 7.
	b) 10.
	c) 15.
	x	d) 17.
	e) 11.
	Para o seguinte trecho de código abaixo, marque a alternativa correta
que representa o valor de saída da função:
	exemplo4.funcao = function(x) {
	 i <- 0
	 y=0
	 while (i < x) {
	   i <- i+1
	   y <- i*2
	 }
	 y*2
	}
	exemplo4.funcao(3)
	a) 6.
	b) 3.
	x	c) 12.
	d) 15.
	e) 4.