Baixe o app para aproveitar ainda mais
Prévia do material em texto
AV Técnicas estatísticas: teoria e prática (R Programing) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) Existe uma série de gráficos que podem ser utilizados como recursos de visualização de dados para apresentação de resultados de análise de dados. Com relação aos tipos de gráficos, avalie as afirmativas a seguir. I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada. II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, tanto nominais quanto discretas. III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual informações de variáveis qualitativas. IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que tenham alguma dependência entre si. V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser realizada com o uso de um diagrama de dispersão bidimensional. Assinale as alternativas que contém as afirmativas CORRETAS. Alternativas: • I, II e IV. • III, IV e V. • II, IV e V. • II, III e V. • I, III e IV. checkCORRETO Resolução comentada: Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, também podem apresentar frequências absolutas. Um gráfico de série temporal é apropriado para apresentar resultados coletados ao longo do tempo, de um determinado período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em determinado período é o gráfico de dispersão unidimensional. Código da questão: 47609 2) Sobre o uso da linguagem de programação R para elaboração de gráficos estatísticos, avalie as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa. ( ) O RStudio é uma IDE (Ambiente de Desenvolvimento Integrado) para uso da linguagem R. ( ) O RStudio tem uma série de facilidades que ajudam na manipulação da linguagem R para elaboração de gráficos. ( ) O comando barplot( ) é utilizado para elaborar gráfico de setores com a linguagem R. ( ) A opção “ylab=” de um comando R é usada para inserir rótulo no eixo horizontal de um gráfico. ( ) O comando stripchart( ) é usado para produzir gráfico de séries temporais no R. Assinale a alternativa que contenha a sequência correta: Alternativas: • V – V – F – F – F. checkCORRETO • V – V – F – V – F. • F – V – F – V – F. • F – F – F – F – F. • V – V – V – V – V. Resolução comentada: O RStudo é uma IDE para uso da linguagem R e apresenta uma série de facilidades em seu uso. O comando barplot( ) é usado para elaborar gráficos de colunas com o R. A opção “ylab=” é usada em comandos de elaboração de gráficos para inserir rótulos no eixo vertical. O comando stripchart( ) é utilizado para produzir gráficos de dispersão unidimensional. Código da questão: 47610 3) A linguagem R, quando utilizada para cálculos mais complexos, necessita fazer uso do conceito de objeto ou variável para a correta manipulação de dados. Com base no texto, avalie as afirmativas sobre e assinale (V), se verdadeiras, e (F), se falsas. ( ) Objeto ou variável é uma estrutura pré-definida que recebe um valor ou resultado de um comando. ( ) A criação de um objeto só pode ser feita através do uso do símbolo de atribuição “<-“. ( ) O nome de um objeto só pode ser iniciado com letra, maiúscula ou minúscula. ( ) Ao digitar o comando 15 -> y.A está sendo criado o objeto com nome 15 que recebe o conteúdo y.A . Referência: OLIVEIRA, P.F.; GUERRA, S.; McDONNELL, R. Ciência de dados com R: introdução. Brasília: IBPAD. 2018. Disponível em: https://www.ibpad.com.br/o-que- fazemos/publicacoes/introducao-ciencia-de-dados-com-r#download. Acesso em: 28 jun. 2019. Assinale a alternativa que contenha a sequência CORRETA: Alternativas: • V – F – V – F. checkCORRETO • F – F – V – V. • F – V – F – V. • V – V – F – F. • F – F – F – F. Resolução comentada: A sequência correta é V – F – V – F. A definição de objeto, segundo Oliveira, Guerra e McDonnell (2018, p. 15), é “uma estrutura pré-definida que ‘recebe’ algum valor”. Para criar um objeto através da atribuição de valores ou conteúdos, basta utilizar os símbolos <- ou =, e, para ser nomeado, um objeto necessariamente precisa ter nome iniciado por letra, maiúscula ou minúscula, tanto faz. Ao digitar o comando 15 -> y.A está sendo criado o objeto com nome y.A, que recebe o conteúdo 15. Código da questão: 47600 4) Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo de padrão existente, assim como a identificação de possíveis erros. Como é denominada a metodologia estatística utilizada na primeira etapa de uma análise de dados? Assinale a alternativa CORRETA.. Alternativas: • Inferência estatística. • Estatística descritiva. checkCORRETO • Causalidade. • Amostragem. • Teste de hipóteses. Resolução comentada: Toda análise de dados é iniciada com uma exploração dos dados. As técnicas utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva. Código da questão: 47592 5) A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre esta linguagem de programação, avalie as afirmativas a seguir. I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) que foram elaboradas para facilitar o seu uso. II. A IDE RStudio tem interface dividida em três partes. III. Um dos pacotes que permite elaboração de tabelas de frequências é o crosstab. IV. O comando “summary( )” é utilizado para se obter medidas resumo das variáveis de um conjunto de dados. V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis quantitativas. Assinale a alternativa que apresenta a sequência CORRETA. Alternativas: • I e IV. checkCORRETO • I, II e IV. • II, III e IV. • IV e V. • II e III. Resolução comentada: A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o seu uso. A IDE RStudio tem interface dividida em quatro partes. Um dos pacotes da linguagem R que permite a elaboração de tabelas de frequências é o “descr”. O comando “summary( )” é utilizado para obter medidas resumo de variáveis de um conjunto de dados. A função “fisher.test( )” é utilizada para verificar associação entre variáveis qualitativas. Código da questão: 47604 6) O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho.V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: • III, IV e V. • I, IV e V. • III e V. • II, III e IV. checkCORRETO • I, II e IV. Resolução comentada: As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código. Código da questão: 47599 7) Os modelos preditivos podem ser implementados em linguagem R de diversas formas. Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as afirmativas a seguir. I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes iguais. II. A função factor( ) converte uma variável para quantitativa. III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um conjunto de dados. V. A função table( ) cria uma tabela de resultados de variáveis. Assinale a alternativa que contém as afirmativas CORRETAS. Alternativas: • III, IV e V, apenas. • I, II, III, IV e V. • III e V, apenas. checkCORRETO • I, II e IV, apenas. • I, II e III, apenas. Resolução comentada: Para criar um modelo de classificação, divide-se o banco de dados em duas partes, onde 70% fica em uma delas e 30% na outra. A função factor( ) converte uma variável para categórica. A função summary( ) exibe resumo descritivo das variáveis do banco de dados. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona 70% das colunas de um conjunto de dados. A função table( ) cria uma tabela de resultados de variáveis. Código da questão: 47619 8) O uso de recurso gráfico para apresentação de resultados de análise de dados é uma boa opção quando se deseja atingir um amplo público e, também, quando se deseja facilitar a compreensão dos resultados encontrados. É uma forma rápida de divulgação de informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017) listaram alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca de padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da esquerda para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o que pode ser concluído desta visualização? BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa CORRETA. Alternativas: • Os dados plotados apresentam variância negativa. • Os dados plotados não são apropriados para o tipo de gráfico. • Os dados plotados não têm correlação entre eles. • Os dados plotados têm correlação negativa entre eles. • Os dados plotados apresentam correlação positiva entre eles. checkCORRETO Resolução comentada: Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda para a direita, há um indício de que os dados plotados apresentam correlação positiva entre eles. Código da questão: 47607 9) Sobre criação de bancos de dados em ambiente R, avalie as afirmações a seguir e assinale (V) para verdadeira e (F) para falsa. ( ) Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz. ( ) O comando para selecionar as duas primeiras colunas de conjuntos de dados denominado “dados” é dados[1:3]. ( ) O comando R para selecionar uma variável de um banco de dados é igual a “nome_variável$dados”. ( ) Para juntar vetores em colunas, utiliza-se a função cbind( ) em linguagem R. ( ) O comando aggregate( ) resume variáveis quantitativas segundo algumas variáveis categórica. Assinale a alternativa que contenha a sequência correta: Alternativas: • V – V – V – V – V. • F – V – V – F – F. • V – F – F – V – V. checkCORRETO • F – F – F – F – F. • F – V – F – V – F. Resolução comentada: Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz, porque pode conter diversos tipos de variáveis. O comando que seleciona as duas primeiras colunas de um conjunto chamado “dados” é dados[1:2]. O comando que seleciona uma variável do conjunto “dados” é dados$nome_variável. A junção de vetores em colunas é feita com o uso do comando cbind( ). O comando aggregate( ) resume variáveis quantitativas em médias, por exemplo, segundo alguma outra variável categórica. Código da questão: 47615 10) A classe de modelos preditivos é diversa e, também, classificada segundo os objetivos que se tem com os dados. A esse respeito, avalie a afirmativa a seguir para completar corretamente suas lacunas. Os modelos preditivos são uma classe de modelos ____________ utilizados para representarem __________ para tomada de decisão. Os modelos preditivos para ____________ também são conhecidos como modelos de _____________ supervisionada. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: • Constantes; problemas; classificação; aprendizagem. • Estatísticos; problemas; classificação; atividade. • Visuais; problemas; equação; atividade. • Visuais; fórmulas; equação; atividade. • Matemáticos; problemas; classificação; aprendizagem. checkCORRETO Resolução comentada: Os modelos preditivos são uma classe de modelos matemáticos utilizados para representarem problemas para tomada de decisão. Os modelos preditivos para classificação também são conhecidos como modelos de aprendizagem supervisionada. Código da questão: 47618 AV Técnicas estatísticas: teoria e prática (R Programing)
Compartilhar