Baixe o app para aproveitar ainda mais
Prévia do material em texto
14/05/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343529 1/5 Técnicas estatísticas: teoria e prática (R Programing) Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A elaboração de um banco de dados para uma posterior análise estatística não é tão trivial quanto pode parecer. É uma das etapas onde mais tempo se utiliza para o bom andamento de um trabalho de análise de dados. De uma forma simples, é possível afirmar que um banco de dados é um arranjo retangular contendo linhas e, também, colunas. A depender da área de estudo, os elementos dos bancos de dados são denominados de maneira distinta. Por exemplo, os que os estatísticos chamam de “variável” em um banco de dados recebe outro nome, dado pelos profissionais da computação. Que nome é este? Assinale a alternativa CORRETA. Alternativas: Linha. Campo. CORRETO Coluna. Variável. Registro. Código da questão: 47612 A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre esta linguagem de programação, avalie as afirmativas a seguir. I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) que foram elaboradas para facilitar o seu uso. II. A IDE RStudio tem interface dividida em três partes. III. Um dos pacotes que permite elaboração de tabelas de frequências é o crosstab. IV. O comando “summary( )” é utilizado para se obter medidas resumo das variáveis de um conjunto de dados. V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis quantitativas. Assinale a alternativa que apresenta a sequência CORRETA. Alternativas: II e III. II, III e IV. I e IV. CORRETO IV e V. I, II e IV. Código da questão: 47604 Resolução comentada: Os elementos que compõem um banco de dados recebem nomes distintos a depender da área de estudo. Por exemplo, o que os estatísticos chamam de “variável”, os profissionais da computação chamam de “campo”. Resolução comentada: A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o seu uso. A IDE RStudio tem interface dividida em quatro partes. Um dos pacotes da linguagem R que permite a elaboração de tabelas de frequências é o “descr”. O comando “summary( )” é utilizado para obter medidas resumo de variáveis de um conjunto de dados. A função “fisher.test( )” é utilizada para verificar associação entre variáveis qualitativas. 14/05/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343529 2/5 3) 4) O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho. V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: I, IV e V. III, IV e V. III e V. I, II e IV. II, III e IV. CORRETO Código da questão: 47599 A classe de modelos preditivos é diversa e, também, classificada segundo os objetivos que se tem com os dados. A esse respeito, avalie a afirmativa a seguir para completar corretamente suas lacunas. Os modelos preditivos são uma classe de modelos ____________ utilizados para representarem __________ para tomada de decisão. Os modelos preditivos para ____________ também são conhecidos como modelos de _____________ supervisionada. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Visuais; problemas; equação; atividade. Visuais; fórmulas; equação; atividade. Constantes; problemas; classificação; aprendizagem. Estatísticos; problemas; classificação; atividade. Matemáticos; problemas; classificação; aprendizagem. CORRETO Código da questão: 47618 Resolução comentada: As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código. Resolução comentada: Os modelos preditivos são uma classe de modelos matemáticos utilizados para representarem problemas para tomada de decisão. Os modelos preditivos para classificação também são conhecidos como modelos de aprendizagem supervisionada. 14/05/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343529 3/5 5) 6) 7) Para uma pesquisa ser bem realizada, faz-se necessário um bom planejamento de todas as etapas de sua realização. O detalhamento ou planejamento de uma pesquisa pode ser documentado em um projeto de pesquisa. Em uma dessas etapas, deve-se buscar a possível existência de falhas e imperfeições existentes na coleta dos dados. A qual etapa do planejamento estamos nos referindo? Assinale a alternativa CORRETA. Alternativas: Apuração de dados. Coleta de dados. Crítica de dados. CORRETO Amostragem de dados. Apresentação de dados. Código da questão: 47588 Muitos autores discutem sobre o uso de recursos gráficos para apresentação de resultados e apresentam uma série de vantagens. Como exemplo, Chambers et al. (1983 apud Bussab e Morettin, 2017). Considerando esses autores, avalie a afirmativa a seguir para completar suas lacunas corretamente. O uso de recursos gráficos ou visuais é bom para buscar ____________, confirmar ____________ e descobrir novos ____________. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Gráficos; ideias; fenômenos. Padrões; hipóteses; gráficos. Dados; hipóteses; dados. Padrões; hipóteses; fenômenos. CORRETO Gráficos; ideias; gráficos. Código da questão: 47608 Existem diversas maneiras de elaboração de um banco de dados em linguagem R. Sobre esta característica, avalie as afirmativas a seguir. I. As estruturas de arranjos de dados em linguagem R são classificadas como escalares, vetores, matrizes, arrays, data frames e listas. II. Um banco de dados escalar em linguagem R tem dimensão de uma linha e várias colunas. III. Um banco de dados do tipo data frame pode possuir diversos tipos de variáveis. IV. Em linguagem R, as variáveis categóricas são classificadas como factor. V. Em linguagem R, denomina-se objeto qualquer elemento que possa ser atribuído a uma variável. São verdadeiras: Resolução comentada: Na etapa de crítica de dados de uma pesquisa é onde ocorre a busca de falhas e imperfeições. Nessa etapa, os dados precisam ser criticados, de maneira cuidadosa, para que não ocorram erros grosseiros em análises posteriores. Resolução comentada: O uso de recursos gráficos ou visuais é bom para buscar padrões, confirmarhipóteses e descobrir novos fenômenos. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). 14/05/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343529 4/5 8) 9) Alternativas: I, II, IV e V, apenas. III e V, apenas. I, III, IV e V, apenas. CORRETO IV e V, apenas. I, II e IV, apenas. Código da questão: 47614 I. A execução de um comando em linguagem R requer conhecimento apropriado sobre criação de funções e objetos para o seu uso adequado. Também é necessário ter um conhecimento razoável sobre a linguagem. PORQUE II. É possível realizar os cálculos diferentes com comandos de execução diversos, ou seja, é possível realizar “caminhos” distintos para se obter os mesmos resultados. Analisando as afirmações acima, conclui-se que: Alternativas: As duas afirmações são falsas. As duas afirmações são verdadeiras e a segunda justifica a primeira. A primeira afirmação é falsa e a segunda é verdadeira. A primeira afirmação é verdadeira e a segunda é falsa. As duas afirmações são verdadeiras e a segunda não justifica a primeira. CORRETO Código da questão: 47601 As técnicas de amostragem foram criadas para garantir que subconjuntos de populações possam representar de maneira adequada alguma característica do todo. Diversas técnicas foram criadas e são utilizadas de acordo com o desenho da pesquisa de interesse. A respeito das técnicas de amostragem, avalie as afirmativas a seguir. I. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. II. A amostragem probabilística não pode atribuir probabilidade na seleção dos elementos da amostra. III. Um dos critérios de seleção dos elementos de uma amostra probabilística é a arbitrariedade. IV. A amostragem sistemática compõe o conjunto de técnicas probabilísticas de amostragem. V. A amostragem por cotas compõe o conjunto de técnicas não probabilísticas de amostragem. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: I, IV e V. CORRETO III e IV. Resolução comentada: As estruturas de bancos de dados existentes em linguagem R são escalares, vetores, matrizes, arrays, data frames e listas. Um banco de dados escalar tem dimensão de uma linha e uma coluna, apenas. Um banco de dados do tipo data frame pode conter vários tipos de variáveis. As variáveis categóricas, em linguagem R, são classificadas como factor e denomina-se objeto qualquer elemento que possa ser atribuído a uma variável. Resolução comentada: É possível obter resultados semelhantes e fazer as mesmas análises com procedimentos distintos no R. Essa é uma das vantagens que a linguagem possui. Cálculos diferentes ou diversos também podem ser realizados com programação diversa. 14/05/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343529 5/5 10) III, IV e V. II e III. I, II e IV. Código da questão: 47594 Sobre o uso de métodos estatísticos e a linguagem R para análise de dados, avalie as asserções a seguir e a relação existente entre elas. I. Existem duas grandes etapas de análise de dados. A primeira etapa é a análise descritiva. Os resultados obtidos de uma análise descritiva realizada em uma amostra podem ser extrapolados para a população de onde foram retirados. PORQUE II. Os métodos estatísticos de uma análise descritiva de dados garantem que os resultados encontrados são válidos apenas para a amostra analisada. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As duas afirmações são verdadeiras e a segunda não justifica a primeira. As afirmativas I e II são falsas. A afirmativa I é falsa e a afirmativa II é verdadeira. CORRETO As duas afirmações são verdadeiras e a segunda justifica a primeira. A afirmativa I é verdadeira e a afirmativa II é falsa. Código da questão: 47606 Resolução comentada: Afirmativas I, IV e V estão corretas. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. As técnicas probabilísticas atribuem probabilidade de seleção aos elementos da população. A arbitrariedade é um critério de seleção das técnicas não probabilísticas. A amostragem sistemática compõe o conjunto de técnicas probabilísticas e a amostragem por cotas compõe o conjunto de técnicas não probabilísticas. Resolução comentada: Uma análise de dados pode ser dividida em duas grandes etapas. A etapa da análise descritiva possui métodos estatísticos que garantem que os resultados obtidos com uma amostra são válidos apenas para ela, não podendo ser extrapolados para a população de onde foram retirados. Arquivos e Links
Compartilhar