Baixe o app para aproveitar ainda mais
Prévia do material em texto
15/02/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059365 1/5 Técnicas estatísticas: teoria e prática (R Programing) Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Árvore de decisão é um dos modelos preditivos de classificação muito utilizado para ajustar modelos matemáticos a conjuntos de dados. Sobre este modelo, avalie as asserções a seguir e a relação entre elas. I. O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineração de dados. PORQUE II. A árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas. Alternativas: As asserções I e II estão corretas, mas a asserção II não é justificativa da asserção I. CORRETO As asserções I e II estão corretas e a segunda justifica a primeira. A asserção I está correta e a asserção II está incorreta. As asserções I e II estão incorretas. A asserção I está incorreta e a asserção II está correta. Código da questão: 47621 Muitos autores discutem sobre o uso de recursos gráficos para apresentação de resultados e apresentam uma série de vantagens. Como exemplo, Chambers et al. (1983 apud Bussab e Morettin, 2017). Considerando esses autores, avalie a afirmativa a seguir para completar suas lacunas corretamente. O uso de recursos gráficos ou visuais é bom para buscar ____________, confirmar ____________ e descobrir novos ____________. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Dados; hipóteses; dados. Gráficos; ideias; gráficos. Padrões; hipóteses; fenômenos. CORRETO Gráficos; ideias; fenômenos. Padrões; hipóteses; gráficos. Código da questão: 47608 Resolução comentada: O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineração de dados. Uma árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes. Resolução comentada: O uso de recursos gráficos ou visuais é bom para buscar padrões, confirmar hipóteses e descobrir novos fenômenos. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). 15/02/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059365 2/5 3) 4) A correlação entre variáveis é uma informação de extrema importância porque a partir de sua existência é possível analisar efeitos de causalidade entre si, assim como elaborar modelos de regressão eficientes. Sobre correlação, causalidade e modelos de regressão, avalie as afirmativas a seguir e classifique com (V) se verdadeira e (F) se falsa. ( ) O coeficiente de correlação de Pearson verifica a existência de relação linear entre variáveis quantitativas. ( ) O coeficiente de correlação de Pearson assume valores numéricos entre -1 e +1. ( ) Para elaborar um modelo de regressão são necessárias pelo menos duas variáveis. ( ) Uma variável dependente de um modelo de regressão também é conhecida como variável endógena. Assinale a alternativa que contenha a sequência CORRETA. Alternativas: F – V – F – V. V – V – F – F. F – F – F – F. V – V – V – V. CORRETO V – F – V – F. Código da questão: 47596 O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho. V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: III e V. I, II e IV. II, III e IV. CORRETO III, IV e V. I, IV e V. Código da questão: 47599 Resolução comentada: A sequência correta é V – V – V – V. O coeficiente de correlação avalia a existência de relação linear entre variáveis quantitativas e é uma medida que assume valores entre -1 e +1. Para um modelo de regressão ser elaborado são necessárias pelo menos duas variáveis, e a variável dependente também é conhecida como variável endógena. Resolução comentada: As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código. 15/02/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059365 3/5 5) 6) 7) Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo de padrão existente, assim como a identificação de possíveis erros. Como é denominada a metodologia estatística utilizada na primeira etapa de uma análise de dados? Assinale a alternativa CORRETA.. Alternativas: Teste de hipóteses. Amostragem. Estatística descritiva. CORRETO Causalidade. Inferência estatística. Código da questão: 47592 Sobre o uso da linguagem de programação R para elaboração de gráficos estatísticos, avalie as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa. ( ) O RStudio é uma IDE (Ambiente de Desenvolvimento Integrado) para uso da linguagem R. ( ) O RStudio tem uma série de facilidades que ajudam na manipulação da linguagem R para elaboração de gráficos. ( ) O comando barplot( ) é utilizado para elaborar gráfico de setores com a linguagem R. ( ) A opção “ylab=” de um comando R é usada para inserir rótulo no eixo horizontal de um gráfico. ( ) O comando stripchart( ) é usado para produzir gráfico de séries temporais no R. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – F – F. CORRETO V – V – V – V – V. V – V – F – V – F. F – F – F – F – F. F – V – F – V – F. Código da questão: 47610 O programa R é um software para análise estatística de dados. É um programa que está em crescimento quanto ao número de usuários, movimento motivado por uma série de fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as afirmativas a seguir. I. O R é um programa gratuito e de código aberto (open source). II. A linguagem R foi desenvolvida por John Chambers e colaboradores. III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S. IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de parênteses. Assinale a alternativa que contenhaas afirmativas CORRETAS. Resolução comentada: Toda análise de dados é iniciada com uma exploração dos dados. As técnicas utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva. Resolução comentada: O RStudo é uma IDE para uso da linguagem R e apresenta uma série de facilidades em seu uso. O comando barplot( ) é usado para elaborar gráficos de colunas com o R. A opção “ylab=” é usada em comandos de elaboração de gráficos para inserir rótulos no eixo vertical. O comando stripchart( ) é utilizado para produzir gráficos de dispersão unidimensional. 15/02/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059365 4/5 8) 9) Alternativas: I, II, III e IV. CORRETO I, II e III. I e II. Apenas I. Apenas IV. Código da questão: 47590 Sobre criação de bancos de dados em ambiente R, avalie as afirmações a seguir e assinale (V) para verdadeira e (F) para falsa. ( ) Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz. ( ) O comando para selecionar as duas primeiras colunas de conjuntos de dados denominado “dados” é dados[1:3]. ( ) O comando R para selecionar uma variável de um banco de dados é igual a “nome_variável$dados”. ( ) Para juntar vetores em colunas, utiliza-se a função cbind( ) em linguagem R. ( ) O comando aggregate( ) resume variáveis quantitativas segundo algumas variáveis categórica. Assinale a alternativa que contenha a sequência correta: Alternativas: F – V – V – F – F. V – F – F – V – V. CORRETO V – V – V – V – V. F – F – F – F – F. F – V – F – V – F. Código da questão: 47615 A organização de dados para uma análise estatística requer uma série de manipulações para transformar os dados em informações úteis e aproveitáveis para pesquisas diversas. Um dos possíveis resultados de uma manipulação de dados se refere à obtenção de medidas ou estatísticas. Uma estatística é uma medida que é uma função dos dados de uma amostra. Qual dos itens apresentados pode ser considerado uma estatística? Assinale a alternativa CORRETA. Alternativas: Parâmetro. Variância. CORRETO Coleta. Amostra. Apuração. Resolução comentada: As afirmativas I, II, III e IV estão corretas. O R é um programa gratuito e de código aberto (open source) desenvolvido por John Chambers e colaboradores. A linguagem R é baseada em linha de comando semelhante à linguagem S, onde os argumentos das suas funções devem ser digitados sempre dentro de parênteses. Resolução comentada: Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz, porque pode conter diversos tipos de variáveis. O comando que seleciona as duas primeiras colunas de um conjunto chamado “dados” é dados[1:2]. O comando que seleciona uma variável do conjunto “dados” é dados$nome_variável. A junção de vetores em colunas é feita com o uso do comando cbind( ). O comando aggregate( ) resume variáveis quantitativas em médias, por exemplo, segundo alguma outra variável categórica. 15/02/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059365 5/5 10) Código da questão: 47587 A estatística, assim como as outras ciências, foi construída ao longo dos tempos. Ao longo desta construção, uma série de acontecimentos marcou o processo de construção da estatística. Sobre os acontecimentos registrados na história da estatística, avalie as afirmativas a seguir. I. A primeira vez que o termo estatística foi utilizado aconteceu por volta do século XVII. II. A história atribui ao austríaco Gottfried Achemmel a criação do termo estatística. III. A palavra estatística é originária da palavra latina status, que era um termo relacionado ao Estado. IV. A criação da palavra estatística é atribuída a um personagem da história de origem alemã. V. O primeiro levantamento estatístico que se tem registrado na história foi realizado por Heródoto. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: III, IV e V. CORRETO III e IV. I, II e IV. II e III. I, II e III. Código da questão: 47589 Resolução comentada: Qualquer função dos dados de uma amostra é considerada uma estatística ou uma medida resumo. Um exemplo de uma função da amostra é a variância, que é o nome simplificado dado para a variância amostral. Resolução comentada: Afirmativas III, IV e V estão corretas. Na afirmativa I, pode-se dizer que o primeiro registro que se tem na história sobre levantamento estatístico está associado a um personagem da história chamado Heródoto, que foi um geógrafo e historiador grego. Na afirmativa II, pode-se dizer que a palavra estatística tem sua origem atribuída a um alemão chamado Gottfried Achemmel e tem origem no latim, da palavra status, a qual estava relacionada com as atividades do Estado. Descrever de maneira suscinta a resolução da questão. Arquivos e Links
Compartilhar