Baixe o app para aproveitar ainda mais
Prévia do material em texto
Técnicas estatísticas: teoria e prática (R Programing) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) Para criar e manipular bancos de dados em linguagem R, pode-se recorrer a uma série de comandos. Considerando esta informação, avalie as duas asserções a seguir e a relação entre elas. I. Existem diversas estruturas de bancos de dados em linguagem R. Portanto, o elaborador deverá escolher a estrutura que melhor atenda aos seus objetivos. PORQUE II. Um data frame é uma estrutura ou objeto de elaboração de banco de dados mais parecido com o que se conhece de banco de dados de outros aplicativos gerenciadores. Analisando as afirmações acima, conclui-se que: Alternativas: As asserções I e II estão incorretas. As asserções I e II estão corretas, mas a asserção II não justifica a asserção I.CORRETO As asserções I e II estão corretas e a asserção II justifica a asserção I.) A asserção I está incorreta e a asserção II está correta. A asserção I está correta e a asserção II está incorreta. Resolução comentada: Existem diversas estruturas de bancos de dados em linguagem R. Cabe ao elaborador escolher aquela que melhor atenda às suas necessidades. Dentre as estruturas existentes, um data frame é a mais genérica porque pode conter variáveis de vários tipos no mesmo banco de dados. Código da questão: 47616 2) A organização de dados para uma análise estatística requer uma série de manipulações para transformar os dados em informações úteis e aproveitáveis para pesquisas diversas. Um dos possíveis resultados de uma manipulação de dados se refere à obtenção de medidas ou estatísticas. Uma estatística é uma medida que é uma função dos dados de uma amostra. Qual dos itens apresentados pode ser considerado uma estatística? Assinale a alternativa CORRETA. Alternativas: Variância. CORRETO Amostra. Apuração. Coleta. Parâmetro. Resolução comentada: Qualquer função dos dados de uma amostra é considerada uma estatística ou uma medida resumo. Um exemplo de uma função da amostra é a variância, que é o nome simplificado dado para a variância amostral. Código da questão: 47587 3) Sobre o uso de métodos estatísticos e a linguagem R para análise de dados, avalie as asserções a seguir e a relação existente entre elas. I. Existem duas grandes etapas de análise de dados. A primeira etapa é a análise descritiva. Os resultados obtidos de uma análise descritiva realizada em uma amostra podem ser extrapolados para a população de onde foram retirados. PORQUE II. Os métodos estatísticos de uma análise descritiva de dados garantem que os resultados encontrados são válidos apenas para a amostra analisada. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As afirmativas I e II são falsas. A afirmativa I é verdadeira e a afirmativa II é falsa. As duas afirmações são verdadeiras e a segunda justifica a primeira. As duas afirmações são verdadeiras e a segunda não justifica a primeira. A afirmativa I é falsa e a afirmativa II é verdadeira. CORRETO Resolução comentada: Uma análise de dados pode ser dividida em duas grandes etapas. A etapa da análise descritiva possui métodos estatísticos que garantem que os resultados obtidos com uma amostra são válidos apenas para ela, não podendo ser extrapolados para a população de onde foram retirados. Código da questão: 47606 4) Muitos autores discutem sobre o uso de recursos gráficos para apresentação de resultados e apresentam uma série de vantagens. Como exemplo, Chambers et al. (1983 apud Bussab e Morettin, 2017). Considerando esses autores, avalie a afirmativa a seguir para completar suas lacunas corretamente. O uso de recursos gráficos ou visuais é bom para buscar ____________, confirmar ____________ e descobrir novos ____________. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Padrões; hipóteses; fenômenos. CORRETO Dados; hipóteses; dados. Padrões; hipóteses; gráficos. Gráficos; ideias; fenômenos. Gráficos; ideias; gráficos. Resolução comentada: O uso de recursos gráficos ou visuais é bom para buscar padrões, confirmar hipóteses e descobrir novos fenômenos. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). Código da questão: 47608 5) Os modelos preditivos podem ser implementados em linguagem R de diversas formas. Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as afirmativas a seguir. I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes iguais. II. A função factor( ) converte uma variável para quantitativa. III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um conjunto de dados. V. A função table( ) cria uma tabela de resultados de variáveis. Assinale a alternativa que contém as afirmativas CORRETAS. Alternativas: I, II, III, IV e V. III e V, apenas. CORRETO I, II e III, apenas. I, II e IV, apenas. III, IV e V, apenas. Resolução comentada: Para criar um modelo de classificação, divide-se o banco de dados em duas partes, onde 70% fica em uma delas e 30% na outra. A função factor( ) converte uma variável para categórica. A função summary( ) exibe resumo descritivo das variáveis do banco de dados. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona 70% das colunas de um conjunto de dados. A função table( ) cria uma tabela de resultados de variáveis. Código da questão: 47619 6) Existe uma classe grande de modelos preditivos para análise de dados. A variável resposta associada ao modelo preditivo pode ser do tipo quantitativa quanto variável categórica. Quando a variável resposta ou dependente é categórica com duas categorias, recebe um nome específico. Qual o nome que a variável resposta recebe? Assinale a alternativa CORRETA. Alternativas: Dicotômica. CORRETO Multinomial. Nominal. Contínua. Ordinal. Resolução comentada: Em um modelo preditivo, quando a variável resposta é categórica com duas categorias, recebe o nome de variável dicotômica. Código da questão: 47617 7) A estatística, assim como as outras ciências, foi construída ao longo dos tempos. Ao longo desta construção, uma série de acontecimentos marcou o processo de construção da estatística. Sobre os acontecimentos registrados na história da estatística, avalie as afirmativas a seguir. I. A primeira vez que o termo estatística foi utilizado aconteceu por volta do século XVII. II. A história atribui ao austríaco Gottfried Achemmel a criação do termo estatística. III. A palavra estatística é originária da palavra latina status, que era um termo relacionado ao Estado. IV. A criação da palavra estatística é atribuída a um personagem da história de origem alemã. V. O primeiro levantamento estatístico que se tem registrado na história foi realizado por Heródoto. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: I, II e III. II e III. III e IV. III, IV e V. CORRETO I, II e IV. Resolução comentada:Afirmativas III, IV e V estão corretas. Na afirmativa I, pode-se dizer que o primeiro registro que se tem na história sobre levantamento estatístico está associado a um personagem da história chamado Heródoto, que foi um geógrafo e historiador grego. Na afirmativa II, pode-se dizer que a palavra estatística tem sua origem atribuída a um alemão chamado Gottfried Achemmel e tem origem no latim, da palavra status, a qual estava relacionada com as atividades do Estado. Descrever de maneira suscinta a resolução da questão. Código da questão: 47589 8) Segundo Siqueira e Tibúrcio (2011, p. 5) “existe mais de uma ênfase de análise estatística”. Considerando esta afirmação, analise a afirmativa a seguir para completar suas lacunas corretamente. Os métodos ____________ estatísticos são métodos de análise ____________ de dados, os quais são elaborados com a produção de ____________. Assinale a alternativa que preenche CORRETAMENTE as lacunas. Alternativas: Clássicos; descritiva; probabilidades. Bayesianos; descritiva; tabelas. Bayesianos; inferencial; tabelas. Clássicos; descritiva; tabelas. CORRETO Bayesianos; inferencial; valor p. Resolução comentada: Siqueira e Tibúrcio (2011, p. 5) afirmam que “existe mais de uma ênfase de análise estatística” e uma é a ênfase clássica, onde os métodos clássicos estatísticos são métodos de análise descritiva, onde um dos seus produtos é a elaboração de tabelas. Código da questão: 47603 9) Uma análise completa de dados se particiona em duas grandes partes. Uma delas é realizada com métodos estatísticos que permitem a extrapolação dos resultados encontrados numa amostra para toda a população. Qual o nome desta etapa de análise de dados? Assinale a alternativa CORRETA. Alternativas: Correlação. Descritiva. Tabelas e gráficos. Associação. Inferencial. CORRETO Resolução comentada: A etapa de uma análise de dados que é realizada com métodos estatísticos que permitem a extrapolação dos resultados encontrados em uma amostra para a população de onde foi retirada é a análise inferencial. Código da questão: 47602 10) É possível utilizar o RStudio e realizar as principais operações matemáticas através de simbologia apropriada. Essa atividade pode ser realizada tanto no editor de códigos quanto no console. Para obter o resto de uma divisão de valores, utiliza-se qual símbolo matemático? Assinale a alternativa CORRETA. Alternativas: Divisão. Diferença. Soma. Multiplicação. Mod. CORRETO Resolução comentada: Sempre que se desejar obter como resultado o resto de uma divisão entre dois números, deve-se utilizar no RStudio o símbolo referente à operação Mod, que é representado por %%. Tal informação encontra-se no Quadro 1 da leitura fundamental. Código da questão: 47597
Compartilhar