Baixe o app para aproveitar ainda mais
Prévia do material em texto
04/03/2022 13:47 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2443614/3222479 1/5 Técnicas estatísticas: teoria e prática (R Programing) Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Existe uma série de gráficos que podem ser utilizados como recursos de visualização de dados para apresentação de resultados de análise de dados. Com relação aos tipos de gráficos, avalie as afirmativas a seguir. I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada. II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, tanto nominais quanto discretas. III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual informações de variáveis qualitativas. IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que tenham alguma dependência entre si. V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser realizada com o uso de um diagrama de dispersão bidimensional. Assinale as alternativas que contém as afirmativas CORRETAS. Alternativas: II, III e V. I, III e IV. CORRETO III, IV e V. II, IV e V. I, II e IV. Código da questão: 47609 Segundo Siqueira e Tibúrcio (2011, p. 5) “existe mais de uma ênfase de análise estatística”. Considerando esta afirmação, analise a afirmativa a seguir para completar suas lacunas corretamente. Os métodos ____________ estatísticos são métodos de análise ____________ de dados, os quais são elaborados com a produção de ____________. Assinale a alternativa que preenche CORRETAMENTE as lacunas. Alternativas: Bayesianos; inferencial; valor p. Clássicos; descritiva; tabelas. CORRETO Clássicos; descritiva; probabilidades. Bayesianos; descritiva; tabelas. Bayesianos; inferencial; tabelas. Resolução comentada: Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, também podem apresentar frequências absolutas. Um gráfico de série temporal é apropriado para apresentar resultados coletados ao longo do tempo, de um determinado período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em determinado período é o gráfico de dispersão unidimensional. Resolução comentada: Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 04/03/2022 13:47 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2443614/3222479 2/5 3) 4) Código da questão: 47603 O uso de recurso gráfico para apresentação de resultados de análise de dados é uma boa opção quando se deseja atingir um amplo público e, também, quando se deseja facilitar a compreensão dos resultados encontrados. É uma forma rápida de divulgação de informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017) listaram alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca de padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da esquerda para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o que pode ser concluído desta visualização? BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa CORRETA. Alternativas: Os dados plotados não têm correlação entre eles. Os dados plotados apresentam variância negativa. Os dados plotados não são apropriados para o tipo de gráfico. Os dados plotados apresentam correlação positiva entre eles. CORRETO Os dados plotados têm correlação negativa entre eles. Código da questão: 47607 Sobre análise de dados com métodos estatísticos e aplicação na linguagem R, avalie as afirmativas a seguir e assinale (V) para verdadeira e (F) para falsa. ( ) O teste qui-quadrado só é considerado confiável quando grande parte dos valores esperados de uma tabela são superiores ao valor 5. ( ) O teste qui-quadrado avalia associação entre variáveis qualitativas. ( ) Quando o valor p é superior a 0,05, pode-se afirmar que existe evidência de associação entre duas variáveis qualitativas. ( ) É possível obter o resultado de um teste qui-quadrado com o uso da função “table( )”. ( ) Uma medida de correlação varia de 0 a +1. Assinale a alternativa que contenha a sequência correta. Alternativas: V – V – F – F – F. CORRETO V – V – V – V – V. F – V – F – V – F. V – V – F – V – F. F – F – F – F – F. Siqueira e Tibúrcio (2011, p. 5) afirmam que “existe mais de uma ênfase de análise estatística” e uma é a ênfase clássica, onde os métodos clássicos estatísticos são métodos de análise descritiva, onde um dos seus produtos é a elaboração de tabelas. Resolução comentada: Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda para a direita, há um indício de que os dados plotados apresentam correlação positiva entre eles. Resolução comentada: O teste qui-quadrado só é considerado válido quando a maioria dos valores esperados da tabela são superiores ao valor 5 e avalia a existência de associação entre variáveis qualitativas. Quando o valor p é inferior a 0,05 é possível afirmar que existe evidência de associação entre duas variáveis qualitativas. Para obter o resultado de um teste qui-quadrado, pode-se utilizar a função “crosstab”. Uma medida de correlação varia de -1 a +1. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 04/03/2022 13:47 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2443614/3222479 3/5 5) 6) 7) Código da questão: 47605 O programa R é um software para análise estatística de dados. É um programa que está em crescimento quanto ao número de usuários, movimento motivado por uma série de fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as afirmativas a seguir. I. O R é um programa gratuito e de código aberto (open source). II. A linguagem R foi desenvolvida por John Chambers e colaboradores. III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S. IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de parênteses. Assinale a alternativa que contenha as afirmativas CORRETAS. Alternativas: Apenas I. I, II e III. I e II. Apenas IV. I, II, III e IV. CORRETO Código da questão: 47590 I. A estatística é um conjunto de métodos quantitativos utilizados para realizar a coleta, organização e apresentação de dados para a busca de respostas a perguntas de pesquisas. Para facilitar a realização destas atividades, recorre-se aos programas computacionais como o software R, pois o uso de programas computacionais facilita a obtenção de resultados. PORQUE II. Com a utilização de programas computacionais, a execução das etapas de realização de uma análise estatística ocorre com muito mais velocidade e muito mais segurança do que se realizada manualmente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas:As duas asserções estão corretas, mas a segunda não justifica a primeira. A primeira asserção está correta e a segunda está incorreta. As duas asserções estão incorretas. A primeira asserção está incorreta e a segunda está correta. A duas asserções estão corretas e a segunda justifica a primeira. CORRETO Código da questão: 47591 Sobre a elaboração de gráficos estatísticos com a linguagem R, avalie as afirmativas a seguir e a relação existente entre elas. I. A linguagem R apresenta uma série de comandos básicos para elaboração de gráficos. No entanto, existe um pacote chamado ggplot2 que é mais indicado para tal atividade. PORQUE Resolução comentada: As afirmativas I, II, III e IV estão corretas. O R é um programa gratuito e de código aberto (open source) desenvolvido por John Chambers e colaboradores. A linguagem R é baseada em linha de comando semelhante à linguagem S, onde os argumentos das suas funções devem ser digitados sempre dentro de parênteses. Resolução comentada: Para realizar uma análise estatística adequada e correta, uma série de etapas deve ser realizada com respeito aos dados. Para facilitar a execução destas etapas, assim como a obtenção dos resultados mais rapidamente, recorre-se ao uso de programas computacionais como o software R. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 04/03/2022 13:47 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2443614/3222479 4/5 8) 9) II. O pacote ggplot2 possui muito mais recursos para elaboração de gráficos com a linguagem R. Ele foi elaborado para produzir, exclusivamente, gráficos mais complexos e elegantes. Assinale a alternativa acerca das afirmativas supracitadas, bem como a relação entre elas. Alternativas: As duas afirmativas estão corretas, mas a segunda não justifica a primeira. A primeira afirmativa está correta e a segunda está incorreta. A duas afirmativas estão corretas e a segunda justifica a primeira. CORRETO As duas afirmativas estão incorretas. A primeira afirmativa está incorreta e a segunda está correta. Código da questão: 47611 Os modelos preditivos podem ser implementados em linguagem R de diversas formas. Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as afirmativas a seguir. I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes iguais. II. A função factor( ) converte uma variável para quantitativa. III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um conjunto de dados. V. A função table( ) cria uma tabela de resultados de variáveis. Assinale a alternativa que contém as afirmativas CORRETAS. Alternativas: III e V, apenas. CORRETO III, IV e V, apenas. I, II e IV, apenas. I, II, III, IV e V. I, II e III, apenas. Código da questão: 47619 Os comandos de linguagem R criados podem ser armazenados em conjunto e, também, podem ser salvos em arquivos permanentes. Com respeito aos conjuntos de comandos do R, analise a afirmativa a seguir para completar suas lacunas corretamente. Quando se elabora comandos de linguagem R no editor de códigos, tem-se um conjunto de comandos denominados ____________. Quando esses conjuntos são armazenados em grupos de conjuntos de comandos são denominados como _____________, também conhecidos como ____________. A partir da afirmativa acima, assinale a alternativa que contém as palavras adequadas que preenchem as lacunas. Resolução comentada: É possível elaborar gráficos estatísticos com comandos básicos da linguagem R. No entanto, com o pacote ggplot2 é possível elaborar gráficos mais bem produzidos, mais complexos e com mais recursos visuais, produzindo gráficos mais elegantes visualmente. Resolução comentada: Para criar um modelo de classificação, divide-se o banco de dados em duas partes, onde 70% fica em uma delas e 30% na outra. A função factor( ) converte uma variável para categórica. A função summary( ) exibe resumo descritivo das variáveis do banco de dados. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona 70% das colunas de um conjunto de dados. A função table( ) cria uma tabela de resultados de variáveis. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 04/03/2022 13:47 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2443614/3222479 5/5 10) Alternativas: Scripts; pacotes; objetos. Pacotes; objetos; variável. Pacotes; atributo; bibliotecas. Scripts; objetos; variável. Scripts; pacotes; bibliotecas. CORRETO Código da questão: 47598 Existe uma classe grande de modelos preditivos para análise de dados. A variável resposta associada ao modelo preditivo pode ser do tipo quantitativa quanto variável categórica. Quando a variável resposta ou dependente é categórica com duas categorias, recebe um nome específico. Qual o nome que a variável resposta recebe? Assinale a alternativa CORRETA. Alternativas: Nominal. Multinomial. Ordinal. Contínua. Dicotômica. CORRETO Código da questão: 47617 Resolução comentada: A alternativa correta é “scripts; pacotes; bibliotecas”. Um conjunto de comandos digitados no editor de códigos compõe um script e um conjunto de scripts compõe um pacote ou biblioteca. Resolução comentada: Em um modelo preditivo, quando a variável resposta é categórica com duas categorias, recebe o nome de variável dicotômica. Arquivos e Links Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k
Compartilhar