Prévia do material em texto
Técnicas estatísticas: teoria e prática (R Programing) Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Existe uma série de gráficos que podem ser utilizados como recursos de visualização de dados para apresentação de resultados de análise de dados. Com relação aos tipos de gráficos, avalie as afirmativas a seguir. I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada. II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, tanto nominais quanto discretas. III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual informações de variáveis qualitativas. IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que tenham alguma dependência entre si. V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser realizada com o uso de um diagrama de dispersão bidimensional. Assinale as alternativas que contém as afirmativas CORRETAS. Alternativas: II, III e V. II, IV e V. I, III e IV. CORRETO III, IV e V. I, II e IV. Código da questão: 47609 I. A estatística é um conjunto de métodos quantitativos utilizados para realizar a coleta, organização e apresentação de dados para a busca de respostas a perguntas de pesquisas. Para facilitar a realização destas atividades, recorre-se aos programas computacionais como o software R, pois o uso de programas computacionais facilita a obtenção de resultados. PORQUE II. Com a utilização de programas computacionais, a execução das etapas de realização de uma análise estatística ocorre com muito mais velocidade e muito mais segurança do que se realizada manualmente. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. As duas asserções estão incorretas. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas, mas a segunda não justifica a primeira. A duas asserções estão corretas e a segunda justifica a primeira. CORRETO Resolução comentada: Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, também podem apresentar frequências absolutas. Um gráfico de série temporal é apropriado para apresentar resultados coletados ao longo do tempo, de um determinado período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em determinado período é o gráfico de dispersão unidimensional. 3) 4) Código da questão: 47591 O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho. V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: III e V. I, II e IV. III, IV e V. I, IV e V. II, III e IV. CORRETO Código da questão: 47599 Sobre o uso da linguagem de programação R para elaboração de gráficos estatísticos, avalie as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa. ( ) O RStudio é uma IDE (Ambiente de Desenvolvimento Integrado) para uso da linguagem R. ( ) O RStudio tem uma série de facilidades que ajudam na manipulação da linguagem R para elaboração de gráficos. ( ) O comando barplot( ) é utilizado para elaborar gráfico de setores com a linguagem R. ( ) A opção “ylab=” de um comando R é usada para inserir rótulo no eixo horizontal de um gráfico. ( ) O comando stripchart( ) é usado para produzir gráfico de séries temporais no R. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F. F – V – F – V – F. V – V – F – F – F. CORRETO F – F – F – F – F. Resolução comentada: Para realizar uma análise estatística adequada e correta, uma série de etapas deve ser realizada com respeito aos dados. Para facilitar a execução destas etapas, assim como a obtenção dos resultados mais rapidamente, recorre-se ao uso de programas computacionais como o software R. Resolução comentada: As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código. 5) 6) V – V – V – V – V. Código da questão: 47610 O programa R é um software para análise estatística de dados. É um programa que está em crescimento quanto ao número de usuários, movimento motivado por uma série de fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as afirmativas a seguir. I. O R é um programa gratuito e de código aberto (open source). II. A linguagem R foi desenvolvida por John Chambers e colaboradores. III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S. IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de parênteses. Assinale a alternativa que contenha as afirmativas CORRETAS. Alternativas: Apenas IV. I, II, III e IV. CORRETO I, II e III. Apenas I. I e II. Código da questão: 47590 O uso de recurso gráfico para apresentação de resultados de análise de dados é uma boa opção quando se deseja atingir um amplo público e, também, quando se deseja facilitar a compreensão dos resultados encontrados. É uma forma rápida de divulgação de informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017) listaram alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca de padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da esquerda para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o que pode ser concluído desta visualização? BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa CORRETA. Alternativas: Os dados plotados não têm correlação entre eles. Os dados plotados não são apropriados para o tipo de gráfico. Os dados plotados apresentam correlação positiva entre eles. CORRETO Os dados plotados apresentam variância negativa. Os dados plotados têm correlação negativa entre eles. Resolução comentada: O RStudo é uma IDE para uso da linguagem R e apresenta uma série de facilidades em seu uso. O comando barplot( ) é usado para elaborar gráficos de colunas como R. A opção “ylab=” é usada em comandos de elaboração de gráficos para inserir rótulos no eixo vertical. O comando stripchart( ) é utilizado para produzir gráficos de dispersão unidimensional. Resolução comentada: As afirmativas I, II, III e IV estão corretas. O R é um programa gratuito e de código aberto (open source) desenvolvido por John Chambers e colaboradores. A linguagem R é baseada em linha de comando semelhante à linguagem S, onde os argumentos das suas funções devem ser digitados sempre dentro de parênteses. Resolução comentada: 7) 8) Código da questão: 47607 I. A execução de um comando em linguagem R requer conhecimento apropriado sobre criação de funções e objetos para o seu uso adequado. Também é necessário ter um conhecimento razoável sobre a linguagem. PORQUE II. É possível realizar os cálculos diferentes com comandos de execução diversos, ou seja, é possível realizar “caminhos” distintos para se obter os mesmos resultados. Analisando as afirmações acima, conclui-se que: Alternativas: A primeira afirmação é falsa e a segunda é verdadeira. As duas afirmações são verdadeiras e a segunda justifica a primeira. As duas afirmações são verdadeiras e a segunda não justifica a primeira. CORRETO As duas afirmações são falsas. A primeira afirmação é verdadeira e a segunda é falsa. Código da questão: 47601 A correlação entre variáveis é uma informação de extrema importância porque a partir de sua existência é possível analisar efeitos de causalidade entre si, assim como elaborar modelos de regressão eficientes. Sobre correlação, causalidade e modelos de regressão, avalie as afirmativas a seguir e classifique com (V) se verdadeira e (F) se falsa. ( ) O coeficiente de correlação de Pearson verifica a existência de relação linear entre variáveis quantitativas. ( ) O coeficiente de correlação de Pearson assume valores numéricos entre -1 e +1. ( ) Para elaborar um modelo de regressão são necessárias pelo menos duas variáveis. ( ) Uma variável dependente de um modelo de regressão também é conhecida como variável endógena. Assinale a alternativa que contenha a sequência CORRETA. Alternativas: V – F – V – F. V – V – V – V. CORRETO V – V – F – F. F – F – F – F. F – V – F – V. Código da questão: 47596 Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda para a direita, há um indício de que os dados plotados apresentam correlação positiva entre eles. Resolução comentada: É possível obter resultados semelhantes e fazer as mesmas análises com procedimentos distintos no R. Essa é uma das vantagens que a linguagem possui. Cálculos diferentes ou diversos também podem ser realizados com programação diversa. Resolução comentada: A sequência correta é V – V – V – V. O coeficiente de correlação avalia a existência de relação linear entre variáveis quantitativas e é uma medida que assume valores entre -1 e +1. Para um modelo de regressão ser elaborado são necessárias pelo menos duas variáveis, e a variável dependente também é conhecida como variável endógena. 9) 10) As técnicas de amostragem foram criadas para garantir que subconjuntos de populações possam representar de maneira adequada alguma característica do todo. Diversas técnicas foram criadas e são utilizadas de acordo com o desenho da pesquisa de interesse. A respeito das técnicas de amostragem, avalie as afirmativas a seguir. I. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. II. A amostragem probabilística não pode atribuir probabilidade na seleção dos elementos da amostra. III. Um dos critérios de seleção dos elementos de uma amostra probabilística é a arbitrariedade. IV. A amostragem sistemática compõe o conjunto de técnicas probabilísticas de amostragem. V. A amostragem por cotas compõe o conjunto de técnicas não probabilísticas de amostragem. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: I, IV e V. CORRETO II e III. III e IV. III, IV e V. I, II e IV. Código da questão: 47594 Muitos autores discutem sobre o uso de recursos gráficos para apresentação de resultados e apresentam uma série de vantagens. Como exemplo, Chambers et al. (1983 apud Bussab e Morettin, 2017). Considerando esses autores, avalie a afirmativa a seguir para completar suas lacunas corretamente. O uso de recursos gráficos ou visuais é bom para buscar ____________, confirmar ____________ e descobrir novos ____________. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p. Assinale a alternativa que completa adequadamente as lacunas acima. Alternativas: Gráficos; ideias; gráficos. Gráficos; ideias; fenômenos. Padrões; hipóteses; fenômenos. CORRETO Padrões; hipóteses; gráficos. Dados; hipóteses; dados. Código da questão: 47608 Resolução comentada: Afirmativas I, IV e V estão corretas. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. As técnicas probabilísticas atribuem probabilidade de seleção aos elementos da população. A arbitrariedade é um critério de seleção das técnicas não probabilísticas. A amostragem sistemática compõe o conjunto de técnicas probabilísticas e a amostragem por cotas compõe o conjunto de técnicas não probabilísticas. Resolução comentada: O uso de recursos gráficos ou visuais é bom para buscar padrões, confirmar hipóteses e descobrir novos fenômenos. No entanto, é necessário utilizar recursos gráficos apropriados para o(s) tipo(s) de variável(is) que esteja(m) sendo manipulado(s). Arquivos e Links