Baixe o app para aproveitar ainda mais
Prévia do material em texto
28/12/2022 20:39 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996101 1/5 Técnicas estatísticas: teoria e prática (R Programing) Professor(a): Marcelo Tavares De Lima (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Segundo Siqueira e Tibúrcio (2011, p. 5) “existe mais de uma ênfase de análise estatística”. Considerando esta afirmação, analise a afirmativa a seguir para completar suas lacunas corretamente. Os métodos ____________ estatísticos são métodos de análise ____________ de dados, os quais são elaborados com a produção de ____________. Assinale a alternativa que preenche CORRETAMENTE as lacunas. Alternativas: Clássicos; descritiva; tabelas. CORRETO Bayesianos; inferencial; tabelas. Bayesianos; inferencial; valor p. Bayesianos; descritiva; tabelas. Clássicos; descritiva; probabilidades. Código da questão: 47603 Sobre o uso de métodos estatísticos e a linguagem R para análise de dados, avalie as asserções a seguir e a relação existente entre elas. I. Existem duas grandes etapas de análise de dados. A primeira etapa é a análise descritiva. Os resultados obtidos de uma análise descritiva realizada em uma amostra podem ser extrapolados para a população de onde foram retirados. PORQUE II. Os métodos estatísticos de uma análise descritiva de dados garantem que os resultados encontrados são válidos apenas para a amostra analisada. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A afirmativa I é verdadeira e a afirmativa II é falsa. As duas afirmações são verdadeiras e a segunda não justifica a primeira. As duas afirmações são verdadeiras e a segunda justifica a primeira. A afirmativa I é falsa e a afirmativa II é verdadeira. CORRETO As afirmativas I e II são falsas. Código da questão: 47606 Resolução comentada: Siqueira e Tibúrcio (2011, p. 5) afirmam que “existe mais de uma ênfase de análise estatística” e uma é a ênfase clássica, onde os métodos clássicos estatísticos são métodos de análise descritiva, onde um dos seus produtos é a elaboração de tabelas. Resolução comentada: Uma análise de dados pode ser dividida em duas grandes etapas. A etapa da análise descritiva possui métodos estatísticos que garantem que os resultados obtidos com uma amostra são válidos apenas para ela, não podendo ser extrapolados para a população de onde foram retirados. 28/12/2022 20:39 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996101 2/5 3) 4) O programa R é um software para análise estatística de dados. É um programa que está em crescimento quanto ao número de usuários, movimento motivado por uma série de fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as afirmativas a seguir. I. O R é um programa gratuito e de código aberto (open source). II. A linguagem R foi desenvolvida por John Chambers e colaboradores. III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S. IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de parênteses. Assinale a alternativa que contenha as afirmativas CORRETAS. Alternativas: I e II. I, II, III e IV. CORRETO I, II e III. Apenas I. Apenas IV. Código da questão: 47590 As técnicas de amostragem foram criadas para garantir que subconjuntos de populações possam representar de maneira adequada alguma característica do todo. Diversas técnicas foram criadas e são utilizadas de acordo com o desenho da pesquisa de interesse. A respeito das técnicas de amostragem, avalie as afirmativas a seguir. I. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. II. A amostragem probabilística não pode atribuir probabilidade na seleção dos elementos da amostra. III. Um dos critérios de seleção dos elementos de uma amostra probabilística é a arbitrariedade. IV. A amostragem sistemática compõe o conjunto de técnicas probabilísticas de amostragem. V. A amostragem por cotas compõe o conjunto de técnicas não probabilísticas de amostragem. Assinale a alternativa que contém as alternativas verdadeiras. Alternativas: III e IV. III, IV e V. I, IV e V. CORRETO II e III. I, II e IV. Código da questão: 47594 Resolução comentada: As afirmativas I, II, III e IV estão corretas. O R é um programa gratuito e de código aberto (open source) desenvolvido por John Chambers e colaboradores. A linguagem R é baseada em linha de comando semelhante à linguagem S, onde os argumentos das suas funções devem ser digitados sempre dentro de parênteses. Resolução comentada: Afirmativas I, IV e V estão corretas. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. As técnicas probabilísticas atribuem probabilidade de seleção aos elementos da população. A arbitrariedade é um critério de seleção das técnicas não probabilísticas. A amostragem sistemática compõe o conjunto de técnicas probabilísticas e a amostragem por cotas compõe o conjunto de técnicas não probabilísticas. 28/12/2022 20:39 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996101 3/5 5) 6) O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir. I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter. II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente. III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet. IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho. V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada. Assinale a alternativa que contém as afirmativas verdadeiras. Alternativas: I, IV e V. II, III e IV. CORRETO III e V. I, II e IV. III, IV e V. Código da questão: 47599 Árvore de decisão é um dos modelos preditivos de classificação muito utilizado para ajustar modelos matemáticos a conjuntos de dados. Sobre este modelo, avalie as asserções a seguir e a relação entre elas. I. O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineração de dados. PORQUE II. A árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas. Alternativas: A asserção I está correta e a asserção II está incorreta. A asserção I está incorreta e a asserção II está correta. As asserções I e II estão incorretas. As asserções I e II estão corretas, mas a asserção II não é justificativa da asserção I. CORRETO As asserções I e II estão corretas e a segunda justifica a primeira. Código da questão: 47621 Resolução comentada: As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código. Resolução comentada: O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineraçãode dados. Uma árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes. 28/12/2022 20:39 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996101 4/5 7) 8) 9) O teste de hipóteses compõe o conjunto de técnicas estatísticas conhecido como inferência estatística. Ele é utilizado para constatar ou refutar hipóteses de pesquisa através de conjuntos de dados. Com base no texto, avalie as afirmativas sobre teste de hipóteses e assinale (V) se verdadeiras e (F) se falsas. ( ) Um teste de hipóteses é composto por três hipóteses. ( ) A hipótese do problema investigado é representada pelo hipótese nula. ( ) O erro tipo I é representado pelo nível de significância associado ao teste de hipóteses. ( ) O critério de decisão é baseado na estatística do teste. Assinale a alternativa que contenha a sequência CORRETA. Alternativas: F – F – F – F. F – F – V – V. CORRETO V – V – F – F. V – V – V – V. F – V – F – V. Código da questão: 47595 A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre esta linguagem de programação, avalie as afirmativas a seguir. I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) que foram elaboradas para facilitar o seu uso. II. A IDE RStudio tem interface dividida em três partes. III. Um dos pacotes que permite elaboração de tabelas de frequências é o crosstab. IV. O comando “summary( )” é utilizado para se obter medidas resumo das variáveis de um conjunto de dados. V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis quantitativas. Assinale a alternativa que apresenta a sequência CORRETA. Alternativas: I, II e IV. II, III e IV. I e IV. CORRETO IV e V. II e III. Código da questão: 47604 Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo Resolução comentada: A sequência correta é F – F – V – V. Um teste de hipóteses é composto por duas hipóteses, conhecidas como hipótese nula e alternativa, respectivamente. A hipótese do problema investigado é a hipótese alternativa. O erro tipo I é representado pelo nível de significância do teste e o critério de decisão é baseado na estatística do teste. Resolução comentada: A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o seu uso. A IDE RStudio tem interface dividida em quatro partes. Um dos pacotes da linguagem R que permite a elaboração de tabelas de frequências é o “descr”. O comando “summary( )” é utilizado para obter medidas resumo de variáveis de um conjunto de dados. A função “fisher.test( )” é utilizada para verificar associação entre variáveis qualitativas. 28/12/2022 20:39 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2686603/4996101 5/5 10) de padrão existente, assim como a identificação de possíveis erros. Como é denominada a metodologia estatística utilizada na primeira etapa de uma análise de dados? Assinale a alternativa CORRETA.. Alternativas: Teste de hipóteses. Inferência estatística. Estatística descritiva. CORRETO Amostragem. Causalidade. Código da questão: 47592 Sobre análise de dados com métodos estatísticos e aplicação na linguagem R, avalie as afirmativas a seguir e assinale (V) para verdadeira e (F) para falsa. ( ) O teste qui-quadrado só é considerado confiável quando grande parte dos valores esperados de uma tabela são superiores ao valor 5. ( ) O teste qui-quadrado avalia associação entre variáveis qualitativas. ( ) Quando o valor p é superior a 0,05, pode-se afirmar que existe evidência de associação entre duas variáveis qualitativas. ( ) É possível obter o resultado de um teste qui-quadrado com o uso da função “table( )”. ( ) Uma medida de correlação varia de 0 a +1. Assinale a alternativa que contenha a sequência correta. Alternativas: F – V – F – V – F. V – V – V – V – V. V – V – F – F – F. CORRETO V – V – F – V – F. F – F – F – F – F. Código da questão: 47605 Resolução comentada: Toda análise de dados é iniciada com uma exploração dos dados. As técnicas utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva. Resolução comentada: O teste qui-quadrado só é considerado válido quando a maioria dos valores esperados da tabela são superiores ao valor 5 e avalia a existência de associação entre variáveis qualitativas. Quando o valor p é inferior a 0,05 é possível afirmar que existe evidência de associação entre duas variáveis qualitativas. Para obter o resultado de um teste qui-quadrado, pode-se utilizar a função “crosstab”. Uma medida de correlação varia de -1 a +1. Arquivos e Links
Compartilhar