Buscar

Técnicas estatísticas - teoria e prática (R Programing)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

29/12/2022 00:12 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2761585/5595690 1/5
Técnicas estatísticas: teoria e prática (R Programing)
Professor(a): Marcelo Osnar Rodrigues de Abreu (Doutorado)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
O uso de recurso gráfico para apresentação de resultados de análise de dados é uma
boa opção quando se deseja atingir um amplo público e, também, quando se deseja
facilitar a compreensão dos resultados encontrados. É uma forma rápida de divulgação de
informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017)
listaram alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca
de padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da
esquerda para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o
que pode ser concluído desta visualização?
BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017.
554p.
Assinale a alternativa CORRETA.
Alternativas:
Os dados plotados não têm correlação entre eles.
Os dados plotados têm correlação negativa entre eles.
Os dados plotados apresentam variância negativa.
Os dados plotados apresentam correlação positiva entre eles.  CORRETO
Os dados plotados não são apropriados para o tipo de gráfico.
Código da questão: 47607
Existe uma classe grande de modelos preditivos para análise de dados. A variável
resposta associada ao modelo preditivo pode ser do tipo quantitativa quanto variável
categórica. Quando a variável resposta ou dependente é categórica com duas categorias,
recebe um nome específico. Qual o nome que a variável resposta recebe?
Assinale a alternativa CORRETA.
Alternativas:
Dicotômica.  CORRETO
Multinomial.
Ordinal.
Contínua.
Nominal.
Código da questão: 47617
A elaboração de um banco de dados para uma posterior análise estatística não é tão
trivial quanto pode parecer. É uma das etapas onde mais tempo se utiliza para o bom
andamento de um trabalho de análise de dados. De uma forma simples, é possível afirmar
que um banco de dados é um arranjo retangular contendo linhas e, também, colunas. A
Resolução comentada:
Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda
para a direita, há um indício de que os dados plotados apresentam correlação
positiva entre eles.
Resolução comentada:
Em um modelo preditivo, quando a variável resposta é categórica com duas
categorias, recebe o nome de variável dicotômica.
29/12/2022 00:12 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2761585/5595690 2/5
4)
5)
depender da área de estudo, os elementos dos bancos de dados são denominados de
maneira distinta. Por exemplo, os que os estatísticos chamam de “variável” em um banco
de dados recebe outro nome, dado pelos profissionais da computação. Que nome é este?
Assinale a alternativa CORRETA.
Alternativas:
Coluna.
Linha.
Registro.
Variável.
Campo.  CORRETO
Código da questão: 47612
Existe uma série de gráficos que podem ser utilizados como recursos de visualização de
dados para apresentação de resultados de análise de dados. Com relação aos tipos de
gráficos, avalie as afirmativas a seguir.
I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada.
II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas,
tanto nominais quanto discretas.
III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual
informações de variáveis qualitativas.
IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao
longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que
tenham alguma dependência entre si.
V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser
realizada com o uso de um diagrama de dispersão bidimensional.
Assinale as alternativas que contém as afirmativas CORRETAS.
Alternativas:
I, II e IV.
I, III e IV.  CORRETO
II, III e V.
II, IV e V.
III, IV e V.
Código da questão: 47609
O programa R é um software para análise estatística de dados. É um programa que está
em crescimento quanto ao número de usuários, movimento motivado por uma série de
fatores que influenciam na decisão de utilizá-lo. A respeito do programa R, avalie as
afirmativas a seguir.
I. O R é um programa gratuito e de código aberto (open source).
Resolução comentada:
Os elementos que compõem um banco de dados recebem nomes distintos a
depender da área de estudo. Por exemplo, o que os estatísticos chamam de
“variável”, os profissionais da computação chamam de “campo”.
Resolução comentada:
Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de
variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado
para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de
setores é bastante utilizado para apresentação de resultados percentuais de variáveis
categóricas ou qualitativas, no entanto, também podem apresentar frequências
absolutas. Um gráfico de série temporal é apropriado para apresentar resultados
coletados ao longo do tempo, de um determinado período. O gráfico apropriado
para apresentar o número de consultas médicas realizadas em determinado período
é o gráfico de dispersão unidimensional.
29/12/2022 00:12 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2761585/5595690 3/5
6)
7)
II. A linguagem R foi desenvolvida por John Chambers e colaboradores.
III. A linguagem R é baseada em linhas de comando e é semelhante à linguagem S.
IV. Os argumentos das funções da linguagem R devem ser escritos sempre dentro de
parênteses.
Assinale a alternativa que contenha as afirmativas CORRETAS.
Alternativas:
I, II, III e IV.  CORRETO
Apenas IV.
I, II e III.
Apenas I.
I e II.
Código da questão: 47590
Para uma pesquisa ser bem realizada, faz-se necessário um bom planejamento de todas
as etapas de sua realização. O detalhamento ou planejamento de uma pesquisa pode ser
documentado em um projeto de pesquisa. Em uma dessas etapas, deve-se buscar a
possível existência de falhas e imperfeições existentes na coleta dos dados. A qual etapa do
planejamento estamos nos referindo?
Assinale a alternativa CORRETA.
Alternativas:
Apresentação de dados.
Apuração de dados.
Amostragem de dados.
Coleta de dados.
Crítica de dados.  CORRETO
Código da questão: 47588
I. A estatística é um conjunto de métodos quantitativos utilizados para realizar a coleta,
organização e apresentação de dados para a busca de respostas a perguntas de pesquisas.
Para facilitar a realização destas atividades, recorre-se aos programas computacionais como
o software R, pois o uso de programas computacionais facilita a obtenção de resultados.
PORQUE
II. Com a utilização de programas computacionais, a execução das etapas de realização de
uma análise estatística ocorre com muito mais velocidade e muito mais segurança do que
se realizada manualmente.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As duas asserções estão corretas, mas a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão incorretas.
Resolução comentada:
As afirmativas I, II, III e IV estão corretas. O R é um programa gratuito e de código
aberto (open source) desenvolvido por John Chambers e colaboradores. A
linguagem R é baseada em linha de comando semelhante à linguagem S, onde os
argumentos das suas funções devemser digitados sempre dentro de parênteses.
Resolução comentada:
Na etapa de crítica de dados de uma pesquisa é onde ocorre a busca de falhas e
imperfeições. Nessa etapa, os dados precisam ser criticados, de maneira cuidadosa,
para que não ocorram erros grosseiros em análises posteriores.
29/12/2022 00:12 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2761585/5595690 4/5
8)
9)
A duas asserções estão corretas e a segunda justifica a primeira.  CORRETO
Código da questão: 47591
Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada
com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas.
A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo
de padrão existente, assim como a identificação de possíveis erros. Como é denominada a
metodologia estatística utilizada na primeira etapa de uma análise de dados?
Assinale a alternativa CORRETA..
Alternativas:
Estatística descritiva.  CORRETO
Inferência estatística.
Causalidade.
Teste de hipóteses.
Amostragem.
Código da questão: 47592
Sobre o uso de métodos estatísticos e a linguagem R para análise de dados, avalie as
asserções a seguir e a relação existente entre elas.
I. Existem duas grandes etapas de análise de dados. A primeira etapa é a análise descritiva.
Os resultados obtidos de uma análise descritiva realizada em uma amostra podem ser
extrapolados para a população de onde foram retirados.
PORQUE
II. Os métodos estatísticos de uma análise descritiva de dados garantem que os resultados
encontrados são válidos apenas para a amostra analisada.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As afirmativas I e II são falsas.
A afirmativa I é verdadeira e a afirmativa II é falsa.
As duas afirmações são verdadeiras e a segunda não justifica a primeira.
A afirmativa I é falsa e a afirmativa II é verdadeira.  CORRETO
As duas afirmações são verdadeiras e a segunda justifica a primeira.
Código da questão: 47606
Resolução comentada:
Para realizar uma análise estatística adequada e correta, uma série de etapas deve
ser realizada com respeito aos dados. Para facilitar a execução destas etapas, assim
como a obtenção dos resultados mais rapidamente, recorre-se ao uso de programas
computacionais como o software R.
Resolução comentada:
Toda análise de dados é iniciada com uma exploração dos dados. As técnicas
utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado
estatística descritiva.
Resolução comentada:
Uma análise de dados pode ser dividida em duas grandes etapas. A etapa da análise
descritiva possui métodos estatísticos que garantem que os resultados obtidos com
uma amostra são válidos apenas para ela, não podendo ser extrapolados para a
população de onde foram retirados.
29/12/2022 00:12 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2761585/5595690 5/5
10) Sobre criação de bancos de dados em ambiente R, avalie as afirmações a seguir e
assinale (V) para verdadeira e (F) para falsa.
( ) Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz.
( ) O comando para selecionar as duas primeiras colunas de conjuntos de dados
denominado “dados” é dados[1:3].
( ) O comando R para selecionar uma variável de um banco de dados é igual a
“nome_variável$dados”.
( ) Para juntar vetores em colunas, utiliza-se a função cbind( ) em linguagem R.
( ) O comando aggregate( ) resume variáveis quantitativas segundo algumas variáveis
categórica.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – F – F – V – V.  CORRETO
F – F – F – F – F.
F – V – F – V – F.
F – V – V – F – F.
V – V – V – V – V.
Código da questão: 47615
Resolução comentada:
Um objeto do tipo data frame é mais genérico que um objeto do tipo matriz, porque
pode conter diversos tipos de variáveis. O comando que seleciona as duas primeiras
colunas de um conjunto chamado “dados” é dados[1:2]. O comando que seleciona
uma variável do conjunto “dados” é dados$nome_variável. A junção de vetores em
colunas é feita com o uso do comando cbind( ). O comando aggregate( ) resume
variáveis quantitativas em médias, por exemplo, segundo alguma outra variável
categórica.
Arquivos e Links

Outros materiais