Buscar

Avaliação Técnicas estatísticas teoria e prática R Programing

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1)
Sobre o uso da linguagem de programação R para elaboração de gráficos estatísticos, avalie as afirmativas a seguir e assinale (V) se verdadeira e (F) se falsa.
( ) O RStudio é uma IDE (Ambiente de Desenvolvimento Integrado) para uso da linguagem R.
( ) O RStudio tem uma série de facilidades que ajudam na manipulação da linguagem R para elaboração de gráficos.
( ) O comando barplot( ) é utilizado para elaborar gráfico de setores com a linguagem R.
( ) A opção “ylab=” de um comando R é usada para inserir rótulo no eixo horizontal de um gráfico.
( ) O comando stripchart( ) é usado para produzir gráfico de séries temporais no R.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – V – V.
· V – V – F – F – F.
checkCORRETO
· F – V – F – V – F.
· F – F – F – F – F.
· V – V – F – V – F.
Resolução comentada:
O RStudo é uma IDE para uso da linguagem R e apresenta uma série de facilidades em seu uso. O comando barplot( ) é usado para elaborar gráficos de colunas com o R. A opção “ylab=” é usada em comandos de elaboração de gráficos para inserir rótulos no eixo vertical. O comando stripchart( ) é utilizado para produzir gráficos de dispersão unidimensional.
Código da questão: 47610
2)
Árvore de decisão é um dos modelos preditivos de classificação muito utilizado para ajustar modelos matemáticos a conjuntos de dados. Sobre este modelo, avalie as asserções a seguir e a relação entre elas.
I. O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineração de dados.
PORQUE
II. A árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas.
Alternativas:
· As asserções I e II estão corretas e a segunda justifica a primeira.
· As asserções I e II estão incorretas.
· A asserção I está incorreta e a asserção II está correta.
· As asserções I e II estão corretas, mas a asserção II não é justificativa da asserção I.
checkCORRETO
· A asserção I está correta e a asserção II está incorreta.
Resolução comentada:
O modelo de classificação árvore de decisão é um método preditivo bastante utilizado em mineração de dados. Uma árvore de decisão consiste em criar um conjunto de regras que dividem as variáveis preditoras em duas partes.
Código da questão: 47621
3)
A elaboração de um banco de dados para uma posterior análise estatística não é tão trivial quanto pode parecer. É uma das etapas onde mais tempo se utiliza para o bom andamento de um trabalho de análise de dados. De uma forma simples, é possível afirmar que um banco de dados é um arranjo retangular contendo linhas e, também, colunas. A depender da área de estudo, os elementos dos bancos de dados são denominados de maneira distinta. Por exemplo, os que os estatísticos chamam de “variável” em um banco de dados recebe outro nome, dado pelos profissionais da computação. Que nome é este?
Assinale a alternativa CORRETA.
Alternativas:
· Linha.
· Coluna.
· Campo.
checkCORRETO
· Registro.
· Variável.
Resolução comentada:
Os elementos que compõem um banco de dados recebem nomes distintos a depender da área de estudo. Por exemplo, o que os estatísticos chamam de “variável”, os profissionais da computação chamam de “campo”.
Código da questão: 47612
4)
Existem diversas maneiras de elaboração de um banco de dados em linguagem R. Sobre esta característica, avalie as afirmativas a seguir.
I. As estruturas de arranjos de dados em linguagem R são classificadas como escalares, vetores, matrizes, arrays, data frames e listas.
II. Um banco de dados escalar em linguagem R tem dimensão de uma linha e várias colunas.
III. Um banco de dados do tipo data frame pode possuir diversos tipos de variáveis.
IV. Em linguagem R, as variáveis categóricas são classificadas como factor.
V. Em linguagem R, denomina-se objeto qualquer elemento que possa ser atribuído a uma variável.
São verdadeiras:
Alternativas:
· I, III, IV e V, apenas.
checkCORRETO
· IV e V, apenas.
· I, II e IV, apenas.
· III e V, apenas.
· I, II, IV e V, apenas.
Resolução comentada:
As estruturas de bancos de dados existentes em linguagem R são escalares, vetores, matrizes, arrays, data frames e listas. Um banco de dados escalar tem dimensão de uma linha e uma coluna, apenas. Um banco de dados do tipo data frame pode conter vários tipos de variáveis. As variáveis categóricas, em linguagem R, são classificadas como factor e denomina-se objeto qualquer elemento que possa ser atribuído a uma variável.
Código da questão: 47614
5)
Sobre análise de dados com métodos estatísticos e aplicação na linguagem R, avalie as afirmativas a seguir e assinale (V) para verdadeira e (F) para falsa.
( ) O teste qui-quadrado só é considerado confiável quando grande parte dos valores esperados de uma tabela são superiores ao valor 5.
( ) O teste qui-quadrado avalia associação entre variáveis qualitativas.
( ) Quando o valor p é superior a 0,05, pode-se afirmar que existe evidência de associação entre duas variáveis qualitativas.
( ) É possível obter o resultado de um teste qui-quadrado com o uso da função “table( )”.
( ) Uma medida de correlação varia de 0 a +1.
Assinale a alternativa que contenha a sequência correta.
Alternativas:
· V – V – F – V – F.
· F – V – F – V – F.
· V – V – F – F – F.
checkCORRETO
· F – F – F – F – F.
· V – V – V – V – V.
Resolução comentada:
O teste qui-quadrado só é considerado válido quando a maioria dos valores esperados da tabela são superiores ao valor 5 e avalia a existência de associação entre variáveis qualitativas. Quando o valor p é inferior a 0,05 é possível afirmar que existe evidência de associação entre duas variáveis qualitativas. Para obter o resultado de um teste qui-quadrado, pode-se utilizar a função “crosstab”. Uma medida de correlação varia de -1 a +1.
Código da questão: 47605
6)
O RStudio apresenta uma série de funcionalidades que facilitam a utilização da linguagem R em seu ambiente. Considerando esta informação, avalie as afirmativas a seguir.
I. Ao digitar uma linha de comando no editor de códigos do RStudio só é possível executar tal comando apertando a tecla enter.
II. A utilização de um pacote do R é realizada quando se deseja fazer uso dos scripts nele existente.
III. Só é possível instalar pacotes no RStudio se estiver com o computador conectado à internet.
IV. A utilização de um pacote específico do R só pode ser realizada se ele for carregado na sessão de trabalho.
V. Os argumentos de uma função do R não podem ser omitidos quando uma função específica for utilizada.
Assinale a alternativa que contém as afirmativas verdadeiras.
Alternativas:
· III e V.
· II, III e IV.
checkCORRETO
· I, II e IV.
· I, IV e V.
· III, IV e V.
Resolução comentada:
As afirmativas corretas são II, III e IV. Ao digitar linhas de comando no editor de códigos do RStudio só é possível executá-los com o uso da tecla “Run” ou da tecla “Source”. Utiliza-se um pacote específico do R quando se pretende utilizar os scripts contidos nele e, para instalar um novo pacote, é necessário estar com o computador conectado à internet. Para utilizar um pacote qualquer, faz-se necessário o seu carregamento na sessão de trabalho em curso. Pode-se omitir a declaração dos argumentos de uma função do R, desde que sejam digitados na ordem em que estão implementados no código.
Código da questão: 47599
7)
Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo de padrão existente, assim como a identificação de possíveis erros. Como é denominada a metodologia estatística utilizada na primeira etapa de uma análise de dados?
Assinale a alternativa CORRETA..
Alternativas:
· Inferência estatística.
· Teste de hipóteses.
· Amostragem.
· Estatística descritiva.
checkCORRETO
· Causalidade.
Resolução comentada:
Toda análise de dados é iniciadacom uma exploração dos dados. As técnicas utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva.
Código da questão: 47592
8)
Existe uma série de gráficos que podem ser utilizados como recursos de visualização de dados para apresentação de resultados de análise de dados. Com relação aos tipos de gráficos, avalie as afirmativas a seguir.
I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada.
II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, tanto nominais quanto discretas.
III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual informações de variáveis qualitativas.
IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que tenham alguma dependência entre si.
V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser realizada com o uso de um diagrama de dispersão bidimensional.
Assinale as alternativas que contém as afirmativas CORRETAS.
Alternativas:
· I, II e IV.
· II, IV e V.
· I, III e IV.
checkCORRETO
· II, III e V.
· III, IV e V.
Resolução comentada:
Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, também podem apresentar frequências absolutas. Um gráfico de série temporal é apropriado para apresentar resultados coletados ao longo do tempo, de um determinado período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em determinado período é o gráfico de dispersão unidimensional.
Código da questão: 47609
9)
O uso de recurso gráfico para apresentação de resultados de análise de dados é uma boa opção quando se deseja atingir um amplo público e, também, quando se deseja facilitar a compreensão dos resultados encontrados. É uma forma rápida de divulgação de informações. Estudiosos como Chambers et al. (1983 apud Bussab e Morettin, 2017) listaram alguns fins que justificam o uso de recursos gráficos, como, por exemplo, a busca de padrões e relações. Se um diagrama de dispersão apresentar padrão crescente da esquerda para a direita, ou seja, da origem do plano cartesiano para a direita do mesmo, o que pode ser concluído desta visualização?
BUSSAB, Wilton.; MORETTIN, Pedro A. Estatística básica. 9. ed. São Paulo: Saraiva, 2017. 554p.
Assinale a alternativa CORRETA.
Alternativas:
· Os dados plotados têm correlação negativa entre eles.
· Os dados plotados não são apropriados para o tipo de gráfico.
· Os dados plotados apresentam correlação positiva entre eles.
checkCORRETO
· Os dados plotados não têm correlação entre eles.
· Os dados plotados apresentam variância negativa.
Resolução comentada:
Se um gráfico de dispersão apresentar pontos com padrão crescente da esquerda para a direita, há um indício de que os dados plotados apresentam correlação positiva entre eles.
Código da questão: 47607
10)
Sobre o uso de métodos estatísticos e a linguagem R para análise de dados, avalie as asserções a seguir e a relação existente entre elas.
I. Existem duas grandes etapas de análise de dados. A primeira etapa é a análise descritiva. Os resultados obtidos de uma análise descritiva realizada em uma amostra podem ser extrapolados para a população de onde foram retirados.
PORQUE
II. Os métodos estatísticos de uma análise descritiva de dados garantem que os resultados encontrados são válidos apenas para a amostra analisada.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· As afirmativas I e II são falsas.
· As duas afirmações são verdadeiras e a segunda justifica a primeira.
· A afirmativa I é verdadeira e a afirmativa II é falsa.
· As duas afirmações são verdadeiras e a segunda não justifica a primeira.
· A afirmativa I é falsa e a afirmativa II é verdadeira.
checkCORRETO
Resolução comentada:
Uma análise de dados pode ser dividida em duas grandes etapas. A etapa da análise descritiva possui métodos estatísticos que garantem que os resultados obtidos com uma amostra são válidos apenas para ela, não podendo ser extrapolados para a população de onde foram retirados.
Código da questão: 47606

Continue navegando