Buscar

8 - Técnicas estatísticas teoria e prática R Programing

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1)As técnicas de amostragem foram criadas para garantir que subconjuntos de 
populações possam representar de maneira adequada alguma característica do 
todo. Diversas técnicas foram criadas e são utilizadas de acordo com o desenho 
da pesquisa de interesse. A respeito das técnicas de amostragem, avalie as 
afirmativas a seguir. 
I. As técnicas de amostragem se subdividem em probabilísticas e não 
probabilísticas. 
II. A amostragem probabilística não pode atribuir probabilidade na seleção dos 
elementos da amostra. 
III. Um dos critérios de seleção dos elementos de uma amostra probabilística é 
a arbitrariedade. 
IV. A amostragem sistemática compõe o conjunto de técnicas probabilísticas de 
amostragem. 
V. A amostragem por cotas compõe o conjunto de técnicas não probabilísticas 
de amostragem. 
 
Assinale a alternativa que contém as alternativas verdadeiras. 
 
• III, IV e V. 
• I, II e IV. 
• II e III. 
• I, IV e V.checkCORRETO 
• III e IV. 
 
Resolução comentada: 
Afirmativas I, IV e V estão corretas. As técnicas de amostragem se subdividem 
em probabilísticas e não probabilísticas. As técnicas probabilísticas atribuem 
probabilidade de seleção aos elementos da população. A arbitrariedade é um 
critério de seleção das técnicas não probabilísticas. A amostragem sistemática 
compõe o conjunto de técnicas probabilísticas e a amostragem por cotas compõe 
o conjunto de técnicas não probabilísticas. 
 
2)A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre 
esta linguagem de programação, avalie as afirmativas a seguir. 
I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) 
que foram elaboradas para facilitar o seu uso. 
II. A IDE RStudio tem interface dividida em três partes. 
III. Um dos pacotes que permite elaboração de tabelas de frequências é o 
crosstab. 
IV. O comando “summary( )” é utilizado para se obter medidas resumo das 
variáveis de um conjunto de dados. 
V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis 
quantitativas. 
Assinale a alternativa que apresenta a sequência CORRETA. 
 
• IV e V. 
• II e III. 
• I, II e IV. 
• I e IV.checkCORRETO 
• II, III e IV. 
 
Resolução comentada: 
A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o 
seu uso. A IDE RStudio tem interface dividida em quatro partes. Um dos pacotes 
da linguagem R que permite a elaboração de tabelas de frequências é o “descr”. 
O comando “summary( )” é utilizado para obter medidas resumo de variáveis de 
um conjunto de dados. A função “fisher.test( )” é utilizada para verificar 
associação entre variáveis qualitativas. 
 
3)É possível utilizar o RStudio e realizar as principais operações matemáticas 
através de simbologia apropriada. Essa atividade pode ser realizada tanto no 
editor de códigos quanto no console. Para obter o resto de uma divisão de 
valores, utiliza-se qual símbolo matemático? 
Assinale a alternativa CORRETA. 
 
 
• Multiplicação. 
• Soma. 
• Mod.checkCORRETO 
• Divisão. 
• Diferença. 
 
Resolução comentada: 
Sempre que se desejar obter como resultado o resto de uma divisão entre dois 
números, deve-se utilizar no RStudio o símbolo referente à operação Mod, que 
é representado por %%. Tal informação encontra-se no Quadro 1 da leitura 
fundamental. 
 
4)Uma análise completa de dados se particiona em duas grandes partes. Uma 
delas é realizada com métodos estatísticos que permitem a extrapolação dos 
resultados encontrados numa amostra para toda a população. Qual o nome 
desta etapa de análise de dados? 
Assinale a alternativa CORRETA. 
 
• Tabelas e gráficos. 
• Inferencial.checkCORRETO 
• Associação. 
• Correlação. 
• Descritiva. 
 
Resolução comentada: 
A etapa de uma análise de dados que é realizada com métodos estatísticos que 
permitem a extrapolação dos resultados encontrados em uma amostra para a 
população de onde foi retirada é a análise inferencial. 
 
5)Os modelos preditivos podem ser implementados em linguagem R de diversas 
formas. Sobre a aplicação de modelos preditivos para classificação em 
linguagem R, avalie as afirmativas a seguir. 
I. Para criar um modelo de classificação no R, o banco de dados é dividido em 
duas partes iguais. 
II. A função factor( ) converte uma variável para quantitativa. 
III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto 
de dados. 
IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de 
um conjunto de dados. 
V. A função table( ) cria uma tabela de resultados de variáveis. 
Assinale a alternativa que contém as afirmativas CORRETAS. 
 
• I, II, III, IV e V. 
• I, II e IV, apenas. 
• I, II e III, apenas. 
• III e V, apenas.checkCORRETO 
• III, IV e V, apenas. 
 
Resolução comentada: 
Para criar um modelo de classificação, divide-se o banco de dados em duas 
partes, onde 70% fica em uma delas e 30% na outra. A função factor( ) converte 
uma variável para categórica. A função summary( ) exibe resumo descritivo das 
variáveis do banco de dados. A função sample(ncol(dados), 0.7*nrow(dados)) 
seleciona 70% das colunas de um conjunto de dados. A função table( ) cria uma 
tabela de resultados de variáveis. 
 
6)Existe uma série de gráficos que podem ser utilizados como recursos de 
visualização de dados para apresentação de resultados de análise de dados. 
Com relação aos tipos de gráficos, avalie as afirmativas a seguir. 
I. Para uma correta apresentação gráfica, é necessário identificar o tipo da 
variável tratada. 
II. O gráfico de colunas é apropriado para apresentar resultados de variáveis 
categóricas, tanto nominais quanto discretas. 
III. O gráfico de setores é apropriado para apresentar, preferencialmente, em 
percentual informações de variáveis qualitativas. 
IV. Um gráfico de série temporal é apropriado para apresentar resultados que 
variam ao longo do tempo, ou seja, que foram coletados considerando uma 
variação temporal e que tenham alguma dependência entre si. 
V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa 
pode ser realizada com o uso de um diagrama de dispersão bidimensional. 
Assinale as alternativas que contém as afirmativas CORRETAS. 
 
• I, II e IV. 
• II, III e V. 
• I, III e IV.checkCORRETO 
• II, IV e V. 
• III, IV e V. 
 
Resolução comentada: 
Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de 
variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado 
para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um 
gráfico de setores é bastante utilizado para apresentação de resultados 
percentuais de variáveis categóricas ou qualitativas, no entanto, também podem 
apresentar frequências absolutas. Um gráfico de série temporal é apropriado 
para apresentar resultados coletados ao longo do tempo, de um determinado 
período. O gráfico apropriado para apresentar o número de consultas médicas 
realizadas em determinado período é o gráfico de dispersão unidimensional. 
 
7)A classe de modelos preditivos é diversa e, também, classificada segundo os 
objetivos que se tem com os dados. A esse respeito, avalie a afirmativa a seguir 
para completar corretamente suas lacunas. 
Os modelos preditivos são uma classe de modelos ____________ utilizados 
para representarem __________ para tomada de decisão. Os modelos 
preditivos para ____________ também são conhecidos como modelos de 
_____________ supervisionada. 
Assinale a alternativa que completa adequadamente as lacunas acima: 
 
• Matemáticos; problemas; classificação; aprendizagem.checkCORRETO 
• Estatísticos; problemas; classificação; atividade. 
• Visuais; problemas; equação; atividade. 
• Visuais; fórmulas; equação; atividade. 
• Constantes; problemas; classificação; aprendizagem. 
 
Resolução comentada: 
Os modelos preditivos são uma classe de modelos matemáticos utilizados para 
representarem problemas para tomada de decisão. Os modelos preditivos para 
classificação também são conhecidos como modelos de aprendizagemsupervisionada. 
 
8)Toda análise de dados, para ser bem executada, precisa ser bem planejada e 
executada com rigor. Então, para uma boa realização da análise, divide-se o 
processo em duas etapas. A primeira etapa da análise ajuda a conhecer os 
dados e a identificar todo e qualquer tipo de padrão existente, assim como a 
identificação de possíveis erros. Como é denominada a metodologia estatística 
utilizada na primeira etapa de uma análise de dados? 
Assinale a alternativa CORRETA.. 
 
 
• Teste de hipóteses. 
• Amostragem. 
• Estatística descritiva.checkCORRETO 
• Causalidade. 
• Inferência estatística. 
 
Resolução comentada: 
Toda análise de dados é iniciada com uma exploração dos dados. As técnicas 
utilizadas para tal exploração compõem o conjunto de medidas descritivas, 
chamado estatística descritiva. 
 
9)I. A execução de um comando em linguagem R requer conhecimento 
apropriado sobre criação de funções e objetos para o seu uso adequado. 
Também é necessário ter um conhecimento razoável sobre a linguagem. 
PORQUE 
II. É possível realizar os cálculos diferentes com comandos de execução 
diversos, ou seja, é possível realizar “caminhos” distintos para se obter os 
mesmos resultados. 
 
Analisando as afirmações acima, conclui-se que: 
 
• A primeira afirmação é verdadeira e a segunda é falsa. 
• As duas afirmações são falsas. 
• A primeira afirmação é falsa e a segunda é verdadeira. 
• As duas afirmações são verdadeiras e a segunda justifica a primeira. 
• As duas afirmações são verdadeiras e a segunda não justifica a 
primeira.checkCORRETO 
 
Resolução comentada: 
É possível obter resultados semelhantes e fazer as mesmas análises com 
procedimentos distintos no R. Essa é uma das vantagens que a linguagem 
possui. Cálculos diferentes ou diversos também podem ser realizados com 
programação diversa. 
 
10)Existe uma classe grande de modelos preditivos para análise de dados. A 
variável resposta associada ao modelo preditivo pode ser do tipo quantitativa 
quanto variável categórica. Quando a variável resposta ou dependente é 
categórica com duas categorias, recebe um nome específico. Qual o nome que 
a variável resposta recebe? 
Assinale a alternativa CORRETA. 
 
 
• Multinomial. 
• Nominal. 
• Contínua. 
• Ordinal. 
• Dicotômica.checkCORRETO 
 
Resolução comentada: 
Em um modelo preditivo, quando a variável resposta é categórica com duas 
categorias, recebe o nome de variável dicotômica.

Continue navegando