Baixe o app para aproveitar ainda mais
Prévia do material em texto
1)As técnicas de amostragem foram criadas para garantir que subconjuntos de populações possam representar de maneira adequada alguma característica do todo. Diversas técnicas foram criadas e são utilizadas de acordo com o desenho da pesquisa de interesse. A respeito das técnicas de amostragem, avalie as afirmativas a seguir. I. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. II. A amostragem probabilística não pode atribuir probabilidade na seleção dos elementos da amostra. III. Um dos critérios de seleção dos elementos de uma amostra probabilística é a arbitrariedade. IV. A amostragem sistemática compõe o conjunto de técnicas probabilísticas de amostragem. V. A amostragem por cotas compõe o conjunto de técnicas não probabilísticas de amostragem. Assinale a alternativa que contém as alternativas verdadeiras. • III, IV e V. • I, II e IV. • II e III. • I, IV e V.checkCORRETO • III e IV. Resolução comentada: Afirmativas I, IV e V estão corretas. As técnicas de amostragem se subdividem em probabilísticas e não probabilísticas. As técnicas probabilísticas atribuem probabilidade de seleção aos elementos da população. A arbitrariedade é um critério de seleção das técnicas não probabilísticas. A amostragem sistemática compõe o conjunto de técnicas probabilísticas e a amostragem por cotas compõe o conjunto de técnicas não probabilísticas. 2)A linguagem R foi elaborada com o intuito de realizar análise de dados. Sobre esta linguagem de programação, avalie as afirmativas a seguir. I. A linguagem R possui diversas IDE (Ambiente de Desenvolvimento Integrado) que foram elaboradas para facilitar o seu uso. II. A IDE RStudio tem interface dividida em três partes. III. Um dos pacotes que permite elaboração de tabelas de frequências é o crosstab. IV. O comando “summary( )” é utilizado para se obter medidas resumo das variáveis de um conjunto de dados. V. A função “fisher.test( )” é utilizada para avaliar correlação entre variáveis quantitativas. Assinale a alternativa que apresenta a sequência CORRETA. • IV e V. • II e III. • I, II e IV. • I e IV.checkCORRETO • II, III e IV. Resolução comentada: A linguagem R possui diversas IDE, as quais foram elaboradas para facilitar o seu uso. A IDE RStudio tem interface dividida em quatro partes. Um dos pacotes da linguagem R que permite a elaboração de tabelas de frequências é o “descr”. O comando “summary( )” é utilizado para obter medidas resumo de variáveis de um conjunto de dados. A função “fisher.test( )” é utilizada para verificar associação entre variáveis qualitativas. 3)É possível utilizar o RStudio e realizar as principais operações matemáticas através de simbologia apropriada. Essa atividade pode ser realizada tanto no editor de códigos quanto no console. Para obter o resto de uma divisão de valores, utiliza-se qual símbolo matemático? Assinale a alternativa CORRETA. • Multiplicação. • Soma. • Mod.checkCORRETO • Divisão. • Diferença. Resolução comentada: Sempre que se desejar obter como resultado o resto de uma divisão entre dois números, deve-se utilizar no RStudio o símbolo referente à operação Mod, que é representado por %%. Tal informação encontra-se no Quadro 1 da leitura fundamental. 4)Uma análise completa de dados se particiona em duas grandes partes. Uma delas é realizada com métodos estatísticos que permitem a extrapolação dos resultados encontrados numa amostra para toda a população. Qual o nome desta etapa de análise de dados? Assinale a alternativa CORRETA. • Tabelas e gráficos. • Inferencial.checkCORRETO • Associação. • Correlação. • Descritiva. Resolução comentada: A etapa de uma análise de dados que é realizada com métodos estatísticos que permitem a extrapolação dos resultados encontrados em uma amostra para a população de onde foi retirada é a análise inferencial. 5)Os modelos preditivos podem ser implementados em linguagem R de diversas formas. Sobre a aplicação de modelos preditivos para classificação em linguagem R, avalie as afirmativas a seguir. I. Para criar um modelo de classificação no R, o banco de dados é dividido em duas partes iguais. II. A função factor( ) converte uma variável para quantitativa. III. A função summary( ) exibe um resumo descritivo das variáveis de um conjunto de dados. IV. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona parte das linhas de um conjunto de dados. V. A função table( ) cria uma tabela de resultados de variáveis. Assinale a alternativa que contém as afirmativas CORRETAS. • I, II, III, IV e V. • I, II e IV, apenas. • I, II e III, apenas. • III e V, apenas.checkCORRETO • III, IV e V, apenas. Resolução comentada: Para criar um modelo de classificação, divide-se o banco de dados em duas partes, onde 70% fica em uma delas e 30% na outra. A função factor( ) converte uma variável para categórica. A função summary( ) exibe resumo descritivo das variáveis do banco de dados. A função sample(ncol(dados), 0.7*nrow(dados)) seleciona 70% das colunas de um conjunto de dados. A função table( ) cria uma tabela de resultados de variáveis. 6)Existe uma série de gráficos que podem ser utilizados como recursos de visualização de dados para apresentação de resultados de análise de dados. Com relação aos tipos de gráficos, avalie as afirmativas a seguir. I. Para uma correta apresentação gráfica, é necessário identificar o tipo da variável tratada. II. O gráfico de colunas é apropriado para apresentar resultados de variáveis categóricas, tanto nominais quanto discretas. III. O gráfico de setores é apropriado para apresentar, preferencialmente, em percentual informações de variáveis qualitativas. IV. Um gráfico de série temporal é apropriado para apresentar resultados que variam ao longo do tempo, ou seja, que foram coletados considerando uma variação temporal e que tenham alguma dependência entre si. V. Apresentar dados sobre a quantidade de consultas médicas de uma pessoa pode ser realizada com o uso de um diagrama de dispersão bidimensional. Assinale as alternativas que contém as afirmativas CORRETAS. • I, II e IV. • II, III e V. • I, III e IV.checkCORRETO • II, IV e V. • III, IV e V. Resolução comentada: Para uma correta apresentação visual (gráfica) é necessário conhecer o tipo de variável que será apresentada. Por exemplo, um gráfico de colunas é apropriado para apresentar variáveis categóricas, tanto nominais quanto ordinais. Um gráfico de setores é bastante utilizado para apresentação de resultados percentuais de variáveis categóricas ou qualitativas, no entanto, também podem apresentar frequências absolutas. Um gráfico de série temporal é apropriado para apresentar resultados coletados ao longo do tempo, de um determinado período. O gráfico apropriado para apresentar o número de consultas médicas realizadas em determinado período é o gráfico de dispersão unidimensional. 7)A classe de modelos preditivos é diversa e, também, classificada segundo os objetivos que se tem com os dados. A esse respeito, avalie a afirmativa a seguir para completar corretamente suas lacunas. Os modelos preditivos são uma classe de modelos ____________ utilizados para representarem __________ para tomada de decisão. Os modelos preditivos para ____________ também são conhecidos como modelos de _____________ supervisionada. Assinale a alternativa que completa adequadamente as lacunas acima: • Matemáticos; problemas; classificação; aprendizagem.checkCORRETO • Estatísticos; problemas; classificação; atividade. • Visuais; problemas; equação; atividade. • Visuais; fórmulas; equação; atividade. • Constantes; problemas; classificação; aprendizagem. Resolução comentada: Os modelos preditivos são uma classe de modelos matemáticos utilizados para representarem problemas para tomada de decisão. Os modelos preditivos para classificação também são conhecidos como modelos de aprendizagemsupervisionada. 8)Toda análise de dados, para ser bem executada, precisa ser bem planejada e executada com rigor. Então, para uma boa realização da análise, divide-se o processo em duas etapas. A primeira etapa da análise ajuda a conhecer os dados e a identificar todo e qualquer tipo de padrão existente, assim como a identificação de possíveis erros. Como é denominada a metodologia estatística utilizada na primeira etapa de uma análise de dados? Assinale a alternativa CORRETA.. • Teste de hipóteses. • Amostragem. • Estatística descritiva.checkCORRETO • Causalidade. • Inferência estatística. Resolução comentada: Toda análise de dados é iniciada com uma exploração dos dados. As técnicas utilizadas para tal exploração compõem o conjunto de medidas descritivas, chamado estatística descritiva. 9)I. A execução de um comando em linguagem R requer conhecimento apropriado sobre criação de funções e objetos para o seu uso adequado. Também é necessário ter um conhecimento razoável sobre a linguagem. PORQUE II. É possível realizar os cálculos diferentes com comandos de execução diversos, ou seja, é possível realizar “caminhos” distintos para se obter os mesmos resultados. Analisando as afirmações acima, conclui-se que: • A primeira afirmação é verdadeira e a segunda é falsa. • As duas afirmações são falsas. • A primeira afirmação é falsa e a segunda é verdadeira. • As duas afirmações são verdadeiras e a segunda justifica a primeira. • As duas afirmações são verdadeiras e a segunda não justifica a primeira.checkCORRETO Resolução comentada: É possível obter resultados semelhantes e fazer as mesmas análises com procedimentos distintos no R. Essa é uma das vantagens que a linguagem possui. Cálculos diferentes ou diversos também podem ser realizados com programação diversa. 10)Existe uma classe grande de modelos preditivos para análise de dados. A variável resposta associada ao modelo preditivo pode ser do tipo quantitativa quanto variável categórica. Quando a variável resposta ou dependente é categórica com duas categorias, recebe um nome específico. Qual o nome que a variável resposta recebe? Assinale a alternativa CORRETA. • Multinomial. • Nominal. • Contínua. • Ordinal. • Dicotômica.checkCORRETO Resolução comentada: Em um modelo preditivo, quando a variável resposta é categórica com duas categorias, recebe o nome de variável dicotômica.
Compartilhar