Baixe o app para aproveitar ainda mais
Prévia do material em texto
Pergunta 1 1. Em uma pesquisa sobre a preferência de esporte transmitidos por um canal televisivo, os entrevistados devem dizer se preferem atletismo ou basquete. Se θ representar a proporção da população que prefere atletismo, encontraremos uma amostra de n participantes. Dado θ, as n respostas são independentes, e a probabilidade de determinado espectador preferir atletismo é θ. A distribuição anterior para θ é uma distribuição beta (a, a), com um desvio-padrão de 0,25. Nesse contexto, o desvio-padrão a posteriori é, aproximadamente: Pergunta 2 1. Considere uma amostragem aleatória de tamanho 10 da distribuição Poisson , na qual cada é o número de defeitos por de uma chapa de metal. Usando uma priori não informativa para , dada por , assinale a alternativa que apresenta, corretamente, o intervalo de credibilidade de 95% para o número médio de defeitos, sabendo que o total observado de defeitos é 10. Pergunta 3 1. Os métodos multivariados, geralmente, estão associados às noções causais e ao controle estatístico entre as variáveis, dentre as quais estão as associações espúrias, o relacionamento encadeado, as múltiplas causas, as variáveis supressoras e a interação estatística. Considerando o exposto e seus conhecimentos a respeito das análises multivariáveis, analise as afirmativas a seguir: I. O escalonamento multidimensional é um teste estatístico que mede a qualidade de ajuste, em que um modelo estatístico, relativamente mais complexo, é comparado com um modelo mais simples, para verificar se ele ajusta um conjunto de dados de forma significativamente melhor. II. A análise de regressão logística verifica se um subconjunto de variáveis pode ser retirado do modelo de regressão logística múltipla, testando se um ou mais coeficientes são nulos. III. A análise discriminante é uma técnica de classificação de um conjunto de observações em classes predefinidas, cujo objetivo é determinar a classe de uma observação, a partir de um conjunto de variáveis preditoras, que devem ser contínuas e ter distribuição normal. IV. A análise de componentes principais envolve um procedimento matemático que transforma um número de variáveis, possivelmente, correlacionadas em um número menor de variáveis não correlacionadas, denominadas componentes principais. Está correto o que se afirma em: I, II e IV, apenas. I e IV, apenas. II e III, apenas. I e III, apenas. II, III e IV, apenas. Pergunta 4 1. Em uma pesquisa sobre intenção de voto, os entrevistados devem dizer qual candidato preferem: A ou B. Se θ representar a proporção da população que prefere A, encontraremos uma amostra de n participantes. Dado θ, as n respostas são independentes, e a probabilidade de determinado participante preferir A é θ. A distribuição anterior para θ é uma distribuição beta (a, a), com um desvio-padrão de 0,25. Ademais, n = 30 eleitores, dos quais 21 preferem o candidato A. Nesse contexto, a distribuição posterior de θ é: Pergunta 5 1. Em uma pequena pesquisa, uma amostra aleatória de 50 pessoas de uma grande população é selecionada. Cada pessoa recebe uma pergunta, cuja resposta é “sim” ou “não”. A proporção da população que responderia “sim” seria θ. Ademais, nossa distribuição a priori para θ é uma distribuição beta (1,5, 1,5). Diante do exposto, e considerando que, nessa pesquisa, 37 pessoas responderam “sim”, assinale a alternativa que apresenta, corretamente, a média e o desvio-padrão a priori de θ. Pergunta 6 1. A característica da população de interesse é chamada de parâmetro, e a característica da amostra correspondente é a estatística da amostra ou a estimativa do parâmetro. Uma variável aleatória tem uma única distribuição, que depende de parâmetros de interesse, mas, apesar de ter somente uma distribuição, é mais fácil modelar uma situação considerando-se uma hierarquia. Nesse contexto, assinale a alternativa que apresenta, corretamente, o teste de razão de verossimilhança. No teste de razão de verossimilhança, há a técnica de classificação de um conjunto de observações em classes predefinidas. O objetivo é determinar a classe de uma observação a partir de um conjunto de variáveis preditoras, que devem ser contínuas e ter distribuição normal. O teste de razão de verossimilhança verifica se um subconjunto de variáveis pode ser retirado do modelo de regressão logística múltipla, isto é, testa se um ou mais coeficientes são iguais a zero. A vantagem do teste de razão de verossimilhança é que processos complicados podem ser modelados por uma sequência de modelos, relativamente simples, colocados em uma hierarquia. Além disso, lidar com hierarquia não é mais difícil do que lidar com distribuições condicionais e marginais. O teste de razão de verossimilhança é um teste estatístico que mede a qualidade de ajuste entre dois modelos; um modelo estatístico, relativamente mais complexo, é comparado com um modelo mais simples, para verificar se ele ajusta um conjunto de dados de forma significativamente melhor. O teste de razão de verossimilhança envolve um procedimento matemático que transforma um número de variáveis, possivelmente, correlacionadas em um número menor de variáveis não correlacionadas, denominadas componentes principais. Pergunta 7 1. O modelo empírico de Bayes é importante para se reconhecer o risco contido nos dados denotados pelo parâmetro de interesse θ. O estimador bayesiano empírico utiliza o cálculo médio, denominado estimador empírico global, por meio da localidade e da taxa global de uma região. Considerando que existe um estimador empírico local, que determina a realidade e a estimativa locais, analise as afirmativas a seguir: I. O modelo Bayesiano empírico tem os hiperparâmetros com valores desconhecidos e usa as estimativas da verossimilhança para a resolução dos hiperparâmetros; a ideia principal é utilizar os dados da amostra para descobrir e estimar valores fixos. II. A abordagem Bayesiana aplicada à estatística é, exatamente, igual à adotada pelo modelo empírico de Bayes, mas não existem aspectos da Bayesiana que podem ser úteis para outras abordagens estatísticas. III. A base de dados multivariados refere-se às medidas de semelhança que avaliam a similaridade das análises de ordenação e classificação; quanto maior é a semelhança, maior é o número de componentes comuns. IV. O modelo empírico de Bayes é uma forma de identificação de grupos de objetos similares e refere-se à possibilidade de separar diferentes grupos, com base nas medidas disponíveis; o objetivo é estudar a variação em uma quantidade de variáveis originais. Está correto o que se afirma em: II e III, apenas. II, III e IV, apenas. I e IV, apenas. I e II, apenas. I e III, apenas. Pergunta 8 1. As vendas de um tipo específico de insumo agrícola, em uma casa agropecuária, foram registradas em cada uma de 20 semanas. Considere que, dado o valor de um parâmetro λ, esses números são independentes observações da distribuição de Poisson (λ). Essa distribuição a priori para λ é uma distribuição gama (a, b). Os números de vendas observados foram: 14 19 14 21 22 33 15 13 16 19 27 22 27 21 16 25 14 23 22 17 Nesse contexto, é possível afirmar que a distribuição a posteriori de λ é uma distribuição gama: (401; 20,25). (400; 20). (404; 20,25). (399; 20). (399; 20,25). Pergunta 9 1. Considere que o período de espera, em minutos, para o atendimento de clientes de determinada empresa segue uma distribuição exponencial com parâmetro θ desconhecido. Considerando que essa situação hipotética possui uma distribuição a priori gama, com desvio-padrão 1 para θ e média 0.2, o menor número de clientes que precisa ser observado, para queo coeficiente de variação a posteriori seja reduzido para 0.1, é, aproximadamente: 75. 100. 25. 50. 125. Pergunta 10 1. Em um experimento médico, os pacientes com uma condição crônica devem dizer qual tratamento preferem: A ou B. Se θ representar a proporção da população que prefere A, encontraremos uma amostra de n pacientes. Dado θ, as n respostas são independentes, e a probabilidade de determinado paciente preferir A é θ. A distribuição anterior para θ é uma distribuição beta (a, a), com um desvio-padrão de 0,25. Nesse sentido, assinale a alternativa que apresenta, corretamente, o valor de a.
Compartilhar