Buscar

Atividade 04 - Inferência Bayesiana FMU

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

Pergunta 1 
1. Em uma pesquisa sobre a preferência de esporte transmitidos por um canal 
televisivo, os entrevistados devem dizer se preferem atletismo ou basquete. Se 
θ representar a proporção da população que prefere atletismo, encontraremos 
uma amostra de n participantes. Dado θ, as n respostas são independentes, e 
a probabilidade de determinado espectador preferir atletismo é θ. A distribuição 
anterior para θ é uma distribuição beta (a, a), com um desvio-padrão de 0,25. 
 
Nesse contexto, o desvio-padrão a posteriori é, aproximadamente: 
 
 
Pergunta 2 
1. Considere uma amostragem aleatória de tamanho 10 da 
distribuição Poisson , na qual cada é o número de defeitos por de 
uma chapa de metal. Usando uma priori não informativa para , dada por 
, assinale a alternativa que apresenta, corretamente, o intervalo de 
credibilidade de 95% para o número médio de defeitos, sabendo que o total 
observado de defeitos é 10. 
 
 
 
Pergunta 3 
1. Os métodos multivariados, geralmente, estão associados às noções causais e 
ao controle estatístico entre as variáveis, dentre as quais estão as associações 
espúrias, o relacionamento encadeado, as múltiplas causas, as variáveis 
supressoras e a interação estatística. 
 
Considerando o exposto e seus conhecimentos a respeito das análises 
multivariáveis, analise as afirmativas a seguir: 
 
I. O escalonamento multidimensional é um teste estatístico que mede a 
qualidade de ajuste, em que um modelo estatístico, relativamente mais 
complexo, é comparado com um modelo mais simples, para verificar se ele 
ajusta um conjunto de dados de forma significativamente melhor. 
II. A análise de regressão logística verifica se um subconjunto de variáveis pode 
ser retirado do modelo de regressão logística múltipla, testando se um ou mais 
coeficientes são nulos. 
III. A análise discriminante é uma técnica de classificação de um conjunto de 
observações em classes predefinidas, cujo objetivo é determinar a classe de 
uma observação, a partir de um conjunto de variáveis preditoras, que devem 
ser contínuas e ter distribuição normal. 
IV. A análise de componentes principais envolve um procedimento matemático 
que transforma um número de variáveis, possivelmente, correlacionadas em 
um número menor de variáveis não correlacionadas, denominadas 
componentes principais. 
 
Está correto o que se afirma em: 
 I, II e IV, apenas. 
 I e IV, apenas. 
 II e III, apenas. 
 I e III, apenas. 
 II, III e IV, apenas. 
 
Pergunta 4 
1. Em uma pesquisa sobre intenção de voto, os entrevistados devem dizer qual 
candidato preferem: A ou B. Se θ representar a proporção da população que 
prefere A, encontraremos uma amostra de n 
participantes. Dado θ, as n respostas são independentes, e a probabilidade de 
determinado participante preferir A é θ. A distribuição anterior para θ é uma 
distribuição beta (a, a), com um desvio-padrão de 0,25. Ademais, n = 30 
eleitores, dos quais 21 preferem o candidato A. 
 
Nesse contexto, a distribuição posterior de θ é: 
 
 
 
Pergunta 5 
1. Em uma pequena pesquisa, uma amostra aleatória de 50 pessoas de uma 
grande população é selecionada. Cada pessoa recebe uma pergunta, cuja 
resposta é “sim” ou “não”. A proporção da população que responderia “sim” 
seria θ. Ademais, nossa distribuição a priori para θ é uma distribuição beta (1,5, 
1,5). Diante do exposto, e considerando que, nessa pesquisa, 37 pessoas 
responderam “sim”, assinale a alternativa que apresenta, corretamente, a 
média e o desvio-padrão a priori de θ. 
 
 
 
Pergunta 6 
1. A característica da população de interesse é chamada de parâmetro, e a 
característica da amostra correspondente é a estatística da amostra ou a 
estimativa do parâmetro. Uma variável aleatória tem uma única distribuição, 
que depende de parâmetros de interesse, mas, apesar de ter somente uma 
distribuição, é mais fácil modelar uma situação considerando-se uma 
hierarquia. 
 
Nesse contexto, assinale a alternativa que apresenta, corretamente, o teste de 
razão de verossimilhança. 
 
No teste de razão de verossimilhança, há a técnica de classificação de um 
conjunto de observações em classes predefinidas. O objetivo é determinar a 
classe de uma observação a partir de um conjunto de variáveis preditoras, que 
devem ser contínuas e ter distribuição normal. 
 
O teste de razão de verossimilhança verifica se um subconjunto de variáveis 
pode ser retirado do modelo de regressão logística múltipla, isto é, testa se um 
ou mais coeficientes são iguais a zero. 
 
A vantagem do teste de razão de verossimilhança é que processos complicados 
podem ser modelados por uma sequência de modelos, relativamente simples, 
colocados em uma hierarquia. Além disso, lidar com hierarquia não é mais 
difícil do que lidar com distribuições condicionais e marginais. 
 
O teste de razão de verossimilhança é um teste estatístico que mede a qualidade 
de ajuste entre dois modelos; um modelo estatístico, relativamente mais 
complexo, é comparado com um modelo mais simples, para verificar se ele 
ajusta um conjunto de dados de forma significativamente melhor. 
 
O teste de razão de verossimilhança envolve um procedimento matemático que 
transforma um número de variáveis, possivelmente, correlacionadas em um 
número menor de variáveis não correlacionadas, denominadas componentes 
principais. 
 
 
Pergunta 7 
1. O modelo empírico de Bayes é importante para se reconhecer o risco contido 
nos dados denotados pelo parâmetro de interesse θ. O estimador bayesiano 
empírico utiliza o cálculo médio, denominado estimador empírico global, por 
meio da localidade e da taxa global de uma região. 
 
Considerando que existe um estimador empírico local, que determina a 
realidade e a estimativa locais, analise as afirmativas a seguir: 
 
I. O modelo Bayesiano empírico tem os hiperparâmetros com valores 
desconhecidos e usa as estimativas da verossimilhança para a resolução dos 
hiperparâmetros; a ideia principal é utilizar os dados da amostra para descobrir 
e estimar valores fixos. 
II. A abordagem Bayesiana aplicada à estatística é, exatamente, igual à 
adotada pelo modelo empírico de Bayes, mas não existem aspectos da 
Bayesiana que podem ser úteis para outras abordagens estatísticas. 
III. A base de dados multivariados refere-se às medidas de semelhança que 
avaliam a similaridade das análises de ordenação e classificação; quanto maior 
é a semelhança, maior é o número de componentes comuns. 
IV. O modelo empírico de Bayes é uma forma de identificação de grupos de 
objetos similares e refere-se à possibilidade de separar diferentes grupos, com 
base nas medidas disponíveis; o objetivo é estudar a variação em uma 
quantidade de variáveis originais. 
 
Está correto o que se afirma em: 
 II e III, apenas. 
 II, III e IV, apenas. 
 I e IV, apenas. 
 I e II, apenas. 
 I e III, apenas. 
 
Pergunta 8 
1. As vendas de um tipo específico de insumo agrícola, em uma casa 
agropecuária, foram registradas em cada uma de 20 semanas. Considere 
que, dado o valor de um parâmetro λ, esses números são independentes 
observações da distribuição de Poisson (λ). Essa distribuição a priori para λ é 
uma distribuição gama (a, b). Os números de vendas observados foram: 
 
14 19 14 21 22 33 15 13 16 19 27 22 27 21 16 25 
14 23 22 17 
 
Nesse contexto, é possível afirmar que a distribuição a posteriori de λ é uma 
distribuição gama: 
 (401; 20,25). 
 (400; 20). 
 (404; 20,25). 
 (399; 20). 
 (399; 20,25). 
 
Pergunta 9 
1. Considere que o período de espera, em minutos, para o atendimento de 
clientes de determinada empresa segue uma distribuição exponencial com 
parâmetro θ desconhecido. Considerando que essa situação hipotética possui 
uma distribuição a priori gama, com desvio-padrão 1 para θ e média 0.2, o 
menor número de clientes que precisa ser observado, para queo coeficiente 
de variação a posteriori seja reduzido para 0.1, é, aproximadamente: 
 75. 
 100. 
 25. 
 50. 
 125. 
 
Pergunta 10 
1. Em um experimento médico, os pacientes com uma condição crônica devem 
dizer qual tratamento preferem: A ou B. Se θ representar a proporção da 
população que prefere A, encontraremos uma amostra de n 
pacientes. Dado θ, as n respostas são independentes, e a probabilidade de 
determinado paciente preferir A é θ. A distribuição anterior para θ é uma 
distribuição beta (a, a), com um desvio-padrão de 0,25. 
 
Nesse sentido, assinale a alternativa que apresenta, corretamente, o valor de 
a.

Continue navegando