Buscar

DistribuiAAúoBetaPrime-Nobrega-2019

Prévia do material em texto

Daniel Araújo Nóbrega
Distribuição beta prime: propriedades,
inferência e aplicação
Natal - RN
10 de Dezembro de 2018
Daniel Araújo Nóbrega
Distribuição beta prime: propriedades, inferência e
aplicação
Monografia de Graduação apresentada ao De-
partamento de Estatística do Centro de Ci-
ências Exatas e da Terra da Universidade
Federal do Rio Grande do Norte como re-
quisito parcial para a obtenção do grau de
Bacharel em Estatística.
Universidade Federal do Rio Grande do Norte
Centro de Ciências Exatas e da Terra
Departamento de Estatística
Orientador: Prof. Dr. Marcelo Bourguignon Pereira
Natal - RN
10 de Dezembro de 2018
Nóbrega, Daniel Araújo.
 Distribuição beta prime: propriedades, inferência e aplicação
/ Daniel Araújo Nóbrega. - 2018.
 40f.: il.
 Monografia (Bacharelado em Estatística) - Universidade
Federal do Rio Grande do Norte, Centro de Ciências Exatas e da
Terra, Departamento de Estatística. Natal, 2018.
 Orientador: Marcelo Bourguignon Pereira.
 1. Estatística - Monografia. 2. Distribuição beta prime -
Monografia. 3. Máxima verossimilhança - Monografia. 4. Método
dos momentos - Monografia. 5. Método dos momentos modificado -
Monografia. I. Pereira, Marcelo Bourguignon. II. Título.
RN/UF/CCET CDU 519.2
Universidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial Prof. Ronaldo Xavier de Arruda - CCET
Elaborado por Joseneide Ferreira Dantas - CRB-15/324
Aos meus pais.
Agradecimentos
Gostaria de agracedecer primeiramente aos meus pais. Através dos esforços deles eu
pude ter oportunidades na minha vida que poucas pessoas têm. Eu pude ter experiências
que me ajudaram a chegar onde estou e continuarão a me levar em frente. Espero que eu
consiga emular algumas das várias qualidades deles: do meu pai, o foco e determinação, e
da minha mãe, a resiliência e benevolência. Sem eles, eu não estaria aqui.
Gostaria também de agradecer a minha namorada Luana por ter sido minha
companheira diária nos últimos anos, sempre me ajudando, me fazendo rir e dando todo o
apoio possível. Se todo mundo fosse tão bondoso quanto ela, sem sombra de dúvidas o
mundo seria bem melhor.
Agradeço aos meus professores, especialmente o meu orientador Marcelo, por todos
os ensinamentos, sugestões e ajudas que contribuíram bastante para meu crescimento
acadêmico.
Espero que daqui pra frente, eu possa retribuir todo o apoio que eu já recebi destas
pessoas.
“Limites, assim como o medo, são geralmente meras ilusões.”
Michael Jordan
Resumo
Nesta monografia discorre-se a respeito da distribuição de probabilidade beta prime,
discutindo em que situações esta distribuição pode ser utilizada e apresentando propriedades
importantes. Além disso, são propostos seis estimadores para cada um dos parâmetros da
distribuição, entre eles o estimador de máxima verossimilhança e estimador de momentos.
É realizada um estudo de simulação com o intuito de avaliar a acurácia e a precisão
destes. Os estimadores propostos são utilizados para estimar os parâmetros da distribuição
beta prime aplicada a um conjunto de dados do tempo de reparo de transceptores de
comunicação aérea. A partir desta aplicação, estimativas são avaliadas e justifica-se qual
estimador aprsenta melhores propriedades. E, finalmente, conclusões a respeito de todo o
processo realizado são feitas.
Palavras-chave: Distribuição beta prime. Máxima verossimilhança. Método dos momen-
tos. Método dos momentos modificado.
Abstract
In this piece the beta prime probability distribution is explored, discussing what situations
are advisable for this distribution to be used and introducing important properties associ-
ated with it. In addition to this, six estimators for each of the distribution parameters are
proposed, including the maximum likelihood estimator and moments estimator. A simula-
tion study is conducted to evaluate the accuracy and precision of said estimators. These
estimators are used to estimate the value of the beta prime distribution parameters, when
the distribution applied to a data set containing observations referring to the repair time
of aerial communication transceivers. Furthermore, the estimation values are evaluated
and justifications are presented to choose which estimator has the best properties. Lastly,
conclusions with regards to the whole process conducted are made.
Keywords: Beta prime distribution. Maximum likelihood. Moments method. Modified
moments method.
Lista de tabelas
Tabela 1 – Médias das estimativas de α e β na simulação realizada. . . . . . . . . 27
Tabela 2 – Erros quadráticos médios das estimativas de α e β na simulação realizada. 28
Tabela 3 – Dados de manutenção de transceptores de comunicação aérea. . . . . . 30
Tabela 4 – Estimativas para os parâmetros em cada um dos estimadores. . . . . . 30
Sumário
Lista de tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 PROPRIEDADES . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 ESTIMAÇÃO DOS PARÂMETROS . . . . . . . . . . . . . . . . . . 19
3.1 Estimador de máxima verossimilhança . . . . . . . . . . . . . . . . . . 19
3.2 Estimador de máxima verossimilhança corrigido . . . . . . . . . . . . 20
3.2.1 Correção de Cox-Snell . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2.2 Correção por bootstrap paramétrico . . . . . . . . . . . . . . . . . . . . . 21
3.3 Estimador pelo método dos momentos . . . . . . . . . . . . . . . . . 22
3.4 Estimador de momentos modificado . . . . . . . . . . . . . . . . . . . 23
3.5 Novo estimador de momentos modificado . . . . . . . . . . . . . . . 23
4 RESULTADOS NUMÉRICOS . . . . . . . . . . . . . . . . . . . . . . 25
5 APLICAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
11
1 Introdução
A distribuição beta prime (BP), também conhecida como distribuição beta inversa
ou distribuição beta do segundo tipo, é uma distribuição de probabilidade inicialmente
introduzida por Keeping(1962) e McDonald (1984). Poucos trabalhos foram realizados com
respeito a esta distribuição. Em McDonald (1987) foram discutidas algumas propriedades
desta distribuição e os estimadores de máxima verossimilhança para os parâmetros foram
obtidos. Já em McDonald e Keeping (1990) e Tulupeyev et al. (2013) a distribuição foi
utilizada no contexto de modelos de regressão para variáveis aleatórias positivas. Em
Bourguignon et al. (2018) esta distribuição foi estudada e utilizada em um contexto de
modelo de regressão baseado em uma nova parametrização.
Seja X uma variável aleatória tal que X ∼ BP(α, β). A função densidade de
probabilidade desta variável aleatória é dada por:
f(x;α, β) = 1
B(α, β)x
α−1(1 + x)−(α+β), x > 0,
em que α > 0, β > 0 são parâmetros de forma e B(α, β) é a função beta que é dada por
∫ ∞
0
tα−1(1 + t)−(α+β)dt = Γ(α)Γ(β)Γ(α + β) ,
sendo Γ(·) a função gama definida por:
Γ(λ) =
∫ ∞
0
e−uuλ−1du.
A função de distribuicão acumulada desta distribuição é dada por
F (x;α, β) = I x
1+x
(α, β),
em que Ix(α, β) = B(x;α, β)/B(α, β) é a função beta incompleta regularizada com
B(x;α, β) =
∫ x
0
tα−1(1 + t)−(α+β)dt, x > 0.
As Figuras 1, 2, 3, 4 e 5 mostram a função densidade da distribuição BP em
diferentes casos de combinações dos parâmetros α e β. Percebe-se que há deslocamentos da
densidade da distribuição, diferenças na moda e mudanças com relação ao valor máximo
atingido. Portanto, é possível perceber que há uma variedade de situações em que a
distribuição BP pode ser ajustada a conjuntos de dados assimétricos à direita. Algumas
Capítulo 1. Introdução 12
0 2 4 6 8 10
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
1.
2
1.
4
x
f(x
; α
, β
)
α = 1.5
α = 4
α = 8
Figura 1 – Função densidade da distribuição BPpara três valores de α e β = 3.
0 1 2 3 4
0.
0
0.
5
1.
0
1.
5
2.
0
x
f(x
; α
, β
)
α = 1.5
α = 4
α = 8
Figura 2 – Função densidade da distribuição BP para três valores de α com β = 5.
áreas da estatística necessitam de distibuições que tenham esta forma como análise de
dados de sobrevivência.
A distribuição BP pode ser utilizada na área de análise de sobrevivência como
alternativa às distribuições gama e Weibull, já que o suporte de variáveis aleatórias que
seguem estas distribuições é o mesmo. Neste trabalho, é realizada uma aplicação da
Capítulo 1. Introdução 13
0 1 2 3 4
0
1
2
3
4
x
f(x
; α
, β
)
α = 1.5
α = 4
α = 8
Figura 3 – Função densidade da distribuição BP para três valores de α com β = 10.
0 5 10 15 20
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
x
f(x
; α
, β
)
β = 0.5
β = 3
Figura 4 – Função densidade da distribuição BP para dois valores de β com α = 0.75.
distribuição BP com dados que podem ser utilizados no contexto da área mencionada para
mostrar a utilidade da distribuição.
Capítulo 1. Introdução 14
0 50 100 150
0.
00
0
0.
00
5
0.
01
0
0.
01
5
0.
02
0
0.
02
5
0.
03
0
x
f(x
; α
, β
)
Figura 5 – Função densidade da dsitribuição BP com α = 8 com β = 0.5.
O objetivo deste trabalho será apresentar propriedades da distribuição BP a fim de
que se tenha uma maior compreensão do comportamento desta. Além disto, serão propostos
seis possíveis estimadores para os parâmetros. Será feita uma comparação dos estimadores
para avaliar suas efetividades quanto à acurácia e precisão além de investigar como cada
um se comporta em amostras de diferentes tamanhos e diferentes combinações dos valores
dos parâmetros. Desta forma, se houver interesse na utilização desta distribuição para se
ajustar a conjuntos de dados diversos, a partir deste trabalho, será possivel decidir qual o
método de estimação apresenta menor viés e erro quadrático médio.
Comparações similares às feitas neste trabalho aparecem na literatura. Em do
Espírito Santo e Mazucheli (2014) foi realizada uma comparação entre métodos de esti-
mação para a distribuição Lindley com extensão Marshall-Olkein. Em Mazucheli et al.
(2016) foi feita uma comparação entre 10 estimadores diferentes para os parâmetros da
distribuição exponencial com extensão Marshall-Olkin, entre estes o estimador de máxima
verossimilhança e o estimador de mínimos quadrados ponderados, para determinar quais
estimadores apresentavam menor viés e menor erro quadrático média no processo de
estimação dos parâmetros. Já em Teimouri et al. (2013) foi realizada uma comparação de
métodos de estimação para a distribuição Weibull.
Esta monografia encontra-se dividida em seis capítulos. No Capítulo 2, algumas pro-
priedades serão apresentadas afim de fornecer uma maior familiaridade com a distribuição
BP. No Capítulo 3 são propostos os estimadores que serão avaliados, no capítulo seguinte
comenta-se os resultados obtidos na simulação realizada. No Capítulo 5 os estimadores são
Capítulo 1. Introdução 15
aplicados a um conjunto de dados real referente à tempos de reparo de transceptores de
comunicação aérea. No Capítulo 6, são discutidas as conclusões que podem ser feitas sobre
qual a melhor forma de estimar os parâmetros da distribuição, ponderando as vantagens e
desvantagens de cada estimador utilizado.
16
2 Propriedades
Neste segundo capítulo, são apresentadas importantes propriedades da distribuição
BP. Entre estas, fala-se sobre diferentes momentos da distribuição e relações com outras
distribuições de probabilidade.
Conforme dito em Bourguignon et al. (2018), pode ser demonstrado que a função
densidade de probabilidade da distribuição BP é decrescente com f(x;α, β)→∞ à medida
que x→ 0, se 0 < α < 1; f(x;α, β) é decrescente com moda em x = 0 no caso de α ser
igual a 1 e caso α seja maior do que 1, f(x;α, β) cresce e depois decresce com moda igual
a (α− 1)/(β + 1). Ademais, para 0 < α < 1, f(x;α, β) é côncava; se 1 < α ≤ 2, f(x;α, β)
é convexa para baixo e depois para cima com ponto de inflexão y2; e caso α > 2, f(x;α, β)
é côncava para cima, e então para baixo e volta a ser para cima com pontos de inflexão
em y1 e y2, em que
y1 =
(α− 1)(α + 2)−
√
(α− 1)(β + 2)(α + β)
(β + 2)(β + 1)
e
y2 =
(α− 1)(α + 2) +
√
(α− 1)(β + 2)(α + β)
(β + 2)(β + 1) .
0 2 4 6 8 10
0.
00
0.
05
0.
10
0.
15
0.
20
0.
25
x
f(x
; α
, β
)
y1 y2
Figura 6 – Curva da densidade da distribuição BP com α = 8 e β = 3 com os pontos de
inflexão y1 e y2 indicados.
Capítulo 2. Propriedades 17
A esperança de uma variável aleatória X que segue uma distribuição BP é dada
por
E(X) = α
β − 1 , β > 1.
O k-ésimo momento pode ser escrito como:
E(Xk) = B(α + k, β − k)
B(α, β) , β > k.
Para k ∈ N e k < β, tem-se que o k-ésimo momento é dado por
E(Xk) =
k∏
i=1
α + i− 1
β − i
, β > k.
Em particular,
E(X2) = α
β − 1
α + 1
β − 2 , β > 2.
Consequentemente, a variância desta distribuição é dada por
V ar(X) = E(X2)− [E(X)]2 = α(α + β − 1)(β − 2)(β − 1)2 , β > 2.
A média harmônica de uma variável aleatória X é denotada por HX e é definida
como
HX =
1
E
(
1
X
) .
No caso da distribuição BP, tem-se que HX é dada por (α− 1)/β. Isto se dá por
outra propriedade da distribuição Beta Prime: se X ∼ BP(α, β), então X−1 ∼ BP(β,α).
Desta forma E(X−1) = β/(α − 1), resultando que HX = [β/(α − 1)]−1 = (α − 1)/β.
Portanto, a média harmônica desta distribuição pode ser escrita como
(1− 1/α)(1− 1/β)E(X).
Logo, quando α→∞ e β →∞, HX → E(X).
A esperança logarítmica denotada por E[log(X)] pode ser escrita da forma
Capítulo 2. Propriedades 18
E[log(X)] = 1
B(α, β)
∞∫
0
log x xα−1(1 + x)−(α+β)dx
= 1
B(α, β)

∞∫
0
log
(
x
1 + x
)
xα−1(1 + x)−(α+β)dx
+
∞∫
0
log(1 + x)xα−1(1 + x)−(α+β)dx

= ∂
∂α
log [B(α, β)]− ∂
∂β
log [B(α, β)] .
Além disso,
E[log(1 +X)] = − ∂
∂β
logB(α, β).
A distribuição BP faz parte da família exponencial, pois sua função densidade de
probabilidade pode ser escrita por
f(x;α, β) = exp{− log[B(α, β)] + (α− 1) log(x)− (α + β) log(1 + x)},
que é da forma
f(x;α, β) = exp{d(θ) + c1(θ)T1(x) + c2(θ)T2(x) + S(x)},
em que θ = (α β)>, d(θ) = − log[B(α, β)], c1(θ) = (α− 1), c2(θ) = −(α + β), T1(x) =
log(x), T2(x) = log(1 + x) e S(x) = 0.
A distribuição também possui algumas relações com algumas distribuições:
i. Se W ∼ F (2α, 2β), então α
β
W ∼ BP(α, β).
ii. Se Z ∼ Beta(α, β), então Z1−Z ∼ BP(α, β).
iii. Sejam V e Y variáveis aleatórias independetes tais que V ∼Gama(α, 1) e Y ∼Gama(β, 1).
Nestas condições
V
Y
∼ BP(α, β).
iv. Se X segue uma distribuição de Pareto com mínimo denotado por x(1) e parâmetro
de forma α, então X − x(1) ∼ BP(1, α).
Capítulo 2. Propriedades 19
É possível gerar valores aleatórios de uma variável aleatória com distribuição Beta
Prime com parâmetros α e β gerando indepentemente valores aleatórios de uma variável que
segue uma distribuição gama com parâmetros α e 1 e de uma variável distribuída seguindo
uma gama com parâmetros β e 1 e dividindo os valores gerados. Ou, alternativamente,
gerar n valores aleatórios denotados z1, . . . , zn, originados de uma distribuição beta com
parâmetros α e β e então aplicar a transformação zi/(1− zi) ∀i ∈ {1, . . . , n}.
20
3 Estimação dos parâmetros
Neste capítulo, são abordados os métodos de estimação utilizados para os parâmetros
da distribuição BP neste trabalho. Os estimadores propostos abrangem entre diferentes
métodos de resolução de sistemas de equações para encontrar soluções para α e β.
3.1 Estimador de máxima verossimilhança
Seja X = (X1, . . . , Xn)> uma amostra aleatória da distribuição Beta Prime com
parâmetros α e β. Utilizando a função densidade de probabilidade explicitada em (1.1),
tem-se que a função de verossimilhança e a função de log-verossimilhança são:
L(α, β; x) =
n∏
i=1
f(xi;α, β) =
1
B(α, β)n
n∏
i=1
xα−1i (1 + xi)−(α+β)
e
`(α, β; x) = logL(α, β; x) = −n log[B(α, β)] + (α−1)
n∑
i=1
log(xi) − (α+β)
n∑
i=1
log(1+xi).
Os estimadores de máxima verossimilhança para α e β, denominados α̂ e β̂ respec-
tivamente, não possuem formafechada de maneira que se possa escrever analiticamente a
expressão dos estimadores. Porém, estes podem ser obtidos maximizando numericamente
`(α, β; x). Estas estimativas são feitas resolvendo numericamente o sistema de equações:

(∂/∂α)`(α, β; x) = 0,
(∂/∂β)`(α, β; x) = 0,
em que
∂
∂α
`(α, β; x) = − n
B(α, β)
∂
∂α
B(α, β) +
n∑
i=1
log
(
xi
1 + xi
)
e
∂
∂β
`(α, β; x) = − n
B(α, β)
∂
∂β
B(α, β) −
n∑
i=1
log(1 + xi).
A matriz de informação de Fisher, definida por
I =
 −E [ ∂2∂α2 `(α, β; x)] −E [ ∂2∂α∂β `(α, β; x)]
−E
[
∂2
∂α∂β
`(α, β; x)
]
−E
[
∂2
∂β2
`(α, β; x)
] 
Capítulo 3. Estimação dos parâmetros 21
pode ser calculada nesta distribuição, pois temos que
−E
[
∂2
∂α2
`(α, β; x)
]
= n
[
∂
∂α
Ψ(α)− ∂
∂α
Ψ(α + β)
]
−E
[
∂2
∂α∂β
`(α, β; x)
]
= −n ∂2
∂α∂β
Ψ(α + β)
−E
[
∂2
∂β2
`(α, β; x)
]
= n
[
∂
∂β
Ψ(β)− ∂
∂β
Ψ(α + β)
]
,
em que Ψ(·) é a função digamma dada por Ψ(y) = (∂Γ(y)/∂y)/Γ(y).
Quando n→∞, o estimador de máxima verossimlhança satisfaz:
α̂
β̂
 d−→ N2
α
β
 , I−1
 .
3.2 Estimador de máxima verossimilhança corrigido
Em pequenas amostras, o estimador de máxima verossimilhança é, muitas vezes,
um estimador tendencioso, ou seja, apresenta um viés. O viés de um estimador θ̂ é dado
por
vies(θ̂) = E(θ̂)− θ.
Desta forma, uma solução é corrigir este estimador para que se obtenha estimativas
com maior acurácia. Para isto, dois métodos de correção de viés serão abordados nesta
subseção.
3.2.1 Correção de Cox-Snell
Em Stošić e Cordeiro (2009) foi proposta uma forma analítica do viés do estimador
de máxima verossimilhança da distribuição BP. Com isto, é possível calcular o valor do
viés e assim corrigir o estimador de máxima verossimilhança.
As expressões do viés para o estimador de α e de β, Bα e Bβ, respectivamente, são
Bα =
1
2[Ψ′(α)(Ψ′(β)−Ψ′(α + β))−Ψ′(β)Ψ′(α + β)]2
×{−[Ψ′(α + β)(Ψ′(α + β)(Ψ′′(α)−Ψ′′(β)) + Ψ′(α)Ψ′′(β))] + Ψ′(β)2[−Ψ′′(α)
+Ψ′′(α + β)] + Ψ′(β)[2Ψ′(α + β)Ψ′′(α) + Ψ′(α)Ψ′′(α + β)]}
e
Bβ =
1
2[Ψ′(α)(Ψ′(β)−Ψ′(α + β))−Ψ′(β)Ψ′(α + β)]2
×{Ψ′(α + β)2[Ψ′′(α)−Ψ′′(β)] + 2Ψ′(α)Ψ′(α + β)Ψ′′(β)Ψ′(α)2[−Ψ′′(β)
+Ψ′′(α + β)] + Ψ′(β)[−(Ψ′(α + β)Ψ′′(α)) + Ψ′(α)Ψ′′(α + β)]},
Capítulo 3. Estimação dos parâmetros 22
em que Ψ′(·) e Ψ′′(·) são a primeira e segunda derivada, respectivamente, da função
digamma Ψ(·), dada por Ψ(y) = (∂Γ(y)/∂y)/Γ(y).
Com isto, os estimadores de máxima verossimilhança corrigidos pelo viés são dados
por
α̂b = α̂−Bα̂
e
β̂b = β̂ −Bβ̂.
Em Mazucheli et al. (2017) foi desenvolvido um pacote no software estatistico R
chamado "mle.tools"que encontra aproximações para as expressões de Bα̂ e de Bβ̂ para
diversas distribuições. Entre estas, a distribuição deste trabalho. Os autores do trabalho
mencionado comentam que a aproximação do viés calculada por meio do pacote não
coincide com o resultado analítico apresentado em Stošić e Cordeiro (2009). No entanto,
ao recalcular as expressões analíticas, os autores perceberam que o resultado coincidia
com as aproximações que haviam encontrado anteriormente. Isto indica que há algum erro
analítico nas expressões propostas em Stošić e Cordeiro (2009). Contudo, neste trabalho
as aproximações foram calculadas utilizando o método do pacote "mle.tools".
3.2.2 Correção por bootstrap paramétrico
Uma das maneiras de corrigir o estimador de máxima verossimilhança, é pelo
método bootstrap. Este método foi inicialmente proposto por Efron (1979).
Através deste método, é possível estimar o viés de um estimador. Seja θ̂ um
estimador para um parâmetro θ.
Ao gerar B amostras artificiais da distribuição em estudo utilizando as estimativas
de máxima verossimilhança de α e β como os parâmetros (bootstrap paramétrico), pode-se
estimar o viés do estimador calculando
viesb(θ̂) =
1
B
B∑
i=1
θ̂i − θ̂,
sendo θ̂ a estimativa do parâmetro de interesse e θ̂i a estimativa do parâmetro na i-ésima
amostra artificial gerada, i = 1, . . . , B.
Portanto, pode-se propor um estimador corrigido da forma
θ̂c = θ̂ − viesb(θ̂) = θ̂ −
(
1
B
B∑
i=1
θ̂i − θ̂
)
= 2θ̂ − 1
B
B∑
i=1
θ̂i.
Capítulo 3. Estimação dos parâmetros 23
Logo, para a distribuição BP, os estimadores de máxima verossimilhança corrigidos
por bootstrap são
α̂c = 2α̂− 1
B
B∑
i=1
α̂i,
β̂c = 2β̂ − 1
B
B∑
i=1
β̂i.
3.3 Estimador pelo método dos momentos
O método dos momentos é um método estatístico de estimação que consiste em
igualar os momentos teóricos µk = E(Xk) aos momentos amostrais mk = (1/n)
∑n
i=1 x
k,
de maneira que os estimadores pelo método dos momentos α̂MM e β̂MM sejam as soluções
do sistema:
 m1 = µ1m2 = µ2
Como visto anteriormente,
E(X) = α
β − 1 , β > 1
e
E(X2) = α
β − 1
α + 1
β − 2 , β > 2.
Igualando m1 e m2 a E(X) e E(X2) respectivamente, tem-se que os estimadores
pelo método dos momentos para os parâmetros α e β são dados por
α̂M =
n∑
i=1
Xi(1+Xi)
n∑
i=1
(Xi−X̄)2
X̄
e
β̂M =
(2/n)
n∑
i=1
X2i +X̄(1−X̄)
(1/n)
n∑
i=1
(Xi−X̄)2
,
respectivamente.
Capítulo 3. Estimação dos parâmetros 24
3.4 Estimador de momentos modificado
Em Kundu e Balakrishnan (2002) foi proposto um estimador pelo método dos mo-
mentos modificado para estimação de parâmetros da distribuição Birnbaum-Saunders. Em
uma continuação deste trabalho, este estimador foi novamente utilizado em Balakrishnan
e Zhu (2013).
O estimador pelo método do momentos modificado consiste em resolver o sistema
de equações (1/n)∑ni=1Xi = E(X) e (1/n)∑ni=1X−1i = E(X−1). Utilizando este sistema,
se isola ambos os parâmetros e, desta maneira, obtém-se estimadores para α e β. Assim,
para a distribuição BP, utilizando o método dos momentos modificado, tem-se que os
estimadores para α e β são dados por
α̂MM =
X̄
{
1+
[
(1/n)
n∑
i=1
X−1i
]−1}
X̄−
[
(1/n)
n∑
i=1
X−1i
]−1
e
β̂MM = 1+X̄
X̄−
[
(1/n)
n∑
i=1
X−1i
]−1 ,
respectivamente.
3.5 Novo estimador de momentos modificado
Outro estimador proposto na literatura é um novo estimador de momentos modifi-
cado, incicialmente proposto em Balakrishnan e Zhu (2013) para a estimação de parâmetros
da distribuição Birnbaum-Saunders. Este método de estimação também foi utilizado em
Balakrishnan et al. (2017) em que foi aplicado para obter estimativas dos parâmetros de
distribuições pertencentes a uma classe de distribuições log-simétricas.
Seja X1, . . . , Xn uma amostra aleatória de tamanho n, em que Xi ∼ BP(α, β).
Defina
Zij = XiX−1j , para 1 ≤ i 6= j ≤ n.
É possível mostrar que
E(Zij) = E(XiX−1j ) =
α
β − 1
β
α− 1 , β > 1, α > 1 (3.1)
e
V ar(Zij) =
α + 1
β − 2
β + 1
α− 2 −
(
α
β − 1
β
α− 1
)2
, β > 2.
Capítulo 3. Estimação dos parâmetros 25
A média amostral de Zij é dada por
z̄ = 1
2
(
n
2
) ∑
1≤i 6=j≤n
Zij.
Tomando X̄ como o estimador de E(X), conforme visto anteriormente na Seção
3.3, e igualando (3.1) a z̄ tem-se um sistema de equações que, ao resolver para α̂ e β̂
obtém-se
α̂∗MM =
z̄ + X̄
z̄ − 1
e
β̂∗MM =
X̄ + 1
X̄
z̄
z̄ − 1 .
26
4 Resultados numéricos
Neste capítulo, é descrito todo o processo de simulação utilizado para avaliar e
comparar os estimadores propostos para os parâmetros da distribuição BP apresentados
no capítulo 3.
Para realizar a simulação, foram escolhidos três valores para α
α1 = 1.5,
α2 = 4,
α3 = 8.
E selecionados três valores para β
β1 = 3,
β2 = 5,
β3 = 10.
Além destes, o tamanho n da amostra utilizada foi variado. Inicialmente foram
utilizadas 25 unidades amostrais, este número foi aumentado para 50 e em seguida para
100 e 200.
Utilizando o software R (R Core Team 2018) foram conduzidos experimentos de
Monte Carlo para observar o comportamento dos estimadores. O número de replicações do
experimento foi 5000. Em cada uma destas, uma amostra artificial proveneniente de uma
distribuição Beta Prime com parâmetros αk e βj ( k, j = 1, 2, 3) foi gerada. Para gerar esta
amostra foi utilizada a função rinvbeta do pacote Laplaces Demon. A partir desta amostra,
foram estimados os parâmetros da distribuição utilizando os estimadores explicitados
anteriormente. Para obter o estimador de máxima verossimilhança foi utilizada a funçãooptim e para calcular o estimador de máxima verossimilhança corrigido via bootstrap
é necessário que seja executado um algoritmo: em cada replicação de Monte Carlo, 100
réplicas de bootstrap paramétrico são realizadas, em que para cada um destas réplicas
se gera uma amostra de tamanho n da distribuição beta prime com parâmetros iguais
às estimativas de máxima verossimilhança obtidas na respectiva iteração do método de
Monte Carlo.
Após a realização da simulação, foi calculada a média das estimativas dos parâmetros
¯̂α = 15000
5000∑
i=1
α̂i
Capítulo 4. Resultados numéricos 27
e
¯̂
β = 15000
5000∑
i=1
β̂i
de cada etimador apresentado no capítulo 3 em cada um dos diferentes cenários de tamanho
de amostra e valores dos parâmetros. Similarmente, foi calculada a variância das estimativas
e a estimativa do viés dos estimadores
s2α̂ =
1
4999
5000∑
i=1
(α̂i − ¯̂α)2
s2
β̂
= 14999
5000∑
i=1
(β̂i − ¯̂β)2
B̂(α̂) = ¯̂α− α
B̂(β̂) = ¯̂β − β.
Em seguida, calcula-se o erro quadrático médio (EQM) dos estimadores de α e β
definido por s2α̂ + B̂2(α̂) e s2β̂ + B̂
2(β̂). Esta medida serve como uma indicadora da precisão
de cada estimador.
Capítulo 4. Resultados numéricos 28
Tabela 1 – Médias das estimativas de α e β na simulação realizada.
Estimativas de α Estimativas de β
n α β α̂M α̂MM α̂MV α̂
b
MV α̂
c
MV α̂
∗
MM β̂M β̂MM β̂MV β̂
b
MV β̂
c
MV β̂
∗
MM
25 1.5 3 2.3759 1.8392 1.6797 1.5000 1.4747 1.8056 4.4329 3.6757 3.4091 3.0052 2.9474 3.6264
1.5 5 2.0650 1.8544 1.6941 1.5137 1.4904 1.8202 6.7927 6.1973 5.7333 5.0304 4.9367 6.1010
1.5 10 1.8854 1.8374 1.6698 1.4928 1.4691 1.8039 12.7936 12.4906 11.4320 9.9899 9.7936 12.2805
4 3 6.2763 4.6811 4.5591 4.0273 3.9518 4.5339 4.3239 3.5005 3.4053 3.0179 2.9635 3.4215
4 5 5.3630 4.5919 4.5116 3.9913 3.9234 4.4482 6.5528 5.7537 5.6540 4.9920 4.9051 5.6046
4 10 4.8897 4.5716 4.4968 3.9814 3.9117 4.4287 12.2337 11.5038 11.3251 9.9671 9.7833 11.1752
8 3 12.5143 9.3926 9.1817 8.0781 7.9294 9.0569 4.3007 3.4986 3.4137 3.0281 2.9771 3.4091
8 5 10.6369 9.1835 9.0739 7.9977 7.8495 8.8561 6.4492 5.7061 5.6359 4.9824 4.8910 5.5382
8 10 9.7672 9.1385 9.0774 8.0097 7.8640 8.8130 12.1527 11.4297 11.3542 10.0086 9.8244 11.0580
50 1.5 3 2.0927 1.7075 1.5866 1.5023 1.4977 1.6933 3.9150 3.3780 3.1888 3.0003 2.9899 3.3582
1.5 5 1.8241 1.7095 1.5869 1.5031 1.4973 1.6953 6.0097 5.6803 5.3373 5.0099 4.9877 5.6413
1.5 10 1.7094 1.7098 1.5816 1.4983 1.4925 1.6956 11.4786 11.4639 10.6765 10.0015 9.9536 11.3769
4 3 5.5244 4.3187 4.2478 4.0006 3.9847 4.2523 3.8491 3.2335 3.1776 2.9976 2.9862 3.1991
4 5 4.7961 4.2973 4.2480 4.0037 3.9863 4.2313 5.8916 5.3772 5.3174 5.0066 4.9856 5.3099
4 10 4.4935 4.3043 4.2622 4.0186 4.0045 4.2382 11.2205 10.7817 10.6824 10.0421 10.0068 10.6314
8 3 11.0292 8.6524 8.5275 8.0150 7.9863 8.4993 3.8323 3.2262 3.1753 2.9968 2.9873 3.1867
8 5 9.5078 8.5310 8.4665 7.9649 7.9300 8.3804 5.8190 5.3224 5.2804 4.9750 4.9550 5.2460
8 10 8.9546 8.5834 8.5461 8.0441 8.0146 8.4317 11.1614 10.7361 10.6905 10.0575 10.0209 10.5640
100 1.5 3 1.9167 1.6303 1.5390 1.4982 1.4973 1.6240 3.6292 3.2306 3.0915 3.0002 2.9980 3.2219
1.5 5 1.6943 1.6308 1.5408 1.5002 1.4990 1.6245 5.5835 5.3996 5.1524 4.9943 4.9890 5.3826
1.5 10 1.6247 1.6380 1.5437 1.5032 1.5020 1.6316 10.8479 10.9126 10.3398 10.0126 10.0004 10.8740
4 3 5.0859 4.1625 4.1215 4.0017 3.9993 4.1309 3.5991 3.1261 3.0920 3.0046 3.0030 3.1099
4 5 4.4826 4.1511 4.1252 4.0067 4.0021 4.1196 5.5318 5.1904 5.1584 5.0078 5.0028 5.1586
4 10 4.2561 4.1383 4.1182 4.0008 3.9953 4.1069 10.6260 10.3534 10.3062 9.9973 9.9832 10.2824
8 3 10.1058 8.3468 8.2674 8.0190 8.0090 8.2733 3.5812 3.1318 3.0991 3.0121 3.0093 3.1130
8 5 8.9013 8.2856 8.2560 8.0115 8.0026 8.2128 5.4939 5.1776 5.1579 5.0089 5.0033 5.1409
8 10 8.4694 8.2635 8.2439 8.0020 7.9963 8.1909 10.5662 10.3304 10.3068 10.0019 9.9943 10.2483
200 1.5 3 1.7903 1.5828 1.5166 1.4966 1.4964 1.5799 3.4240 3.1365 3.0399 2.9950 2.9943 3.1326
1.5 5 1.6217 1.5893 1.5194 1.4994 1.4995 1.5863 5.3647 5.2686 5.0775 4.9996 4.9997 5.2607
1.5 10 1.5580 1.5895 1.5184 1.4985 1.4982 1.5866 10.4103 10.5909 10.1627 10.0018 9.9996 10.5731
4 3 4.7748 4.0881 4.0648 4.0058 4.0049 4.0726 3.4183 3.0662 3.0466 3.0036 3.0029 3.0584
4 5 4.2651 4.0743 4.0595 4.0012 4.0012 4.0589 5.2882 5.0919 5.0753 5.0013 5.0013 5.0764
4 10 4.1331 4.0790 4.0658 4.0078 4.0076 4.0636 10.3237 10.1975 10.1677 10.0153 10.0153 10.1628
8 3 9.4986 8.1747 8.1320 8.0098 8.0082 8.1388 3.3996 3.0628 3.0454 3.0027 3.0022 3.0538
8 5 8.5043 8.1332 8.1196 7.9995 7.9981 8.0976 5.2730 5.0828 5.0741 5.0008 4.9998 5.0649
8 10 8.2323 8.1215 8.1111 7.9921 7.9909 8.0859 10.2797 10.1517 10.1395 9.9895 9.9880 10.1116
Observando a Tabela 1, percebe-se que na menor amostra utilizada na simulação,
de tamanho 25, o estimador pelo método dos momentos possui um viés positivo maior do
que os demais estimadores. Isto tende a ocorrer devido ao tamanho pequeno da amostra.
Também nota-se que o estimador de máxima verossimilhança apresenta um viés positivo
principalmente na estimação do α = 1.5. No entanto, ambos os estimadores de máxima
verossimilhança corrigidos não apresentam um viés tão significativo quando comparado aos
estimadores de momentos, sobretudo no estimador corrigido utilizando a forma analítica
do viés α̂bMV . O estimador de momentos modificado resultou em estimativas com uma
tendência que, embora positiva, é menor do que a tendência do estimador pelo método dos
momentos. O novo estimador de momentos modificado apresentou resultados similares ao
estimador de momentos modificados, todavia a tendência positiva é menor no caso desta
amostra de tamanho 25. Já na Tabela 2, analisando os erros quadráticos médios, nota-se
que os estimadores de máxima verossimilhança corrigidos têm resultados similares, no
entanto o estimador corrigido por bootstrap apresenta EQM menor muito embora haja um
Capítulo 4. Resultados numéricos 29
Tabela 2 – Erros quadráticos médios das estimativas de α e β na simulação realizada.
Estimativas de α Estimativas de β
n α β α̂M α̂MM α̂MV α̂
b
MV α̂
c
MV α̂
∗
MM β̂M β̂MM β̂MV β̂
b
MV β̂
c
MV β̂
∗
MM
25 1.5 3 1.2680 0.3322 0.2625 0.1787 0.1745 0.2935 4.0438 1.5573 1.2554 0.8398 0.8187 1.4292
1.5 5 0.8044 0.3756 0.2961 0.2009 0.1976 0.3330 20.3308 13.8861 11.0677 6.8989 6.4962 13.0519
1.5 10 0.5543 0.3450 0.2618 0.1812 0.1808 0.3054 117.8360 104.8836 85.2439 59.7795 56.9312 99.9893
4 3 8.8821 2.5354 2.3688 1.5920 1.5575 2.1941 2.2140 3.3496 3.6346 4.7740 4.9728 3.5124
4 5 5.0686 2.1966 2.0985 1.4225 1.3934 1.9024 7.1751 3.5563 3.4081 2.3074 2.2647 3.1317
4 10 3.5373 2.2473 2.1432 1.4695 1.4576 1.9538 70.3976 55.6191 53.1775 34.8668 32.9597 50.4466
8 3 35.5159 11.2609 10.6016 7.1295 6.9896 9.7078 34.2586 43.4489 44.5409 49.5075 50.2021 44.5311
8 5 20.4216 9.8804 9.5558 6.5050 6.3996 8.5479 17.1448 21.4434 22.0184 27.4790 28.3494 22.6829
8 10 14.1923 9.4614 9.3011 6.3040 6.1806 8.1860 21.7668 15.0234 14.7816 10.0260 9.8106 13.0949
1.5 3 0.6015 0.1381 0.1019 0.0835 0.0842 0.1287 1.7269 0.5899 0.4669 0.3804 0.3839 0.5629
50 1.5 5 0.3382 0.1424 0.1008 0.0826 0.0831 0.1327 11.7085 8.6040 6.8018 5.2203 5.1360 8.3536
1.5 10 0.2405 0.1436 0.0988 0.0816 0.0823 0.1339 81.9367 77.7474 64.5491 53.9789 53.3384 76.0894
4 3 4.1814 0.9126 0.8543 0.7003 0.7060 0.8425 2.1322 3.5531 3.7373 4.3774 4.4238 3.6603
4 5 2.1592 0.8541 0.8137 0.6646 0.6659 0.7889 2.9409 1.3632 1.3018 1.0612 1.0669 1.2716
4 10 1.4607 0.8518 0.7981 0.6449 0.6494 0.7859 46.4019 38.4863 37.2132 29.7718 29.4592 36.5797
8 3 16.3565 3.7585 3.4778 2.8259 2.8583 3.4503 38.7964 46.3018 46.9679 49.3908 49.5280 46.8216
8 5 8.0216 3.3560 3.2500 2.6803 2.7065 3.0970 19.4085 23.0406 23.4168 26.2601 26.4698 23.7161
8 10 5.7452 3.5530 3.4957 2.8273 2.8356 3.2718 8.6097 5.6123 5.5299 4.4681 4.4712 5.1910
100 1.5 3 0.3121 0.0666 0.0435 0.0395 0.0400 0.0640 0.8674 0.2780 0.2113 0.1907 0.1936 0.2709
1.5 5 0.1620 0.0679 0.0429 0.0388 0.0392 0.0653 7.9665 6.4050 5.2015 4.5118 4.4966 6.3137
1.5 10 0.1180 0.0721 0.0449 0.0405 0.0409 0.0693 66.6026 65.5404 56.411451.5638 51.4147 64.8831
4 3 2.2468 0.3802 0.3509 0.3162 0.3200 0.3639 2.4058 3.7112 3.8253 4.1557 4.1642 3.7685
4 5 1.0378 0.3714 0.3481 0.3128 0.3161 0.3559 1.3854 0.5952 0.5655 0.5085 0.5121 0.5737
4 10 0.6758 0.3853 0.3574 0.3231 0.3244 0.3703 35.5205 31.1349 30.5345 27.2112 27.0806 30.3332
8 3 8.4641 1.6303 1.4975 1.3419 1.3447 1.5547 41.6124 47.3725 47.8058 49.0029 49.0439 47.6270
8 5 4.1941 1.5174 1.4754 1.3266 1.3436 1.4525 21.4045 23.7927 23.9659 25.4007 25.4638 24.1380
8 10 2.5239 1.4544 1.4286 1.2882 1.3028 1.3939 3.7304 2.2742 2.2425 2.0214 2.0463 2.1844
200 1.5 3 0.1742 0.0348 0.0202 0.0194 0.0196 0.0341 0.4547 0.1330 0.0949 0.0905 0.0914 0.1311
1.5 5 0.0900 0.0380 0.0205 0.0195 0.0198 0.0372 6.3425 5.5000 4.5963 4.2702 4.2749 5.4613
1.5 10 0.0579 0.0382 0.0201 0.0192 0.0193 0.0374 57.4873 59.1512 52.4692 50.1545 50.1303 58.8688
4 3 1.2755 0.1833 0.1655 0.1565 0.1583 0.1791 2.7666 3.8379 3.9023 4.0697 4.0735 3.8673
4 5 0.5532 0.1692 0.1587 0.1505 0.1519 0.1656 0.7052 0.2684 0.2551 0.2420 0.2440 0.2634
4 10 0.3408 0.1786 0.1638 0.1548 0.1563 0.1747 30.3210 28.1487 27.7822 26.1987 26.2098 27.7782
8 3 4.8649 0.7957 0.7149 0.6767 0.6868 0.7769 43.8139 48.2260 48.4552 49.0480 49.0558 48.3508
8 5 2.1269 0.6889 0.6739 0.6399 0.6462 0.6740 22.9379 24.4327 24.5116 25.2313 25.2433 24.6067
8 10 1.2466 0.6851 0.6755 0.6435 0.6460 0.6710 1.8459 1.0704 1.0572 1.0069 1.0115 1.0495
viés um pouco maior. Os estimadores de máxima verossimilhança corrigidos têm medidas
de eqm bastante parecidas, enquanto que o estimador sem correção tem resultado maior
em geral.
Quando o tamanho da amostra foi aumentado para 50, percebe-se que há uma
melhora nas estimativas utilizando o método dos momentos no que se diz respeito ao viés,
já que é perceptível que embora o estimador ainda esteja superestimando os valores do
parâmetro, nota-se que as estimativas estão mais próximas dos verdadeiros valores dos
parâmetros. Com o aumento do tamanho da amostra, podemos notar uma redução no
viés do estimador de máxima verossimilhança. Isto é esperado dado que é um estimador
assintoticamente não-viesado. Entre os estimadores de máxima verossimilhança corrigidos,
embora apresentem estimativas próximas dos verdadeiros valores dos parâmetros, o esti-
mador corrigido pela forma analítica proposto na Seção 3.5 continua com resultados mais
próximos dos reais valores dos parâmetros do que o estimador corrigido por bootstrap. O
estimador α̂∗MM permanece com um viés positivo mas apresenta uma redução com relação
ao cenário do tamanho de amostra 25, e tem média das estimativas mais próximas dos
Capítulo 4. Resultados numéricos 30
verdadeiros valores dos parâmetros comparado ao estimador de momentos modificado.
Com relação ao erro quadrático médio destes estimadores, assim como no cenário anterior,
os estimadores de máxima verossimilhança corrigidos são os que tem menor erro quadrático
médio. O EQM dos dois estimadores de momentos modificados é comparável com o do
estimador de máxima verossimilhança; em alguns casos é maior e em outros, menor.
Nos casos das amostras de tamanho 100 e 200, percebe-se que as estimativas
médias dos parâmetros se aproximaram mais dos valores reais dos parâmetros. Porém, os
estimadores de máxima verossimilhança corrigidos, embora tenham se aproximado mais
dos verdadeiros valores dos parâmetros, não há grandes mudanças quando comparados às
estimativas dos mesmos estimadores nas amostras menores, pois as estimativas anteriores
já apresentavam tendência próxima de zero. As estimativas pelo estimador de momentos
são bem mais próximas dos valores reais dos parâmetros, no entanto mesmo com um
tamanho amostral de 200, ainda há um viés maior do que o viés dos demais estimadores.
Com relação às medidas de erro quadrático médio dos estimadores, nota-se que, como
esperado, há uma redução nesta medida, já que são amostras maiores, mas fica evidente
que são os mesmos estimadores dos cenários anteriores a terem as menores medidas do
erro.
31
5 Aplicação
Neste capítulo é feita uma aplicação dos estimadores propostos no Capítulo 3 à
um conjunto de dados real. O conjunto de dados utilizado foi utilizado em Percontini et al.
(2014). Os dados são formados por 46 observações do tempo ativo de reparo, em horas, de
um transceptor de comuicação aérea.
Tabela 3 – Dados de manutenção de transceptores de comunicação aérea.
0.2 0.3 0.5 0.5 0.5 0.5 0.6 0.6 0.7 0.7 0.7 0.8
0.8 1.0 1.0 1.0 1.0 1.1 1.3 1.5 1.5 1.5 1.5 2.0
2.0 2.2 2.5 2.7 3.0 3.0 3.3 3.3 4.0 4.0 4.5 4.7
5.0 5.4 5.4 7.0 7.5 8.8 9.0 10.3 22.0 24.5
A Tabela 3 apresenta os dados a serem analisados. Os dados estão ordenados, logo
é possível ver que o valor mínimo é 0.2 e o valor máximo é 24.5. O primeiro quartil das
observações é o valor 0.8, a mediana é igual a 1.75 e o terceiro quartil é 4.375. Já a média
dos dados é igual a 3.607 e a variância é de 24.445.
Tabela 4 – Estimativas para os parâmetros em cada um dos estimadores.
α̂ β̂
θ̂ 2.7818 1.6576
θ̂b 2.6062 1.5612
θ̂c 2.6011 1.5807
θ̂M 6.1827 2.7053
θ̂MM 3.1113 1.8582
θ̂∗MM 3.0813 1.8499
A Tabela 4 mostra as estimativas para os parâmetros obtidas por meio dos estima-
dores propostos no Capítulo 3. Nota-se que as estimativas obtidas para os parâmetros pelos
diferentes estimadores segue um padrão semelhante à simulação conduzida no Capítulo 4.
Os estimadores de máxima verossimilhança corrigidos têm estimativas similares, princi-
palmente para a estimativa de α, as estimativas pelo método dos momentos modificados
e pelo novo método dos momentos modificados também são similares e com resultados
maiores do que os estimadores de máxima verossimilhança. Como o estimador de máxima
verossimilhança corrigida pelo método de Cox-Snell teve resultados melhores na simulação,
a estimativa dos parâmetros será realizada utilizando este estimador.
A Figura 7 apresenta o boxplot dos dados. Percebe-se que de fato a distribuição dos
dados é assimétrica à direita e que de fato há valores discrepantes no conjunto de dados.
Isto pode ser indicativo de que as estimativas podem estar sendo influenciados devido à
presença destes outliers.
Capítulo 5. Aplicação 32
0
5
10
15
20
25
Te
m
po
 a
tiv
o 
de
 re
pa
ro
 (h
or
as
)
Figura 7 – Boxplot dos dados de manutenção de transceptores de comunicação aérea.
A Figura 8 apresenta o histograma dos dados de tempo de reparo e a curva da
densidade da distribuição BP com os parâmetros estimados por meio do estimador de
máxima verossimilhança com o viés corrigido pelo método de Cox-Snell em azul e a curva
da densidade da distribuição BP com os parâmetros estimados por meio do estimador de
momentos, cujas estimativas foram bem diferentes dos demais estimadores, em vermelho.
Percebe-se que a densidade ajustada utilizando as estimativas de máxima verossimilhança
corrigidas pelo método de Cox-Snell é bastante parecida com a forma do histograma dos
dados. Já a outra curva da densidade aparenta estar deslocada para a direita com relação
à distribuição do conjunto de dados.
Capítulo 5. Aplicação 33
Tempo ativo de reparo (horas)
D
en
si
da
de
0 5 10 15 20 25
0.
0
0.
1
0.
2
0.
3
Figura 8 – Histograma dos dados de manutenção com a curva densidade da distribuição BP
com parâmetros iguais às estimativas α̂b e α̂b em azul; e a curva de densidade da
distribuição BP com parâmetros iguais às estimativas α̂M e α̂M em vermelho.
34
6 Conclusão
Neste capítulo são discutidas as possíveis conclusões e ponderações a serem feitas
com respeito aos métodos de estimação abordados.
Nas simulações realizadas, fica claro que o estimadores de máxima verossimilhança
com correção de viés fornecem estimativas mais próximas dos verdadeiros valores dos
parâmetros do que os demais estimadores. Isto ocorre em todos os tamanhos de amostra
e em todas as combinações dos valores dos parâmetros. Entre os estimadores corrigidos
mencionados, o estimador que tem o viés corrigido pela forma analítica apresenta resultados
melhores dos que o corrigido pelo método bootstrap, principalmente quando a amostra é
menor.Isso pode estar occorrendo devido ao número de réplicas bootstrap ser 100, pois a
tendência é que as estimativas fiquem mais próximas dos parâmetros quando se utiliza mais
réplicas. Logo, apesar da possível limitação do estimador corrigido por bootstrap devido
ao número de réplicas bootstrap, na ocasião de aplicar esta distribuição a conjuntos de
dados diversos, caso o tamanho da amostra não seja grande, é recomendável que utilize-se
o estimador de máxima verossimilhança corrigido pelo método de Cox-Snell para obter-se
estimativas para os parâmetros.
Caso fosse necessário trabalhar computacionalmente com a forma analítica do
viés, a utilização deste estimador não seria prática, pois se tornaria necessário que isto
fosse programado. E, como há uma expressão analística diferente para cada distribuição,
conforme apresentado em Stošić e Cordeiro (2009), ficaria difícil de testar diferentes
distribuições para um determinado conjunto de dados. No entanto, como existe o pacote
computacional "mle.tools"no software R, a implementação deste estimador torna-se viável
e simples de ser programado.
Por um lado, é bem verdade que os estimadores que forneceram melhores estimativas
tiveram correção de viés, o que não ocorreu para os estimadores baseados no método dos
momentos, sejam estes modificados ou não. Portanto, para um estudo de comparação mais
completo de métodos de estimação, seria interessante que se implementasse a correção do
viés destes outros estimadores e então fosse comparados todos os estimadores corrigidos. A
vantagem da utilização dos estimadores baseados no método dos momentos é a simplicidade,
pois estes estimadores tem expressões que dependem de estatísticas facilmente calculáveis.
Já o estimador de máxima verossimilhança requer um rigor computacional mais elevado
devido ao fato que no caso da distribuição BP, não há forma analística para este estimador,
logo é necessário utilizar algum método de otimização para se obter as estimativas, e este
tipo de prática é sujeita a falhas compatucionais como erros de aproximação.
Por outro lado, é importante frisar que, embora seja verdade que as tendências dos
Capítulo 6. Conclusão 35
estimadores de momentos não foram corrigidas, o estimador de máxima verossimilhança
sem correção forneceu resultados mais precisos e acurados mesmo que este também não
tenha tido o viés eliminado. Portanto, é razoável imaginar que mesmo que se corrija os
estimadores de momentos, os resultados não serem melhores do que os estimadores de
máxima verossimilhança corrigido.
No caso da aplicação dos métodos de estimação ao conjunto de dados referente
ao tempo ativo de reparo dos transceptores de comunicação aérea, abordada no capítulo
5, tem-se o estimador de máxima verossimilhança teve estimativas menores do que os
estimadores baseado em algum método dos momentos. Além disso, foi calculado que
este estimador teve um viés positivo ao estimar os parâmetros, logo os parâmetros foram
superestimados. Isto pode indicar que os demais estimadores superestimaram ainda mais os
parâmetros. Isto corrobora com o fato de que é mias prudente a utilização dos estimadores
de máxima verossimilhança corrigidos para aplicações em que a distribuição BP seja
relevante e útil.
36
Referências
BALAKRISHNAN, N.; ZHU, X. An improved method of estimation for the parameters
of the Birnbaum-Saunders distribution. Journal of Statistical Computation and
Simulation, v. 84, n. 10, p. 2285–2294, abr 2013. ISSN 3437-3450. Disponível em:
<http://dx.doi.org/10.1080/00949655.2013.789029>.
BALAKRISHNAN, N. et al. On moment-type estimators for a class of log-symmetric
distributions. Computational Statistics, v. 32, n. 4, p. 1339–1355, mar 2017. ISSN
0943-4062. Disponível em: <https://doi.org/10.1007/s00180-017-0722-6>.
BOURGUIGNON, M;SANTOS-NETO, M; DE CASTRO; M. A new regression model for
positive data. Disponível em: <arXiv:1804.07734v1[stat.ME]>.
DO ESPÍRITO SANTO, A.P.J.; Mazucheli, J. Comparison of estimation methods for
the Marshall–Olkin extended Lindley distribution. Journal of Statistical Computation
and Simulation, v. 85, n. 17, p. 317–328, nov 2014. ISSN 3437-3450. Disponível em:
<http://dx.doi.org/10.1080/00949655.2014.977904>.
KEEPING, E. S. Introduction to Statistical Inference. Nova Iorque: Van Norstrand, 1962.
MAZUCHELI, J.; GHITANI, M.E.; LOUZADA, F. Comparisons of Ten Estimation
Methods for the Parameters of Marshall-Olkin Extended Exponential Distribution.
Communications in Statistics - Simulation and Computation, v. 46, n. 7, p. 5627–5645,
maio 2016. ISSN 0361-0918. Disponível em: <http://dx.doi.org/10.1080/03610918.2016.
1171345>.
MAZUCHELI, J.; MENEZES, A. F.; NADARAJAH, S. mle.tools: An R Package for
Maximum Likelihood Bias Correction. The R Journal, v. 79, n. 6, p. 751–767, dec 2017.
ISSN 2073-4859. Disponível em: <https://www.researchgate.net/publication/320757321>.
McDONALD, J. B. Some generalized functions for the size distribution of income.
Econometrica, v. 52, n. 3, p. 647–663, maio 1984. ISSN 1468-0262. Disponível
em: <http://links.jstor.org/sici?sici=0012-9682%28198405%2952%3A3%3C647%
3ASGFFTS%3E2.0.CO%3B2-D>.
McDONALD, J. B. Model Selection: Some generalized distributions. Communications
in Statistics - Theory and Methods, v. 16, n. 4, p. 1049–1074, jan 1987. ISSN 03610926.
Disponível em: <http://dx.doi.org/10.1080/03610928708829422>.
NG, H. K. T; KUNDU, D.; BALAKRISHNAN, N. Modified moment estimation
for the two-parameter Birnbaum-Saunders distribution. Computational Statistics
& Data Analysis, v. 43, p. 283–298, 2013. ISSN 0167-9473. Disponível em:
<https://www.researchgate.net/publication/320757321>.
PERCONTINI, A. et al. A distribuição Gama Weibull Poisson aplicada a dados de
sobrevivência. Brazilian Society of Applied and Computational Mathematics, v. 15, n. 2,
ago 2014. ISSN 1677-1966. Disponível em: <http://dx.doi.org/10.5540/tema.2014.015.02.
0165>.
http://dx.doi.org/10.1080/00949655.2013.789029
https://doi.org/10.1007/s00180-017-0722-6
arXiv:1804.07734v1 [stat.ME]
http://dx.doi.org/10.1080/00949655.2014.977904
http://dx.doi.org/10.1080/03610918.2016.1171345
http://dx.doi.org/10.1080/03610918.2016.1171345
https://www.researchgate.net/publication/320757321
http://links.jstor.org/sici?sici=0012-9682%28198405%2952%3A3%3C647%3ASGFFTS%3E2.0.CO%3B2-D
http://links.jstor.org/sici?sici=0012-9682%28198405%2952%3A3%3C647%3ASGFFTS%3E2.0.CO%3B2-D
http://dx.doi.org/10.1080/03610928708829422
https://www.researchgate.net/publication/320757321
http://dx.doi.org/10.5540/tema.2014.015.02.0165
http://dx.doi.org/10.5540/tema.2014.015.02.0165
Referências 37
R Core Team (2018). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
STOŠIC, B.D.; CORDEIRO, G. Using Maple and Mathematica to derive bias
corrections for two parameter distributions. Journal of Statistical Computation and
Simulation, v. 79, n. 6, p. 751–767, maio 2009. ISSN 3437-3450. Disponível em:
<http://dx.doi.org/10.1080/00949650801911047>.
TEIMOURI, M.; HOSEINI, S.M; NADARAJAH, S. Comparison of estimation
methods for the Weibull distribution. Statistics: A Journal of Theoretical and
Applied Statistics, v. 47, n. 1, p. 93–109, mar 2011. ISSN 0943-4062. Disponível em:
<http://dx.doi.org/10.1080/02331888.2011.559657>.
http://dx.doi.org/10.1080/00949650801911047
http://dx.doi.org/10.1080/02331888.2011.559657
38
Apêndice
Propriedades
X ∼ BP(α, β).
E
[
log
(
X
1 +X
)]
= 1
B(α, β)
∫ ∞
0
log
(
x
1 + x
)
xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∫ ∞
0
[log(x)− log(1 + x)]xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∫ ∞
0
[log(x) xα−1(1 + x)−(α+β)
− log(1 + x) xα−1(1 + x)−(α+β)]dx
= 1
B(α, β)
∫ ∞
0
∂
∂α
(
xα−1(1 + x)−(α+β)
)
dx
= 1
B(α, β)
∂
∂α
∫ ∞
0
xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∂
∂α
B(α, β)
= ∂
∂α
logB(α, β)
E [log (1 +X)] = 1
B(α, β)
∫ ∞
0
log(1 + x) xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∫ ∞
0
− ∂
∂β
(
xα−1(1 + x)−(α+β)
)
dx
= − 1
B(α, β)
∂
∂β
B(α, β)
= − ∂
∂β
logB(α, β)
Referências 39
E [log(X)] = 1
B(α, β)
∫ ∞
0
log(x) xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∫ ∞
0
[
log
(
x
1 + x
)
+ log(1 + x)
]
xα−1(1 + x)−(α+β)dx
= 1
B(α, β)
∫ ∞
0
log
(
x
1 + x
)
xα−1(1 + x)−(α+β)dx
+ 1
B(α, β)
∫ ∞
0
log(1 + x) xα−1(1 + x)−(α+β)dx
= E
[
log
(
X
1 +X
)]
+ E [log (1 +X)]
= ∂
∂α
logB(α, β)− ∂
∂β
logB(α, β)
Estimação dos parâmetros
Estimador pelo método dos momentos:
X̄ = α̂
β̂−1
⇒ β̂ = α̂+X̄
X̄
(1/n)
n∑
i=1
X2i = α̂β̂−1
α̂+1
β̂−2
⇒ (1/n)
n∑
i=1
X2i = X̄
(
α̂+1
α̂+X̄
X̄
−2
)
⇒ (1/n)
n∑
i=1
X2i = X̄2
(
α̂+1
α̂−X̄
)
⇒ α̂(1/n)
n∑
i=1
X2i − X̄(1/n)
n∑
i=1
X2i = α̂X̄2 + X̄2
⇒ α̂
[
(1/n)
(
n∑
i=1
X2i − nX̄2
)]
= X̄(1/n)
n∑
i=1
X2i + X̄2
⇒ α̂
[
(1/n)
n∑
i=1
(Xi − X̄)2
]
= X̄
[
(1/n)
n∑
i=1
Xi(1 +Xi)
]
⇒ α̂ =
n∑
i=1
Xi(1+Xi)
n∑
i=1
(Xi−X̄)2
X̄
β̂ = α̂+X̄
X̄
⇒ β̂ =
(2/n)
n∑
i=1
X2i +X̄(1−X̄)
(1/n)
n∑
i=1
(Xi−X̄)2
Estimador de momentos modificado:
X̄ = α̂
β̂−1
⇒ α̂ = X̄(β̂ − 1)
Referências 40
(1/n)
n∑
i=1
X−1i = β̂α̂−1 ⇒
β̂
(1/n)
n∑
i=1
X−1i
= α̂− 1
⇒ β̂
(1/n)
n∑
i=1
X−1i
= X̄(β̂ − 1)− 1
⇒ β̂
(1/n)
n∑
i=1
X−1i
− β̂X̄ = −(1 + X̄)
⇒ β̂ = 1+X̄
X̄−
[
(1/n)
n∑
i=1
X−1i
]−1
α̂ = X̄(β̂ − 1)
⇒ α̂ =
X̄
{
1+
[
(1/n)
n∑
i=1
X−1i
]−1}
X̄−
[
(1/n)
n∑
i=1
X−1i
]−1
Novo estimador de momentos modificado:
z̄ = X̄ β̂
α̂−1
β̂ = α̂+X̄
X̄
⇒ z̄ = α̂+X̄
α̂−1
⇒ α̂ = Z̄+X̄
Z̄−1
⇒ β̂ = X̄+1
X̄
z̄
z̄−1
	Folha de rosto
	Folha de aprovação
	Dedicatória
	Agradecimentos
	Epígrafe
	Resumo
	Abstract
	Lista de tabelas
	Lista de tabelas
	Sumário
	Introdução
	Propriedades
	Estimação dos parâmetros
	Estimador de máxima verossimilhança
	Estimador de máxima verossimilhança corrigido
	Correção de Cox-Snell
	Correção por bootstrap paramétrico
	Estimador pelo método dos momentos
	Estimador de momentos modificado
	Novo estimador de momentos modificado
	Resultados numéricos
	Aplicação
	Conclusão
	Referências

Continue navegando