Buscar

Continue navegando


Prévia do material em texto

Material auxiliar a ser usado exclusivamente na disciplina 
 
Comunicações Ópticas 
 
da 
 
Universidade Federal do ABC. 
 
 
 
 
 
 
Este material é um apanhado dos tópicos essenciais para a referida disciplina, extraídos da 
obra de 
 
 
Govind P. Agrawal 
 
 
Fiber-Optic Communications Systems, Third Edition, 
John Wiley & Sons, Inc, 2002. 
 
 
 
 
Por 
 
Luiz Henrique Bonani 
 
 
 
 
1 
 
 
Receptores Ópticos 
O papel de um receptor óptico é converter o sinal óptico de volta em sinal elétrico e 
recuperar os dados transmitidos através do sistema óptico de comunicação. Seu principal 
componente é um fotodetetor que converte luz em eletricidade por meio do efeito 
fotoelétrico. 
Os requisitos para um fotodetetor são semelhantes aos de uma fonte óptica: alta 
sensibilidade, resposta rápida, baixo ruído, baixo custo e alta confiabilidade. Além disso, seu 
tamanho deve ser compatível com o tamanho do núcleo da fibra óptica. Todos estes requisitos 
são melhor atendidos por fotodetetores feitos de materiais semicondutores. 
 
Conceitos Básicos 
O mecanismo fundamental por trás do processo de fotodetecção é a absorção óptica. 
Também são importantes os conceitos de responsividade, eficiência quântica e largura de 
banda, que são comuns a todos os fotodetectores. 
Considerando o semicondutor mostrado, se a energia hf dos fótons incidentes 
excederem a energia do bandgap, um par elétron-lacuna é gerado toda vez que um fóton é 
absorvido. 
 
 
Responsividade do Detector 
Sob a influência de um campo elétrico devido a uma tensão, os elétrons e lacunas se 
propagam pelo semicondutor, resultando em um fluxo de corrente elétrica. A fotocorrente Ip 
é diretamente proporcional à potência óptica incidente Pin, ou seja, 
inpI RP 
em que R é a responsividade do fotodetetor (A/W). 
A responsividade R pode ser expressa em termos de uma quantidade fundamental η, 
chamada de eficiência quântica: 
/taxa de geração de elétrons
taxa de incidência de fótons /
p
in
I q hf
R
P hf q
    
Considerando λ ≡ c/f , a responsividade R é dada por: 
2 
 
1, 24
q
R
hf
 
  
A responsividade de um fotodetetor aumenta com o comprimento de onda λ, pois 
mais fótons estão presentes para a mesma potência óptica. A dependência linear em λ não 
continua para sempre, porque eventualmente a energia do fóton torna-se demasiadamente 
pequena para gerar elétrons. 
Em semicondutores isso acontece para hf < Eg, em que Eg, é o bandgap. A eficiência 
quântica η, então, cai para zero. A dependência de η em relação a λ existe pelo coeficiente de 
absorção α. Se as faces do tarugo de semicondutor têm um revestimento antireflexo, a 
potência transmitida através da placa de largura W é Ptr = exp(-αW) Pin. 
A potência absorvida pode ser escrita como: 
abs in tr in[1 exp( )]P P P W P     
Uma vez que cada fóton absorvido cria um par elétron-lacuna, o a eficiência quântica 
η é dada por: 
abs in/ 1 exp( )P P W     
Como esperado, η tende a zero quando α = 0. Por outro lado, η se aproxima de 1 se 
αW >> 1. 
A figura mostra a dependência do comprimento de onda de α para vários materiais 
semicondutores usados para fazer fotodetectores para sistemas ópticos de comunicação. 
 
O comprimento de onda λc para o qual α torna-se zero é chamado de comprimento 
de onda de corte, já que esse material pode ser usado em um fotodetector apenas no caso λ 
< λc. 
 
3 
 
Tempo de Subida 
A largura de banda de um fotodetetor é dada pela velocidade com que ele responde a 
variações de potência incidente. O tempo de subida Tr é definido como o tempo durante o 
qual a corrente salta de 10 a 90% do seu valor final quando a potência óptica incidente muda 
abruptamente. 
Claramente Tr depende do tempo para os elétrons e lacunas viajarem até os contatos 
elétricos e do tempo de resposta do circuito elétrico usado para processar a fotocorrente. O 
tempo de subida Tr de um circuito elétrico linear é definido como o tempo durante o qual a 
resposta aumenta de 10 até 90% do seu valor final de saída, quando a entrada muda 
abruptamente. 
Quando a tensão de entrada de um circuito RC se altera instantaneamente de 0 a V0, 
a variação da tensão de saída é: 
out 0( ) [1 exp( / )]V t V t RC   
em que R é a resistência e C é a capacitância do circuito RC. 
O tempo de subida é dado por: 
(ln9) 2,2r RCT RC   
em que τRC = RC é a constante de tempo do circuito RC. O tempo de subida de um 
fotodetector pode ser escrito como: 
tr(ln9)( )r RCT    
em que τtr é o tempo de trânsito e τRC é a constante de tempo do circuito RC equivalente. 
Muitas vezes, a constante τRC limita a largura de banda por causa de parasitas elétricos. Os 
valores numéricos de τtr e τRC dependem do projeto do detector e podem variar amplamente. 
 
Largura de Banda 
A largura de banda de um fotodetector é definida de maneira análoga ao de um 
circuito RC e é dada por: 
1
tr[2 ( )]RCf   
   
Como exemplo, quando τtr = τRC = 100 ps, a largura de banda do fotodetector é abaixo 
1 GHz. Claramente, tanto τtr como τRC devem ser reduzidos abaixo de 10 ps para 
fotodetectores operando a taxas de bit de 10 Gb/s ou mais. 
Além da largura de banda e a responsividade, a corrente de escuro Id de um 
fotodetector é o terceiro parâmetro importante. Essa corrente é gerada em um fotodetector na 
ausência de qualquer sinal óptico e provém de luz difusa ou de pares elétron-lacunas 
termicamente gerados. 
Para um bom fotodetector a corrente escura deve ser desprezível (Id <10 nA). 
 
4 
 
Fotodiodos p-n 
Uma junção p-n reversamente polarizada apresenta uma região de depleção, que é 
essencialmente desprovida de portadores de carga e onde há um grande campo elétrico que 
se opõe ao fluxo de cargas (elétrons do lado n para o lado p e de lacunas de p para n). 
Quando junção p-n é iluminada, pares elétron-lacuna são criados por absorção. 
Devido ao campo elétrico, estes elétrons e lacunas gerados se aceleram em direções opostas, 
indo para os lados n e p, respectivamente. 
O fluxo total de corrente é proporcional à potência óptica incidente. Assim, uma 
junção p-n inversamente polarizada age como um fotodetetor e é referida como o fotodiodo 
p-n. A largura de banda de um fotodiodo p-n é limitada pelo tempo de trânsito τtr. Se W é a 
largura da região de depleção e vd é a velocidade de deriva, o tempo de trânsito é dado por: 
tr / dW v  
A largura da camada de depleção depende das concentrações das impurezas 
receptoras e doadoras e pode ser controlada por meio delas. 
 
A velocidade vd depende da tensão aplicada, mas atinge um valor máximo (chamado 
de velocidade de saturação) de ~105 m/s que depende do material utilizado para o fotodiodo. 
A constante de tempo τRC pode ser escrita como: 
( )RC L s pR R C   
em que RL é a resistência da carga externa, Rs é a resistência série interna e Cp é a capacitância 
parasita. 
Um fator limitante para a largura de banda de fotodiodos p-n é o componente de 
difusão na fotocorrente, decorrente da absorção de luz incidente fora da camada de depleção. 
A contribuição de difusão pode ser reduzida, diminuindo a largura das regiões p e n e 
aumentando a largura da região de depleção, de modo que a maioria da potência óptica 
incidente seja absorvida no seu interior. 
5 
 
Esta é a abordagem adotada para fotodiodos p-i-n e para aumentar a largura da região 
de depleção insere-se uma camada de material semicondutor não dopado (ou levemente 
dopado) entre a junção p-n. 
 
Fotodiodos p-i-n 
A figura mostra a estrutura do dispositivo em conjunto com o campo elétrico 
distribuído dentro dele sob operação de polarização reversa. 
 
Devido à sua natureza intrínseca, a camada i oferece uma alta resistência, 
concentrando a maior queda de tensão, resultando em um grande campo elétrico nessa 
camada. A região de depleção se estende por toda a região i e sua largura W pode sercontrolada alterando a espessura da camada do meio. 
A principal diferença para o fotodiodo p-n é que a componente de deriva da 
fotocorrente domina sobre a componente de difusão porque a maior parte da potência 
incidente é absorvida dentro da região i de um fotodiodo p-i-n. 
A largura de depleção W pode ser adaptada em fotodiodos p-i-n e uma pergunta 
natural é quão grande W pode ser. O valor ideal de W depende de um compromisso entre 
velocidade e sensibilidade. A responsividade pode ser aumentada aumentando W de modo 
que a eficiência quântica η se aproxime de 100%. No entanto, o tempo de resposta também 
aumenta, já que leva mais tempo para a deriva em toda a região de depleção. 
Para semicondutores com bandgap indireto, tais como Si e Ge, tipicamente W deve 
estar na faixa de 2 a 50 μm para garantir uma eficiência quântica razoável. A largura de 
banda de fotodiodos é limitada por um tempo de trânsito relativamente longo (τtr > 200 ps). 
Por outro lado, W pode ser tão pequena quanto 3-5 μm para fotodiodos que usam 
semicondutores com bandgap direto, tais como InGaAs, cujo tempo de trânsito é de τtr ~10ps. 
Os valores de τtr correspondem a uma largura de banda Δf ~ 10 GHz. O desempenho 
6 
 
de fotodiodos p-i-n pode ser melhorado usando uma dupla heteroestrutura. Assim, o meio i 
é prensado entre as camadas n e p de um novo tipo de semicondutor cujo bandgap é escolhido 
para que a luz seja absorvida somente na camada i. 
Fotodiodos InGaAs são bastante úteis para sistemas ópticos de comunicação. A tabela 
lista as características de operação dos três fotodiodos p-i-n mais comuns. Na década de 1990 
foram desenvidos fotodiodos p-i-n para operar em taxas de bits superiores a 10 Gb/s. 
 
Outra abordagem para conseguir fotodiodos de alta velocidades e eficientes faz uso 
de um guia de onda óptico. Tal estrutura se assemelha a um laser semicondutor não 
bombeado, exceto por várias camadas epitaxiais otimizadas de forma diferente. Em contraste 
com um laser semicondutor, o guia de onda pode ser feito largo para suportar múltiplos 
modos transversais, a fim de melhorar a eficiência de acoplamento. 
A largura de banda de fotodiodos de guia de onda pode ser aumentada para 110 GHz, 
adotando uma estrutura em que a largura da camada i seja reduzida para 1,5 μm enquanto as 
camadas p e n sejam feitas com 6 μm de largura. Desta forma, tanto a capacitância parasita 
como a resistência série interna são minimizadas, reduzindo τRC para ~1 ps. 
O desempenho de fotodiodos de guia de onda pode ser melhorado com a adoção de 
uma estrutura de eletrodo, projetada para suportar ondas elétricas com casamento de 
impedâncias para evitar reflexões. Esses fotodiodos são chamados fotodetetores de onda 
viajante. 
 
Fotodiodos Avalanche 
Todos os detectores exigem um mínimo de corrente para operar de forma confiável. 
A exigência de corrente traduz-se em um requisito mínimo de energia com Pin = Ip/R. 
Detectores com responsividades grandes são preferidos por exigirem menos potência óptica. 
A responsividade de fotodiodos p-i-n é limitada, com máximo em R = q/hν, η = 1. 
Fotodiodos Avalanche (APDs) podem ter valores muito maiores de R, já que são 
concebidos para proporcionar um alto ganho interno de corrente e são usados quando a 
quantidade de potência óptica que pode ser usada para o receptor é limitada. 
O fenômeno físico por trás do ganho interno de corrente é conhecido como ionização 
de impacto. Sob certas condições, um elétron acelerado pode adquirir energia suficiente para 
gerar um par elétron-lacuna novo. 
7 
 
Os elétrons mais energéticos dão uma parte de sua energia cinética para um outro 
elétron na banda de valência, que por sua vez acaba na banda de condução, deixando para 
trás uma lacuna. O resultado líquido da ionização de impacto é que um único elétron 
primário, gerado por meio da absorção de um fóton, cria muitos elétrons secundários e 
lacunas, os quais contribuem para a corrente do fotodiodo. 
A lacuna principal também pode gerar pares elétron-lacuna secundários que 
contribuem para a corrente. A taxa de geração é governada por dois parâmetros (αe e αh), que 
são os coeficientes de ionização por impacto de elétrons e lacunas, respectivamente. Seus 
valores numéricos dependem do material semicondutor e do campo elétrico que acelera os 
elétrons e lacunas. 
Os APDs diferem na sua concepção de fotodiodos p-i-n, principalmente em um 
aspecto: uma camada adicional é inserida na qual pares secundários elétron-lacuna são 
gerados por meio de ionização de impacto. A figura a seguir mostra a estrutura APD 
juntamente com a variação do campo elétrico em várias camadas. 
 
O ganho de corrente para APDs pode ser calculado usando as equações que regem a 
taxa de fluxo de corrente dentro da camada de multiplicação: 
e
e e h h
h
e e h h
di
i i
dx
di
i i
dx
 
 
 
  
 
em que ie é a corrente de elétrons e ih é a corrente de lacunas. 
O sinal negativo na equação se deve à direção oposta da corrente de lacunas. A 
corrente total I permanece constante em todos os pontos dentro da região de multiplicação. 
( ) ( )e hI i x i x  
8 
 
Se ih for substituída por I – ie, obtém-se: 
/ ( )e e h e hdi dx i i I    
Em geral, αe e αh são dependentes de x se o campo elétrico em toda a região de ganho 
for não uniforme. A análise é simplificada com um campo elétrico uniforme, tratando αe e αh 
como constantes. Assume-se também que αe > αh, com o processo de avalanche sendo 
iniciado por elétrons que entram na região de ganho de espessura d em x = 0. Usando a 
condição ih(d) = 0 (só elétrons cruzam a fronteira para entrar na região n), a condição de 
contorno é ie(d) = I. 
Ao integrar esta equação, o fator de multiplicação definido como M = ie(d)/ie(0) é 
dado por: 
A
A A
1
exp[ (1 ) ]e
k
M
k d k


  
 
em que o coeficiente de ionização kA = αh/αe. 
O ganho APD é bastante sensível à relação entre os coeficientes de impacto de 
ionização. Quando αh = 0 apenas com os elétrons participando do processo de avalanche, 
M = exp (αed), e o ganho APD aumenta com d. 
Por outro lado, quando αh = αe, de modo que kA = 1, M = (1 – αed)
-1. O ganho APD, 
torna-se infinito para αed = 1, uma condição conhecida como ponto de avalanche. O maior 
ganho de APD pode ser conseguido com uma menor região de ganho quando αh e αe são 
comparáveis. 
Por outro lado, o desempenho é melhor para APDs em que αh >> αe ou αh << αe para 
que o processo de avalanche seja dominado por apenas um tipo de portador de carga. Por 
causa do ganho de corrente, a responsividade de um APD é reforçada pelo fator de 
multiplicação M e é dada por: 
APD ( / )R MR M q hf  
O processo de avalanche em APDs é intrinsecamente ruidoso e resulta em um fator 
de ganho que oscila em torno de um valor médio. O fator M se refere ao ganho APD médio. 
A largura de banda intrínseca de um APD depende do fator de multiplicação M, pois o tempo 
de trânsito τtr para um APD aumenta consideravelmente, já que a geração e coleta de pares 
elétron-lacuna secundários demoram mais tempo. 
O ganho APD diminui em altas frequências por causa desse aumento no tempo de trânsito e 
limites de largura de banda. A diminuição de M(ω) pode ser escrita como: 
2 1/2
0 0( ) [1 ( ) ]eM M M 
  
em que M0 = M(0) é o ganho de baixa frequência e τe é o tempo de trânsito eficaz que depende 
da relação dos coeficientes de ionização kA. 
Para αh < αe, τe = cAkAτtr, com cA constante (cA ~ 1) e supondo que τRC << τe, a largura 
de banda APD é dada por Δf = (2π τeM0)
-1, que mostra o compromisso entre o ganho APD, 
M0 e a largura de banda Δf. A tabela compara as características operacionais de APDs de Si, 
9 
 
Ge, e InGaAs. 
 
 
Ruído no Receptor 
Receptores ópticos convertem a potência óptica incidente Pin em corrente elétrica por 
meio de um fotodiodo. A relação Ip = RPin assume que tal conversão é livre de ruído. No 
entanto, estenão é o caso, mesmo para um receptor perfeito. Dois mecanismos de ruído 
fundamentais, o ruído shot e o ruído térmico, levam a flutuações na corrente mesmo quando 
o sinal óptico incidente tem uma potência constante. 
A relação Ip = RPin ainda vale se Ip for interpretada como a corrente média. No 
entanto, o ruído elétrico induzido pelas flutuações de corrente afeta o desempenho do 
receptor. 
 
Ruído Shot 
O ruído shot é uma manifestação do fato de que uma corrente elétrica consiste em um 
fluxo de elétrons que são gerados em momentos aleatórios. Foi primeiramente estudado por 
Schottky em 1918 e tem sido amplamente pesquisado desde então. A corrente do fotodiodo 
gerada em resposta a um sinal óptico constante pode ser escrita como: 
I(t) = Ip + is(t) 
em que Ip = RPin é a corrente média e is(t) é uma flutuação na corrente relacionada ao ruído 
shot. 
Matematicamente, is(t) é um processo estacionário aleatório com estatística 
poissoniana (aproximada muitas vezes por estatísticas gaussianas). A função de 
autocorrelação de is(t) está relacionada com a densidade espectral Ss( f ) pelo teorema de 
Wiener-Khinchin: 
( ) ( ) ( ) exp( 2 )s s si t i t S f j f df  


   
A densidade espectral do ruído shot é constante e é dada por Ss( f ) = qIp (um exemplo 
de ruído branco). 
10 
 
O parâmetro Ss(f) é a densidade espectral de potência dos dois lados, com as 
frequências negativas já incluídas. Se apenas as frequências positivas são consideradas, 
alterando o limite inferior de integração para zero, a densidade espectral de lado único torna-
se 2qIp. A variância do ruído é obtida com τ = 0 na equação, ou seja, 
2 2 ( ) ( ) 2s s s pi t S f df qI f


    
em que Δf é a largura de banda efetiva de ruído do receptor. 
O valor real de Δf depende do projeto do receptor e corresponde à largura de banda 
intrínseca do fotodetector se flutuações na fotocorrente são medidas. Na prática, por razões 
de construção do circuito de decisão, deve-se considerar as funções de transferência dos 
componentes do receptor, tais como o pré-amplificador e o filtro passa-baixas. 
É comum considerar flutuações na corrente e incluir a função de transferência total 
HT(f), modificando a equação anterior: 
22
0
2 ( ) 2s p T pqI H f df qI f

   
em que 2
0
| ( ) |Tf H f df

   . 
Como a corrente escura Id também gera ruído shot, sua contribuição está incluída na 
equação, substituindo Ip por Id + Ip. O ruído shot total é então dado por: 
2 2 ( )s p dq I I f    
 
Ruído Térmico 
Em uma temperatura finita, os elétrons se movem aleatoriamente em qualquer 
condutor, que em um resistor se manifesta como uma corrente flutuante, mesmo na ausência 
de uma tensão aplicada. 
O resistor de carga na extremidade dianteira de um receptor óptico adiciona tais 
flutuações para a corrente gerada pelo fotodiodo, que é conhecido como ruído térmico. O 
ruído térmico pode ser incluído como segue: 
( ) ( ) ( )p s TI t I i t i t   
em que iT(t) é uma flutuação de corrente induzida pelo ruído térmico. 
Matematicamente, iT(t) é modelada como um processo aleatório estacionário 
gaussiano com densidade espectral que é independente da frequência até f ~ 1 THz (ruído 
quase branco) e é dada por: 
( ) 2 /T B LS t k T R 
em que kB é a constante de Boltzmann, T é a temperatura absoluta e RL é o resistor de carga. 
 
11 
 
O ruído térmico é obtido com: 
2 2 ( ) ( ) (4 / )T T T B Li t S f df k T R f


    
em que Δf é a largura de banda eficaz do ruído. 
A equação anterior inclui o ruído térmico gerado pelo resistor de carga, mas como 
existem múltiplos componentes elétricos no receptor, há ruído adicional que depende do 
projeto de construção e dos amplificadores usados. Uma abordagem simples para estimar o 
ruído do amplificador para diferentes projetos introduz um parâmetro Fn, conhecido como 
figura de ruído do amplificador, modificando a equação: 
2 (4 / )T B L nk T R F f   
Fisicamente, Fn representa o fator pelo qual o ruído térmico é reforçado por vários 
resistores usados nos pré-amplificadores e no amplificador principal. 
 
Ruído Total de Corrente 
O ruído total de corrente pode ser obtido pela soma das contribuições de ruído shot e 
ruído térmico. Uma vez que is(t) e iT(t) são processos aleatórios independentes com as 
estatísticas aproximadamente gaussianas, a variância total de flutuações de corrente ΔI=I–Ip 
= is + iT, pode ser obtida adicionando as variações individuais. O resultado é: 
2 2 2 2( ) 2 ( ) (4 / )T s T p d B L nI q I I f k T R F f           
Este resultado é usado para calcular a SNR da fotocorrente. 
 
Para Receptores p-i-n 
O desempenho de um receptor óptico depende da SNR e esta deve ser considerada 
para fotodiodos p-i-n. A SNR de qualquer sinal elétrico é definida como: 
2
2
potência média do sinal
SNR
potência média do ruído
pI

  
em que se usa o fato de que a energia elétrica varia com o quadrado da corrente. 
Usando o ruído total de corrente calculado anteriormente juntamente com Ip = RPin, 
a SNR está relacionada com a potência óptica incidente como: 
2 2
in
in
SNR
2 ( ) (4 / )d B L n
R P
q RP I f k T R F f

   
 
em que R = ηq / hf é a responsividade do fotodiodo p-i-n. 
 
 
12 
 
Limite do Ruído Térmico 
Na maioria dos casos o ruído térmico domina o desempenho do receptor (σT
2 >> σs
2), 
desprezando o termo de ruído shot na equação anterior, tornando a SNR: 
2 2
inSNR
4
L
B n
R R P
k TF f
 
    
 
Assim, a SNR varia como Pin
2 no limite de ruído térmico. Ela também pode ser 
melhorada por meio do aumento da resistência de carga. 
O efeito do ruído térmico é muitas vezes quantificada por meio da potência de ruído 
equivalente (NEP – Noise-equivalent Power). A NEP é definida como a potência óptica 
mínima por unidade de largura de banda necessária para produzir uma SNR = 1: 
1/2 1/2
in
2
4 4
NEP B n B n
LL
k TF k TFP hf
q RR Rf 
   
         
 
Outro parâmetro, chamado detectividade, é definido como (NEP)-1, e também é usado 
para esta finalidade. A vantagem de especificar a NEP ou a detetividade para receptores p-
i-n é estimar a potência óptica necessária para obter uma SNR específica se a largura de 
banda Δf é dada. 
 
Limite do Ruído Shot 
No limite oposto, em que o desempenho do receptor é dominado pelo ruído shot (σs
2 
>> σT
2), há a seguinte expressão para a SNR: 
in inSNR
2 2
RP P
q f hf f

 
 
 
A SNR aumenta linearmente com Pin no limite do ruído shot e depende apenas da 
eficiência quântica η, da largura de banda Δf e da energia do fóton hf. Esta SNR também 
pode ser escrita em termos do número de fótons contidos no bit “1”, Np, já que: 
in pP N hfB 
em que B é a taxa de bits. 
 
Para Receptores APD 
Receptores ópticos que empregam um fotodiodo APD fornecem uma SNR maior para 
a mesma potência óptica incidente. A melhora se deve ao ganho interno que aumenta a 
fotocorrente por um fator de multiplicação M, de modo que: 
in APD inpI MRP R P  
em que RAPD é a responsividade APD, reforçada por um fator de M comparado com o de 
fotodiodos p-i-n (RAPD = MR). 
13 
 
A SNR deve melhorar por um fator de M2 se o ruído do receptor não for afetado pelo 
mecanismo de ganho interno de APDs. Infelizmente, este não é o caso, e a melhoria da SNR 
é consideravelmente reduzida. 
 
Enriquecimento do Ruído Shot 
O ruído térmico permanece o mesmo para os receptores APD, já que ele se origina 
em componentes elétricos que não fazem parte do APD. Este não é o caso para o ruído shot, 
pois o ganho APD resulta da geração de pares elétron-lacuna secundários por meio do 
processo de ionização de impacto. 
Como tais pares são gerados em momentos aleatórios, uma contribuição adicional 
entra no ruído shot associada com a geração principal de pares elétron-lacuna. O fator de 
multiplicação é uma variável aleatória, e o M da equação anteriorrepresenta o ganho médio 
APD. O ruído shot total pode ser calculado como: 
2 2
in2 ( )s A dqM F RP I f    
em que FA é o fator de excesso de ruído do APD e é calculado como: 
( ) (1 )(2 1/ )A A AF M k M k M    
O parâmetro adimensional kA = αh/αe se αh <αe mas é definido como kA = αe/αh quando 
αh> αe. Em outras palavras, kA está na faixa entre 0 e 1. A figura mostra a dependência de FA 
em relação ao ganho para vários valores de kA. 
 
Se o processo de ganho de avalanche fosse sem ruído (FA = 1), tanto Ip como Is 
aumentariam pelo mesmo fator M, e a SNR não seria afetada já que o ruído shot já é levado 
em consideração. 
14 
 
Na prática, a SNR de receptores APD é pior do que a de receptores p-i-n quando o 
ruído shot domina por causa do excesso de ruído gerado dentro do APD. É o domínio do 
ruído térmico em receptores práticos que faz os APDs atraentes. Na verdade, a SNR de 
receptores APD pode ser escrita como: 
2 2
in
2 2 2
in
( )
SNR
2 ( ) 4( / )
p
s T A d B L n
I MRP
qM F RP I f k T R F f 
 
    
 
No limite do ruído térmico (σs << σT), a SNR se torna: 
2
2 2
inSNR
4
L
B n
R R
M P
k TF f


 
e é melhorada por um fator de M2 em comparação com a SNR de receptores p-i-n. Por outro 
lado, no limite do ruído shot (σs >> σT), a SNR é: 
in inSNR
2 2A A
RP P
qF f hfF f

 
 
 
e diminui pelo excesso de fator de ruído FA comparado com o de receptores p-i-n. 
 
Ganho Ótimo APD 
Para uma dada Pin, a SNR de receptores APD é máxima para um valor ótimo Mopt do 
ganho APD. Pode-se mostrar que a SNR é máxima quando Mopt satisfaz o seguinte polinômio 
cúbico: 
3
opt opt
in
4
(1 )
( )
B n
A A
L d
k TF
k M k M
qR RP I
  

 
O valor ótimo Mopt depende de um grande número de parâmetros do receptor, como 
a corrente de escuro, a responsividade R, e o coeficiente de ionização kA. No entanto, é 
independente da largura de banda do receptor. A característica mais notável da equação 
acima é que Mopt diminui com o aumento da Pin. A figura mostra a variação da Mopt com Pin 
para vários valores de kA. 
O ganho ótimo APD é bastante sensível ao coeficiente de ionização kA. Para kA = 0, 
Mopt diminui inversamente com Pin, observando que a contribuição de Id é insignificante na 
prática. 
15 
 
 
Por outro lado, P varia como Mopt 
-1/3 para kA = 1, e esta forma de dependência parece 
se manter até mesmo para kA pequenos. Na verdade, por desprezar o segundo termo na 
equação anterior, Mopt pode ser aproximado por: 
1/3
opt
in
4
( )
B n
A L d
k TF
M
k qR RP I
 
  
 
 
para kA no intervalo de 0,01 a 1. 
Esta última expressão mostra o papel crítico desempenhado pelo coeficiente de 
ionização kA. Em APDs de Si, para o qual kA << 1, Mopt pode ser tão grande quanto 100. Já 
para receptores de InGaAs, Mopt é ao redor de 10, uma vez que kA ~0,7. 
 
Sensibilidade dos Receptores 
Um receptor é dito ser mais sensível se atingir o mesmo desempenho com menos 
potência óptica incidente sobre ele. O critério de desempenho para receptores digitais é 
determinado pela taxa de erro de bit (BER). Assim, uma BER de 2×10-6 corresponde, em 
média, a dois erros por milhão de bits. Um critério comumente usado para receptores digitais 
ópticos requer BER abaixo de 1×10-9. 
A sensibilidade do receptor é definida como a potência média mínima recebida Prec 
necessária para operar em uma BER de 10-9. Assim, a primeira coisa a ser feita é calcular a 
BER. 
 
16 
 
Taxa de Erro de Bit (BER) 
A figura mostra o sinal flutuante recebido pelo circuito de decisão, em que as 
amostras estão no instante de decisão tD determinado por meio da recuperação de relógio. 
 
O valor amostrado I flutua de bit a bit em torno de um valor médio I1 ou I0, 
dependendo se o bit corresponde a 1 ou 0. O circuito de decisão compara o valor amostrado 
com um valor limiar ID e chama de bit 1 se I > ID ou de bit 0 se I < ID. Ambas as fontes de 
erros podem ser incluídas, definindo a probabilidade de erro de bit como: 
BER (1) (0 /1) (0) (1/ 0)p P p P  
em que p(1) e p(0) são as probabilidades de receber os bits 1 e 0, respectivamente; P(0/1) é 
a probabilidade de decidir 0 quando um 1 é recebido, e P(1/0) é a probabilidade de decidir 1 
quando um 0 é recebido. 
Como os bits 1 e 0 bits são igualmente prováveis de ocorrer, p(1) = p(0) = 1/2, e a 
BER se torna: 
 
1
BER (0 /1) (1/ 0)
2
P P  
A forma funcional de p(I) depende da estatística da fonte de ruído responsável pelas 
flutuações de corrente. Ruído térmico iT é bem descrito por estatísticas gaussianas com média 
zero e variância σT
2. A estatística do ruído shot também se aproxima de uma gaussiana para 
receptores p-i-n, mas não é o caso para APDs. 
Uma aproximação comum trata is como uma variável aleatória gaussiana para ambos 
os receptores, mas com diferentes variâncias σs
2, já estudadas previamente: 
2 2 ( )s p i n p dq I I f      
2 2
APD 2 ( )s A p dqM F I I f    
17 
 
A soma de duas variáveis aleatórias gaussianas também é uma variável aleatória 
gaussiana, e o valor da amostragem I tem uma função densidade de probabilidade gaussiana 
com variância σ2 = σs
2 + σT
2. No entanto, a média e a variância são diferentes para os bits 1 
e 0 já que Ip é igual a I1 ou I0 dependendo do bit recebido. 
Se σ1
2 e σ0
2 são as variâncias correspondentes, as probabilidades condicionais são 
dadas por: 
2
1 1
2
11 1
( )1 1
(0 /1) exp erfc
222 2
DI
DI I I IP dI
  

   
        
   
 
2
0 0
2
00 0
( )1 1
(1/ 0) exp erfc
222 2
D
D
I
I I I I
P dI
  
    
        
   
 
Nesse caso, erfc() é a função de erro complementar: 
22erfc(x) exp( )
x
y dy


  
E fazendo as substituições necessárias, a BER é dada por: 
01
1 0
1
BER erfc erfc
4 2 2
DD I II I
 
    
       
     
 
 
Limiar Ótimo de Decisão 
A BER depende do limiar de decisão ID e ID é otimizado para minimizar a BER. O 
mínimo ocorre quando ID é escolhido de tal forma que: 
2 2
0 1 1
2 2
00 1
( ) ( )
ln
2 2
D DI I I I 
 
  
   
 
 
O último termo desta equação é desprezível na maioria dos casos e ID é 
aproximadamente obtido a partir de: 
0 0 1 1( ) / ( ) /D DI I I I Q     
Uma expressão explícita para ID é: 
0 1 1 0
0 1
D
I I
I
 
 



 
Quando σ1 = σ0, ID = (I1 + I0)/2, que corresponde à definição do limiar de decisão no 
meio. Isso funciona para a maioria dos receptores p-i-n com ruído dominado pelo ruído 
térmico. 
Para APDs, a BER é minimizada com o limiar ótimo de decisão. A BER com a 
18 
 
configuração ótima do limiar de decisão depende apenas do parâmetro Q: 
21 exp( / 2)
BER erfc
2 2 2
Q Q
Q 
 
  
 
 
em que o parâmetro Q é dado por: 
1 0
1 0
I I
Q
 



 
 
BER e Parâmetro Q 
A figura mostra como a BER varia de acordo com o parâmetro Q. A BER melhora à medida 
que Q aumenta e torna-se menor do que 10-12 para Q > 7. A sensibilidade do receptor 
corresponde à potência óptica média para que Q ≈ 6, (BER ≈ 10-9). 
 
 
Potência Mínima Recebida 
A equação da BER pode ser usada para calcular a energia mínima que um receptor 
óptico precisa para operar de forma confiável com uma BER abaixo de um valor 
especificado. O parâmetro Q deve ser relacionado com a potência óptica incidente. 
Considerando o caso em que os bits 0 não carregam nenhuma potência óptica, então P0 = 0 
e I0 = 0. A potência P1 nos bits 1 está relacionada com I1 como: 
1 1 rec2I MRP MRP  
em que Prec é a potência média recebida, sendo Prec = (P1 + P0)/2. O ganho APD M é incluído 
na equação por generalidade. Para receptores p-i-n, M = 1. 
19 
 
As correntes de ruído RMS σ1 e σ0 incluem as contribuições de ambos os ruídos shot 
e térmico e pode ser escrita como: 
2 2 1/2
1 0( ) es T T       
em que σs
2 e σT
2 já foram calculadas anteriormente. 
Desprezando a contribuiçãoda corrente de escuro, as variâncias de ruído se tornam: 
2 2
rec2 (2 )s AqM F R P f   
2 (4 / )T B L nk T R F f   
Assim, o parâmetro Q é dado por: 
rec1
2 2 1/2
1 0
2
( )s T T
MRPI
Q
    
 
  
 
Para um valor específico de BER, Q pode ser determinado e a sensibilidade do 
receptor Prec é encontrada. Uma expressão analítica simples para Prec é obtida resolvendo esta 
equação para um dado Q: 
T
rec A
Q
P qF Q f
R M
 
   
 
 
Isso mostra como Prec depende de vários parâmetros do receptor e como ele pode ser 
otimizado. Para o receptor p-i-n (M = 1), como o ruído térmico σT geralmente domina, Prec é 
dada por: 
rec pin( ) /TP Q R 
Da equação, σT
2 depende não só dos parâmetros do receptor, como RL e Fn mas 
também da taxa de bits na largura de banda Δf do receptor (geralmente, Δf = B/2). O 
parâmetro Prec aumenta com √B no limite de ruído térmico. A equação também mostra como 
a sensibilidade do receptor melhora com o uso de receptores APD. 
Se o ruído térmico permanece dominante, Prec é reduzido por um fator de M, e a sensibilidade 
recebida é melhorada pelo mesmo fator. Mas, o ruído shot aumenta consideravelmente para 
APDs, e a equação deve ser usada no caso em que as contribuições do ruído shot e do ruído 
térmico são comparáveis. 
Similarmente ao caso da SNR, a sensibilidade do receptor pode ser otimizada, 
ajustando o ganho APD M. Assim, Prec é mínimo para um valor ideal de M dado por: 
1/21/2
1/2
opt 1
T T
A A
A
M k k
Qq f k Qq f
    
      
    
 
E o valor mínimo é: 
2
rec APD opt( ) (2 / ) ( 1 )A AP q f R Q k M k    
20 
 
Para receptores APD, Prec apresenta uma dependência linear de B, em contraste com 
receptores p-i-n em que a dependência é em √B. Assim, para um receptor ideal no qual σT = 
0, a sensibilidade do receptor é obtida pela definição M = 1 e é dada por: 
2
rec ideal( ) ( / )P q f R Q  
Medidas alternativas de sensibilidade do receptor às vezes são utilizadas, como a SNR 
e o número médio de fótons Np contidos no bit 1. Na ausência de ruído térmico, σ0 ≈ 0, já que 
o ruído shot é insignificante para o bit 0 se a contribuição da corrente de escuro Id é 
desprezada. Uma vez que SNR = I1
2/σ1
2 e Q = I1/σ1 = (SNR)
1/2 no limite de ruído shot, uma 
SNR de 36 ou 15,6 dB é suficiente para obter BER = 1×10-9. 
Como a SNR ≈ ηNp no limite de ruído shot, usando Q = (ηNp)
1/2 a BER é dada por: 
 1BER erfc / 2
2
pN 
Para um receptor com 100% de eficiência quântica (η = 1), a BER = 1×10-9 quando 
Np = 36. A maioria dos receptores ópticos exigem Np ~ 1000 para alcançar um BER de 10
-9, 
pois seu desempenho é severamente limitado pelo ruído térmico. A expressão para BER 
obtida no limite do ruído shot não é precisa, pois é baseada numa aproximação gaussiana 
(não adequada para um pequeno número de fótons). 
 
Limite Quântico da Fotodetecção 
Nesse caso, no limite do ruído shot a distribuição estatística exata (poisson) deve ser 
usada. 
Assim, se Np é o número médio de fótons em cada bit 1, a probabilidade de se gerar m pares 
elétron-lacuna é dada por: 
exp( ) / !mm p pP N N m  
A BER deve ser calculada usando sua definição, em que P(1/0) é 0 já que nenhum 
para elétron-lacuna é gerado quando não existem fótons e P(0/1) = exp(-Np), com m = 0. A 
BER é calculada pela expressão: 
BER exp( ) / 2pN  
Para BER < 10-9, Np deve ser maior que 20 (limite quântico). Esse resultado é 
equivalente em potência usando P1 = NphfB, em que B é a taxa de bits e hf é a energia do 
fóton. A sensibilidade do receptor é então dada por: 
'
rec 1 0 1( ) / 2 / 2 / 2p pP P P P N h B N h B      
A quantidade Np’ expressa a sensibilidade do receptor em termos do número médio 
de fótons/bit e Np’ = Np/2 quando os bits 0 não carregam energia. Toda a análise de 
sensibilidade foi baseada somente no ruído do receptor e no fato de que toda a energia está 
no fluxo de bits 1, sem nenhuma energia para os bits 0. 
21 
 
No entanto, o sinal óptico prático não segue esta situação ideal e pode ser degradado 
durante a transmissão. Um exemplo dessas degradações é o ruído adicionado pelos 
amplificadores, aumentando a potência média mínima necessária na entrada do receptor. 
 
Degradação da Sensibilidade 
Essas degradações são conhecidas como penalidades de potência, existindo 
penalidades que podem degradar a sensibilidade mesmo sem nenhum sinal transmitido. Uma 
fonte de penalidade de potência está relacionada com a potência carregada pelos bits 0, P0, 
que depende da corrente de polarização Ib e da corrente de limiar Ith. 
 
Razão de Extinção 
Esta potência pode ser devida apenas à emissão espontânea (desprezível), e pode ser 
significativa se o Laser é polarizado ao redor, mas acima da corrente de limiar. A razão de 
extinção é definida como: 
ex 0 1/r P P 
A penalidade de potência pode ser obtida por meio do parâmetro Q, dado por: 
ex rec
ex 1 0
1 2
1
r RP
Q
r  
 
  
  
 
Em geral, σ1 e σ0 dependem de Prec. Mas ambas podem ser aproximadas pelo ruído 
térmico σT, quando este é dominante. Assim, usando σ1 ~ σ0 ~ σT: 
ex
rec ex
ex
1
( )
1
Tr QP r
r R
 
  
 
 
Esta expressão mostra que Prec aumenta quando rex ≠ 0. A penalidade de potência é 
definida como a razão δex = Prec(rex)/Prec(0) e é comumente expressa em dB: 
rec ex ex
ex 10 10
rec ex
( ) 1
10log 10log
(0) 1
P r r
P r

   
    
   
 
A figura mostra como a penalidade de potência aumenta com rex. Uma penalidade de 
1 dB ocorre para rex = 0,12, mas tipicamente é menor que 0,05, que é desprezível. Mas a 
penalidade passa a ser significante para correntes de polarização acima da corrente de limiar. 
22 
 
 
Ruído de Intensidade 
Toda a análise até agora é baseada no fato de que a potência óptica incidente no 
receptor não flutua. Entretanto, isso não é verdade porque qualquer luz emitida exibe 
flutuações, o que faz com que haja variações de potência e consequentemente de corrente. 
Assim, a SNR é degradada e é menor que a anteriormente calculada. Uma abordagem simples 
consiste em adicionar um terceiro termo à variância da corrente, de modo que: 
σ2 = σs
2 + σT
2 + σI
2 
em que σI = RPinrI, sendo rI uma medida do ruído de intensidade, que é relacionada ao ruído 
de intensidade relativa do transmissor. 
Ruído de Intensidade 
Por esta análise, o parâmetro Q é reduzido na presença de ruído de intensidade e é necessário 
aumentar a potência recebida para manter a BER. Para simplificar a análise, a razão de 
extinção é assumida como zero. Assim, usando rI = RP1 = 2RPrec, Q é dado por: 
2 2 2 1/2
2
( )
rec
T s I T
RP
Q
   

  
 
em que: 
1/2
rec rec(4 ) e 2s I IqRP f r RP    
Com estes resultados calcula-se a sensibilidade do receptor: 
2
2 2
( )
(1 )
T
rec I
I
Q Q q f
P r
R r Q
  


 
23 
 
A penalidade de potência, definida como o aumento de Prec quando rI ≠ 0, é dada por: 
2 2
10 rec rec 1010log [ ( ) / (0)] 10log (1 )I I IP r P r Q     
A figura mostra a penalidade de potência em função de r
I
 para Q = 6. 
 
A análise precedente assume que o ruído de intensidade no receptor seja o mesmo no 
transmissor. No entanto, isso não é verdade para um sinal óptico se propagando em uma fibra, 
o que torna este parâmetro limitante para sistemas ópticos de longa distância. O cálculo da 
sensibilidade do receptor até agora é baseado no pressuposto de que o sinal é amostrado 
sempre no pico do pulso de tensão. Isso não é verdade na prática, já que o instante de decisão 
é determinado pelo circuito de recuperação de relógio.