Há um certo prazer em perceber que um objeto complicado, quando observado sob a lente correta, revela uma estrutura surpreendentemente simples.

Recentemente, estive pensando a respeito de combinações lineares de variáveis qui-quadrado e gamma. À primeira vista, trata-se de um problema que parece condenado à complexidade: somas de variáveis gamma independentes, em geral, não admitem formas fechadas elegantes. Em vez disso, somos conduzidos a convoluções, funções especiais e expressões que existem mais no papel do que na prática.

Mas há uma mudança sutil de perspectiva que transforma completamente o problema.

Em vez de perguntar:

“Qual é a forma exata da distribuição?”

perguntamos:

“Como essa distribuição se comporta localmente, perto de zero?”

Essa mudança — de global para local — é o ponto central.


A estrutura escondida

Considere uma soma:

$$ S = T_1 + T_2 + \cdots + T_n $$

onde cada $ T_j \sim \text{Gamma}(a_j, \lambda_j) $.

A densidade de $ S $ é uma convolução de densidades gamma. Em geral, isso não simplifica. Mas, surpreendentemente, quando olhamos para valores pequenos de $ x $, algo notável acontece.

A distribuição começa a se comportar como se fosse uma única variável gamma.

Mais precisamente, para $ x $ pequeno:

$$ f(x) \approx C \cdot x^{|a|-1} e^{-\mu x} $$

onde:

  • $ |a| = a_1 + \cdots + a_n $
  • $ \mu $ é uma média ponderada dos parâmetros $ \lambda_j $

Por que isso acontece?

Uma forma de entender isso é observar que a convolução pode ser reescrita de maneira mais estruturada. Existe uma representação (implícita no post) que escreve a densidade como:

$$ f(x) = x^{|a|-1} \cdot \mathbb{E}\left[e^{-x(\lambda \cdot U)}\right] $$

onde $ U $ vive em um simplex (relacionado a uma distribuição do tipo Dirichlet).

Ou seja, estamos essencialmente calculando uma média de exponenciais.

Agora, quando $ x $ é pequeno, podemos usar a expansão:

$$ e^{-x(\lambda \cdot U)} \approx 1 - x(\lambda \cdot U) + \cdots $$

E aqui surge o ponto crucial: o termo dominante depende apenas da média de $ \lambda \cdot U $, que leva diretamente ao parâmetro $ \mu $.

Em outras palavras:

A soma de gammas, perto de zero, “esquece” sua complexidade interna e passa a se comportar como uma única exponencial média.


Um exemplo concreto

Considere:

  • $ T_1 \sim \chi^2(5) $
  • $ T_2 \sim \chi^2(3) $

Após reparametrização como gammas:

  • $ a_1 = 5/2 $, $ \lambda_1 = 1 $
  • $ a_2 = 3/2 $, $ \lambda_2 = 1/2 $

Temos: $$ |a| = 4, \quad \mu = \frac{13}{16} $$

Então, para valores pequenos de $ x $:

$$ f(x) \approx c \cdot x^3 e^{-\frac{13}{16}x} $$

O mais interessante aqui não é apenas a forma, mas o fato de que essa aproximação é quantificável: fornece limites de erro explícitos que permitem determinar exatamente até onde essa aproximação é confiável.


Comparação com Satterthwaite

Existe uma aproximação clássica (Satterthwaite) que também substitui a soma por uma única gamma. Mas ela é calibrada para capturar média e variância — ou seja, o comportamento global.

Isso sugere uma visão mais ampla:

Não existe “uma” boa aproximação — existem aproximações naturais em diferentes regimes.


Uma observação importante

Se removermos o termo exponencial e mantivermos apenas:

$$ f(x) \approx x^{|a|-1} $$

a aproximação ainda funciona — mas apenas em um intervalo muito menor.

Isso reforça uma lição recorrente:

Pequenos termos negligenciados em teoria podem ter grande impacto na prática.


Conclusão

O resultado principal pode ser resumido assim:

Uma soma de variáveis gamma independentes, apesar de sua complexidade global, possui uma estrutura local extremamente simples.

Essa simplicidade não é acidental — ela emerge de forma robusta da estrutura da convolução e da regularidade das exponenciais.

E talvez essa seja a principal lição aqui:

Muitas vezes, a maneira mais eficaz de entender um objeto complicado não é tentar descrevê-lo completamente, mas sim entender como ele se comporta em regimes específicos.

Pequeno $ x $, neste caso, é suficiente para revelar toda a essência.