W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
renyi_ratio ( log_p , q , alpha , z = None , n = None , seed = None , name = 'renyi_ratio' )
定義在 tensorflow/contrib/bayesflow/python/ops/entropy_impl.py
參見指南:貝葉斯熵(contrib)>操作
使用 Monte Carlo 估計出現(xiàn)在 Renyi 分歧中的比率.
這可以用于計算 Renyi(alpha)分歧,或者基于 Renyi 分歧的日志痕跡近似值.
用 z_i 獨立同分布樣品 q,和 exp{log_p(z)} = p(z),這操作返回查看(偏向有限個 n)估計:
(1 -alpha)^ { - 1 } Log[ n^{- 1} sum_ {i = 1 } ^ n ( p(z_i)/q(z_i))^ {1-alpha} \approx(1-alpha)^ {- 1 } Log[ E_q [( p(Z)/q(Z))^ { 1 - alpha }]]
該比例出現(xiàn)在不同的上下文中:
如果 log_p(z) = Log[p(z)] 是分配的日志概率,并且 alpha > 0,alpha != 1 ,那么該操作近似于 -1 倍仁義分歧:
# 選擇合理的高 n 來限制偏移,見下文 renyi_ratio ( log_p , q ,alpha,n = 100 ) \approx - 1 * D_alpha [ q || p ] ,where D_alpha [ q || p ] := (1 - alpha)^ {-1} Log E_q [(p(Z)/q(Z))^ { 1 - alpha} ]
Renyi(或 “alpha”)的分歧是非負(fù)數(shù),并且當(dāng)且僅當(dāng) q = p 時它等于零;alpha 的各種限制導(dǎo)致不同的特殊情況:
alpha D_alpha[q||p] ----- --------------- -- > 0 Log[int_ {q >0} p(Z)dz] = 0.5 , -2 Log[ 1- Hel^ 2[q||p]] ,(\propto squared Hellinger distance) -- > 1 KL[q||p] = 2 Log[1 + chi ^ 2[q||p]] ,(\propto squared Chi - 2 divergence ) -- > infty Log[max_z{q(z)/ p(z)}] ,(min description length principle).
如果 log_p (z) = log [p (z, x)] 是聯(lián)合分布 p 的日志,這是在變分推理中常見的 ELBO 的一種替代方法.
L_alpha( q ,p )= Log[p(X)] - D_alpha[q||p]
如果 q 和 p 有同樣的支持,并且 0 < a <= b < 1,則可以顯示出 ELBO <= D_b <= D_a <= Log[p(x)].因此,該操作允許 ELBO 和真實證據(jù)之間進(jìn)行平滑的插值.
請注意,當(dāng) 1 - alpha 值不小的時候,比例 (p(z) / q(z))^{1 - alpha} 會受到下溢/溢出問題的影響.因此,它在集中后在對數(shù)空間中進(jìn)行評估.盡管如此,infinite / NaN 的結(jié)果還是會出現(xiàn).為此,人們可能希望 alpha 逐漸縮小,見操作 renyi_alpha;使用 float64 也將有所幫助.
由于對數(shù)的非線性,對于隨機變量{X_1,...,X_n},有 E[ Log[sum_{i=1}^n X_i] ] != Log[ E[sum_{i=1}^n X_i] ].結(jié)果,這個估計是有限偏移的 n.對于 alpha < 1 ,它是不減少的 n(預(yù)期中).例如,如果 n = 1,此估計器產(chǎn)生與 elbo_ratio 相同的結(jié)果,并且當(dāng) n 增加的時候,估計的預(yù)期值也增加.
用戶提供 Tensor 樣品 z 或 樣品數(shù)量來繪制 n.
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: