基于KL散度和近鄰點間距離的球面嵌入算法
大小:0.75 MB 人氣: 2017-12-05 需要積分:2
標簽:嵌入算法(6413)
針對現有球面嵌入算法在非近鄰點間的距離度量不準確或缺失的情況下,不能有效地進行低維嵌入的問題,提出了一種新的球面嵌入算法,它能夠只利用近鄰點間的距離,將任何尺度的高維數據嵌入到單位球面上,同時求出適合原始數據分布的球面半徑。該算法從一個隨機產生的球面分布開始,利用KL散度衡量每對近鄰點間的歸一化距離在原始空間和球面空間中的差異,并基于此差異構建出目標函數,然后再用帶有動量的隨機梯度下降法,不斷優化球面上點的分布,直到結果穩定。為了測試算法,模擬產生了兩類球面分布數據:分別是球面均勻分布和球面正態分布的數據。實驗結果表明,對于球面均勻分布的數據,即使在近鄰點個數很少的情況下,仍然能夠將數據準確地嵌入球面空間,嵌入后的數據分布與原始數據分布的均方根誤差( RMSE)低于0.000 01,且球面半徑的估算誤差低于0. 000 001;而對于球面正態分布的數據,在近鄰點個數較多的情況下,該算法也可以將數據較準確地嵌入球面空間。因此,在非近鄰點間距離缺失的情況下,所提方法仍然可以較準確地對數據進行低維嵌入,這非常有利于數據的可視化研究。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%