hero

正在加载一言...

Blake Chan

Be the change you wish to see in the world.

2021-08-31

Attention / Conv 大锅烩

Self-Attentions and Convolutions

长期记录和实现看过的各种论文里的自注意力和卷积机制

2021-07-28

自然梯度下降

Natural Gradient Decent

自然梯度下降(Natural Gradient Decent)把参数看成一种概率分布,然后使用 KL 散度而不是欧氏距离来作为距离的度量,从而更好地描述更新后的分布和原分布有多大的不同。

2021-07-27

Fisher 信息矩阵

Fisher Information Matrix

Fisher 信息矩阵的数学意义和直观上的理解。