






















神经网络引入了一个划时代的的概念:词向量,它把每一个词变成了一组数字(一个高维空间的坐标)。
神经网络是从统计到语义的理解的飞跃。
比如下面这个例子
N-gram 眼里: “国王”和“女王”是两个完全不同的词,就像“国王”和“桌子”一样,毫无关系。因为字不一样。
神经网络 眼里: 它把每个词变成了一组数字(一个在高维空间里的坐标)。
它发现“国王”的坐标和“女王”的坐标靠得很近(都是统治者、人物、有头衔)。
而“国王”和“桌子”的坐标离得很远。
更神奇的是,它还能学到关系:从“国王”到“男人”的向量,几乎等于从“女王”到“女人”的向量。这就是语义关系的数学表达。
让我们来看一个关于“交通与旅行”的场景:
训练数据里有:
考题是:
“一位商人搭乘 轮船前往____。”
N-gram 的反应:
“完蛋,我见过‘坐飞机’、‘坐高铁’,但没见过‘搭乘轮船’这个组合。我更没学过‘前往’后面应该跟哪个城市。这道题我不会,概率为0。”
(它被全新的词语组合卡住了,暴露了数据稀疏和短视的致命伤。)
神经网络的思考过程:
举一反三: 它推理出:“既然‘坐飞机’可以去‘北京’,那么结构相似、意思相近的‘搭乘轮船’,自然也可以去一个和‘上海’类似的大城市。所以空格里填一个地名,比如‘广州’、‘天津’或‘青岛’,都是非常合理。
这就是从“统计”到“语义理解”的伟大飞跃。神经网络不再仅仅记住“什么词和什么词经常一起出现”,而是真正理解了“这个词是什么意思,它和那个词有什么关系”。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。