文本匹配2
文本匹配从词向量到句向量(SIF)
获取sentence embedding最直接最简单的思路就是对一个句子中所有词的word embedding进行组合。这种方法最明显的缺点是没有考虑词序信息,但是足够简单高效,在一些任务上是很好的
...
文本匹配从EMD、WMD到WRD:文本向量序列的相似度计算
在NLP中,我们经常要去比较两个句子的相似度,其标准方法是想办法将句子编码为固定大小的向量,然后用某种几何距离(欧氏距离、cosine距离等)作为相似度。这种方案相对来说比较简单,而且检索起来比较快
...