造价通

反馈
取消

热门搜词

造价通

取消 发送 反馈意见

矢量空间模型局限

2022/07/16138 作者:佚名
导读:向量空间模型有如下局限: 不适用于较长的文档,因为它的相似值不理想(过小的内积和过高的维数)。 检索词组必须与文档中出现的词组精确匹配;词语子字串可能会导致“假阳性”匹配。 语义敏感度不佳;具有相同的语境但使用不同的词组的文档不能被关联起来,导致“假阴性匹配”。 词组在文档中出现的顺序在向量形式中无法表示出来。 假定词组在统计上是独立的。 权重是直观上获得的而不够正式。 然而,这些局限中的多数能够

向量空间模型有如下局限:

  1. 不适用于较长的文档,因为它的相似值不理想(过小的内积和过高的维数)。

  2. 检索词组必须与文档中出现的词组精确匹配;词语子字串可能会导致“假阳性”匹配。

  3. 语义敏感度不佳;具有相同的语境但使用不同的词组的文档不能被关联起来,导致“假阴性匹配”。

  4. 词组在文档中出现的顺序在向量形式中无法表示出来。

  5. 假定词组在统计上是独立的。

  6. 权重是直观上获得的而不够正式。

然而,这些局限中的多数能够通过集合各种方法来解决,包括数学上的技术(比如奇异值分解)和词汇数据库(比如WordNet)。

*文章为作者独立观点,不代表造价通立场,除来源是“造价通”外。
关注微信公众号造价通(zjtcn_Largedata),获取建设行业第一手资讯

热门推荐

相关阅读