张柯论文指导

张柯论文指导考试资料
当前位置:张柯论文指导 > 毕业论文答疑 >

Query Rewriting查询改写方案汇总

2026-05-22 张柯论文指导

1.背景

在目前主流的语义查询中,query的质量直接影响搜索召回的关联结果。

由于用户的查询输入对于服务者来说是不可控的,而不同的query质量直接影响不同的召回结果。一般查询语句中会出现各种各样的意图问题,比如不明确、混淆、错误之类的,查询重写旨在通过一系列手段修正query的错误,提高query的质量,以尽可能准确的识别用户的查询意图,匹配到关键的召回结果。

针对Query进行处理其实是一个在搜索系统中比较常见和有历史的工程手段了,它们一般基于固定的规则和流程实现。

整个Query处理的流程

Query Rewriting是对Query进行处理的一种方式,实际上对query进行的操作,或者关联query的大部分操作都可以归类于Qeury Rewriting这类里。

以下将把短查询和长查询的处理分开介绍,原因是短查询本身往往没有那么多语义信息,而且意图并不准确,实际上处理方式都是数据增强,对query进行不同程度的扩写,相当于补充上下文,而不同的短查询有各自的特征,这些特征决定了数据增强的方案。而长查询往往能够有一个相对精确的语义和意图,只是可能仍然存在语义信息不足的问题,需要对原文进行补充的同时不破坏原先的语义。

简单来说,针对短查询和长查询的处理思路核心分别是“揣测”和“解释”,短查询由于没有明确上下文和语义信息,需要去猜测最可能的意图,长查询有一定的上下文和相对精准的语义信息,只需要扩充和补充说明或者纠正。

2.短查询数据增强

2.1.意图多样

意图多样是指短查询提供的词或短语可能存在多种不同的意图,这个query在不同的语境中有不同的含义和不同的关联,或者可以指代语义跨度大的物或事件。

例如,query输入为“周杰伦”时,可能的表示是“周杰伦 歌曲”,“周杰伦 mv”,“周杰伦演唱会”,“周杰伦 新闻”等等,甚至在搜索集中存在重名的人或物或者同名不同意的名词时,都会出现。

这里的解决方法实际是针对单个名词进行分类,以扩写对应种类的query,比如上例的“周杰伦”,可能指代的一系列表述。

2.2.意图不清

意图不清是指短查询提供的词或短语存在意图,但表述不够清晰或错误而导致完全错误的结果或无关的结果。

如果需要论文指导,可联系网站客服!

学员评价

随机文章
最新文章
长按复制 bbapay 加微信!