通过召回率看策略产品的工作

1.策略质量评估

1.1在全体对象中随机抽样

在后台随机抽取了200个query

1.2样本进入策略得到计算结果

策略识别为天气需求:36


1.3人工标注样本

天气需求:33


1.4对比:计算出召回率以及准确率

策略识别有误的案例数:7
策略识别正确的案例数:29


策略识别忽略的案例数:4


召回率 (代表策略对问题的解决程度)
= 希望被覆盖的案例中,策略实际覆盖到的案例 / 理想态下希望策略覆盖的案例
= 29 / 33 = 0.88%
准确率 (代表策略有没有带来其他伤害)
= 策略覆盖的案例中,真正希望被覆盖的 / 策略覆盖的所有案例
= 29 / 36 = 0.80

2.问题分析

2.1产品目的

能够准确解析query可能存在的用户需求,帮助下一步检索。

2.2存在问题

通过人工标注和随机抽样结果分析可得,识别策略存在的问题可以概括为:

系统识别出来,但是错了。query中都存在目标词,但是用户的搜索需求并非查找天气。集中出现两类问题:第一类是断句不当;第二类是需求理解判断不当。


case1:男朋友今天气死我了
这query中存在连续的“天气”一词,但是结合整个句子来看,明显是与“天气”没有联系。存在的问题是切词有误。正确切词方式为:男朋友/今天/气死我/了。
case2:爱上你的好天气
爱上你的好天气,这个query是一个完整的歌曲名称。根据搜索结果页的操作点击链接类型可以判断,对于该query,用户更大概率是要查找歌曲。

系统没有识别出来的query。这类case的特点是,没有出现明确的搜索关键词,但其实是通过侧面的描述,反映用户想要了解天气的需求。


case1:去华山需要准备什么衣服
用户没有直接搜索华山最近天气如何,但其实准备什么衣服与当时的天气关联度很大。
这类query存在明确的地点信息,有明确诉求如穿衣,衣服,并且一般是带疑问句性质。

2.3策略优化目标

1.优化存在明确类目词时,搜索词的解析规则;
2.把搜索结果点击操作反馈历史数据作为query分析的一个维度,让对需求的把握更准确。
3.优化query切词方案;

3.项目计划

3.1项目收益分析

3.2优先级排序

如上述分析,综合考虑问题的影响面,解决程度以及开发成本,方案2为优先级最高的项目,接下来是优化切词的方案,最后是搜索词解析规则优化项目。

4.需求文档

4.1背景

近期,接收到客服部门反映,用户对于当前搜索结果不太满意。为此,策略PM介入,通过阶段性调研以及抽样分析的方法,找出问题原因并提出优化方案。

4.2需求概述

改善目前系统对于搜索词的需求识别策略,提升query的召回率以及准确率。

4.3需求详述

需求1

问题:query中包含目标搜索词,但从整个query看,有权重更高的搜索结果。
解决方案:把搜索结果点击操作反馈历史数据作为query分析的一个维度。通过分析历史搜索结果数据,判断用户是要搜索整个query。

需求2

问题:中文分词,在不同颗粒度下能有不同的切词方式,对搜索结果的理解产生偏差。
解决方案:当query能产生多种颗粒度切词方式时,构建索引时使用细粒度的分词以保证召回,在查询的时候使用粗粒度的分词以保证精度。

需求3

问题:没有出现明确的搜索关键词,但其实是通过侧面的描述,反映用户想要了解天气的需求。
解决方案:在搜索词解析规则中,加入口语词汇作为标识。解析时,如遇到标识的口语词,则把query按照预设的规则进行转义操作。
困难:由于这项工作涉及大量的规则定义,在2周的开发期内不能保证完成,因此,这个需求的优先级较低,不纳入本次开发计划中。

4.4统计需求

核心指标:query召回率与准确率
观察方法:从系统中随机抽取200条数据,在优化后的策略系统中运算一次,把召回率与准确率与优化前作对比。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容