搭建搜索词评估体系的简单实践

搜索功能作为C端用户的重要路径,搜索行为对应的信息获取成本及效果会直接影响用户的使用体验,所以针对搜索词做定期评估是非常重要的。这篇文章会简单说一些搭建搜索词评估体系的关键指标,具体的评估细节还要视具体的业务形态而定。

01

确定评估范围

明确产品对标的竞品,并确定抽取搜索词规则,一般都是随机抽取评估。

02

评估场景

衡量用户在什么场景下发起的搜索及回答效果。比如下方的主动搜索场景,针对用户输入的搜索词,搜索词纠错、召回结果排序、是否有badcase等,这些都是评估体系的打分标准之一。

搭建搜索词评估体系的简单实践-传播蛙

03

确定核心评估指标

一般以GSB指标作为评估效果反馈。GSB的名称叫做Good: Same: Bad,每次进行随机词抽取,然后进行人工GSB评估,如果效果好就会把当前的搜索词评估为Good,如果效果持平那么就是Same,否则就是Bad。

04

打分标准

搭建搜索词评估体系的简单实践-传播蛙

05

评估细项

搭建搜索词评估体系的简单实践-传播蛙

06

评估效果总结

除了上面的人工GSB评估,AB实验和日常核心指标如换Query率,有点比,点击位置等监控,作为后验指标也是评估体系的一部分。想要搭建完整的评估体系是需要跟自身业务相结合的,很难总结出标准模版可以直接落地,只能针对公司业务场景变化多端不断迭代升级。我们只能尽量不断完善评估体系,来帮助去量化策略及算法效果,得到相对靠谱置信的结论。

来源:一个数据人的自留地

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧