目录
-
Learning to Rank(LTR)在高德的尝试
-
应用场景
-
详细方案
-
具体效果
Learning to Rank(LTR)在高德的尝试
应用场景

-
高德地图每天的访问量巨大,这背后隐藏的候选POI更是一个天文数字,想要使用人工标注的方法去获得样本明显不现实。 -
如果想要使用一些样本自动构造的方法,比如基于用户对POI的点击情况构建样本pair <click, no-click>,也会遇到如下的问题: -
容易出现点击过拟合,以前点击什么,以后都给什么结果。 -
有时,用户点击行为也无法衡量真实满意度。 -
Suggest前端只展示排序Top 10结果,更多的结果没有机会展现给用户,自然没有点击。
详细方案




-
交叉特征query-click的缺失程度较高,60%的样本该特征值为0。该特征的树节点分裂收益较小,特征无法被选择。然而,事实上,在点击充分的情况下,query-click的点击比city-click更接近用户的真实意图。 -
对于文本相似特征,虽然不会缺失,但是它的正逆序比较低,因此节点分裂收益也比city-click低,同样无法被选择。
-
对稀疏特征的样本、低频query的样本进行过采样,从而增大分裂收益。优点是实现简单,但缺点也很明显:改变了样本的真实分布,并且过采样对所有特征生效,无法灵活的实现调整目标。 -
调loss function。按两个样本的特征差值,修改负梯度(残差),从而修改该特征的下一轮分裂收益。例如,对于query-click特征非缺失的样本,学习错误时会产生loss,调loss就是给这个loss增加惩罚项loss_diff。随着loss的增加,下一棵树的分裂收益随之增加,这时query-click特征被选作分裂节点的概率就增加了。具体的计算公式如下式:

具体效果
-
机器学习在高德搜索建议中的应用优化实践(https://developer.aliyun.com/article/708264)
如喜欢本文,请点击右上角,把文章分享到朋友圈
·END·
作者:钱魏Way
来源:www.biaodianfu.com/amap-suggestion-optimization-practice.html
版权申明:内容来源网络,仅供分享学习,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!
关注公众号,回复关键词:架构师
获取2T架构师学习资料
本篇文章来源于微信公众号:架构师指南
原创文章,作者:software,如若转载,请注明出处:https://www.sldh123.com/1377.html