* 本报告来自网络,如有侵权请联系删除
数字经济下的算法力量
收藏
纠错
价格免费
数据简介
大数据时代,知识是基础,工具是撬动业务的力量。通过此文,你不仅可以学习到理论知识,还能一窥阿里算法工程师解决问题的思维逻辑。究竟资深专家是如何深入到模型最深处,用数值分析和理论证明给出严谨的答案?在这里,你能找到答案。
详情描述
数字经济下的算法力量 在线学习(Online learning) 由于能捕捉用户的动态行为,实现模型快速自适应,进而成为提升推荐系统性能的重要工具。然而它对链路和模型的稳定性,训练系统的性能都提出了很高的要求。但在基于原生TensorFlow,设计Online推荐算法时,我们发现三个核心问题: 一些资讯推荐场景,需要大量长尾词汇作为特征,需使用featuremap对低频特征频次截断并连续性编码,但耗时且方法aggressive。 使用流式数据后,无法预知特征规模,而是随训练逐渐增长。因此需预留特征空间训练几天后重启,否则会越界。 模型稀疏性不佳,体积达到数十GB,导致上传和线上加载耗时长且不稳定。 更重要的是,在线学习如火如茶,当流式特征和数据都被打通后,能按需增删特征,实现参数弹性伸缩的新一代训练平台成为大势所趋。为了解决这些问题,从2017年底至今,蚂蚁金服人工智能部的同学,充分考虑蚂蚁的业务场景和链路,对TensorFlow进行了弹性改造,解决了 以上三大痛点,简化并加速离线和在线学习任务。其核心能力如下: 弹性特征伸缩体系,支持百亿参数训练。 group_lasso优化器和频次过滤,提高模型稀疏性,明显提升线上效果。 模型体积压缩90%,完善的特征管理和模型稳定性监控。 在与业务线团队的共同努力下,目前已在支付宝首页的多个推荐场景全流量上线。其中某推荐位的个性化online learning桶最近一周相比线上多模型融合最优桶提升4.23%,相比随机对照提升达34. 67%。某个性化资讯推荐业务最近一周,相比DNN基准uv-ctr提升+0.77%,pv-ctr 提升+4.78%,模型体积压缩90%,链路效率提升50%。 【更多详情,请下载:数字经济下的算法力量】
报告预览
*本报告来自网络,如有侵权请联系删除