Alibaba Innovative Research (AIR) > Big Data & Data Mining
复杂电商环境的预测技术(神算子平台2.0)

业务背景

电商平台几大组成要素:商品、商家、用户,构建了复杂的大规模图关系网络。优质上的商家和商品可以为平台不断增加新的供给,促进平台生态的良
性循环。在一期项目中,我们围绕淘系平台商品成长的全生命周期新品孵化、趋势成长、爆款打造开展研究工作,在新品冷启动情形下挖掘优质的新品,基
于兴趣人群偏好预测商品趋势,并且在大促场景中通过对主推款商品GMV的准确预测,指导商家的库存备货优化和电商平台的流量分配,提升平台效率。
上述研究工作在实际业务中初见成效,随着淘系电商平台的纯线上形式到o2o等线上线下结合的新场景的延伸发展,我们希望可以将神算子平台在淘系
场景上的一系列预测能力赋能到新场景上,然而在新的场景应用中也面临着诸多新的挑战。
1. 首先从新商户的角度,平台需要新的优质供给对线上的商家进行补充,平台上的这些新商家往往是从线下的店铺转化而来,如何从线下商家中识别出好
的商家,并转化成平台的线上优质商家是急需解决的问题。然而在o2o场景里平台起初能获取到的线下店铺信息非常有限的,依赖大量人工获取的非结构化
信息,而且由于线下餐饮等商户生命周期较短,数据往往又是含噪声的,同时店铺可能在其他平台有经营活动,能获取的信息又是不完备的,因而如何准确
评估新商户未来入驻平台之后在平台上的产能表现是非常挑战。
2. 此外,随着商家在平台上的成长,如何识别平台上的优质壁垒商家,帮助这些商家更好的在平台发展,并通过这些优质商户扶持,识别它们对应的忠实
用户群体,对增强用户的平台黏性,预防优质商家的流失对平台都非常重要。不同于淘系的用户商家之间的关系模式,商户往往具有地域性特点,因而其所
能触达的用户范围往往还受限于其出餐能力,物流配送履约能力等等,用户的流动性也更强,因此准确识别区域性的优质商户和其对应的忠实用户人群仍然
是具体挑战的问题。
3. 最后,从平台流量分配的角度,o2o场景下的流量分配也比淘系场景更具挑战,区域流量、用户需求、商品产能以及物流服务能力之间都是相关联的。
为精细化分配流量资源,往往需要在具体线下配送路径粒度上更实时的单量预估,从而更好的预估区域的物流压力,进行流量调节,通过保持物流履约能力,
保障用户的体验,并尽可能提升成交单量等全局目标。在此复杂环境下的流量调控仍然非常挑战。
综上本研究旨在解决新老商家预估、忠实用户人群挖掘、实时单量预估等一系列的重要预测问题,以加强商家商品的理解和用户的理解和优化流量分配,
从而在大规模平台流量中提升平台效率和用户体验。

拟解决问题

1.研究目标
(1)大规模图关系网络中新商家的表征和预估问题
设计一个多源异构空间表征技术模型,可以同时对新商家的效率和产能预估等多个任务进行有效的表达和预估。在线上行为完全缺失的情形下,如何根
据线下有限的知识去构建关系网络来预估线上的表现。同时,由于外卖场景较强的地域特性,预估模型中如何引入时空关系,综合考虑时间周期、空间距离、
区块属性、邻接关系以及区域用户等多源多域信息,从而挖掘优质新签商户。
(2)图网络表征技术在商户价值预估和人群挖掘的应用
设计一个大规模商户表征学习模型,可以同时对商家产能、商家复购率等多个预测任务进行高效和鲁棒的预测。在商户的表征中,引入人群偏好、用户
重要性等信息,提升不同目标类型的相关性表达。在商家表达中,如何利用图嵌入技术对稀疏特征和跨域人群偏好特征进行有效的表征,从而挖掘出不同类
型商家中的隐层相关性信息。针对不同商户,通过图关系网络学习用户表达,通过图嵌入技术深度理解用户和用户行为表达,识别商户的忠实用户人群。
(3)大规模图网络上的实时单量预估和流量调控优化
在进行商户的流量分配和物流资源分配时,根据用户行为实时预估在实际配送路径OD(起点O:商户簇,终点D:用户簇)上未来一段时间内的成交单
量,帮助精细化识别区域上的物流配送压力,进行更准确的预估,通过含约束的多目标优化问题建模,在流量分配时在保障物流服务用户体验的同时,优化
流量分配提升流量效率。
2.研究方向和内容
(1)基于深度网络学习的新商户冷启动预估
A.基于统一商品表达的多任务学习方法
a)如何定义在线上数据完全缺失以及线下知识有限的场景中基于销量预测的一系列复杂场景预测问题。
b)在更复杂的口饿场景中,不仅要考虑短期和长期时序特征,同时如何兼顾时空信息,地域特性,品类稀缺性,用户口味偏好等多源知识的
表达是需要被进一步研究的问题
(2)图网络场景下的商户价值和人群挖掘技术
A.大规模图网络在商户表达中的实现方法
a)在口饿场景中的线上商户,如何设计一个面向复杂场景的商家表征学习深度神经网络,利用大规模用户-商品购买记录,将购买人群信息嵌
入到商家表达中,来提升商加表达中用户偏好的作用,使得商户表达能够有效应用于多个预测任务目标,如产能、用户复购率等进行联合
预估。
b)如何设计大规模图网络上的图嵌入学习算法,结合品类区域等特征信息,通过商家节点和对应用户的向量化表达,识别商家的忠诚用户人
群。
(3)大规模行为网络上的实时成交单量预估和流量调控优化
A.图网络上的实时成交单量预估
a)在口饿场景对模型实时性要求进一步提高,对于流量调控场景,如何优化商户和用户的表征,设计一个下单概率预估模型,实时预估各个
商家-用户对聚合形成的OD路径上未来一段时间内的成交单量。
B.复杂约束环境下的流量调控优化
a)在单量预估基础上,结合物流压力等复杂约束,研究多渠道流量分布优化问题,同时兼顾单智能体的ROI、用户体验、商业目标,以及全局
优化目标等。

期望交付物

1、通过本项目的研究,有望对不同生命周期的商品和商家进行系统性的分析和建模,设计搭建一套适用于大规模移动互联网服务系统中的预测问题的通用智能预测算法框架
2、输出通用智能预测算法框架的相关算法包源代码
3、论文:在国际顶会、期刊上发表2篇高质量论文(如:KDD、ICDE、CIKM、IJCAI等级别会议)
4、专利:完成发明专利1项
5、形成一个在复杂环境下大数据分析和预测的算法平台,并推广核心算法在不同场景中的落地和应用 ,在阿里巴巴集团进行推广

Scan QR code
关注Ali TechnologyWechat Account