图计算引擎——将关联分析发挥到最有效

预测是人工智能未来的发展方向之一,而关联分析是预测能力的核心。关联分析,是一种简单、实用的分析技术,用于发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。通过关联分析,可从数据库中找到如“由于某些事件的发生而引起另外一些事件的发生”之类的规则。唐代诗人孟浩然“夜来风雨声,花落知多少”的诗句,之所以夜闻风雨声会联想到花落,便是日常经验中将两者关联,生活中常见的群燕底飞雨临近,一场秋雨一场寒都是同样的效果。

放到商业场景中,如果通过关联分析得出“70%的顾客在购买牛排时会购买黑胡椒”,那么通过合理的牛排和黑胡椒的货架摆放或捆绑销售,便可提高市的服务质量和效益。又如同“学习素描的同学在学习服装设计时优秀的可能性达86%”,那么就可以通过设立素描课程来提高服装设计教学效果。企业在数字化进程中,常利用关联分析来测算消费者与品牌、产品、KOL及其他消费者之间的关系,并预测需求和喜好,给出下一步的营销建议,实现以人为本的驱动商业流程优化,提升效率的同时增加效益。

作为一切预测的基础,当关联分析面对海量数据的时候,在众多维度的影响下,两个因素的关联关系会有很多的到达路径,而处理复杂的到达路径,就需要强大的分析引擎,图计算应运而生。“图计算”是以“图论”为基础的对现实世界的一种“图”结构的抽象表达,以及在这种数据结构上的计算模式。图数据结构很好的表达了数据之间的关联性(  dependencies between data  ),通过获得数据的关联性,可以从噪音很多的海量数据中抽取有用的信息。比如通过为购物者之间的关系建模,就能很快找到口味相似的用户,并为之推荐商品;或者在社交网络中,通过传播关系发现KOL

类似这样复杂的关联性计算涉及的客户数据源涵盖了自媒体行为,关系,内容。企业内部营销,销售,售后数据,以及其他第三方和广告投放数据等,数据来源结构复杂,这就要求底层图计算能力具备以下三点技术能力:

一、实时性

首先是对计算速度的要求。曾有公司进行社交用户推荐,对于5000万注册用户,50亿关系对,利用10台机器的集群,需要10个小时以上的计算。这显然无法应对实时更新的用户数据,最终给出的营销策略也在时效性和准确度上大打折扣。因此,对于大数据量的实时计算就成为了一个挑战。而企业个性化营销往往是基于用户行为数据的变化实时触动的,这就需要服务器端在毫秒级别内给出个性化的预测结果。

二、灵活性

营销的核心是研究“人”,营销人员对智能算法与模型的需求也会随用户动向及业务需要进行不断的新增或调整,因此需要底层的图计算高度灵活,以适应不同算法模型的数据计算。

三、具备预测能力

于营销来说“预测性”分析不仅仅是发现营销的好坏,更重要的是发现为何好,以进行优化。比如“归因分析”和“相似人群”等预测性模型,都需要关联计算的支持。因此,就要求图数据库不仅只是支持图数据结构的读取访问,更需要对于大数据量的关联计算支持。

时趣的CrowdGraph内存图计算引擎专利,毫秒级的计算速度,协助企业实现多属性过滤搜索排序,支持群体消费者实时洞察及消费者的实时个性化营销操作,为营销领域的企业数字化进程提供强大的底层支持。