中台的困境​及破局思考

前台,平台,中台的定义&区别

没有对错,只有选择

前些年,阿里比较强调中台的建设,希望大力投入资源去建设中台,以便能够高效解决众多不同业务的共性,底层的效率问题。这两年不怎么提这个概念了,因为很多时候大家也会比较担心中台可能会带来更多的沟通成本,或者是担心中台不太能适应业务定制化的场景需要额外的开发代价和成本。

业务前台

一般情况下,我们认为业务前台就是具体针对业务的产研。这样的团队对最终的业务指标负责,比如说商业化的收入,大搜索/推荐的流量,增长的日活等。

业务前台很多时候会快速的针对业务的特点去做定制,他们会为了探索更好的模式,快速的进行尝试,甚至不断地调整方向,以最快的速度以及最好的投入产出比去推进项目。

平台

平台一般是解决某个部门的共性问题所建立的团队,他们会去解决BU内部相似的问题,以便产出能够在BU内部为多个业务所使用,其目标解决BU级别的共性问题,提升BU的整体效率。例如某个应用的UGC可能涉及到评论, 或者其他用户反馈, 此时审核平台都需要统一支持审核需求。

中台

中台则是解决大型企业各个部门甚至是不同子公司的共性问题而设立的团队,他们的目标是对更底层的基础设施进行抽象,以期望这些设施能够在各个子公司都能够进行复用,提升公司OR集团的整体效率。

图:业务前台,平台,中台区别。一般平台+某个使用该平台较多的业务前台会由同一人来负责,这样的组织叫做L形组织,如红框部分。

各自解决的问题

前台业务,就是解决具体的业务问题,他是高度定制化的,需要快速进行模式的尝试。如果需要,整体的业务模式都可能很快进行调整。它解决的是模式问题,所以其特点就是高度定制,快速试错。

而平台和中台更多的解决的更大范围的是效率问题,他们的出发点是希望在进行模式探索的时候,能够将平台或者中台当做乐高或者积木组件,能够快速的去组建新的探索模式。

但很多时候,事与愿违:中台做了之后,前台业务不愿意用,经常出现的情况有两种:

  1. 要么就是前台业务,觉得中台根本就不理解业务,很多功能都不支持,如果需要在中台中去加定制的逻辑,中台不愿意或者需要的开发成本比较高,开发周期比较长,业务前台觉得还不如自己去开发来的快,效果更好。

  2. 另外一种就是前台业务,在初期的时候觉得中台能解决一切问题,等在使用的时候发现不是那么回事,就会觉得中台做的比较烂,以后就再也不用了。

导致以上两种情况的原因,是因为中台不是万能的,它所解决的问题是有一个边界的,不属于这个边界之类的问题状态是不能很好支撑的,但是业务方并不太理解。所以中台以及平台一定要定义好自己的边界,有所为,有所不为,并且需要让业务方尽早知道这一点。

中台注定难做

绩效评估体系的‘锅’

以我的经验,中台注定非常难做。搜推广这样的前台业务,或者大数据平台dmp这样的平台系统我都做过。这一点我体会比较深一些。最直接的感受就是:平台OR中台,真心难做!

原因很简单:公司是非常强调投入产出比的组织,很多时候,对于产出的衡量,更偏向于业务指标。因为业务指标更客观,更容易和公司的目标绑定。但中台最终对公司业务目标是间接关系,产出内容就不太容易客观的衡量。这就导致从绩效评估体系的角度就天然重视前台业务。

前台业务比较像球场上的一个前锋,而平台中台更像是一个后卫。我们可以清晰的衡量一个前锋进了多少球,但我们很难衡量一个后卫对进球的贡献;同时,从另一个角度,我们经常听说某某明星球员转会会费高达XX亿,这样的明星绝对是一个前锋,很少听说一个后卫有天价的转会费用。

例如,数据平台产生的数据用到业务当中,结合业务的策略OR算法上线,如果运气比较好:上线效果比较好,有可能业务会认为是自己算法做得比较好,并不一定会认为说数据有多牛逼;但反过来,如果策略效果不好,很有可能会认为是数据质量比较差,这是经常发生的情况。

所以经常发生的情况,就是要么别人不用中台,要么用了之后觉得中台不好用。

所以中台很难做,也很难成功。平台则比中台容易做那么一丢丢,该有的困难也都有。

目标不一样,不相为谋

业务前台和中台的目标,一般情况下也大相径庭,这就导致两种团队一般都互相不待见。可以认为,业务前台有自己非常清晰,并且压力很重的业务指标,这是他们的KPI,必须要完成。

而中台则会从集团或者公司的角度去考虑整体的效率最大化,整体的效率最大化并不代表单独各自业务的效率最大化,也许业务前台自己搞更快并且效果更好,或者他们单独搞会有更高更快的投入产出比,能更快的达成自己的KPI。这就会导致前台业务没有动力去用中台,或者支持中台。

什么时候可以做中台

那什么时候可以做中台呢?我看到的比较令人沮丧的现象是:没有什么时候是适合做中台的,直接上来就定位是做中台的团队都死掉了。

那是不是没有成功的中台呢?也不是,也有一些成功的状态存在,很多都是先应用于某个特定的场景去认真打磨,并且相对是比较定制化的,刚才这个业务当中用的比较好,在逐渐将可能的通用组件抽象出来,支撑其他的业务。比如阿里的语雀。相当于中台都是在不知不觉中做成的。

平台成功的关键:L形组织

一般成功的中台都是首先依附于某一个比较重要,比较大的业务,先把这个业务支撑好,并且可能存在比较多的定制证明效果和收益,之后再视情况,将通用的部分抽出来作为平台或中台,只有这样的方式才可能成功。

而很多时候,中台的负责人也需要是某个业务的负责人,这样中台才有优化的目标和动力, 有很多公司强调的L形组织,一竖就是具体的被支撑的业务,一横则是平台,这个平台先支持一竖,之后再进行应用的拓展。这样的组织形式也简称一横一纵。

什么是好的平台?

以我的经验来看,平台首先要在一个比较重要核心业务中体现出来它的价值,这个时候只能说这个中台做的还行,而如果这个中台能够支撑两个及其以上的不同核心业务,并能拿到收益,这个平台就算是成功了,而且在其他的类似业务当中去推进的时候就会很迅速,很容易,因为之前的两个成功案例都可以拿出来证明中台的有效性以及更容易让用户理解中台功能的边界。

就类似于公司销售去售卖自己公司产品的时候, 如果有一两个成功的样板,则客户会更容易理解产品, 以及更容易说服客户。

这里也有一个有意思的现象:做平台或者中台的同学, 无论是产品还是技术, 都需要承担起一部分销售和售后支持的工作。

只有变化才是不变的

那是不是所有的公司都不需要做中台呢?

这是一个比较有意思的问题:当阿里不再强调中台的时候,我看腾讯却组建了比较多的中台团队,腾讯之前一向是一个个独立的小团队,作为业务前台进行快速独立的尝试闻名的,这其中包含了非常多的重复造轮子的工作。

是不是觉得比较搞笑?

这也是个哲学问题,包括公司的组织形式,你是以游击队非正规军的模式作战,还是以集团正规军的模式去进行组织,是没有统一的标准答案的,需要在不同的情况,不同的阶段,不同的大环境之下去进行调整和选择的。

没有对错,只有选择

工业界内容审核系统构建

P.S. 还有少量数据&工程HC,欢迎推荐和自荐,关注该公众号->人才招聘,获取更多信息。

背景

目前,随着智能手机的普及,几乎人手一个智能手机,并且上网的费用也越来越便宜,这就导致内容的生产以及内容的传播变得非常方便,有一种说法就是东北的产业,主要是主播和烧烤就是在这样的大背景之下产生的。

同时,从增长飞轮的角度,内容也是非常重要的环节,很多的互联网产品如抖音头条,小红书,快手都是这样。都是优质内容增长,带来流量增长,流量增长带来收入的增长,而收入的增长又可以反哺激励内容创造者带来更多的优质内容,形成正向的内容生产循环,所以,内容,特别是优质内容就变得越来越重要。

图:内容增长飞轮, 更多流量带来更多创作者, 更多创作者生产更多优质内容,优质内容带来好的用户体验,产生更多流量,同时更多流量可以进行商业化变现,这些收入可以用于内容生产者的激励,以便产生更多内容形成正向循环。

而每个内容平台也会有自己内容的调性和定位,例如,抖音是用户年轻内容清晰;快手是搞怪奇特;小红书是白领年轻有品位;B站是二次元。

此时,内容平台会面临一个巨大的挑战,就是内容的合规性和质量保障,比如平台的内容必须符合国家的法规,否则,就不仅仅是内容质量问题了,而是犯法的问题可能会面临国家的严重处罚,一条内容有问题导致整个平台完蛋的例子也不是没有。

在这样的大背景下,生产的内容需要保障其调性和质量。这就需要构建完整的内容审核平台来对内容的合规性和质量进行审核。每一个内容平台都会在审核上投入大量的产业以及外包审核人员。

甚至有一种说法是字节跳动的内容审核团队一直在增长,有上万人的规模, 类似于B站等都有小几千人的审核员。在这样的环境下, 如果构建一个算法+人工的审核平台, 最大化提升审核效率同时保障内容质量, 降低内容带来的风险就尤为重要。

审核具体的工作范畴

审核就是一个专家系统打标签&决策的过程

绝大部分的数据处理工作,例如数据挖掘,文本分析或者图像语音分析,我们都可以将其视为一个打标签的工作。审核也不例外,我们可以认为,审核就类似一个信息专家系统,是不断地打标签的过程。

例如,审核的内容是不是合规?内容是不是优质?都可以说一个打标的过程。

再简单一点,我们可以将其视为一个不断使用规则进行二分类的过程:不断用不同的规则检查是否通过?YES OR NO。是否优质?YES OR NO。

审核是一个算法与人工配合的过程

一方面, 是否违规,内容是否涉及黄赌毒, 是否涉政, 这些都是相对明确禁止的;如果UGC内容中出现这些内容, 直接判定审核不通过就可以。

但更多的情况是针对不同的业务, 需要判断内容是否符合内容调性, 质量, 这时候就会存在很多灰色的部分, 机器很难做到100%覆盖, 此时就需要机制引入人工审核。例如LBS场景中,内容中不能出现广告, 但评论中对某个门店露骨地使劲夸, 这样算不算广告?如果不算, 那如果发评论的人经常夸这个店呢?

又或者内容本身没什么大问题, 但被评论的POI是一个高风险的类别呢, 例如‘按摩’ 这个类别风险比较高, 那需不需要人工审核呢?

所以, 在机器无法完全判黑, 或者在识别存在潜在风险的情况下, 需要引入人工审核。 审核系统永远是算法 + 人工的组合。算法无法做到全自动化。

从这个角度构建审核系统, 更像是构造一个专家系统的过程,并不像搜推广一样倾向于使用端到端解决问题。这一点和搜推广有本质区别。

审核是一个需要分级处理的过程

为什么需要分级呢?主要的出发点,还是审核的计算, 人力资源有限, 需要将资源投入在最重要, 最需要审核的环节。

这里的分级, 包括用户的分级, 以及待审核内容的分级,如果做的精细化, 还需要根据具体审核人员根据审核质量的分级。

工作中的一个方法论:只要(而且是必然)资源有限, 就需要进行分级,而且只要存在2/8原则, 就能够分级进行处理。很简单超级有用的思维模式。

  • 用户分级:此处需要对用户进行分级, 根据C端内容提交用户的活跃程度,账号存在时间, 对内容的正向贡献, 或者负向内容提交的比例等, 对用户进行行为信用分级, 总的思路是信用好的用户审核偏松, 信用差的用户审核偏严格。思路比较直接, 一直做好人好事的C端用户, 有理由相信他作恶的概率较低, 反过来有前科的用户就要重点关注了。

  • 内容分级:例如涉黄涉政这种原则问题, 直接审核不通过, 而一些模棱两可, 例如可能是偏营销的内容, 则审核要求会没有那么高。

  • 影响面分级:如果一个评论发表后, 预估看到的人会比较多, 则这条评论审核通过后的影响面会比较大, 则需要投入的审核资源要多一些, 而如果预期这条评论审核通过后, 看到的人会比较少, 则影响面相对较小, 此时投入的审核资源也较少。

  • 生效手段的分级:在审核内容生效后, 需要综合考虑用户分级, 内容分级, 影响面分级确定生效手段的分级。例如高风险的内容, 但没有触发明显的规则, 则可以小流量试投, 低风险的则可以直接全流量。

在经过必要的安全审核和机器自动审核后, 就会根据以上前3个维度, 将内容审核分发至不同的审核流程分支, 之后决定生效手段:有些内容可以直接上线 ,有些需要人工审核, 有些则可以小流量试投。

审核的内容划分

从具体审核的内容的角度来看,我们可以将审核的内容分为安全审核和业务审核两类:

  1. 安全审核:就是看待审核的内容,是不是触犯法律法规.例如,是不是涉及黄赌毒?或者内容是不是侵权等,这是原则问题, 一旦触碰, 直接将内容干掉, 没有任何余地。

  2. 业务审核:主要看内容是不是符合平台的规则和调性,例如,内容可能有长度限制,图片可能有尺寸或者图片内容的限制,或者想中提到的一些调性的限制。

在大公司一般安全审核会有专门的平台或中台团队来支持,一般审核内容更多的指业务审核。

对审核平台的要求

  1. 准确性:一般审核平台对准确性有较高的要求,很多平台出问题,不管是法律风险或者舆论风险,可能就只是因为一条内容内容,所以一般审核平台对准确性有较高的要求。

  2. 审核效率:从内容创造者的角度,他希望自己发布的内容很快能被C端用户看到,那种平台的角度,很多内容是具有时效性的,需要具有很强的新鲜度,所以审核效率是很重要的一个考量因素。这里面还需要考虑的一个点,就是机器审核的占比在审核平台当中,我们不能过多的投入人力资源,人力资源,人力资源是比较贵的。

  3. 可扩展性:内容支持的形态和字段都会不断的在变化或者扩展,所以平台需要具有一定的可扩展性

审核逻辑必须规则化

这里要重点说一下,在审核平台当中,技术体系和业务体系的关系:

我可以说,在审核平台当中,还是以业务体系为主导的,最终,我们在审核过程当中,都是将逻辑抽象成一组组的规则,然后去用规则去判定内容是否符合规则,之后用这些规则去对内容进行达标分级,我们可以认为是我还是以规则驱动的,从这个角度来说,审核平台更新是一个专家系统。

只是在判定是否符合某条规则的时候,需要有很强的技术性,甚至里面会包含多个执行单独任务的模型,例如,以下规则的判定就需要很强的技术能力,甚至每个条件的判定都是一个单独的算法模型,甚至会用到深度学习:

  • 图片中是否包含广告字样内容,中间可能需要使用到OCR的文字识别引擎。

  • 是否为截屏图片,需要去识别图片当中各部分的组成,有没有投入的时间信号等各种要素。

  • 图片中是否包含色情内容,内容中是否以人像为主体,这会涉及到图像识别和分类

  • 图片中是否包含建筑,是否是一个加油站的图片,或者说是一个门店的门脸。

以上这些规则都很简单,但是要实现的时候都需要使用图像识别的模型来解决判定。

简单来说,就是整体审核或是一个规则系统,所有的审核逻辑都通过规则进行串联,只是规则的判定会使用到算法模型。

系统架构

图:审核系统算法架构图

整个审核系统从业务逻辑的角度,主要要包含以下部分:

  1. 安全审核,例如是否黄赌毒是否涉政,一旦命中,直接干掉。

  2. 机器审核,将规则引擎中的审核规则都按照合适的顺序过一遍,命中黑规则的直接干掉;其余的打上灰或白的标签,供后续走不同的分支使用;从业务的角度,可能还需要区分是否优质,是否高质量,这个和具体审核系统的业务逻辑相关。

  3. 派单人工审核:根据机器审核的不同结果,再结合影响面和用户信用的分类,确定是否需要人工审核,以及线上投放的话,需要按照什么样的流量比例进行投放。例如,提交内容的用户是优质用户,而提交的内容预估影响面比较小,同时,机器审核的时候没有命中任何违规的规则,这这条内容甚至可以不过人工审核;如果预估这条内容审核通过后,影响面比较大,则需要进入人工审核的流程。

  4. 线上投放:一条评论经过机器审核,而如果因为内容创作者的信用比较好没有经过人工审核,此时,满足上线条件,我们可以先让这条内容小流量上线,如果小流量上线之后发现用户的观看比较多,则可以让人工再次进行审核;如果上线之后流量比较小,则人工无需再次进行审核。

  5. 定期机器巡查:有时候内容是否违规,需要综合内容创作者在多天在不同poi上的行为来进行综合定,这样的判定规则是无法实施实现的,所以我们需要对已经上线的内容进行定期的巡查,把这种单挑没有问题,但汇总起来就有的问题给干掉。例如,有的用户会在同类型不同的POI上都发表相同的评论,我们需要在单条审核通过的情况之下,批量的把这一类评论下线。

  6. 人工抽查:需要对线上审核通过的评论进行定期的抽查,以检查审核的准确度。

其中,在审核&决策部分,需要综合考虑用户信用等级,内容影响面, 内容质量确定是需要进入人审, 还是进行线上小流量投放, 还是直接正常投放。这是加速审核逻辑非常重要的核心思想:将有限的审核资源投入到影响面,风险最大的内容审核上。

图:审核&决策思路,在进行完用户信用分级, 内容质量分级, 内容影响面分级后, 就会根据这三个要素维度进行接下来的审核决策, 图中仅展示了用户信用为高的用户路径,红勾代表需要人工介入审核, 例如内容影响面较大,而内容质量一般就必须人工审核,而对于高信用用户,影响面偏低的内容,过了基本的机器审核后, 就可以直接上线投放。

审核元素的设计

上面也提到,在进行审核平台建设的时候,我们需要考虑平台的扩展性。我们可以简单的将社会平台看成是一个规则的系统,所以为了扩展性,我们需要抽象规则的定义以及作用于规则的逻辑。以便能够灵活地增加各种字段以及这些字段上所作用的规则。

我们可以使用xml或者json这样的格式去描述对应的字段,以便接字段以及其上的规则,可以进行灵活的扩展。

同时,对于审核的各种基础算子,我们可以进行抽象,以便在不同的字段,甚至不同的业务里边都可以服用这些具体的算子。

评价&优化

审核系统就类似于球场上的后卫,他和前锋不一样,我们很难去评判他对业务的直接贡献,但是我们可以通过机器审核的比例的提升,以及审核人力的减少去评估系统效率的提升。

同时,有些系统可能比较注重审核的时效性,在这样的业务场景审核的时效性也可以纳入指标统计。

另外,做审核系统的一个经验就是审核系统是非常CASE驱动的,所以做审核系统的同学,一定要细致的去看各种CASE,不过,幸运的是,一般某几类CASE就会占到问题的大部分,所以我们可以开始先解决头部问题,先解决容易的性价比高的问题,之后再去精细化的构建其他审核规则完善系统。

大型平台商品选货逻辑

现在在很多大型平台,一提到其中的算法,大家的第一反应就是搜推广中1. 的CTR预估模型或是CVR预估模型。
的确,在系统当中,从分发的角度,在线的分发效率是直接能够影响到最终的业务结果,也是最好度量的,类似于球场上的射手。但这也是我一直强调的,在线的分发虽然非常重要,但它不是全部。
为了提升整个系统的分发效率,我们还需要综合考虑数据的应用、供给的优化、人群的定向挖掘等然后才能有最终分发效率的提升,而且这个过程当中还会伴随着各种风险的防控和反作弊的策略。所以就最终达到比较好的业务效果整个系统链路是比较复杂和冗长的。有可能系统当前最大的瓶颈还不是分发部分。
大部分情况下,分发效率的提升,必然会伴随着供给侧的优化,也就是b端的优化。例如,在广告系统中,会伴随着广告主侧的优化,包括物料创意等。 例如,百度凤巢的关键词,推荐账户优化等工具。或者是交易型系统中的选货盘货工具。
这些B端的选货,盘货逻辑和在线分发系统的关系,就类似一个传球手和射手之间的配合关系,他们是相互补充的关系。
因为B端的工具一般是优化供给,它能够利用B端离线的丰富的统计数据。而在线的分发系统则主要是面向C端,它有丰富的实时在线的用户数据和场景数据。两类系统互相配合补充最大化B端商户营销交易的目标,C端用户体验的目标和平台收入的目标.

废话了半天,今天我们就来聊一聊B端的选货平台的构建。

选货的重要性

我们经常说互联网三类比较重要的变现手段:交易广告和游戏,无论一个工具或者平台,他是做什么的,最后,他要商业化的时候,都是通过这三种模式。
对于存在交易的平台来说,用户之所以来这个平台,肯定是平台给他带来了特殊的价值。而一般最主要的价值主要是信任感和价格优势。
如何找出对用户有信任感和价格优势的货呢?就需要有对应的选货平台支撑,因为所有的选货逻辑都是人工进行的话,一方面,人工会有其经验的局限性,另外人的精力是有限,货品太多肯定会有疏漏,第三是人工操作可能就会带来对应的腐败,如何通过算法去自动化的,规模化的选货,是非常有价值意义的一个工作。


图:淘宝聚划算展示模式,选出具有品牌效应的折扣商品,让用户对该板块有心智,新用户访问淘宝,提升淘宝的DAU和交易量

而对于美团或者高德这样的LBS生活服务平台,同样需要将具有品牌效应和价格竞争力的商品选出来展现给用户。

实现思路

一般的选货平台中,主要包含以下几个主要逻辑:

  1. 群组推荐(group recommendation)进行人群圈选,确定平台或者板块主打的人群类别,并且使用群组推荐的方式确定人群的需求或者类目&心智,以便后续进行对应的类目和商品的圈选。
  2. 品类规划:在很多业务场景中,我们进行选货的目的是为了最大化线上的业务指标收益,但这个过程当中,我们还需要考虑品类的多样性,就和推荐系统一样,我们认为业务指标是短期收益的度量,但多样性是为了提升用户选择的类目广度,它是一个长期收益的度量。为了平衡长短期收益,我们就需要进行品类规划,保证各个类别的占比在合适的水位上。
  3. 货品选取:当选货的类别和占比确定之后,我们就要进行具体货品的选择。 在进行选择的时候, 需要充分考虑商品的价格竞争力, 品牌能力, 后续商品的趋势等因素。
  4. 商品评估:然后进行具体的商品选取
  5. 在线投放和效果回收:之后配合在线的分发投放系统进行商品的投放以及对应的效果回收。
    以上就是整体选货的逻辑和步骤。

系统架构

货品选择和线上投放进行互补,需要进行离线选货和在线投放分发的联动。
智能选品, 选品后台和前台流量投放的链路打通, 以人群需求出发, 结合推荐等算法技术, 深入挖掘人群偏好和商品, 类目。 同事对价格力, 销量趋势, 品牌力等进行多维度立体评估, 这样可以让投放链路来撬动极致的供给。


图: 选品平台示意图,通过对品的选择, 人的选择, 结合投放端最大化撬动供给。

人群选品

人群选品解决的问题, 是在不同的场景, 根据不同的对象用户, 主打品牌折扣的心智, 针对货品,场景特点, 主打不同特点的人群, 例如聚划算品质辣妈, 精明主妇, 高德周末遛娃, 出差白领, 货车司机,网约车司机等人群。 基于人群推荐group recommendation 算法挖掘不同人群下的货品个性化供给, 提升目标人群的选品效率和准确性。
该思路其实也比较通用:就是每一个产品或者平台必须要确定其主打的人群,然后对这些人群去用不同特点的货品作为钩子去吸引住这些用户。比如,在电商平台,有一波消费的主力是家庭主妇或者有娃的妈妈,那就要针对这些特定的人群去进行选货;或者在LBS场景周边溜娃会是非常大的需求人群,也可以针对这些人群去进行定向的盘货。

群主推荐的主要思路是根据群组中的个体对item的偏好去计算群组总体的偏好,具体计算的过程当中有以下三种思路:

$group score=\sum_{uj\in G}w{ij}*f_{UI}(u_j, item_i)$

  1. ADD的思路:该思路下认为,群主中的每个群体成员的重要性都是一样的,所以$w_{ij}$的权重可以设置为1
  2. Least Misery(LMS):该方式需要避免群体最不容易接受的情况,所以,将$w_{ij}$低分设置为1,其他为0
  3. MRP: 该方式是将头部的重要人物的权重$w_{ij}$设置为1,其他为0,该方式主要考虑的是意见领袖的倾向,而不考虑大众的感受。

三种方式各有各的特点和倾向,所以在应用的时候,我们需要挑选合适的模式应用到我们的场景中。

更多的细节可以参见群组推荐这个topic的相关研究和进展。

参考聚划算

聚划算的心智, 简单来说就是品牌折扣的心智: 让用户买到品质优惠的商品(to c) 让商家实现用户增长和商业增长( to b), 对于这样的模式, 核心优势是商品供给, 而商品供给的关键, 在于运营招商, 商家是否愿意参加, 是否愿意给到极具吸引力的折扣, 很大程度上取决于商家在聚划算固定渠道上的流量体感。
其实绝大部分的平台选货都可以参考聚划算的思路。

品类规划

品类规划根据品类整体收益函数$f(x,c)$ 可以得到品类x规划c个坑位带来的预期总收益,品类规划问题, 是希望能够在单坑满足条件的情况下, 尽可能最大化品类宽度。
例如,业务上的指标可能是需要保证各个业务或者行业的成单占比,以及在各个入口的占比。我们可以将业务指标作为具体的约束项,然后将目标设定为在保证业务场景整体占比等约束的基础之上,去最大化品类的数量和宽度。
例如,将问题定义为如下形式:

  • 目标:保证业务要求的基础之上,去最大化品类的数量和宽度。
  • 输入:总的类目集合,总得资源位坑位数,各个业务的单坑产能。
  • 输出: 未来一段时间,每个类目的坑位数。
    相当于使用这样的方式将每个类目再接下来一段时间的坑位数进行规划。 可以使用动态规划的方式进行求解。当然求解出来的模式不是最优解,但是具有很强的参考意义。

货品选取

一般情况下,在选择货品的时候,以下几方面是最重要的度量因素:

  1. 价格力:即价格是否优惠,而且度量的方式是看用户是否真的买到了便宜。例如iPhone可能平常不打折,但某一天他的价格突然降低了300块钱,这其实已经是一个很好的折扣了,我们就说他有很好的价格力;反过来,如果一个商品常年都是打五折,那这个折扣其实并没有什么西引力,因为用户并没有买到真正的便宜。
  2. 品牌力:指的是这个货品的品牌效应,更多体现的是这个商品的质量保障。还是以iPhone为例,如果官方旗舰店打了一个300块的折扣,因为有品牌的背书,所以对用户购买意愿的刺激其实是非常大的;但如果是一个不知名的小店,她卖的iPhone打了一个300块钱的折扣,因为这个店的品牌效应不行,所以他对顾客所带来的消费刺激也不一定会明显。
  3. 贡献力:指该商品对平台的收入这贡献。平台需要考虑自己长短期的收益。
  4. 趋势力:指这个商品是不是能够引领整个平台用户消费的趋势, 是不是应季货品, 是不是新品等。


图:商品选货五要素

整个商品选货的过程就需要围绕以上方面进行。而在具体选货的过程当中,可以考虑以上5因素的综合影响。

以下为更加详细的操作展开介绍

价格力

核心思想就是看用户能不能买到真正的便宜,而真正的便宜的度量可以是多维度的,就要可以包含以下维度的度量:

  • 历史比价:这可能是价格最有吸引力的方式了,例如,淘宝双11说,这是全年最低价,虽然可能也就比平常便宜5%,但对用户购买的刺激性爆棚。
  • 同款商品比价
  • 相似商品比价
  • 实时价格变化

品牌力

主要是看用户对品牌的认知程度以及对应的货品的质量保证,主要可以从以下几方面去衡量:

  • 热门程度:热门程度体现了用户对该商品的认可程度
  • 美誉度/提及度:例如,用户评论的数量和好评的数量

趋势力

主要看商品后续是不是能够引领平台的趋势和成为爆品的可能性。只要衡量的指标可以是:

  • 预测的销量
  • 是否为应季的商品
  • 新特奇的程度

综合以上的维度以及人工运营的市场需求,最终对货品进行盘点。

选货完成之后,相当于是对这些货品打上了特殊的高阶标签,这个时候需要对接线上的投放系统进行分发,根据预先定义的标签,所投放的入口以及规划的坑位,投放的时间去展现给特定的用户群体。此时就要求选货系统和线上的分发引擎是打通的。在很多场景选货的维度非常多,同时选出来的货也会多种多样,此时如果将所有的货品的标签都同步到线上,全量同步会给线上索引投放系统带来巨大的压力,此我们可以跟线上引擎有联动,仅同步有diff的部分减轻线上系统的压力。

总结

离线对于货品的选择,是整个系统对攻给重要的分析以及处理,是整个系统必不可少的部分。
我们可以利用离线的丰富的数据以及人工的经验去对货品进行选择,然后配合在线的实时场景的预估去进行分发,从整体系统的角度去最大化用户体验以及收益。