gitbook/推荐系统三十六式/docs/7653.md
2022-09-03 22:05:03 +08:00

106 lines
8.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 35 | 说说信息流的前世今生
信息流就是Feed包括社交动态信息流也有图文资讯信息流短视频信息流。
在前面说过,推荐系统是一种注意力存储器,注意力是信息经济时代的稀缺商品,广告商向平台方购买注意力,平台方把存储的注意力分一点给广告商,然后通过推荐系统收集更多注意力补充回来。
在今天最厉害的注意力存储器就是信息流尤其是个性化信息流也叫做兴趣Feed这也是推荐系统的一种。
## 前世今生
说信息流就不得不提到NewsFeed。2004年Facebook问世2006年信息流鼻祖NewsFeed横空出世经过十多年NewsFeed已经是日收入几千万美金的现金大牛。
在NewsFeed上线前经历过两个抗议阶段第一个是把新鲜事公布出来原先的新鲜事被大家认为是隐私在时间线中呈现出来被好友看见不妥而事实是每个人在意的除了自己的隐私被公布更在意的是朋友的八卦数据表明新鲜事被公布后用户活跃度大幅上涨。
第二个就是NewsFeed上线用户广泛抗议原来按照时间先后顺序阅读新鲜事现在却按照重要程度阅读非常不习惯然而数据表明用户互动行为再一次大幅度提高。
这些年来NewsFeed有数不清的改进甚至每天线上会同时部署很多算法版本进行AB测试。后来的故事大家都知道了Facebook上市股价逐年上涨。
NewsFeed的成功验证了几个常识
1. 数据驱动比舆论驱动靠谱,别听人们嘴上是怎么说的,只看人们是如何行动的;
2. 窥探隐私,向群体靠拢,害怕孤单是普遍人性,把新鲜事公开这件事验证了这一点;
3. 注意力非常有限,用推荐系统的方法更好地储存注意力,基于兴趣的信息流验证了这一点。
后来Twitter微博Instagram老牌的时间线信息流方式如今都换成了按照兴趣筛选内容原因都是信息泛滥用户错过的信息量越来越多注意力耗散很多无法将耗散的注意力变现成了这些平台最大的痛。
今天搜索公司Google、百度都已经押注了信息流更不说那辆行驶在注意力收割航道里的短视频新兴巨轮。
这些公司,尤其是其中的上市公司,在财报里也会提及信息流,可以说,信息流在今天已经是红透了半边天。
## 配套设施
信息流是一个低衰减的注意力存储器,但是光有信息流是不完整的,最大的问题可能有两个:
1. 内容源不足,无法形成信息过载,注意力就不会稀缺,注意力是无法待价而沽的商品;
2. 在注意力变成稀缺的事物后,存储的注意力无法变现,反哺平台自身。
针对这两个问题完整的信息流产品还需要配套设施。以NewsFeed为例讲讲信息流的配套设施。
### 1.内容源
内容源是注意力的重要间接影响因素。“内容哪里来”是信息流要不断思考的问题对于NewsFeed来说就是社交关系上的人发布新鲜事。
NewsFeed存在的前提是要依赖用户建立大量的社交联系这样才会出现信息过载因此NewsFeed的一个重要的配套设施就是“你可能感兴趣的人”推荐系统。
这是一个我们在产品形式上比较熟悉的推荐系统它是一套大规模矩阵分解算法在前面的专栏已经专门讲过这套推荐系统希望用户和用户用户和App、公共主页等都建立起大量的连接。
建立起连接相当于变相地增加了内容源这些用户发布的新鲜事App产生的内容公共主页发布的帖子都会通过这些连接流进用户的个人信息流。
社交信息流中,内容源依赖于社交关系的数量。而图文资讯信息流,则更多依赖爬虫技术,“不生产内容,只是内容的搬运工”。
依赖爬虫的信息流内容源质量非常不可控会有涉黄、涉政、涉暴力等敏感内容甄别工作量非常巨大而且一旦控制不好就是社会事件代价惨重这一点在2018年你一定感受很深。
内容源是信息流的一种重要基础设施,要想尽办法建设好。内容源应该考虑下面几种。
1. 质量:虽然群体喜欢消费低质量的内容,便宜商品,但是一旦出现敏感内容, 不合格的商品等,代价还是很高昂。
2. 多样性:信息只有多样了才有信息量,有了多样性才能满足更多的用户,才能在存储海量注意力时不衰减。
3. 数量:数量自不必说,推荐系统解决信息过载问题,没有信息过载问题怎么办呢?就是先制造信息过载问题,要制造信息过载,信息的数量就要有保障。
### 2.广告系统
NewsFeed还有另一个配套设施也是它为什么每天能吸金几千万刀的原因那就是广告系统。
Facebook的广告形态多样。
1. Suggested Page (你可能喜欢的公众页)
2. Page Post (公众号帖子推广)
3. Suggested App (你可能喜欢的应用)
4. Video Ads (视频广告)
广告主花钱购买信息流存储的注意力,俗称信息流变现。实际上就是信息流产品供应注意力,广告主消费注意力。注意这枚硬币的另一面:广告主供应的什么,用户是否消费了,则是另外一套看待角度。
以前Facebook鼓励商业机构花钱投广告增加粉丝彼时的NewsFeed算法允许随意发广告看上去就是公共主页发布了新鲜事。
这一阶段对应着增加用户和内容源之间的连接阶段,是一个非常必要的步骤。看上去广告主增加了自己的粉丝,用户增加了内容源,而本质上则是让注意力买主先看到他种草的商品,这个阶段只让广告主每天摸摸自己种草的商品,并不是真的给他。
直到后来平台方开始严格限制商业广告与普通用户触达不只是Facebook任何的信息流平台在广告主吸引了足够粉丝之后都会果断限制广告无节制地触达用户。种草的商品突然提价广告主就只能剁手买买买这就是广告系统了。
跟据某个专门做NewsFeed推广的公司追踪结果1000个公共主页的50000条内容以原生方式触达用户的比例从2012年16%降低到了2014年的6.51%,降了一倍还多。
当然也可能是因为用户平均关注的公共主页增多了,而本质上的原因就是,注意力市场开市了。
在注意力这边,存储注意力要做的事就是基于兴趣筛选信息流,重新排序展示,这样的好处就是用户不会错过自己感兴趣的,而本质上就是留住注意力,不要衰减。在注意力购买方这边,通过广告系统,大家去购买自己看中的注意力。
信息流,看上去就是这么一个简单的商业逻辑。广告主这边一开始和信息流平台方有非常甜蜜的日子,直到要花钱购买自己帮忙存储的注意力时,就会有怨言了。
曾经就有广告主对Facebook抗议道那你干脆不要干涉NewsFeed排序啊按时间线自然展示用户错过就错过大家都公平。对此Facebook的解释则是数据显示重排序后的NewsFeed可以让用户阅读积极性提高很多。这句话的意思是这样做才能存储注意力啊。
关于到底要不要重排序的争吵,我们要看清楚,双方都是商业机构:一边是要消费注意力,一边在销售注意力。
这本身就是买卖嘛,不要谈什么情怀,商业社会永远是逐利的,逐利的手段就是制造信息不对称,并且在制造过程中不断提高效率和降低成本。
显然,“大家一起穷,完全拼人品”的时间线,不符合基本商业逻辑,信息流才符合商业逻辑。
世界上最遥远的距离就是:手握大把粉丝,却不能随心所欲地曝光自己的产品。
## 总结和展望
具体信息流会怎么发展,我们无法预测,但是可以肯定的有三点:
1. 信息流是推荐系统在商业上最成功的应用;
2. 完全依赖数据驱动的信息流会面临黑天鹅事件,所以人和算法协同进化的信息流会是最有生命力的;
3. 数量上,注意力已被大厂囤在自己了手中,那么下一步要关注的是注意力的质量,这是信息流平台方的商品,毕竟广告主购买了注意力后,发现是地摊货,生意也不会长久的。
今天和你聊了信息流前世今生和未来,其中有很多我的个人观点,不一定对,咱们可以互相切磋。感谢你的收听,我们下期再见。