You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

60 lines
7.0 KiB
Markdown

2 years ago
# 095 | 广告投放如何选择受众?如何扩展受众群?
从上一期的分享开始,我们来讨论计算广告相关的一些高级话题。作为机器学习在计算广告的应用,这些话题往往偏冷,但在现实中又有很大的实用价值。我们首先聊了归因模型,介绍了几种经验方法和一些基于模型的归因方法,这种模型在计算广告业中举足轻重,不过也常常被人忽视。
今天我们来看另外一个重要的话题那就是如何帮助广告商扩大受众群我们也把这种技术称为受众扩展Audience Expansion技术。
## 什么是受众
广告商在投放广告时有一个最根本的需求,就是希望通过广告平台接触到更多有可能被转化的受众群。所以,对于绝大多数的广告平台而言,满足广告商的这个需求就成为了一个非常重要的功能。
为了让广告商来选择受众,不少广告平台提供两种最基本的功能。
第一种方式是**搜索广告的模式**,也就是广告商可以选择**通过某个关键词或者一系列关键词**来接触到希望投放的受众。这里面其实有一个假设,那就是受众的兴趣或者意图是和关键词联系在一起的,而如果投放的广告内容和受众的兴趣以及意图相符,那么对于广告商来说,就可以假设这种情况下受众的转化率是最高的。
第二种就是**通过某种选择受众群的方式来让广告商自由地选择广告投放的对象**。这里最基本的方式是通过受众的“人口”Demographic信息来进行投放。典型的人口信息包括年龄、性别和地域。
不管是采用关键词还是人口信息来进行受众选择,这些方法看似简单直观,但其实也给广告商带来了不小的挑战。
首先,我们来看关于搜索关键词的难点。作为一个广告商,你怎么知道所有的跟你产品或者服务相关的关键词呢?理论上说,可能会有无穷无尽的关键词可供投放。但是关键词的投放数量也和成本有着密切的关系。所以,从现实的角度来讲,肯定是无法投放所有的关键词的。
其次,利用人口信息来选择受众,那如何来找到比较合适的人口信息呢?这里面就有很大的挑战了。广告商可以利用一些研究结果来找到对应的人口信息从而增强广告投放的效果。然而针对很多中小广告商来说,花费很大的精力和时间去研究这些不同的人口信息和广告效果之间的关系显然是不可能的。
除了我们刚才所说的这两种广告商选择受众的方式以外,现在也有不少的广告平台并不需要广告商进行“显式”的受众选择。这些服务其实就是看到了这种选择带给广告商的复杂性,与其让广告商来选择,还不如让广告平台来优化。于是,有很多广告平台提供的就是“**傻瓜式**”的广告服务,广告商仅需要设置预算信息,对于人群的投放则完全由广告平台来负责。
## 受众扩展
了解了受众的选择以后,一个很现实的问题就摆在了广告平台商的面前,如何帮助广告商来扩展已经选择了的受众群体,从而能够实现受众转化的最大化呢?
来自LinkedIn的几位作者就探讨了在社交媒体广告中受众扩展的这个问题\[1\]。在LinkedIn平台上广告商也就是雇主可以针对不同的群体限制条件也就是我们所说的受众来投放广告以吸引潜在的雇员和候选人。广告商在投放广告的时候可以按照雇员的职业技能比如是否会Java是否会机器学习等以及一些其他的信息例如来自哪个公司、地理位置来选择投放的受众。这和我们之前介绍的场景一样很明显即便是广告商精心选择一个看似比较有效的受众在这种情况下其实依然有很多种其他选择的可能性。
在这篇文章里,作者们介绍了这么几种受众扩展的思路。
第一种思路是和某一个广告推广计划Campaign无关的。这里主要是**通过一种“类似”算法而找到类似的公司、类似的技能等等**。这种扩展的好处是可以对任何广告推广进行扩展而无需积累数据。
第二种思路是广告推广相关的扩展。这里其实还是利用了“类似”算法,但是在扩展的时候是根据广告商**对当前这个广告推广所选择的条件来进行选择**,这样的选择自然就会和当前的广告推广更加相关。
在实际操作中LinkedIn采用了这两种思路结合的方法。先利用于推广无关的扩展方法来获取最初的一些扩展用户尽管这部分用户可能质量不高。然后当广告推广已经运行了一段时间以后再针对这个广告推广的选择进行扩展就可以找到更加高质量的扩展用户群体。
我们看到这些扩展方法都依赖于“**类似**”算法,这里我简单说一下这个算法的核心思想。
总体来说这个算法是针对某一个实体可以是公司、人名、地域、技能等通过搜索的方法来返回最相关的K个其他实体。作者们把这个问题看成了一个**监督学习的问题**。其核心就是利用了一个**对数几率模型**,对相似的正例和负例进行学习。
那么,哪些实体是正例,哪些是负例呢?作者们把用户频繁选择放在一起投放的实体当做了正例,而把其他的实体当做负例。对于特性来说,这里广泛采用了**文本特性**包括文本的词包表达、以及N元语法N-gram组成的特性。同时这里还利用了**图相关度**来推算,比如两个公司在社交关系上的相关程度。然后,两个实体之间的**余弦相关度**也作为一种特性被包含在了模型中。
在线上实验的结果中所有受众扩展的效果都比不用扩展有显著的提升。特别是在混合扩展的模式下展示机会、点击率和总的收益都提升了10%以上。这个实验结果可以用来说明受众扩展的重要性。
## 总结
今天我为你介绍了在线计算广告的另外一个高级话题:受众扩展。
一起来回顾下要点:第一,广告商可以通过关键词或者人口信息等方式来选择受众,不过受众选择也并不容易,有很大的挑战性;第二,我们介绍了和推广计划有关的与无关的两种受众扩展思路,以及将两种思路结合的方法,并简单介绍了两种思路都依赖的“类似”算法。
最后,给你留一个思考题,在什么情况下受众扩展可能会出现问题,如何来衡量这些问题?
欢迎你给我留言,和我一起讨论。
**参考文献**
1. Haishan Liu, David Pardoe, Kun Liu, Manoj Thakur, Frank Cao, and Chongzhe Li. **Audience Expansion for Online Social Network Advertising**. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16). ACM, New York, NY, USA, 165-174, 2016.