广告数据并非表面数字这么简单!

先上个某游戏的部分广告投放数据,投放时间是5.1-5.3,共三天(摘抄自某厂优化师面试题):

广告数据并非表面数字这么简单!
优化师日常看的最多的就是这些广告投放数据了,有下载类(或其它业务数据有滞后性的)广告投放经验的优化师可能对上面的数据见怪不怪,但是有些优化师看到这个表格可能会说,这里面的数据好像有点异常:
 
为什么5.4-5.6没投广告也没消耗,却有曝光、下载、激活、注册数据?
 
嗯,没错,今天就想跟大家聊聊这关于归因的话题!
 

文章分成三部分内容:

  1. 关于归因分析
  2. 归因分析应用
  3. 转化延迟计算(会模拟计算上面表格数据)

01.关于归因分析

我是在2011年,刚入广告行业的时候听到“归因分析”这个词的,当时我们还是广告行业新人。某天老板出去参加广告行业大会,回来之后很兴奋地跟我们说他学到了一个词,叫“归因分析”,然后给我们布置任务说,每个人回去调研一下归因分析是什么……
 
——是的,我们也是从这样的萌新学习期过来的,那时的广告行业大会,只能作为一个行业新人在台下遥望台上演讲的嘉宾,边听边学。当时我们对归因这个词还是挺陌生的,只是百度了解了个大概所以然……
 
第二次听到这个词,是在2015年跟某监测公司好友在咖啡店的时候,她问起,你们这个DSP系统有做归因分析吗?当时我对归因分析勉强算是懂一点,但是没有太多相关实战项目。虽然都是第三方身份,但她面对的是品牌广告主多一些……
 
——那时候确实因为我们业务所接触行业和客户的原因,对归因分析这个并没有很注重,只是部分品牌客户需要这么个报表来综合分析各渠道对广告转化(访问网站、购买等)带来的价值,我们做了个归因报表。可能因为品牌广告的效果评估不像游戏 、电商等效果广告那么直接……
 
2015-2018年间,整个行业充斥着“归因作弊”,尤其是游戏广告行业,就是那种把曝光设备号当作点击设备号回传给广告主,抢归因转化的一种手段。有些更夸张的是甚至不需要真实广告投放,只需要把手头有的设备号当点击设备回传,不需要花任何广告费用就可以获得CPA结算,名副其实的白嫖。
 
——归因作弊的CPA结算的来源是抢占了其它平台的转化数或者自然量,不仅欺骗的是广告主的广告费用,还可能让其它平台消耗了广告费用却得不到CPA结算而造成损失。当年还有家公司发报告曝光了几家归因作弊公司,不过里面曝光的也只是小虾小蟹而已。
 
所以,归因分析到底是什么?
 
我在两年前写过一篇归因分析文章,里面提炼了概念:
 
归因分析(Attribution Analysis)是指在特定时间周期内,用户旅程中所经历的不同营销渠道的不同接触点对达成转化目标的贡献价值评估。
 
特定时间周期一般称为归因时间窗口、归因回溯窗口,比如从用户点击的时间点开始,设定一个回溯窗口时间,只有在该时间周期内发生的注册才会被计入转化归因。归因时间窗口一般是12小时、24小时、3天、7天。

接触点又简称为触点(Touch point或Contact point),包括曝光、点击、注册及其他互动等。去年年底,巨量引擎针对抖音的oCPM投放方式,将点击监测链接升级为有效触点监测链接,这里面的触点在原来的“点击”归因触点基础上增加“3秒播放”归因触点。最直接的影响就是转化数据会呈几倍至几十倍的增长,如果投放量大的广告主就需要对服务器进行扩容才行了……

02.归因分析应用

聊聊跟归因分析挂钩的两个词:归因模型和归因转化延迟。
 

先来说个场景:

我上午看公众号文章的时候,看到底部有个X游戏的广告,我大概喵了一眼,关闭公众号文章了。

中午刷抖音时候,又刷到个X游戏的视频广告,好像还挺有意思的,因为上午我也有看到这个广告,所以有印象,也觉得挺好奇的,于是点击视频后去下载游戏了。

游戏文件有点大,我就点开优酷看视频去了(看完视频完全忘记下载游戏这回事了)……

第二天中午,闲得无聊,想起昨天下载的游戏,于是我打开了下载的APP,注册了个账号,玩了盘游戏!

归因模型 

归因模型有几种,不过最常用的是Last click,即末次互动归因模型。另外还有平均分配归因模型、时间衰减归因模型、价值加权归因模型或者自定义归因模型。
 
在效果广告行业里面,基本都是用Last click,因为够简单够直接。其它模型也不是不好,只是行业还没有形成一个好的标准或共识。
 
上面场景中,我是在抖音渠道产生转化的,所以转化数归因到抖音渠道。
 
如果用其它归因模型的话,那转化价值就不止是算到抖音上了,在我的转化路径里面,我也有看到过公众号的广告,这里面到底对我的转化行为起了什么价值,还真不好评估。不过我们可以认为公众号渠道在这里起到了助攻角色。
 
我看前不久巨量引擎还推出了个全渠道助攻模型,提供了个单独接口,广告可以通过这个接口将其它渠道转化数据回传巨量引擎,系统不会把助攻部分的数据计为转化,只用于帮助算法模型学习已转化人群特征,更好地去look alike,助攻广告模型的优化。
 
姑且不说各渠道对转化的贡献价值到底应该怎么分配,我觉得起码用于勾勒用户转化路径中经历过的每一个渠道的历史轨迹还是很有价值的,可以计算从触达用户到用户完成转化的时间周期、第一次接触到用户是几时、用户总共经历过哪些营销渠道的哪些广告、用户在每个广告中的场景和停留时长、互动行为等……

归因转化延迟 

上面场景中,我的整个路径是:曝光-点击-下载-激活-注册,不过我的下载是隔天才激活和注册的。
 
假设归因窗口大于24小时,那我的转化数据归因到抖音渠道。假设归因窗口只有12小时,那我的转化就归因不到抖音渠道了。
 
从用户正常转化逻辑来看归因作弊数据的话,还是有迹可循的,比如点击转化率远低于行业平均值、广告点击到完成转化的时间差低于正常值。

03.转化延迟计算

当存在转化延迟数据的时候,就可能出现广告投放第一天的转化数其实是小于实际转化数的,之后每一天所看到的,其实都不是真实转化数,而是包含了前面广告投放所导致的转化延迟数据。
 

再看回文章开头的数据报表里面隐藏的信息:

广告数据并非表面数字这么简单!
 

5.4号没花钱还产生了微量的曝光数和下载完成数,是由于刚好卡在凌晨0点,有几秒到几分钟的时间延迟导致的,量级不大的话,可以忽略不计。

5.5-5.6还有激活数和注册数,5.7开始没有余量,说明广告结束三天后就不再产生下载、激活、注册,说明归因窗口时间三天。

光看每天的注册成本是在59-62,综合来看整体的话平均成本是总花费161685.805/总注册数3304=48.94。

 
注册延迟余量涉及很多原因,会有不同因素导致每天的延迟比例并不一样,比如有没有出现工作日周末或者其它节假日,或者买量高峰爆发的影响等,这些我们都先忽略,我们用最简单粗暴的方式模拟一下推导过程:

广告数据并非表面数字这么简单!

第①步:可以明确的是5.1的注册数743一定是5.1的,5.6的注册延迟数31一定是5.3的,先把这两个数据填入对应位置。

第②步:用5.6注册延迟数31除以5.3的下载数23085,得出第三天的注册延迟占比(比例)0.134%。

第③步:用5.1下载数14630乘以第②步算出来的比例0.134%,得出5.1广告消耗带来的5.4注册数20;用5.2下载数17975乘以第②步算出来的比例0.134%,得出5.2广告消耗带来的5.5注册数24。

第④步:用5.5注册数92减去第③步算出来的5.2注册延迟数24,得出5.3广告消耗带来的5.5注册数68。

第⑤步:用第④步算出来的68除以5.3的下载数23085,得出第二天的注册延迟占比0.294%。

第⑥步:用5.1下载数14630乘以第⑤步算出来的比例0.294%,得出5.1广告消耗带来的5.3注册数43;用5.2下载数17975乘以第⑤步算出来的比例0.294%,得出5.2广告消耗带来的5.4注册数53。

第⑦步:用5.4注册数520减去第③步和第⑥步算出来的20和53,得出5.3广告消耗带来的5.4注册数448。

第⑧步:用第⑦步算出来的448除以5.3的下载数23085,得出第一天的归因延迟占比1.939%。

第⑨步:用5.1下载数14630乘以第⑧步算出来的比例1.939%,得出5.1广告消耗带来的5.2注册数284;用5.2下载数17975乘以第⑧步算出来的比例1.939%,得出5.2广告消耗带来的5.3注册数348。

第⑩步:用5.2注册数859减去284,得出5.2广告消耗带来的当天实际转化数575;用5.3注册数1059减去43和348,得出5.3广告消耗带来的当天实际转化数668。

最后:可以算出5.1广告消耗带来的总注册数是1089,5.2是1001,5.3是1214;按总消耗除以总注册数,可以算出5.1的实际注册成本是40.52,5.2是51.56,5.3是54.33。

这个结果不代表正确数据,因为是以5.1-5.3的下载数作为基准值并且假设下载注册率相等的基础上计算注册延迟比例的,需要在算出来的数据基础上进一步反推、验证和调整,而且还需要考虑样本量问题。
 
又或者换个思路,用5.1-5.3的实际注册数作为基准值来算比例,5.1、5.2、5.3的实际注册量分别用a、b、c表示,假定每天投放在当天、后续第一天、第二天、第三天分别是相同比例的,分别用t0、t1、t2、t3表示。它们之间的关系如下图:

广告数据并非表面数字这么简单!

有兴趣的同学可以计算,也欢迎留言交流探讨。当然,实际的转化延迟计算过程要复杂的多,预估的时候也要合理,建议参考同周期的,考虑上节假日,最好要用日志数据具体分析。
巨量引擎针对这种情况也有相关指标了,用以区分这个归因导致的转化数据归属问题的计算,就不会像上面表格那样把当天转化数据和前面的转化延迟数据混一起了:
转化数和转化成本:把转化归到转化行为发生时间核算转化数和转化成本。也就是说注册数发生在哪天就算哪天的。
转化数(计费时间)和转化成本(计费时间):把转化归到展示计费时间核算转化数和转化成本。也就是说注册数是由哪天的广告点击带来的,就应该归因回那天去。

广告数据并非表面数字这么简单!

-END-

文章标题:广告数据并非表面数字这么简单!

文章链接:https://www.tanglang360.com/2021061519415870090.html

转载声明:本文内容,来自于网络,不代表【【螳螂可视化建站】】立场,分享目的仅供大家学习和参考,本站不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证或承诺,请读者仅作参考。

免责声明:如有侵权,请邮件80164590@qq.com,予以删除。

发表评论

登录后才能评论