互联网广告作弊十八般武艺 (下)

本贴最后更新于 1899 天前,其中的信息可能已经东海扬尘

本文原载于公号“计算广告(Comp_Ad)“,经过深入采风和精心准备,我们毅然决定做“互联网流量作弊的秘密”这期 live。Live 里的内容绝对是干货,学到这些知识,你可以毅然投身“流量优化”行业,也可以在自己业务中擦亮双眼避免上当。

上篇的内容发出后,广大吃瓜群众纷纷表示,一定要努力学习作弊技术,以满足祖国四化建设的需要。However,不要以为了解了 CPM/CPC 领域的作弊技术,就可以在这个领域大显身手。与 CPM/CPC 相比,收益更加丰厚的 CPA/CPS 才是近年来广告作弊的主战场。由于 CPA/CPS 直接伪造流量的成本较高,勤劳勇敢的广告人们想出了灿若群星般的作弊手段,每一种手段,都凝结着劳动人民的智慧和汗水,我们有什么理由不敬仰和学习呢?

上篇开始,我们给出了作弊的几种分类视角,其实还有个关键点没有讲到,那就是要搞清到底是谁在作弊。一般来说,作弊者可能有如下几种典型身份:

  • **媒体作弊:**这个很容易理解,制造假流量创造更多的收入,是媒体义不容辞的责任。

  • **广告中间商作弊:**广告主往往会对广告代理、DSP 等提出量和质的要求,那要是达不到怎么办呢?只好造假了。

  • **广告主仇家作弊:**按 CPM/CPC 结算时,广告主如果得罪了谁,人家有可能盯着你的广告猛刷猛点,让你的预算耗尽还全无效果。当然,猛刷猛点需要骗过各个环节的反作弊系统才行。

  • **广告主自己作弊:**这个其实也不难理解,为了把数据做好看一点儿,获得平台排名上的优势,几乎所有广告主都想过这事儿。站在广告主立场上,这叫做“冲榜”,可是站在平台立场上,就也是作弊了。

下面,我们就来看看在看似对广告主旱涝保收的 CPS/CPA 结算情形下,到底有哪些作弊手段。有关每个标题后面字幕的含义,请大家参考上篇互联网广告作弊十八般武艺(上)中的介绍。

八、运营商弹窗 (M/S, N, H)

你是否还记得,那飘在电视节目上方的黑框中,治疗狐臭的令狐诊所;

你是否还记得,那杵在电脑右下脚的弹窗里,省钱又省心的掌上营业厅;

你是否还记得,那悬在手机屏幕中,提醒你剩余流量 388M 的流量球;

如果你还没有忘记,那么恭喜恭喜,至少说明,还有人在惦记着你。

运营商弹窗可能是一直以来让所有人都为之反感,却又无能为力的一种作弊手段。这些广告种类繁多,特点相似,背后主人都是为人民服务的运营商。由于广告植入发生在数据传输层,因此无论你看的是什么节目、浏览的是哪家网站、用的是什么手机,只要连上网络,都将收到来自运营商的爱。

除了这种霸王硬上弓的弹出式劫持,还有一种方式是普通用户根本无感,润物细无声地存在着。比如,媒体在某个位置上展示了一个广告,在网页到用户浏览器的数据链路中,运营商对网页数据进行深度报文解析(Deep Packet Inspection, DPI),用自己的广告覆盖掉媒体的广告,发送给用户。这样,本次媒体广告的曝光机会就被硬生生的掠夺了。这叫抢吗?不,运营商的事情,怎么能叫抢呢。

九、落地页劫持(S, A, R)

同样是运营商劫持,弹窗还是比较温柔的,它不过是强占了一些曝光机会。在实际的 CPS 联盟广告中,劫持往往以更加简单凝练的方式进行。什么是 CPS 联盟呢?以淘宝联盟为例,站长的页面可以用来投放淘宝的广告,当用户点击广告主的广告时, 淘宝在站长页面上的埋点代码会给用户打上一个 Cookie,标记该用户是从站长那里来的。如果用户后续产生了购买,淘宝就要按 CPS 给站长付钱。

什么是运营商的落地页劫持呢?比方说,您打开浏览器访问京东:

京东(JD.COM)-正品低价、品质保障、配送及时、轻松购物!

可是你按下回车的那一刹那,地址栏里的网址却变成了这样:

http://www.jd.com?utm_source=ABC

发生了什么?原来是运营商把你的网址替换成了一个广告来源地址,这样一来,你在京东的消费,就记到“ABC”这个渠道头上啦!

用落地页劫持的方法做 CPS 广告,那真是价格便宜、量又足啊!而且最美妙的是,任你怎样考察后续数据,都发现不了问题:废话,自然流量的质量还能差到哪里去!

说句不客气的话,目前各大电商的 CPS 联盟中,真实有效的正常流量,我认为占比不超过两成,当然无效流量中并不只是运营商劫持,还有下文中的一些奇葩手段。有人可能要问了,既然 CPS 流量没什么卵用,电商为什么还要做呢?关于这个哲学问题啊,诸位可以深入思考十八般武艺中的最后一种。

针对流量劫持,有什么好办法么?去运营商那里投诉?别逗了。目前比较好的解决方法就是使用 HTTPS 替换 HTTP,对数据进行加密,使得运营商难以解析数据内容。更多的,你永远也叫不醒一个装睡的人。

当然,除了运营商,手机厂商也有能力把其他广告渠道的下载包换成自己应用市场的,这个原理跟落地页劫持一样。唉,不多说了,现在安卓的应用市场,得说是个重灾区,有几家著名的手机厂商也玩这个玩的很 high。

十、Cookie Stuffing (S, A, R)

“Stuffing”的意思是“填充”,这同样是针对 CPS 联盟的一种祖传作弊手段。

在 CPS 联盟的机制下,站长作弊的手段就显得格外纯粹了,一个字,偷!在用户不知情的情况下,给用户打上标识站长的 Cookie,如果该用户后面自己去淘宝上产生了购买行为,由于 Cookie 的存在,这次自然的购买结果就变成了站长的引流结果。

Cookie Stuffing 在实现方法上,主要有图片 +.htaccess 跳转、1*1iframe 和 Flash 等,根本原理都是在用户浏览器上静悄悄的对淘宝的推广链接发起 HTTP 请求,在用户不点击广告的情况下打上站长的 Cookie。Cookie Stuffing 的作弊手段类似于后面要介绍的下载归因,都是将自然结果转变成自己的推广效果,骗取更多的转化付费。

太阳底下没有新鲜事儿,电商广告主要效果的心情可以理解。不过可以负责任地说,好的离谱的效果十有八九是有问题的。前一段,某 DSP 巨头与客户就流量来源和疑似劫持的问题闹上了法庭,虽然最后达成了庭外和解,却让我们不得不怀疑,他们家的广告效果,恐怕也有类似于 Cookie Stuffing 的逻辑存在。

十一、刷机墙(S, N/A, R)

刷机墙是一种简单粗暴的作弊手段,指的是同时操作多部手机终端,以人工或自动的方式,批量的刷各种转化。手机是真手机,只不过流量都是垃圾,所谓僵尸号,多数指的就是这一种。微博粉丝,微信阅读量,顶帖点赞,无一不通。800 块钱十万阅读量,客官您要吗?

刷机墙看起来简单粗暴,实际上却是个技术活儿。怎么搞到足够多的 IP,怎样精心模拟用户行为使得看起来像真的一样,这些事儿啊,还真非得有工匠精神不行。

如果用心的话,媒体方想判断这种刷出来的流量,其实并不是太困难,这是因为移动设备有丰富的传感器信息。你想想,这些半身不遂的、以刷机为终身使命的可怜手机,跟那些鲜活的、跟着主人欢蹦乱跳的手机,难道不容易分辨么?

十二、游戏自充 (S, N, H)

游戏开发者自己给自己的游戏充值,早已是行业内公开的秘密了。为什么要自己充值呢?因为只有数据表现好了,才能在渠道那里获得更高的排名,得到更多的流量,挣更多的钱,这叫做老鼠拉木锨——大头在后面。这种自充的本质,跟淘宝店家的刷单、移动应用的 ASO 冲榜,都是一样的。

有趣的是,在游戏类广告中,还存在一种广告代理商偷偷给游戏充值的情形。代理商给游戏充值,还不让开发者知道?这不是吃饱了撑的么?其实不然,这里面大有深沉。

比方说,广告主要求投放一次广告活动后,三个月的充值回收要达到 100%,而我的媒体质量很差(或者根本就没打算投),怎么办呢?干脆就在三个月里自己把钱充进去。这样一来,广告主看到效果不错,就会追加预算,追加了我就自己再充回去。如此周而复始,直到把广告主养成了大肥羊(预算足够大了),嘿嘿,就一刀两断不再投了!

谁说庞氏骗局只能对白发苍苍的大爷大妈有效,掌握了它的精髓,看似精明、实则贪婪的商人一样会上当。

十三、羊毛党 (S, N, H)

羊毛党是一个很有趣的组织,以“人数多,规模大,金额小”为特点,所到之处广告主都被薅的一毛不剩。这类作弊手段常见于“注册返话费/代金卷”之类的活动,以极低的成本就可以获得实实在在的现金激励。以话费为例,通常情况下,注册换来的充值卡最终常常会以 8 折的价格汇集到某宝店铺,店铺在为用户充值时会以 99 折的价格卖掉。您瞧,多么完整的一条产业链,有人负责底层采集,有人负责分销渠道。总而言之,被坑的只有广告主,虽然获得了大量的注册和转化,可是一群僵尸号又能带来什么价值呢。说到这里,再多说一个活生生的例子。

在 2014 年底外卖大战的时候,各家外卖平台轮番上演烧钱大戏,例如满 15 减 12,还可以用红包,吃一顿饭不超过 5 块钱。然而这都不是重点,记忆最深刻的是一次“满 12 减 12”的活动。因为这个优惠的存在,当时学校周边餐馆的饮料一下子全都卖空了,因为大家都不点外卖,改点饮料了。一瓶饮料 3 块钱,12 块可以点 4 瓶。下单,减免,一分不花,4 瓶饮料到手。于是乎,校园中到处洋溢着甜蜜的气氛,人人都是羊毛党,见面打招呼都是“喝了吗”。这场闹剧过后,新的一轮补助又来了,但是我到现在我实在是想不起“满 12 减 12”的外卖平台叫什么名字,只记得看到可乐没货时,那心情是相当失落的。

顺便说下,中国的 P2P 行业在经历了几年的火热后,今年大有降温的趋势。为什么那么多的 P2P 都销声匿迹了呢?它们无非是两个结局:一、卷款跑了;二、被羊毛党薅死了。

羊毛党的市场敏感性和组织能力,是令人乍舌的。君不见,从美团到滴滴、乃至最近淘宝针对新注册用户的激励政策,很快便成为羊毛党们狂欢的盛宴。“一日薅出七千元”、“3 日获利五万”,靠劳动发家致富不再是梦。

十四、淘宝代销 (S, A, H)

淘宝代销是一类左手倒右手,赚取佣金的作弊手段,其场景是这样的。假设广告主让有一号店渠道的代理商帮忙做品牌宣传,按 CPS 计费,希望商品在一号店上能够打开销路,完成品牌的积累和沉淀。为了尽可能多的提高收入,该代理商转身在人数更多的淘宝开了家店铺,卖广告主的商品。用户在淘宝下单后,代理商直接从一号店发货给用户,算是完成了一个 Sale。

如果您在淘宝下单,收到了一号店寄来的包裹,不要觉得很奇怪,东西没错,大胆的用就是,只是肥了代理商,可怜了广告主。

十五、Cloaking (M/S, N/A, R/H)

Cloaking 是“掩盖,遮盖”的意思,指的是在广告投放的过程中,屏蔽掉一些 IP 地址,不对其进行广告展示,相当于是作弊者维护的“黑名单”。那么问题来了,谁会上作弊者的黑名单呢,当然是对广告市场起监管作用的人了,比如搜索引擎、或者主要广告平台的公司 IP。

考虑到养一个广告投放账户成本较高,为了在一次投放中收获更多的利益,作弊者想方设法要延长广告的投放时间。如果这个广告出现在搜索引擎上,那么作弊者就会使用 Cloaking 方法,屏蔽掉搜索引擎公司所有的 IP 地址,导致相关监管人员在处理投诉或举报时,难以快速复现用户所投诉的场景,继而拖延审查流程。当搜索引擎的监管人员通过排查广告创意,确定作弊者违规时,作弊者早已赚的盆满钵满,洋洋洒洒而去了。如果你要问作弊者是如何知道搜索引擎公司所有的 IP 地址的,呵呵,真相总是出人意料。

由此看来,Cloaking 不是一种作弊手法,而是一种辅助手段,甚至是目前作弊者都会使用的一种手段。通过增加监管人员的审查成本,延长广告的投放时间,多赚一笔是一笔。

Cloaking 的原理看起来简单,做得好不好可是大有区别了。追求极致的作弊人,有时闲着闷了,会临时中午去机场,随便赶上哪班就搭上哪班飞机,独自在 Facebook 的园区发呆,一语不发地记下附近所有 wifi 的 IP,当晚再飞回去。

十六、下载归因(S, A, R)

所谓归因(Attribution),通俗点的解释就是,到底是什么因素,最终导致了目标的达成,举个简单的例子。足球场上,A 一脚打门球进了,A 说球是我进的,荣誉是我的。但是,A 的球是 B 传给他的,不传球他也不会进球,所以 B 说他也有功劳。这时食堂做饭的大妈说了,都是我给你们营养调的好,你们才身体倍棒,所以这功劳也有我一份。综上,这个球应该归谁呢?常理上来说,这份荣誉人人都有;但是实际上,是 A 抢夺了 B 的传球贡献,也抢夺了食堂大妈的做饭贡献,独自一人享受进球荣誉,这就是归因。

下载归因,是一种钻移动应用下载监测逻辑的空子而产生的作弊手段。在移动应用下载广告中,第三方监测一般规定:用户点击广告后一段时间内,产生的下载行为算作广告效果。具备科学精神的广告从业者必然会思考,如何能将自然下载也变成钱呢,这太简单了,来访的每个用户,不管下载不下载,先记录一次点击不就完了!这样一来,只要用户后续产生了下载,那就希特勒看地球——全是我的!

下载归因的后续效果怎么样呢?当然也是好的,因为本质上也是抢的自然下载。

当然,钱不是那么好挣的。这里还有一个问题。如果将所有用户都提前标记点击,那么数量就会太庞大,很容易看出来数据明显造价。为了把事情做的好看一些,应用市场也要对来访用户进行一下受众定向、广告召回和 CTR 预估,看看用户点击哪些 APP 的概率最大,有选择的提前加上点击。你看,一套作弊抓弄的广告系统就攒出来了,骗个钱还真是不容易呢。

为了人身安全,怎么准确判别下载归因、怎么躲过反作弊的追踪、有什么更先进的新手段,我们在这里就不多谈了。

十七、买栗子 (S, N, H)

”买栗子“,即买 sales leads,指的是以”精准“广告的方式为广告主带来销售线索的广告手法。关注本公众号的朋友应该都知道,在“精准”汽车广告真的能带来销售线索么?别逗了一文中,通过对效果古那哥哥和品牌广告的分析,我们曾经揭露过以用精准广告获得大量 sales leads 是一个骗局,哦不,是一个大骗局。

在今天的中国的广告市场中,即使是如某某和某某某这样大的广告平台,也基本上靠造假完成广告主的 leads 要求,更遑论其他第三方广告平台。当然,sales leads 造假并不困难:找些社会闲散人员,培训其点击广告、留资料、接厂商电话乃至到店的全过程,像群众演员一样走一遭也就是了。曾经有友人相告,他在一次投放汽车广告时,两个渠道采集到的 leads 居然百分之九十是重合的,这样低劣的导演水准,让人唏嘘。据说,在京郊廊坊至三河一带,各行业广告主销售线索批量人肉生产产业正在蓬勃发展,并且都是以大数据的名义。如果非要给一个数字上的估计,我想说,当今显示广告带来的汽车 sales leads 中,至少有 70% 都不是真实的。

当然,leads 是假的,并不代表广告是无效的。不过,实际操作中,由于对 leads 这个不正确 kpi 的追求,很可能使得正确市场目标的执行效果大打折扣。这种以生了几个孩子来评价搞对象质量的所谓数据驱动方法,真的是历史的进步么?别丢人了!

十八、搞定人 (M/S, N/A, R/H)

纵然你把以上十七种武艺掌握得纯熟,如果不会最后这一招,那么也是竹篮打水一场空,而这一项秘技,就是——搞定人。

决定广告市场走向的,从来都是人。在市场上深入调查一圈,你会发现,大多数作弊者的手段不仅谈不上高明,简直可以用拙劣来形容。为什么简单拙劣的手段仍然可以奏效呢?是不是甲方的人都是火星来的呢?当然不是,是因为他们早已变成了半个乙方的人。

典型的例子,当然是前些日子某动物汽车品牌市场部公然通过 DSP 收取回扣,以劣质乃至伪造的流量洗钱的案例。说它典型,是因为每一次大规模的作弊活动背后,往往都有着一段可歌可泣的商业故事。

对于媒体、广告公司来说,搞定人意味着可以放心大胆地作弊;而对于广告主来说,如果不能管好自己买流量的负责人,研究多么高明的反作弊技术,也是无济于事。

好的,十八般武艺就介绍到这里了。篇幅所限加上思想顾虑,很多细节并未展开讨论。觉得看的不够过瘾的读者,或迫切需要实操某些方法的读者,咱们还是私下交流吧!

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 399 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 20 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 492 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 417 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    3 引用 • 80 回帖 • 2 关注
  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    7 引用 • 30 回帖 • 451 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 545 关注
  • 安装

    你若安好,便是晴天。

    128 引用 • 1184 回帖
  • 音乐

    你听到信仰的声音了么?

    59 引用 • 509 回帖
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 13 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    45 引用 • 113 回帖 • 315 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 626 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    261 引用 • 662 回帖
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 636 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    941 引用 • 1458 回帖 • 150 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 427 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 10 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3168 引用 • 8207 回帖
  • 自由行
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 423 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 513 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    96 引用 • 330 回帖
  • OnlyOffice
    4 引用 • 24 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 421 回帖