内容产业的“马蜂窝”被捅,能捅破行业背后的虚假泡沫吗?

萌新,欢迎加入考新闻2019先锋2群:664034386,更多院校微信专属群请私信考新闻主页2君(kaopress15)

10月21日,自媒体“小声比比”的一篇文章,《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》在朋友圈迅速刷屏。这篇文章通过列举大量的数据分析指出,成立于2006年、已获得4轮融资的马蜂窝旅游,其平台上2100万条点评数据中,有7454个抄袭账号,这些抄袭账号从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了572万条餐饮点评,1221万条酒店点评,占马蜂窝平台全部点评数量的85%。

一石激起千层浪,马蜂窝迅速采取了一些实际行动。现在在马蜂窝网站上搜索上文中提到的涉嫌抄袭和虚假信息的账号时,许多账号的数据显示为0。21日晚上,“小声比比”推送文章,声称马蜂窝已经将报告中提及的账号数据清空。

22日,马蜂窝将乎睿数据团队和小声比比创始人告上法庭。同日,马蜂窝发布官方声明,称点评内容只占总体数据的2.91%,平台中游记和攻略占比为78.91%,“自媒体将不法商家的违规行为归结于马蜂窝,与事实严重不符”。马蜂窝表示,涉嫌虚假点评的账号数据在整体用户中的占比更是微乎其微,并已对这部分账号进行了清理。

值得一提的是,马蜂窝声明一出,微信公众平台便设置了“争议详情”功能,在打开小声比比的文章之前,就会弹出一个显示“以下内容存在争议”的页面,将小声比比、马蜂窝对立两方的立场同时呈现给读者,引导读者理性判断此次风波。

随后,“小声比比”又以一篇《我承认,我们是有组织攻击马蜂窝的》文章予以回击,作者梓泉表示,马蜂窝的声明是在故意偷换概念,用点评的字数占比总UGC产出字数的统计方法不科学,“这至少7454个抄袭账号在用户中占比并不多,但是它贡献了85%的点评啊!”

在这篇文章下面,有自称马蜂窝前员工的用户在下面评论,称马蜂窝曾购买书籍《孤独星球》再润色,并成为了官方的第一版攻略。《孤独星球》为旅行攻略系列书籍,为由同名的世界最大的私人旅行指南出版商出版。

被捅的马蜂窝背后是行业潜规则的又一次示众,其中揭示出的千万量级的数据造假,也只是内容行业虚假繁荣的冰山一角。有媒体指出,此次马蜂窝风波又是一场互联网原罪的典型事件,内容产业的“马蜂窝”又一次被捅,这次到底能捅破行业背后的虚假泡沫吗?

一、马蜂窝的崛起之路:从旅游分享社区到互联网平台独角兽

1、消费升级带来的利好

2006年被称为社交网络之年,MySpace、YouTube和Facebook在众多新兴网站中脱颖而出,而马蜂窝就是成立于那年。当时还在搜狐工作的陈罡和吕刚二人创办了“旅游攻略”社区,号召网友像蚂蚁和蜜蜂一样协同合作,将自己的旅行经验分享到网站中,为更多人带来旅行攻略以供参考。成立之初,马蜂窝还只是一个基于兴趣集聚的普通业余社区,用户以游记的形式记录见闻,分享攻略。

根据马斯洛的需求理论,随着生活水平的提高,人们对于生活的需求不仅仅局限于物质层面,而是开始乐忠于精神文化消费。直到2010年,我国经济持续快速发展,国人旅行需求快速增长,旅行攻略成为国人的刚需,这个时候马蜂窝的创始人才从原公司离职,正式开始将其作为一个商业项目来运营。

(数据来源:《艾媒报告丨2016-2017中国在线出境游市场行业研究报告》)

旅游业快速发展带来的变化,不仅呈现在数据的增长上,还体现在消费者旅游观念的变化。国人逐渐意识到跟团旅游的不便,一方面,跟团游个性化不足,人必须追着行程走;另一方面,年轻人普遍不喜欢“上车睡觉、下车撒尿、景区门口拍照”这种上一代人“到此一游”式的旅行方式,他们追求享受旅行本身,渴望深度体验当地人的生活。

然而,自由行最大的障碍是信息不对称,诸如交通景点、住宿、美食、语言等问题,用户要想自己搜寻信息则会消耗大量的时间成本,旅行攻略因此成为刚需。2012年,恰逢用户需求和社群经济的双重利好,脱胎于旅行兴趣社区的马蜂窝,迎来了创办以来的发展黄金期,开创了“内容+交易”的盈利模式。

2、海量UGC造就的差异化优势

马蜂窝是以内容起家的,海量UGC一直是马蜂窝最重要的差异化优势,也是马蜂窝开拓商业版图的制胜法宝。马蜂窝崛起成为互联网旅游平台的独角兽,原因离不开大量素人分享的旅行攻略,以及由其带动的千万级流量。

克莱·舍基在《未来是湿的》一书中提到,“基于爱、正义、共同的喜好和经历,人和人可以超越传统社会的种种限制,灵活而有效地采用即时通信、移动电话、网络日志和维基百科等新的社会性工具联结起来,一起分享、合作乃至展开集体行动。”这种无组织的组织力量,虽然看不见摸不着,却能够带来难以估量的影响。马蜂窝社区的崛起,印证了分享是互联网的根本特质。

马蜂窝社区为用户的表达欲望提供场所,用户在分享个人旅游经历见闻的同时,也在他人的评论、点赞中赢得群体认同,从而实现自我价值的提升。所以哪怕平台没有相关的物质激励,依然能够激励用户源源不断地进行创作分享。

创始人之一吕刚道出了其中关键:“游记是国人唯一能大面积落笔的题材。除了专业的写作者,我们普通人能写点什么呢?就剩下游记了。而且旅行是我一次性花了很多时间和金钱的事,它有可能是我今年最开心的事,加上是门槛比较低的创作题材,所以就有了写游记的基础。有了这个基础,我们是活跃的社区,会用游记的方式进行社交。聊旅行是一个深度话题,相互交流取经这也是一种让人开心的体验。”

2010年,马蜂窝开始商业化运作时,OTA(Online Travel Agency,电子旅行商务)市场激烈正酣,与携程、去哪儿、途牛等企业不同,马蜂窝没有切在线售票的蛋糕,而是集中精力挖掘内容价值,增强社区用户黏性。正因如此,很多人养成“先在马蜂窝上看攻略,然后去其它家订机票、酒店”的习惯。

2015年,在线旅游市场风起云涌,一场惨烈的混战厮杀从上游烧到下游,混战之后的格局出现了新一轮洗牌:携程、去哪儿合并,紧接着BAT巨头纷纷布局O2O领域,OTA行业逐渐变成寡头之间的竞争。因此,当初靠着UGC入局的马蜂窝则显得独善其身得多。

然而马蜂窝的早期盈利,只有微薄的广告收入。于是2015年,马蜂窝进行品牌升级从“社区”转向“平台”,以“内容+交易”模式为核心,不同于携程、飞猪等B2C产品,马蜂窝开启了主打自由行的C2B道路,从而成功实现差异化运营。

同年,马蜂窝上线了自由行产品“自由行商城”,与OTA、传统旅游代理机构打通,用户可以在商城中自己选购机票、酒店、签证、wifi、保险等产品,下单后与第三方商家进行交易,马蜂窝收取平台分成。

(数据来源:艾媒咨询,《2018上半年中国在线旅游行业研究报告》)

面对商业变现的问题,吕刚曾公开表示马蜂窝是独特的一类,因为它打通了“决策-交易-分享” 的闭环:用户通过其他人在平台上分享的攻略做出去哪里的决策,进而在平台上做出旅行交易,旅行回来继续在平台上做攻略撰写、分享。这是与其它OTA卖产品相比最大的区别,也是马蜂窝的核心竞争力。“我们有长期货币化的可能,因为我们是一个社区。我们有大量内容(攻略),而内容是做出旅行决策的重要依据,也就是我们从这个切入点进入。只有我们是先有用户,再逐步组织出商业化产品,而它们不是,它们是有了产品之后去招呼用户。”

这次马蜂窝丑闻的曝光,之所以会引起公众如此愤怒,正是因为人们一向视为干货满满的有爱社区,竟有可能是商家制造的“鬼城”,这也从侧面印证了UGC在互联网C2B产品中的重要性。一旦这一核心竞争力被证伪,对此类企业未来的发展前景将是沉重的打击。

3、算法技术巩固行业制高点

马蜂窝不但洞察到用户心理,为个人强烈的表达欲望提供出口,还利用技术提高用户的活跃度,通过算法技术提高优质游记的曝光率,比如在用户浏览页面反复露出、推至首页“蜂首游记”、贴标签,同时也让新游记在第一时间露出。

马蜂窝手握海量UGC的宝贵资产,占据行业制高点。另一方面,借助强算法技术的加持,不断优化用户服务,增强用户黏性,积攒了一大批忠诚度极高的社区用户,以此维护、保持自身的制高点。

近年来马蜂窝在对外宣传中,除了用户原创内容UGC和自由行交易平台,大数据能力也是其自诩的核心竞争力之一,利用技术能力分析平台内容以助力商业化。

据新京报,今年5月下旬,马蜂窝与中国旅游研究院在贵州共同成立“自由行大数据联合实验室”。据陈罡介绍,这个实验室结合了中国旅游研究院的科研能力和马蜂窝的数据采集和分析能力,是全国首个专门研究自由行市场的大数据实验室。“马蜂窝平台上1.3亿用户的海量大数据,将助力地方政府及旅游企业精准把握市场趋势,优化资源配置,提升效率和旅游服务质量。” 而此次马蜂窝被内容抄袭丑闻被曝光之后,作为其大数据分析原材料的内容可信度打折是否会影响到大数据能力,我们尚未可知。

二、数据爬取:UGC内容,到底属于谁?

马蜂窝被捅,又一次将数据爬取推入公众视野。爬取指的是利用爬虫程序自动抓取某个网页的信息。在爬虫成为行业通病的背后,存在着一条技术门槛与使用成本双低的产业链条。

凤凰网旅游,在百度搜索“酒店+爬虫”则会出现大量关于酒店采集爬虫的工具和服务信息。在一家以携程为主要抓取对象的网站中,该公司提供的爬虫技术可批量采集携程网国内国外酒店点评评价。数据爬取的信息包括评价ID、酒店ID、酒店名称、评价时间、评价内容/图片/分数等,甚至可以通过技术手段对其进行清洗和机器学习。

因此关于数据爬取而产生的纠纷并不少见,早在2008年,淘宝屏蔽了百度的搜索爬虫,防止百度抓取淘宝用户数据信息。2017年8月,今日头条在未经微博授权的情况下,自动抓取了微博自媒体账号的内容,最终微博暂停了第三方接口。前不久,小红书也曾发表官方声明称平台上的原创笔记被大众点评抄袭、搬运。

1、互联网原罪下的行业通病

网络安全行业一名从业者接受刺猬公社的采访时提到,爬取数据是互联网平台惯用的方法。“互联网产品在上线之初都会经历‘冷启动’的阶段,在这个阶段中是很难获得足够数量的用户数据的,所以爬取别家的数据是很普遍的做法。”

他指出,爬取数据在新平台冷启动阶段是惯用方式,以至于当一家平台的数据和另一家平台出现重复时,很难说是哪一方爬取了对方的数据,“甚至有可能是两方共同爬取了另一家平台的数据。”

正如新京报所言,“为了满足短时内多轮融资的需求,在自身原创内容生产能力有限的情况下,不少互联网企业往往采取扒文这一方式,用爬虫技术从网络上扒取大量来自其他平台或者用户个体的内容,再以水军的方式来推动其内容的权威性,形成一个虚假的内容生态,成为互联网行业的原罪。”

与此逻辑相对应的还有电商平台的刷单、公众号文章阅读数和微博转发点赞的刷量,以及更为常态化的网上内容被“洗文”,由此造成的结果就是,包括OTA在内的不少互联网平台,一方面遭遇被其他企业爬取的权益侵犯,另一方面也同样在爬取他人的数据信息,形成了行业内的人尽皆知的潜规则。就像此次风波中的马蜂窝,他从大众点评上爬取的数据,也极有可能是前者从别处扒来的。

如此往复的恶性循环,到头来真正受损害最重的用户,数据爬取导致各平台内容的同质化,大量僵尸号和水军刷屏,导致真正有价值的旅行攻略无人问津,出现劣币驱逐良币的局面。

(图片来源:小声比比;乎睿数据罗列出马蜂窝每条游记下面都有千篇一律的机器人口吻)

2、UGC内容,到底可以“偷”吗?

UGC内容,爬取能算偷吗?抓取其他平台用户评论是否构成侵权?针对此问题,新京报在评论文章《马蜂窝被“捅”,用户评论到底属于谁? 》中指出:绝大部分的UGC平台在网民协议中,都有关于版权的声明,一般由两部分构成:一是明确本平台产生的内容,其他主体不得非法获取;二是用户在平台发布的自创内容,版权归本平台所有。按照著作权法的规定,声明中的第二部分内容是无效的,因为用户自己完成的作品,版权自然归属用户。

如果在平台产生的内容版权归属于用户,那么平台在他人非法抓取内容时,是否有权利维权呢?答案当然是有,只不过不能局限在著作权法,而是存在竞争法之中。

非法抓取他人内容,这对于以UGC内容为核心竞争力的新经济形态是非常严重的不正当竞争行为。后果可能会有三个:其一,侵权者不劳而获地通过爬虫剽窃内容,损害了被侵权人的合法权益。其二,爬虫抓取,造成公众认知的混同,侵害了被抓取者的市场信赖度。其三,抓取行为降低了被侵权人的市场份额,稀释了用户黏连度。所以,此类情况,一般按照竞争法第二条,即违反诚实信用原则来判定。

但是并非所有内容都不能抓取。如果是用户自己在多平台发布的信息,这属于用户自由,首发平台没有权利进行限制。另外,对于一些生活类、广告类的信息发布,用户自身就希望信息的扩散,这类信息的抓取应推定是否符合用户意愿。

据新京报评论,马蜂窝事件给以UGC为主的平台敲响警钟,要做到合法合规至少要保证以下几点:第一,非广告类的用户信息,平台不能随便抓取。第二,对于一些质量很好的非本平台信息,若想获取一定要征求发布者的同意(首发平台所谓的网民协议约束,在法律上是无效的)。第三,爬虫抓取的信息,不要欲盖弥彰地修改内容,去掉水印或者创造出假网民发布,这种行为会导致性质变化,面临着被诉讼的风险。

三、“皇帝的新衣”:“马蜂窝们”为什么要流量造假?

2017年12月,马蜂窝完成1.33亿美元D轮融资后,公司创始人陈罡与吕刚提出对马蜂窝的愿景是三年后成为中国最大的旅游流量平台。据马蜂窝向《第一财经周刊》提供的数据显示,平台平均每天产生3000篇用户原创游记,每月新增18.5万条目的地旅游问答,累计超过3200万的点评,以及8000万月活用户。

虽然马蜂窝对外一直宣城旅游内容的商业化是其主打内容,但在实际运作中,平台在品牌营销中心投入了更大的比例,聘请黄轩为品牌代言人,花费1.65亿元成为央视世界杯转播的赞助商。

既然如此,“手握一手好牌”的马蜂窝为什么要流量造假?数据造假又为何成为行业默认潜规则?

1、垂直内容社区之痛:流量被稀释

据艾媒咨询,2018年,由于优质UGC内容的稀缺及变现能力不足,马蜂窝已经跌出了在线旅游平台的第一梯队。

(数据来源:艾媒咨询,《2018上半年中国在线旅游行业研究报告》)

由于大多数人一年也不会旅行几次,所以用户一般只有在面临实际需要时,才会主动使用马蜂窝这种单纯生产旅行内容的APP。

作为同样是单纯美妆内容社区起家,小红书致力于将自己打造成一个综合性的社区平台。现在很多“居居女孩”不仅在小红书上看美妆,还看装修、美食、旅行等所有涉及生活方式的内容,使得它具有了远远高于其他纯美妆社区的用户黏性。

2015年以来,以咪蒙为代表的个人IP、KOL和网红经济开始崛起,一些旅行达人选择将主要精力放在更为多元活跃的平台上,如微博、抖音、小红书等。当旅行KOL积攒了一定的用户量之后,粉丝对平台的认可就会继而转化为对个人IP的认可。部分KOL离开转战其他平台,同时带走一批马蜂窝原先的忠诚用户,使得马蜂窝的流量进一步被稀释。

2、数据大跃进时代:人人都为数据狂

身处一个为数据大跃进的时代,无论是流量明星、影视剧,还是互联网平台,人人都为数据发狂。如今粉丝爱爱豆的表现,就是把自己活成他们的水军机器人。看看流量明星的微博,不禁令人对这个世界产生怀疑:我们的国家真的只有14亿人口吗?真的只有7亿多网民吗?

而这背后则是除了公司买的水军,其中一大部分数据都是粉丝靠着“轮博”出来的,粉丝通过反复转发爱豆的某条微博,生生用人力将转发数据拉上去,以此来显示自家爱豆的商业价值。

对数据的狂热从电视网络播放量可见一斑,2017年年初《三生三世十里桃花》以全网播放量300亿收关。没到半年,赵丽颖、林更新主演的《楚乔传》还没播完就突破了300亿,截止收关时已突破400亿大关,创造了中国电视剧历史

回到马蜂窝等OTA平台更是如此,据新京报,“通过数据爬取带来的内容及流量数据,是OTA等互联网平台在融资或上市后股价、业绩的重要支撑点,海量内容样本和数据可以获得来自资本市场和用户的更多认可,从而获得投资或股价的丰厚回报。”

在人人高呼“流量变现”的时代,因为资本认可流量,于是明星、自媒体、平台都开始疯狂的追逐流量。微博转发数、公号阅读数、内容好评数都不过是他们装点门面的头饰,并且不惜为此雇用大量水军、营销号。

2014年,马蜂窝创始人陈罡曾在微博炮轰去哪儿网“花钱雇人为酒店写正面评价”,称其每条500元“购买正面评价”,他表示“我认为只有真实评价才能帮助用户,这也是你我事业的根基”,不知今日的他又会作何感想。

小声比比作者梓泉在最后一篇回击文章的结尾处说到,“我们到底是要活在水军、造假、抄袭中。还是活在一个没那么繁荣,但诚实能得到回报,真话可以得到保护的世界?”我们不能因为大家都知道了皇帝没穿衣服的事实,却嘲笑揭露真相的那个孩子。

不过令人遗憾的是,互联网注意力迅速更迭的状态下,过不了多久,我们就会忘记今天的愤怒和伤痕。

全国班以及人大、复旦、中传、暨大、湖大定制版

Hash:fbe07b15567f47a1271d2f987d45cb40c23425ed

声明:此文由 考新闻 分享发布,并不意味本站赞同其观点,文章内容仅供参考。此文如侵犯到您的合法权益,请联系我们 kefu@qqx.com