国家首次提出打击洗稿!洗稿之痛,到底痛在哪里?
作者:张洁,首发:新榜
7月16日,国家版权局、互信办、工信部、公安部等四部门宣布联合启动 “剑网2018”专项行动。这个行动旨在打击网络侵权盗版,自2010年开展至今已是第9年。
值得关注的是,新媒体的“洗稿”问题在今年被首次提及,换言之,这是国家有关部门第一次提出打击洗稿。相关违规账号或面临新一轮严查,甚至关闭。
此次行动将整治自媒体通过“洗稿”方式抄袭剽窃、篡改删减原创作品的侵权行为,并规范搜索引擎、浏览器、应用商店、微博、微信等涉及的网络转载行为。
虽然其中并无提及更多细则,但仍不失为一个重要信号。消息一出,也再次引发部分从业者关于洗稿的讨论,以及对于背后一系列问题的思考。
洗稿这个词,新媒体人应该都不陌生了。
在内容创业时代,每个创作者都明白原创的艰辛,所以没有一个词可以像“洗稿”那样让我们深恶痛绝。毕竟,原文照搬的抄袭都是肉眼可见的铁锤,洗稿却能把你的东西改得亲妈都认不出但又让你觉得明明就是你的。
这是一种什么感觉呢,知名自媒体人魏武挥曾用“吃了苍蝇”来形容被洗稿的感觉。
此前,“和毛利午餐”因洗稿纠纷在公号上大战几个回合后,甚至以洗稿为题写起了连载小说,虽注明纯属虚构,但可见胸中愤懑。
从霍炬差评对簿公堂、六神磊磊手撕周冲、樱桃画报致信闪送、格十三发文指被众多账号洗稿至今……谈及洗稿,能被人很快记起的,往往至少有一方是头部大号。这些案例相较不为人所知的那些,还只是沧海一粟。
但目前,无论是法律、技术、平台亦或行业规范,似乎都很难解决这个问题。大多数情况下,原创者只能在家气到跺脚,破口开骂。不过问题仍然存在,而且是整个行业的痛点。
如何界定洗稿,如何推动解决洗稿难题,这背后有哪些错综复杂的阻碍?借着今天新推出的整治消息,我们尝试重新对这个话题做了一些梳理和探讨。或许不会起到更多帮助,但希望能抛砖引玉。
01
是为人类知识更新做贡献,还是剽窃?
洗稿并不是法律上的概念,而是传媒行业特有的名词。
关于洗稿的定义,国内传媒法专家魏永征教授曾在文章中介绍过,“洗稿”一词出于香港新闻界,当时指的是某个新闻事件,没有到场采访的记者从广播电视或网上的报道获取信息,撰文发表,或同行间分头采访后对事实交换共享,基本都不涉及版权问题。
但今天所说的洗稿,语义已经发生了变化。简单说就是,通过调整变换一篇原创文章的段落、字词、语序等,将其“清洗”成看似全新的内容,但实际上是变相的抄袭和剽窃,即“实质性相似”。
“半信半疑”改成“将信将疑”,“张三李四”改成“张四李三”,将文字转化成图表,图表改成文字,更有甚者,将一段话拆分成几段,或将几段话拼成一段,一篇文章拆成几篇,几篇凑成一篇。花样层出不穷。
有网友这样形容被洗之后的文章,由于很多洗稿都在替换同义词,导致最后“文章呈现出一种迷之外国人写中文作文的感觉,让原作者石化在电脑前,不想追讨,恨不得撇清跟这段奇文的关系”。
洗稿也不是什么新媒体的产物,在传统媒体时代或者更早,可以说有原创的地方就有洗稿,只不过呈现形式与带来的影响有些差别。总的来说,关于洗稿的定义并没有标准答案,但有一个大致的行业约定俗成的印象。
比如刺猬公社创始人叶铁桥认为,关键在于文字中是否包含了独特的劳动成果,如果是,应当注明源头以示尊重,“为了逃避被认出来,而在原稿基础上做改头换面和整容,就是洗稿”。
围绕洗稿,有一些比较常见的关键词:搬运,替换,拼贴,整合,思想抄袭。
随着资本的进驻,内容早已不仅是简单的个人表达,围绕流量、变现等一系列规则,创业者以内容为匙,建立起一个个商业工厂,不同类别的内容就像不同口味的面包,可以被批量制造。
原创者日复一日守着键盘码字总是苦兮兮的,而且单兵作战耗时长,运营推广能力弱,搬运党洗洗抄抄加个标题党,反而可能在短时间内以低成本的方式获得高流量。
除此之外还有一些其他因素在推动,比如用户其实不在意,或者说无法察觉文章内容是否洗稿。
再如知名自媒体人魏武挥曾提到,有些洗稿是为了应对百度新闻合并同类项的呈现规则,改成不太一样的文字以便获得更多点击。
在流量与资本的种种诱惑下,自媒体时代的洗稿大军横空出世,而且已成体系。
不少新闻媒体包括新媒体都研究过这背后的做号江湖,新榜也曾暗访洗稿的灰色产业链,得知洗稿者有人千字10元,也有人月入过万。
整个洗稿市场要比我们想象的成熟得多。其中有买卖双方,有人做中间生意,也有各种洗稿工具、原创检测工具和伪原创教学等等,还有不少传授洗稿技巧的文章和课程,美其名曰“间接为人类知识更新做出贡献”。
让原创者深恶痛绝的洗稿,对这条洗稿产业链上的从业者来说,这只是一项普通的工作而已。
02
“每天跟洗稿的撕逼都快让我爆血管了!”
即便再多人对洗稿者穷追猛打,目前要解决洗稿问题仍然有很多障碍。
现实诱惑的层面上文已经提到,其他比如洗稿的量大,我们所知的洗稿案例可能不过是九牛一毛。大号洗小号,文章刷屏被发现的概率更高,小号尚可发文鞭挞;小号洗大号,大号可能根本就无从发觉。
由此还带来社交网络上热点事件的伪盛况。新榜曾做过大量热点话题的数据稿件,几乎每次采集数据时都发现同一个话题,往往有很多标题和素材相同或相似的文章。
我们不排除其中有爆文带来的大量转载,但其中也不乏一些账号为蹭热点粗暴洗稿,于是我们能看到同一套素材,换着花样在不同的账号反复出现,仿佛大家用的是同一个素材库。
洗稿的方式和花样之多,又让整个问题变得更为复杂。自媒体之间洗的,新媒体与传统媒体之间洗的,还有自己洗自己的,比如矩阵号之间互相洗稿,一稿多用,外人很难对此判责。
还有跨平台洗稿的,几个内容平台洗来洗去,这也是维权难度最大的一类。
乌鸦电影创始人乌鸦就聊到这方面的困惑,他提到,目前微信公众号平台内的洗稿由于有原创标签保护还不算太严重,“更严重的是跨平台的抄袭和洗稿,其维权成本之高,需要提供的证据之多,流程之复杂,这都让原创者失去了维权的动力”。
这逼得一些自媒体人不得不多平台分发,稍晚一步,在其他平台可能连原创都标不了。
还有一些连原创都不必标的平台。比如自媒体人摇铃铛说,她的公众号文章被一个微博账号连续抄袭了三年,她每次看到都上去私信骂,对方虽然也道歉,但来年照抄不误。
“每天跟抄袭洗稿的人撕逼都快让我爆血管了!”提及抄袭和洗稿,摇铃铛整个人都处在一种暴走状态。
这也是推动解决洗稿问题的另一道坎,很多自媒体人并没有精力去处理洗稿。即便不走法律程序只是撰文撕逼(走法律程序就更不用说了),作者都需要搜集提供大量证据,一战就是几个回合。
“这他妈太累了,连六神磊磊都说怼人一次累三天,不是每个原创者都受得了这种折腾。”乌鸦感慨说。
除了举证难,成本高也是个问题,或者说付出与回报不一定成正比。霍炬当时索赔1块钱,明确说目的不在赔偿而是“测试”。也就是说,不是所有的账号都会选择用曝光等方式争取权益,此前就有被洗稿的小号通过协商让大号置换资源导流,作为补偿。
还有一个问题恐怕来自平台。此前,新榜曾发文《没有自媒体平台纵容默许,哪来的抄袭拼凑做号江湖?》,提到自媒体平台之间由于相互竞争和相对封闭,以及部分平台围绕补贴政策的内部腐败,诸如此类的问题,带来一系列破坏原创的恶果。
此外,有业内人士透露,一些平台会依据自身对内容数量的需求和外界环境的变化,来调整平台对抄袭、洗稿等劣质内容的判定规则和技术方案——当平台需要海量内容时,便对抄袭洗稿睁一只眼闭一只眼、放任和纵容;当外界环境发生变化时(包括主管部门监管或竞争对手起诉等),它们就会动用技术手段干掉那些抄袭洗稿而来的内容和账号(尤其是明显抄袭的内容)。
不过,最麻烦的还是洗稿的界定。
虽然上文也提到洗稿的定义,但在实际案例中,如何判定洗稿仍然是最大的难题,无论对平台还是法官(退一步讲,即便平台有足够的人力进行人工审核,恐怕也很难断)。
正如魏武挥所说,洗稿这种事情,感觉为主,“就是让看过原稿的读者,再读此稿,会有一种强烈的‘咦,我好像哪里看过’这种感觉”。
但主观感觉是很难讲清楚的。摇铃铛认为,“拙劣一点的洗稿还是很容易看出来的,更难界定的是把你文章的中心思想吸收了再用不同的例子和方式去表达”。
关键在于,能否判定是否构成了实质性相似,引起相关受众混淆,否则最多只能算“同题作文”。
其实也好理解,从法律的角度来说,假如认定范围过宽,反而会损害宪法保护的创作自由。但究竟是抄袭还是同题作文,这中间的度如何把握,目前还没有人能给出一个标准。
03
洗稿维权,需要更多的霍矩,还是区块链、哈希?
约束洗稿,显然不能纯靠一张脸皮。如何解决洗稿,其中一个核心问题正是上文提到的“洗稿的界定”,一直以来很多业内人士都在参与探讨:
1. 建立反洗稿联盟,制定行业公约
魏武挥之前在文章中就提到这个设想,建立一种反洗稿联盟、行会、公约这样的非盈利组织,由具备声望的媒体发起,制定一些洗稿的认定方式,然后公益性地聘请一些专家从业者来裁定。
但方案真要实行起来恐怕很难。自媒体人灰鸽认为,类似这样的组织成立后无非是吆喝几句,作用有限,“断人财路这事儿,维权成本极高,如果不是头部作者,被洗稿后有大家帮忙吆喝吆喝曝光一下已经很不容易了。”
2. 平台机制的优化
“罗超频道”认为,微信上的洗稿行为,通过二次申诉+人工审核,就可以清理掉大部分。“二次申诉应该不由机器审核,而是人工审核。如果人工审核之后还是认为没有抄袭,再给一次复议机会,换一个人审。”
增设人工审核的期待是好的,也不失为一种方法,但个人认为作用不大。一来腾讯不见得会增设如此多人力来做这件事,二来微信目前对洗稿同样没有判定标准,仅凭审核人员判断,恐怕会引来更多纠纷。
当然,这其中也有对平台作为的期待。此前,有业内人士认为微信的原创体系反而带来了更严重的洗稿。由于原创标后不开白无法直接转载,导致一些账号选择用洗稿的方式搬运。但由于微信目前在技术上无法辨别洗稿,反而给一些洗稿文打上了原创标。
事实上,微信也一直在强化原创的价值,不论是对违规抄袭的打压,作者体系的建立,还是对转载模式的探索。从平台的层面来说,应该更有机会通过机制和功能的调整,例如公号违规机制、打赏功能、流量主分成等作为监督和奖励的手段,创建更适合当下互联网语境的知识共享生态,通过优化内容创作分享的模式改善洗稿。
3. 技术的可能性
“传媒茶话会”曾发文提到,上海治宬网络科技创始人傅耀称,现在绝大多数公司都是依靠技术直接对比文章中字词的相似度,因此拿洗稿无可奈何,但只要改变技术路径,用语义分析便可解决洗稿检测的难题。
不过傅耀也提到,开发成本是个问题,目前尚无单家媒体做定制开发。但至少,提供了一种思路。
浙江大邦律师事务所律师熊磊之还提到引入区块链,比如将某个内容备案,将来引入各种机制,给有争议的内容打分,“打分的结果对人工智能来说也是机器学习的素材,这种例子多了作为人的认知什么情况下是洗稿,系统会越来越准”。
4. 留下文字标记,作为证据
对于推动解决洗稿问题,目前在法律层面值得参考的案例主要是霍炬案和于正案。
当时,霍炬案的结果是证据不足,驳回诉讼请求。霍炬一开始就在公众号里写,从开公众号的第一天起他就在文章里使用“文字标记”(一些独一无二的短句或词),其中一个原因就是为了应对将来可能发生的洗稿和抄袭。
霍炬说自己等这个案子已经等了很久,甚至用“狂喜”来形容自己的心情,他为这一战做了充分的准备,充分到让人感到有些悲哀——洗稿对对创作者的伤害之深,对这个行业的影响之大,竟然到了需要一个作者长年累月全副武装,在自己的文字里精打细算地埋雷的地步。
但他确实身体力行,找到了自己认为有效的方式,也就是“文字标记”。
通过独创一些全网无人搜索的短句短词,无形中在作者的文章中打上铁板钉钉的标签,而洗稿者很有可能无意中搬运,掉进文字陷阱。
5. 内容拆分,细节比对
洗稿不是抄袭,仅做字面上的查重是没有意义的,要对比就要将内容拆分做更细节的对比。
“架构师之路”提过一个方法是局部敏感哈希LSH(Locality Sensitive Hash):用相同的规则抽取集合中的少部分元素代表整个集合,如果少部分元素的重合度很高,非常可能整个集合的重复度也很高。也就是说,将一篇文章通过分词转化为集合来表示,然后在与其他文章的集合进行相似度对比(除了分词还可以考虑词频,以及词的权重)。
于正案在这方面也能带来一些思考。虽然是影视作品著作权方面的案例,但案件本质与自媒体的洗稿十分接近。
当时法庭考虑对比的因素包括台词、旁白、人物设置、人物关系、具体情节的逻辑编排、语法表达、逻辑关系、历史史实等错误、特殊的细节设计等等。
由于著作权的核心是保护表达而不保护思想,在表达并非完全相同的基础上,通过拆分细节在不同层面进行对比,能更深入地了解两部作品是否真正存在抄袭,或者说洗稿。
对自媒体来说,可以参考的细节比如有:文章创意、结构、主要情节、行文顺序、引用案例、主要观点、因果关系推导、人物关系、独特短句/用词、文章失误等。
如果能从这些细节出发一一比对,无论是发文控诉还是走法律途径,成功率都要高得多。尤其是一些文中特有的细节(比如特殊用词和失误),或许能作为洗稿实锤。
6. 个性写作
除此之外,霍炬还提过两个建议,一个是不要写基于信息的文章,“这样的文章最容易被洗稿,我只写带有强烈个人烙印,带有强烈感情和个人观点的文章,这种很难洗”。
这个建议确实有一定道理,不过可能也有例外,如果一个人真的想洗你的稿,变着花样都能给洗了。
7. 起诉
另一个建议是起诉。
“无论结果如何,去起诉吧,去测试可能性,去寻找机会,去帮助司法部门积累案例,无论怎么说都是由意义的”。用霍炬的话说,这就像钉了一根钉子,不致命,但硌手。
熊磊之也谈到,虽然全交给司法并不现实,但路径还是有的,“不过先需要多几个霍炬,毕竟司法总是被动的”。
我们常说,内容为王,这是内容创作者最好的时代,这句话究竟意味着什么。
某种程度上来说,内容创业能迅速崛起至今,是因为包容了各种不同生态的内容生产方式,让知识流通和共享的方式发生了翻天覆地的变化。
在此基础上,创作者确实有了最好的自我表达的阵地,甚至可以此为生,但在流量游戏背后,原创者是否也面临“劣币驱逐良币”的风险?
洗稿确实是个复杂的命题,但并非无解。重要的是,洗稿者不能永远肆无忌惮,也不会一直有利可图。谁也无法预知那根钉子什么时候会出现,不是所有的钉子都只硌手,关键的部位,再小的钉子也可能致命。
数英用户原创,转载请遵守规范
作者公众号:新榜(ID:newrankcn)
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
全部评论(1条)