坚定不移走中国特色社会主义法治道路
中国舆情法治网

   活动公告

网络作品“伪原创”现象调查

来源: | 作者: | 发布时间: 2024-04-08 15:41:08 | 41 次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:
网络作品“伪原创”现象调查 2017年05月09日 16:21:53    来源:人民网

互联网内容生产市场的拼杀日趋白热化,优质原创内容可谓互联网上的“兵家必争之地”。在此背景下,不少平台推出网络作品申请原创功能,此举既可以保护原创作者的合法权益,也推动优质内容不断出现。然而,有不少人却瞄准了原创市场,炮制出“伪原创”作品。“伪原创”手段有哪些?

内容生产无疑是当前互联网经济的一大“风口”。不管是传统媒体的转型者,还是自媒体人,都将内容生产视作互联网经济的一个富矿,文字、视频、音频等产品不断出现在各种网络平台。

既然是内容生产,就涉及到内容的版权问题,衍生出了网络作品盗版侵权现象。不过,与传统的盗版侵权相比,网络原创作品还面临一种新的侵权形式——“伪原创”,即通过各种手段将原作者的原创作品变成侵权者的“原创”。

“伪原创”手段花样百出

刘思含目前在北京一家视频新媒体公司市场部工作,主要业务是负责公司生产内容的版权保护。

“我们是做科普、知识类视频的新媒体公司,在微信、微博等很多平台上投放医学、汽车等多个领域的内容。我们制作的每一个原创内容由三个部分组成,视频和详细的画外音讲解,还有相对精简的文字。”刘思含说。

一个原创内容包含视频、音频、文字三部分,按理说是不容易被他人直接“拿走”的,但刘思含恰恰遇到了这种情况。

2016年12月27日,刘思含所在的公司上传了一篇关于汽车外观的原创内容。“今年2月中旬,某微信公众号发出一篇文章,用了我们原创视频的截图,复制粘贴了文字版,把画外音整理成文字。在这个基础上,剽窃者给文章加了个开头和从网上扒来的图片。就这样,对方把我们的原创内容变成了他的原创作品。”刘思含说。

刘思含在微信后台与对方交涉,对方不承认。之后,刘思含所在的公司向平台投诉,并要求对方把稿子删掉,对方回复,“既然你们都投诉了,那就交给平台方处理吧”。

“被抄袭的不仅是我们的汽车公众号,我们制作的其他领域的视频,每周会发现并举报几次剽窃行为。”刘思含说。

记者调查发现,目前网上的“伪原创”抄袭方法还有不少。例如“洗稿”,就是把类似的几篇文章拼在一起,之后申请“原创”。

目前,常见的平台审查机制主要由机器完成,即按文字内容的比例来判断是否存在抄袭。不过,机器审查存在一个弱点,就是很难识别视频和漫画。

“我们公司以创作漫画或视频为主,抄袭者直接对视频进行截屏,将原创文章中的文字内容转换成图片,不使用文字,机器就很难识别出抄袭。”刘思含说,“我们与粉丝的互动是问答式的。在读者留言中会有一些提问,我们在互动中作出相应解答。我了解到,有的公号甚至抄袭我们和读者互动的内容,将这些问答内容搬到自己的文章中。”

在线自动生成“伪原创”

记者在调查中发现,除了刘思含提到的各种“伪原创”手法,还有一种模式——在线自动生成“伪原创”。

记者通过阅读多个“伪原创”工具的说明并试用,梳理出其制作过程和原理。“伪原创”的目标是通过同义词替换的方式,让搜索引擎认为是一篇原创文章,从而提高在搜索结果中的排名。“伪原创”工具或在线生成网站都有自己的同义词库,有的通过免费模式向用户开放一部分,另一部分更大的同义词库则要用户付费后才可以使用。

“用‘伪原创’工具可以把在互联网上复制的文章瞬间变成您自己的原创文章。”一个“伪原创”网站的说明这样写到。此类“伪原创”工具还可以在文章中随意植入想被读者看到的关键词或网址,以达到宣传作用。

记者把原创文章复制粘贴到这样的网站上,一键即可生成同义词替换过的文章,被替换的词通常用不同的字体和颜色标记出来。

在这个过程中,记者发现,专业类文章替换较少;生活类的文章替换掉的词较多;文章越长,替换率越高。在线“伪原创”工具还附带相似度检测、关键词排序、关键词统计、关键词组合工具等在线工具,文章整体替换的比例在10%左右。替换后的文章可读性降低,网站建议对文章进行人工修改提升可读性。一个“伪原创”网站在说明中称,“‘伪原创’文章最好将文章开头和结尾用自己的语言组织,这样的效果更好一些”。

记者使用相似度检测对原创和“伪原创”进行对比发现,机器识别出相似度在85%至98%之间。

记者在网站上看到一个生成记录,内容文本字符长度为734个字的文章,共替换了44个词长度为90个字符,替换比率为12.26%。原文和替换之后的文章相似度为92.6%,如此高的相似度怎么办?这些网站给出了进一步的“解决方案”。

“在线生成文章,将其粘贴入前两步已做好的‘伪原创’文章后一段即可”。记者点击“在线生成文章”发现,生成的并不是可读的文章,而是一段看似是中文的乱码。将这段乱码贴在文章最后,相似度降低到84.3%。

除了用乱码降低相似度,这些网站介绍称还可以在文章中插入图片,建议用户打乱文章顺序等方法。

此外,记者发现,网上还可以搜索到大量关于“如何制作‘伪原创’”的教程。

原创维权依然麻烦

   媒体公信

责任编辑:杨松