让机器服务于人才是未来趋势丨专访腾讯“Dreamwriter”负责人刘康
在2009年美国的职业棒球大联盟季后赛上,一款名为“StatsMonkey”的人工软件完成了世界上第一篇机器稿件。随后的两年内,包括《福布斯》在内的顶级媒体里已经开始尝试机器人写稿,其完成的文章应用在商业,政治等各个领域,依靠强大的大数据平台,其30s生成一篇稿件的速度无人能及。一时间“写稿机器人入侵传媒界,记者编辑要失业了”的论调弄得满城风雨,记者编辑们也惶惶不可终日,都开始担心起自己的前途。
时间来到了2015年,腾讯作为国内“第一个吃螃蟹的人”率先启用机器人写稿,并发布了一篇出自写作机器人“Dreamwriter”之手的文章。官方称Dreamwriter是腾讯财经开发的自动化新闻写作机器人,能够根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。
自那以后,国内无论是传统媒体还是互联网巨头,都纷纷开始使用人工智能进行内容创作,机器人写的文章也在潜移默化之中融入进我们的资讯世界。那么,在当下这个时间节点,机器写稿究竟发展到了什么程度?与人相比机器在内容创作方面的优势与劣势在哪?
本期内容我们采访到了Dreamwriter的负责人刘康,并结合当下的研究资料整理成文,期待能够解答内容创作者朋友们内心的疑问与焦虑。
1
从Dreamwriter的写稿逻辑看人工智能在内容领域的应用
总体上看写稿机器人总共可分为三类,都依赖“自然语言处理”技术,第一类是模板式写稿,即使用一个文章模板套用,将数据库中的结构化信息包括具体数字、百分比等填充进去,进行传统意义上的“照本宣科”工作。第二类是提取后整理,即对包含无用信息的长自然语言文本进行分析,提取文章中的关键信息,重新组织语言后输出。第三种是自己生成,其通常方法是通过训练语言模型,对语言进行数学建模,然后不使用原文的原话,使用自己的方式逐句地生成算法认为“最能够体现原文包含意思而且看起来像一句话”的文字。
Dreamwriter在这三种模式中均有尝试,但模板式写稿和提取后整理是最常用的两种。Dreamwriter进行写作的整个流程主要经历以上五个环节:数据库的建立、机器对数据库的学习、就具体项目进行写作、内容审核、分发。通俗来说,即是腾讯要先通过购买或自己创建数据库(即要进行机器写稿的行业稿件);然后让Dreamwriter机器对数据库内的各项数据进行分析,得出字、词在某个句子中相互匹配的概率,接着在写作时选用最有可能匹配的字、词、句进行匹配,生成一篇完整的文章;写作完成后经过审核环节,最后通过腾讯的内容发布平台到达用户端。
需要强调的是,机器人写作的重要前提是数据库的购买和建立。没有数据,机器就无法进行数据的分析与学习,也无法自动量化生成生动的文章。所谓机器学习,即是专门的技术人员通过算法设计和数据分析技术让Dreamwriter去理解数据库。这种理解不只是对数据本身的理解,还要理解每一项数据所对应的写作模板。
刘康举了一个例子:“体育新闻报道要求欣赏到其中的细节,因此Dreamwriter要把每一个点都打得很‘碎’,最后‘组合’起来。比如说报道奥运会的跳水比赛,这是Dreamwriter表达最生动的一个范例。比赛中,每一个运动员都一套专业得分,包含了走板、空中姿态、入水水花效果等。在Dreamwriter学习过程中,它把每一步的得分都打散了,在数据库里随意组合抓取,同时综合赛事本身的规则,最终把这些分数还原成一套表述。”
2
把人从枯燥而繁琐的工作中解放出来
刘康指出Dreamwriter最初诞生时要解决的最核心的问题就是“财经新闻的生产能力满足不了内容的需要”。据统计,中国的金融市场平均每天发布大约1900篇公告,而这1900篇公告,一位资深证券编辑需要100个小时才能看完。Dreamwriter的意义便是解放了一大部分记者编辑的人力,让他们不再花时间盯着公司财报和证监会的网站,通过模板式的文章生产与数据抓取来为用户供给这些信息。
就目前来看,写稿机器人能够赢过人类记者,主要优势在两个方面——“数量”和“效率”。和传统媒体人相比,写稿机器人可以瞬间完成海量阅读、分析并根据互联网活跃点击量数据,瞬时筛选出下一个热点新闻,然后通过后台算法快速合成新闻。总体来看,写稿机器人在速度和数量上有着绝对优势。依靠海量数据和不断演进的算法设计,生成一篇深度报道的时间已经由最初的30秒缩短到2秒以内,其精确度还在不断提升,而且拟人化、情感化的技能也在不断增强。
刘康把机器的优势归纳为“多、快、好、省”,善于处理数据、在海量信息中摸爬滚打等等,机器人的这些“天性”,使得他们不仅在处理涉及数据的新闻时更不易出错,有时甚至还能成为抵制虚假信息的“打假斗士”。海量的新闻抓取,精准的数据加工,实时监控、快速报道,这些都是人类所无法轻易达到的。
3
机器替代人?No,机器服务于人
当我们问刘康记者、编辑是否会失业时,他坚决地予以否定,并讲到:“机器服务于人才是未来的趋势。”
国外曾有一位资深商业记者与智能机器人进行了一次“写稿比赛”,双方坐等一家公司出财报,两“人”同时开写一篇短报道。最终结果,速度上机器人以2分钟完稿大胜人类的7分钟。质量上,机器人的文章获得912票支持,而记者的文章获得了9916票的支持。
“人们难以期望机器人会变换着语气在采访中进行观点交锋,也不能指望它在镜头前随机应变或深入背街小巷明察暗访。”曾有一位媒体从业者这样说,新闻字里行间与镜头之下都包含着记者的判断、价值观与人文关怀。机器人写手却无法完全具备人的灵活性和创造力。
究其根本,机器始终是机器,它并不具备和人一样的思考能力,所有AI作品的完成都或多或少得到了人类的指点,而人给的指点越少,AI的最终作品就越惨不忍睹。另一方面,机器写稿的核心是利用大数据对信息进行分析,然后套用固定算法进行重新排列组合,再用人们能够接受的或新闻报道要求的格式呈现,这就造成了写作模式固定,适用面窄。刘康也在采访中提到目前应用领域最多的为体育、天气、财经等资讯性较强的新闻报道,而人文社科类则有待进一步开发。
所以机器替代人在未来很长一段时间内是不可能发生的事情,机器要取代的,只是机械式、无创造力的编辑工作。从这一角度出发,刘康认为记者和编辑以后会越来越有价值,因为专业性更高,从业门槛也更高了。
当问及未来人与机器之间的关系,刘康作了一番畅想:“很有可能未来每个编辑都会配一个人工智能写稿软件,以帮助人来抓取热点信息或解决掉繁琐、重复、无创造力的工作,把人放在更高层级的工作上,让机器帮助人提高工作效率。”
或许正如北京师范大学新闻传播学院执行院长喻国明所说,随着机器人写稿能够实现在灾害、体育、财报等规格化新闻资讯的精确、迅捷发布,并对不同语言风格的智能化学习,未来新闻人应该把精力重点放在机器人无法完成的调查性、深度解释性报道上——联系采访对象,观察对方,用心感受人物,再对大量资料进行整理,做出取舍。
新闻稿件的字里行间里都饱含着记者的判断、价值观与人文关怀,这都是机器所无法企及的。就如人民日报副总编辑卢新宁在2017年媒体融合发展论坛上所言:“作为记者,我为地震颤抖,但机器人不会。”
来源公众号:腾讯媒体研究院(ID:TencentMRI),深耕媒体行业,探索前沿趋势
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)