首篇文章一秒完成 写作机器人描绘未来“智媒体”
时间:2017-01-19
作者:
来源:
【
中国智能制造网 智造快讯】1月17日,南方都市报社写稿
机器人“小南”正式上岗,并推出第一篇共300余字的春运报道。此外,南方都市报社、凯迪网络和北京大学计算机科学技术研究所还在小南的基础上,联合成立了“智媒体实验室”,探索人工智能在媒体上的更多应用。

首篇文章一秒完成 写作机器人描绘未来“智媒体”
首篇文章一秒完成 请用5秒的时间思考以下新闻的共同点:《苹果第一季度营收超华尔街预测》(A pple topsStreet1Qforecasts),2015年1月发布;《8月CPI涨2%创12个月新高》,2015年9月发布;《绵阳安州发生4 .3级地震》,2016年5月发布;《奥运会乒乓球女子单打四分之一决赛 丁宁(中国)4:0轻松晋级下一轮》,2016年8月发布。
这道题其实没有标准答案,但不管你有没有注意到,有一点非常重要:这些新闻的作者,都不是人。或许你已经听说过“写稿机器人”———在写作这一似乎最不可能被机器人涉足的领域,变化正在发生。
看看这些数字:苹果财报发布数分钟后,美联社的机器人报道便已完成,他们还号称每个季度可撰写3000篇财经报道。《纽约时报》走得更快,其机器人编辑Blossom blot每天推送300篇文章,在财报季、运动比赛报道中写稿已成惯例。
如此速度和质量,确实让人类记者望尘莫及。但真正尝试使用机器人写稿的媒体,尤其是在国内,还并不多。如今,小南正式入场。
北京大学计算机科学技术研究所万小军教授,是小南的技术开发团队负责人。他透露,小南的首篇春运报道作品,共300余字,数据自动抓取完成后,报道的生成只用了不到一秒的时间。
率先进军民生领域 与其他机器人“同行”有所区别的是,小南聚焦的是民生领域报道。
此前,写稿机器人大显身手的领域,往往是体育和财经———因为这两个领域都涉及大量数据。从庞杂、枯燥的数据中寻找模式,就准确度和速度而言,机器人比人类更有优势。
人类的笔法千变万化,但总是有“套路”,也就是模式和规则可以依循的。这时候,算法就有了用武之地。
采集数据、分析数据、规划文章结构,再到最终的遣词用句,和人类一样,机器人也能做到“读书破万卷,下笔如有神”。海量的数据和高效的算法,是写稿机器人的两大利器。
相较于体育和财经领域,民生报道的生成对机器人来说略为棘手。许多财报文章都大同小异,但民生报道的“套路”可就太多了,从交通出行到食品安全,主题也五花八门。
一个民生领域的人类记者可以同时报道交通和食品领域,但就目前而言,让机器人做到跨界的“融会贯通”还需要时间。万小军介绍,机器人写稿又快又好的前提是通过大量的积累和训练。
“教小南写稿的过程中,主要的难点就是可供学习的样本不够丰富。”万小军说,民生议题的关注度高,却不像常规的体育和财经报道一样有着相对固定的模式,训练语料较为缺乏。
小南的未来是“智媒体” 不少时政记者可能都有梳理政府工作报告的“痛苦”经历。动辄上万字的文本,要在其中找到不同于去年、前年甚至是大前年的新变化、新提法,还要把这些变化简洁又流畅地写在报道里,第一时间发出。想象一下,记者还在一目十行地看报告找新闻点,编辑的声声催促已在耳边响起:“稿子好了吗?朋友圈里已经有人拍了照片,转发报告原文了,赶紧的!”
生成报告摘要,是小南已经解锁的另一项新本领。近日,深圳市市委书记、市长许勤在深圳市第六届人民代表大会第三次会议上作了政府工作报告,全文2万多字。万小军把报告交给了小南,几秒之后,2000多字的报告摘要新鲜出炉。
“如果一条信息被频繁提及,它显然是比较重要的。”万小军介绍,小南采用了先进的自动文摘技术,该技术可以根据多种文本特征———如关键词、段落位置等———判断不同信息的重要性,最终在摘要里保留核心部分。
小南还能做到定制化输出。今年的政府工作,网友比较关心哪些部分?房价?环境?交通?只要把关键词告诉小南,“他”会在稿件生成过程中注意定向分析。
万小军说,机器人写稿的应用还有很多。除了写摘要,小南将来还可以根据不同的稿件写综合报道,可以对已有的稿件进行改写,甚至试着写有一定情感、观点和立场的报道。
事实上,小南的背后还有个大招:南方都市报社、凯迪网络和北京大学计算机科学技术研究所三方昨日正式宣布联合成立“智媒体实验室”,小南是该实验室的首个重要成果代表。三方将在推动媒体智能化技术研发、促进自然语言处理等学科领域的发展、探索媒体智能化产品服务的新运营模式等方面开展深度合作,对机器写作、文本实体识别、智能摘要、立场分析、智能服务等方面进行研究和实践。
(来源:南方都市报) [1] [2] 下一页
免责声明:本网站部 分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系管理 员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网站不作任何承诺。