由雷速体育:理工学部计算机学院媒体信息技术研究所承担的北京市科委项目《基于类脑知识图谱的中文新闻自动写作系统的研发》经过现阶段的研究,已初见成效。
本课题旨在中文新闻领域,依据大脑对新闻语言(尤其是中文)的认知及表达功能的理论模型,研究类脑的中文知识图谱技术和语言表达过程,结合类脑计算与深度学习技术,实现中文知识图谱的建立和中文新闻的报道自动生成。
本课题目前已经建立农业和体育等相关领域的知识图谱,改进并提高了内容选择方法的算法效率,结合自然语言生成技术,初步实现了面向农业领域的天气预报文本和面向体育领域的赛事报道的自动生成。
图1 农业领域以水稻为例的知识图谱
图2 体育领域的赛事报道自动生成文本示例
在新闻领域,国外自动写作的优秀代表是Automated Insights和Narrative Science两家公司,他们已将技术成功应用于财经、气象/地质、体育、健康等领域的常规稿件的生产中。国内目前已开发的新闻写作机器人包括腾讯公司的Dreamwriter、新华社的“快笔小新”、第一财经的DT稿王以及今日头条的xiaomingbot等。本课题从更深层次上模仿大脑对自然语言的处理,研究并形成针对中文的类脑知识图谱,从而达到更好支持中文文本自动生成的目的。
本课题的研究成果将有助于提升中文自动生成技术,提高我国媒体研发和掌握内容自动生产方面的核心技术能力,同时可提高记者工作效率,增加媒体的内容覆盖范围,加强和改进新闻舆论工作,为大众提供更为广泛和快捷的新闻资讯服务。
(编辑:杨佳文)