独家 | 创新工场首席科学家周明:NLP 与金融「联(2)

来源:系统科学学报 【在线投稿】 栏目:综合新闻 时间:2022-06-07
作者:网站采编
关键词:
摘要:周明: 是的,我也是倡导者。别人都在做巨量化模型的时候,我是反其道而行之。当时很多人都笑话我,说那是因为你穷、做不起大模型。他们这么说也
周明:是的,我也是倡导者。别人都在做巨量化模型的时候,我是反其道而行之。当时很多人都笑话我,说那是因为你穷、做不起大模型。他们这么说也是对的,但即使我有充足的经费,我也还是觉得应该做轻量化模型,不能因为片面追求人工智能的最大化,不惜浪费资源、造成大量污染,这是不对的,要有社会责任。

NLP的这些能力在金融领域有很多用处,比如智能信息抽取。几乎所有金融单位都要处理很多无结构、有结构或半结构的文档,如网页有表格、有字段。举个例子,基金的变化,昨天的价格多少、今天的价格多少、基金数量、购买人数、交易量、上升与下降幅度等等,有可能写在年报里,也有可能写在网页里,我们就可以使用智能文档分析技术,将其重要信息抽取出来形成数据库。


金融的需求没有那么明确,而且场景多样化,同时 AI 技术也在不停地迭代,例如,大模型约每三个月就要迭代一次。

因此,金融行业的人士对 AI 是既渴望、又觉得太繁复,跟不上 AI 的节奏。在这种方式下,项目制就会产生一些问题,而联合实验室则能更灵活地应付这种快速多变的局面,把双方的优势与长处发挥出来。

AI科技评论:金融业务有哪些特征?在金融场景中,NLP能够解决什么样的问题?

而此时,「孟子」的轻量化优势便发挥了出来。

周明:两者都不多。由于技术的局限性,NLP落地很难,因此全世界的NLP公司都比较少,但像百度、微软、谷歌等背后都有 NLP 团队,主要是服务于它们自身的业务和产品,作为一个部件,例如拼写检查、文档分析、索引等等,但极少有公司专门以 NLP 技术立足。

AI科技评论:「孟子」模型之所以能够在某些基准上表现优于大模型,是因为其针对特定任务去做训练吗?

周明:首先说NLP(自然语言处理)技术。目前 NLP 领域有许多基于互联网的海量数据训练出来的大规模预训练模型,过去几年也在全世界引起了广泛关注。但澜舟科技做的是「孟子」轻量化模型,模型不大、容易落地,同时又具备分析、搜索、翻译、生成等能力。

周明:「孟子」在澜舟公司的所有技术体系中都会体现,包括智能文档、信息抽取、知识图谱、搜索问答,还有文本生成等,这些核心技术均会进入到跟华夏一同成立的联合实验室中。「孟子」会基于一些金融数据做训练,从而获得处理金融数据的能力。

他是中国第一个中英翻译系统CEMT-I(哈工大1989年)、日本最有名的中日机器翻译产品J-北京(日本高电社1998年)的研制者,曾担任2019年国际计算语言学协会(ACL)主席,中国计算机学会理事、中文信息技术专委会主任、术语工作委员会主任、中国中文信息学会常务理事,谷歌学术引用数超过32000次。

根据华夏基金首席数据官陈一昕的介绍,在以往的「金融+NLP」建设中,他们往往面临模型与行业场景适配性差、训练代价大、中文理解能力不足等问题。面对金融领域文本专业性强、应用场景多变的情况,构建落地快、易迭代、可适配金融垂直领域的中文NLP模型是一个亟待实现的目标。

周明告诉AI科技评论,诸如「孟子」的轻量化模型部署成本低,能够快速迭代,用户压力小,且适配性强。此外,通过知识融合、数据增强,能力上或并不逊于大模型,十分适合金融场景的需求,更容易落地。

周明:算力比较低,用 16 块 GPU、训练两三周就能训练出一个孟子轻量化模型。当然,卡越多,速度越快。

以下是雷峰网-AI科技评论与周明博士的对话:

AI科技评论:「孟子」强调的是小模型,小模型对于处理金融领域的问题是否有独特的优势?

恰好在去年10月,我应邀参加一个在上海举行的智能投研大会,做了一个特邀报告,其中介绍了澜舟科技的自然语言处理技术,包括「孟子」预训练模型。华夏基金的杨思成在台下,对我们很感兴趣,就介绍我和华夏基金的首席数据官陈一昕认识,双方一拍即合。

1999年,周明加入微软亚洲研究院,随后担任自然语言研究组的负责人、微软亚研副院长。2020年12月,他从微软离职,随后加入创新工场担任首席科学家,2021年6月孵化出澜舟科技,7月就推出轻量化模型——「孟子」,在中文语言理解评测CLUE榜单的多项指标上登顶第一,引起不少关注。

文章来源:《系统科学学报》 网址: http://www.xtkxxb.cn/zonghexinwen/2022/0607/832.html



上一篇:【微特稿·科技与新知】人工智能助力科学家“听
下一篇:科学家首次系统阐述亚洲水塔失衡问题

系统科学学报投稿 | 系统科学学报编辑部| 系统科学学报版面费 | 系统科学学报论文发表 | 系统科学学报最新目录
Copyright © 2019 《系统科学学报》杂志社 版权所有
投稿电话: 投稿邮箱: