界面新闻记者 |
界面新闻编辑 | 江怡曼
9月6日,由界面新闻主办的2024REAL科技大会在上海顺利举办,本次大会主题为“大模型落地,重塑现实场景”。
近年来,金融科技加速发展,金融+大模型成为了行业趋势。目前在技术与实践层面,各大金融机构进行了哪些尝试?迎来了哪些挑战?相关监管配套是否完善?
在由宁波银行赞助呈现的“金融大模型的进阶之路”圆桌讨论会上,江苏苏商银行股份有限公司副行长黄进、众邦银行首席信息官李耀、招联消费金融股份有限公司首席信息官王耀南、众源资本高级投资副总裁冉翀、蚂蚁集团金融AI首席架构师徐万青等与会嘉宾们就以上话题进行了热切讨论。
(“金融大模型的进阶之路”圆桌讨论会现场)
应用场景多方面突破
“银行已经进入5.0时代,银行所有的业务模式都值得用AI重新思考一遍。” 李耀强调AI对于银行的重要性。
起步之际,银行+大模型多集中于人工客服、资料库等基础层面,如今伴随技术的迭代与新需求的涌现,应用场景实现了多方面突破。
黄进介绍,目前银行主要基于大模型的生成能力,在两个核心的业务领域——产业链金融和科创金融,辅助生成相关的尽调报告。“我们也会基于自身的信贷语料库,以及行内整合的非结构化数据,将大模型的分析能力应用在O2O的信贷审批环节,应用场景包括信贷客户的KYC以及部分贷后管理环节。”
基于大模型能力,蚂蚁集团于去年发布了智能业务助手“支小助”。 徐万青介绍,经过一整年的打磨和培养,现在“支小助”已经升级到2.0版本,并落地在销售、理赔、财务写作,营销创意等多个场景。他称,规模化的落地验证了支小助2.0能为业务带来非常好的提升效果。
“比如在财务报表领域,阿里巴巴最近发布的财报首次使用支小助2.0帮助专家进行了很多精密任务的执行。包括财务逻辑理解、业绩归因、专业写作,都由支小助2.0辅助财务专家进行编写。”徐万青称,这些任务(完成情况)已经达到了高级财务专家的要求。
对于金融机构而言,如何借助大模型实现降本增效是一个重要命题。
招联消费金融股份有限公司首席信息官王耀南分享道,招联2023年11月发布消费金融行业首个130亿参数大模型“招联智鹿”,今年7月升级推出“招联智鹿二代”,以智能客服为例,不仅可以结合具体会话状态与服务场景,快速精准地进行会话小结,大幅提升坐席作业效率,还能充分利用深度学习技术,准确理解客户意图,共情客户情绪,并将与客户交互的“经验”和“感觉”积累成参考样本,实现举一反三的智能服务,大幅降低投诉率。
徐万青也谈及,现在支小助2.0有能力去学习优质的销售经验、销售能力和销售话术,从而构建一个数字分身,让数字分身帮助基础销售人员提升他们的客户服务的能力和标准。“这套能力在保险规划师团队上已经完全铺开使用了,目前可以将人均产能提升约150%。”
展望银行业未来的大模型应用,王耀南表示,希望用大语言模型的推理能力持续优化招联的整体业务运营情况。他认为,对于金融企业而言,要把业务和语言模型结合,产生(实际)效果,因为只有在企业内部踏踏实实落地,语言模型的价值才能更好地凸显出来。”
徐万青强调需要基于用户的角度进行思考。“以理财为例,我们的客户会希望能够获得更个性化的金融服务,希望大模型理解我真正的偏好、诉求、风险;同时,也希望这个服务的获取方式非常便利,借助大模型能力,实现语言交流、视频交流;更进一步,用户希望给到的个性化服务,能够真正有效的能够支持他的投资决策,而这对大模型处理信息的及时性和有效性也提出了更高的要求。”
金融领域有其特殊性,李耀建议在运用大模型的过程中,应当走“通用加专用”的道路,即通用大模型搭配专用模型使用,这可以让传统的专家模型、机器学习手段更加稳定、更加具有可解释性。
冉翀则认为,在金融大模型的未来,如果能把任务和职业定义清楚,应该是都有可能利用大模型来实现任务和职业的替换。
(“金融大模型的进阶之路”圆桌讨论会现场)
技术与成本的多重挑战
不可避免地,路上总有挑战。
一方面,Bug总会出现,这要求大量的实践与改进。王耀南举例称,在推断客户最近的资金需求时,银行一般会查看他们的人行查询报告次数,人工会发现客户最近没有很频繁查看,但机器人推断出客户查看很频繁。最后发现,这名客户在一年前查看的次数比较多,但最近一年只有一次。“大语言模型对时间没有什么概念,如果由机器做推断,需要的细节非常多,我们正在持续推进这方面的工作。”
冉翀也强调,目前在金融领域,如果模型的搜索能力不够强,或者理解错误,出现幻觉,单一任务上就有出错可能性。“面对复杂的工作流,比如有5个步骤,每个步骤都要做一次,如果每个步骤只有80%的正确率,答案几乎不可能是对的。”
冉翀称,在此背景下,模型本身的性能、模型使用工具的能力、模型做多步推理的可靠性,这是当下面临的很明确的问题。
“模型的能力要足够强,是不是(达到)金融级别的模型?是不是足够可靠?是否有很强的多步推理能力?模型能不能知道自己错了?以及中间和用户场景之间的Gap怎么弥补?这些都是挑战。”冉翀具体指出。
另一方面,成本的问题需要考量。李耀提及,“现在大公司要做大模型,没有一万个显卡没法进行,这也就意味着3-4亿美金的投入。对我们来说,不做训练,只做推理,投入也是很大的。”
黄进也坦言,“现在各种大模型出来得太多、太快了,大模型需要本地化部署。我们作为一家中小银行,缺乏足够的财力与精力来适应这些比较大的外部需求变化。”
同时,数据对于大模型的运用尤其重要,但数据的获取并不容易。黄进表示,为什么说现在的金融行业并没有真正的模型能达到金融学专业的硕士或者博士水平?因为数据很缺乏,单靠某一家机构、银行无法解决这个问题,这需要更高层面的努力。
最后,人才亦是关键所在,“大模型的人才非常难得,既要懂业务,同时还要懂大模型的技术,还要有工程化交付的能力,这些都要求极强的学习能力。” 黄进称。
强监管背景下如何走得更远?
在 “AI+金融”的各式探索中,监管与合规的重要性愈加突出。
黄进坦言,由于银行强监管的特点,整个大模型利用还是相对比较局限,更多偏向中后台,没有完全直接对客的应用场景。
徐万青在论坛上强调,金融行业是强监管行业,大模型在这样的监管和合规要求下能做的事情是什么?不能做的事情是什么?怎么结合才能实现用户更深的需求?这些问题都有待思考和突破。
李耀对此持有同感,并期待监管层在这方面能有更多相关立法和管理条例。
2024年法治蓝皮书《中国法治发展报告》指出,2023年是生成式人工智能监管元年。为应对生成式人工智能带来的安全风险,国家网信办等7部门发布了《生成式人工智能服务管理暂行办法》。中国也因此成为世界上首个为GPT大模型立法的国家。
在金融科技领域,更完善的AI监管制度仍在路上。显然,只有在监管环境更为明朗的环境下,银行的大模型运用才能走得更远。