2025-04-29各位专家下午好!我是南京银行数字化管理部的黄涛。今天,我主要想介绍一下南京银行在智能话题建设方面的一些探索与实践。其实我们做得也并非尽善尽美,今天主要也是抱着学习的态度来的,还请大家多多批评指正 。
2025开年,AI技术引爆热搜话题
2025 年开年的三件事,给全国人民实实在在地上了一次 AI 培训课,让普通大众能够看到、摸到人工智能,还能与它交流互动、进行思考。这三件事,使得大家对人工智能及其相关技术有了切实的感受。
DeepSeek引爆社会话题
实际上,自 2022 年年底 GPT 出现后,我们银行就开展了诸多探索,尝试了很多应用场景。当时,我们深入到全行业务部门以及各个分支机构,为行员介绍了一些典型场景。然而,经过这两年的实践,我感觉我们所做的工作影响力还不及 DeepSeek 发布的一个版本。目前来看,DeepSeek 对我们整个银行业,尤其是普通业务人员的认知影响非常深远。今年春节后上班第一天,董事长就提出,能否邀请 DeepSeek 的梁教授来我们银行交流,我们还尝试通过各种渠道去联系,可人家肯定不会轻易前来。
进入Bank4.0时代,场景智能化成为中小银行实现弯道超车的机遇
如今已步入银行 4.0 阶段,在过去几年,基于人工智能技术,我们做了许多场景应用,包括图像识别、NLP(自然语言处理)、语音处理等,现在也在大模型方面做了一些尝试。此前,我们努力尝试贴近业务进行实践,但对行业的影响较为有限。
我们一直在思考,如何让智能化能力与我们银行的业务、风险偏好以及人员素质相匹配,使其具有我们银行自身的特色。今年开年,领导给我们定了一个 KPI,要求银行管理部今年必须完成 100 个与大模型相关的应用场景,这也促使我们不断向前推进工作,希望通过量变实现质变,这是我们目前基本的工作思路。
实际上,数智金融时代已然来临。过去,我们去找业务部门,他们出于礼貌会接待我们,但实际工作中该怎么做还是怎么做。现在,情况有了明显变化,我觉得我们已经进入了一个比较好的发展阶段。
场景智能化:算力+算法+数据
对于人工智能体系而言,金融行业乃至各个行业的人工智能体系都有三个关键要素:算力、算法和数据。
在算力方面,各家银行可以各显神通,可以选择租赁、购买,或者利用公有云来满足自身需求。算法的核心在于是否拥有算法人才。以我们南京银行为例,过去几年通过校招的方式,培养了一批构建小模型的人才,算法人才培养主要依靠校招并自主培养,因为外面成熟的算法人才成本太高,我们不一定请得起。总体而言,数据是解决 AI 幻觉的关键要点。在银行业这种强监管领域,很多数据不能直接与外部数据关联,这就必然导致我们在处理很多行内问题时,无法向外部寻求答案。
所以,无论是做 RAG(检索增强生成)、模型微调,还是自建大模型,算法和数据方面的工作都是金融行业不得不面对的问题。如果完全采用 API 调用或者直接外采应用的方式部署大模型,就无法与行内现有的独立风险体系和技术体系完全融合,因此必然会面临自建大模型应用的场景。当然,所有这些都依赖于算力、算法和数据,目前我们可能还处于储备阶段,但这是未来 3 - 5 年内必须解决的问题。
智能化应用场景将贯穿商业银行业务流程的各个环节
在人工智能领域,从最初的图像、语音、NLP 等技术,到相关的底层技术模型,都是以神经网络为基础。未来发展到长短期记忆网络,包括 STM 等各类人工智能底层算法,其能力本质上是逐步通过 Transformer、大模型等领域叠加发展起来的。对于像南京银行这样的中小银行而言,我认为我们需要真正吃透技术领域。之前,我们在人工智能方面做了很多场景应用,比如 OCR(光学字符识别)场景可能有几百个,NLP 场景也有几百个。但现在大模型出现后,很多 NLP 场景完全可以被大模型替代。不过,OCR 场景很多是经过专有训练的,短期内多模态大模型可能无法完全替代。目前来看,既然我们已经有了这么多基础,如何将银行原有的知识体系与大模型进行融合是关键。我们主要想借助以 AI Agent 为核心的智能中枢,对业务流进行编排,将之前的 OCR、RPA(机器人流程自动化)等各种能力,以及决策型模型、机器学习模型的所有决策流,都通过 AI Agent 进行统一编排,最终应用到金融行业的风险运营、对公、零售、同业等六大业务领域。
前面提到我们给自己设定了 100 个大模型场景的目标,期望实现从量变到质变的过程。我们去年 10 月份考虑做 100 个模型的时候,DeepSeek 还未产生,当时我还很发愁,觉得 100 个场景可能得自己绞尽脑汁去想。但现在,这 100 个场景都是业务部门主动找过来的。春节之后,我们没有过度向业务部门推销,让他们给我们提出智能化场景需求,可现在都是他们主动来找我们,每个分行、每个部门都希望我们给他们介绍大模型领域的思路等,我们都应接不暇了,这就是南京银行目前的基本状况。
南京银行AI规划蓝图
总体而言,基于现状,我们还得着眼未来,做一些基于大模型的智能中台规划。我们之前打造了智能中台,核心包括图像处理引擎、语音处理引擎、文字处理引擎、智能决策引擎,这些引擎此前与我们银行的一些业务系统紧密融合。现在大模型出现了,我们主要思考如何将这几个引擎的能力与大模型相结合,沉淀出一些技术平台。在此基础上,向上打造在银行内部具有标杆影响力的典型人工智能产品或服务,我们还取了一些比较好听的名字,像 “鑫智语”“鑫智慧”,但真正要做的是在语言类和图像类领域打造端到端、切实解决业务场景问题的体系,而不是只关注分散的节点。我们一直在思考如何将银行的人工智能体系真正融入业务体系中。
大模型在银行落地的四大范式
目前,我们认为大模型在银行领域有四种典型应用范式。一是知识管理,以前在知识管理方面可能采用了一些搜索引擎技术,甚至通过 NLP 技术自建了一些体系,但现在通过当前的 RAG 技术或模型微调,能够更好地实现知识管理。
二是报告撰写,这是生成式大模型与生俱来的能力。三是智能问数,很多银行都在开展这项工作,但我认为智能问数的核心并非技术难题,而是银行底层的数据治理。银行业的数据存在几十种口径,如监管口径、报送口径、统计口径、绩效口径等。如果智能问数提供的数据不符合业务需求,那这项功能就没有实际意义,因为在数据准确性方面不存在 90% 或 99% 的情况,只有准确(1)和不准确(0)之分。如果底层数据治理不佳,大模型就只是一个简单的交互工具,并不能真正解决智能问数的问题。当然,我们也在研究这个场景,但目前并不认为智能问数是一个非常理想的场景,因为它确实需要建立在良好的数据指令基础之上。智能标准功能主要是以 Agent 作为业务流编排工具,调用各种能力,我觉得这是我们目前正在突破的一个关键点,能够让业务人员切实感受到其作用。
我们银行还有金融市场业务,金融市场业务的研究人员经常需要撰写分析报告。在座的证券行业、保险行业以及银行业的同仁们应该都有类似经历,就是将外部通用研报进行总结提炼,并做关联分析,这方面大家做法都差不多,我就不多赘述了。
接下来谈谈 “五篇大文章” 中的第一篇 —— 科创金融。对于银行业来说,过去资金供给相对紧缺,银行处于优势地位,企业求着银行贷款。但现在资金需求较为宽松,银行在同业竞争中,尤其是在争取科创企业认可方面,面临着很大挑战,这对我们营销人员的专业性提出了很高要求。比如,客户经理去拜访科创企业客户时,如果只会聊财报,说企业今年营收不错,然后提议合作,让客户找财务对接,那业务很可能就谈不下去了。因为科创企业家通常有情怀、有技术情节,此时客户经理需要快速了解企业的技术领域,而大模型可以帮助客户经理实现这一点,它能够将复杂的技术原理以通俗易懂的方式解释出来,与日常生活中的原理相结合,便于理解,这是我们正在打造的一个比较好的应用场景。
对于客户经理而言,日常案头工作繁多,拜访客户后晚上还得加班撰写客户社情报告。我们人工查看过客户经理撰写的社情报告,发现他们很多是从网上查找资料拼凑而成,质量参差不齐。大模型可以辅助客户经理撰写报告,但我们银行的分析人员不允许大模型完全替代人工,这与各家银行的风险偏好有关。我认为大模型作为辅助工具是可行的,这也是一个不错的应用场景。
大模型赋能场景(智能问数)——DeepSeek财报分析功能
另外,年后我们得知同城的江苏银行在大年初四就宣布接入了 DeepSeek,这给我们南京银行带来了很大压力。春节之后,我们做的第一件事就是发布南京银行年报简报分析。大家应该知道,南京银行去年年报简报情况还不错,我们为领导做了这份分析,以缓解领导对我们此前工作进度的担忧。还有人力资源部每年要求员工撰写述职报告,实际上这些述职报告根本没人看,南京银行数字银行管理部有 200 多人,领导不可能逐个查看员工的述职报告。我们通过 Agent 或者大模型技术,对述职报告进行智能分析,根据员工的工作经历,判断其当前工作与价值是否匹配,辅助领导对员工进行标签化管理。
大模型赋能场景(智慧办公)——国际结算境内运费智能汇款
大模型已经发展到多模态阶段。例如,对于普通电子发票,我们之前做过专门的 OCR 训练,能够精准识别发票信息。我们也对多模态技术进行了实际测试,发现其效果并不理想。目前,我们采用 “大模型 + OCR 小模型 + 大模型” 的联合技术来识别发票,总体效果还是不错的。
金融业AI大模型建设路径总结
总体而言,大模型建设路径包括直接外采大模型应用、接入 API 进行信息检索、模型微调和自建大模型等。在实际落地过程中,需要从数据、成本、安全等多个角度综合考虑。我觉得每家机构在这几个方面都有所涉及,可能自建大模型对部分机构来说难度较大,或者说前四个方面相对容易实现。我们要根据自身场景的实际情况,选择合适的方式。比如,有些场景使用外部接口即可满足需求,就不必自行开发;当然,结合本行私有领域的数据,通过 RAG、模型微调等方式实现大模型应用,也是非常好的方法。以南京银行目前的算法人员能力来看,我们可能还无法完全支持自建基础大模型,而且当前行业内通用大模型的能力已经非常强大,像 DeepSeek 可能在今年 5 月份会推出 R2 版本,其性能可能远超我们投入几百万、几十人自建的大模型。
从南京银行的角度出发,我们目前混合使用前四种大模型建设方式。前面也提到,鉴于我们是金融行业,主营业务并非科技研发,所以能够跟随行业通用模型,实现快速部署,并将线上模型与线下模型有效结合,我们认为在技术层面已经达到了较好的水平。
前面介绍过,金融机构拥有很多小模型,大模型和小模型是相互辅助的关系,未来不一定是大模型完全替代小模型,OCR、NLP 等技术也并非不再使用,这是我们目前的一些思考。
最后,我们基于大模型考虑了一个框架,这个框架与外面通用的框架差不多。大家可以看到,框架中的每个格子,都代表着一家机构或金融机构应该配备专门的人才来负责相关工作,有可能一个格子对应一个团队,甚至是专人负责。从长远来看,金融行业智能化转型的根本在于拥有一批懂原理、懂算法、能够进行模型微调的团队。因为在银行业等强监管领域,不可能完全依赖外部技术,这是我们的一些浅见,如有不当之处,请大家批评指正。谢谢大家!

扫一扫微信二维码
随时了解信息侠微报资讯

扫一扫手机端二维码
随时了解信息侠微报资讯
Copyright @ 2018-2019 信息侠一站式数字化转型交流分享平台 版权所有 皖ICP备19006839号-1
上海申馥文化传媒有限公司
安徽申馥商务咨询有限公司
安徽申馥企业服务有限公司
地址:安徽合肥望江西路西湖国际广场D座2345室 网址:www.xinxixia.cn
电话:021-34121111 0551-64388008