解析CIFS|华泰证券毕成功:如何让大模型项目成功落地的深度思考

2025-04-18
大家下午好!我今天话题的关键在于落地,所以可能讲得会比较务实。近期大模型非常热门,我接到很多领导、同事以及行业朋友的邀请,一起参与讨论,过程中产生了不少自己的想法。我把这些想法整理了一下,希望今天能与大家进行思想上的碰撞。
今天我从四个方面展开讲述:
01战略布局
首先,说说较为宏观的部分。
围绕业务价值展开
在大模型这股浪潮下,仔细思考会发现,其底层是由技术发展推动的。这很容易让大家高度关注技术本身,但实际上,作为企业,我们最需要关注的是价值。技术本身并不直接产生价值,而且价值也需要区分,并非所有价值都是我们期望看到或需要去做的,我们真正要关注的是业务价值,业务价值才是我们的壁垒。
例如,做更多的模型调优以及开发通用工具等,说实话,这既不是我们擅长的领域,也不该是我们做的事情。还有很重要的第三点,就是要关注 ROI(投资回报率)。因为从长远十年的视角看,大模型目前仍处于非常初级的阶段,技术成本较高,且效果还有待进一步提升。所以,比较合适的方式是采用迭代式发展,我们先做到 60 分,如果觉得这个价值不错,再持续投入。
根据发展趋势动态调整策略
不过,我们也得承认,现在 AI 发展极为迅速,我们应该以动态发展的思路来看待这件事。那么,我们要采取什么样的策略呢?
第一,要注意避免不确定性。比如一些不太成熟的技术,像超长文本处理、强规则处理等方面,我们应尽量避开。
第二,关注偏长期主义的事情,关注那些不变或者具有积累性优势的东西。在大模型领域,有个很好的例子,即大模型的主要三要素:算法、算力和数据。算法通常是头部科技公司在做的事情;算力说白了就是固定资产,而且还在持续贬值,前期没必要投入;当下最重要且最值得做的其实是数据。当我们积累了大量高质量数据后,若日后发现好机会,再投入算法和算力,运用最新算法,很快就能跟上。
第三,关注发展动态。我觉得大家肯定都有这个意识,但可能没有将其提升到足够高的高度。如果用自己的团队,耗费自身资源和时间去做这件事,会发现成本其实很高。不如多关注市场上其他人在做什么,借鉴别人的优秀经验,这可能是一种非常高效的做事方式。我甚至认为很多公司应该成立一个 AI 市场研究团队专门负责此事。当下,这件事相对容易,我们完全可以借助 AI 来做,比如我每天就用 AI 帮我生成行业早报。
说到市场发展,必然会涉及各种竞争策略,不同体量的公司需要采用不同的竞争方式。战略上的失误影响会非常大。
创业公司的竞争策略
对于创业公司而言,最合适的方式一定是 All in(全力投入)。因为创业公司资源有限,需要将资源集中在自身最具优势的地方,做我们所说的 AI 原生应用,即产品围绕 AI 打造,甚至组织架构也围绕 AI 构建,这样才能形成强大的创新力,从而在市场中实现突围。但说实话,我一直觉得大公司不太适合 All in AI。实际上,大公司与小公司所做的 All in AI 完全不是一回事,因为大公司有很多存量业务,没必要冒这个风险,它们有更适合的方式开拓市场,后面我会详细提到。
中小公司的竞争策略
另一种较为简单的方式是进行低成本引入,提升一下估值,这对中小公司来说也是非常必要的。中小公司最直接的做法是进行微创新,找到较为确定的事情,低成本投入,确保回报率合理。
还有一种是跟随策略,就像博弈论中的智猪博弈。创新成本很高,最好由市场头部公司承担,中小公司直接享受红利,拿来就用。这两种策略对于中小公司来说是组合策略,因为用同样的团队就可以同时开展。
头部公司的竞争策略
对于头部公司而言,微创新可能只是小打小闹,意义不大,它们可能需要成为市场的主导者,承担主要的创新职能。这里我提两点:第一,创新一定要围绕自身核心领域进行,因为最担心的是小公司对自身核心领域产生巨大的破坏性冲击;第二,大公司内部产生创新较为困难,所以要考虑组织活化和内部竞争等方式。此外,还可以采用模仿策略,作为头部公司,没必要追求绝对领先优势,模仿他人,保持相对优势即可。第三是收购,前面提到大公司内部产生创新难,而创业公司适合 All in AI,所以大公司很适合收购创业公司。
02场景选择
第二部分讲讲更具体的场景选择及方法。
发挥大模型相较于人的优势
第一个重要的思考角度是发挥 AI 的优势。AI 绝对理性、无恶意且情绪稳定,非常适合做客服类工作;它信息处理能力强,读取数据快、数据容量大,适合做交叉学科、迁移学习以及构建知识库;它劳动性价比高,虽然训练成本高,但运行成本低,相较于雇佣人力,它能 24 小时在线,若效果不错,大规模复制也很简单。
选择能接受大模型缺陷的场景
既然大模型有优势,那我们也要扬长避短,避开其劣势。第一,AI 的精确度存在问题,比如 AI 幻觉和随机性,这几乎是难以突破的,也是行业内将大模型落地时非常头疼的一点,导致很多场景无法应用;第二,AI 不太懂伦理,尤其是法律和道德方面,将这些规则全部纳入,大模型的性能会受到影响,所以在选择场景时要注意这方面的敏感性;第三,AI 即时响应较慢,在实时交易、医疗救援等场景中不适用。
选择大模型适合解决的场景
那么,大模型适合做什么呢?通过与业内大量交流,收集已落地的场景,我认为主要集中在两个领域:
生成类,偏向创意的内容。
理解类,偏向事实的内容。
生成类能做什么呢?比如现在常见的代替搜索引擎、自动化写作(如扩写、代码生成)、生成 PPT(我今天的 PPT 就是给 AI 大纲后由它生成的,但说实话,生成质量不太理想,80% 的内容都经过了调整)。还有一个较为通用的场景是知识库,知识库中还有很多衍生场景,比如智能陪练,我看到时觉得很惊艳。理解类的事情则更需要大家去探索。生成类场景除了知识库较为通用外,在很多场景下并不太好用,而与业务、行业结合时,很多时候会涉及理解类的部分。
理解类可以做什么呢?第一,可以做评估,如净值调查评估、合规审查、风险评估等;第二,可以做归因、生成摘要类工作;第三,可以进行数据打标签,我们在做大模型时,数据清洗和标注工作完全可以借助 AI 完成,典型的如客户画像分群,估计很多公司都在做。说了这些场景后,如何将场景与产品结合应用,这里也有一些值得思考的地方。
根据场景容忍度采用不同的使用方式
根据对 AI 的容忍度,可以进行如下区分:
第一,一种非常简单且易于落地的思路是让 AI 辅助人做事,而不做决策,这种方式很容易实施。
第二,寻找决策容忍度高的场景,比如资产配置、客户拜访计划等,这类场景很容易落地。
第三,先由 AI 生成决策提议,再由人确认后执行,例如询报价,报价在发给客户前由交易员确认,这样可以平衡创新与风险。
再剩下的就是风险较高的场景了,比如责任风险高、错误难以承受的交易场景。业内很多人都在思考这个问题,但几乎没人敢将 AI 与交易直接绑定并自动执行。
根据ROI来筛选项目
最后,还有一个很好的项目选择角度,即根据 ROI(投资回报率)。首先,高 ROI 的事情肯定值得做。什么样的事情属于此类呢?就是能带来显著提升的事情。我发现很多人喜欢做一些小的优化,但从业务角度看,这些可能并非必要。最值得做的是那些在未使用 AI 或大模型之前难以落地,使用后能解决大问题的事情。比如做净值调查,之前资料审查非常慢,使用大模型后效果会成倍提升。
第二,要巧妙利用 AI,避开其短板,选择本身对精确度要求较低的场景。这里我提一个有趣的小细节,今天上午我看到一个应用,它将整个应用换成了对话模式。我一直觉得这可能并非最终形态,不知道大家怎么看。我还是喜欢一些常用功能能像现在这样高效使用,毕竟页面容量有限,不可能将所有功能都添加到页面上。对于那些长尾功能,我们要求相对较低但覆盖范围广,其实很适合用大模型来覆盖,这些都是可以想象的。
还有一些低 ROI 的事情,要避免技术短板。最后一点我想重点强调,与大家想象的不同,我认为现在大模型的调优成本仍然较高。之前业内有类似的情况,有些公司投入大量资源做行业大模型,结果做出来还不如通用大模型升级一个版本的效果,前期投入基本白费。更合适的方式是,我们尽量先通过 Prompt(提示词)和 RAG(检索增强生成)等方式进行简单调优,如果是非常重要且有价值的业务场景,再进行微调,实在必要时才考虑全参数调优,尽量不要轻易尝试模型开发,我觉得这可能是比较合适的方式。
03组织保障
第三个部分谈谈组织保障。
避免错误激励
我认为在公司内部形成创新文化非常重要。先说一些我看到的乱象,大家需要避免。第一是 KPI,它很容易催生伪需求,正所谓 “道高一尺,魔高一丈”,大家都懂;第二是领导可能过于激进,不分场合要求各种 AI 化,这会造成严重的资源浪费;第三是搞全民 AI 大赛,市场上能看到这类情况,但仔细观察会发现,基本都是 AI 平台厂商在做,目的是宣传自己的产品。在公司内部,这类事情意义不大,因为很容易避重就轻,解决一些无关痛痒的问题,还有盲目模仿抄袭,我们还是要结合自身场景,判断是否有价值。
营造创新的土壤
说完不好的方面,再说说我们该怎么做。我觉得创新需要良好的土壤。尤其是很多公司已经发展多年,在原有模式上不断打磨、优化,但这也有其负面影响,会抑制创新。我们需要打破这种局面,我个人感觉,创新往往带有很多英雄主义色彩,要强调人的价值,所以在组织模式上应更依赖于人。
第二,在进行攻坚项目时,要赋予攻坚团队相应的决策权和资源配套。比如做一个测试类的 AI 创新项目,若让它与原有的测试团队配合,不用想也知道,这相当于革人家的命,对方肯定不会配合,会造成很大的内耗,导致项目很容易失败。
第三,可以做一些更潜移默化的事情,培养大家的 AI 意识,多推广 AI 工具,在考核方面有所倾向,从而产生潜移默化的影响。
有效利用资源
再进一步,若想把事情做得更好,还需考虑资源问题。AI 相关资源如何高效利用呢?前段时间大家还在说降本增效,最近却开始大力投入 AI。如果大家近期参与招聘就会发现,相关人才非常抢手,很难招到。所以,每个公司在这方面的资源,无论是硬件还是人才,都相当稀缺。我建议在前期,无论大公司还是小团队,选择一些有潜力的项目集中资源投入,通过实践积累经验、培养团队。
第二,公司发展到一定阶段,要考虑避免重复工作,沉淀公共能力,这是非常值得做的事情。
第三,鉴于当下 AI 资源极为稀缺,建议成立横向团队提供咨询,由业务团队进行业务创新,横向团队提供技术支持。在前期攻关阶段,可以将两者结合成一个团队,兼顾横向职能。
鼓励发扬创业精神
最后,在组织方面还可以考虑发扬创业精神,但这也有很多需要注意的地方。为什么内部创业容易失败呢?一是容易陷入理想主义,我们还是要回归到价值层面;二是大家会有很强的主人公意识,缺乏危机感,所以个人应承担一定的创新风险,同时公司应给予其超额收益;最后一点,由于创业本身容易失败,无论是内部还是外部,所以公司应适度容忍失败。
04落地的核心挑战
回到第四点,讲讲落地时可能遇到的一些较大挑战,我想大家或多或少都会碰到,主要有两个方面:
找到适合的场景并做出合理的AI产品设计
AI 产品设计。可以想象,AI 产品肯定与传统产品不同,具有创新性。ChatGPT 刚推出时,我就在想,这么厉害的东西界面竟然如此简洁。所以,当我们将大模型与自身场景结合时,其具体形态可能与传统产品完全不同。
人才问题,尤其是产品人才。这类产品人才要求极高,除了具备传统优秀产品人才懂业务、能从 0 到 1 打造产品的能力外,还需懂技术,要清楚 AI 能做什么以及其边界在哪里。
说实话,对于这个问题,无论是内部培养还是外部招聘,都没有特别好的解决方案来填补空白。唯一能给大家提供的思路是扩大人才搜罗范围,这类人才不一定出自产品团队,毕竟 AI 浪潮的底层是技术革命,他们有可能来自技术团队。
优化出能符合实际场景要求的效果
还有一个非常困难的事情,大家在深化应用时可能都会遇到挑战,就是在实际落地过程中,调优效果很难把控。一方面,调优方法众多,不同场景可能需要使用不同的调优方式,我相信过一段时间,相关方法论会逐渐沉淀下来,届时会容易很多,但当下确实比较模糊;另一方面,调优效果存在很多不确定性,因为 AI 本身具有一定的黑盒性质,结果不太可控,这就导致我们可能不知道要投入多少资源才能达到期望的效果。综上所述,应对思路大家也都在探讨,但要提升到更高层面,就是建设评测体系。由于大模型本身比较 “黑盒”,所以测试调优思路也应从 “黑盒” 角度切入,构建一套完整的评测配套工具就变得非常重要。我认为这将是未来测试工作的主要内容。好了,今天我用大部分时间分享了这些内容,希望能对大家后续开展这项工作有所帮助。
谢谢大家!