2025-07-08大家好,我是金赛药业的王梅亭。金赛药业自上而下总结为两句话:Data for AI 和 AI for Data,今天我将围绕这两部分展开分享。
大数据平台建设历程
在早期,我们开展了大数据平台建设。从总体的数据总线,到数据计算平台 OneFlow;从处理无价值与高价值数据关系以实现数据资产沉淀,到通过 OneAuth 处理数据与人的关系、OneBI 处理高价值数据与业务的关系。最终实现从数据接入到报表展示,报表开发可在一天内完成,大致就是这样的逻辑。
主数据治理难题与解决
尽管有了这样较高的效率,但我们在过程中仍遇到一些问题。其中最突出的是,在对接的 140 个系统中,主数据存在严重不一致的情况。例如,同一个机构主数据,在不同系统中的名称却不相同。这就需要花费大量时间进行治理。而最终的责任应落实到每个销售代表或使用主数据的人员身上,因为只有一线销售代表最清楚主数据的实际情况,比如有些医院是多中心的,名称、地址发生变更等。
数字化建设推进策略
完成主数据治理后,我们以顶层推动的逻辑推进数字化建设。在顶层,集团高层设有总看板,主要展示财经指标和项目情况。为达成特定财经指标,会有多个项目同步推进。但在指标拆解过程中,存在如何将财经指标拆解为业务指标,以及项目如何与指标、OKR、KPI 挂钩等问题。
我们致力于让每个人都拥有自己的数据看板。通过飞书,数据看板不仅可以随时在手机上查看,还能每日推送,告知指标达成情况,提醒跟进相关项目。这样自下而上的管理方式,能让各级管理者清晰了解管理逻辑和日常工作重点。
目标统一化管理与策略执行
这是目标的统一化管理。金赛药业发展迅速,新业务单元(BU)不断涌现,目标也随之频繁调整。例如,今天可能重点关注销售代表拜访情况,明天则聚焦准入工作,不同月份侧重点也因药品销售季节(我们主要做儿科药品)而有所不同。在实现人人都有数据看板后,一旦目标调整,全公司的目标也能同步更新。
在策略执行方面,我们建立了标准化流程,能够快速调整策略。如图所示,起初我们面临数据不可见的问题,后来看板数量大幅增加,一年新增了一千八百多张。面对如此多的看板,大家开始质疑:为什么要看这些看板,直接告知问题不就好了?由此引出指标巡检的需求,即查看看板中异常指标并上报。这与 AI for Data 密切相关,因为随着需求升级,人们不仅满足于查看看板,还希望能拆解任务。目前,我们通过与管理岗沟通,确定任务按人员、产品或区域进行派发。未来,我们期望借助 Agent 实现自动决策和任务拆解,这也是后续 AI Agent 应用的基础。
业财一体化与数据资产沉淀
数据采集及通路建设完成后,业财一体化成为重点。我们基于数据中台,贯通各类数据,实现成本和 ROI(投资回报率)的精细化核算,确保每个业务颗粒度的成本与收益达到平衡
最终,我们实现了集团整体的精细化管控。如图所示,此前我们在大数据领域做了诸多工作。进入 2.0 时代,从技术层面来看,我们将从主要处理结构化数据,转向处理大量非结构化数据,如员工本地存储的文档,这些文档构成了个人知识库,包含工作多年沉淀的法律法规、销售经验等信息。如今,借助 AI 技术,如知识图谱,我们能够更好地管理这些知识。尽管过去知识图谱存在线条和路径不清晰的问题,但对于 AI 而言,它仍是非常实用的工具。因此,我们在进行很多工作时,不仅要考虑人的使用需求,更要着眼于未来 AI 的应用。通过知识沉淀,最终形成数据资产,这将成为企业未来最有价值的财富,目前已经出现数据交易的现象,这也充分说明了数据资产建设的重要性。
AI 基础设施建设
从 AI 基础设施建设来看,主要包括四个方面:工程化能力、模型能力、数据能力、应用能力。数据能力正如前文所述;工程化能力是企业和供应商都能够开展的工作;模型能力主要体现在模型微调,预训练成本极高,通常只有大型企业有能力开展;应用能力是我们最为关注的,因为没有应用场景,AI 建设就失去了意义。
在基础能力建设方面,我们首先搭建了 AI 计算平台。随着 GPU 设备的增加,为了实现算力的高效利用,避免资源浪费(例如夜间闲置),需要对任务进行调度。AI 计算平台主要负责根据任务需求选择合适的 GPU 资源、规划运行方式和时间,同时支持模型微调、蒸馏等操作。一般来说,模型微调可能需要 1 - 2 周时间,而生成预处理模型则可能需要 3 - 4 个月,像阿里、字节、DeepSeek 等大厂在模型训练方面具有显著优势。
在大模型微调后,如何评估其是否满足要求也是关键。使用通用模型进行微调,往往只能强化某个特定方向的能力,其他方向的能力甚至会被削弱。因此,微调必须有明确的方向,例如针对特定适应证场景,通过资料训练微调模型后,还需经过一系列下游评测,只有达到预期标准,才能上线使用。如果使用通用标准进行评测,结果往往不理想,而且从通用模型微调得到的模型,通常仅在某一特定方向超越原通用模型。
AI 技术应用实践
其次是提示词工程管理。在 DeepSeek 推理模型出现之前,提示词工程是非常有效的工具。提示词工程就像编写代码(如 circle、Python),有些提示词长达数千字,能够详细规定输出字符串格式、段落要求以及检测内容等。例如在图片识别中,我们先将一张大图切成 5 张小图,连同原图共 6 张图片输入,通过提示词指令,让模型先逐张识别小图(小图识别精度更高),最后将 5 张小图合并与原图对比,使得图片识别率从 80% 提升至 95%。虽然现在推理模型能够自动生成思维链执行任务,但当模型性能提升遇到瓶颈时,提示词工程仍可通过限定思维链,帮助模型进一步优化。
在 RAG 平台方面,我们采用了 GPT4。从知识库数据入库、配置向量库,到完成 Agent 配置,现场操作仅需 1 分多钟,使用较为便捷,建议药企尝试。但需要注意的是,RAG 平台只是工具,若没有完善的知识库,它无法发挥更大作用,因此企业需要注重自身知识沉淀,才能实现高质量的问答交互。
知识管理规划与应用场景
我们对知识管理进行了规划。在知识库建设方面,企业可根据实际需求,如侧重图像识别(包括 OCR 识别等),针对特定场景对模型进行微调。例如血常规、质量报告等,由于模板相对固定,实现 99% 以上的识别准确率,训练成本并不高,因为这是基于通用模型进行专项训练。
另外,在对检索速度要求高、关联复杂的场景(如 HCO/HCP 场景,需要了解专家文献阅读、关注内容、学会参与情况及专家关系等)中,知识图谱是理想选择。但知识图谱最好与 AI Agent 结合使用,这样 AI Agent 能够通过思维链整合信息,避免用户自行搜索筛选的繁琐过程。
我们的应用场景还包括伴学机器人(培训机器人)。开发伴学机器人的意义在于,通过它可以评估员工工作水平。随着培训机器人资料库的完善,未来有望替代部分低水平岗位工作,因为它既能培训员工,也能作为 Agent 对外提供服务。
AI 能力检验与未来展望
自动化报告生成是检验 AI 能力的重要指标。实现自动化报告生成,需要 AI 阅读大量报告,并将生成的报告反馈优化原有数据。一旦具备自动化报告生成能力,将在众多场景中实现复用。
我们每年制作大量看板,而 ChatBI 的目标是,通过数据中台建设和数据集完善,将数据信息输入专属私人 AI Agent,使其能够回答公司数据范围内的各类问题。这样一来,每个人都能真正拥有个性化的数据看板,无需依赖大量人工制作的看板。
在大模型应用方面,通过 Prompt(提示词)已经能够解决 70% - 80% 的业务场景需求。如果企业有预算或特定细分领域需求,可以进行大模型微调与强化训练,但不建议开展预训练,因为预训练不仅需要大量 GPU 资源,而且训练周期长达数月,成本过高。今天的分享就到这里,谢谢!

扫一扫微信二维码
随时了解信息侠微报资讯

扫一扫手机端二维码
随时了解信息侠微报资讯
Copyright @ 2018-2019 信息侠一站式数字化转型交流分享平台 版权所有 皖ICP备19006839号-1
上海申馥文化传媒有限公司
安徽申馥商务咨询有限公司
安徽申馥企业服务有限公司
地址:安徽合肥望江西路西湖国际广场D座2345室 网址:www.xinxixia.cn
电话:021-34121111 0551-64388008