解析CMIS|江苏省医药有限公司彭俊:数据全生命周期的探索与实践

2024-07-26
大家下午好!
我是江苏医药的CIO彭俊,今天下午很高兴再次莅临医药的数智化峰会,这次来比上次来更加忐忑,两个原因:
1.来之前我想想去年,我分享的是业务中台,今年我想更多的是分享我们的数据中台,数据中台大家都知道数据其实是一个很枯燥的事,它是咱们业务状态的一个记录和表达的载体,谈到数据我们更多其实融入我们的一些平时枯燥、繁琐工作,怎么把它讲得出彩这是我第一个压力。
2.因为大家知道整个行业现在非常卷,我看到最近好多同行的朋友本来也要参加这次会议的,因为各种原因都没有来,我也是,本来我是准备过来参会的,要求我这边做一次演讲,所以到昨天晚上我的PPT才正式完结,今天分享有不太恰当的地方请大家海涵。
下面进入我的分享,我今天的分享主要是《数据全生命周期的探索与实践》,包含四部分:
01
引子
大家看一下左上图,这是今年热播的影片叫《飞驰人生二》,中间有一个桥段就是三个兄弟看到大屏,大屏有各种数据,他们讲一句数据自己能说话,在整个比赛期间前面晴空万里,后面他们突然看图表的时候感觉到马上要雷雨来了。数据自己能说话,怎样让数据自己能够说话呢?我觉得应该包含以下几个方面:
(1)数据在哪里?现在有各种各样系统,有的在ERP、WMS、MES等等各种系统,数据在哪里,我们要做思考,盘点和整理。
(2)数据标准吗?数据在那里,但是我们没有按照标准化的方式录入,所以我们让它不太符合我们的要求。
(3)数据准确吗?因为数据是人录的,所以必然包含异常和错误。
(4)数据完整吗?就是我们完整性。
(5)数据可不可取,如何取?涉及到技术层面怎么取,当然现在取ETL工具非常多,我不做赘述了,所有一切回归到最后就是我们整个数据全生命周期之中我们必须要问自己的三个问题,因为建设到最后其实我们围绕着三个核心的问题就是:
(1)我们现在做了这么多丰富绚丽的大屏是不是面子工程?我们看到各种数字化论坛也好、新闻也好基本上千篇一律标准摆设就是前面一个大屏,一堆领导围着一个大屏,大屏真正实用度有多少,我们要存疑。
(2)繁多复杂的系统老板会用几个?我们公司我们老板只用两个系统:OA、BI。OA只负责所有的财务和业务的审批;BI那就是它最终决策的一个很重要的依据。它不可能登录CRM做拜访,也不可能登录WMS做库内的操作。
(3)多维多样的BI报表,业务是否考核的时候才会想起?我们做了这么多绚丽的报表,什么时候业务才真正用起来,我觉得这是我们存疑的问题,所以我们面对这么多的技术与管理的鸿沟,怎么突破它?怎么跨越它,这是我接下来想要谈一点我的认知跟理解。
02
认知与理解
数据是形成新质生产力的优质生产要素
数据现在是新质生产力很重要的一部分,我们国家近五年来无论从组织的重构上,还是我们整个发文上非常地重视数据,2020年开始国务院就已经提出了第一个叫土地劳动力资本技术之外的第五个数据,作为第五大生产要素。
2021年《数据安全法》出来了,2022年咱们的重点数据要素的重要意见出来了。去年大家都知道,国家数据局正式揭牌成立,各个省市包括江苏省小到市甚至区都有各种各样的大数据集团蜂拥而起了,意味着国家层面大家对数据重视非常之高。
浓缩到我们现在整个医疗行业,我们的数据要素,医疗健康这块国家最新一期《数据要素三年行动计划》也明示了,提升群众就医便捷度、便捷医疗赔付结算、有序释放医疗健康数据价值、加强医疗数据融合、创新和提升中医药发展水平,这是数据要素发挥重点,这是大背景。
结合数据平台与技术发展脉络来讲,到2024年AI与BI的融合,从技术与数据平台融合角度已经达到了汇聚点,去年大家讲ChatGPT数据是从人工智能元年来讲,今年应该讲大模型是爆发的一年。
人工智能的应用现在非常普遍,每次会议其实各种嘉宾都会分享咱们的人工智能探索,今年我想AI+BI不仅仅作为咱们的助手,更多在医药研发、整个的用户交互包括我们整个数据价值的挖掘上我觉得它要发挥更大的作用,这是我整体的认知。
数据全生命周期:90%的枯燥与10%的有趣
回归到数据全生命周期,这里面最重要的一点在行业内大家把数据全生命周期分为六个阶段,但是我更愿意把它分为八个阶段,我加了两个阶段:
1.组织规划。
2.存储整合。
因为我们现在来讲组织规划其实是一个很重要的东西,我们公司来讲以前其实是没有数据治理小组也没有数据委员会的,经常会存在数据打架、数据出现问题找不到哪个部门、数据出现问题之后即便找到部门它也不愿意改,所以我觉得组织的规划这块是最重要的、最前置的。
第二标准规范,我们存在各种各样数据类型:元数据、主数据、业务数据、运营数据。这些数据怎么规范它,我想这是我们打好整个数据分析和数据价值实现的很重要的基础。
采集交互我不讲了,现在RPA,包括外面展台也有RPA厂商在,包括我们最近的接口,包括一些爬虫技术都是我们比较好的技术底座。
存储整合不用我讲了,重点我要讲容灾备份,容灾备份在我们行业里面非常重要,但是很多企业其实没有重视到它,就我了解在咱们南京,已经最少有四家三甲医院曾经或者正在经历着勒索病毒的威胁,后面就是咱们的数据抽取、清洗转化、可视展现和回收销毁我不做展示了。
数据治理面临的挑战与困惑
数据治理面临的困惑和挑战,最重要一点:防护准入的数据安全需要考虑。
这是我们非常重要的一点,好多企业其实它最后CIO职业生涯就断送在这里,刚刚是技术层面。
管理层面我觉得咱们面临的最大问题还是两个:
1.使用者与设计者存在的巨大认知差。
2.数据质量堪忧。
我后面会再详细做我的分析和见解。
03
探索与实践
探索与实践我简单讲一下咱们省医药对数据全生命周期的治理方式和治理见解。
愿景目标
我们把数据治理的全生命周期的愿景定义为构筑清洁、透明、自助、智慧的数据土壤,实现采集、规则、过程、清洗、展现数字化,驱动业务的感知、联动、预警、预测,提质赋能。
数据为谁赋能?数据一定为业务服务,我们要实现业务的分析、预警和预测,必须要实现数据的清洁,要实现业务上下的联动必须要让它更加透明,针对上下游更加透明,更加能够共享,要实现业务的便捷就必须要更加自助,要实现数据从数据到信息再到知识再到智慧的四个步骤我觉得我们还有更多的动作需要做。这里面尤为重要的一点,更多是治理体系的框架
做数字化决策和分析平台的时候,我们经历了六年准备时间,大家会问为什么经历六年时间,很多人做数字化规划或者建设的时候,他想无非建个数据仓库,找点ETL工具把数据抽取过来,转换一下,清洗一下用BI展示一下就完事了,但是我们2018年一直在想三个问题:
1.我们的组织能不能够很高效应对数据的变化。
2.我们的标准能不能够很直接地反映我现在数据的现状。
3.出现问题后,我们的协同机制能不能满足现在的要求。
所以我们从整个组织变革到流程重塑到机制上,我们做了大量工作,大家也会问三个变化为什么不会跟我现在的数字化分析平台做一些同步进行?其实这里面有织轴,就是重塑,流程重塑如果要重构ERP、WMS和考核系统,大家都知道这是一个非常艰难的工作,我们大概重构ERP前后花了一年半时间,包括我们的考核系统,我们把整个数据维度给它不断释放,标签不断重塑,设计标签大概200多个,让组织之间协同更加高效,保证后面数据基座非常充实的基础。
构建自我治理的数据环境
这里面最重要的还是更加追求数据的自我治理的环节,我觉得自我治理存在两个方面:
1.由系统主动自己治理。
2.由我的业务发起者主动自助治理。
系统自主治理包含三方面:
1.由机器代替人完成取数工作。
2.我们抛弃我们不需要去纠结的事。因为大家都知道主数据这块盒码或者微码是业内比较重要的事,当年我们重构ERP的时候就面临这个问题,行业内面临着很纠结的事,就是如果我要针对我的供应商、渠道、进价、客户销价等等因素把我的码合到里面去,我们算了一下大概有32个情况,有一个场景是什么?我32个情况要列表,让采购员或者收银业务员按照32个情况决定是盒码还是拆码还是拆渠道,需要花大量时间去背去记,完全违背了我们业务高效初衷,所以最后我们采取两种方式:
1.用五维度确定我的结算码。
2.但是用系统自主治理实现我相应的数据一致性与统一性。
3.自主运维,怎样保证我硬件设备和接口充分提供稳定的数据基座,其实我们这块也上了一套全自主运维的感知能力的运维平台。
4.最后就是咱们自助查询,我们做数据平台提供给业务使用者,更多围绕着我们做菜,他要什么菜点菜我们上给他,现在我们更多做自助餐,你想吃什么、想看到什么数据在里面自己搭建,这里面花费了大量我们培训时间和达成共识的过程。
科学标记,打造数据感知的基石
感知(硬感知、软感知),最近我们也与大厂合作,把我们硬感知这块发挥到极致:
第一,我们与整个打车平台和硬件厂商合作,给他们佩戴手环,大家可能觉得由于一个很平常的事,其实行业内整个滴滴司机或者其他平台司机,面临最大的问题就是心血管问题,很多时候是不断超负荷工作情况下,他的心脏得不到休息,经常会出现各种心肌梗塞问题,也影响了乘客安全,我们通过全域管理保障了2000多位司机数据与平台打通,时刻监督司机的心血管情况,以防出现特殊情况。
第二,我们与社区卫生服务中心几个社区做了相应的合作,免费为50岁以上的人群提供佩戴传感器贴片,大家有的人可能用过,由于针扎的那种,可以实时测血糖,还有是无感的那个可能贵一点,这块通过硬件传感器与整个人体交互实现我们整个数据的汇集。大家经常会讲数据有啥用?其实国家层面现在对数据的定义已经从记录属性转换为交易属性了,如果这个数据积累到一定量,到后面我们把它脱敏给到行业去分析、给到国家去分析都是有巨大的价值。
第三,我们现在软感知。怎样通过标签化或者说多维度去扩展咱们数据分析的能力,让它赋能业务,最终引领业务,我觉得买点是一个非常重要的做法。
像我们缺货这块,以前我们缺货记录只有两个字段、买点,一个是缺货数量、缺货记录,只记录业务发生,后面为什么缺货让他填缺货原因,填了缺货原因之后,业务员经常会问,你知道缺货原因了大概什么时候能到货,加了到货时间,后面到货时间来了之后业务员要时时刻刻知道通过企业微信推送,我也知道要未来业务之间怎样更加连贯跟采购沟通,就加了缺货登记时间和企业微信推送与否。
最终层面大家可以看到我们整个字段十几个了,我们已经深深跟精准考核结合起来了,为什么?因为通过采购员填的缺货原因,我们大致能预估到他的缺货原因能够影响多少数据,通过预计到货时间和采购录入时间,结合我采购订单的下单时间就能够分辨出采购员是不是真的是这个原因,打个比方他录的是厂缺,是不是厂缺,如果录了厂缺下午又下了订单,这个时候与厂缺原因就违背了,诸如此类。所以我们通过数据分析把我们整个考核也融入进来了。
可视化,只是最小的一步,让业务用起来才是最重要的一步
最后一点就是其实我觉得所有数字化的分析平台和运营平台、决策平台可视化只是最小一步,现在技术发展到这个层面,抽取数据不是问题,展现数据不是问题,装了什么数据其实是最重要的问题,怎样让数据发挥它的最大价值,我觉得应该是每个IT人最重要要思考的点。
04
一点感想
最后一点我的几个感想,今年四个感想:
第一,如果除去资金支持以外,一把手工程一定是一个伪命题。换位思考一下,如果你是每个公司的老总,你每天要面临多少个领导小组,安全生产小组、网络安全小组、ERP小组各种小组,那么你在当领导的时候你真的会关心那么多业务问题吗?会协调部门问题吗?所以我刚刚讲了一点部门协同和部门的强打破不能依靠老总,所以我觉得一把手工程一定是一个伪命题。
第二,道术相融才能用得更有意愿。道(全员要有数字化的意识),现在我们面临最大的问题是为什么业务用不起来?我觉得最核心的一点,就是业务对数据、对于业务的支撑作用和赋能作用是没有充分认识的,他也不知道怎样让数据运用起来。什么叫做术?术我不仅要告诉他这个东西怎么好用,我也得告诉他你用了之后跟你的考核或者业绩会产生什么样的强关联,这样我觉得业务才有更有意愿进一步用。
第三,花里胡哨整的再多,不如业务三句话:
1.查到了。业务跑客户的时候它的根本要求其实只需要在那一瞬间,他能在一分钟之内查出要的数据。
2.得亏提醒。我们要主动推送,得亏提醒,预警。
3.真牛B。比如说业务它如果看到整个业务形态和未来的走势,看到了业务的一些新增长点,你能告知它,我觉得它才会觉得你的数字平台发挥了真正的价值。
第四,AI到现在大家都在讲AI“四架马车”:知识、数据、算力、算法,哪一个不需要钱?很简单一点算力,现在一个芯片都是六位数的级别,有预算我觉得可以积极拥抱AI,但是没有预算我觉得就好好用好BI,非常可以了。对于我们来讲BI对于整个企业赋能远远大于现有的AI,大家可以看一下,整个的ROI分析有多少企业投入AI之后你的投入和你的产出是不成正比的?我觉得再过五年这个关系会颠倒过来,当然可能有点武断,但是我觉得不妨等等,如果有钱了投点AI,没钱了好好搞BI。
以上就是我的分享,谢谢大家!