2023年12月13日至15日,“2023第二届数据治理年会暨博览会”在北京展览馆隆重举办。本届大会由中国电子信息行业联合会主办,以“数据强基、智领未来”为主题,展示中国数据治理成果。上海罗盘公司作为数据治理行业先行者,也应邀参加此次博览会,集中展示数据治理体系和能力建设成果。
在数字化转型大背景下,“数据是企业的核心战略资产”已然成为社会共识。然而金融行业数据资产运营目前普遍存在“锚不定”,缺少企业级数据战略,业数融合不足;“驱不动”,缺少业务和运营思维,以技术为驱动的推进模式,缺乏升级活力;“配不对”,数据资产运营没有形成闭环机制,高质量数据供给不足,导致供给和需求错位匹配等诸多问题,金融行业要想充分挖掘数据潜能,更好的实现数据驱动和数据资产入表,离不开数据资产运营在背后的“百炼成金”。
针对这些问题,上海罗盘凭借多年的行业积累和先进的技术实力提出了自己的解决方案,并且荣获了“2023数智杯数据管理创新应用大赛智能化数据治理应用赛道优秀奖”。这表明上海罗盘的数智化解决方案已经获得了行业内的高度认可。
具体问题具体分析,上海罗盘为客户解决实际痛点
据悉,本次上海罗盘获奖项目的具体客户是上海期货交易所。
需要指出的是在证监会发布《证券期货行业分类分级指引》以后,交易所作为证券期货行业的核心机构,它的职能除了提供交易场所确保公平交易以外,还有一个很重要的职能是进行监管。
因此他的分类分级要求是要做到全覆盖,但是客户的数据量又比较庞大,也是百万级的元数据,并且项目一期做了比较长的时间,二期的资产盘点人力投入还是比较大,主要工作就是将系统中的表和字段与前期项目中梳理出来的资产目录和资产项进行物理映射,另外就给表和字段分配相应的安全级别以满足后续对数据安全的精细化管理,因此客户期望能够通过智能化手段来完成这一过程。
为了解决客户的这一痛点,首先在模型的构建上,上海罗盘创新性的将百度的ERNIE模型和DPCNN深度神经网络模型进行融合。这两大模型各有各的优势,其中百度的ERNIE模型,它是一个基于知识遮蔽策略的语言表征预训练模型,在上海罗盘的测试当中,他的效果超过了Google的BERT模型,而DPCNN深度神经网络模型,则在解决文本的长距离依赖上比较有优势。
其次在模型的训练上,上海罗盘采用了k折交叉验证、数据增强及分词等方法来不断增强模型的泛化能力和输出效果。
最后在智能化落地上,可以分为以下几个步骤,第一步是自动捕获元数据的变更,然后创建盘点任务,提交给AI模型进行盘点,盘点结果可以导出进行人工复核和调整,调整结果经过评审以后就可以一键提交入库了。其中AI模型盘点的结果给出了表和字段对应资产目录和资产项的推荐映射关系及安全级别,可以分为已有资产项、新增资产项和新增资产目录三大类,已有资产项的判定标准是表匹配度达到40%,字段匹配度达到80%,新增资产项的判定标准是表的匹配度已达40%但是字段匹配度未达80%,新增资产目录的判定标准是表的匹配度没达到40%,这就意味着现有的资产目录已经不能满足该表的分类需求,需要增加新的资产目录了。至于这个匹配度的判定阈值还可以进行参数化设置。
正是因为上海罗盘为客户找准了真正的痛点、提供了有针对性的方案,使得整个项目获得了客户和行业的认可。而这背后则是上海罗盘长年深耕这一行业带来的实践积累。
知中行、行中知,上海罗盘商业化进程不断加快
众所周知,做学问不能只一味的空谈,要从实践中来到实践中去,实现知行合一;做企业亦是如此,要平衡好技术开发和商业化之间的关系,为客户创造价值,从而获得长期发展的动力。
上海罗盘也是深谙此道,其始终致力与为企业提供最佳数据服务,一直秉承“从理论到实践,再从实践到理论的飞跃”。
以前文提及的上海期货交易所为例,上海罗盘助力其实实在在实现了降本增效。根据上海罗盘的估算,上线智能化盘点功能以后,数管部用户不用再频繁去找业务部门用户核对资产项信息了,整体资产盘点流程工作效率提升达到30%以上。减少了两个专职岗位,到目前为止给客户节约成本超过120万,这个是按照人均30万年成本,从功能上线到现在估算出来的,而且还没有考虑和业务部门沟通占用的业务部门资源成本,上海罗盘也因此获得了客户的高度认可。
此外这个项目的另一层意义还在于提供了一个可复制的商业模式和案例。管理学大师彼得·德鲁克曾说过:“当今企业之间的竞争,不是产品之间的竞争,而是商业模式之间的竞争”。
在企业成长的过程中,将优秀的商业模式和案例复制到新的项目中,成为很多企业做大做强历程中的必经之路。并且选择可复制的商业模式还可以帮助企业节省大量的成本。
根据赛迪顾问《金融科技发展白皮书》数据,2016-2020年,我国金融科技市场规模保持增长态势,增速保持在10%左右。2022年,中国金融科技整体市场规模达到5423亿元左右。也就说2023年中国金融科技的整体市场规模在6000亿左右。
面对这样一个广阔的市场,有优秀的可复制的商业案例,将为上海罗盘持续拓展客户提供有力的支撑。
面对不同的客户需求,上海罗盘具有差异化服务能力
在此背景下,面对不同的客户需求,能否具有差异化服务能力变成了决定企业能否具有长期生命力的又一关键。
而上海罗盘的EDGS自2016年投产至今,成功服务200+大型客户,已经积累较多用户群体,涉及金融、类金融、互联网、制造业等不同领域。并且也在不断地升级更新当中。
能服务不同领域的不同客户,说明了上海罗盘公司的产品已经有了差异化和精细化的优势。
产品差异化上,在数据资产治理系列产品上,面对数据治理工作专业化、独立化程度提升,上海罗盘产品能够解决企业全面综合数据治理和专题数据治理多样性、专业化诉求。其是由多个模块组成的整套解决方案,致力于帮助企业控制数据风险、运营数据资产、发掘数据价值。产品以元模型为核心、元数据为基础、AI算法为支撑,数据管理流程为纽带,实现了数据从被创建到退役全生命周期管理。EDGS自2016年投产至今,已经积累较多用户群体,涉及金融、类金融、互联网、制造业等领域。并且也在不断地升级更新当中。
在数据资产应用系列产品上,在相较市场大多提供的封闭且重型数据中台应用产品,难以满足大量探索性强、需求变化快且反复、难以固化成专业数据系统的分析需求,上海罗盘产品能够以低耦合的架构,低成本AI场景赋能、短平快持续交付、全流程安全管理,解决数据最后一公里的广泛业务诉求。
随着技术的不断进步和市场的不断变化,数据资产运营将面临更多的挑战和机遇。未来,企业需要更加注重数据的活性管理和综合评价,释放数据价值。为此,上海罗盘也将在数据资产运营领域持续创新,结合数据能力优势,帮助金融机构推进数据资产的创新实践,真正实现数据资产化、数据要素化,打造金融机构数字时代的新引擎。