在浏览器中启用javascript以获得更好的体验. 需要知道如何启用它? Go 在这里.
为什么数据产品的Data Mesh可以更快地提供财务洞察

为什么数据产品的Data Mesh可以更快地提供财务洞察

金融正处于分析的十字路口

 

那是一个典型的工作日,在一家典型银行总部的典型会议室里. “在威利斯人app银行的产品中,威利斯人app在这个国家有多少独特的客户?全球消费银行(全球 Consumer Bank)的国家业务经理问道. 他认为这是一个简单的问题,数据科学领域的领军人物将会在他的指尖找到答案. 出席会议的是商界领袖:总经理, 这个国家的头, 零售银行业务主管, 信用卡和个人贷款主管, 住房贷款的头, 还有高级国家运营官. 在接下来的几分钟里,几个数字被当作可能的答案抛来抛去. 

 

很快就很明显,无法找到一致的数字,也无法就这个数字达成一致. 

 

这家银行有一个精心设计的数据仓库. 即使金融机构的数据仓库有全球客户识别号(GCIN)等数据, 户口号(HH号), 客户识别号(CIF编号)和帐户编号, 领导层仍然无法得出不同产品的独特客户数量. 主要的问题是:企业中的客户数据所有权在哪里? 为什么数据平台团队不能拥有所有权? 有人拥有这个问题域吗? 解决任何问题的第一步都是提出正确的问题. 就是这样:有人拥有这个问题域吗?

 

No? 威利斯人app是怎么走到这一步的? 

 

大多数金融机构的数据支柱都有几十年的历史了. 它们现在是由历史最悠久的银行加上过去发生的所有合并和收购组成的集团. 较小的实体很可能为其客户带来了不同格式的银行系统. 威利斯人app指的不仅仅是系统,还有管理哲学. 银行系统被并排聚集成更大的公司. 它们可能在同一个网络上,但它们的数据就像森林中的两棵树一样孤立.

 

要理解这种情况, 威利斯人app需要看看大多数金融机构在现实生活中面临的挑战——那些让它们忙碌、阻止它们处理基本和战略问题的事情:

  • 数据标识认证. 您的分析人员拥有多个自包含的系统,这些系统对客户id使用不同的名称. 这是您的组织中持续存在的摩擦, 一个经常交叉检查和过滤的隐藏工厂, 每次你都需要制定一个客户获取策略, 客户收入或利润分析报告, 或者客户推出360计划.

 

例如, 报告中统计数据的准确性主要取决于所选择的数据及其质量. 当没有在这些自包含系统中找到所选数据时, 有一种倾向是替换替代数据. 这就是影响报告准确性的因素.  

 

  • 数据分级审批. 分层和古老的, 许多传统银行仍在使用70年代版的分析管理理念, 没有敏感性训练.  彼得·德鲁克(Peter Drucker)还没有获胜.  银行业是非常动态的——那么,为什么要因为流程或产品的增加而创建新的数据呢, 是否需要金融机构各个部门的多级审批? 想想这导致的摩擦和上市延迟.

 

通过跨业务部门和产品线(如信用卡)使用数据, 零售银行和私人银行业务, 金融机构能够更有效、更主动地瞄准客户需求. 不幸的是,目前这需要花费很多时间才能得到业务领导的批准. 为什么? 例如,在交叉销售计划中, 审批过程是用来尝试和清除不一致和不同的方法,当一个产品销售时,如何在业务部门之间分配收入.  

 

  • 离线数据. 高收入的, 有限的数量, 您组织中的专门分析人员在清理上花费了过多的时间, 以应该自动化的手动方式组织和聚合数据. 这几乎和去当地银行分行让分行经理填写你的支票登记簿来平衡你的支票簿一样痛苦.  当你的分析时间线被破坏的时候, 可以肯定的是,您的团队正在执行手工数据管理,而不是分析.

 

第三方数据用于增强组织数据,使其更完整的分析. 例如,在二三线城市开展收购高净值个人进行财富管理的活动时,要确定目标地区. 获取第三方研究数据以确定市场规模并帮助达成规模 & 潜在客户钱包份额. 然而, 这些数据以完全不同的格式到达, 有不同的命名法和定义. 将数据标准化并转换为组织的格式是一项资源密集型的任务.

 

  • 组织的挑战. 分析团队知道他们拥有和控制哪些数据吗? 是否有拥有域数据的组? 例如, 客户概要信息是否由管理其内容的一组人拥有, 安全性和访问? 如果不是, 这意味着没有人可能会这样做——这导致了组织内多个部门和部门之间各种形式的相互依赖和内部沟通. 一碗意大利面式的沟通,可能不需要与任何一个权威机构沟通.  

 

数据的所有者导致更好的完整性和有效地使用数据. 车主身份不明时, 维护, 记录, 更新, 确保完整性是无效的. 例如:一家银行的入职运营团队审查一个新的公司账户表单,并将详细信息输入到核心银行系统.  如果随着时间的推移,企业客户的人口统计信息发生了变化(他们移动了, 新CEO), 组织中的谁将负责返回客户并更新数据? 对于活动客户机,这将更容易在事务的验证交互期间进行管理. 然而,威利斯人app知道有很大比例的客户是被动的或不活跃的. 如果确定了数据所有者,则可以定期更新客户详细信息. 

 

更深入的分析通常表明,上述大多数问题都是由于缺乏一个 商务词典或术语表. 业务术语表是组织在数据治理开发工作期间产生的重要资产. 术语表是对关键业务概念的技术和社会公认的理解, 领域中的业务术语及其之间的关系. 事实上,它是银行业务架构中的关键部分.

 

威利斯人app的银行领域示例中,一个很好的参考是一个名为 金融行业业务本体 (FIBO). FIBO是金融行业的一个概念模型 企业数据管理委员会 (EDMC).  它识别金融业务应用程序中感兴趣的对象,以及这些对象之间相互关联的方式.

 

通过引入FIBO领域术语表, 可以识别数据不一致,避免对数据进行多级审批, 因为数据项是预先在术语表中指定的. 由于有一个共同的目标数据集,脱机数据处理可以实现自动化. 最后, 通过将所有权分配给术语表中引入的对象和术语,可以最大限度地减少组织方面的挑战.

金融行业业务本体组织在金融业务应用程序中感兴趣的金融术语和概念的层次结构中, 以及这些概念之间的联系.

 

顶级目录称为域, 在那里你可以找到商业实体, 金融及商业合约, 还有指数和指标.

 

子域, FIBO合同本体包括哪些 , 贷款, 抵押贷款, 证券等.

 

其次是定价、分析和收益率.

标准化的业务术语表无疑是提高金融机构分析结果的关键第一步. 但是,为了真正加快计算和利用公共数据术语表的力量, 威利斯人app必须超越现有的数据系统实现技术. 这些系统和软件使用集中的数据湖和仓库(在前提下或在云中).  威利斯人app必须投资于自动化和治理:数据网格.

 

数据网格

 

威利斯人app合作过的另一家银行, 数据域的所有权是分散的,没有集中的术语表.  他们有好几代客户数据系统,他们使用云技术. 当威利斯人app完成他们的Data Mesh的第一个实现时, 分析业务“数据产品”的价值交付时间在很短的时间内从3个增加到100个, 确定未来的所有权和管理所有数据产品的业务术语表之后.

 

注意数据域(e.g. 客户) 数据产品. 这也是至关重要的一步, 并负责识别所有权和时间价值速度. 简单地说,就是把数据消费者当作客户. 一个团队为特定客户的需求创建数据产品或数据集. 该团队还拥有数据域,可以为任何其他消费者生产数据产品. 

 

实现价值的时间加速特别来自于所有权的强制性组合, 数据自动化工具, 以及一个通用的业务术语表,以便快速理解供应商和消费者.

数据网格可以连接来自整个企业的有价值的见解来源

了解数据网格, 改变你当前的思维模式, 集中式数据湖, 数据产品的生态系统可以很好地协同工作. 而不是为每个人手工打造一个数据湖, 您将特定于领域的用户聚集在一起,并确定他们较小的组的需求. 而不是手工批量数据加载, 您可以创建从相关数据源读取数据的自动化管道,从而为该组生成数据产品. 而不是手工制作的数据导出代码, 您可以使用一种语言自动生成数据管道, 生成数据产品, 尽快. 这三个元素—特定于域的用户组, 一个生成的, 自动化流水线, 和该用户组的数据产品-在你的数据网格上创建一个节点. 

 

面向数据网格的云开发使用众所周知的数据基础设施工具(例如.g. Kubernetes和Terraform),比数据湖和仓库解决方案的开发快得多. 在威利斯人app的经验, 你减少了从季度和月份获得有价值见解的时间, 到周.

 

对于金融行业的人来说, 这种类型的方法可以支持过程和操作改进,从而更好地预测客户的结果.

 

当数据所有权明确时,问责制就会增加,从而提高数据的质量. 就像经常更新商务词典/术语表一样, 它使整个组织的术语标准化.

 

面向数据产品的领域团队将推动跨企业的数据使用,用于跨公司产品线的活动. 他们已经对自己领域的数据字段以及与第三方数据字段的关联关系有了深入的了解. 这将鼓励和激发组织其他成员使用由这些面向数据产品的领域团队认证的第三方数据的信心.

 

现在, 当银行高管想知道产品中有多少独特的客户时, 他们将得到准确的回应, 可靠的, 和 faster; 最重要的是 the number will be the same across the organisation. 

 

因此,数据网格方法的重要输出是数据产品. 它为一个或多个业务用例服务于业务社区. 它的建造速度非常快——只需要几天到几周. 然后,数据产品通常由需要它的消费者(分析师)访问, 商业智能, 机器学习应用程序-和连接可以自动生成的数据网格工具. 一个重要的数据网格的时间价值改进的指标是:

 

  • 产生分析性ROI或业务影响的数据产品的数量, 在每个时间段内部署到客户组. 例如,创建与业务相关的Data Mesh数据集的上市时间.

     

要摆脱多年的遗留数据仓库体系结构并不容易. 当你“改变了你当前的思维模式, 集中式数据湖,”“你怎么说呢? 数据网格的一些良好实践可以指导您找到更好的数据解决方案. 它们由三个阶段组成:

 

  1. 构建一个平台策略来识别一个或多个域中的端到端用例

  2. 根据术语表执行数据发现,以确定和验证要读取的数据源

  3. 迭代地构建管道,操作它,并共享数据产品供用户使用

     

在迭代地构建和交付时, 记住数据网格架构的这些原则,以帮助确保你的数据产品是完整的:

 

  1. 分布式域驱动体系结构. 确保数据产品受域内术语表的约束

  2. 自助平台设计. 创建数据产品的软件是公共的——在您的安全范围内. 确保其他人可以“运行和扩展”管道来创建新的数据产品

  3. 用数据思考产品. 为数据产品建立所有权 

     

更多的数据和集中化是一种普遍的智慧.k.a. "真相的单一版本,“将继续是一个挑战,以建立可扩展和相关的分析系统. 但这是一种错误的做法. 财务数据可以带来高ROI和客户360分析, 但是资产的定义和分布应该与当前用例相关, 需要数据的客户, 最重要的是, 及时地, 抓住出现的市场机会. 

 

了解数据网格如何帮助您的业务