信息集成平台之数据中心
来源: | 作者:pro01fdf3 | 发布时间: 2020-05-18 | 43 次浏览 | 分享到:
基于平台的数据中心建设模式与传统意义上的方法建设数据中心在数据中心数据抽取、加载、清洗、整合方面应该是不一样的建设方法。平台方式下服务总线进行数据的交换时完成了很多数据分类的传递,这些数据分类需要自动化进行数据中心的数据整合,同时通地平台提供的适配器完成其它数据分类的整合。

本文不对数据中心的利用及进行讨论,聚焦在业务数据中心的数据整合层面。

目前医疗行业中在平台建设模式下,采用ESB进行信息交换,而数据中心采用另一套ETL的方式进行数据的整合,这种方式没有充分利用平台内部整合价值,在成本、时间方面都是一种浪费。

医疗行业经过多年发展,从专业化出发,引入了大量的专业化的软件,所以出现大量的交互集成问题,交换集成问题在早期是采用点对点或数据共享方式实现,由于接口数量的剧增,后面引入ESB来解决一源多用与系统耦合度高的问题。另一方面,专业化程序高化,各种医疗数据都分散到各在各自的业务系统中,数据利用变得十分困难,针对这个问题,大家就采用ETL的方式来进行集中数据中心的建设。

采用ESB与ETL来实现两个不同的业务目标,存在不少的问题:

1、交换信息的分类数据中与ETL构建数据中心的数据分类中有大量重叠部分;

2、ETL的时效性方面不是很好,一般都是在晚上进行,所以有很大滞后;

3、ETL采用的数据抽取方法一般对原有系统的性能有一定影响;

4、交换的信息与数据中心采用的标准很难进行统一。

以数据集作为数据交换与数据整合的基础

数据集是一类数据所有数据元的集合,具有结构与逻辑关系,他可以与协议标准融合形成交换标准;向下构建数据中心物理模式。

数据元设计时采用卫生部颁布《卫生信息数据元目录 第1部分》规范作为参考基础,数据元编码规范:

信息集成平台之数据中心


数据集根据业务特点进行建模,让其具有结构与逻辑关系,数据集其实可以理解一个信息模型,设计时要形成以下关键要素信息:

1、 主集与子集:从概念模型的角度出发进行设计,主集是一个数据分类的基本信息;子集是一个数据分类的明细信息;如检验报告数据集主集为检验报告基本信息,如检验项目、检验时间、病人基本信息等;检验子集是指检验明细信息;数据集中主集仅有一个,子集可以有多个;

2、 业务主键:用数据集承载数据时,能唯一标识确定一笔业务的数据元称为业务主键。针对主集而言,可以理解为申请单号或报告单号及病人ID;针对子集而言,业务主键可以理解为唯一确定子集中一行数据的数据元;

3、 业务外键:子集中才有外键的概念,通过外键子集可以关联到主集,与数据库的外键的用途上是一致;

4、 索引:主集与子集都可以建索引,与数据库索引用途一致;

5、 非空:指数据元不能为空,不能为空的字段,在交换与数整合中可以作为校验方法;

6、 其它数据元的属性,如长度、精度、类型由数据元中进行定义;

数据集定义从数据中心这个维度看,其它是一个概念模型的生成过程,通过概念模型的生成,就可进一步映射成物理模型。

数据集是通过一个管理工具来实现,也意味着根据业务特点需要调整数据集规范时,我们同时可以调整数据中心的物理模型规范。这样就可实现一种动态管理的要求,可以根据业务与管理要求,分阶段来实现数据中心的数据分类规划,如数据中心前期我们实现以病人为中心的临床数据中心;后面可慢慢来实现运营管理数据中心。而不要像传统的方法采用穷举的方式,在数据中心建设前期需要对数据分类进行全面规划,实际上全面规划也做不到,一来有可能某些方面考虑不周期;另一个有些业务是一将来才可能出现。

以交换与适配器两种方式进行数据整合

通过平台进行系统集成与业务协同实现,交换的数据分类越来越多,数据中心大部分数据分类都可以通过信息交换来进行自动化的数据整合。

以目前的业务特点来看,以病人为主线的临床数据中心(CDR)是基本上可以通过信息交换过来的数据来完成数据整合;物流如药品、物资、耗材等也可以通过交换来实现数据中心的整合。

其它不能通过数据交换来完成数据整合的数据分类,通过平台提供的适配器来快速完成

数据整合。

适配器的特点:

1、直接利用数据集的制定的数据规范,通过数据集规范中的数据标准与原有系统标准进行对应与转换,快速完成数据的接入,同时完成数据清洗与转换;

2、对生产系统影响很小,适配器的特点不会在原有系统建触发器、视图;没有特殊数据转换时不会读源表;不会与原表比对;

3、中心端数据集标准有变化,在适配器中直接下载变化的标准后,对变化内容进行匹配与转换,可以快递应对标准变化;

总结

基于平台的数据中心建设模式是一种以业务与管理为导向的建设思路,能极大满足未来各种复杂的业务局面。一来降低技术的复杂度与人员要求;同时大家的重点关心问题从技术层面转移到业务与管理上。