随着医疗信息化的基础建设趋近于饱和状态,医疗数据被各类医疗软件厂商作为产品的一大宣传卖点,很多公司也把医疗数据作为公司的一大资产,随之而来,有越来越多的公司开始切入到医疗大数据这个垂直的领域。 话说医疗行业本来就是一个壁垒高的行业,势必也绕不开医疗数据的管理,如果数据管理不好会带来治理速度赶不上构建速度,作为一个医疗数据部门,如何评价医疗数据构建的质量呢? 个人觉得可以以下几个维度进行评估:
一、数据可信度:评估所构建的是否满足行业标准或数据数据管理规范要求参考 如:WS3电子病历数据组与数据元、ICD编码等,有标准,则优先依照行业,尽可能与行业标准保持一致; 二、数据完整性:数据的属性字段是否都填充; 如:数据元有9个属性字段,已维护的属性字段占多少个 三、数据可应用性:数据构建完成成,在应用时是否能够快速识别,区分等,所构建的数据是否方便被引用 举例:症状库有16850个,如何区分医疗行业常见的症状 如:构建疾病库,是否可以快速区分常见疾病、ICD编码疾病、按科室区分疾病等; 四、数据专业性,所构建的数据是否符合医疗行业的命名规则取名,与行业的叫法尽可能保持一致 举例:构建检查项目时,会在项目后增加检查、检测、测定等; 五、数据安全性:数据管理是否有权限管理、对于底层数据是否有审核机制; 如:所构建的数据操作是否安全,能否被轻易修改、删除等 六、数据规范性:在构建数据时是否遵循行业或公司规范
如:创建症状时,以字母ZZ大写开头+6位数字,ZZ000001 七、数据一致性:同一名称数据是否只能一条,不重名 如:帕金森既属于症状库,又属于疾病库,一旦一个名称在多个类别就会容易出现脏数据,数据治理难度加大,故在符合行业要求的前提下尽可能保证数据的唯一性; 八、数据易理解性:所构建的数据是否容易理解,如何让业务端准确的引用到对应的数据 举例:如:实体【帕金森病】与【帕金森综合征】谁能区分,维护或引用数据时是引用帕金森还是引用帕金森综合征 九、可维护性:同一数据在一个位置进行存储,具有共性的数据是否只需维护一份 如:高血压、高危高血压,原发性高血压,是否具有共同特点,是否存在相似的属性,在一个地方维护后可以同步到其他血压 十、可追溯性:数据从新建到删除,是否可以追溯到时间、操作人,操作前等操作日志 如:如果数据被修改或删除了,是否有版本记录,是否可以找到对应的操作者,修改或删除的原因 十一、数据可拓展性:如果数据被升级或废弃后,是否有对应的处理机制 如:ICD10到ICD11后,对应的数据如何更新,更新后对业务端被引用的数据如何处理; 十二、数据维护及时性:数据构建后,该数据相关的属性或关联数据是否在规定时间内维护 如:构建元数据后,是否构建元数据对应的值域(举例:创建【性别】后,是否创建【性别】的值域【男】、【女】)
|