医疗健康大数据关键问题及对策研究

网络
医疗健康大数据分析能发挥区域卫生信息平台上汇聚采集的数据价值。针对目前医疗健康大数据分析存在的一些关 键问题,结合在上海市卫计委医疗健康大数据分析的项目案例,探讨了医疗健康大数据关键问题的对策。研究成果表明解决医疗健康大数据关键问题非常重要,包括确定医疗健康大数据业务主题、医疗健康大数据技术架构、医疗健康数据的数据分类、医疗健康数据标准制定策略、医疗健康数据治理策略和医疗健康大数据分析关键技术。案例研究表明,解决医疗健康大数据的关键问题对已有医疗健康数据做科研分析、临床指导、医学经济研究等具有重

[[175050]]

1.医疗健康大数据应用研究现状和意义

在医疗卫生领域,我国对大数据技术的应用成熟度还不高。如何将传统的医疗数据平滑过渡到大数据体系中,通过数据挖掘等手段对其进行专业的分析来实现数据的“增值”,是当下亟待解决的重要问题。能够为精准临床诊疗、决策支持、疾病监测预警与管理、公众健康服务等领域提供有效的支撑,并能发挥区域卫生信息平台上汇聚采集的数据价值。

2.医疗健康大数据分析需要解决的关键问题

本文的研究目的就是探讨如何解决大数据分析关键问题,主要包括:医疗健康数据类型和结构复杂而多样;从技术到业务有巨大的鸿沟:缺乏面向医疗健康领域的分析和挖掘算法库、模型库;缺少医疗健康知识库支撑;大数据技术架构及工具选择所面临的挑战:选择一种架构并构建合适的大数据解决方案***挑战,因为需要考虑非常多的因素;技术本身的挑战:医疗健康语义知识库构建,非结构数据的语义处理,传统分析和挖掘技术的并行化,医疗健康标准化问题和数据质量问题;如何研究基于大数据的应用。

3. 医疗健康大数据分析对策

本文结合在上海市卫计委医疗大数据分析案例给出医疗健康大数据分析对策。

3.1 确定医疗健康大数据的业务研究主题

结合上海市卫计委目前信息化现状,以及采集的数据范围,确定医疗健康大数据的业务研究主题,包括:个性化健康管理:健康评估预警、健康自我管理、康复跟踪、就医辅助、健康处方制定、健康异常提醒;医疗卫生服务:医疗临床辅助、临床成本效益、智能诊疗方案分析、疗效评估、临床质量分析、医疗数据透明度;精准化卫生管理:医疗资源分配、管理绩效分析、公众健康监测、病人疾病经济负担、医疗服务定价、医保控费;医疗科研:比较效果研究、疾病模式分析、合理用药分析、传染病预警、慢性病发病趋势;企业大数据利用:新药研究、药物不良反应、医疗保险定价、健康管理服务。

3.2 医疗健康大数据技术架构

医疗健康大数据技术架构解决方案提供基于大数据的医疗健康智能服务。通过聚合数据、重构数据、挖掘数据价值,实现医疗健康领域的智能化服务。

3.3 医疗健康大数据的数据分类

医疗健康大数据根据数据的采集来源和业务分类可以分为:医院医疗大数据:包括各种门急诊记录、住院记录、影像记录、实验室记录、用药记录、手术记录、随访记录和医保数据等;区域服务平台医疗健康大数据;疾病监测大数据:基于大量人群的医学研究或者疾病监测的大数据;自我量化大数据:基于移动物联网的个人身体体征和活动的自我量化数据,包含血压、心跳、血糖、呼吸、睡眠、体育锻炼等信息;互联网及社交媒体数据:是指互联网上与医学相关的各种数据;生物大数据:主要是关于生物标本和基因测序的信息,直接关系到临床的个性化诊疗及精准医疗;保险数据:医保、新农合、健康保险数据等;外部数据:包括环境、气象、地理数据等。

3.4 医疗健康大数据标准制定

上海市卫计委医疗卫生大数据平台标准体系将在相关国际标准、国家标准、省市的区域卫生信息化建设中已发布的数据元、数据元值域代码、医疗卫生术语、共享文档规范等标准基础上,结合业务特性建立业务的关联性,建立业务逻辑模型,并落实到医疗健康大数据采集的相关数据接口中。从而建立医疗卫生大数据标准体系,包括医疗卫生大数据服务数据规范、医疗卫生大数据服务接入管理规范、医疗卫生大数据服务开放管理规范和医疗卫生大数据服务安全隐私规范。

3.5 医疗健康大数据治理策略

数据质量依赖于数据的应用,如何用大数据思维、新理念、新技术、新方法对采集到的数据进行梳理、整体分类。医疗健康数据的整合、存储、挖掘和探索的基础是数据治理。数据质量问题已经成为限制医疗卫生信息系统效能发挥的瓶颈和短板。数据质量涉及许多因素,包括准确性、完整性、一致性、时效性、可信性和可解释性。为了提高数据时效性,任何数据都在医务人员的实际工作过程中在其工作平台软件上录入,业务软件上采集的数据按照一定的规则和标准逐级汇总到卫计委/局的数据中心。

3.6 医疗健康大数据挖掘分析关键技

医疗健康大数据挖掘分析的技术包括:计算、互联和存储;数据处理和管理;数据分析;可视化;应用和服务。

4.上海市卫计委糖尿病用药推荐案例分析

确定大数据分析主题:研究影响医生给糖尿病患者用药的相关因素;数据预处理与特征提取:根据诊断编码ICD-10筛选糖尿病人诊疗记录,共472 460诊疗记录,涉及516 340个病人;根据初筛的特征变量进行数据质量分析,判断其实际可用性。通过两轮筛选判别,最终选取可用变量38 项,最终形成糖尿病病人特征大表,共260万条记录;目标的模型构建与评估:将300多种药品,按目录通用名分为26类,利用随机森林树算法的多分类挖掘方法,给出28种药品的使用概率,基于概率大小推荐Top药品组合;最终优化结果:模型准确度为0.64,模型的精度为0.25。

5 结论

本文结合在上海市卫计委医疗健康大数据分析的项目案例,提出医疗健康大数据分析的关键问题,探索和总结了解决这些关键问题的对策。研究医疗健康大数据分析的方法、模型和算法,结合临床、科研、药品、公共卫生等领域的业务需求,能够充分挖掘区域卫生信息平台中积累的医疗健康大数据的应用价值。

责任编辑:赵宁宁 来源: 数据资源管理与利用
相关推荐

2016-09-23 15:23:24

大数据时代大数据

2016-11-01 13:44:12

大数据老年医疗大数据技术

2016-12-02 09:13:01

2017-07-17 11:12:07

大数据医疗戴尔

2016-11-08 09:24:34

2017-01-07 11:45:43

医疗健康大数据虚拟化

2012-08-13 10:52:37

数据主权云计算法式云计算

2021-09-07 18:23:37

数据清理对策

2018-12-11 13:46:54

2015-10-09 10:19:48

大数据医疗健康

2015-05-11 15:42:32

阿里云大数据

2009-08-05 15:38:59

谷歌云计算问题

2009-02-12 09:35:00

2009-03-19 09:51:00

2020-09-14 09:39:22

信号

2016-11-15 09:50:47

大数据医疗盈利模式

2017-07-03 15:18:10

戴尔生态医疗

2021-09-01 13:49:34

大数据医疗保健数据分析

2017-07-12 10:58:31

医疗大数据电子化服务

2016-10-19 21:14:01

王建民工业大数据
点赞
收藏

51CTO技术栈公众号