
四、AI疾病预测
疾病预测分为个人疾病筛查和公共卫生防控。在个人疾病筛查方面,需要提升对慢性病的管理效能,对慢性病相关的危险因素进行筛查,传统的慢性病人群筛查主要依据历史统计结果,其筛查因素范围及力度有限。在公共卫生防控方面,需要实时全面地收集大数据,使用适应的数学模型对疾病发展传播进行精准预测,指导政府防疫机构开展相关防治工作。传统的人工筛查能力和速度都非常有限。
(一)AI疾病预测关键技术
(1)医疗大数据技术:
近年来,医疗大数据的发展十分迅猛。通过医疗大数据,医院可对每个患者的个人信息、病情发展、用药情况、治疗方案以及各类检验、影像数据,进行实时的更新。对大数据的有效整理、归纳、分析,运用大数据技术对包括病历数据、医学影像数据、各类检验结果、诊疗费用等在内的各种数据进行整理、分析,对医务人员、广大患者、科研人员及政府决策者提供宏观层面的信息,从而对医疗政策的制定提供客观的参考。利用大数据技术,疾病预防控制中心对传染病的暴发区域、暴发规模、风险等级作出全面的研判,为资源调动、行动制定提供指导。对于患者而言,大数据技术整合个人病历数据,提供完整的个人健康档案,使医生充分了解患者的个人信息从而做出更科学的诊断。
大数据技术可以提供多元化的新型就诊方式。通过云计算和大数据的结合打通各个医院的网络预约平台,患者可以同步实现网络预约、异地就诊、医疗保险即时结算;打破医疗机构之间同级检查结果互认的壁垒,有效提高医疗资源的利用效率,大大减轻患者负担。大数据技术在医疗领域将不断发掘出新的业务模式和服务模式。
常用的医疗大数据的处理分析工具有Hadoop分布式文件系统(HDFS)、HBase和Zookeeper等。大数据处理的主要流程为数据的采集、分类、归档和整合分析。
1)数据采集:
医疗大数据的采集首先需要确认个体的身份,通常通过人体的指纹、人脸及虹膜等生理特性鉴定个人身份。数据采集方式可以很灵活,例如:①患者在医院就诊时,通过医院的感应识别系统记录患者的特征,与其身份证、社保卡信息连接形成身份确认,方便病历归档和就诊记录的追踪;②患者在社区就诊,通过医院的医联体或社区服务终端进行远程身份登记,跨区进行实时就诊情况的记录和传送,保证数据的有效性、准确性;③患者在家中或是与签约的家庭医生就诊过程中,通过移动互联网、便携式医疗仪器及可穿戴式医疗设备进行实时采集生理数据,由网络传送到医疗机构的服务器中。
2)数据分类:
健康医疗大数据在进行数据挖掘时,采集得到的数据主要是医院信息系统、检验信息系统、影像存储与传输系统、放射信息系统等系统数据和基于电子病历的处方管理、居民健康保健管理、妇幼保健信息、干部健康管理、公共卫生传染病预警、慢性病预防治疗、远程自助健康服务、肿瘤个性化诊疗服务、人体基因数据及医学科研实验数据等。这些系统产生的数据结构各不相同,无法直接进行分析处理。需要将这些数据库中索引表里的关键字段进行关联,采用数据异构同化处理工具二次链接,保证数据的可用性和完整性。不同类别的数据形成许多具有共同属性的集合,分为文字、数据包、图像、文档及数据表等。
3)数据归档:
采集来的原始数据种类、结构各不相同,需要分类后储存入数据储存单元。将原始数据进行数据聚类分析、主成分分析、元素因子分析、关联分析、数据定义、数据归类和数据聚合分析等过程处理,然后开始数据属性标签及数据项分解操作,大数据分析工具对数据完成标准化归档,主要流程分别为数据一级归档、数据标签分析、数据二级归档、数据项元素分解、数据项设计。
4)数据整合分析:
大数据的处理方式与传统数据有着很大的区别。由于数据量与储存格式的关系,医疗大数据的处理,依赖高性能的计算机和分析处理工具HDFS才能进行高效的大规模并行计算。
(2)5G通信以及物联网技术:
物联网技术在医疗卫生领域的应用,最早出现在医院各种物资材料的物流供应管理上。近年来,由于人工智能、移动互联网、可穿戴设备及便携式医疗仪器的广泛使用,现代医学基础科学研究快速发展,诞生了很多人工智能和跨地区、跨应用平台的新应用,如针对社区患者的慢性病健康保健管理平台、分级诊疗的三级联通系统、家庭医生信息管理系统、人体医疗健康大数据、公共卫生疾病预防、医疗保健、药品保障信息系统、远程自助健康服务及个性化诊疗服务等。
随着5G技术的日渐成熟,使得智能可穿戴实时健康监测设备的大规模应用成为可能。可穿戴医疗设备与传统的便携式医疗设备相比重要特点是高度移动性,传统设备只能在接电固定的状态下才能正常运行,而可穿戴设备不仅在关机状态下可以移动,在运转状态下也可以随佩戴者任意移动。技术的核心是可穿戴设备的无线化,即利用红外线、蓝牙、WIFI、GPS(全球定位系统)等高科技手段使设备可随患者任意移动,检测、记录、传输患者各项生理数据、生命体征和即时化验结果,供医师参考,实现便携、可穿戴的特点。未来10年5G网络技术将在4G网络技术的基础上将移动网络数据流量密度提高1 000倍以上,极大改善传输效能,克服以往传输延迟、联通滞后的弊端,实现高速智能化以及动态监测。
(二)AI疾病预测应用现状
(1)公共卫生防控方面:
2013年,Chen等利用推特数据建立了流感暴发的早期预警模型。他们采用分类算法对推特数据进行自动过滤,留取与流感相关的记录,再通过无监督算法结合流感的空间时间信息进行预测,发现预测结果与真实数据的相关系数达到0 97。2017年,重庆市疾病预防控制中心组织联合研发课题组,利用“互联网+医疗健康”大数据前沿技术,首次提出“宏观+微观”的深度智能疾病预测方法,实现了提前一周预测某一地区流感和手足口病的患病率。2018年,中国澳门与某科技公司合作开展“疾病趋势”预测,AI技术通过疾病趋势以及过往流感疫情综合分析,可以预测未来两周城市流感等疾病的暴发强度和蔓延风险,从而提前帮助市民和卫生机构做好预防措施。
(2)个人疾病筛查方面:
2014年,美国匹兹堡大学的Sun等,设计了一款可穿戴个人健康监控设备eButton。它可以像胸针一样戴在胸前,其内部包含一个微型摄像头、加速度计、GPS及其他传感器,不但每天追踪食物摄取情况、运动情况,还追踪生活方式等,比如花了多长时间看电视玩电脑,花了多长时间在户外,从什么地方买了什么食品,去了哪个餐厅,点了什么食物,还能分析花在用餐上的时间有多久,哪些食物和饮料被消化了,和家人及朋友在用餐过程中是如何交流的,这些因素都有可能影响到能量摄取与消耗。2017年2月,北卡罗来纳大学的精神病学家Heather Hazlett带领团队利用深度学习算法,开发了可预测12个月大的儿童在2岁时是否会患上自闭症的人工智能系统,采用的人工智能算法通过不断“学习”脑部数据自动判断婴儿的大脑生长速度是否异常,以此来获得自闭症的早期线索,这种预测方法具有81%的准确率与88%的灵敏度。2018年2月,美国食品药品监督管理局(FDA)批准了一项人工智能成果——用于检测儿童自闭症的人工智能平台,这也是FDA监管许可的首个用于自闭症筛查的Ⅱ类诊断医疗设备。通过分析家长提供的儿童自然行为信息和视频,该应用程序使用机器学习算法来评估该儿童是否正在以正确的速度发展,并评估他们的行为健康状况。该应用已经通过临床验证,可以在早期识别儿童的自闭症,其准确率超过80%。
(丁晨良 张鸿轩 章依依 李小倩 董 浩 费哲遥 严国锋)