面向防篡改及信息传输应用的医学影像水印技术研究

业务背景

医疗健康产业的高速发展是面向未来十年、二十年高度确定性发展领域, 未来医疗健康随着数字化进程的快速发展,设备智能化、海量数据产生和使用,带来数据安全的严峻挑战。随着医疗健康产业的发展,其中最为重要的医疗影像数据预防篡改造假及隐私保护也将变得越来越重要。

随着互联网医疗、智能医学影像服务等新应用的发展,医学影像走出传统医院范畴在互联网及新兴起的第三方医疗服务行业中传输和流转并且越来越普遍。近年来互联网医疗出现较快增长,据统计2018 年至 2019 年,我国互联网医疗用户从 2800 万人增长到 4500 万人,同比增长 59.9%。另外互联网医疗在突发公共卫生事件中也体现了价值和优势,如近期新冠状病毒疫情爆发,阿里健康在线义诊短短几天内访问用户数达到280万。智能医学影像服务方面,据上交大2019中国人工智能医疗白皮书披露AI医学影像已成中国人工智能医疗领域最成熟的研究方向。智能医学影像服务的社会价值和优势非常明显,比如在新冠期间达摩院医疗AI已对3万个临床疑似新冠肺炎病例CT影像进行了快速(20秒内完成),准确(96%准确率)的诊断,为治疗争取了时间。2019年互联网医疗已纳入医保范围,且随着中国医疗卫生体制改革的进一步深化,互联网医疗和智能医学影像服务等新医疗业务将会得以快速发展。

医学影像含有敏感信息在公共网络中传输时会有安全风险。例如仅2019年美国、澳大利亚等发达国家就报告了多起医疗中心数据泄露事故。其中一家第三方独立医学实验室公司Quest Diagnostic泄露了85GB用户信息,对1200万人造成影响。AI医学影像服务中隐私泄露风险也日益突显,模型预测服务存在着泄露训练数据隐私的风险。攻击者可以采用模型逆向攻击技术,从模型预测结果中提取和训练数据有关的信息,最终获得具有较高预测置信度的被攻击图片。医学影像作为AI诊疗算法的训练数据成为了一种特殊的数据商品,医学影像的交易和流转过程中不仅需要版权保护还需要履行数据脱敏和隐私保护等义务。防止医学影像中患者隐私泄露是监管部门对相关行业提出的合规性要求,医学影像水印技术能够保证医学图像真实性、完整性,同时实现有效的隐私保护,为医学影像新业务提供安全可信的应用环境和必要技术支持,此外隐私保护也是个人人身安全保护的必要手段之一。

医学影像与普通的自然图像相比差异较大,难以直接采用普通图像水印技术:首先,不同人相同检测部位的医学图像内容非常相似,很难用自然图像特征方法得到有效的目标检测特征;其次,医学图像中的纹理区域常常用于诊断,不能在纹理区嵌入不可逆水印,以免引入噪声;最后,医学图像为灰度图像,并且像素深度高于普通图像,因此图像灰阶动态范围大。同时医学图像中灰阶通常反映射线穿过人体不同组织的能力,或人体不同物质在磁场作用下被激发后所释放的能量,因此医学图像中大部分区域为黑色(低信号)或白色(高信号)。医学影像的这些特点对水印不可见性和容量都提出了挑战,医学影像水印研究存在一些待解决的关键问题:一方面医学影像对图像处理十分敏感,ROI中像素微小的变化都会影响诊断,甚至造成误诊,危及患者生命。因此嵌入水印对医学影像的影响应尽可能的小,可逆水印技术是较好的解决方案。DICOM图像(医学影像格式)中纹理区为应受保护、无损的、受攻击后可逆的ROI区域,ROI区域可逆性能与水印鲁棒性是矛盾的,水印鲁棒性高则ROI区域逆恢复性能会变差。另一方面,将DICOM图像中包含的患者身份、诊断及设备参数等隐私信息,以不可见的加密水印方式嵌入到DICOM图像中,需要非常高的信息容量。为了不影响诊断,ROI区域可嵌入水印容量有限,因此应将隐私信息嵌入RONI区域。但是,医学影像中ROI区域占据了影像的大部分内容,而且RONI区域多为低信号黑色区域,造成了RONI可嵌时频区域受限问题。因此需解决在水印容量、不可见性、鲁棒性联合优化的问题。

医学影像水印根据不同的需求有授权、数据安全、信息隐藏等不同的研究方向,本案主要研究数据防篡改安全性和信息隐藏方面,相似研究工作[1]可以在256字节高嵌入容量及PSNR 36db下,获得较高鲁棒性及安全性。

([1] S. A. Parah, J. A. Sheikh, F. Ahad, N. A. Loan, and G. M. Bhat, "Information hiding in medical images: a robust medical image watermarking system for E-healthcare," Multimedia Tools and Applications, pp.1-35, 2015.)

拟解决问题

考虑到图像失真会导致误诊,甚至危及患者生命,因此本项目提出了极低失真水印研究,具体采用可逆水印技术。可逆水印是在医学图像中插入水印,传输含水印图像,并在接收端将水印从图像中完全去除水印的过程。去除水印后,原始图像获得恢复,不影像图像的诊疗。目前一些典型的可逆水印技包括:可逆对比映射(RCM)、可逆量化调制、原始图像LSB信息恢复法及可逆的直方图调制法等。另外医学影响也有复合式高容量隐蔽信息传输的需求,DICOM医学影像文件头中虽然可以包含患者姓名、年龄、性别、影像采集时间等个人隐私信息,但在传输流转之前需要符合规范进行脱敏处理。水印技术可以承载这些隐私信息,将患者信息或者电子病历(Electronic Patient Record,EPR)加密后形成不可见水印嵌入医学影像中,是识别图像所属人及保护所属人隐私的有效方法。为了预防恶意攻击和盗用,证明影像来源的真实性,DICOM医疗图像中应嵌入医院和负责真实性验证的可信任第三方信息,如医院和来源ID。为了获得更好的鲁棒性,一般情况下真实性验证信息应嵌入医学图像的RONI区域。所有这些信息尤其是真实性验证和患者隐私水印数据如身份、诊断及设备参数等数据需要非常高的信息容量(图1)。综上,本课题拟进行如下2个方向的研究:

1)研究医学影像特征,图像特征的合理利用对水印的不可感知性、鲁棒性和容量具有提升作用,医学影像也是如此,研究水印可利用的医学影像特征,增强水印各核心指标性能;

2)研究复合式高容量隐蔽信息传输技术,将真实性数据、完整性数据、患者病历诊断等信息嵌入医学图像中,完成版权保护、篡改检测定位、隐蔽信息传输多个功能的需求

 

期望交付物

1、基于医学影像特征的医学水印算法及演示原型;

2、复合式高容量隐蔽信息传输水印技术研究:水印容量、不可见性、鲁棒性间综合优化的复合式高容量隐蔽信息传输技术算法、代码及测试报告;

3、技术指标:

      水印影像PSNR不小于42db;

       高容量水印信息容量不小于256字节;

       常规应用情况下,水印信息提取率不小于99%;

       篡改检测准确率不小于98%;

        篡改检测最小面积不小于100x100像素;

 4、预期发表CCF-B以上论文1~2篇,申请专利1~2项。

Scan QR code
关注Ali TechnologyWechat Account