抗社交媒体传输图像取证

业务背景

数字经济环境下,数字图像的安全性已引起社会各界高度关注,包括各种公开学术会议(IH&MMSec,WIFS,ICIP)以及取证比赛(MFC,DeepFake,IEEE IFS-TC)。以阿里经济体为例,涉及到数字图像安全性问题的场景包括但不限于:商家平台的商品展示、数字商品、资质审核、身份认证等。目前,学术界和工业界对于无严重后处理的篡改图片检测已取得较好的效果,部分算法甚至于可以做到8*8像素级别检测精度。但随着钉钉、微信、QQ、微博等通讯应用的广泛应用(基本覆盖全国10亿网民),越来越多的客户通过这些社交媒体进行图片传输和交流。经过篡改合成的图像内容通过通讯应用会被用于散播谣言、编造虚假新闻、非法获取经济利益,更有甚者,还可能会被用来恶意地充当投诉/申诉证物或者法庭证据,这些安全隐患无疑会对个人、阿里经济体和社会造成非常严重和恶劣的负面影响。同时阿里经济体内的通讯平台例如钉钉、淘宝、闲鱼等也有可能因这些伪造图片受到舆论压力。因此无论是阿里经济体内部还是整个社会层面对抗社交媒体传输图像取证技术都有迫切的需求。

目前,阿里经济体内外部都充斥着大量的造假图像,并且这些假冒伪造合成的图像内容极有可能是通过社交媒体传输的,正在对阿里经济体产生巨大的冲击。媒体内容安全团队已经掌握到的阿里经济体正在面临社交媒体传输的图像内容篡改造假的场景有

材料审核:阿里经济体内有大量业务需要审核客户提供的材料,例如一张通过审核的假资质图像,代表着没有资质的商家能在淘宝或天猫上销售商品,这将会给拥有真实资质的商家带来极大的资金损失,并且给商家和消费者带来不好的体验。部分商家手头没有原件,可能会通过黑产伪造原件图片,并通过钉钉或微信传输造假图片给商家。而虚假资质的鉴定,不仅需要判断资质图像为假,还需要给出哪里被篡改,这样才能给出强有力的证据,使上传虚假资质者难以狡辩,从而使平台的审核结果更有说服力。目前存在该需求的BU包括:阿里妈妈、阿里游戏、天猫、考拉、AliExpress等。

合规监管:网信办、文化部及广电总局联合发布《网络音视频信息服务管理规定》以及文化部《互联网文化管理暂行规定》:指出自2020年1月1日起,要求网络音视频提供商建立健全辟谣机制,互联网文化单位应当建立自审制度,发现服务使用者虚假图像生成技术制作、发布、传播谣言的,应当及时采取相应的辟谣措施,阿里经济体内部有大量BU是有提供多媒体服务展示平台,特别的,例如钉钉、淘宝、支付宝等具备社交属性的平台上流转着大量图像数据。人工审核的成本高而且效率非常低,无法满足多个业务部门海量图像内容认证的要求。

媒体传输对抗(掩盖痕迹):不同于现有的图像取证邻域,篡改后的图片经过上述通讯平台传播,各个平台为了节约带宽以及提高客户体验通常使用各自的压缩算法减小传输图片的大小,而这一过程会消除可利用的篡改痕迹。黑灰产熟悉到这一点后,极有可能采用媒体传输,掩盖篡改痕迹,伪装成传输后的真实图像。

拟解决问题

根据与10+BU的业务方沟通交流,他们都表明对图像篡改检测技术有迫切需求,但他们业务场景中遇到的伪造图像通常经过社交媒体传输(例如钉钉、微信等,通常伴有较强的压缩和缩放操作),已有的检测技术在此类图像上存在性能瓶颈,尤其是不同的社交媒体的后处理的手段是多种多样纷繁复杂的,对我们是非常大的一个技术挑战。这些难点和痛点在高校的顶级取证团队有一定的技术积累,我们与之合作能达成互补,可以解决几个前沿技术探索和分支的难点攻关,着重解决篡改图像压缩和缩放后的鲁棒性,从而加速图像取证技术对各业务方形成强有力支撑。

针对上述难点和痛点,我们打算跟国内TOP取证团队进行合作,具体拟合作解决的技术问题如下:

1. 抗媒体传输的图像鲁棒篡改定位检测:篡改图像的篡改定位(包括但不限于,拼接篡改定位,copy-move篡改定位,inpainting篡改定位),以及这些篡改的图像经过主流媒体压缩信道传输(钉钉、微信、微博等)的篡改定位等技术挑战,研究抗媒体传输的鲁棒检测定位技术将是此合作需求的首要目标;

期望交付物

成果形式:算法代码及演示2+份,测试报告2+份,申请专利2+项,发表CCF-A和CCF-B论文各1篇以上;

性能指标:

1、图像篡改定位:由于黑灰产造假手段和方式很难明确定义,这里采用学术上常用的F1 score作为篡改定位评价指标。假定单张图造假的区域比例为10%(图像像素或JPEG块),虚警往往会导致强烈反弹,导致客户体验差,因此虚警率要求低于5%,召回率要求高于50%,采用学术上通用的F1 Score作为评价指标,指标上要求F1大于5128;(现有state-of-the-art 篡改检测方法ManTraNet 对于媒体传输后的图片F1约为0.19,实际效果见附录)

图3 (a)篡改图片,篡改区域为印章(b)无后处理检测效果(c)媒体传输后检测效果

2、提供实验数据集包含5000以上带标注的类业务篡改图像以及数据集benchmark说明。

Scan QR code
关注Ali TechnologyWechat Account