编者按
通过肉眼在人海中寻找被拐儿童的成功率,历来不高。除了人海战术要耗费巨大人力资源,还要面对随着岁月流逝,走失孩子长相的改变。随着AI技术的成熟,告别传统寻人方式成为可能。通过对海量图片样本数据的训练,AI人脸识别技术的准确率已达到人类可以信任的级别。除了人脸识别,基于地理位置和精准推送等充满科技含量的传播方式,也在智能人海战术中得到了广泛应用,并在实际运用中取得了成果。
当然,技术的善用还有几道坎:AI寻人需要更多的采集面和数据量,但走失儿童最集中流向的农村偏远地区,往往缺乏监控,影响寻人定位。而现有相关找寻走失者的数据库、监控视频资源等分散各地,要提高找人效率,还依赖于打通各方现有数据、实现信息共享。隐私和伦理问题也成为制约AI寻人发展的另一道坎。制定相关法律法规,确保技术不被滥用、限制技术的负面影响,是AI寻人安全落地的法制保障。假以时日,再远的路途都有被征服的那一天。AI在寻亲和抓捕犯罪嫌疑人方面的作为,值得期待。
■ 雪颖
近日,一张“梅姨”的彩色照片在网上被疯传。全网都在通缉“梅姨”,她是谁,却是个谜。“梅姨”真实存在,真名不详,涉嫌拐卖九名儿童,九个家庭的幸福也因“梅姨”遭到摧毁。
尚未落网的“梅姨”可能就潜伏在你我周围。然而,要想找到她,靠人力如同大海捞针,光辨认就有难度。“说实话,这个长相真的没有太多辨识度,感觉就是普通大妈”,网友们留言道。AI,成了寻找拐卖儿童和犯罪嫌疑人的新希望。AI研究员王宽表示,运用跨年龄人脸识别算法,通过走失儿童小时候的照片,可以认出长大后的孩子。人工智能的技术正在升级,并且运用到寻人和打拐的具体场景中,让更多孩子找到回家的路。而目前,直接通过素描用人脸识别找到嫌疑人的可能性不大。
AI更好识别“梅姨”?
想要用肉眼把孩子从茫茫人海里捞出来有多难?据此前媒体报道,2015年,警方通过孩子画像带回了300余份疑似照片,组织走失家长进行辨认,确定了176个疑似对象,但最终无一命中。专案组还曾经尝试过用肉眼把十几万张疑似照片和走失儿童一张一张进行比对,但还是没能找出孩子。在传统的寻人方式下,很多走失者的家人付出了沉痛的代价。
公布了“梅姨”新画像的人,叫申军良,他的孩子申聪在2005年在家里被“梅姨”团伙抢走。从失去孩子的那一刻起,近十五年来,他一直没有放弃寻找,他走遍了广州、东莞、珠海、深圳的大街小巷,有人提供线索,说儿子还在增城,他就挨个街道张贴寻人启事。但人海茫茫,“梅姨”的行踪至今不明。申军良担心,无法认出孩子,因此找到画像专家为孩子画素描,他盼望:有了孩子长大后的画像,就不会和儿子擦肩而过了。然而,时隔十五年,孩子长什么样,谁又能知道呢?
AI或许正在突破这一难题。AI研究员王宽表示,AI寻人从技术框架上来说,很好理解,主要分为:前置任务、人脸特征提取、人脸比对和检索三个流程。走失者的照片会被提取人脸特征,录入到底库系统中。同时,通过火车站、机场、商场等地点,进行人脸的动态布控,如果发现相似度较高的路人则系统发出警报,一般还需要通过的人工核验。目前,AI寻人已经取得了成果。
百度和“宝贝回家”展开合作,对两万多条寻亲照片进行对比评测,并成功找回一名丢失了27年的孩子。目前,百度AI寻人支持了数万名走失人员进行实时比对,基于2亿张图片的训练样本数据,百度人脸识别准确率已达到99.7%。2017年,警方也在腾讯优图跨年龄人脸识别系统的帮助下,成功找到“426大案”被拐10个孩子中的7个。优图团队的研究人员对0~18岁的人脸成长变化进行模拟建模,基于DDL(分布式蒸馏学习法则)学习策略的正则化迁移学习策略,通过算法模型机器得以认出长大后的孩子。小玉就是通过人脸识别技术找回来的孩子。1993年,小玉在天津火车站与亲生父母走散,25年后,志愿者通过将小玉提供的照片放进“百度AI寻人”进行人脸对比,成功配对此前寻亲帖中的照片,相似度达到77.82%,经过多次DNA比对,2019年,小玉终于和母亲相认。
除了人脸识别,基于地理位置和精准推送等方式也得到了广泛应用。信息推送以失踪地点为中心,随着失踪时间推移扩大定向推送范围。以“团圆”系统为例,家长报警,警察核实后,立即联系打拐警察,截至2019年6月,“团圆”共发布失踪儿童信息3978条,找回3901名,找回率高达98%。在科技的加持之下,AI寻人直接采用人脸识别、大数据的挖掘和信息推送,寻人正在从传统的1.0时代向2.0迈进。新一代寻人技术和传统寻人方式相比,实现了质的飞跃。
AI寻人还要跨过几道坎
成千上万的走失者家属还在焦急地等待着。据报道,公益网站“宝贝回家”上失踪的40000多个孩子,没有找回来的占绝大多数。
罗兴珍的儿子和女儿在25年前被人贩子双双拐走,她每天守在汽车站旁的鞋摊,期盼着自己的孩子有一天能回来。帮助千千万万个罗兴珍之前,AI寻人还有几道坎要跨过。
首先,AI寻人需要更多的采集面和数据量。在技术人员眼里看来,人脸识别需要大量的机器学习才能更加精准判断,算法也需要有一个学习的过程,再辅之以大量的数据,才能更加精准有效。毕竟,走失儿童照片素材的模糊、缺失,以及走失多年面部特征发生的巨大变化,都会给算法带来一定的挑战。目前,一二线城市布有大量的监控设备,相关社会层面的采集,例如去购票,商场购物信息、上网、酒店登记信息等更容易被监控,而人贩子往往在广大的农村偏远地区,那里的监控缺乏,很难定位到他们。发动更多人加入AI寻人,成为科技寻人的眼线是其中的一个弥补方法。目前为止,仍然有很多人不知道新的寻人方式。多位行业人士号召,应当让给更多人,特别是为农村朋友们普及相关信息,通过流量精准推送的方式,让人人加入通缉人贩子和寻找走失者的阵营。
找寻走失者的数据库、各地监控视频资源、社会化监控视频资源等分散各地。只有打通各方现有数据,让信息共享才能提高找人效率。腾讯安全管理部安全专家汤海鹏表示:“这个系统虽说现在已经成熟了,但如果想在全国推广去用,这个过程会很长,因为要涉及很多要协调的事情,我们一个省的一个案子就协调了好几个月。”
其次,制约AI寻人发展的另一道坎是隐私和伦理问题。民众对于数据隐私越来越敏感。10月28日,浙江理工大学特聘副教授郭兵就对一家杭州的动物园进行起诉,理由是动物园未经用户许可,要把之前的指纹入园认证改为人脸识别认证。此外,校园安防监控项目与脑机接口头环引发的校园监控事件也牵动着公众的神经。人脸识别作为一项技术,其本身并没有什么问题,关键在于如何运用。同样的人脸识别技术,帮助幼儿园和小学建立智慧安防系统,用来寻找丢失的幼童或监护老人,就很少陷入争议。但与此同时,在教育场景内使用AI技术,需要进一步推进法治化进程,建立相关法律法规,做到有法可依。这是确保技术不被滥用、限制技术的负面影响、真正发挥其促进教育教学作用的关键所在。
汤海鹏此前向媒体透露,“这里面有很大的伦理道德难题,我们其实压力非常大……我们只能尽量走得谨慎一些,尽量去避免发生一些负面的影响。”金杜研究院在《人工智能系列之人脸识别信息的内涵与合规难题》的报告中建议:“企业在对相关技术进行部署和应用时,应持续遵守合法、正当与必要的原则,在部署前开展必要的个人信息安全影响评估,以确保生物识别信息的处理严格遵从法律法规和监管要求。”
(文中王宽为化名,余洋洋对本文亦有贡献)