超越文本,GPT-4在虹膜生物识别的创新应用
添加书签专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
虹膜识别作为识别人类身份的特殊验证方法,已经在门禁监控、在线支付、飞机场等广泛应用。但在应用的过程中也面临一些挑战。例如,佩戴眼镜、隐形眼镜或是虹膜受到部分遮挡等情况可能会干扰虹膜图像的采集,进而影响识别的准确性。
美国密歇根州立大学的研究人员对GPT-4的虹膜识别能力进行了一系列评估,使用了零样本学习方法,在各种挑战条件下对模型进行综合测试,包括不同的数据集、呈现攻击、眼镜遮挡等。
结果显示,GPT-4对虹膜的识别能力非常优秀,同时在软生物识别方面也很强,例如,通过观察虹膜特征,能判断出使用睫毛膏人的性别等相关识别信息。
研究人员通过利用Python与GPT-4的API设计了实验参数和提示。这种方法允许以一致、可复制的方式与模型进行交互,同时能够根据不同实验的需求轻松调整参数。
在初步实验中,研究人员从 ND – Iris – 0405 和 IIT – Delhi – Iris 数据集中选取了两个明显不同的虹膜图像,让 GPT – 4 判断它们是否属于同一个人。
起初,系统因伦理考虑而拒绝进行生物识别分析,但通过调整提示,明确查询的非生物识别性质并寻求GPT 的 意见,GPT – 4 成功参与了任务,并提供了关于虹膜特征和组件的详细解释,认为图像可能代表不同的身份。
随后增加了实验的难度,研究人员从 CASIA – Iris – Intervalv3数据集中精心挑选了更为相似的图像,这些图像在虹膜的纹理、颜色和形态等特征上的差异极其细微,几乎达到了肉眼难以分辨的程度。
同时还特意引入了高斯噪声,这是一种在图像处理中常见的随机噪声,它会使图像的像素值发生随机的波动,从而严重干扰虹膜图像的清晰度和准确性。
GPT – 4通过对虹膜特征的精细建模和对噪声的有效过滤,依然能够分析虹膜纹理的细微变化、颜色的微妙差异以及形态的微小改动,精准判断出这些图像是否属于同一个虹膜。
在相似性测试实验中,通过让GPT – 4 对虹膜图像进行概率评估并给出相似性评分(0 – 100)和 “是” 或 “否” 的判断,研究发现尽管眼镜可能会遮挡虹膜,但 GPT – 4 能够准确预测匹配,展示了其先进的视觉处理技能和对实际应用中变化和障碍的应对能力。
在 PA 检测实验中,GPT – 4 能够检测到通过死后虹膜图像和带纹理的隐形眼镜试图绕过生物识别系统的行为。例如,在使用 Warsaw – vl 死后虹膜数据集的实验中,GPT – 4 怀疑其中一个图像是人工伪造的,因为其清晰度非常不自然。
在跨模态匹配实验中,最初 GPT – 4 在匹配虹膜图像与面部照片时遇到点困难,但通过将任务重新描述为谜题,并使用眼睛代替虹膜以及引入明显不同的眼睛颜色时,模型的匹配准确性得到了显著提高。当图像数量增加到 12 和 20 时,GPT – 4 能够始终正确识别匹配,证实了其在该任务中的稳健性。
此外,研究人员还对 谷歌的Gemini 进行了实验。与GPT – 4 能够同时处理多个图像不同,Gemini 一次只能处理一个图像,这需要使用外部工具将图像组合成一个文件进行分析,增加了实验的复杂性并降低了效率。
论文地址:https://arxiv.org/abs/2408.04868
尽管 Gemini 在某些情况下能够提供准确的响应,但它在保持查询间的上下文连续性方面存在显著局限性,与 ChatGPT – 4 相比,在图像理解和生物识别验证任务中的 Sophistication和 Userfriendliness 方面还有差距。
本文素材来源研究论文,如有侵权请联系删除
END
本篇文章来源于微信公众号: AIGC开放社区