这些专门为研究目的而创建的数据主要用于测试系统,该系统在授予访问权限之前可以验证一个人的身份-无论这个人是要进入一个房间还是入境一个国家。目前很少有可用资源来帮助开发人员评估构成这些系统核心的软件算法的性能,而NIST的数据将填补这一空白。
三个数据库包含不同时间内收集的不同类型数据,其中两个包含美国智能先进研究计划(IAPRA)资助、NIST设计并实施的“指纹挑战赛”中收集的信息。
其中SD 301是新资源,是NIST有史以来发布的第一个“多模型”数据组。多模型的意思是个人的不同生物特征标记(即面部,指纹和虹膜扫描)都已连在一起,因此可将它们一起用于使用识别方法集成的系统识别,例如面部的照片和指纹。由于多模型系统很难被假象欺骗,因此能够得到更安全和准确的身份识别。
SD 302数据组包含来自八种市场销售设备和原型机上收集的数百人的指纹数据。从“挑战赛“中收集的数据组包括使用非接触式设备采集的指纹,还包含处理日常物品时会留下潜在的指纹数据。两组中代表的所有人都已正式同意采用其生物识别数据,用于进一步研究。
第三个数据组SD 300,是从900张旧墨水卡片中采集的指纹,这些卡片均来自过世的人。该数据的用途是帮助制造商评估其现代生产系统可产生与纸质墨水记录协同操作结果的能力,目前这对于刑事司法系统而言十分重要。
总体而言,三个SD数据组包含档案级无损压缩保存的数据,这是重大的进步,因为过去的研究数据组通常未能保持原始图像的真实度。
图:指纹图像包含在NIST可供研究的三个新生物识别数据组中