人眼揭开图像骗过人工智能之谜

研究 02/10/2024

三个要点
✔️ 人类实验对于评估无限制修改图像的攻击至关重要，但目前缺乏此类研究。
✔️ 我们提出了一个新的人体评估实验框架 SCOOTER。本文介绍了系统的实验程序和计算所需参与人数的方法。
✔️ 人工智能技术的快速发展增加了自然图像攻击的威胁。本研究的框架将用于进一步开展研究。

How Real Is Real? A Human Evaluation Framework for Unrestricted Adversarial Examples
written by Dren Fazlija, Arkadij Orlov, Johanna Schrader, Monty-Maximilian Zühlke, Michael Rohs, Daniel Kudenko
(Submitted on 19 Apr 2024)
Comments: 3 pages, 3 figures, AAAI 2024 Spring Symposium on User-Aligned Assessment of Adaptive AI Systems
Subjects: Artificial Intelligence (cs.AI)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

概述

随着机器学习模型渗透到我们的生活中，对抗性实例威胁着人工智能系统的安全性。在图像领域，那些被巧妙修改成人类无法察觉的图像可以极大地欺骗最先进的机器学习模型。这些样本包含的微小变化通常对人类来说是明显的差异，但对机器学习模型来说却毫无意义。使用这类样本进行攻击会导致机器学习模型做出错误的预测或表现出错误的行为。

传统上，由于对图像的修改有限，这类攻击相对容易抵御。然而，最近的研究表明，在保持自然外观和感觉的前提下，可以生成不受限制修改的敌对样本。攻击者可以利用这种自由度发起超出传统防御假设范围的攻击。

这种 "不受限制的敌意样本 "真的不会被人类察觉吗？严格的人类评估实验对评估其质量至关重要。在本文中，我们提出了专门针对基于图像的攻击的人类评估框架 SCOOTER，并为研究人员解决这一重要问题提供了途径。

拟议方法（SCOOTER）

本文提出了一个用于人类评估无限制对抗样本的框架 SCOOTER（Systemising Confusion Over Observations To Evaluate Realness）。(1).

1. 模块化设计的网络应用程序：基于 Flask 的网络应用程序，可轻松集成图像。 2. 研究协议：指导用户详细完成在线研究的每个步骤。 3.在线排行榜：可针对不同目标模型比较最先进的攻击技术。
4. 图像数据库：收集生成的敌对样本，供进一步分析。

拟议方法的核心是一项 13 分钟的在线研究。学习流程如下

1. 色觉测试（图 1）：为排除色盲参与者，确定了五幅石原型图像。

2. 理解检查（图 2）：展示六对图像，只有能够正确判断至少五对正确图像的参与者才能进入主要研究。

3. 主要研究（图 3）：使用滑块输入对 106 幅图像的修正程度进行评分，连续值从 -100（无修正）到 +100（修正）。其中 50 幅为未修正图像，50 幅为敌对样本，6 幅为警戒检查图像。

它还提出了一种方法，用于根据经验估算有统计意义的研究需要的参与者人数；它计划为三种攻击方法中的每种方法收集 690 名参与者的数据，以确定足够的样本量。

总之，SCOOTER 是一个支持在不受限制的敌对样本上进行人体评估实验的综合框架。建议的研究协议和估算参与人数的方法将在提高该领域的研究质量方面发挥重要作用。

试验计划

本文的重点是为人类评估不受限制的敌对样本提出一个框架 SCOOTER，目前还没有在实践中使用 SCOOTER 进行实验。

在对所提方法的描述中，介绍了一种实验设计，用于根据经验估算所需的参与者人数。具体来说，计划使用经过对抗训练的 ResNet-50 模型（Salman 等人，2020 年）为三种攻击方法中的每一种收集 690 名参与者的数据，以确定足够的样本量。这种实验设计将在确保使用 SCOOTER 进行研究的质量方面发挥重要作用。

不过，该计划目前仅处于建议阶段，尚未进行实际实验。本文的重要意义在于，它为解决人类对无限制对抗样本进行评估这一重要问题提供了一个框架。我们希望使用 SCOOTER 开展进一步的实证实验，并报告实验结果。