Machine Unlearning

Lucas Bourtoule 等人于 2019年在 arXiv 上发表，并最终在 2021年的 IEEE Symposium on Security and Privacy (S&P) 上正式发表的论文《Machine Unlearning》。

比较早期的模型，方法比较朴素。

训练阶段 (Training Phase)：

数据分片 (Sharding)：将完整的原始训练数据集 D 分割成 S 个互不相交的数据子集，称为“分片” (Shards)。
数据切片 (Slicing)：将每个分片 Dk 内部的数据再进一步分割成 R 个互不相-交的“切片” (Slices)。
隔离与增量训练 (Isolated & Incremental Training)：为每一个分片 Dk 单独训练一个模型 Mk，过程如下：
- 步骤 1: 使用随机初始化的参数，仅在第一个切片 Dk,1 上训练模型。训练完成后，保存当前模型的参数状态。
- 步骤 2: 加载上一步保存的模型参数，然后在 Dk,1 ∪ Dk,2 的数据上继续训练。完成后保存新的模型状态。
- 重复此过程: 直到模型在所有 R 个切片上都训练完毕。每次加入一个新的切片进行训练后，都要保存一次模型状态。
聚合 (Aggregation)：在需要进行预测时，将输入数据分别送入所有 S 个独立训练好的模型。然后通过“多数投票”等策略将它们的输出结果聚合起来，得到最终的预测结果。

反学习阶段 (Unlearning Phase)：

当收到一个删除数据点 du 的请求时：

优化策略

作者提出了如何更智能地进行分片以最小化未来的unlearning成本，称为分布感知的智能分片 (Distribution-Aware Sharding)

我们定义：

流程:

排序: 根据每个数据点 du 被请求删除的概率 p(u)，对整个数据集进行升序排序（概率最低的在前）。
初始化: 创建第一个空的分片 D0。
循环分配: 遍历排序后的数据集：
- 从数据集中取出当前删除概率最低的数据点 du。
- 将 du 添加到当前的分片 Di 中。
检查阈值: 每次添加后，计算当前分片 Di 的“预期被删除次数” E(χi)。
- 如果 E(χi) ≥ C:
  - 将刚刚添加的数据点 du 从当前分片 Di 中移出。
  - 创建一个新的空分片 Di+1。
  - 将数据点 du 添加到这个新的分片 Di+1 中。
结束: 重复步骤3和4，直到所有数据点都被分配到某个分片中。

比较早期的模型，方法比较朴素。

模型参数量大，重新训练就很耗时。

在当时，作者认为遗忘有以下难度。

#深度学习

Machine Unlearning

https://lijianxiong.space/2025/20250926/

作者

LJX

发布于

2025年9月26日

许可协议