技术进展

微调LLMs激活对版权书籍内容的回忆

Heooo 05月01日20时01分 10 阅读

「研究发现对大语言模型微调时，会激活其对受版权保护书籍的回忆，呈现“对齐打地鼠”现象」

近日一项研究指出，在对大语言模型（LLMs）进行对齐微调时，出现了“对齐打地鼠”的现象：微调过程会激活模型对受版权保护书籍内容的回忆。相关研究代码已开源至GitHub，链接为https://github.com/cauchy221/Alignment-Whack-a-Mole-Code，供开发者和研究者参考探讨。

# 大语言模型 # 模型微调 # AI对齐研究

来源：Heooo AI工具导航