技术进展
微调LLMs激活对版权书籍内容的回忆
Heooo 05月01日20时01分 1 阅读
「研究发现对大语言模型微调时,会激活其对受版权保护书籍的回忆,呈现“对齐打地鼠”现象」
近日一项研究指出,在对大语言模型(LLMs)进行对齐微调时,出现了“对齐打地鼠”的现象:微调过程会激活模型对受版权保护书籍内容的回忆。相关研究代码已开源至GitHub,链接为https://github.com/cauchy221/Alignment-Whack-a-Mole-Code,供开发者和研究者参考探讨。
# 大语言模型 # 模型微调 # AI对齐研究
来源:Heooo AI工具导航