技术进展

研究发现微调LLM会激活版权书籍召回

Heooo 05月01日22时01分 10 阅读

「一项针对大语言模型的研究显示，对其微调时会触发模型回忆起受版权保护书籍内容，相关代码已开源。」

近日有研究揭示了大语言模型（LLM）对齐过程中的“打地鼠”现象——对模型进行微调时，会意外激活其对受版权保护书籍内容的召回能力。相关研究代码已托管至GitHub，链接为：https://github.com/cauchy221/Alignment-Whack-a-Mole-Code。

# 大语言模型 # 模型微调 # AI对齐研究

来源：Heooo AI工具导航