技术进展
研究发现微调LLM会激活版权书籍召回
Heooo 05月01日22时01分 1 阅读
「一项针对大语言模型的研究显示,对其微调时会触发模型回忆起受版权保护书籍内容,相关代码已开源。」
近日有研究揭示了大语言模型(LLM)对齐过程中的“打地鼠”现象——对模型进行微调时,会意外激活其对受版权保护书籍内容的召回能力。相关研究代码已托管至GitHub,链接为:https://github.com/cauchy221/Alignment-Whack-a-Mole-Code。
# 大语言模型 # 模型微调 # AI对齐研究
来源:Heooo AI工具导航