技术进展

微调LLMs激活对版权书籍内容的回忆

Heooo 05月01日20时01分 1 阅读

「研究发现对大语言模型微调时,会激活其对受版权保护书籍的回忆,呈现“对齐打地鼠”现象」

近日一项研究指出,在对大语言模型(LLMs)进行对齐微调时,出现了“对齐打地鼠”的现象:微调过程会激活模型对受版权保护书籍内容的回忆。相关研究代码已开源至GitHub,链接为https://github.com/cauchy221/Alignment-Whack-a-Mole-Code,供开发者和研究者参考探讨。
# 大语言模型 # 模型微调 # AI对齐研究

来源:Heooo AI工具导航

📰

资讯不存在

该资讯可能已被删除或不存在

返回资讯列表