开源项目

Intel开源大语言模型先进量化算法AutoRound

Heooo 05月02日02时13分 1 阅读

「Intel开源面向大语言模型的AutoRound先进量化算法,兼顾精度与性能,助力模型轻量化部署。」

近日,Intel在GitHub平台开源了一款专为大语言模型(LLMs)打造的先进量化算法AutoRound,聚焦解决大模型部署阶段面临的算力、存储资源瓶颈问题。传统量化方法往往会在压缩模型体积的同时导致精度大幅下降,而AutoRound通过优化量化校准流程,能够在将模型参数量化至4-bit等低精度格式时,最大程度保留模型的推理精度,实现精度与性能的高效平衡。 作为开源项目,AutoRound兼容当前主流的大语言模型架构,开发者可通过其GitHub仓库(https://github.com/intel/auto-round)获取完整代码,轻松集成到自身的模型开发或部署流程中,也可基于该算法进行定制化二次开发。该算法的推出,为大语言模型的轻量化落地提供了新的技术路径,能够有效降低部署成本,适用于边缘计算设备、云端推理服务等多种场景,为AI开发者生态提供了更高效的工具选择。
# 大语言模型 # 量化算法 # 开源AI项目

来源:Heooo AI工具导航

📰

资讯不存在

该资讯可能已被删除或不存在

返回资讯列表