微信AI团队论文首获ICASSP最佳工业论文奖
「微信AI团队凭借视障辅助视觉语言模型WalkVLM-LR,在ICASSP 2026上获得最佳工业论文奖,系该奖项设立以来首次颁给中国企业团队。」
在5月于西班牙巴塞罗那举行的IEEE国际声学、语音与信号处理会议(ICASSP 2026)上,微信AI团队模式识别中心凭借论文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》斩获最佳工业论文奖。这是该奖项自2016年设立以来,首次由中国企业团队获得,此前获奖者多为Meta、微软、Spotify等国际科技巨头。
获奖论文的核心成果是WalkVLM-LR,一个专为视障人士行走辅助设计的视觉语言模型。该模型在技术创新上聚焦于“减少冗余”,具体表现为两个方面:一是减少“输出冗余”,即避免模型生成过多不必要的描述性语言;二是减少“时间冗余”,即避免模型对每一帧画面都进行无差别提醒。通过这种双重冗余削减策略,WalkVLM-LR能够精准判断“何时该提醒”,仅在需要时向用户发出关键指引,从而大幅提升实用性和用户体验。
针对业界关心的模型延迟问题,微信AI团队成员在社交平台回应称,目前整体延迟已控制在百毫秒量级。这一成果主要得益于环境感知判断器与视觉语言模型共享视觉编码器的架构设计,有效减少了等待时间。团队同时表示,虽然实时性已具备一定的可用性,但距离真实落地应用仍有优化空间,未来将继续打磨模型性能。
ICASSP作为全球规模最大、最具综合性的信号处理技术会议,其最佳工业论文奖历来竞争激烈。微信AI团队的此次获奖,不仅标志着中国企业在信号处理与AI交叉领域的科研实力获得国际认可,也展示了视觉语言模型在辅助技术中的创新应用潜力。WalkVLM-LR通过减少冗余的设计思路,为视障人士提供了更自然、更高效的行走辅助方案,体现了AI技术服务于社会福祉的积极方向。
来源:Heooo AI工具导航