千问PC端上线AI语音输入,开口即用
「千问在PC端推出AI语音输入功能,支持口语去语气词、纠错与结构化整理,用户可在各类应用中通过语音指令直接创作、问答与翻译。」
千问近日在PC端正式上线了AI语音输入能力,这一功能让用户无需切换窗口或手动打字,只需通过快捷键即可在各类桌面应用中直接使用语音进行输入和操作。该功能不仅支持基础的语音转文字,还具备强大的语义理解和文本优化能力,能够将口语化的表达实时转化为结构清晰、逻辑准确的书面文本。
千问语音输入的核心亮点在于其对口语内容的深度处理。例如,当用户口述一段带有口误和冗余词的内容:“王总,会议定在两点……不对三点,地点在老会议室,记得带那份……市场调研报告。”千问能够自动过滤掉“那个”、“额”等语气词,并修正“两点”到“三点”的口误,最终输出为:“王总,会议定在下午三点,地点为老会议室,请带上市场调研报告。”这种能力极大地提升了语音输入的实用性和效率,让用户在日常沟通、会议记录或文档撰写中能够更自然地表达。
除了基础的语音转文字,千问还具备上下文理解和智能回复功能。在办公或创作场景中,用户无需离开当前编辑器,直接通过语音指令即可调用千问的能力。例如,在撰写周报时,用户只需口述“帮我插入2025年全国GDP数据”,千问便会自动搜索并插入相关数据。在浏览网页或阅读专业英文论文时,遇到不理解的段落,用户只需划选后说“帮我解释一下”或“帮我翻译一下”,千问便会自动生成解释或翻译内容,极大提升了阅读和学习的效率。
在通讯和邮件场景中,千问的语音输入同样表现出色。用户在使用钉钉、微信或邮件客户端时,可以直接通过语音要求千问根据上下文自动生成回复。例如,在回复一封客户的英文邮件时,用户只需用中文简单口述回复要点,千问便能在输入框中生成格式正确、措辞恰当的英文邮件回复。这一功能不仅节省了打字时间,还降低了语言障碍,尤其适合跨国沟通场景。
千问语音输入对口语化表达的重构不仅限于文字精简,更在于逻辑纠错与结构化整理。用户在撰写周报或会议纪要时,即使表达逻辑跳跃,千问也能基于上下文进行语义归纳,自动将散乱的描述整理为要点清晰的结构化文本。例如,用户口述一段工作进展,千问可以自动将其拆分为“完成情况”、“遇到的问题”、“下一步计划”等模块,形成一份规范的周报。
目前,千问语音输入法功能已全面开放,所有用户均可通过千问PC端免费使用。这一功能的推出,标志着AI语音交互从简单的语音转文字迈向了更深层次的语义理解与智能辅助,为日常办公、学习和沟通带来了全新的效率提升方式。随着AI技术的不断演进,类似千问这样的工具正在逐步改变人机交互的范式,让“开口即用”成为现实。
来源:Heooo AI工具导航