微软开源超强语音输入法:Vibing

随着大模型与多模态能力持续爆发,语音交互正成为新一代输入风口。像手机端的豆包语音输入法(豆包输入法正式版发布!搜狗输入法代替品!),凭借精准识别、智能断句、自然流畅,收获大量好评。

但豆包语音输入法目前尚未发布 Windows 版本,电脑端想用上同款体验并不容易。市面上其它语音输入工具,要么依赖云端 API、需要按量付费。

最近,微软直接甩出王炸,开源了超强语音转文本模型 VibeVoice-ASR,并基于它推出了一款开箱即用的语音识别输入工具「Vibing」提供了 Windows 和 macOS 客户端。

VibeVoice-ASR 是微软开源的90 亿参数统一语音识别大模型,在 GitHub 上收获海量 Star,堪称当前 ASR 领域的 “长语音王者”。50 + 语言支持:中英混合、多语种切换都能稳识别,不切片、不拼凑:一次性处理长达 60 分钟音频,64K 超长上下文,全程语义连贯。

免费、开源、开箱即用的 Windows 语音识别输入工具「Vibing」使用很简单,按下快捷键 Ctrl+Win 即可快速激活语音转文本,在 Word、浏览器、聊天窗口等任意输入框都能直接用,不用切换软件。

按下 Ctrl+Win+Alt 支持语音翻译,可直接外语转中文,也能中文转其他语言,翻译准确、延迟极低,跨境沟通、外文听写都能用。

自定义热词,专业场景更准支持添加行业术语、专属名词,解决专业词汇识别不准的问题,科研、法务、技术岗都适配。

功能介绍

总结

在语音输入成为刚需的今天,微软 VibeVoice-ASR + Vibing 组合,不用花钱买 API,一键唤起、超长语音、多语言翻译、说话人区分,全部拉满。可以说是目前最省心的开源语音输入法之一。

展开阅读全文

更新时间:2026-05-26

标签:数码   微软   输入法   语音   豆包   语言   外文   模型   精准   上下文   文本

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top