当前位置: 首页 > news >正文

Voicebox开源:本地克隆声音,给Claude Code配音,支持情绪标签

ElevenLabs 的声音克隆效果不错,但每月几十刀,加上音频数据要上传到他们服务器——这两道坎不小。Voicebox 是开源平替,28000+ Star,核心是本地优先。

几秒钟参考音频就能生成声音模型,覆盖23种语言。内置7个TTS引擎,各有侧重:Chatterbox Turbo 支持 [laugh]、[sigh] 这类情绪标签,让生成语音带真实情绪;Qwen3-TTS 擅长多语言克隆还能听懂「慢一点说」「用耳语」这种自然语言指令;没有显卡的可以选 Kokoro,82M模型CPU就能跑。

接入 Claude Code 只需一行:
claude mcp add voicebox --transport http --url http://127.0.0.1:17493/mcp

接上之后,Claude Code 能用你克隆的声音说「测试通过,可以合并」。还能给不同 Agent 绑定不同声音,听声音就能分辨是哪个 Agent 在汇报。

还有一个「人格化」功能:给声音绑一段人设描述,比如「毒舌的代码审查官」,之后所有输出文本都会先按人设改写,再合成语音。说话风格也是你定的。

macOS 和 Windows 都有安装包,苹果 M 芯片上速度比通用方案快不少,NVIDIA 显卡自动走 CUDA。缺点是 Qwen3-TTS 模型文件有几个 G,首次下载得等。

项目地址:https://pan.quark.cn/s/6f22fd03bfd1

GitHub 项目地址:https://github.com/jamiepine/voicebox

http://www.rkmt.cn/news/1463214.html

相关文章:

  • DDD-017:六边形架构(Hexagonal Architecture)
  • 2026年北京钢铁租赁行业现状与专业选型分析 - 品牌企业推荐师(官方)
  • 别再死记硬背了!用Python和NumPy从零理解张量:从标量到视频数据的直观建模
  • GPT-3.5微调实战指南:企业专属ChatGPT构建方法
  • 提升openwfd开发效率:用快马平台智能生成高性能编码与传输模块
  • 想做硬件工程师?高考志愿填报与职业全攻略:芯片·嵌入式·板级硬件深度解析
  • 告别网盘限速烦恼:这款免费工具让你下载速度飙升500%
  • 2026年PDF全能转换指南:保留过渡效果与超链接,5款工具实测对比 - 时时资讯
  • 8分钟预测千只股票:Kronos AI如何用基础模型重塑你的投资决策?
  • Qbot量化交易框架:本地化AI投研平台架构深度解析与实战部署
  • 为什么选择BigVGAN-v2_22khz_80band_256x?揭秘其在多语言语音与环境音效生成中的优势
  • 2026年北京农村自建房用什么瓦好?不锈钢瓦/铝镁锰瓦/彩石金属瓦深度测评:金宸伯领先 - 企业深度横评dyy6420
  • MiniCPM-V-4-GPTQ安全与优化:确保模型稳定运行的10个最佳实践
  • 3步掌握PDF全能工具箱,轻松处理各类文档难题
  • 安卓本地仓库管理App源码:三类用户权限区分+SQLite数据存储+全界面流程实现
  • 如何彻底修复DWPose姿态估计器报错:3种实用解决方案
  • 11万英语发音宝库:打造你的专属离线发音助手
  • 2026年 通信电缆厂家推荐榜单:市话电缆/矿用通讯电缆/室内通信电缆/自承式通信电缆/防水通信电缆/地埋通信电缆优质品牌精选 - 企业推荐官【官方】
  • NF-κB通路:炎症与癌症发展的关键枢纽
  • 终极炉石传说增强插件HsMod:55项功能打造个性化游戏体验
  • 抖音批量下载工具终极指南:从零开始掌握无水印视频下载
  • 2026年论文党必备:一键生成论文工具测评与推荐清单
  • 如何用MOOTDX在5分钟内搭建专业级量化交易系统:从数据获取到策略实现的完整指南
  • 原生技术,赋能视频孪生;镜像视界空间计算,成就顶尖视频孪生
  • 3分钟解决Cursor试用限制:设备标识重置的终极技术指南
  • Oracle数据库锁表一小时,我靠这3个SQL脚本定位到元凶(附实战排查流程)
  • 运筹优化老鸟的私房菜:Benders分解在产能规划与供应链问题中的实战调参指南
  • 空间视觉重建技术,打造园区顶尖全域视频孪生管控体系
  • 终极指南:5分钟掌握GitHut,解锁GitHub编程语言趋势可视化
  • 2026年 南通门墙柜一体化定制推荐榜:极简同色/轻奢统色/全屋收纳定制,实力厂家与精装改造口碑解析 - 品牌企业推荐师(官方)