Kokoro-82M文本转语音模型

Kokoro-82M是一个先进的文本转语音模型，参数量为8200万，支持将文本转换为音频。

Kokoro-82M模型于2024年12月25日发布，在同年年底前陆续推出了多种声音包。

Kokoro-82M在TTS领域的表现尤为突出，尽管训练数据少于100小时，但在多个对比测试中显示出优异的性能，超越了许多参数更多的模型。

Kokoro-82M的架构属于StyleTTS 2，提供丰富的声音包选择，模型支持Apache 2.0许可证，可以免费使用和修改。

在训练过程中，Kokoro使用了许可的非版权音频数据，通过80GB的A100 GPU实例进行训练。

Kokoro-82M的局限性包括缺乏声音克隆能力，主要训练于长篇朗读和叙述音频，而非对话音频。

用户可以在Hugging Face平台上体验Kokoro的在线演示，进行文本转语音的转换。

AI工具

访问 huggingface.co/hexgrad/Kokoro-82M

你可能想看的

1Xcode搭配Cursor：Cursor 开发 iOS 的实用技巧与避坑指南 iOS开发 AI工具

2从高考志愿到网络热梗都能轻松上手的Kimi首个Agent：Kimi-Researcher AI工具

3智源开源AI绘图神器 OmniGen2 AI工具

4Puppeteer Real Browser：防止被检测为机器人的工具，支持通过验证码 AI工具爬虫蜘蛛

5VDraw.ai：基于 AI 的在线作图工具 AI工具

6photoshot 开源 AI 头像生成器 AI工具

7Crawl4LLM：面向大语言模型预训练的高效网络爬虫 AI工具网络爬虫

8HealthGPT 医疗大规模视觉语言模型：整合视觉理解与生成能力，支持多种医学任务 AI工具

9MatAnyone 人体视频抠像框架 AI工具视频工具抠图工具

10HiveChat：专为中小团队设计的AI聊天应用 AI工具

1Mac 下 brew services 启动失败，报错：sudo launchctl bootstrap

2使用launchctl list 查看项目状态，状态码出现 78 的问题 MacOS

3使用pthon实现word转换成pdf，适用于windows系统和macos系统 MicrosoftOfficeWord PDF

4OpenClaw新手必看：20款高人气Skills安装指南 AI OpenClaw

5Trae开发的Python项目，如何在Windows系统上开机自运行？ Windows Python

6Trae开发的Python项目，如何在苹果Macbook上开机自运行？ Python Macbook

7Google Search Console 站长工具使用指南 Google 站长工具

8iOS开发中7个提高效率的实用工具库：MBProgressHUD，Vapor，Try，Swift OpenAPI Generator，MarkEdit，AXe iOS开发

9Excel如何绘制差额对比折线图 Excel教程

10旋风加速器，真正免费的加速器，不限流量旋风加速器

11Origin如何绘制多半径饼图 Origin教程

12海贼王(真人版) 第二季全8集迅雷（国英多音轨+简繁英字幕）动漫动画片海贼王

1V视频助手一键下载在线视频

2英语真题在线

3科技爱好者周刊（第 170 期）：软件订阅制的胜利 - 阮一峰的网络日志

4免费在线PDF工具

5不要大声责骂年轻人，他们会立刻辞职的，但是你可以往死里去骂那些中年人，尤其是有车有房有娃的那些。

6依附理论 - 维基百科，自由的百科全书

7【福利】阿里云数据库电子书合集开放下载！从开源数据库到阿里巴巴实战，一键全包！-阿里云开发者社区

8Android-P7/Android开发还不会这些？如何面试拿高薪！.md at master · Android-Alvin/Android-P7

9研究人员介绍放大低分辨率图像的新方法

10关于公司带饭省钱的一些经验分享（坐标北京）

11今年国庆高校放几天假？清华已明确：3天

12微软发布个性化新闻源 Microsoft Start

13WhatsApp 将允许用户加密聊天记录备份

14携程商旅-差旅管理,商旅管理,月结免垫资,专业差旅管理公司-企业差旅及费用管理全流程,出差申请,行程预订,授权审批,免费差旅报销系统,差旅管理报告.

15《Linux操作系统实现原理》网页/Book-Lite/

16绿茶加速器永久免费

17西柚加速器，最快的加速器

18快帆加速器官网-海外华人免费回国加速器