30s克隆声音，AI文本生成音频，太强了！

近两年，AI发展的速度真的太迅猛了。

当你还没尝试过传统的文本转语音，或许更新的技术已经到来，甚至都被另一个技术超越了。

上面是我和一位同事的聊天对话，她让我帮她把文本转成语音。

这几年我都发过10篇左右的文本转音频文章了，他们都还没有尝试过。且

这还是最传统的文本转语音方式，使用的是平台内置的播讲人 。

这一年多以来，大家更是把目光转向了AI音频克隆和生成，文本转音频能更多样化、个性化。

最近又诞生了一个开源的AI文本转音频项目，瞬间冲上热榜（7.4K⭐），可以在线使用，也可以自行搭建。

在线使用

网址（复制后浏览器访问）：44886.com/go-398

传统的文本转音频，要么是预制好了播讲人，要么是自己克隆后自己悄悄用。

这个平台最大的特点是——可以模型共享 。你可以使用别人创建的声音模型来文本生成语音。

这些别人调好的模型，细节优化非常好，你可以直接使用。

瞬间生成音频文件。

在生成的时候没有参数可以调整，只可以选择模型，所以生成的质量和模型的好坏紧密相关。可以挑广场中热度高的模型来生成试试。

自己创建模型

只需要1分钟时间，就能用自己的声音创建模型。

如果你不想自己的声音被公开使用，一定记得这儿要选择“私有 ”。

你可以直接在创建的网页上，现场录音。大约朗读3段文字即可 ，太多反而不行。

录完音频，你的模型瞬间就能生成了，赶快去试试生成效果如何吧！

平台和开源的区别

在平台上免费使用是有限制的，每天可以免费用50次。

很多人不理解：为什么很多项目声称开源，但进官网还分免费和收费？

集中给大家科普一下：

开源是指项目源码是开放的，你可以用源码自己去搭建一个平台，这需要一定的门槛。官方用源码搭建好了示例平台，这个平台会有很多人使用，服务器是很贵的，所以会有收费计划。

如果你动手能力强，可以用自己的电脑来跑这些开源项目，不花钱；如果你想图方便，就用官方的示例平台，不是重度使用，每天50次已经足够了。

- end -

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

这是 CapsWriter-Offline ，一个 PC 端的语音输入、字幕转录工具。可用实现简单一键将音频文件转换成文字的懒人工具。

两个功能：

1、实时转换，按下键盘上的大写锁定键，录音开始，当松开大写锁定键时，就会识别你的录音，并将识别结果立刻输入

2，离线转换，将音视频文件拖动到客户端打开，即可转录生成 srt 字幕

特性

完全离线、无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔

热词功能：可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词，客户端动态载入

日记功能：默认每次录音识别后，识别结果记录在年份/月份/日期.md ，录音文件保存在年份/月份/assets

关键词日记：识别结果若以关键词开头，会被记录在年份/月份/关键词-日期.md，关键词在 keywords.txt 中定义

转录功能：将音视频文件拖动到客户端打开，即可转录生成 srt 字幕

服务端、客户端分离，可以服务多台客户端

编辑 config.py ，可以配置服务端地址、快捷键、录音开关……

本地离线整合包

请确保电脑上安装了 Microsoft Visual C++ Redistributable 运行库

服务端载入模型所用的 onnxruntime 只能在 Windows 10 及以上版本的系统使用

服务端载入模型需要系统内存 4G，只能在 64 位系统上使用

额外打包了 32 位系统可用的客户端，在 Windows 7 及以上版本的系统可用

官方程序和模型分离开，需要单独下载模型

我已经把模型和软件打包好，无需单独下载模型，下载整合包，解压即用。

完整整合包下载 ：https://deepface.cc/thread-258-1-1.html

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

功能：热词

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

如果你有专用名词需要替换，可以加入热词文件。规则文件中以 # 开头的行以及空行会被忽略，可以用作注释。

中文热词请写到 hot-zh.txt 文件，每行一个，替换依据为拼音，实测每 1 万条热词约引入 3ms 延迟

英文热词请写到 hot-en.txt 文件，每行一个，替换依据为字母拼写

自定义规则热词请写到 hot-rule.txt 文件，每行一个，将搜索和替换词以等号隔开，如毫安时 = mAh

你可以在 core_client.py 文件中配置是否匹配中文多音字，是否严格匹配拼音声调。

检测到修改后，客户端会动态载入热词，效果示例：

例如 hot-zh.txt 有热词「我家鸽鸽」，则所有识别结果中的「我家哥哥」都会被替换成「我家鸽鸽」

例如 hot-en.txt 有热词「ChatGPT」，则所有识别结果中的「chat gpt」都会被替换成「ChatGPT」

例如 hot-rule.txt 有热词「毫安时 = mAh」，则所有识别结果中的「毫安时」都会被替换成「mAh」

功能：日记、关键词

默认每次语音识别结束后，会以年、月为分类，保存录音文件和识别结果：

录音文件存放在「年/月/assets」文件夹下

识别结果存放在「年/月/日.md」Markdown 文件中

例如今天是2023年6月5号，示例：

语音输入任一句话后，录音就会被保存到 2023/06/assets 路径下，以时间和识别结果命名，并将识别结果保存到 2023/06/05.md 文件中，方便我日后查阅

例如我在 keywords.txt 中定义了关键词「健康」，用于随时记录自己的身体状况，吃完饭后我可以按住 CapsLock 说「健康今天中午吃了大米炒饭」，由于识别结果以「健康」关键词开头，这条识别记录就会被保存到 2023/06/05-健康.md 中

例如我在 keywords.txt 中定义了关键词「重要」，用于随时记录突然的灵感，有想法时我就可以按住 CapsLock 说「重要，xx问题可以用xxxx方法解决」，由于识别结果以「重要」关键词开头，这条识别记录就会被保存到 2023/06/05-重要.md 中

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

功能：转录文件

在服务端运行后，将音视频文件拖动到客户端打开，即可转录生成四个同名文件：

json 文件，包含了字级时间戳

txt 文件，包含了分行结果

merge.txt 文件，包含了带标点的整段结果

srt 文件，字幕文件

如果生成的字幕有微小错误，可以在分行的 txt 文件中修改，然后将 txt 文件拖动到客户端打开，客户端检测到输入的是 txt 文件，就会查到同名的 json 文件，结合 json 文件中的字级时间戳和 txt 文件中修正结果，更新 srt 字幕文件。

修改配置

你可以编辑 config.py ，在开头部分有注释，指导你修改服务端、客户端的：

连接的地址和端口，默认是 127.0.0.1 和 6006

键盘快捷键

是否要保存录音文件

要移除识别结果末尾的哪些标点，（如果你想把句尾的问号也删除掉，可以在这边加上）

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

ai文字转曲?

AI文字转曲指的是使用AI技术将文字进行曲线处理。曲线处理是一种将文字变形、扭曲或旋转的操作,以使文字更具有艺术感或个性化。在AI文字转曲过程中,可以使用...

ai文件怎么转曲不会被缺少字体?

选择菜单“选择——对象——文本对象”,即可选中所有的文字,然后再选择菜单“文字——创建轮廓(快捷键是Shift+Ctrl+O)”,选中的所有文本即可转曲。ai文字...

AI如何快速转曲?

快捷键“Shift+Ctrl+O”。操作如下:1、首先打开要转曲的文件(最好是复制一份,因为转曲后文字不能直接删除和添加文字)。2、在要转曲的文字上右键单击,在弹...

ai可以实现文字转曲的是?

在ai软件界面中,先用选取工具选中编辑好的文字对象,然后再按下快捷键ctrl+shift+o,可以将文字全部进行转曲,不同于cdr软件中的转曲方式“cdr软件中的转曲方式...

ai中文字转曲有哪些方式?

在ai中,有多种方式实现中文字转曲。其中最基本的方法是利用数学函数对每个字进行变形,并进行连续的曲线平滑处理。另一种方法是使用深度学习模型,通过训练大...

AI文档如何转曲?

AI文档的转曲通常需要进行一些特定的处理和技术操作。以下是一种常见的方法:数据准备:将要转曲的AI文档作为输入数据,并对其进行预处理和格式化。这可能包括...

PDF里的文字如何在AI转曲?

在PDF文档中提取文字并转换为AI转曲,可以按照以下步骤进行操作:1.将PDF文档导入AI软件:首先,您需要将PDF文档导入AI软件中。您可以使用AdobeIllustrator或...

ai文字转曲之后怎么改变字体粗细?

1、首先,用文字工具输入需要加粗的文字。2、接着添加描边,设置和填充一样的颜色。3、在设置描边的粗细,数值根据自己的需要。4、就可以得到加粗的字体了。...

文字转曲怎么操作?

文字转曲的6种方法:文字转曲的方法一:CDR10以前的版本可以利用滤镜中的冻结来解决。在段落文本上画一个全黑的矩形,打开滤镜--透明度--100%,并勾选冻...文...

在Ai中，如何将Ai文件怎么转曲-159****0171的回答-懂得

1、文字转曲方法选择要转曲的文字对象——文字——创建轮廓即完成了文字转曲的动作,也可以用快捷键“Shift+Ctrl+O”。2、如何快速转曲单有很多文本...

吴敦义任达华的哥哥

上一集下一集 

30s克隆声音，AI文本生成音频，太强了！

在线使用

自己创建模型

平台和开源的区别

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

ai文字转曲?

ai文件怎么转曲不会被缺少字体?

AI如何快速转曲?

ai可以实现文字转曲的是?

ai中文字转曲有哪些方式?

AI文档如何转曲?

PDF里的文字如何在AI转曲?

ai文字转曲之后怎么改变字体粗细?

文字转曲怎么操作?

在Ai中，如何将Ai文件怎么转曲-159****0171的回答-懂得

猜你喜欢

在线查找字体不用再到处找字体了，精选5个免费字体下载网站！赶紧收藏！

非主流字体

快手字体大小怎么设置关注适老化｜字体大了，功能少了，App开启长辈模式香不香？

ps字体做旧旧文字，Photoshop把文字做旧

最新文章

热门视频

标签列表

30s克隆声音，AI文本生成音频，太强了！

在线使用

自己创建模型

平台和开源的区别

AI一键音频转文字工具 速度超快，支持实时转换，本地离线可用

ai文字转曲?

ai文件怎么转曲不会被缺少字体?

AI如何快速转曲?

ai可以实现文字转曲的是?

ai中文字转曲有哪些方式?

AI文档如何转曲?

PDF里的文字如何在AI转曲?

ai文字转曲之后怎么改变字体粗细?

文字转曲怎么操作?

在Ai中，如何将Ai文件怎么转曲-159****0171的回答-懂得

猜你喜欢

在线查找字体 不用再到处找字体了，精选5个免费字体下载网站！赶紧收藏！

非主流字体

快手字体大小怎么设置 关注适老化｜字体大了，功能少了，App开启长辈模式香不香？

ps字体做旧 旧文字，Photoshop把文字做旧

最新文章

热门视频

标签列表

AI一键音频转文字工具速度超快，支持实时转换，本地离线可用

在线查找字体不用再到处找字体了，精选5个免费字体下载网站！赶紧收藏！

快手字体大小怎么设置关注适老化｜字体大了，功能少了，App开启长辈模式香不香？

ps字体做旧旧文字，Photoshop把文字做旧

最新文章

热门视频

标签列表