华为|几行代码的事儿，语音识别翻译合成克隆一条龙AI功能都有折叠屏|5G

其实，对于语音识别这类和语音有关的几个常见的AI功能——没错，是AI应用，模型都给你训练好了的——往往一行代码（核心实现）就能实现，不过为了谨慎起见，还是不要那么说吧，毕竟一行终端命令是一个功能。这个很厉害的AI就是百度飞桨的Speech ，其实就是PaddleSpeech啦。
这是PaddlePaddle里的项目。 PaddleSpeech基于飞桨PaddlePaddle的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。也就是封装了语音识别语音翻译等多个我们常用的功能。之前在很多AI应用上一直用国外的开源项目，虽然一直听说PaddlePaddle但没在意，后来用了某个一试，果然啊，比较符合胃口（门槛低呗）。

如果我们想要做一个语音识别的小应用，或者就是想要体验一下，可以试试PaddleSpeech这个。机智客简单试了下，感觉效果还是很棒的。由于这是基于飞桨的PaddleSpeech ，所以我们在配置环境的时候就要安装飞桨的库，保证环境里有PaddlePaddle或者创建新的虚拟环境，安装飞桨。再用pip安装paddlespeech就行。这里官方强烈建议在Linux下，而且是3.7以及以上版本的Python ，由于自己用的是Ubuntu ，之前默认的Python就完全符合，这一步不存在障碍。
等待安装成功， pip检查没有问题，就可以测试使用语音识别这些功能了。比如我们在本地文件夹里放一个测试的wav文件，然后用输入paddlespeech asr --lang zh --input 0.wav这样的命令开始识别。当然，这里没有加路径，说明是在当前目录里开的终端。然后执行命令。此时会加载数据，然后会自动下载模型，下载PaddleSpeech需要的whl文件也就是paddlespeech_ctcdecoders-0.1.0-cp38-cp38-manylinux_2_12_x86_64.manylinux2010_x86_64.whl 。文件并不大，不过之后有很多代码输出，安静等着就行了。
【华为|几行代码的事儿，语音识别翻译合成克隆一条龙AI功能都有】等到结束了。正确的识别输出就出来了。当然这里是输出到终端里的，我们能直接看到。而paddlespeech命令还有很多参数和要求，我们可以在项目说明里查看文档，或者在终端用help查看相关说明。这只是一个小例子， Paddlespeech有很多内置的模型，也就是有很多相应的应用，方便我们直接调用。大家可以试一下。

华为|几行代码的事儿，语音识别翻译合成克隆一条龙AI功能都有

相关经验推荐

一款暗黑生存向的即时战略游戏

扬州城乡居民医保住院医疗费用报销比例

如何消除眼袋呢

黄瓜灰霉病如何防治效果好黄瓜灰霉病用什么药效果好

奥特战士|《奈克瑟斯奥特曼》制作精良而且极其优秀的作品，可惜影响不够

天龙怀旧八卦：移民玩家初来乍到，迅速与本土杀手结下梁子？

怎么用煎锅煮干饭

jian怎么拼读 jian怎么拼读的正确发音

洗眼镜的水是什么水

盘点AG超玩会为了捧一诺糟蹋的选手，不数不知道一数吓一跳！

申太公歌词乙太歌词

微波炉骨肉相连

怎样擦玻璃才干净？轻松省事擦玻璃小窍门

妄想山海的蘑菇肉汤怎么做妄想山海蘑菇肉汤怎么做几率大

面相学：教你如何看清情场小人的嘴脸

单绒单羊双胞胎性别会一样吗单绒单羊双胞胎

充电器|OPPO Reno8 全新配色鸢尾紫正式上线

地面胶水用什么可以洗掉

旅游饮食安全注意事项去旅游注意事项和饮食

ios13怎么快速截屏 ios14如何快速截屏