基于微软 Edge TTS 神经网络语音合成

文字转语音让每段文字都能被聆听

输入任意文字,选择喜欢的音色,一键生成自然流畅的语音。支持多种语言和声音风格。

开始生成语音

输入文字,调整参数,点击生成即可获得高质量语音

生成的语音 0:00
0:00 0:00
功能特性

强大的功能,满足多样化的语音生成需求

30+种音色

支持中文、粤语、台湾国语、英文、日文、韩文等多种语言,点击试听后再选择

自然发音

微软神经网络语音合成,发音自然流畅,接近真人朗读效果

多格式输出

支持 MP3/Opus/AAC/FLAC 多种音频格式,满足不同场景需求

即点即生成

基于 Edge TTS 引擎,毫秒级响应,一键生成并下载高质量语音

常见问题

关于文字转语音的一些常见疑问解答

支持哪些语言?

系统底层基于微软 Edge TTS 模型,支持中文(大陆)、粤语、台湾国语、英文、日文、韩文等多种语言。

文本长度有什么限制?

单次最多支持输入 4096 个字符。对于更长的文本内容,建议分段生成后拼接使用。

生成的音频文件可以商用吗?

本工具基于开源的 openai-tts-edge 项目构建,生成的音频可用于个人和商业用途。

生成需要多长时间?

基于 Edge TTS 神经网络引擎,通常在几秒内即可完成短文本的语音合成。