基于微软 Edge TTS 神经网络语音合成

文字转语音让每段文字都能被聆听

输入任意文字，选择喜欢的音色，一键生成自然流畅的语音。支持多种语言和声音风格。

开始生成语音

输入文字，调整参数，点击生成即可获得高质量语音

输入文字 (0 字符)

输出格式

选择音色

生成的语音 0:00

功能特性

强大的功能，满足多样化的语音生成需求

支持中文、粤语、台湾国语、英文、日文、韩文等多种语言，点击试听后再选择

微软神经网络语音合成，发音自然流畅，接近真人朗读效果

支持 MP3/Opus/AAC/FLAC 多种音频格式，满足不同场景需求

基于 Edge TTS 引擎，毫秒级响应，一键生成并下载高质量语音

常见问题

关于文字转语音的一些常见疑问解答

支持哪些语言？

系统底层基于微软 Edge TTS 模型，支持中文（大陆）、粤语、台湾国语、英文、日文、韩文等多种语言。

文本长度有什么限制？

单次最多支持输入 4096 个字符。对于更长的文本内容，建议分段生成后拼接使用。

生成的音频文件可以商用吗？

本工具基于开源的 openai-tts-edge 项目构建，生成的音频可用于个人和商业用途。

生成需要多长时间？

基于 Edge TTS 神经网络引擎，通常在几秒内即可完成短文本的语音合成。