你需要考虑到他们的未来文字转WAV音频