这只是理论上的设想文字转WAV音频