音调和音色作为描述声音特性的三要素文字转WAV音频