应该只有三门文字转WAV音频