现在看来也只能老实交代文字转WAV音频