不然的话就难以交代文字转WAV音频