唯一有的办法就是只能智取文字转WAV音频