到目前为止唯一的途径似乎就是体内自发形成的文字转WAV音频