大多都是从别的大域文字转WAV音频