少部分则是二流文字转WAV音频