因为要有原声版和译制版文字转WAV音频