其中最主要的就是落位速度文字转WAV音频