是因为没必要计较文字转WAV音频