当然前提条件是双方自愿文字转WAV音频