主要还是要看双方的文字转WAV音频