说话时还用了几个手势文字转WAV音频