并且他已经能够说话文字转WAV音频