虽然话语是询问文字转WAV音频