但能从严默的话语中分析出一二文字转WAV音频