他们说话和看人时就好像完全忽略了两个小孩文字转WAV音频