然后如实禀报自己看到的文字转WAV音频