试图重新把当时的画面拼凑起来文字转WAV音频