所以可以看到图像有略微的表情文字转WAV音频