脸色和嘴唇也呈现出深色文字转WAV音频