更偏向于把情绪隐藏在缓慢的文字转WAV音频