但要依赖设备呼吸文字转WAV音频