至少他们勉强能够应付文字转WAV音频