我们现在应该往哪个方向追文字转WAV音频