所以无论如何他都要找到文字转WAV音频