恐怕也没办法面对数十倍文字转WAV音频