那时候是担心开支太大文字转WAV音频