实际却是在给自己挑文字转WAV音频