考虑到客人们的用餐习惯文字转WAV音频