如果只是让一两个乞丐或茶客去说文字转WAV音频