尽可能重现出他七到十岁之间的容貌文字转WAV音频