现在他已经可以猜到文字转WAV音频