大模型可以帮学生摆脱“Chinglish”了?

学生说一句,虚拟人外教就能立刻接一句,并且听得懂中式英语,还能一步步引导,教你地道表达?大模型抢外教“饭碗”的时代真的来临了吗?

近日,网易有道发布了教育领域垂直大模型“子曰”及其六大创新应用。与通用大模型不同,“子曰”大模型从一开始就定位为教育垂类大模型,支持多个下游任务,为不同教育场景提供基础能力。“子曰”大模型在多个场景中已有应用成果,涵盖口语训练、作文批改、习题答疑等六大教育细分领域。虚拟人口语教练Hi Echo是其中的应用之一,具备引导式学习和实时反馈的能力,可以帮助学生更好地练习英语口语。

对话周枫:发布教育领域垂直大模型“子曰”及六大应用,不打无准备之仗-风君雪科技博客

虚拟人教练真的能替代外教吗?其发音能做到母语者水平吗?虚拟人用何种技术驱动,是否会有面部不自然的现象?其背后依托的自研模型在语义理解、知识广度方面表现如何,是否对标近期火爆的接入ChatGPT3.0的应用Call Annie?带着这些疑问,网易科技与网易有道CEO周枫、网易有道词典业务负责人张艺进行了对谈,探讨虚拟人外教背后的科技基因。

谈技术路径:虚拟外教不仅是虚拟人+大模型

网易有道不打“无准备之仗”,周枫表示,在Hi Echo诞生之前,网易有道对市场上的多款产品进行了仔细研究,包括来自于美国的Call Annie以及其它几款英语教学虚拟人教练,发现每家公司对用户需求和应对方法都有所不同,而这些公司也找到了自身的一些独特优势。他特别指出,Call Annie的产品定位并非完全是外语学习,而是更像一个虚拟助手,除了辅助语言学习外,还能播放新闻等功能。这使得Call Annie面向的用户更广泛,不仅局限于学习英语的用户。而Hi Echo定位则更加垂直,仅面向英语学习场景,更有针对性。

张艺补充说,之前Call Annie备受欢迎主要是因为用户认为其在帮助用户练习口语方面很有用处,这也反映出广大用户在口语练习方面存在着痛点。“这说明了用户对于口语学习辅助AI产品的需求非常大。口语教练一直以来都是有道团队的梦想,因为有道汇聚了全国最大的学生用户群体,其中很多人都是狂热的口语爱好者或希望提升口语能力的人。然而,由于过去的AI能力限制,无法很好地满足口语训练的需求,这一痛点一直存在。”张艺进一步称。

在技术方面的差异化中,张艺指出,虚拟人外教不仅仅是简单的虚拟人加大模型,背后需要复杂的逻辑和对学习者的引导。“子曰”大模型对口语进行了深入研究,考虑到中国人在口语学习中可能出现的各种表达方式、不自然的表达以及其他问题,针对这些问题进行了针对性的改进。此外,语音合成和语音识别等技术也得到了充分的应用,使得虚拟人外教可以像真人一样纠正学习者的发音,识别中国人常用的英语表达方式,提供全面的口语学习体验。

至于虚拟人的制作,这涉及到网易整个团队,很多人的共同努力。周枫称赞该虚拟人在面部表情、嘴型准确度以及发音流畅度方面都非常逼真,可以说是当前市场上最优秀的虚拟教练之一。其产品定位非常准确,旨在解决用户学习英语口语的问题,而不是与其他产品对标。

谈商业模式:利用技术优势降本 产品或将开启会员制

针对成本问题,周枫表示,优秀的技术通常会伴随高昂的成本,但网易有道会管理好资源,充分利用团队内部的优势。团队擅长将Transformer等大模型优化,让其在小设备上也能高效运行,从而提高资金和人力利用率。他们并未额外组建团队来做大模型,而是在现有团队框架下进行开发,充分利用之前的技术和资源积累。

同时他也指出,目前大部分的大模型均为免费,因为复制模型的边际成本非常低,一个训练出来的模型可以服务很多人。很多公司之所以会开源大模型,可能出于增强公司影响力、构建生态或者纯粹出于有利于大众的考虑。大模型适合开放是因为它容易使用和改进,不需要专业技能,即便拿到现成的模型也可以自由修改和改进,这使得开源的生态逐渐壮大。

“然而,虽然大模型开放带来了很多优势,但对于团队来说,现阶段还需要资金支持。虽然技术是开放的,但我们自身对产品的要求可能需要自己进行改进,因此长期来看,资金仍然是需要的。然而,随着技术的进步,开源生态会逐渐增强,未来可能会更加开放。” 周枫向网易科技表示。

谈及Hi Echo虚拟人口语教练、语法精讲、AI作文指导等六大落地应用的商业模式,周枫表示目前可能有采取会员制得想法:“我希望越便宜越好,像电子书的逻辑,希望好技术让更多人使用,因为这样才能最后倒过来推动技术发展。”