来源|多知
作者|冯玮
网易有道再上新。
今天下午,网易有道在“POWERED BY 子曰”有道AI新品发布会上发布了多款基于“子曰”教育大模型的AI新品:
1、全新硬件有道AI答疑笔SpaceX——AI答疑笔SpaceOne的二代机型,延续答疑场景,升级了扫题交互能力,新增全景拼图技术和板书视频答疑等功能。标准WiFi版1199元,4G流量版1399元。
2、有道音视频翻译——“文本+音频+视频”多模态一体化原声翻译系统,3分钟即可完成一段10分钟视频的处理。处理100集短剧只需要100元不到。
3、全新升级的有道词典——界面更新,同时主要功能已全面AI化,覆盖AI同传、AI拍照翻译、AI文档翻译等。
网易有道CEO周枫首次提出了教育AI应用能力L1-L5分级标准,同时强调“教育AI正全面加速升级。”
今年的有道全面开花:技术端有道在6月末开源“子曰3”数学模型(Confucius3-Math),作为推理模型“子曰-o1” 在数学模型能力上的延伸,子曰3长板在于数学、逻辑与推理能力;硬件端有道在半年内推出三款全面屏,聚焦答疑场景的AI答疑笔SpaceOne与SpaceX,全面屏听力宝M7;应用端,有道文档FM官宣开启公测,作为全新的AI播客应用,其围绕“文档”的高效形态进行了多维度延展……
有道似乎正在酝酿一个崭新的自己:一个在云端、内容端、技术端与设备端的全线升级。
01 Space X:想做“马良的神笔”
有道对答疑场景的关注与硬件落地,经历了几轮谨慎的尝试:
词典笔5代产品中,有道首次在其中尝试与题目、学科扩展相关的事情;词典笔6代产品中,有道开始在词典笔形态上配置答疑功能;词典笔7代上,有道对屏幕进行调整,用以强化互动体验。
这是个用几年时间逐渐摩挲清晰的选择。
2025年年初,有道在词典笔累计销量刚好突破1000w台的同时开始放大答疑场景的落地。
2025年2月,有道官宣全新形态硬件“AI答疑笔‘有道SpaceOne’ ”,保有词典笔特质,但也在走出词典笔的概念,转向专业的AI答疑。
作为有道的第一款AI原生硬件,在技术基座基础上,有道小P、Hi Echo、AI拍照等AI功能全部嵌入,其中小P的AI家教角色被放大,提供全学科、全学段的个性化服务。
这是有道首次尝试,用以“把一个会讲题会解题的AI老师交到孩子身边。”
据有道官方数据显示,推出的半年时间里,AI答疑笔人均每日答疑次数超过10次,中学阶段理科题占理科答疑请求的60%——这是个不错的数据。
另外,SpaceOne问世半年多次售罄,据官方数据目前出货量几近10万台,“这给了我们信心”,网易有道高级副总裁吴迎晖强调,“答疑笔的场景很好,可能会比查词翻译更大,我们如果能够做深、做透,可能就已经很足够了。”
为了“做深、做透”,有道拿出了新机。
多知观察发现,相较于初代产品SpaceOne,SpaceX在扫描交互、答疑讲解以及硬件配置等方面全面均实现升级。简单看下其特点:
1、SpaceX重点更新了扫题输入环节。
SpaceX升级了扫题交互的体验过程,通过新增的智能拼图技术和3.6cm宽笔头,面对比较长的文字或图片题,SpaceX也可以完成拼图输入,进而满足长题、多图题的录入。
在拍题、扫题、语音提问等多种录入方式的基础上,SpaceX升级配置,答疑功能位于一级入口,不用翻菜单、切模式,即便屏幕还没亮,用户依然可以提笔即扫。
目前SpaceX已覆盖所有题型,理科中的几何图、物理电路图、化学方程式等复杂图文的题型都可以直接识别解答。
2、新增板书式视频答疑。
为了丰富解题答疑的沉浸感与丰富度,有道为SpaceX新增了板书式视频答疑。
在板书答疑形态下,SpaceX将对每道题目生成专属AI讲解视频,通过图、文、声融合的动态板书视频,还原日常课堂上老师边写边讲题的过程。
有道官方数据介绍,基于全新升级的多模态视觉模型,有道AI答疑笔SpaceX识题、讲题准确率已能实现96%。
此外,有道还配套丰富了AI错题本,现已全面支持收录错题、订正提醒、举一反三、组卷打印等等。
3、硬件配置全面升级。
SpaceX采用4.4英寸OLED高清全面屏,并通过了莱茵低蓝光护眼认证,机身更轻薄,厚度13毫米、重量105g,2350mAh容量电池长续航,充一次电可用一周。
4、售价方面,SpaceX标准WiFi版1199元,支持插卡的4G流量版1399元。
今年上旬,网易有道词典笔产品负责人孟旭曾在多知OpenTalk线下活动上提到:
“词典笔作为智能学习硬件领域的一个重要产品形态,它的发展演进本质上是用户场景需求、硬件创新与人工智能技术发展三重维度协同作用的结果。”
“具体来说,产品在迭代过程中会呈现出"需求牵引-技术支撑-体验升级"的螺旋式发展路径。”
SpaceX的推出,也刚好契合这一逻辑。
“我们希望AI答疑笔能够真正开启即时答疑新范式,让学生随时随地解决错题,用最少的时间、最短的路径提升学习效果”,吴迎晖强调。
而伴随着新品的问世,也意味着有道用半年时间已完成三款全面屏产品的落地。
02 有道进入全面屏时代
在前文提到的两款答疑笔之外,有道还在本月推出了另一款新品——“全面屏听力宝M7”。
作为听力宝系列的首款全面屏产品,M7延续了有道的极简风格,正面配备4.02英寸全面屏,背面为独立扬声器,侧面为音量、智能调用和播放键。
M7在资源上内置AI拍照答疑、Hi Echo、听力资源、英语学科的同步学、写作、单词记忆和有道词典等功能;语文学科的写作、背诵、同步学等功能,以及水平测试、熏听计划等。
虽然与AI答疑笔SpaceOne、SpaceX的部分功能相近,但M7整体更垂直于语言学习,同时塑料材质机身降低了听力机重量,对青少年随身携带也更加友好。
今年4月,多知曾根据知识产权官网、企查查、天眼查等公开平台查询到包括新东方、作业帮、网易有道、小度等企业在内的多个专利信息。
根据公开专利信息,有道于今年2月分别获得学习机(听力宝A)和学习机(听力宝B)两款授权。两者都是全面屏的听力宝设备,侧边均设有极简的功能按键。不同之处在于两款产品的背板。
虽然与实际问世的M7背板样貌并不相同,以及专利获得授权并公开后,并不意味着这些产品能很快会上市或实现量产。但也在侧面证明,有道正在围绕全面屏形态进行创新。
多位业内从业者对多知分析,有道对全面屏机型的关注,或许是有道绕开学习机红海,向“口袋型学习机”谋求市场先发优势的商业选择。
周枫曾在与多知于2024年年末的一次对话中分享,有道的硬件业务在2023年“可以说是非常困难”,周枫解读,由于曾经在渠道管理、产品管理等方面的错误选择,一直到2024年上半年,有道硬件整体还处在比较困难的阶段。
“后来我们做了大幅度的调整,基本上硬件团队的渠道、产品管理等等都是重新做了一遍。差不多用了一年时间,直到2024年三季度恢复了增长。当然这其中大模型和硬件结合也为业务发展做了很大推动。”周枫补充。
在当时定下的将模型功能与硬件形态做更加深度的融合思路,也成为有道今年多款新品的底层逻辑。
对于轻型全面屏产品的市场空间和特征,周枫曾对多知举例:“我有时候观察我自己的孩子,其实现在的学生们随身有挺多产品的,这其中有学习的也有非学习的,但这些产品的功能上存在交叉,我觉得在这个基础上的创新空间很大。”
“我想讲的是,不一定要把这些需求完全区分开,我觉得整个AI硬件市场未来几年都还是有很大空间在的。我也很鼓励团队去充分探索。”
实际上,面向青少年市场、主打便携场景的AI智能市场在2024年下旬开始趋热。
首先在于参与者与硬件形态开始扎堆,仅以多知在2024年年末到2025年年初报道的产品中,就有云天励飞的原生教育硬件“噜咔博士AI拍学机”,科大讯飞旗下“E听说家长通”,灵宇宙在CES上展示的Ling,牛听听真正意义上的第一款全AI机型“慧听牛”,Luka智能“AI学伴小黄机”,听力熊AI学伴手机X3……
这其中,既有上市公司跨界教育便携场景、也有教育科技公司通过AI对原有硬件进行重构,还有刚加入的创业公司通过全新的产品试图占据一方天地。
竞争格局的节奏变化明显加快。
多位教育科技从业者对多知表示,便携场景下的AI教育综合产品或将在2025年进入爆发期,市场也会伴随更多的产品形态、或多元或聚焦的内容和AI的融入,展现全新的面貌。
对于有道来说,全面屏、答疑场景、技术提升和内容积累,或许都是帮助其不断提升差异化壁垒的存在,或许还会有新的,但还需要时间。
吴迎晖在最后强调,“我们现在能确定的是,尊重市场规律、尊重产品规律。对自己所做的事情保有足够的信心。”
03 AI应用矩阵“大扩容”
发布会上,有道还官宣了多个AI产品动向。
”网易有道智能应用事业部负责人张艺在现场分享,有道AI订阅销售额累计3亿多,AI功能渗透率超过40%。有道累计用户量超10亿。伴随用户的增长和对产品需求的专业化邀请,团队开始思考如何通过AI更好地提升应用能力。
有道词典业务打响了全面AI化升级的第一枪。
据介绍,目前其已更新为更加简洁的首页,专业翻译能力,以及覆盖AI同传、AI拍照翻译、AI文档翻译等功能。
以AI同传为例,新版有道词典在识别能力、翻译覆盖度及翻译质量上相应提升。
针对用户经常遇到的噪音情况,有道词典团队也就此重点优化了底层模型的抗噪性,可在嘈杂环境中保障高准度识别。新增71种语言、125种口音,包括粤语、印度英语等,同时增强其在金融、医学、化学等专业领域的理解能力,用于提升同传的精准度。
此外,AI同传功能目前已具备AI总结与脑图生成功能,可实时根据内容生成总结,将单一的同传翻译升维至内容效率提升工具。
张艺透露,网易有道AI同传累计服务已超1000万人,全新版本已经上线。
除了对现有应用的升级,有道还推出了全新的产品——有道音视频翻译。
“随着大模型技术的成熟,AI翻译开始进入到多模态内容的深度理解与生成阶段。”张艺分享了音视频翻译平台的诞生背景。
基于多模态AI,有道音视频翻译平台目前可支持多语言音视频处理,直接完成“听录—识别—翻译—配音”全流程,这也将为出海企业、短视频和影视等从业者提供“AI视频专家”。
张艺强调,在上海刚刚结束的世界人工智能大会上,有用户提到出海业务中对翻译的需求:跨境内容翻译面临多重挑战——不仅要精准,还需兼顾文化背景、人物音色与表达风格等元素……
基于此,有道音视频翻译提供了“文本+音频+视频”多模态一体化原声翻译系统,可自动识别翻译场景、人物特征和情绪标签,并通过角色分离技术精准识别说话人的特征,使翻译更贴合实际情境,做到准确和生动兼得。
针对用户对于音色还原的关键诉求,系统搭载了自研的Adaptive Voice Cloning引擎,可快速学习人物的声音特征,实现情感化配音,避免机翻或AI配音的生硬感。
在效率和成本方面,有道音视频翻译3分钟即可完成一段10分钟视频的处理。
得益于自研技术,有道音视频翻译更显著降低了处理成本——据介绍,目前该平台的处理价格仅为行业的1/10,相应减少了企业的运营成本,为出海团队提供了高效率、低成本的一站式音视频翻译解决方案,助力跨境内容全球化的效率提升。
“处理100集短剧,通过有道音视频翻译只需要100元不到”,张艺在现场介绍,内测版本已经上线,正式版本九月初发布,前期会提供较高优惠力度。
为更直观地呈现大模型在教育场景中的智能能力,网易有道还在现场发布教育AI应用能力等级,以L1-L5五大阶段来衡量教育AI的智能水平。
周枫在现场表示表示,目前教育AI正在从“L3主动辅助学习”加速迈向“L4虚拟老师”,已具备接近人类教师的思考能力,能够主动引导思路、预判对错和难点,从而推动个性化课堂发展……
04 便携产品也有大天地
发布会后,网易有道高级副总裁吴迎晖、网易有道首席科学家段亦涛、网易有道智能应用事业部负责人张艺进行了媒体对话。
谈话内容中提到:
“年初一代AI答疑笔推出之后,非常明显的变化数据就是答疑的使用频次已经远高于查词翻译的使用频次,渗透率甚至高出了30%。”
“答疑的设计并不是解决问题的准确率,其实更多的是在内容端的投入。”
“答疑场景中,便携的设定为用户提供了更多元的使用机会。”
“我们其实是可以针对性训练多模态模型在这个部分的能力,使它能够更好地去理解和表达图形的信息,同时我们也不停地优化它。”
“先专注在把视频相关的翻译技术做好,未来的想象空间就可能是出海内容综合的解决方案。”
以下为部分对话,多知编辑整理。
提问:从一代答疑笔到二代答疑笔,用户反馈了哪些重要提升需求么?
吴迎晖:我想先聊下用户的行为数据,这给了我们一些关键的信息。
年初一代AI答疑笔推出之后,非常明显的变化数据就是答疑的使用频次已经远高于查词翻译的使用频次,渗透率甚至高出了30%。这给了我们非常强烈的信心,说明它真的是一个足够大的需求。
另外我们发现,用户向答疑笔提问的核心学科已经变成了数学,这意味着用户的需求已经表现的非常清晰,我们的新品方向也就相应明晰。
提问:在产品设计上,有哪些得益于用户反馈么?
吴迎晖:首先是答疑功能位于一级入口的设计。在一代产品出来的时候,我们当然也很强化答疑的位置,但是到了二代机几乎是完全突出了答疑交互的入口,在整个页面都把它放在了最显眼的位置。
另外我们在观察用户的使用时发现,答疑笔的需求场景和词典笔的需求有非常大的不同。词典笔中,小学的用户占比会很高一些,所以我们给出的题目服务依旧是以小学、小高类似这样的题目占比高一些。但是到了答疑笔这边我们发现了一个很显著的变化,就是答疑笔初高中的学生占比很高,因为这个时候其实他们对于学习机没有那么依赖了,但是便携场景更易得易用。
这会导致一个结果,就是它对于模型解题能力要求真的很高,对于推动我们去优化模型和针对性的去做推理的设计,起到了很重要的推动作用。
提问:目前还有很多大模型对于理科类题目的理解、呈现和处理存在难点,有道答疑笔是如何突破的?
吴迎晖:的确,目前推理模型面对非图形题目、文字类题目时,准确率已经非常非常高了。在多模态的能力上从识别到答疑的准确率平均已经能做到70-80%左右,其实已经是一个非常大提升了。
对于我们来说,答疑的设计并不是解决问题的准确率,其实更多的是在内容端的投入。想把一道题讲好是离不开内容的,所以我们会借助题库、借助对模型的强化学习训练等多维度的方法,去提高答疑讲解的质量。
段亦涛:我想补充下,几何类的问题我们模型解决能力到底解决得如何。
首先,有道在多模态的模型进展比较显著,所以我们的整个答疑笔的能力构建也是基于整体的这种能力的进步上。
此外,在几何答疑的具体场景上,有些题其实没有图形一样可以解出来,因为有很大一部分题目的描述信息已经足够精准地把信息描述清楚了。
但也存在另外一种情况,就是题目的题干和图形是有信息补充的关系,我们其实是可以针对性训练多模态模型在这个部分的能力,使它能够更好地去理解和表达图形的信息,同时我们也不停地优化它。
我相信随着整体的技术发展,复杂的图形题应该是越来越不成问题的。
提问:有道之前也出过学习机,目前怎么看学习机市场?对于自己的学习机业务是如何考量的?为什么目前把更重的关注放在便携智能场景?
吴迎晖:是的,学习机现在很热,从我的角度来说,我觉得首先就是术业有专攻,当有道锚定一个方向并且想持续完善的时候,就不太想再顾及复杂的、宽泛的提升。我们目前还是会更关注答疑场景,我们判断它会有更大的空间。
另外答疑场景中,便携的设定为用户提供了更多元的使用机会,比如学生在外面忽然想记录下自己的思考和对一些知识的理解,学习机类的大产品肯定就不能实现了。便携形态还是很有意义的一个角度,也能让有道做出独特的价值。
提问:这个过程中,能否介绍下技术如何为独特价值提供垂直服务?
段亦涛:比如说我们今天介绍了全景拼图的功能,这就是我们为了方便大家在用词典笔时能够拿来就扫、完整输入的一个关键创新技术。解题也是一样,我们的模型在给出答案的过程中也会评判解答的质量,进而提升技术开发的走向。
对于技术基座来说,这些思考都是很关键的脉络。
提问:关于技术基座,有道推理模型这一块最新的一些进展是怎样的?
段亦涛:整体上我们是针对场景来做优化,包括这一次升级带来比较大的变化,一个就是推理能力大幅提升,另外就是把多学科放到一个模型里面,我们的开源模型是一个数学模型,但是我们后面的模型是一个多学科的模型。
总的思路就是说我们是能够把我们业务里面需要的这些很多能力依托我们的一些优质数据和现在比较掌握的很好的优化办法,在这个场景下把它做到极致。
提问:音视频翻译对于有道承接直播电商出海、短视频出海需求的市场缺口预估有多大?未来它会不会成为有道业务的一个比较重要的增长点?
张艺:我们一直在研究,近几年这片市场保持着高速增长的节奏,复合增长率也有相当不错的表现。过去两年出海电商、短剧可能是一个百亿级别,我们相信未来很快很快它们就能达到千亿级别。另外像Tik Tok等短视频平台上还有非常非常多的视频创作者和搬运者其实也会存在这样的视频翻译需求。
我们目前先专注在把视频相关的翻译技术做好,未来完全有巨大的机会去延伸到视频生成的领域。未来的整个想象空间就不止是翻译这一件事情,可能会涉及到出海外面内容一套综合的解决方案,我觉得它的未来潜力是非常非常大的。
提问:答疑笔之后,我们还有没有同步再看一些其他产品?
吴迎晖:有,我们保持对市场的关注,我们现在有词典笔、有答疑笔、有听力宝,接下来还会关注所有这个世界上AI的新能力会提供一些新的机会,我们认为这个机会非常大。
从我们自己本行来看我们词典、翻译这些能力上我们在持续地积累,也在持续地进化,这一边也会有硬件的机会。
更新时间:2025-08-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号