下一波超越BAT千亿美金市值的公司将来自哪里?早在2017年财富全球论坛上,马化腾就做出预测:AI+教育或AI+医疗。
近年来,AI在教育行业加速落地,从直播课程中的AI老师,到比尔盖茨、扎克伯格盛赞的自适应教育,再到近日引发巨大争议、无处不在的课堂监控,AI与教育的碰撞从不缺故事,但热闹之下,诸多创业者与投资人却认为,AI对教育改造更似"文火慢炖",注定是一场持久战。
辅助类应用未触及教育核心
2019年8月,科技部新一代人工智能发展研究中心联合罗兰贝格管理咨询公司发布了《智能教育创新应用发展报告》(下称《报告》),数据显示,2014年至2016年是智能教育行业热度最高的三年,三年间新成立43家智能教育公司,占2011~2018年期间智能教育公司成立数量总和的56%。教育类公司、互联网公司、人工智能技术提供商与计算平台提供商等不同背景企业纷纷入局,在产品形态方面,智能批改、拍照搜题、智能测评、智能题库、分级阅读和自适应学习为目前六大主流产品,从更细分的赛道分布来看,K12赛道的公司最多,聚集了60%的智能教育公司。在商业模式方面,各企业在2B、 2C领域分布均匀,B端产品形态以智能批改、分级阅读和自适应学习为主,C端产品以自适应学习、分级阅读和智能题库为主。
作为典型的抗周期行业,资本对智能教育青睐有加,出手也相当阔绰,《报告》显示,智能教育市场于2014年爆发,这一年发生14笔融资事件,同比增长180%,此后市场持续升温,2018年全年融资次数达24次。
尽管入局的创业者众多,产品不断推陈出新,但在诸多业内人士看来,AI在教育行业的落地应用仍处于早期的阶段,"目前的大多数产品为辅助类应用,可以承担助教的角色,像拍照搜题、智能测评等,能够针对某一特定流程实现减负增效的目标,但要触及到教育的核心还需要更多的时间。"拼图资本创始合伙人、董事长王磊认为。
在蓝象资本执行合伙人周爽看来,长期以来,教育一直属于人力密集但集成度很低的行业,未来想要更大程度释放教育产能,达到因材施教的美好愿景,AI被寄予厚望,但这其中有两步最为关键,一是要有数据,大量的、高质量、事先设计并有效标签的数据,二是教育科学的成熟,教育是一个非常复杂和专业的领域,需求又很多元,什么样的教育是好的教育,如何教才能达到最好效果,这一点要有共识,但放眼全球,目前这两个关键问题都需要进一步探索。
"虽然现在关于AI的投资很火热,市面上的多数教育公司也都宣称自己正在用AI赋能教育,但目前AI在教育行业落地的确还处于收集数据、不断改进数据的契合度和有用性这样一个比较早期的阶段"周爽表示。
"底层技术平台的坑太多"
李斌2016年回国加入龙之门教育集团负责技术研发工作,带领团队开发自适应学习相关应用,在他看来,一款AI教育产品的成功取决于底层技术、智能算法以及对教育深入洞察等多方因素的良好配合,是一个非常复杂的过程,但现阶段,底层技术的不完善是他在从业过程中最先感触到的困难。
"作为教育行业的从业者,我们希望国内的人工智能技术领军者能够把底层技术做扎实、做细致,确保技术真正是能用和好用的,这是最基础的",李斌表示,AI在教育领域的所有应用都基于底层技术,然而国内大部分底层技术目前不尽成熟,与谷歌等全球科技巨头仍有很大差距。"像亚马逊,不仅能提供云计算平台、各类大数据优化的托管服务,而且每年上线的工具也高达上千个,能够为从业者数据分析、架构及机器学习提供很好的支持,还能充分利用共享资源的方式为企业节省成本。但反观国内一些云计算平台,保证不了计算量、运行速度特别慢,甚至里边还有很多坑需要从业者花大量的时间精力自己去填,这实在有点本末倒置,如果底层不是特别完善,我们谈上面的应用都是空中楼阁"。
在中外的行业交流中,李斌也发现国际型的AI教育大会中90%左右的参会者依然在谈架构,讨论如何创造一个好的平台承载海量的数据、哪些数据是有用的、如何去处理这些数据等基础问题。但在国内,行业交流关注的重点已经到了产品与解决方案的应用层面,"我觉得第一步还是要发展我们的技术,国内的底层技术还有很大的进步空间,包括技术的使用成本也要降下来,这个条件具备了才能带动垂直领域更好地去应用,做出好的产品"。
数据量小且质量低
除了底层技术这一基石,现阶段数据数量少、数据质量低也正制约着AI在教育行业实现更多的可能。
"大数据是人工智能的信息来源与发展动力,要实现对学生的个性化关注,AI需要从大量的教学与学习数据中进行多维度的取样、分析,未来谁拥有更多的优质教学数据,谁就拥有主动权",乐乐课堂CEO毛颖告诉记者,"但现在没有企业敢说自己拥有大数据,即使像好未来、新东方这样有一二十年积累的企业,以每年400万人次的学生、十余年的数据采集量来看,比起人工智能真正需要的海量数据还是比较小的,缺乏数据和内容的前提下AI很难解决效果问题"。
据了解,目前企业获取教育数据的方式主要有两种:一是从数字化的教学环境中实时收集数据;二是从现有教学过程中收集教育信息,然后将其转化为数据,数据量积累越大、类型越丰富,训练出的模型也就越精准,同时数据的反哺能力也会越强,从而形成良性循环。
李斌认为,在数据收集过程中的一大忌是盲目贪量,全部收集过来再说,如何采集数据、哪些是有用的提前都要设计梳理清楚,这样才能确保收集的数据是真实有效的,否则得来的都是一些零散的、非结构化的数据,意义并不大。"比如对学生能力的衡量标准不仅仅在于答案的对错,他做题时的一些行为数据可能比答案本身更为重要,当他在做题时花费的时间过长,屏幕可能暗下去了,学生就得再点一下,我们会提前对这些行为进行设计、标注,这些都是很有价值的数据"。他表示,目前来看,行业中数据来源单一、重要环节数据缺失等问题还比较突出的。
"我国在教育信息化方面国家支持的力度非常大,自身的数据量也很大,这是我们的优势",周爽认为,"创业企业在收集数据过程中为了活下去必须要有符合市场需求的产品和清晰的商业模式,这也是为什么应试教育领域聚集了最多的AI创业公司的原因所在,因为这一领域学校和家长的诉求最为明确也易于量化,就是提分,所以AI的价值也被释放得最快"。在她看来,虽然这些应用目前看来不尽成熟,处于个性化教育非常初级阶段,与真正的"千人千面"距离尚远,但都是前进过程中有益的探索和尝试。
教育科学需要更加成熟
抛开技术、数据这些硬核因素,采访中多位从业者向记者表示,教研与教育科学的成熟对于AI在教育行业的生根落地至关重要。
"教研尤其是本地化教研是教育的根本,没有教研的教育公司一定做不好,不做好教研没有好的内容学生就不会来学,企业也就无从获得学生的数据,这是一个恶性循环。"毛颖认为,目前我国K12阶段教材版本众多,这意味着全国各地的教学要求、学生学习的进度和重点都不尽相同,因此教研必须本地化。
在毛颖团队深入到地市、县甚至乡镇进行本地化教研过程中,他们也有新的发现,"现在教育公司都说用AI实现教育千人千面的美好愿景,每个学生都能有个性化的辅导方案,这是理想状态。当我们真正深入到一些地市、县甚至乡镇时发现,由于教育条件和师资水平的限制,那里80%左右学生遇到的恰恰都是共性的问题,所以我们从业者还是要深入到行业中,踏踏实实先把教研做好,把这些学生在学习中遇到的共性的的问题解决了再谈更高阶的个性化的问题"。
在李斌看来,充分了解教育规律、了解人的学习过程是做出一款好产品的重要前提,"在参加一些国际会议时我发现,国外同行对如何教育好一个孩子、在哪一步给什么样的提示能够达到最好的教学结果等问题上有浓厚的兴趣和细致钻研,这些基础研究是我们非常欠缺和值得学习的",李斌告诉记者,一个良好的教育模式的探索需要大量的理论研究和积累,在这些研究结果和理论的指导下再去做产品的研发,这是一个合理的路径,"下一步我们从业者可能需要花更多的时间和精力去探索教与学之间的这种逻辑关系,而不是盲目地跟风上线新奇产品"。
在这一点,周爽也有同样的看法,她认为,不论是幼儿教育、K12教育还是成人教育都是要遵循教学理论或者规律的,如建构主义、结构化语言认知理论等,教育是一门综合性很强的科学,涉及心理学、生理学、统计学、管理学等多学科,无论是具体的学术理论突破还是教育教学数据的积累都不是简单砸钱能快速解决的。
"AI求快,但在教育行业必须慢下来、沉进去,作为投资人,在AI落地教育这场持久战中,未来我们看好对教育有敬畏之心,尊重教育规律、善用技术的团队"周爽说。